JAMA Network Open上发表的一项最新研究介绍了一种先进的机器学习模型,该模型使用有限的信息预测幼儿的自闭症谱系障碍,对两岁以下儿童的准确率接近 80%。该模型名为 AutMedAI,旨在使用儿科常规就诊期间通常可获得的基本行为和医疗信息,使其在医疗保健环境中广泛应用既方便又实用。该模型可能有助于早期发现自闭症,帮助尽早提供必要的干预措施以改善发育结果。
自闭症谱系障碍是一种神经发育障碍,会影响个人对周围世界的感知和互动方式。其特征是社交沟通困难、重复行为和兴趣有限。自闭症患者可能难以理解社交暗示、建立关系和适应新环境,症状从轻微到严重不等。
虽然自闭症的病因很复杂,涉及遗传和环境因素,但早期干预已被证明对自闭症儿童大有裨益,特别是在改善社交、沟通和行为技能方面。然而,诊断自闭症可能很困难,因为它通常依赖于观察可能在生命最初几年后才完全出现的特定行为。这导致自闭症的早期迹象首次出现和通常做出诊断之间存在差距,从而延迟了可能有用的干预措施。
本研究的动机在于解决当前自闭症筛查和诊断工具的局限性。传统的筛查通常依赖于问卷和清单,这些工具虽然有用,但可能会遗漏细微的迹象,可能受到解释偏差的影响,并且通常需要专业知识才能进行准确评估。这些工具可能会延迟诊断,因为它们通常针对已经表现出明显自闭症迹象的儿童,通常在三岁左右或更晚。
瑞典卡罗琳斯卡医学院的研究人员旨在开发一种更方便、更准确的工具,利用现成的医疗和发育数据识别幼儿的自闭症风险。通过创建一个机器学习模型来分析常见的早期生活因素(例如初笑年龄或语言里程碑),他们希望能够更早地识别自闭症风险。这种早期检测可以为及时干预和更好的发展支持打开大门,最终改善自闭症儿童及其家庭的结果。瑞典卡罗琳斯卡医学院的研究人员旨在开发一种更方便、更准确的工具,利用现成的医疗和发育数据识别幼儿的自闭症风险。通过创建一个机器学习模型,分析他们希望通过研究常见的早期生活因素(如初笑年龄或语言发育里程碑)来尽早发现自闭症风险。这种早期发现可以为及时干预和更好的发展支持打开大门,最终改善自闭症儿童及其家庭的结局。
研究人员使用了 SPARK(西蒙斯基金会自闭症研究知识推动者)数据库的数据,该数据库是美国最大的自闭症研究数据集之一。SPARK 数据库包含 30,000 多名患有和不患有自闭症的儿童的详细医疗和背景信息。在这项研究中,该团队专注于 SPARK 中大约 12,000 名儿童的样本,以训练和验证他们的机器学习模型。所选数据仅包括儿童早年常规医疗访问中通常可获得的信息,例如关键发育里程碑的年龄和特定行为特征。
为了建立该模型,研究人员使用了 28 个不同的因素,这些因素经过精心挑选,易于获取、无创且易于父母报告。这些因素包括可观察到的里程碑,例如孩子第一次微笑、说出简短的句子或难以吃某些食物。该研究的重点是 24 个月以下的儿童,这是发展评估的关键时期。该团队使用了各种机器学习算法,包括逻辑回归和随机森林,以探索解释这些数据的不同方法。经过多轮测试和改进,他们最终选择了表现最佳的模型 AutMedAI,以最大限度地提高预测准确性,同时保持用户友好性并基于现成的数据。
AutMedAI 在 SPARK 数据集上进行训练和验证,该数据集被分成多个子集,以便进行严格的交叉验证。具体来说,数据被划分为 60% 用于训练,20% 用于调整模型参数,剩下的 20% 用于最终验证。这种方法有助于确保模型不仅在用于训练的样本中准确,而且在“看不见的”数据中也准确,模仿现实世界的应用。研究人员通过优化模型以防止过度拟合来进一步完善模型,确保它能够很好地推广到新案例。
AutMedAI 模型在约 12,000 名儿童样本中进行了评估,在预测自闭症方面取得了约 80% 的准确率,正确识别了大部分患有自闭症谱系障碍的儿童。该模型在标记社交互动和认知功能方面存在更严重困难的儿童方面尤其有效,这两个领域与自闭症密切相关。
“这项研究的结果意义重大,因为它们表明,从相对有限且容易获得的信息中识别出可能患有自闭症的个体是可能的,”这项研究的第一作者、卡罗琳斯卡医学院的附属研究员、现任印度生物信息学和应用技术研究所助理教授的 Shyam Rajagopalan 说。
在该模型中,几个特定因素成为强有力的预测因素,包括孩子第一次微笑的年龄、开始使用短句的时间以及进食困难的情况。这些预测因素的组合既有洞察力又实用,表明如果综合分析,共同的发展里程碑可能是自闭症风险的有力指标。模型中出现了几个特定因素,作为强有力的预测因素,包括孩子第一次微笑的年龄、他们开始使用短句的时间以及进食困难的情况。这些预测因素的组合既有洞察力又实用,表明常见的发育里程碑可能是自闭症风险的有力指标,当分析集体。
研究人员强调,AutMedAI 并非旨在取代详细的临床评估,而是作为一种初步筛查工具。通过标记可能需要进一步评估的儿童,该模型可以帮助减轻诊断服务的压力,并为家庭提供对孩子发育情况的早期洞察。
早期干预对自闭症儿童尤其重要,因为有针对性的治疗和支持系统可以显著改善长期结果,特别是在沟通和社交技能方面。该模式的可及性也为农村或服务不足的地区带来了希望,这些地区可能缺乏专门的自闭症诊断服务,为初步筛查提供了一个有价值的选择。
AutMedAI 最有前景的方面之一是它依赖无需侵入性测试或广泛临床评估即可收集的数据,这使得它能够融入常规儿科护理中。研究人员计划在临床环境中进行进一步的测试和验证,以确认该模型在研究环境之外的可靠性。他们还在探索在模型的未来迭代中加入遗传信息的可能性,这可以进一步提高准确性并实现更加个性化的筛查。
“为了确保该模型足够可靠,可以在临床环境中实施,需要严谨的工作和仔细的验证。我想强调的是,我们的目标是让该模型成为医疗保健的宝贵工具,它并非旨在取代自闭症的临床评估,”卡罗琳斯卡医学院妇女和儿童健康系 KIND 副教授、该研究的资深作者克里斯蒂娜·塔米米斯 (Kristiina Tammimies) 表示。
这项研究的作者是 Shyam Sundar Rajagopalan、Yali Zhang、Ashraf Yahia 和 Kristiina Tammimies,即“通过机器学习从一组最少的医疗和背景信息预测自闭症谱系障碍”。