当前位置 : 医疗首页> 学术报告

Translational Psychiatry：语音特征揭示自闭症真相，ASDSpeech算法在大规模数据集上的突破性应用

时间：2025-01-21 12:10:29 热度：37.1℃ 作者：网络

自闭症谱系障碍（ASD）是通过社交沟通困难和限制性重复行为（RRB）的存在来诊断的。尽管许多ASD儿童在早期存在语言延迟，但核心症状的严重程度并不完全由言语的数量表现出来，更多的是通过言语的方式体现。例如，一些ASD儿童表现出较差的流利性、语言重复（回声言语）、代词混用和典型的发音与语调异常等，所有这些都可以通过语音的声学特征来观察。近年来，越来越多的研究使用自动化语音分析技术来量化ASD症状，尤其是社交沟通障碍的严重程度。

本文提出了一种名为ASDSpeech的开源人工智能算法，能够分析ASD儿童的语音录音，并通过多次发展时间点准确量化他们的社交沟通困难。该算法在迄今为止最大规模的ASD语音数据集上进行训练和测试，该数据集包含了197名ASD儿童在258次《自闭症诊断观察量表》（ADOS-2）评估中的99,193个语音片段。通过使用来自136名儿童的录音，ASDSpeech算法训练了基于声学和对话特征的模型，评估了ASD症状的严重性。

测试结果表明，ASDSpeech在两次独立的ADOS-2评估中，能够显著准确地估算社交沟通症状（即ADOS-2社交情感评分），并与实际评估分数高度相关，且表现出较强的横向和纵向一致性。特别是在估算社交沟通症状时，算法的准确性要高于对限制性重复行为症状的估算。研究者通过对来自以色列不同临床中心的197名ASD儿童的语音记录进行分析，提取了包括音高、共鸣频率、抖动、能量、零交叉率等49种特征，这些特征能够反映儿童在社交沟通中的不同表现。

图1：提取的语音特征与ADOS-2评分的皮尔逊相关系数

ASDSpeech算法通过卷积神经网络（CNN）进行训练，预测ADOS-2的社交情感（SA）分数和限制性重复行为（RRB）分数。训练数据来自136名只完成一次评估的儿童，而测试数据来自61名在两次ADOS-2评估中都有录音的儿童。研究还在不同年龄组和性别子群中评估了模型的准确性，结果表明，ASDSpeech在这些子群体中具有一致的表现，尤其是在年轻儿童和男性儿童中的表现尤为突出。

ASDSpeech算法在测试数据集中，能够准确估算每个儿童的ADOS-2社交情感分数和总分，且与实际分数之间存在显著相关性。特别地，在评估社交沟通症状时，ASDSpeech展示了与实际ADOS-2评分的较高相关性（r=0.544, P<0.0001）和较低的归一化均方根误差（NRMSE=0.164, P<0.0001）。此外，ASDSpeech在年龄和性别子群中的准确性没有显著差异，表明其在多种不同背景下的稳健性。模型也在纵向分析中表现出良好的稳定性，特别是在社交情感评分（SA）上，T1和T2评估之间的相关性为0.649（P<0.0001）。

研究结果表明，ASDSpeech能够可靠地量化ASD儿童的社交症状严重性，并且具备临床应用的潜力，特别是通过将该算法与眼动追踪、面部表情和身体运动等数据结合使用，可以进一步提高其准确性和可靠性。

原始出处：

Eni M., Zigel Y., Ilan M., et al. Reliably quantifying the severity of social symptoms in children with autism using ASDSpeech. Translational Psychiatry, 2025, 15:14. https://doi.org/10.1038/s41398-025-03233-6

上一篇： 论著|比较不同成分短链脂肪酸的抗抑郁作用...

下一篇： 问诊分析：检查发现肺结节，找出6年前CT...

Translational Psychiatry：语音特征揭示自闭症真相，ASDSpeech算法在大规模数据集上的突破性应用

时间：2025-01-21 12:10:29 热度：37.1℃ 作者：网络

相关文章

最新资讯

热门文章

国家药监局与沙特食品药品监督管理局签署合作谅解备忘录

国家药监局与丹麦药品管理局签署合作意向书le

本站广告