Translational Psychiatry:语音特征揭示自闭症真相,ASDSpeech算法在大规模数据集上的突破性应用

时间:2025-01-21 12:10:29   热度:37.1℃   作者:网络

自闭症谱系障碍(ASD)是通过社交沟通困难和限制性重复行为(RRB)的存在来诊断的。尽管许多ASD儿童在早期存在语言延迟,但核心症状的严重程度并不完全由言语的数量表现出来,更多的是通过言语的方式体现。例如,一些ASD儿童表现出较差的流利性、语言重复(回声言语)、代词混用和典型的发音与语调异常等,所有这些都可以通过语音的声学特征来观察。近年来,越来越多的研究使用自动化语音分析技术来量化ASD症状,尤其是社交沟通障碍的严重程度。

本文提出了一种名为ASDSpeech的开源人工智能算法,能够分析ASD儿童的语音录音,并通过多次发展时间点准确量化他们的社交沟通困难。该算法在迄今为止最大规模的ASD语音数据集上进行训练和测试,该数据集包含了197名ASD儿童在258次《自闭症诊断观察量表》(ADOS-2)评估中的99,193个语音片段。通过使用来自136名儿童的录音,ASDSpeech算法训练了基于声学和对话特征的模型,评估了ASD症状的严重性。

测试结果表明,ASDSpeech在两次独立的ADOS-2评估中,能够显著准确地估算社交沟通症状(即ADOS-2社交情感评分),并与实际评估分数高度相关,且表现出较强的横向和纵向一致性。特别是在估算社交沟通症状时,算法的准确性要高于对限制性重复行为症状的估算。研究者通过对来自以色列不同临床中心的197名ASD儿童的语音记录进行分析,提取了包括音高、共鸣频率、抖动、能量、零交叉率等49种特征,这些特征能够反映儿童在社交沟通中的不同表现。

图1:提取的语音特征与ADOS-2评分的皮尔逊相关系数

ASDSpeech算法通过卷积神经网络(CNN)进行训练,预测ADOS-2的社交情感(SA)分数和限制性重复行为(RRB)分数。训练数据来自136名只完成一次评估的儿童,而测试数据来自61名在两次ADOS-2评估中都有录音的儿童。研究还在不同年龄组和性别子群中评估了模型的准确性,结果表明,ASDSpeech在这些子群体中具有一致的表现,尤其是在年轻儿童和男性儿童中的表现尤为突出。

ASDSpeech算法在测试数据集中,能够准确估算每个儿童的ADOS-2社交情感分数和总分,且与实际分数之间存在显著相关性。特别地,在评估社交沟通症状时,ASDSpeech展示了与实际ADOS-2评分的较高相关性(r=0.544, P<0.0001)和较低的归一化均方根误差(NRMSE=0.164, P<0.0001)。此外,ASDSpeech在年龄和性别子群中的准确性没有显著差异,表明其在多种不同背景下的稳健性。模型也在纵向分析中表现出良好的稳定性,特别是在社交情感评分(SA)上,T1和T2评估之间的相关性为0.649(P<0.0001)。

研究结果表明,ASDSpeech能够可靠地量化ASD儿童的社交症状严重性,并且具备临床应用的潜力,特别是通过将该算法与眼动追踪、面部表情和身体运动等数据结合使用,可以进一步提高其准确性和可靠性。

原始出处:

Eni M., Zigel Y., Ilan M., et al. Reliably quantifying the severity of social symptoms in children with autism using ASDSpeech. Translational Psychiatry, 2025, 15:14. https://doi.org/10.1038/s41398-025-03233-6

上一篇: 论著|比较不同成分短链脂肪酸的抗抑郁作用...

下一篇: 问诊分析:检查发现肺结节,找出6年前CT...


 本站广告