论著|利用多导睡眠监测构建失眠患者抑郁症诊断模型
时间:2025-01-21 12:10:34 热度:37.1℃ 作者:网络
摘 要
目的 通过机器学习算法对失眠患者的多导睡眠监测(polysomnography,PSG)数据进行挖掘,建立失眠患者抑郁症的诊断模型,为失眠患者的抑郁症诊断提供科学依据。
方法 选择2023年1~12月在内蒙古自治区精神卫生中心进行PSG的失眠住院与门诊患者共2162例,抑郁症根据《国际疾病与相关健康问题统计分类第10版》(International Statistical Classification of Diseases and Related Health Problems, 10th version, ICD-10)进行诊断。收集患者的一般情况与PSG资料,分别基于logistic回归、支持向量机、随机森林、自适应提升、极限提升树、朴素贝叶斯等6种算法构建失眠患者抑郁症的诊断模型。
结果 纳入的失眠患者中,40.1%(868例)的患者合并抑郁症。6种模型中,logistic回归和随机森林模型的受试者操作特征曲线(receiver operating characteristic curve,ROC curve)的曲线下面积(area under the curve,AUC)值最高,分别为0.825和0.823,综合分类性能更优。
结论 Logistic回归和随机森林模型对失眠患者中的抑郁症人群有良好的诊断效能。
关键词
失眠;抑郁症;多导睡眠监测;机器学习;诊断模型;逻辑回归;随机森林模型
失眠是最常见的睡眠障碍,全球范围内约10%的成年人受到失眠的干扰[1]。失眠与抑郁症密切相关[2-3],抑郁症是目前发病率最高的精神疾病[4-6]。因此,早期对失眠患者中的抑郁症人群进行诊断有助于早期开展治疗。目前抑郁症的诊断缺乏客观指标[7-8],有必要寻找失眠患者抑郁症诊断的客观工具,帮助识别抑郁症人群。多导睡眠监测(polysomnography, PSG)广泛应用于睡眠研究领域,多项研究表明,抑郁症患者的PSG参数与健康对照者显著不同[9-12],如快速眼动(rapid eye movement,REM)睡眠潜伏期缩短以及睡眠连续性改变等,并且不同抑郁症亚型间的表现也有差异[3],说明PSG在抑郁症的诊断和鉴别中具有一定价值。近年来,机器学习在临床上得到广泛的应用[13-14],本研究拟通过机器学习算法对失眠患者的PSG数据进行挖掘,基于不同算法建立失眠患者抑郁症的诊断模型,比较不同模型的性能,筛选出最佳的诊断模型,为诊断失眠患者抑郁症提供科学依据。
1 对象与方法
1.1 研究对象 选择2023年1-12月在内蒙古自治区精神卫生中心就诊的进行过PSG检查的失眠住院与门诊患者作为研究对象。纳入标准:①年龄≥18岁;②符合《国际疾病与相关健康问题统计分类第10版》(International Statistical Classification of Diseases and Related Health Problems, 10th version,ICD-10)中失眠(ICD-10编码为F51.0)的诊断标准。排除标准:①合并严重心脑血管疾病;②合并其他严重精神疾病,如精神分裂等;③痴呆患者。本研究纳入失眠患者2162例。纳入的失眠患者中合并抑郁症者为抑郁症组,不合并抑郁症者为非抑郁症组。
1.2 抑郁症诊断与一般情况收集 抑郁症状至少持续2周以上,并符合ICD-10中抑郁症(ICD-10编码为F32和F33)的诊断标准则诊断为抑郁症,由主治及以上职称的精神科医生进行诊断。收集患者的性别、年龄、体质指数(body mass index,BMI)及用药等一般情况。患者在就诊时主诉有失眠症状,会被开出助眠药物的处方,主要为苯二氮䓬受体激动剂。
1.3 多导睡眠监测(polysomnography, PSG)
患者在睡眠监测当晚8点左右到达我院睡眠医学中心,提前至监测房间熟悉睡眠环境。所有患者接受夜间完整的PSG监测(澳大利亚Compumedics公司),监测项目包括脑电图、双侧眼电图、下颌肌电图、双下肢肌电图、心电图以及口鼻气流和胸腹运动等。根据监测结果获得呼吸暂停低通气指数(apnea-hypopnea index, AHI)、非快速眼动睡眠(non-rapid eye movement sleep, NREM)期和REM期AHI、不同睡眠分期占总睡眠持续时间百分比、不同睡眠时期觉醒次数和氧饱和度等。为保证判读标准的一致性及判读结果的准确性,PSG分析由2位专业技术人员进行人工判读及校正。
1.4 数据预处理 统计每个参数的缺失情况,如参数缺失率超过20%,则予以删除。如缺失率未超过20%则加以填补。由于PSG参数均为连续性变量且非正态分布,因此采用中位数方法进行填补。
1.5 机器学习模型的开发与验证 采用6种模型构建诊断模型,分别为logistic回归(logistic regression, LR)、支持向量机(support vector machines, SVM)、随机森林(random forest, RF)、极限提升树(extreme gradient boosting, XGBoost)、自适应提升(adaptive boosting, AdaBoost)和朴素贝叶斯(naive Bayes,NB)。使用train_test_split函数将受试者按照7∶3的比例随机分为训练集与测试集。为使机器学习算法获得最佳的训练模型,模型训练使用10折交叉验证以减少模型过拟合,并使用网格搜索的方法进行超参数寻优。每个模型纳入的变量均为经单因素和多因素分析后筛选出组间差异具有统计学意义的PSG参数。使用受试者操作特征曲线(receiver operator characteristic curve,ROC curve)的曲线下面积(area under the curve,AUC)值作为模型性能的主要评价指标,并使用准确度、召回率、精确度、F1分数进行综合评价。同时引入校准曲线评估模型预测概率与实际发生概率之间的一致性,运用临床决策曲线(clinical decision curve,DCA)评估诊断模型在临床决策中的实际效用,利用精确率-召回率曲线(precision-recall curve, PR curve)评估模型在类别不平衡数据集上的正类预测性能。
1.6 统计学方法 使用SPSS 25.0进行数据统计分析。年龄和BMI用均数±标准差(x±s)描述,组间比较采用独立样本t检验。PSG参数不符合正态分布,采用中位数(下四分位数,上四分位数)[M(QL,QU)]描述,组间比较采用Mann-Whitney U检验。性别和药物使用情况以例数和构成比描述,组间比较采用χ2检验。采用多因素logistic回归分析失眠患者发生抑郁症的影响因素。检验水准α=0.05。使用Python 3.12建立机器学习模型。
2 结果
2.1 一般情况与PSG参数比较 2162例失眠患者中,抑郁症868例,占40.1%。男性744例,占34.4%,全部患者年龄(54.4±24.32)岁。两组患者的性别构成(χ2=14.831,P<0.001)、年龄(t=8.334,P<0.001)、BMI(t=-4.137,P<0.001)差异有统计学意义。见表1。
表1 抑郁症组与非抑郁症组的一般情况与PSG参数的比较Tab.1 Comparison of general characteristics and PSG parameters between depression and non-depression groups
注:BMI,体质指数;REM,快速眼动睡眠;NREM,非快速眼动睡眠;AHI,呼吸暂停低通气指数。
共1609例(74.4%)失眠患者在监测当日使用助眠药,1591例(占使用助眠药者98.9%)服用苯二氮䓬受体激动剂(其中1396例使用苯二氮䓬类,195例使用非苯二氮䓬类),其余18例(占使用助眠药者1.1%)患者服用褪黑素受体激动剂或中成药。两组使用助眠药物的比例差异有统计学意义(χ2=430.349,P<0.001),见表1。抑郁症患者中,有700例(80.6%)服用抗抑郁药,其中使用选择性5-羟色胺再摄取抑制剂者356例(占服用抗抑郁药者50.9%),使用5-羟色胺受体拮抗/再摄取抑制剂者192例(占服用抗抑郁药者27.4%),使用选择性5-羟色胺和去甲肾上腺素再摄取抑制剂者38例(占服用抗抑郁药者5.4%)。
两组患者PSG参数比较,总睡眠时间等共40个参数在两组之间的差异有统计学意义(P<0.05),阻塞型呼吸暂停平均时间等16个参数组间差异无统计学意义(P>0.05)。见表1。
2.2 PSG参数与抑郁症关系的多因素分析 将以上差异有统计学意义的PSG参数纳入多因素logistic回归分析,结果表明睡眠效率、睡眠潜伏期、REM潜伏期、REM期占睡眠期百分比(R%)、NREM3期占睡眠期百分比(N3%)、清醒平均氧饱和度、REM睡眠期觉醒次数、REM睡眠期自发性觉醒次数、NREM睡眠期自发性觉醒次数是与失眠患者发生抑郁症有关联的影响因素(P<0.05)。见表2。
表2 失眠患者发生抑郁症影响因素的多因素logistic回归分析Tab.2 Multivariate logistic regression analysis of influencing factors of depression in patients with insomnia
注:校正了年龄、性别、BMI和药物使用。
2.3 各模型的性能比较 纳入以上多因素logistic回归分析有统计学意义的9个PSG参数进行模型构建。构建的6种模型中,除SVM模型外,其他模型的AUC值在0.80以上,见表3和图1A。校准曲线显示LR和RF模型的平均预测值较低,表明这两个模型的预测概率与实际发生概率更接近,见图1B;DCA结果表明LR和RF模型的临床净效益更高,见图1C;PR曲线显示LR和RF模型的平均精度(average precision, AP)最高,见图1D。因此认为LR和RF模型的分类性能综合表现相对更优。
表3 6种诊断模型性能评价Tab.3 Performance evaluation of six diagnostic models
注:LR,logistic回归;SVM,支持向量机;RF,随机森林;XGBoost,极限提升树;AdaBoost,自适应提升;NB,朴素贝叶斯;AUC,曲线下面积。
图1 6种模型在验证集上的ROC曲线(A)、校准曲线(B)、DCA曲线(C)和PR曲线(D)Fig.1 ROC curve (A), calibration curve (B), DCA curve (C) and PR curve (D) of the six models on the validation set
2.4 特征变量重要性排序 为进一步分析特征变量的相对重要性,分别在LR和RF模型中筛选对失眠患者诊断抑郁症关联最大的变量。两种模型中特征变量的重要性排序有所不同。对于LR模型排名前5位分别是REM睡眠期自发性觉醒次数、R%、N3%、REM睡眠期觉醒次数和睡眠效率,见图2A;对于RF模型则是R%、睡眠效率、REM潜伏期和REM睡眠期觉醒次数和N3%,见图2B。
图2 Logistic回归模型(A)与随机森林模型(B)特征变量重要性排序Fig.2 Relative importance ranking of variables of logistic regression model (A) and random forest model (B)
3 讨论
本研究使用6种算法建立失眠患者抑郁症的诊断模型,并通过比较不同模型的性能,筛选出最佳预测模型,为失眠患者抑郁症的诊断提供了新思路。
在本研究使用的6种模型中,logistic回归和随机森林模型的分类性能综合表现相对较优。随机森林模型由于不容易过拟合,并且具有一定的抗噪声能力,被广泛应用于医学领域[15-19],而本研究的结果也体现了其准确度高的特点。logistic回归是目前临床常用的传统模型,本研究结果中并未显示出机器学习模型在失眠患者抑郁症诊断方面优于logistic回归,与既往研究抑郁症预测模型的结果一致[20]。可能原因是机器学习模型更适用于数据量更大更复杂的情况。除此之外,既往有系统综述也表明机器学习算法并没有比logistic回归表现更好[21]。
进一步对特征变量的重要性进行排序,R%在两个模型中的重要性均排在前列。REM睡眠又称为快波睡眠,REM睡眠改变是抑郁症患者的PSG特点之一。一般情况下,抑郁症患者的REM睡眠潜伏期缩短,并且持续时间延长[22-23]。而在本研究中抑郁症患者的REM睡眠潜伏期延长,持续时间缩短,这可能与其服用的助眠药物和抗抑郁药物作用有关。由于PSG通常在患者诊断之后,为尽早开展治疗,纳入的抑郁症患者大多在监测日当天服用了药物,而药物可对REM期产生明显抑制作用[24-26]。除此之外,两模型中其他特征变量的重要性排序有所不同。可能原因:①logistic回归对多重共线性敏感[27],而随机森林对共线性敏感性较低;②两种模型处理特征的机制不同,随机森林模型由众多独立的决策树组成,更重视接近树根的特征,而logistic回归通过寻找特征的线性组合来预测结果[28]。另外上述结果也说明可以为不同的诊断模型选择不同的特征。在logistic回归分析中,可以选择REM睡眠期自发性觉醒次数、R%、N3%、REM睡眠期觉醒次数和睡眠效率等参数对失眠患者诊断抑郁症,而R%、睡眠效率、REM潜伏期、REM睡眠期觉醒次数和N3%等参数则可以用于获得失眠患者诊断抑郁症的最佳随机森林模型。
本研究的局限性:首先,未能排除用药对于PSG参数的影响,既往研究表明,没有药物影响的PSG数据至少需要7~14 d的药物洗脱期[24];其次,研究结果未进行外部验证,推广性有限。综上所述,本研究基于6种算法分别构建了失眠患者抑郁症的诊断模型,其中logistic回归和随机森林模型的分类性能最佳,研究结果可为失眠患者的抑郁症诊断提供科学依据。
参考文献:
1. 李双艳, 张斌. 失眠障碍的研究现状与展望[J]. 实用医学杂志, 2024, 40(6): 731-737.
2. PLANTE D T. The evolving nexus of sleep and depression[J]. Am J Psychiatry, 2021, 178(10): 896-902.
3. EDWARDS C, ALMEIDA O P, FORD A H. Obstructive sleep apnea and depression: A systematic review and meta-analysis[J]. Maturitas, 2020, 142: 45-54.
4. LU J, XU X, HUANG Y, et al. Prevalence of depressive disorders and treatment in China: A cross-pal epidemiological study[J]. Lancet Psychiatry, 2021, 8(11): 981-990.
5. 杨军韦, 梁杰, 刘敬文, 等. 焦虑障碍、抑郁障碍患者的睡眠质量及与焦虑、抑郁症状的相关性[J]. 神经疾病与精神卫生, 2022, 22(3): 166-171.
6. ANDERSON E, CRAWFORD C M, FAVA M, et al. Depression -understanding, identifying, and diagnosing[J]. N Engl J Med, 2024, 390(17): e41.
7. 张晨阳. 机器学习算法对抑郁症诊断预测的比较研究[D]. 长春: 吉林大学, 2022.
8. 花田甜. 不同机器学习方法在抑郁症诊断和预后预测中的应用比较[D]. 南京: 东南大学, 2020.
9. SOLELHAC G, BERGER M, STRIPPOLI M F, et al. Objective polysomnography-based sleep features and major depressive disorder subtypes in the general population[J]. Psychiatry Res, 2023, 324: 115213.
10. THAKRE T P, KULKARNI H, ADAMS K S, et al. Polysomnographic identification of anxiety and depression using deep learning[J]. J Psychiatr Res, 2022, 150: 54-63.
11. ARIKAN M K, UYSAL O, GICA S, et al. REM parameters in drug-free major depressive disorder: A systematic review and meta-analysis[J]. Sleep Med Rev, 2024, 73: 101876.
12. NIELSON S A, KAY D B, DZIERZEWSKI J M. Sleep and depression in older adults: A narrative review[J]. Curr Psychiatry Rep, 2023, 25(11): 643-658.
13. CIOBANU-CARAUS O, AICHER A, KERNBACH J M, et al. A critical moment in machine learning in medicine: On reproducible and interpretable learning[J]. Acta Neurochir (Wien), 2024, 166(1): 14.
14. 曾金坤, 曹敏讷, 刘丹丹, 等. 基于机器学习构建单双相抑郁鉴别诊断模型[J]. 中国神经精神疾病杂志, 2024, 50(3): 129-134.
15. 黄光成, 周良, 石建伟, 等. 机器学习算法在疾病风险预测中的应用与比较[J]. 中国卫生资源, 2020, 23(4): 432-436.
16. 海瑞, 王慧, 张蓉, 等. 基于机器学习的老年慢性心力衰竭病人衰弱风险预测模型的构建[J]. 护理研究, 2024, 38(12): 2103-2109.
17. 汪丹丹, 姚侃斐, 祝雪花. 3种机器学习算法对维持性血液透析病人衰弱风险预测性能比较[J]. 护理研究, 2024, 38(1): 8-16.
18. 罗枭, 程义, 何倩, 等. 基于机器学习算法的重症缺血性脑卒中早期死亡预测效果评价[J]. 海军军医大学学报, 2022, 43(12): 1365-1371.
19. 张烁妮, 王俊杰, 张波, 等. 急性中毒患者洗胃期间误吸风险预测模型的构建及验证[J]. 中华护理杂志, 2024, 59(17): 2100-2107.
20. LIN S, WU Y, FANG Y. Comparison of regression and machine learning methods in depression forecasting among home-based elderly Chinese: A community based study[J]. Front Psychiatry, 2021, 12: 764806.
21. CHRISTODOULOU E, MA J, COLLINS G S, et al. A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models[J]. J Clin Epidemiol, 2019, 110: 12-22.
22. STRAWBRIDGE R, YOUNG A H, CLEARE A J. Biomarkers for depression: Recent insights, current challenges and future prospects[J]. Neuropsychiatr Dis Treat, 2017, 13: 1245-1262.
23. ARIKAN M K, UYSAL O, GICA S, et al. REM parameters in drug-free major depressive disorder: A systematic review and meta-analysis[J]. Sleep Med Rev, 2024, 73: 101876.
24. RIEMANN D, KRONE L B, WULFF K, et al. Sleep, insomnia, and depression[J]. Neuropsychopharmacology, 2020, 45(1): 74-89.
25. 赵显超, 邱健, 任佳封, 等. 慢性失眠障碍患者既往药物使用情况及客观睡眠紊乱的影响因素分析[J]. 中风与神经疾病杂志, 2020, 37(11): 973-977.
26. 杨静怡, 田军章. 原发性失眠大脑默认网络功能损害的特点及其机制[J]. 中山大学学报(医学科学版), 2023, 44(3): 528-533.
27. 肖松. 二元逻辑回归模型中几类有偏估计的研究[D]. 贵阳: 贵州民族大学, 2024.
28. 唐婷, 黎明. 大数据环境下的逻辑回归算法分析与研究[J]. 电子技术与软件工程, 2022(17): 178-181.
【引用格式】曹宁 ,张慧如 ,牛丽薇,等. 利用多导睡眠监测构建失眠患者抑郁症诊断模型[J]. 中国神经精神疾病杂志,2024,50(11):661-667.
【Cite this article】CAO N,ZHANG H R,NIU L W,et al.Construction of diagnostic model of depression in insomnia patients based on polysomnography data[J]. Chin J Nervous Mental Dis,2024,50(11):661-667.
DOI:10.3969/j.issn.1002-0152.2024.011.004