HGG Advances:大型语言模型罕见病知识的系统评估,大型语言模型对罕见病了解多少

时间:2026-05-05 17:30:03   热度:37.1℃   作者:网络

深度解析医学证据,DeepEvidence为你支撑决策 近年来大型语言模型在通用医学测评中展现出优异表现,但其在罕见病领域的知识储备与推理能力始终缺乏系统性评估。罕见病由于单个病种病例稀少、表型异质性强、遗传机制复杂,对精准医学知识库的构建形成持续挑战。面对这一困境,来自澳大利亚、美国、新加坡、德国等多国研究机构的学者组成联合团队,开展了一项迄今规模最大的罕见病知识量化研究。 研究者选取了六款具有代表性的通用领域大型语言模型,包括两款商业闭源模型GPT-4和Claude 3.7,以及四款开源可复现模型Llama-3.3 70B、Gemma-2 27B、Llama-3.2和Phi-4,系统评估它们对罕见病核心表型特征及致病基因的掌握程度。研究覆盖了Orphanet数据库收录的全部10892种罕见病,通过标准化提示词让每个模型独立外化其对该疾病的知识,并以自由文本形式输出核心临床表型与致病基因。 为了与权威知识库进行可量化的比对,研究团队将模型输出的自由文本表型描述通过FastHPOCR工具映射到人类表型本体术语,基因输出则手动核对并标准化为HGNC基因符号。参照数据集选用Orphanet

小提示:本篇资讯需要登录阅读,点击跳转登录

上一篇: Briefings in Bioinfo...

下一篇: 人工智能在护理领域的研究全景:一项跨越四...


 本站广告