JMIR Nursing:AI 能当公共卫生护士吗?三款顶级大模型挑战日本国家考试

时间:2026-05-05 17:29:46   热度:37.1℃   作者:网络

深度解析医学证据,DeepEvidence为你支撑决策 近年来,以GPT-4o、Claude Opus 4和Gemini 2.5 Pro为代表的大型语言模型在医学与护理学国家考试中展现出令人瞩目的性能,然而,其在强调社区健康、多学科协作与社会决定因素整合的公共卫生护理领域的能力尚未得到验证。本研究填补了这一空白,首次系统评估了上述三款主流大型语言模型应对日本第111届公共卫生护士国家考试的表现。公共卫生护理不仅要求扎实的生物医学知识,更需综合考量区域特征、居民需求、社会资源及政策法规等多重因素,其复杂决策过程对当前人工智能的推理能力构成了独特的挑战。 为全面比较模型表现,研究者采用了普查方法,将此次考试的全部110道试题纳入分析。所有问题均于2025年6月在一个全新的独立聊天窗口中,使用标准化的日语提示词向各模型进行提问,以避免上下文干扰。对应考题中一般的单句型题目、情境型题目、含图表题目以及计算题,研究团队分别设计了六种标准化的提示词模板,确保评估过程的一致性与可重复性。题目根据内容被划分为一般性问题和情境性问题,根据形式分为纯文本题和图表或计算题,并根据选项类型分为单选题和多选题。

小提示:本篇资讯需要登录阅读,点击跳转登录

上一篇: Nature:我国学者开发了一项用于罕见...

下一篇: 2022年度中国医药工业百强榜发布,中国...


 本站广告