medRxiv preprint Score 80

AI击败人类学员:核医学考试新纪录

Claude Opus 4.7搭配检索增强技术,在核医学心脏病学考试中取得85.1%的高分,超过人类平均表现。

一项预印本研究显示,搭载检索增强生成(RAG)技术的Claude Opus 4.7和GPT-5.5在2023年ASNC核医学心脏病学委员会备考考试中表现惊人。Claude Opus 4.7得分85.1%,GPT-5.5得分82.7%,均超过人类学员的平均分78%和及格线65%。研究者指出,新一代模型结合RAG后首次全面超越人类考生。有趣的是,Claude在完成考试后还自动撰写了一篇关于该研究的论文草稿。该研究尚未经过同行评审,但展示了AI在医学教育评估中的巨大潜力。

artificial intelligencecardiologymedical education