Medical Xpress news Score 70

多语言基准评估AI解读临床文本能力

BRIDGE工具可测试大语言模型在九种语言中理解电子健康记录等临床文本的能力。

马萨诸塞总医院布里格姆的研究人员开发了一个名为BRIDGE的多语言基准,用于评估大型语言模型(LLM)在九种语言中理解临床患者护理文本的能力,包括电子健康记录中的用语。该工具旨在帮助临床医生评估和比较LLM在特定医疗场景中的表现。研究结果已发表在《自然生物医学工程》上。

large language modelsclinical text miningnatural language processing