Google 与 DeepMind 携手攻数位医疗,推出医学领域大型语言模型 Med-PaLM

0

继 OpenAI 推出聊天机器人 ChatGPT 掀起风潮之后,Google Research 与 DeepMind 也共同发布了医学聊天机器人程式 Med-PaLM,结合了一个新的线上搜寻医学问题自由回答数据集,以及六个现有的开放式问题回答数据集,涵盖专业医学检查、研究与消费者查询,希望为医疗保健专业人员与患者提出的问题生成安全有用的答案。

涵盖七个数据集

MedPaLM 透过提供各种数据集来解决多项选择题以及医疗专业人员、非专业人员提出的问题。这些数据集分别来自 MedQA、MedMCQA、PubMedQA、LiveQA、MedicationQA 及 MMLU,另外,还添加了 HealthSearchQA 新的精选、经常搜寻的医疗查询数据集,以改进 MultiMedQA。

在研究人员发表的一篇论文中指出,Med-PaLM 可以在临床应用中发挥作用,包括知识检索、临床决策支持、研究中关键发现的总结以及对患者的初级保健问题进行分类。不过研究人员也承认 Med-PaLM目前表现仍然不如人类临床医师。例如在 16.9% 的 Med-PaLM 回复中发现讯息检索不正确,而人类临床医师的这一比例不到 4%;在不正确的推理(大约 10% 与 2%)和不恰当或不正确的回复内容(18.7% 与 1.4%)方面也存在类似的差异。

目标为优于人类医师判断

随着 ChatGPT 的推出,以大型语言模型(Large language models,LLMs)为设计基础的对话式人工智能,透过从互联网抓取的数据进行训练,提供接近人类的互动,能回答广泛主题的能力令人惊叹,并能生成文本、进行统计分析。

研究团队称,比迄今为止的结果更重要的是可用于提高 LLM 性能的技术,例如使用指令提示调整,使用交互示例来产生对用户更有帮助的答案。指令提示调整显示 Med-PaLM 优于另一个名为 Flan-PaLM 的 LLM,临床医师小组判断 Flan-PaLM 长格式答案的准确率为 62%,而 Med-PaLM 为 93%,不过 Med-PaLM 仍然必须优于人类医学专家的判断。目前,有一组医学专家发现,92.6% 的 Med-PaLM 回答与临床医师提供的答案相符。

细胞的太阳能板!来自光遗传学产生的能量延长线虫寿命

参考资料:
https://arxiv.org/pdf/2212.13138.pdf

©www.geneonline.news. All rights reserved. 基因线上版权所有 未经授权不得转载。合作请联系:service@geneonlineasia.com

Share.
error: 注意: 右键复制内容已停用!