Google 与 DeepMind 携手攻数位医疗，推出医学领域大型语言模型 Med-PaLM

继 OpenAI 推出聊天机器人 ChatGPT 掀起风潮之后，Google Research 与 DeepMind 也共同发布了医学聊天机器人程式 Med-PaLM，结合了一个新的线上搜寻医学问题自由回答数据集，以及六个现有的开放式问题回答数据集，涵盖专业医学检查、研究与消费者查询，希望为医疗保健专业人员与患者提出的问题生成安全有用的答案。

涵盖七个数据集

MedPaLM 透过提供各种数据集来解决多项选择题以及医疗专业人员、非专业人员提出的问题。这些数据集分别来自 MedQA、MedMCQA、PubMedQA、LiveQA、MedicationQA 及 MMLU，另外，还添加了 HealthSearchQA 新的精选、经常搜寻的医疗查询数据集，以改进 MultiMedQA。

在研究人员发表的一篇论文中指出，Med-PaLM 可以在临床应用中发挥作用，包括知识检索、临床决策支持、研究中关键发现的总结以及对患者的初级保健问题进行分类。不过研究人员也承认 Med-PaLM目前表现仍然不如人类临床医师。例如在 16.9% 的 Med-PaLM 回复中发现讯息检索不正确，而人类临床医师的这一比例不到 4%；在不正确的推理（大约 10% 与 2%）和不恰当或不正确的回复内容（18.7% 与 1.4%）方面也存在类似的差异。

目标为优于人类医师判断

随着 ChatGPT 的推出，以大型语言模型（Large language models，LLMs）为设计基础的对话式人工智能，透过从互联网抓取的数据进行训练，提供接近人类的互动，能回答广泛主题的能力令人惊叹，并能生成文本、进行统计分析。

研究团队称，比迄今为止的结果更重要的是可用于提高 LLM 性能的技术，例如使用指令提示调整，使用交互示例来产生对用户更有帮助的答案。指令提示调整显示 Med-PaLM 优于另一个名为 Flan-PaLM 的 LLM，临床医师小组判断 Flan-PaLM 长格式答案的准确率为 62%，而 Med-PaLM 为 93%，不过 Med-PaLM 仍然必须优于人类医学专家的判断。目前，有一组医学专家发现，92.6% 的 Med-PaLM 回答与临床医师提供的答案相符。

细胞的太阳能板！来自光遗传学产生的能量延长线虫寿命

参考资料：
https://arxiv.org/pdf/2212.13138.pdf