Google 與 DeepMind 攜手攻數位醫療，推出醫學領域大型語言模型 Med-PaLM

繼 OpenAI 推出聊天機器人 ChatGPT 掀起風潮之後，Google Research 與 DeepMind 也共同發佈了醫學聊天機器人程式 Med-PaLM，結合了一個新的線上搜尋醫學問題自由回答數據集，以及六個現有的開放式問題回答數據集，涵蓋專業醫學檢查、研究與消費者查詢，希望為醫療保健專業人員與患者提出的問題生成安全有用的答案。

涵蓋七個數據集

MedPaLM 透過提供各種數據集來解決多項選擇題以及醫療專業人員、非專業人員提出的問題。這些數據集分別來自 MedQA、MedMCQA、PubMedQA、LiveQA、MedicationQA 及 MMLU，另外，還添加了 HealthSearchQA 新的精選、經常搜尋的醫療查詢數據集，以改進 MultiMedQA。

在研究人員發表的一篇論文中指出，Med-PaLM 可以在臨床應用中發揮作用，包括知識檢索、臨床決策支持、研究中關鍵發現的總結以及對患者的初級保健問題進行分類。不過研究人員也承認 Med-PaLM目前表現仍然不如人類臨床醫師。例如在 16.9% 的 Med-PaLM 回覆中發現訊息檢索不正確，而人類臨床醫師的這一比例不到 4%；在不正確的推理（大約 10% 與 2%）和不恰當或不正確的回覆內容（18.7% 與 1.4%）方面也存在類似的差異。

目標為優於人類醫師判斷

隨著 ChatGPT 的推出，以大型語言模型（Large language models，LLMs）為設計基礎的對話式人工智慧，透過從網際網路抓取的數據進行訓練，提供接近人類的互動，能回答廣泛主題的能力令人驚嘆，並能生成文本、進行統計分析。

研究團隊稱，比迄今為止的結果更重要的是可用於提高 LLM 性能的技術，例如使用指令提示調整，使用交互示例來產生對用戶更有幫助的答案。指令提示調整顯示 Med-PaLM 優於另一個名為 Flan-PaLM 的 LLM，臨床醫師小組判斷 Flan-PaLM 長格式答案的準確率為 62%，而 Med-PaLM 為 93%，不過 Med-PaLM 仍然必須優於人類醫學專家的判斷。目前，有一組醫學專家發現，92.6% 的 Med-PaLM 回答與臨床醫師提供的答案相符。

細胞的太陽能板！來自光遺傳學產生的能量延長線蟲壽命

參考資料：
https://arxiv.org/pdf/2212.13138.pdf