Google 與 DeepMind 攜手攻數位醫療,推出醫學領域大型語言模型 Med-PaLM

0

繼 OpenAI 推出聊天機器人 ChatGPT 掀起風潮之後,Google Research 與 DeepMind 也共同發佈了醫學聊天機器人程式 Med-PaLM,結合了一個新的線上搜尋醫學問題自由回答數據集,以及六個現有的開放式問題回答數據集,涵蓋專業醫學檢查、研究與消費者查詢,希望為醫療保健專業人員與患者提出的問題生成安全有用的答案。

涵蓋七個數據集

MedPaLM 透過提供各種數據集來解決多項選擇題以及醫療專業人員、非專業人員提出的問題。這些數據集分別來自 MedQA、MedMCQA、PubMedQA、LiveQA、MedicationQA 及 MMLU,另外,還添加了 HealthSearchQA 新的精選、經常搜尋的醫療查詢數據集,以改進 MultiMedQA。

在研究人員發表的一篇論文中指出,Med-PaLM 可以在臨床應用中發揮作用,包括知識檢索、臨床決策支持、研究中關鍵發現的總結以及對患者的初級保健問題進行分類。不過研究人員也承認 Med-PaLM目前表現仍然不如人類臨床醫師。例如在 16.9% 的 Med-PaLM 回覆中發現訊息檢索不正確,而人類臨床醫師的這一比例不到 4%;在不正確的推理(大約 10% 與 2%)和不恰當或不正確的回覆內容(18.7% 與 1.4%)方面也存在類似的差異。

目標為優於人類醫師判斷

隨著 ChatGPT 的推出,以大型語言模型(Large language models,LLMs)為設計基礎的對話式人工智慧,透過從網際網路抓取的數據進行訓練,提供接近人類的互動,能回答廣泛主題的能力令人驚嘆,並能生成文本、進行統計分析。

研究團隊稱,比迄今為止的結果更重要的是可用於提高 LLM 性能的技術,例如使用指令提示調整,使用交互示例來產生對用戶更有幫助的答案。指令提示調整顯示 Med-PaLM 優於另一個名為 Flan-PaLM 的 LLM,臨床醫師小組判斷 Flan-PaLM 長格式答案的準確率為 62%,而 Med-PaLM 為 93%,不過 Med-PaLM 仍然必須優於人類醫學專家的判斷。目前,有一組醫學專家發現,92.6% 的 Med-PaLM 回答與臨床醫師提供的答案相符。

細胞的太陽能板!來自光遺傳學產生的能量延長線蟲壽命

參考資料:
https://arxiv.org/pdf/2212.13138.pdf

©www.geneonline.news. All rights reserved. 基因線上版權所有 未經授權不得轉載。合作請聯繫:service@geneonlineasia.com

Share.
error: 注意: 右鍵複製內容已停用!