Variational AI 以演算法重建藥物開發,飛躍廣袤化學宇宙空間

0

2025 年 11 月 3 日,Variational AI 執行長 Handol Kim 在 TRPMA 專題演講「AI for drug discovery is not the future: it is the now」中主張,在藥物化學這個資料昂貴且成長緩慢的領域,傳統以資料驅動的擴表策略走不遠;真正的突破,來自演算法與方法學的創新。他語重心長地說,如果現在還不迎頭趕上,幾年後定會被這快速發展的領域淘汰。

他說道,Variational AI 2019 年創立於溫哥華,團隊核心由跨 AI 與數理背景的博士組成,定位為「純平台公司」,與新藥商與藥廠協作,而非自建藥物產品線。地緣上,他也毫不避諱地替家鄉行銷一番:「不誇張,卑詩省是加拿大生醫最成熟的重鎮,溫哥華就是重中之重。」

Variational AI 執行長 Handol Kim(攝影:吳柏緯)

走進 Enki,一窺小分子新藥的「Prompt」設計革命

他端出的主角是生成式 AI 平台 Enki。若把影像生成的「文字提示」換成藥物世界的「目標產品概況(TPP)」——分子量、LogP、TPSA、溶解度、目標/脫靶活性、PK 與 Tox 門檻等——模型便能在「設計階段」直接創造同時符合多參數的候選分子。

Kim 形容:「我們不再用文字描述黑短髮女孩騎紅色腳踏車,而是用 TPP 描述分子要具備的條件;Enki 便依此生成多樣且一致達標的分子。」在此框架下,Enki 不是篩選,而是「創造」;它先以大量的實驗與計算樣本進行前置預訓練,涵蓋數百個治療靶點,接著以 TPP 作為引,透過生成器與優化器完成結構新穎且可製造的化學設計結構。

這種路線之所以有其存在的必要,起因於面對廣袤化學空間的殘酷現實。人類可探索的類藥分子規模約為 10 的 60 次方,而即便第一代 AI 把虛擬庫擴增到 10 的 10 次方,覆蓋率仍近乎 0%;無論再怎麼把庫放大,仍像在路燈下找鑰匙,探尋空間有限。Kim 更直言:「資料量有限且幾乎固定,因此在此前提下,唯一能讓模型持續變好的是演算法。」,換句話說,當資料不可能指數增長的情況下,靠「更好的演算法」才是可能的可行之道。

新藥開發數據稀缺的時代,「從篩選到創造」的演算法給出一條出路

在不少化學 AI 專案裡,模型一旦離開「相似性」舒適圈,誤差便急遽上升,導致創造性受限、骨架跳躍困難、FTO 侷促。Enki 的路數是從基礎模型先吸收跨標靶的標的、並包含跨屬性的「廣度」,再把任務定義往前挪移到設計階段:用戶以 TPP 設定好多方面的需求條件,系統將可以一次生成一批彼此「多元樣但同時符合使用者要求」的化合物,再進一步在 MPO(效力、選擇性、ADME、Tox)上進行協同優化。這種方法等於把 DMTA 迭代的許多次嘗試的成本,預先吸收在評估模型的階段中。

Kim 也分享在過去的商業洽談中,他以相當務實的方式提出建議。他不鼓勵客戶把少量、零碎的 SAR 當成祕密武器:「多數生技在單一系列裡也就幾百個點,幫不上忙;除非你手上是新穎的靶點且手握獨特資料,否則我們通常不依賴客戶資料進行訓練。」這也是為什麼 Variational AI 以「預訓練基礎模型,加上必要時的小幅微調」為主打,並能善用外插法,讓生成結果不被單一資料集所侷限。當然,若遇到團隊擁有獨有且高品質的新靶點資料,Enki 也能在專案內利用客戶的數據集進行客製化微調,但資料權屬仍完全歸屬於原客戶。

Enki 以實際合成分子訓練,破解「畫得出做不出」困境

透過目前執行的成果最具有說服力。Kim 展示出的一組指標:在不倚賴客戶資料的前提下,Enki 生成的一批分子中,超過 56% 在生化與細胞試驗中達到 IC50/EC50 < 1 μM;常見在單循環(one cycle)內就拿到單位數 nM 效力,且具選擇性、PK 與 Tox 同步達標,而且「可合成且新穎」。

在更具體的案例中,Kim 進一步分享,Enki 曾於一次迭代中處理 1 個 on-target、6 個 off-target 的選擇性課題,並在多屬性同時優化下產生 1.9 nM 量級的分子,同時達到高命中率,並且展現出多個不同的分子架構。

可製造性則是另一個重要指標。許多學界模型面臨「畫得出」但卻「做不出」的窘境。反觀 Enki 的策略是:訓練以實際合成過的分子為主,設計階段強制可合成性門檻,事後再做逆合成與路徑分析,甚至可在提示裡預先限定合成步驟的數量起始原料成本

Kim 表示,當客戶把結構丟給 CRO 或自家實驗團隊時,多數都能順利做出想要的分子並進入測試,同時表現出高達 90% 的合成成功率。這種把 CMC 思維嵌入設計前端的做法,也支援在設計時同步限定分子量、氫鍵供受體數、TPSA、溶解度、MDCK、E-flux、CYP、hERG 等多重屬性,真正做到「在設計端進行 MPO」。「我們做的是在很短時間內給你可直接進入 Lead 優化的化合物;你不需要先做 HTS、再慢慢往前推。」Kim 表示。

此外,Enki 的基礎模型已覆蓋約 600 個靶點,從 2024 年以激酶起步,迅速擴展到 GPCR、蛋白酶與離子通道等大類,並持續增加目標數。換算效率上,他更直白地比喻:「100 個 Enki 生成分子 ≈ 100 萬個 HTS 篩選分子的價值」,在成本與時間上都是顯著的等比下降。

按 TPP 計價先收預付款,再依里程碑進行支付,並聚焦臨床前階段

Variational AI 是徹底的「平台公司」:不自建管線、不做生物學,只做生成與優化,與客戶分工扮演「狙擊手」。Kim 的比喻很形象:「我們像狙擊手;請你告訴我該打哪個靶,否則我們可能會打錯。」這樣的公司定位也回應資料與成本的現實:做出泛化能力強、延伸推廣力高的基礎模型,比一家一家為單一靶點去堆資料更有效率。

商業模式上,Kim 仔細解釋從官網網站帳號開立、定義並送出 TPP,按 TPP 計價收取前期費用;Variational AI 生成結構、由客戶合成與測試,若滿意再支付 IP 轉讓費;接著在 DC 提名或非 GLP 毒理臨床前里程支付下一筆里程款。大型藥廠則另有企業方案。這種「先交付、後授權」的設計,降低了早期決策的沉沒成本,也讓合作門檻更親民。

擴大到區域合作的層次,加拿大—特別是溫哥華—擁有成熟的生醫與 AI 生態,台灣則在 ICT 與工程人才上有深厚底盤。會上亦有來賓提到,加拿大端對在地設立研發據點提供誘因,包括水電補助約 40%、人力與學研合作資源等,對跨境共創是一劑強心針。Kim 也強調從 MOA 與靶點洞察到 TPP 定義,台灣團隊完全可以把握上游策略,再把生成與化學設計交給 Enki 接棒負責,最後回到本地完成合成、測試與 CMC,鋪設出一條跨域分工、快速驗證的跑道。

如果還沒應用 AI 新藥開發,代表你已經落後

Kim 的結語話鋒一轉,既是中肯的建議,也是慎重的提醒。他認為未來十年,「臨床前或臨床開發中的資產,有一半將由 AI 生成;十五到二十年後,這個比例甚至會逼近 99.5%。」而談到對台灣團隊的實務建議,首先他建議把 TPP 說清楚:要的 MW、LogP、TPSA、效力與選擇性窗口、ADME/Tox 門檻與 CMC 可及性,都需要盡可能在設計階段一次到位;其次是把握多參數並行優化的優勢,用模型把不必要的 DMTA 嘗試次數減到最低;最後,把合成與測試的強項本地化,並在成本結構與速度上進行差異化。

他直言:「如果你還沒有把 AI 用在化學新藥開發上,代表你已經落後了。」這場演講所呈現的,不只是新工具的展示,而是一條重構藥物發現單位經濟、把科學往前推進的道路。Enki 的命題簡單樸實:把「篩選→修飾」重塑成「設計→合成」。在化學空間堪比宇宙的浩瀚尺度裡,真正能擴張的不是資料,而是演算法;真正被改寫的,不只是週期與成本,更是從一開始就提高成功率的方式。對想與加拿大生態接軌的台灣團隊而言,相信這是一個夠具體、也夠務實的起手式。

閱讀英文版:
https://www.geneonline.com/generative-ai-lowers-the-drug-discovery-barrier-can-smaller-biotechs-finally-rival-big-pharma/

Share.
error: 注意: 右鍵複製內容已停用!