酶有多重要呢?酶是一種生物催化劑,在生命體系中扮演著關鍵的角色,控制和調節各種代謝途徑,保障它們高效工作。許多科學家都希望把酶的功能改造得更好,實現高效能、高穩定性、更優質的催化劑。美國伊利諾伊大學香檳分校化學和生物分子工程(Carl R. Woese Institute for Genomic Biology at Illinois)趙惠民教授 ( Huimin Zhao)團隊獨闢蹊徑,希望能預測酶的功能。
許多酶已被鑑定出來,但對其作用仍知之甚少
對於酶功能的註釋是一項基本挑戰,已經開發了許多計算工具。然而,這些工具大多無法準確預測功能註釋,例如酶的 EC(enzyme commission,EC)編號,是以每種酶所催化的化學反應為分類基礎,用於研究較少的蛋白質或具有以前未表徵的功能或多種活動的蛋白質。如果能更準確的預測酶,將是一項偉大的革新。
研究人員在《Science》上發表其最新發現,並已於 3 月 31 日在線提供 CLEAN 公開使用。伊利諾伊州 Carl R. Woese 基因組生物學研究所的研究團隊表示,隨著基因組學的進步,許多酶已被鑑定和定序,但科學家們對這些酶的作用知之甚少或一無所知。許多計算工具試圖預測酶的功能,通常是試圖透過將查詢的序列與已知酶的目錄進行比較,並找到相似的序列來分配一個酶編號,也就是一個 ID 代碼,指示酶催化的反應類型。然而,這些工具不適用於研究較少或未表徵的酶,或是執行多項工作的酶。
與 BLASTp 相比, CLEAN 更準確、更可靠且更靈敏
一種新的 AI 工具可以根據酶的氨基酸序列預測酶的功能,即使這個酶未經研究或知之甚少。研究人員表示,這款名為「啟用對比學習的酶註釋(contrastive learning–enabled enzyme annotation,CLEAN)」的機器學習演算法,在準確性、可靠性和靈敏度方面優於領先的最先進工具,有助於對酶及其功能的了解,並有利於基因組學、化學、工業材料、醫學、製藥等領域的研究。
CLEAN 機器學習算法,與最先進的工具 BLASTp 相比,它可以將 EC 編號分配給具有更高準確性、可靠性和靈敏度的酶。對比學習框架使 CLEAN 能夠準確地註釋未充分研究的酶、糾正錯誤標記的酶,以及識別具有兩個或更多 EC 數字的混雜酶。團隊透過系統的模擬計算功能和體外實驗證明,該工具將能夠被廣泛用於預測未表徵酶的功能,從而推動許多領域的發展,例如基因組學、合成生物學和生物催化。
研究負責人趙惠民教授說:「就像 ChatGPT 使用書面語言的數據來建立預測文字一樣,我們正在利用蛋白質的語言來預測它們的活動,因為幾乎每個研究人員在處理新的蛋白質序列時,都想立即知道蛋白質的作用。本團隊不是第一個使用 AI 工具來預測酶 EC 編號的人,但是首個使用這種對比學習的新深度學習演算法來預測酶功能的人。這種演算法比 AI 效果更好。雖然不能保證每個產品都可以被準確預測,但可以獲得比其他兩種或其他三種方法更高的準確率。」此外,在為任何應用(生物學、醫學、工業)製造化學品時,該工具將幫助研究人員快速確定酶的功用。
希望 CLEAN 能發揮更多用途,甚至可以協助表徵結合蛋白
研究團隊正在為尋找表徵酶或確定酶是否可以催化所需反應的其他研究人員提供在線訪問 CLEAN 的途徑。希望這個工具能被廣大研究界廣泛使用,通過網絡界面,研究人員只需在搜索框中輸入序列,就像搜索引擎一樣,就可以看到結果。該小組計劃擴展 CLEAN 背後的 AI,以表徵其他蛋白質,例如結合蛋白,並進一步開發機器學習演算法,以利用戶搜尋所需的反應,而 AI 會指出適合該任務的酶。
趙教授表示:「有很多未表徵的結合蛋白,例如受體和轉錄因子,我們也想預測它們的功能。我們想預測所有蛋白質的功能,以便我們能夠了解細胞所具有的所有蛋白質,並更好地研究或設計整個細胞以用於生物技術或生物醫學應用。」
參考資料:
1. https://www.science.org/doi/10.1126/science.adf2465
©www.geneonline.news. All rights reserved. 基因線上版權所有 未經授權不得轉載。合作請聯繫:[email protected]