數據科學助抗癌:生物資訊學家 Mohamed Alshalalfa 博士談前列腺癌基因組研究

0

根據國際癌症研究機構(IARC)2018 年的報告,前列腺癌是全球男性的第四大致死癌症,儘管我們對前列腺癌已有一定程度的瞭解,也有標準化的醫療臨床指南,但每年全球仍有至少 30 萬人受此疾病影響[1]。在精準醫學時代,科學家透過分子層面了解癌症、分析前列腺癌基因組,試圖尋找個人化的醫療策略,國際團隊協力投入大型計畫,應用基因組學建立進階的癌症分類、發展新的診斷與治療選擇,其中,許多研究涉及大量的數據分析與資料管理,數據科學在當今的醫療研究中扮演關鍵環節。

Mohamed Alshalalfa 博士是前列腺癌基因組學的科學家,在此領域有超過十年的經驗,與加州大學、梅奧醫院(Mayo Clinic)、約翰霍普金斯大學以及哈佛醫學院的研究團隊合作,他參與計畫主要著重於前列腺癌的基因分析,同時發展轉譯醫學(translational medicine),將實驗室的技術轉化為臨床醫學可應用的工具。基因線上有幸採訪 Alshalalfa 博士,透過生物資訊學的角度,他與我們分享他在學術與產業界中多年的經驗,以及前列腺癌研究的當前發展。

跨入前列腺癌症基因組學

癌症基因組學在過去幾十年越趨熱門,前列腺癌相關的基因組研究卻是科學家和企業鮮少觸碰的領域,其一原因在於當前的研究仰賴大量數據運算與分析,許多研究人員雖具備熟稔的濕實驗室(wet lab)知識,例如:基因剔除和細胞培養等實驗技術,但卻缺乏同等的數據科學經驗,僅有少數研究人員具備相當的跨領域能力。

當問起 Mohamed Alshalalfa 博士是如何展開職業生涯的,他道:「大學時期我主修遺傳學,而後踏入計算生物學攻讀碩士與博士,自碩士時期,我就以前列腺癌作為研究主題。取得博士學位後,我進入業界,加入一間研究前列腺癌的公司。」當前列腺癌基因組學萌芽時,Alshalalfa 博士是 GenomeDx Biosciences 的資深生物資訊學家,GenomeDx Biosciences 是一間專注於泌尿腫瘤學、前列腺癌和膀胱癌的基因組學公司,透過數據科學開發癌症基因檢測,幫助醫師進行癌症診斷與分級,致力於改善泌尿系統癌症患者的醫療保健。

腫瘤學生物資訊學歷年發展

過往很長一段時間,科學家著重分析癌細胞系與個體基因,試圖了解基因與疾病進程的關聯,當微陣列、DNA 定序、RNA 定序和高通量序列分析等技術出現時,科技將癌症研究帶入大數據時代。優勢在於基因定序可以更快速且相對低成本,研究人員取得大量的癌症基因與病患資訊,有助於開發臨床檢測工具,Alshalalfa博士說:「現在有許多基因檢測工具幫助臨床醫生進行癌症診斷、了解癌症的侵略性,並提供針對病患的治療決策,但實際上我們還是需要更高階的運算工具作為後盾。」

深度學習改變癌症醫療

深度學習(deep learning)是機器學習的分支,應用人工神經網路進行資料分析,為許多領域帶來革新性的改變,其中語音識別和圖像分析是常見的醫學應用,借助人工智慧分析醫療影像、病理切片,電腦程式可以偵測到肉眼無法辨識的異常影像或細胞,疾病像是視網膜疾病、皮膚癌和乳腺癌已有相對應的診斷工具[2][3],幫助臨床及病理醫師進行確診疾病,Alshalalfa 博士提出幾項前列腺癌的臨床應用,其一為病理切片的影像分析,他道:「研究人員使用深度學習模型分析病理組織切片,借助電腦系統的鑑別能力細分癌細胞種類,同時整合癌細胞的基因序列分析,進一步建立更精確的癌症分級系統。」

另一方面,生物資訊學家應用機器學習模型,如:廣義線性模型(GLM)、隨機森林(random forest)和支援向量機(support vector machine)分析癌症基因組,這些演算工具大幅提升數據處理的效率,進而強化基因定序工具的能力,讓少量的 DNA 片段也足夠作為分析樣本。

前列腺癌之基因檢測

前列腺癌的基因檢測分為兩大類型:分子預後檢測(molecular prognostic test)與早期診斷檢測,目前有數家公司投入此領域,其中 GenomeDx Biosciences 是開發預後檢測的前驅,Alshalalfa 博士在 GenomeDx 負責研發適用於前列線癌基因數據分析的演算工具,他說明:「我當時與 GenomeDx 合作發展轉譯醫學,將數據運算技術移轉至臨床應用,開發前列腺癌檢測 Decipher® 以及 Decipher GRID 基因資料庫。」Decipher® 基因檢測為針對患有局限性前列腺癌(localized prostate cancer)的男性,接受根治性前列腺根除術(radical prostatectomy,RP)後的基因檢測,以 RP 手術採集的組織為檢測樣本,分析 22 組癌症相關基因,從中得知癌細胞的惡性程度,以及是否有轉移的可能性,相較於傳統的病理分析,Decipher® 提供更具個人化的資訊,協助臨床醫師決定後續的治療策略。

其他開發公司與商品化檢測

除了 GenomeDx Biosciences 的 Decipher® 檢測之外,其他基因檢測公司也分別發展出不同的檢測商品,其他市面上可見的檢測包含:Myriad Genetics 的 Prolaris® 檢測、Genomic Health 的前列腺癌 Oncotype DX,上述兩種檢測也是預後型基因檢測,可用於穿刺採樣的活檢(biopsy)組織或是經 RP 切除的前列腺組織。另一方面,早期診斷測試也是前列腺癌基因檢測的重要範疇,尤其前列腺癌的分期影響後續的治療策略,MDxHealth 基因檢測公司開發 SelectMDx 和 ConfirmMDx,用於癌症初期的診斷,SelectMDx 適用於臨床表現偏高的前列腺特異性抗原(prostate specific antigen,PSA)指數或直腸指檢(digital rectal exam,DRE)異常的男性,測量尿液樣本中的生物標記,幫助醫師判斷罹癌的風險指數、決定是否需要進行組織採樣,透過基因檢測篩選,可以避免不必要的的侵入性檢驗;ConfirmMDx 則用於臨床表現高風險但活檢結果為陰性的男性,利用分子生物標記確認活檢結果,排除假陰性活檢並決定是否密切追蹤觀察[5]。

這些檢測是否可供臨床使用?

許多基因檢測已用於臨床,並顯著改變前列腺癌的醫療管理,以 Decipher® 檢測為例,此檢測已在美國臨床使用超過五年,美國國家綜合癌症網絡(National Comprehensive Cancer Network,NCCN)更在 2018 年將 Decipher® 列入泌尿腫瘤科臨床指南,協助醫師評估患者的罹癌風險,以及提供個人化的治療方針。

不過,基因檢測仍有使用限制,僅有大型醫療單位才有充裕的資源,目前還不常見於小型醫院和區域診所,高昂的檢測費用是其一原因,而且多數的醫療保險尚不給付相關的支出,保險公司僅認可少數有充分臨床實驗數據與顯著效益的基因檢測,也因此尚未廣泛被大眾與醫師採用。

當前挑戰以及解決對策

談到該領域的挑戰以及如何突破困境時,Alshalalfa 博士說:「如何將基因檢測普及化取決於兩件事:數據可用性以及經濟支援。」開發基因檢測需要大量的財務支持,不論公、私部門或學術單位,都需要資金進行技術研發與商業推廣,而數據更是研究疾病與找尋治療方式的關鍵資源,Alshalalfa 博士說:「研究人員需要數據來了解疾病,才有機會建立有助於對抗疾病的基因檢測組測試。」

然而,資源分配不均讓許多研究告終,一般而言,私部門往往掌握較多研究經費和數據,商業營運模式讓企業更容易獲取數據,Alshalalfa 博士繼續道:「許多公司將數據侷限於內部使用、不願與外部分享,這只會拖累醫學進步。」他強調數據共享的重要性:「如果私人企業把數據與其他研究單位分享,我們將會有更多資源與空間開發檢測工具。」各界科學家已經意識到資源共享的重要性,私部門以 GenomeDx 為例,該公司專為 Decipher® 檢測建立一個 Decipher GRID® 資料庫,收集超過 50,000 個泌尿腫瘤科的基因組譜,為目前世界上最大的前列腺癌轉錄組學(transcriptomics)資料庫,提供完整的腫瘤 RNA 表現數據,Alshalalfa 博士說:「如果更多的基因檢測公司願意公開分享基因組資訊、交換臨床數據,相信我們可以更快戰勝癌症。」

「如何將基因檢測普及化取決於兩件事:數據可用性以及經濟支援。」- Mohamed Alshalalfa 博士

展望未來十年

除了早期癌症診斷與預後檢測之外,預測治療反應也是另一個重要領域,Alshalalfa 博士說:「多數基因檢測公司現在正嘗試開發有效的預後檢測,協助了解哪些患者需要治療,但卻沒有檢測能評估不同療法對個體的影響與效益,目前僅有極少數的基因檢測能幫助醫師評估荷爾蒙治療或放射治療的效果。」AR-V7 為其一相關檢測,評估雄性素剝奪療法(androgen deprivation therapy,ADT)是否適用於特定患者,至於放射療法的相關測試,目前僅有少數研究,但尚未發展為臨床應用。

人類的抗癌之路雖然仍有許多障礙,但我們也不斷在錯誤中學習、困境中成長,Alshalalfa 博士最後作結:「我相信在未來的五到十年內之中,會有更多臨床數據可供研究,更多基因檢測將通過美國 FDA 和保險公司核可,屆時基因檢測將能造福更廣大的群眾。」

圖片:採訪 Mohamed Alshalalfa 博士。 (圖片來源:GeneOnline / Joanne Shih)

科學編輯:施柔安 Joanne Shih

參考資料:
1.Latest global cancer data: Cancer burden rises to 18.1 million new cases and 9.6 million cancer deaths in 2018. IARC (2018) (https://www.who.int/cancer/PRGlobocanFinal.pdf?ua=1)
2. Clinically applicable deep learning for diagnosis and referral in retinal disease. Nature Medicine volume 24, pages1342–1350 (2018) (https://www.nature.com/articles/s41591-018-0107-6)
3. Deep Learning and Medical Diagnosis: A Review of Literature. Multimodal Technologies and Interact 2, 47; doi:10.3390/mti2030047 (2018)
4. MDxHealth (https://mdxhealth.com)