数据科学助抗癌:生物资讯学家 Mohamed Alshalalfa 博士谈前列腺癌基因组研究

0

根据国际癌症研究机构(IARC)2018 年的报告,前列腺癌是全球男性的第四大致死癌症,尽管我们对前列腺癌已有一定程度的了解,也有标准化的医疗临床指南,但每年全球仍有至少 30 万人受此疾病影响[1]。在精准医学时代,科学家透过分子层面了解癌症、分析前列腺癌基因组,试图寻找个人化的医疗策略,国际团队协力投入大型计画,应用基因组学建立进阶的癌症分类、发展新的诊断与治疗选择,其中,许多研究涉及大量的数据分析与资料管理,数据科学在当今的医疗研究中扮演关键环节。

Mohamed Alshalalfa 博士是前列腺癌基因组学的科学家,在此领域有超过十年的经验,与加州大学、梅奥医院(Mayo Clinic)、约翰霍普金斯大学以及哈佛医学院的研究团队合作,他参与计画主要着重于前列腺癌的基因分析,同时发展转译医学(translational medicine),将实验室的技术转化为临床医学可应用的工具。基因线上有幸采访 Alshalalfa 博士,透过生物资讯学的角度,他与我们分享他在学术与产业界中多年的经验,以及前列腺癌研究的当前发展。

跨入前列腺癌症基因组学

癌症基因组学在过去几十年越趋热门,前列腺癌相关的基因组研究却是科学家和企业鲜少触碰的领域,其一原因在于当前的研究仰赖大量数据运算与分析,许多研究人员虽具备熟稔的湿实验室(wet lab)知识,例如:基因剔除和细胞培养等实验技术,但却缺乏同等的数据科学经验,仅有少数研究人员具备相当的跨领域能力。

当问起 Mohamed Alshalalfa 博士是如何展开职业生涯的,他道:“大学时期我主修遗传学,而后踏入计算生物学攻读硕士与博士,自硕士时期,我就以前列腺癌作为研究主题。取得博士学位后,我进入业界,加入一间研究前列腺癌的公司。”当前列腺癌基因组学萌芽时,Alshalalfa 博士是 GenomeDx Biosciences 的资深生物资讯学家,GenomeDx Biosciences 是一间专注于泌尿肿瘤学、前列腺癌和膀胱癌的基因组学公司,透过数据科学开发癌症基因检测,帮助医师进行癌症诊断与分级,致力于改善泌尿系统癌症患者的医疗保健。

肿瘤学生物资讯学历年发展

过往很长一段时间,科学家着重分析癌细胞系与个体基因,试图了解基因与疾病进程的关联,当微阵列、DNA 定序、RNA 定序和高通量序列分析等技术出现时,科技将癌症研究带入大数据时代。优势在于基因定序可以更快速且相对低成本,研究人员取得大量的癌症基因与病患资讯,有助于开发临床检测工具,Alshalalfa博士说:“现在有许多基因检测工具帮助临床医生进行癌症诊断、了解癌症的侵略性,并提供针对病患的治疗决策,但实际上我们还是需要更高阶的运算工具作为后盾。”

深度学习改变癌症医疗

深度学习(deep learning)是机器学习的分支,应用人工神经网络进行资料分析,为许多领域带来革新性的改变,其中语音识别和图像分析是常见的医学应用,借助人工智能分析医疗影像、病理切片,电脑程式可以侦测到肉眼无法辨识的异常影像或细胞,疾病像是视网膜疾病、皮肤癌和乳腺癌已有相对应的诊断工具[2][3],帮助临床及病理医师进行确诊疾病,Alshalalfa 博士提出几项前列腺癌的临床应用,其一为病理切片的影像分析,他道:“研究人员使用深度学习模型分析病理组织切片,借助电脑系统的鉴别能力细分癌细胞种类,同时整合癌细胞的基因序列分析,进一步建立更精确的癌症分级系统。”

另一方面,生物资讯学家应用机器学习模型,如:广义线性模型(GLM)、随机森林(random forest)和支援向量机(support vector machine)分析癌症基因组,这些演算工具大幅提升数据处理的效率,进而强化基因定序工具的能力,让少量的 DNA 片段也足够作为分析样本。

前列腺癌之基因检测

前列腺癌的基因检测分为两大类型:分子预后检测(molecular prognostic test)与早期诊断检测,目前有数家公司投入此领域,其中 GenomeDx Biosciences 是开发预后检测的前驱,Alshalalfa 博士在 GenomeDx 负责研发适用于前列线癌基因子据分析的演算工具,他说明:“我当时与 GenomeDx 合作发展转译医学,将数据运算技术移转至临床应用,开发前列腺癌检测 Decipher® 以及 Decipher GRID 基因数据库。”Decipher® 基因检测为针对患有局限性前列腺癌(localized prostate cancer)的男性,接受根治性前列腺根除术(radical prostatectomy,RP)后的基因检测,以 RP 手术采集的组织为检测样本,分析 22 组癌症相关基因,从中得知癌细胞的恶性程度,以及是否有转移的可能性,相较于传统的病理分析,Decipher® 提供更具个人化的资讯,协助临床医师决定后续的治疗策略。

其他开发公司与商品化检测

除了 GenomeDx Biosciences 的 Decipher® 检测之外,其他基因检测公司也分别发展出不同的检测商品,其他市面上可见的检测包含:Myriad Genetics 的 Prolaris® 检测、Genomic Health 的前列腺癌 Oncotype DX,上述两种检测也是预后型基因检测,可用于穿刺采样的活检(biopsy)组织或是经 RP 切除的前列腺组织。另一方面,早期诊断测试也是前列腺癌基因检测的重要范畴,尤其前列腺癌的分期影响后续的治疗策略,MDxHealth 基因检测公司开发 SelectMDx 和 ConfirmMDx,用于癌症初期的诊断,SelectMDx 适用于临床表现偏高的前列腺特异性抗原(prostate specific antigen,PSA)指数或直肠指检(digital rectal exam,DRE)异常的男性,测量尿液样本中的生物标记,帮助医师判断罹癌的风险指数、决定是否需要进行组织采样,透过基因检测筛选,可以避免不必要的的侵入性检验;ConfirmMDx 则用于临床表现高风险但活检结果为阴性的男性,利用分子生物标记确认活检结果,排除假阴性活检并决定是否密切追踪观察[5]。

这些检测是否可供临床使用?

许多基因检测已用于临床,并显著改变前列腺癌的医疗管理,以 Decipher® 检测为例,此检测已在美国临床使用超过五年,美国国家综合癌症网络(National Comprehensive Cancer Network,NCCN)更在 2018 年将 Decipher® 列入泌尿肿瘤科临床指南,协助医师评估患者的罹癌风险,以及提供个人化的治疗方针。

不过,基因检测仍有使用限制,仅有大型医疗单位才有充裕的资源,目前还不常见于小型医院和区域诊所,高昂的检测费用是其一原因,而且多数的医疗保险尚不给付相关的支出,保险公司仅认可少数有充分临床实验数据与显著效益的基因检测,也因此尚未广泛被大众与医师采用。

当前挑战以及解决对策

谈到该领域的挑战以及如何突破困境时,Alshalalfa 博士说:“如何将基因检测普及化取决于两件事:数据可用性以及经济支援。”开发基因检测需要大量的财务支持,不论公、私部门或学术单位,都需要资金进行技术研发与商业推广,而数据更是研究疾病与找寻治疗方式的关键资源,Alshalalfa 博士说:“研究人员需要数据来了解疾病,才有机会建立有助于对抗疾病的基因检测组测试。”

然而,资源分配不均让许多研究告终,一般而言,私部门往往掌握较多研究经费和数据,商业营运模式让企业更容易获取数据,Alshalalfa 博士继续道:“许多公司将数据侷限于内部使用、不愿与外部分享,这只会拖累医学进步。”他强调数据共享的重要性:“如果私人企业把数据与其他研究单位分享,我们将会有更多资源与空间开发检测工具。”各界科学家已经意识到资源共享的重要性,私部门以 GenomeDx 为例,该公司专为 Decipher® 检测建立一个 Decipher GRID® 数据库,收集超过 50,000 个泌尿肿瘤科的基因组谱,为目前世界上最大的前列腺癌转录组学(transcriptomics)数据库,提供完整的肿瘤 RNA 表现数据,Alshalalfa 博士说:“如果更多的基因检测公司愿意公开分享基因组资讯、交换临床数据,相信我们可以更快战胜癌症。”

“如何将基因检测普及化取决于两件事:数据可用性以及经济支援。”- Mohamed Alshalalfa 博士

展望未来十年

除了早期癌症诊断与预后检测之外,预测治疗反应也是另一个重要领域,Alshalalfa 博士说:“多数基因检测公司现在正尝试开发有效的预后检测,协助了解哪些患者需要治疗,但却没有检测能评估不同疗法对个体的影响与效益,目前仅有极少数的基因检测能帮助医师评估荷尔蒙治疗或放射治疗的效果。”AR-V7 为其一相关检测,评估雄性素剥夺疗法(androgen deprivation therapy,ADT)是否适用于特定患者,至于放射疗法的相关测试,目前仅有少数研究,但尚未发展为临床应用。

人类的抗癌之路虽然仍有许多障碍,但我们也不断在错误中学习、困境中成长,Alshalalfa 博士最后作结:“我相信在未来的五到十年内之中,会有更多临床数据可供研究,更多基因检测将通过美国 FDA 和保险公司核可,届时基因检测将能造福更广大的群众。”

图片:采访 Mohamed Alshalalfa 博士。 (图片来源:GeneOnline / Joanne Shih)

科学编辑:施柔安 Joanne Shih

参考资料:
1.Latest global cancer data: Cancer burden rises to 18.1 million new cases and 9.6 million cancer deaths in 2018. IARC (2018) (https://www.who.int/cancer/PRGlobocanFinal.pdf?ua=1)
2. Clinically applicable deep learning for diagnosis and referral in retinal disease. Nature Medicine volume 24, pages1342–1350 (2018) (https://www.nature.com/articles/s41591-018-0107-6)
3. Deep Learning and Medical Diagnosis: A Review of Literature. Multimodal Technologies and Interact 2, 47; doi:10.3390/mti2030047 (2018)
4. MDxHealth (https://mdxhealth.com)

Share.
error: 注意: 右键复制内容已停用!