预测下一个生技世代的风貌(一):NGS次世代定序的见微知著

0

1995 年 11 月,美国微软创办人比尔・盖兹发表新书 The Road Ahead (中文译为《拥抱未来》),准确预测下一个资讯世代将会是电脑无缝接轨 (seamless computing) 的时代,任何资讯都可随时随地以各种不同的装置即时取得,而电脑也将从单点运作化为二维网络,甚至可结合现实生活的人、事、物达到3D资讯结构。事实证明,比尔・盖兹的预测在不到二十年后即全面实现,现在的智慧型随身装置、云端计算、以及物联网的发展甚至超越当时想像力的极限。而当今的生技产业正如 1995 年的资讯业,同样有许多新技术窜出头、有雄厚资金投入其中、有各国政府大力支持、也有大量新人才和新点子激起活力和创意。这一系列专文将大胆预测下个生技世代可能呈现的风貌,也会剖析带动下一世代生医发展的关键六大技术:NGS 次世代定序、大数据分析、蛋白质体学、液态生物检体 (liquid biopsy)、CRISPR 基因修饰技术、以及 3D 生物打印 (bioprinting)。未来结合资讯、速度、精准度、以及病源根除工具之崭新生医健康产业,非常值得期待!

认识 NGS 次世代定序 (next-generation sequencing)

2003 年 04 月 14 日,人类基因体完整定序图谱出炉,整整耗费 13 年的时间和 27 亿美元的经费,才得到一组基因体序列。时间来到 2016 年,完成一个人的基因体定序仅需 26 小时和 1,500 美元,如此惊人的落差,主要是 NGS 次世代定序技术所造就。

由于 NGS 已是非常成熟的技术, 相关的科研计划及临床运用也越来越广泛。在科研方面,去年《Science》期刊上发表的伊波拉病毒基因,就是借由 NGS 去分析它的起源。临床研究方面,NGS 也常被用来做基因的筛选、检测及治疗用药的评估,而许多实验室及临床计画皆透过与经验丰富的业界团队合作来完成,业界提供客制化的科研服务也是近年的趋势。尤其 NGS 产出数据的流程已经标准化,实验设计及数据产出后的分析将扮演关键的角色。由 NGS 产生的大量数据动辄数十亿至数千亿个碱基,在分析时从软件选择,参数设定、软件串连到最后的验证等都有相当难度。因此,有经验的分析团队是目前许多研究单位最缺乏,却也是 NGS 流程中最不可或缺的。几年前,中国华大基因可说是从科研服务起家,而台湾的 Biotools 图尔思生物科技,近年来也提供这样的 NGS 服务,让许多研究单位可借重业界的数据分析经验和团队。在少子化的时代,尤其是实验室人力逐渐锐减下,不失为一个不错的选择。

目前 NGS 技术主要有几种:

  1. Illumina (Solexa) NGS MiniSeq/MiSeq/NextSeq/HiSeq
    Solexa 公司于 1998 年由两位英国剑桥大学的科学家创办,而其核心 NGS 技术的特色是将待定序的序列切成 100-150 个碱基长的短片段后再大量复制各个片段,然后再将各片段的一端固定在平面上,以带有萤光的碱基进行定序。萤光碱基结合 DNA 序列后就会发光,而电脑可捕捉这些萤光影像并同时读取上万片段的序列。由于每次反应只会接上一个新的萤光碱基,所以只要读取 100-150 个影像就能完成所有片段的定序,可大幅缩短资料读取时间,而随着技术的的进步被读取的碱基长度也更长。最后再利用电脑整合各片段的资讯,即可获得完整的序列。Solexa 公司于 2007 年被 DNA 定序巨擘 Illumina 买下,而目前Illumina 堪称 DNA 定序的全球龙头,年营业额高达 16 亿美金。现在全世界 90% 已定序的 DNA 序列,都是由 Illumina 的技术或机器所完成。
  2. ThermoFisher Ion Proton/Ion PGM/Ion S5
    Ion Torrent 的 NGS 技术早期属于 Life Technologies,后来在 2014 年被 ThermoFisher 并购。这项技术是利用碱基在定序过程结合上 DNA 序列后即会释放一个氢离子的原理,舍弃过去以光学讯号作为读取碱基的基础。ThermoFisher 的 NGS 的基本操作方式与 454 NGS 相当类似,是将待定序的序列切成 200 个碱基长左右的小片段,然后将个别片段与单一珠子结合,再置入微量盘上的独立凹槽进行片段复制。接下来同样是利用一次将微量盘充满一种碱基的方式进行定序,但最大的差别是在于电脑会侦测氢离子释放的讯号和数目,而不是光讯号。454 NGS 最大的弱点在于待定序片段出现一整串相同碱基时 (例如:AAAAA),电脑有时会分不清楚光学讯号而误判碱基数。不过侦测氢离子数目的 Ion Torrent 可以减少这种问题,故精准度可提升许多。
  3. 454 NGS
    454 生命科学公司于 2005 年推出这项快速定序技术,是将待定序的序列切成 1,000 个碱基长左右的大片段,再将这些片段与特殊珠料结合,每一个珠子上只会有一种片段。接下来,每个珠子将会被分到微量盘上的独立凹槽进行片段复制作业。完成复制后,微量盘则会加满同一种碱基,而这些碱基与 DNA 序列结合后就会释放光讯号让电脑可读取序列。反应完成后,多余的碱基将会被洗掉,然后微量盘会重新充满另一种碱基。这种定序方式只须注意单一讯号即可,电脑不须区分四种碱基的萤光颜色,因此定序速度可大幅提升,定序成本也可降低许多。2007 年,454 生命科学被 Roche 公司买下,不过随着近年有更便宜而准确的 NGS 技术陆续推出,454 NGS的市占率也逐渐下滑,促使 Roche 公司宣布将于 2016 年结束这个平台,不再提供服务。

22001487_xl

延伸阅读:美国 Foundation Medicine 宣布与阿斯利康继续合作 并取得 Sequenom 定序实验室

NGS次世代定序在生技和医疗的价值

而全球 NGS 市场在 2021 年估计可达到 104 亿美元的产值,主要价值在于基因序列即时侦测和大数据整合。若能立即了解特定基因甚至基因体的序列,研发各种转殖微生物、生产单株抗体的细胞、或具有特定特征的农作物将可大幅缩短时间并提升效率;而在临床上,快速定序有助于诊断遗传性疾病、判断肿瘤类型、或是预测各种疾病的发病风险等等。而更上一层楼来看,所有这些定序的资讯若能透过大数据系统进行整合,将有助于了解每个基因的功能、基因与基因之间的互动、以及非基因的序列之功能和意义,真正地解开基因体的奥秘。

NGS 技术除了应用在基因体的范畴之外, 从转录体 (transcriptome,即生物个体在任一时间点真正被转录出来的讯息 RNA,可反应当下有在发挥功能的基因种类) 与表观体 (epigenome,即一个基因体上的各种表观遗传学修饰情形,像是甲基化、乙酰化等等) 的层面进行剖析更能够表现出生物体内的即时状态,这有机会让医疗真正进入“即时医学”和“预防医学”的时代,未来可能不只癌症,各式各样的遗传性疾病、慢性病、或感染性疾病,都有机会进行即时病况追踪和治疗疗效评估,甚至可达到前期预防的境界。

本文末与读者分享长庚医院人类全基因体疾病研究核心实验室于 2016 的演说:
http://pics.ee/uoN

©www.geneonline.news. All rights reserved. 基因线上版权所有 未经授权不得转载。合作请联系:[email protected]