基因也环保 ?! 长链非编码 RNA 的诞生

0

女生怎么控制 X 染色体的基因表现?

唐氏症这种遗传疾病,大家应该耳熟能详。唐氏症的病因是因为有 3 条第 21 号染色体,比一般人多了一条,从而导致许多基因表现的异常。由此一案例可以看出,基因子目与表现量的多寡,对维持人体的正常运作非常重要,不能随意增减。

既然染色体数目这么重要,假如多了一条染色体,就会使正常人变成唐氏症,那么每位女生都比男生多了一条 X 染色体,而 X 染色体上头又满是基因,为什么不论女生或男生,两性都能够正常控制基因表现,不会造成问题呢?

人类的性别是由 X 与 Y 染色体决定,因此它们被称作性染色体。人类的祖先演化出“抑制”的方式,让男生正常表达一条 X 染色体的基因;女生两条 X 染色体则是选择抑制一条,关闭其基因表现,使得两性都只有一条 X 染色体的基因表现,就不会有问题了。

然而,女生是如何关掉一条 X 染色体呢?看似简单的问题,学者们却费了很多心力才找到答案。

不会转译成蛋白质的长链 RNA

1991 年发表的论文报告,在 X 染色体上找到一个基因,被抑制的那条 X 染色体中,该基因会大量表现,关闭整条染色体的基因表现(X inactivation)。那个基因被称作“Xist”,不过,故事到这里还没有结束。[1][2]

基因本身是 DNA,会先转录表现出 mRNA,再转译成氨基酸(氨基酸是组成蛋白质的小单元);所以当找到 Xist 基因的 RNA 产物后,下一步就是继续寻找它的蛋白质。奇怪的是,Xist 转录出的 RNA 非常长,达到 17000 个核苷酸。理论上,这段 RNA 会转译成 5700 个氨基酸,以当时对蛋白质的了解而言,这体型大到超乎想像;就算会经过 RNA 剪接(splicing),Xist 蛋白质应该还是非常巨大。

不可思议的是,Xist 基因其实不会制造很大的蛋白质产物,因为它只会转录,根本不会转译成氨基酸!它的作用方式,就是保持在 17000 个核苷酸长的 RNA 形式,直接去影响 X 染色体,关闭整条染色体的基因。

Xist 是史上第一个得知,不会转译成氨基酸,直接以 RNA 形式作用,又超过 200 核苷酸长的 RNA。近来随着基因体学发达,科学家找到大量以这种方式作用的“基因”,如今它们有了一个专有名词: long non-coding RNAs(长链非编码 RNA),简称“lncRNA”。

数目庞大,演化迅速的 lncRNA 基因

直到最近才确认 lncRNA 普遍存在,至今对它们的研究仍处于非常初期,Xist 只是少数了解比较透彻的特例。令人吃惊的是,lncRNA 的数目超乎想像的多,人类至少超过 1 万,或许达到 2 万个之多。人类基因组会转译成蛋白质的基因,一共也才 2 万个左右;意思是人类 lncRNA 的数量,也许和蛋白质基因不相上下,而我们之前几乎不知道它们的存在!

比较不同生物的基因组,会发现许多蛋白质基因在差了很远的演化支系,例如人类与鱼类,甚至是人类与昆虫中皆有存在,例如脂肪酸去饱和酶(fatty acid desaturase,在人类叫作 FADS),在演化上这种状况称为保守(conserved)存在

不只人类,其他生物也有 lncRNA,而蛋白质基因相较于 lncRNA 显得保守许多;各种生物间的 lncRNA 组成,差异比蛋白质基因更大,只有少数 lncRNA 在不同生物中共通存在。这就表示演化史上,常常有新的 lncRNA 基因诞生,同时也有许多消失。

新的 lncRNA 基因从何而来?至少有两个可能。一种方式是无中生有:如果一段本来不会表现的 DNA,偶然获得会转录出 RNA 的能力,就有机会生成一个全新的 lncRNA 基因。另一可能是回收利用:存在已久、老旧的蛋白质基因不再转译后,变成只会转录的 lncRNA 基因。

最近发表的一项研究,证实的确有些 lncRNA,源自回收利用的失效蛋白质基因。[3]

DNA chain.

延伸阅读:揪出细胞层次里的致病真凶:单细胞 RNA 定序结合微流体技术

lncRNA 基因的诞生:旧基因回收利用

该怎么知道一个 lncRNA 来自旧基因的回收利用?过去这类研究是不可能的,所幸随着基因体学发展,遗传学家已掌握大批物种的基因组;靠着比较各种脊椎动物的基因组,能得知有哪些基因保守地同时存在

人类属于哺乳类,哺乳类又是脊椎动物旗下一支。研究团队的假设,若一个基因在哺乳类之外的脊椎动物中普遍存在,部分哺乳类也有,而人类却没有,反而变成 lncRNA 基因,那么这类 lncRNA 就有可能是失去功能的蛋白质基因,回收利用后重生的结果。

靠着此套策略,以及后续实验确认,一共侦测到至少 55 个符合标准的 lncRNA,因此论文表示,确实有些 lncRNA 基因,源于丧失本来功能的蛋白质基因。然而,所有哺乳类中保守存在的 lncRNA 数量远远大于 55,由于回收利用而诞生的 lncRNA 只占全体不到 5% ;因此多数 lncRNA 的生成方式,应该是无中生有。

基因研究全新领域

最近学术界兴起一股探讨 lncRNA 的潮流,不过这些研究不只有学术价值,也对医疗应用相当有意义。即使至今了解仍很有限,我们也已经知道一些疾病与 lncRNA 有关,除了遗传性疾病,在多种癌症中,lncRNA 也扮演着可疑的角色。

另一点值得玩味的是,lncRNA 在人类脑部的表现量特别高,我们的神经运作、认知、心智,是否也受到这些不会转译的长链 RNA 分子大幅影响?一些神经退化疾病,是否源自它们出了问题?这些疑问,都有待未来研究厘清。

文  /  寒波

NGSC 报名进入倒数阶段!各位对次世代定序有兴趣的专家学者同学们,赶快报名吧!

2017NGSCBanner_700x259

参考文献:

  1. Brown, C. J., Lafreniere, R. G., Powers, V. E., Sebastio, G., Ballabio, A., Pettigrew, A. L., … & Willard, H. F. (1991). Localization of the X inactivation centre on the human X chromosome in Xq13. Nature, 349(6304), 82-84.
  2. Brown, C. J., Ballabio, A., Rupert, J. L., Lafreniere, R. G., Grompe, M., Tonlorenzi, R., & Willard, H. F. (1991). A gene from the region of the human X inactivation centre is expressed exclusively from the inactive X chromosome. Nature, 349(6304), 38-44.
  3. Hezroni, H., Perry, R. B. T., Meir, Z., Housman, G., Lubelsky, Y., & Ulitsky, I. (2017). A subset of conserved mammalian long non-coding RNAs are fossils of ancestral protein-coding genes. Genome Biology, 18(1), 162.

(作者部落格《盲眼的尼安德塔石器匠》、同名的粉丝团《同名的粉丝团》,欢迎参观、拍打、与喂食)

©www.geneonline.news. All rights reserved. 基因线上版权所有 未经授权不得转载。合作请联系:service@geneonlineasia.com

 

Share.
error: 注意: 右键复制内容已停用!