ATCG加加减减,竟然让稻的基因更丰富!

0

由非编码序列变成新的de novo基因

基因是承载遗传讯息的小单位,生物在演化过程中,旧的基因不断丧失,也会有新的基因加入,至今已经知道超过十种新基因诞生的方式。

绝大部分新基因源自于旧基因的编码(coding)序列,例如 DNA 复制、反转录复制、水平基因转移等方式,都能替基因组添加新的基因。然而,有一种新基因出现的状况,却不需要任何既有的编码序列,而是由非编码序列直接无中生有,凭空生出新的基因。

真核生物的基因组序列中,会表现出蛋白质,也就是编码 DNA 的比例很低,大部分都是不会表现的非编码 DNA。原本不会表现的 DNA 序列,若是某些地方突变以后,形成前有起始密码子(start codon),后有终止密码子(stop codon)的序列结构,就有机会成为会表现的新基因。此一无中生有的新基因诞生方式,称作“de novo”。

实务上要寻找 de novo 基因却很不容易,遗传学家直到最近才在多种生物中确认这类基因的存在。必需比对许多高品质的近亲基因组,才能确认某个看似孤单的基因,真的是由非编码序列衍生而成。

稻,是当今世界上最大宗的粮食作物之一,也有大量的基因体学资讯。一项研究以 13 个稻属(Oryza)的近缘物种为材料,研究 de novo 基因的演化状况,结果发现稻的基因组中,源于无中生有的基因子目不少。[1]

基因也环保 ?! 长链非编码 RNA 的诞生

真的会工作,有存在感的新鲜基因们

众多稻属植物中,台湾人非常熟悉的粳稻(Oryza sativa japonica)资讯齐全,遗传研究众多,被作为和其他亲戚对照的基础。粳稻一共有 38000 多个基因,与亲戚们比较后,研究团队判断其中至少有 175 个基因是无中生有而成。

粳稻和亲戚东非野生稻(Oryza punctata)大概分家 340 万年,诞生 175 个无中生有的基因,意思是平均每一百万年约产生 51 个新基因。不过必需注意,175 是现在的情形,也就是说,历经时间考验后还有 175 个基因尚未被淘汰,因此历史上曾经出现过的 de novo 基因子量,应该比 175 更多一些。[2]

过去研究得知,诞生时间相对短的基因,表现量通常比资深的基因更低,也更容易有组织特异性(tissue specific),亦即只在特定组织表现。

粳稻有 4965 个基因,是在各种稻分家以前就已经出现,演化史非常悠久;历史相对较短的 de novo 基因与它们比较之下,新基因的表现量普遍不高。研究团队也比较三种组织:叶、穗、根,同一个基因各自的表现,发现新基因常有组织专一性。这些特征都符合新基因诞生后已知的常态。

粳稻以外,各种稻的基因组中总共有 343 个可能的 de novo 基因,不过它们也可能是空有基因序列,却不是真的会表现的基因。分析多种组织后,研究团队判断,至少 194 个基因会转译出蛋白质,可以肯定这 56.6% 是真有作用的真基因,而不是假基因。

上述结果表示,即使新基因诞生后在演化上还不算很久,也已经成为稻生理运作中的一环。de novo 生成新基因的方式,也对稻的基因多样性有所贡献。

【小岛果蝇启示录】看似假基因,真的会表现?

一个基因怎么从无到有?

非编码 DNA 序列,是怎么变成有头(起始密码子)有尾(终止密码子)的完整基因呢?有两种突变方式,一种是点突变,比方说原本是 CTG,直接变成 “A”TG;另一种是插入/删除(indel),例如原本是 ATCG,在中间插入 GCGT,变成 AT”GCGT”CG。

粳稻的 175 个基因中,123 个基因只有插入/删除,30 个只有点突变,18 个两者皆有,4 个无法判断。各种突变发生的机率不同,稻产生点突变的机率,是插入/删除的 10 倍多,但是 de novo 基因的生成过程中,插入/删除造成新基因的数目,却是点突变的 3 倍左右。

简单换算,由非编码序列变成基因的演化过程,插入/删除这一类突变留下的机率,约为点突变的 30 倍。由此推论,各种突变方式中,插入/删除是促进 de novo 基因出现的主要机制。

有了基因的序列,还要能够表现。一种状况是,先形成完整的基因 DNA 序列以后,才开始转录为 mRNA;也有些时候,一段非编码 DNA 先开始转录,后续突变再衍生为完整的 mRNA 序列;也有可能是开始转录与形成完整基因,两件事同时发生。

考虑上述三种情形,粳稻的 175 个基因中,159 个基因是非编码状态下先开始转录,10 个是先演化出完整序列,6 个则是同时发生。超过 90% 的 de novo 基因在其一开始转录的阶段,仍然尚未成为完整的基因,可见一段 DNA 序列先开始转录出非编码 RNA,是最后形成新基因的大宗潜在原料。

稻被人类驯化之后,至今都是重要的粮食作物。这回新研究告诉我们,稻在被人类驯化以前,也经历过非常精彩的基因演化。几百万年来,稻基因组中有数百处非编码序列,获得转录 RNA 的能力,又因为突变而变成有头有尾的完整基因,最后衍生为可以转译出蛋白质的标准基因。

文/寒波

参考文献:
1. Zhang, L., Ren, Y., Yang, T., Li, G., Chen, J., Gschwend, A. R., … & Wen, B. (2019). Rapid evolution of protein diversity by de novo origination in Oryza. Nature Ecology & Evolution, 1.
2. Becoming a de novo gene
https://www.nature.com/articles/s41559-019-0845-y

(作者部落格《盲眼的尼安德塔石器匠》、同名的粉丝团《同名的粉丝团》,欢迎参观、拍打、与喂食)

©www.geneonline.news. All rights reserved. 基因线上版权所有 未经授权不得转载。合作请联系:service@geneonlineasia.com

Share.
error: 注意: 右键复制内容已停用!