由非編碼序列變成新的de novo基因
基因是承載遺傳訊息的小單位,生物在演化過程中,舊的基因不斷喪失,也會有新的基因加入,至今已經知道超過十種新基因誕生的方式。
絕大部分新基因源自於舊基因的編碼(coding)序列,例如 DNA 複製、反轉錄複製、水平基因轉移等方式,都能替基因組添加新的基因。然而,有一種新基因出現的狀況,卻不需要任何既有的編碼序列,而是由非編碼序列直接無中生有,憑空生出新的基因。
真核生物的基因組序列中,會表現出蛋白質,也就是編碼 DNA 的比例很低,大部分都是不會表現的非編碼 DNA。原本不會表現的 DNA 序列,若是某些地方突變以後,形成前有起始密碼子(start codon),後有終止密碼子(stop codon)的序列結構,就有機會成為會表現的新基因。此一無中生有的新基因誕生方式,稱作「de novo」。
實務上要尋找 de novo 基因卻很不容易,遺傳學家直到最近才在多種生物中確認這類基因的存在。必需比對許多高品質的近親基因組,才能確認某個看似孤單的基因,真的是由非編碼序列衍生而成。
稻,是當今世界上最大宗的糧食作物之一,也有大量的基因體學資訊。一項研究以 13 個稻屬(Oryza)的近緣物種為材料,研究 de novo 基因的演化狀況,結果發現稻的基因組中,源於無中生有的基因數目不少。[1]
基因也環保 ?! 長鏈非編碼 RNA 的誕生
真的會工作,有存在感的新鮮基因們
眾多稻屬植物中,台灣人非常熟悉的粳稻(Oryza sativa japonica)資訊齊全,遺傳研究眾多,被作為和其他親戚對照的基礎。粳稻一共有 38000 多個基因,與親戚們比較後,研究團隊判斷其中至少有 175 個基因是無中生有而成。
粳稻和親戚東非野生稻(Oryza punctata)大概分家 340 萬年,誕生 175 個無中生有的基因,意思是平均每一百萬年約產生 51 個新基因。不過必需注意,175 是現在的情形,也就是說,歷經時間考驗後還有 175 個基因尚未被淘汰,因此歷史上曾經出現過的 de novo 基因數量,應該比 175 更多一些。[2]
過去研究得知,誕生時間相對短的基因,表現量通常比資深的基因更低,也更容易有組織特異性(tissue specific),亦即只在特定組織表現。
粳稻有 4965 個基因,是在各種稻分家以前就已經出現,演化史非常悠久;歷史相對較短的 de novo 基因與它們比較之下,新基因的表現量普遍不高。研究團隊也比較三種組織:葉、穗、根,同一個基因各自的表現,發現新基因常有組織專一性。這些特徵都符合新基因誕生後已知的常態。
粳稻以外,各種稻的基因組中總共有 343 個可能的 de novo 基因,不過它們也可能是空有基因序列,卻不是真的會表現的基因。分析多種組織後,研究團隊判斷,至少 194 個基因會轉譯出蛋白質,可以肯定這 56.6% 是真有作用的真基因,而不是假基因。
上述結果表示,即使新基因誕生後在演化上還不算很久,也已經成為稻生理運作中的一環。de novo 生成新基因的方式,也對稻的基因多樣性有所貢獻。
【小島果蠅啟示錄】看似假基因,真的會表現?一個基因怎麼從無到有?
非編碼 DNA 序列,是怎麼變成有頭(起始密碼子)有尾(終止密碼子)的完整基因呢?有兩種突變方式,一種是點突變,比方說原本是 CTG,直接變成 “A”TG;另一種是插入/刪除(indel),例如原本是 ATCG,在中間插入 GCGT,變成 AT”GCGT”CG。
粳稻的 175 個基因中,123 個基因只有插入/刪除,30 個只有點突變,18 個兩者皆有,4 個無法判斷。各種突變發生的機率不同,稻產生點突變的機率,是插入/刪除的 10 倍多,但是 de novo 基因的生成過程中,插入/刪除造成新基因的數目,卻是點突變的 3 倍左右。
簡單換算,由非編碼序列變成基因的演化過程,插入/刪除這一類突變留下的機率,約為點突變的 30 倍。由此推論,各種突變方式中,插入/刪除是促進 de novo 基因出現的主要機制。
有了基因的序列,還要能夠表現。一種狀況是,先形成完整的基因 DNA 序列以後,才開始轉錄為 mRNA;也有些時候,一段非編碼 DNA 先開始轉錄,後續突變再衍生為完整的 mRNA 序列;也有可能是開始轉錄與形成完整基因,兩件事同時發生。
考慮上述三種情形,粳稻的 175 個基因中,159 個基因是非編碼狀態下先開始轉錄,10 個是先演化出完整序列,6 個則是同時發生。超過 90% 的 de novo 基因在其一開始轉錄的階段,仍然尚未成為完整的基因,可見一段 DNA 序列先開始轉錄出非編碼 RNA,是最後形成新基因的大宗潛在原料。
稻被人類馴化之後,至今都是重要的糧食作物。這回新研究告訴我們,稻在被人類馴化以前,也經歷過非常精彩的基因演化。幾百萬年來,稻基因組中有數百處非編碼序列,獲得轉錄 RNA 的能力,又因為突變而變成有頭有尾的完整基因,最後衍生為可以轉譯出蛋白質的標準基因。
文/寒波
參考文獻:
1. Zhang, L., Ren, Y., Yang, T., Li, G., Chen, J., Gschwend, A. R., … & Wen, B. (2019). Rapid evolution of protein diversity by de novo origination in Oryza. Nature Ecology & Evolution, 1.
2. Becoming a de novo gene
https://www.nature.com/articles/s41559-019-0845-y
(作者部落格《盲眼的尼安德塔石器匠》、同名的粉絲團《同名的粉絲團》,歡迎參觀、拍打、與餵食)
©www.geneonline.news. All rights reserved. 基因線上版權所有 未經授權不得轉載。合作請聯繫:[email protected]