結構變異(Structural variation,SVs)和基因拷貝數變異(gene copy number variations,gCNVs)是動植物中主要的遺傳變異來源,對于作物進化、馴化和改良具有重要貢獻。全面準確地鑒定和分析SV和gCNV對挖掘優異等位基因、保障水稻糧食安全具有重要意義。
四川農業大學李仕貴等研究人員合作于2021年發表于《Cell》期刊“Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations”的研究論文,通過組裝了31個具有遺傳多樣性的水稻種質的高質量基因組,并結合兩個現有的水稻基因組,開發了水稻泛基因組,為水稻及其他作物基因組研究、種質資源的精準鑒定、優良基因的挖掘、基因功能解析、分子設計育種等研究奠定了堅實基礎。
本研究選取了遺傳背景具有高度代表性的33個水稻材料,包括亞洲栽培稻各亞群代表性材料和非洲栽培稻材料,以及水稻生產和育種上廣泛使用的優良品種和核心親本材料。利用PacBio長片段測序、Illumina測序、RNA-seq和NCBI數據庫,獲得了31份材料平均深度為60倍的長片段序列數據。利用高質量基因組組裝和注釋流程,獲得了31個均達到參考基因組水平的高質量基因組和基因注釋。結合已發表的兩個高質量基因組(日本晴和蜀恢498)和注釋結果,構建了水稻泛基因組,同時比較分析水稻的結構變異情況。1、獲得31 個從頭組裝高質量水稻基因組,用于遺傳多樣性的種質研究;
2、構建水稻泛基因組規模資源和基于圖的基因組揭示隱藏的SV和gCNV;
3、使用O. glaberrima基因組推斷O. sativa SVs的衍生狀態;
4、SVs和gCNVs塑造了水稻基因表達譜和農藝性狀變異。
組裝的31份水稻的高質量基因組中,亞洲稻基因組大小平均為385.8 Mbp(371.7–392.9 Mbp),非洲稻CG14基因組大小為344.7 Mbp。平均Contig N50達到12.88 Mbp。以日本晴基因為基礎采用迭代策略構建泛基因組,獲得了包含66,636個蛋白質編碼基因的首次構建了水稻圖形基因組,是水稻中迄今最為完整的基于圖形結構的泛基因組。其中20,374個基因為核心基因,46,262個為可變基因。表1 31個水稻高質量基因組組裝及注釋結果
圖1 遺傳多樣性水稻種質的不同農藝表型
將32個基因組序列與日本晴基因組序列進行比較檢測SVs,獲得了總共有171,072個非冗余SVs,包括164,009個存在/缺失變異(PAVs),6,109個易位和954個倒位。SVs在染色體上呈不均勻分布,有140個SVs熱點區域。在染色體11上一個SV熱點區域與12個稻瘟病抗性數量性狀基因座(QTLs)重疊或鄰接。這些發現表明,位于SV熱點區域內的變異可能經歷更強的環境選擇。圖2 代表衍生狀態的SVs的推斷和表征
大多數dSVs與非編碼區重疊。對R527的29種不同樣本類型的RNA測序分析發現脅迫處理后dSVs基因表達變化大于3倍的比例明顯高于非dSVs基因,表明dSVs基因通常對環境壓力更敏感,水稻進化和馴化過程中SVs具有廣泛的基因表達譜。。這些基因組變異很難利用傳統手段鑒定到,絕大多數在先前研究中均未發現,但在農藝性狀調控中發揮重要作用。例如,著名日本優質稻品種“越光”中一個早熟位點(qDTH7-3),可能由OsMADS18基因在“越光”產生兩個拷貝,導致表達量升高從而表現早熟表型。圖3 SVs對基因的影響促成了環境適應和馴化
水稻泛基因組中25,549個(38.34%)蛋白質編碼基因被推斷為gCNVs,包括14,782個基因PAVs。此外,gCNVs可以導致異位表達模式,水稻中gCNV普遍存在并與農藝性狀的變異有關。總體而言,這個gCNVs目錄有助于研究水稻表型變異背后潛在的隱藏基因組變異。圖4 廣泛存在的基因CNVs與農藝性狀變異相關
這些SVs主要的形成機制是轉座因子插入(TEI),其次是非同源末端連接(NHEJ)。研究表明TEs,尤其是LTRs,能夠以某種方式頻繁地為NHEJ產生DNA斷裂,或者通過提供同源序列來促進非等位同源重組(NAHR)。圖5 多種機制驅動水稻SV的形成
以日本晴基因組作為基礎線性基因組,基于彼此同源性<50%的PAV序列構建水稻圖形基因組。總共6,542個PAVs被整合到圖形基因組中。將水稻3K-RG數據集中選擇的674份覆蓋所有亞群、測序深度>10X的水稻材料比對到圖形基因組,證明了水稻圖形基因組的實用性。圖6 水稻圖形基因組的構建及效用展示
為了便于使用這些基因組資源,作者搭建了水稻數據庫網站(http://www.RiceRC.com)。該網絡工具集成了基因組瀏覽器和BLAST功能,便于使用基因組序列和查詢遺傳變異等內容,促進水稻功能基因組學和育種應用研究。圖7 水稻數據庫網站
總之,本研究獲得了31 個從頭組裝高質量水稻基因組,用于遺傳多樣性的種質研究。同時首次構建了水稻圖形基因組,是水稻中迄今最為完整的基于圖形結構的泛基因組。研究對 SV 形成機制、對基因表達的影響以及亞群之間分布的分析說明了這些資源在理解 SV 和 gCNV如何塑造水稻環境適應和馴化方面的效用。研究基于水稻泛基因組通過全基因組關聯 (GWAS)分析,來鑒定那些僅通過SNPs和單個參考基因組所無法檢測的、與表型相關的遺傳變異。本文的工作提供了水稻群體級別的基因組資源,同時配套開發了在線網站便于用戶獲取相關資源,有助于促進水稻育種以及植物功能基因組學和進化生物學研究。參考文獻
Pan-genome analysis of 33 genetically diverse rice accessions reveals hidden genomic variations. Cell, 2021.
凌恩生物明星產品,種質資源數字化解決方案重磅來襲!( 明星產品!種質資源數字化一站式解決方案!)一站式服務,打造種質資源農業育種全套分析流程!四大模塊,全方位開展高質量農業育種研究!專業找凌恩!期待與您的合作!
組學數據-育種高通量表型數據聯合構建農業育種平臺!
本站僅提供存儲服務,所有內容均由用戶發布,如發現有害或侵權內容,請
點擊舉報。