
物種中不同品系表型差異示意圖
(Jayakodi M et al., DNA Research; Tian X et al.Sci China Life Sci; Barchi L et al.,Plant J)
因此對于一個物種來說,如果只使用單一的參考基因組進(jìn)行遺傳馴化變異的研究,可能會丟失掉大量有意義的基因信息。為了解決這些問題并充分理解關(guān)鍵物種中重要性狀形成機(jī)理,為育種奠定重要的研究基礎(chǔ),動植物泛基因組研究應(yīng)運(yùn)而生。

泛基因組近年發(fā)展趨勢(基于NCBI PubMed搜索pan-genome)
泛基因組分析有助于理解物種的特征,同時泛基因組圖譜提供的復(fù)雜基因組變異,有助于解析作物表型和農(nóng)藝性狀的多樣性。選擇不同亞種材料進(jìn)行泛基因組測序,可以研究物種的起源及演化等重要生物學(xué)問題;選擇野生種和栽培種等不同特性的種質(zhì)資源進(jìn)行泛基因組測序,可以發(fā)掘重要性狀相關(guān)的基因資源,為科學(xué)育種提供指導(dǎo);選擇不同生態(tài)地理類型的種質(zhì)資源進(jìn)行泛基因組測序,可以開展物種的適應(yīng)性進(jìn)化、外來物種入侵性等熱門科學(xué)問題。
泛基因組在遺傳變異發(fā)掘和植物分子育種中應(yīng)用[1]
其實(shí)說了很多泛基因組的概念與意義,那么泛基因組到底能分析哪些內(nèi)容呢?接下來容小編一一道來~
泛基因組構(gòu)建的開放性檢測
廣義的泛基因組是指獲取該物種全部遺傳信息,構(gòu)建一個非冗余的集合體。由于個體間的差異,在構(gòu)建泛基因組的時候會在參考基因組的基礎(chǔ)上,不斷引入新的特異性序列。因此,統(tǒng)計(jì)結(jié)果可發(fā)現(xiàn)整個泛基因組的大小隨著個體數(shù)量的增加而增加,核心基因組(幾乎存在與全部個體基因組中)的大小隨著個體數(shù)量的增加而減?。ㄈ鐖D1)。
由于物種受到生存環(huán)境與生態(tài)位差異、有效群體規(guī)模、多態(tài)性水平差異等因素的影響,泛基因組呈現(xiàn)開放型和閉合型兩種模式。對于閉合型的泛基因組,核心基因組和整個泛基因組含量會隨著個體增加很快到達(dá)平臺期。而開放型泛基因組的物種具有更豐富的遺傳資源庫、更強(qiáng)的多態(tài)性與環(huán)境適應(yīng)性,因此想達(dá)到平臺期通常需要更多的個體加入,才能通過有限的個體充分展示物種內(nèi)全部遺傳信息。從而,通過泛基因組與核心基因組的比例統(tǒng)計(jì),可以了解所選材料構(gòu)建的泛基因組是否具有一定的代表性。

圖1開放型(左)與閉合型(右)泛基因組[2]
泛基因組核心與非核心基因分析
泛基因組分析通過對每個個體中共有情況進(jìn)行基因集聚類,通常分為以下三種:
核心基因(core gene):在所有動植物品系或者菌株中都存在的基因;非核心基因(dispensable gene):在1個以及1個以上的動植物品系或者菌株中存在的基因。特有基因(Private):僅在一個品系中存在的基因。

圖2 核心基因與非核心基因示意圖[3]
隨著基因組數(shù)量的增加,核心基因的識別將嚴(yán)重受到denovo中組裝錯誤的影響。為了糾正這種錯誤,一些科研工作者將泛基因組進(jìn)一步細(xì)分:在所有基因組的為核心基因(core),在幾乎所有品系中發(fā)現(xiàn)的為soft-core,在比soft-core少但不止幾個品系的品系中發(fā)現(xiàn)的shell,以及在只有幾個品系中發(fā)現(xiàn)的為cloud。具體的分類比例與樣品數(shù)量間的關(guān)系并不固定,目的均是為了對基因進(jìn)行分組,以便進(jìn)行可靠的比較(圖3)。而這些分組的基因頻率呈現(xiàn)不對稱的首尾高中間低的分布形式,充分展示了不同類別基因型的占比情況。

圖3 棉花(上左)、雞(上右)與高粱(下)泛基因組成分
(Li J et al.Genome Biol.2021;Wang K et al.,Mol Biol Evol.2021;Tao Y et al.,Nat Plants.2021)
除此之外,根據(jù)core、dispensable等各組分聚類結(jié)果構(gòu)建基因家族的存在與缺失分布熱圖,進(jìn)一步了解不同材料中的差異情況。同時可結(jié)合不同來源or不同表型等特征充分挖掘其基因型的多態(tài)性。

圖4 雞泛基因組中每個個體基因家族的存在缺失分布圖
(Wang K et al.,Mol Biol Evol.2021)
從進(jìn)化的角度來講,pan-genome中鑒定出的核心基因(core genes)可能是執(zhí)行關(guān)鍵功能的基因,其在一個物種中傾向于一些保守的基因。相反,非核心基因促進(jìn)了物種的多樣性,使其能夠適應(yīng)各種環(huán)境條件。核心基因通常富集到控制著生命體基本生成代謝的基本細(xì)胞功能,而非核心基因則富集到與環(huán)境和防御反應(yīng),受體和抗氧化劑活性,基因調(diào)控以及信號轉(zhuǎn)導(dǎo)等相關(guān)的功能。通過功能注釋可了解到核心、可變與特有基因家族的功能情況,從而找尋物種特異的功能與性狀形成相關(guān)通路(圖5)。

圖5 水稻共有和特有基因家族分析
(Choi J Y et al., Genome Biology.2020)
例如,地中海貽貝泛基因組研究中發(fā)現(xiàn),可變基因顯著富集在與環(huán)境適應(yīng)性相關(guān)的通路中(如細(xì)胞凋亡、免疫信號傳導(dǎo)等),增強(qiáng)了地中海貽貝的環(huán)境適應(yīng)性(圖6)。
圖6 貽貝泛基因組表達(dá)情況
(Gerdol M et al., Genome Biology.2020)
眾多研究表明,非核心基因比核心基因的可變性更強(qiáng);與核心基因集相比,非核心基因集中的非同義突變比同義突變的比率要高。因此通過同義與非同義突變(ka/ks)可以用來檢測非核心基因集中基因是否受到選擇作用。

圖7 高粱泛基因組Ka/Ks占比情況
(Tao Y et al.,Nat Plants.2021)
泛基因組變異分析
結(jié)構(gòu)變異是泛基因組的重點(diǎn)研究對象,這些變異信息為物種的人為選擇及自然選擇提供原始的材料。了解變異產(chǎn)生的過程,探究不同材料的變異程度并利用有利的變異對維持并提高物種生產(chǎn)力至關(guān)重要,有助于解析物種表型和農(nóng)藝性狀的多樣性。泛基因組研究,為更好地了解SV在動植物馴化中的作用提供了基礎(chǔ)。主要研究的變異類型為:SNP(Single nucleotide polymorphism),即單核苷酸多態(tài)性變異,主要指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性,這種變異可由單個堿基的轉(zhuǎn)換(transition)或顛換(transversion)所引起。InDel(Insertion-Deletion),指的是在基因組的某個位置上所發(fā)生的小片段序列的插入或者刪除,其長度通常在在 2 bp-50 bp 之間。SV(Structure Variantions),即基因組結(jié)構(gòu)性變異,通常指的是基因組上大長度的序列變化和位置關(guān)系變化,有豐富的變異類型,包括長度在50bp以上的長片段染色體倒位、染色體易位、重復(fù)、存在/缺失(PAV)、拷貝數(shù)變異(CNV)。

圖8 SV變異類型[4]
例如高粱泛基因組研究發(fā)現(xiàn),相對于參考基因組,其它高粱個體基因組中有429~1118個基因存在拷貝數(shù)變異(CNV)。功能注釋顯示這些CNV基因豐富了防御反應(yīng)、信號轉(zhuǎn)導(dǎo)和細(xì)胞蛋白分解代謝等生物學(xué)過程。并且不同高粱個體基因組上存在大量的存在缺失變異(PAV),有2514個基因受PAV嚴(yán)重影響,這些基因富集于與生物和非生物脅迫相關(guān)的生物過程,而抗病基因在這組基因中顯著富集。進(jìn)一步研究發(fā)現(xiàn)Yellow seed1、SbRc的PAV影響到高粱籽粒顏色變化(圖9)

圖9 Yellow seed1 基因和sbRc基因的序列差異
(Tao Y et al.,Nat Plants.2021)
除此之外,在其他物種中同樣也發(fā)現(xiàn)大量結(jié)構(gòu)變異導(dǎo)致性狀差異。在水稻中,主要基因的presence/absence變異賦予其對淹沒這一環(huán)境的耐受性,如Sub1A基因的PAVs變異(Xu et al., 2006),兩個乙烯反應(yīng)因子基因,SNORKEL1和SNORKEL2,進(jìn)一步引發(fā)了深水水稻與非深水水稻對水深的不同反應(yīng)(Hattori et al., 2009)。水稻泛基因組研究發(fā)現(xiàn)SV熱點(diǎn)區(qū)域與稻瘟病抗性QTLs重疊/鄰接,OsGLP2-1的存在可能保證種子的適當(dāng)休眠,有助于其適應(yīng)環(huán)境。

圖10 水稻SV熱點(diǎn)區(qū)域與種子休眠相關(guān)基因插入
(Qin P et al., Cell.2021)
眾多泛基因組SV分析結(jié)果中我們不難發(fā)現(xiàn),SV在農(nóng)作物重要農(nóng)藝性狀的遺傳控制中起著關(guān)鍵作用?;蚪M的結(jié)構(gòu)變異可以導(dǎo)致物種個體間基因結(jié)構(gòu)、表達(dá)特性、基因劑量等發(fā)生實(shí)質(zhì)性地變化,并對動植物農(nóng)藝性狀形成了深刻的影響。
圖形泛基因組構(gòu)建
圖形泛基因組是指以參考基因組為框架,將其他個體材料基因組序列與之比對,存在差異的地方構(gòu)成不同的分支,并隨著新序列的加入不斷擴(kuò)展變化,最終構(gòu)建出一個包含全部變異信息的復(fù)雜圖形結(jié)構(gòu)(圖11)。圖形泛基因組可以更好的展示每部分序列在泛基因組中的位置關(guān)系,使構(gòu)建一個包含物種內(nèi)全部遺傳信息的泛基因組成為可能。圖形泛基因組已經(jīng)在大豆、水稻、牛、高粱等物種有了初步構(gòu)建與應(yīng)用,為基因組學(xué)研究提供了一個重要的推動力。
圖11 圖形泛基因組構(gòu)建過程[3]
轉(zhuǎn)座子分析
TEs轉(zhuǎn)座因子(Transposable element,TE):又稱之為“跳躍基因” “可移動的遺傳因子”,是基因組中最活躍的部分,TE的活性被認(rèn)為是不同物種之間基因組大小變化的重要因素。SVs可以通過TEs轉(zhuǎn)座子的移動而形成(主要位于非核心基因區(qū)),在很多物種中已經(jīng)發(fā)現(xiàn)PAVs富集在轉(zhuǎn)座子TEs區(qū),TE活性可以介導(dǎo)大規(guī)模的染色體重排。隨著時間推移,轉(zhuǎn)座子兩端的LTR由于堿基突變逐漸產(chǎn)生了差異。通過這種與時間長短有關(guān)的序列差異,利用LTR之間的分化距離計(jì)算轉(zhuǎn)座子插入至基因組的時間,進(jìn)而可以評估不同品種的遺傳進(jìn)化關(guān)系。
水稻中TEs,尤其是LTRs促進(jìn)非等位同源重組(Qin P et al.,Cell.2021);玉米泛基因組中隨著個體的增加,LTR插入呈現(xiàn)向中心富集,并與插入時間的增加相關(guān)。

圖12 水稻中TE類別比例與玉米LTR插入時間與分布
(Qin P et al., Cell.2021;Haberer G et al., Nat Genet.2020)
群體變異挖掘
由于泛基因組保留了群體完整的基因組多樣性,可鑒定到單一參考基因組無法鑒定的基因組變異。泛基因組結(jié)合GWAS、QTL等數(shù)據(jù),可進(jìn)一步提高變異與性狀關(guān)聯(lián)的精度,捕獲到更加完整的遺傳變異信息,植物遺傳學(xué)家和育種者提供全面的基因組資源,對于物種育種和研究具有重要的意義。例如玉米泛基因組研究發(fā)現(xiàn),在檢測到的GWAS信號中,關(guān)聯(lián)信號中SV相關(guān)的信號有93.05%與SNPs識別的信號重疊,SV特有信號最顯著的是關(guān)聯(lián)到10號染色體上的北葉枯病QTL。該SV位于編碼thylakoid lumenal protein的基因內(nèi);這些蛋白質(zhì)可以通過調(diào)節(jié)病毒感染期間的細(xì)胞死亡與植物免疫關(guān)聯(lián)。

圖13 玉米SV 與SNP GWAS(Hufford MB et al., Science.2021)
前期泛基因組系列文章已舉非常多的案例,這里不再反復(fù)闡述~(點(diǎn)擊回顧:泛基因組(Pan-genome)研究思路與應(yīng)用—作物篇)
泛基因組研究展現(xiàn)了作物多樣性和改良的前景,總的來說其研究內(nèi)容主要集中在不同生態(tài)型、表型等品系材料間共同與差異的基因與功能研究。重要的是這些變異能被挖掘并為育種提供重要的理論基礎(chǔ)。
而更重要的是,以上內(nèi)容百邁客均可進(jìn)行分析,圖片還老好看了;更更重要的是,百邁客可得到的結(jié)果還遠(yuǎn)不止以上這些
如果您對我們的服務(wù)產(chǎn)品感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費(fèi)為您設(shè)計(jì)文章思路方案。
參考文獻(xiàn):
[1]趙均良,張少紅,劉斌.泛基因組及其在植物功能基因組學(xué)研究中的應(yīng)用[J].植物遺傳資源學(xué)報(bào),2021.
[2]邊培培,張禹,姜雨.泛基因組:高質(zhì)量參考基因組的新標(biāo)準(zhǔn)[J].遺傳,2021.
[3]Lei L , Goltsman E , Goodstein D ,?et al. Plant Pan-Genomics Comes of Age[J]. Annual Review of Plant Biology, 2021.
[4]Coletta R D, Qiu Y, Ou S, et al. How the pan-genome is changing crop genomics and improvement[J]. Genome Biology, 2021.