三年成全在线观看大全,中文字幕av一区二区,免费看的黄色视频,中文字幕无码在线
 分類: 基因組測序

多倍體是指含有 3 套或 3 套以上完整染色體組的生物體,根據(jù)染色體來源的不同分為同源多倍體與異源多倍體,其形成途徑主要有:①二倍體親本經(jīng)過基因組加倍直接形成同源四倍體;②通過種間雜交形成單倍體雜種,然后經(jīng)過染色體加倍形成異源多倍體;③自然產(chǎn)生的雌雄非減數(shù)配子通過融合形成異源多倍體;④兩個(gè)同源四倍體親本通過雜交形成異源四倍體;⑤異源多倍體通過染色體間的重組形成節(jié)段異源多倍體。也有利用突變體產(chǎn)生多倍體的途徑[1]。多倍化能夠拓寬物種的遺傳變異并有利于新物種的形成。此外,多倍化有利于創(chuàng)建新型種質(zhì)資源,增加物種變異,改良作物
近10年來, 隨著DNA測序等技術(shù)的進(jìn)步, 植物多倍化研究進(jìn)入了基因組學(xué)時(shí)代, 植物多倍化研究也轉(zhuǎn)移至基因組結(jié)構(gòu)進(jìn)化及其對物種分化與表型性狀形成的作用機(jī)制領(lǐng)域[2]。

PART ONE

高質(zhì)量基因組獲得

異源多倍體

異源多倍體是指不同染色體組來自于已經(jīng)產(chǎn)生生殖隔離(reproductive isolation)的不同物種間的雜交并加倍。常見的異源多倍體有很多,比如普通小麥(AABBDD),二粒小麥(AABB),芥菜(AABB),油菜(AACC),陸地棉/海島棉(AADD),栽培花生(AABB)等。

正是因?yàn)槭加诓煌嫦龋沟卯愒炊啾扼w基因組的亞基因組通常能被“輕松”組裝出來。如圖1所示,組裝好的基因組是一個(gè)“混合體”,需要與祖先種/近似祖先種序列比對來拆分不同的亞基因組。(詳情可見→基因組技術(shù)分享|多倍體如何區(qū)分亞基因組?)


圖1 異源多倍體基因組組裝與區(qū)分亞基因組示意圖
(由百度圖片拼接整理,侵刪)

例如研究的較為成熟的花生,作者將組裝好的異源四倍體栽培花生(AABB)與兩種野生二倍體花生(A、B的可能祖先種)的組裝結(jié)果進(jìn)行全基因組比較,直接鑒定出相應(yīng)的亞基因組。成功地將96.07%以上的序列分為A.mon-A和A.mon-B亞基因組。


圖2 祖先種序列比對以及分亞基因組的Hi-C熱圖

同源多倍體

同源多倍體是指所有染色體組來源于一個(gè)個(gè)體的染色體組自我復(fù)制或同一個(gè)物種內(nèi)不同個(gè)體間的雜交與多倍化。通常二倍體基因組裝出單套基因組,異源四倍體能組裝出兩套基因組。而由于早期的技術(shù)限制,同源多倍體物種往往只能組裝1-2套(例如2017年甘薯基因組)。隨著技術(shù)的發(fā)展以及研究的深入,研究者發(fā)現(xiàn)僅單套的基因組數(shù)據(jù)難以完全演示該物種的全面信息。尤其是一些同源多倍體的物種,同源染色體之間不同遺傳位點(diǎn)的組合對生物表型有重要影響,如動(dòng)植物中的雜種優(yōu)勢、某些物種雜交不育現(xiàn)象等。單倍型等位基因間差異對基因表達(dá)、功能及其表型都有著重要影響,大多數(shù)雜交品種的優(yōu)勢表型都受等位基因調(diào)控。


圖3 當(dāng)前基因組模式與新興基因組模式

目前主要通過識別差異位點(diǎn)來區(qū)分這些基因組單倍型,在準(zhǔn)確度足夠的情況下,測序結(jié)果即可支持單堿基變異(SNV)的分析,其中雜合基因座表明了同源染色體對之間的序列差異。長reads組裝算法可以準(zhǔn)確地糾正和解決不同的單倍型,使組裝體超過單倍體基因組的大小。但基因組的單倍型之間同源性非常高,僅存在少量雜合位點(diǎn)。常規(guī)三代測序由于其需要reads間相互糾錯(cuò),會將這些差異位點(diǎn)整合與糾正,最終導(dǎo)致難以區(qū)分雜合率較低的單倍型。這也是傳統(tǒng)的低精度長讀長測序的技術(shù)瓶頸,無法判斷差異是來自于變異,還是本身就是讀取時(shí)產(chǎn)生的錯(cuò)誤。

困難有多少那辦法也就有多少,通過不斷的技術(shù)改進(jìn),已有幾種有效單倍型區(qū)分方式:

(1)通過對父本母本區(qū)分單倍型——Trio-binning[3]、graph-binning[4]

通過父母本二代測序數(shù)據(jù)獲得兩個(gè)親本特有的kmer,將三代reads區(qū)分為來自父本、母本以及部分無法區(qū)分的reads。而后將區(qū)分后的reads分別組裝,便獲得子代兩套單倍體序列。(詳情可見→基于hifi數(shù)據(jù)的組裝軟件–hifiasm介紹)


圖4 單倍型組裝材料構(gòu)建示意圖

(2)HiFi+Hi-C技術(shù)區(qū)分單倍型

大多研究是天然材料材料,這種就難以構(gòu)建如上遠(yuǎn)源雜交的親系。PacBio平臺的HiFi技術(shù)基于其高準(zhǔn)確率,無需reads間進(jìn)行糾錯(cuò),從而可以更為有效區(qū)分同源對之間的差異,再結(jié)合現(xiàn)有的Hifiasm、HiCanu等具有更強(qiáng)的區(qū)分單倍型的組裝軟件,使得多倍體的多套組裝成為了可能。例如同源四倍體紫花苜蓿使用~22X CCS(HiFi)reads進(jìn)行基因組組裝后用ALLHiC進(jìn)行同源染色體聚類,最終組裝出四套單倍型[5]。李恒等大牛發(fā)布Hi-C結(jié)合HiFi的 DipAsm算法也為二倍體物種染色體規(guī)模的分相組裝提供了可能[6]。


圖5 紫花苜蓿Hi-C互作熱圖評估
(每個(gè)等位基因?qū)?yīng)4條染色體)

(3)單細(xì)胞技術(shù)輔助分型Bar-coding[7]、Strand-seq[8]

Bar-coding:將花粉單細(xì)胞結(jié)合構(gòu)建的人工染色體(BAC,artificialchromosome)進(jìn)行單倍型分型。Strand-seq:短reads結(jié)合單細(xì)胞通過胸苷類似物選擇性標(biāo)記去除一條DNA鏈,并可與長reads測序數(shù)據(jù)結(jié)合使用來完成單倍型分型。


圖6 Bar-coding及Strand-seq方法概要

從以上幾種區(qū)分單倍型的方法我們不難發(fā)現(xiàn),這三種方法均能有效的解決二倍體物種的單倍型區(qū)分,但針對同源多倍體材料來說,目前方法(2)是最合適也是操作相對簡單的方式。當(dāng)然也并不是所有同源多倍體材料都能直接組裝出完整的單倍型,與物種本身的特性也有相當(dāng)大的關(guān)系,這里篇幅有限,小編就不再贅述了。

PART TWO
多倍體基因組深入挖掘

基因組的差異——變異分析

隨著單倍型的解析,不少研究發(fā)現(xiàn)在同源染色體間有大量的變異信息,而這些突變累積很可能引起等位基因的有害/有益替代。從而可以對亞基因組(同源染色體)間基因含量、GC含量、基因結(jié)構(gòu)、重復(fù)元件分布等比較、亞基因組間結(jié)構(gòu)變異(倒置、易位),結(jié)合TE分布等進(jìn)行亞基因組(同源染色體)間差異分析。

例如在高雜合二倍體馬鈴薯中,作者發(fā)現(xiàn)馬鈴薯的兩套單倍體間存在著大量的SNP、InDel、SV、PAV,甚至有超過106個(gè)長度大于100kb的SV。展示了基因組內(nèi)單體型間存在2.1%的序列多樣性,并檢測到有害等位基因的緊密連鎖[9]。


圖7 馬鈴薯中同源染色體間SNP差異與共線性展示

不對稱演化

大多數(shù)研究發(fā)現(xiàn)在多倍體植物中,其中一個(gè)亞基因組傾向擁有更多蛋白編碼基因、保留較高的基因表達(dá)水平、維持較低的甲基化水平、經(jīng)歷較強(qiáng)的純化選擇(負(fù)選擇)。這種現(xiàn)象稱為亞基因組優(yōu)勢(subgenome dominance),例如異源四倍體芥菜、異源四倍體金魚等研究中都有報(bào)道。而二倍體馬鈴薯的案例給我們成功展示了單倍型間,同樣也有不對稱的演化現(xiàn)象,該現(xiàn)象可能也同樣存在于同源多倍體物種中。


圖8 馬鈴薯基因組的單倍型差異(有害變異、甲基化水平、基因數(shù)等)

(1)不對稱演化——選擇壓力

多倍體物種中,兩個(gè)亞基因組(同源基因組)所受到的選擇壓力往往不同:某亞(同源)基因組經(jīng)歷更強(qiáng)的純化選擇,另一個(gè)則經(jīng)歷較寬松的選擇,同源多倍體中可能同樣有這種現(xiàn)象。


圖9 金魚A、B亞基因組Ka/Ks
(Xu P et al., Nature communications.2019)

(2)不對稱演化——表達(dá)差異

優(yōu)勢亞基因組受到較高的純化選擇,往往會使其維持較高的基因表達(dá)水平,這些可能與物種的生理生態(tài)等特性相關(guān)。且在芥菜、金魚,異源八倍體草莓,雜合二倍體馬鈴薯等眾多物種中都發(fā)現(xiàn)明顯的表達(dá)差異。


圖10 亞基因組、單體型間基因表達(dá)差異研究
(Xu P et al., Nature communications.2019;P.E P et al., Nature genetics.2019;Zhou Q et al., Nature Genetics.2020)

起源與進(jìn)化

(1)起源與進(jìn)化——祖先來源

對于多倍體物種,其二倍體祖先種的探尋,一直是廣大科研工作者重要的研究方向。近緣種初步找尋:①廣泛收集已有的二倍體近緣物種,通過重測序/轉(zhuǎn)錄組加遺傳分析找到哪種是可能的祖先,基于SNP進(jìn)行進(jìn)化樹的構(gòu)建來初步判斷哪個(gè)種是更有可能的祖先材料(結(jié)果不一定理想);②構(gòu)建線粒體和核基因序列的進(jìn)化樹等。深入研究,后續(xù)則還需要再將該疑似祖先種的材料進(jìn)一步做denovo,并結(jié)合相關(guān)的細(xì)胞生物學(xué)及進(jìn)化等分析來進(jìn)一步深入的研究祖先。

(2)起源與進(jìn)化——演化歷程

除了祖先來源的探索,物種的進(jìn)化與傳播歷程也是每一個(gè)種質(zhì)資源研究者的重點(diǎn)關(guān)注對象。


圖11 油菜傳播歷程及草莓形成歷程
(Wu D et al., Molecular Plant.2018;P.E P et al., Nature genetics.2019)

三維基因網(wǎng)絡(luò)調(diào)控

(1)同源/亞基因組間

早期研究先前的研究廣泛地研究了平均染色質(zhì)結(jié)構(gòu),一直忽視了同源染色體間的表觀調(diào)控差異。近期研究表明,同源染色體間的三維結(jié)構(gòu)同樣具有差異。例如靳文菲課題組通過多組學(xué)技術(shù)研究雜交小鼠揭示同源染色體間的相互作用模式、三維結(jié)構(gòu)、染色質(zhì)動(dòng)態(tài)、組蛋白修飾及其對基因表達(dá)的影響。


圖12 小鼠子代單倍型間以及與雙親本間TAD邊界比較
(Han Z et al., Genome Research.2020)

(2)祖先二倍體與多倍化

與祖先材料做研究比較更是多倍體中亙古不變的話題。物種在由祖先進(jìn)化、加倍而成現(xiàn)代多倍體材料的過程中,三維結(jié)構(gòu)發(fā)生如何的變化,是否引起相關(guān)功能的差異?例如相比于二倍體亞洲棉陸地棉和海島棉的A/B compartment比較分析,發(fā)現(xiàn)存在大量A到B的轉(zhuǎn)換,以及一定區(qū)域出現(xiàn)了B到A的轉(zhuǎn)換。同時(shí)相對于祖先基因組,亞基因組發(fā)生了不同程度的Compartment的轉(zhuǎn)換,At亞基因組轉(zhuǎn)換明顯高于Dt。


圖13 棉花中A/B Compartment分布

(Wang M et al., Nature Plants. 2018)

小結(jié)

多倍體研究嚴(yán)重依賴于一個(gè)優(yōu)質(zhì)的基因組,單倍體基因組技術(shù)的出現(xiàn)使得自交不親和的二倍體、同源多倍體的組裝成為了可能,基因組的完整信息將一點(diǎn)點(diǎn)的被揭露。通過祖先的推演使得我們更充分的了解到現(xiàn)代多倍體物種的進(jìn)化歷程,也將更利于優(yōu)良品種的改良與育種。除了上述幾種方式之外其實(shí)還有很多研究方向,例如LTR類轉(zhuǎn)座子爆發(fā)豐度和時(shí)間分析、加倍事件、分化時(shí)間、基因編輯還有近年研究火爆的泛基因組分析,都能從不同的層面進(jìn)行解析。

參考文獻(xiàn)

[1] 田恩堂等. 植物多倍體的形成及其二倍化機(jī)制[J]. 湖北農(nóng)業(yè)科學(xué), 2017(11)
[2] 李霖鋒等. 植物多倍化與多倍體基因組進(jìn)化研究進(jìn)展[J]. 中國科學(xué):生命科學(xué), 2019, 049(004):327-337.
[3] Koren S et al., De novo assembly of haplotype-resolved genomes with trio binning.Nat Biotechnol.2019
[4] Haoyu Cheng et al., Haplotype-resolved de novo assembly with phased assembly graphs. arXiv. 2020
[5] Chen H et al., Allele-aware chromosome-level genome assembly and efficient transgene-free genome editing for the autotetraploid cultivated alfalfa. Nature Communications.2020
[6] Garg S et al. Chromosome-scale, haplotype-resolved assembly of humangenomes. Nat Biotechnol .2020
[7] Shi D et al., Single-pollen-cell sequencing for gamete-based phased diploid genome assembly in plants.Genome Research.2020
[8] Porubsky D et al. Fully phased human genome assembly withoutparental data using single-cell strand sequencing and long reads. NatBiotechnol.2020
[9] Zhou Q et al. Haplotype-resolved genome analyses of a heterozygous diploid potato. Nature Genetics.2020

最近文章