三年成全在线观看大全,中文字幕av一区二区,免费看的黄色视频,中文字幕无码在线
 分類(lèi): 基因組測(cè)序

?2018124日,華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室張獻(xiàn)龍課題組首次通過(guò)三代測(cè)序(PacBio+光學(xué)圖譜(BioNano+Hi-C技術(shù)完成了異源四倍體陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)基因組組裝。該研究成果刊登于Nature Genetics,文中利用北京百邁客生物科技有限公司的三代PacBio測(cè)序組裝及Hi-C染色體掛載技術(shù),組裝獲得了高質(zhì)量栽培種異源多倍體棉基因組。>>下載文獻(xiàn)全文

英文題目:Reference genome sequences of two cultivated allotetraploid cottons?Gossypium hirsutum?and?Gossypium barbadense
中文題目:三代異源四倍體陸地棉和海島棉基因組破譯;
發(fā)表雜志:Nature Genetics;
影響因子:27.125;
發(fā)表時(shí)間:2018.12.04;
合作單位:華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室;

摘要

異源四倍體陸地棉和海島棉(Gossypium hirsutumGossypium barbadense)長(zhǎng)期以來(lái)一直在世界范圍內(nèi)種植,由于其具有天然可再生紡織纖維。雖然以前利用二代測(cè)序技術(shù)組裝的陸地棉和海島棉基因組在棉花研究中應(yīng)用較高,但是其基因組高度片段化且不完整。本研究中進(jìn)行了異源四倍體基因組的升級(jí),利用了三代測(cè)序組裝技術(shù)(single-molecule real-time sequencing+光學(xué)圖譜(BioNano optical mapping+Hi-C染色體掛載技術(shù)(high-throughput chromosome conformation capture techniques),實(shí)現(xiàn)了異源四倍體陸地棉G. hirsutum?acc. Texas Marker-1 (TM-1)?和海島棉G. barbadense?acc. 3-79基因組的組裝。與之前的二代基因組相比,三代陸地棉和海島棉基因組具有高度連續(xù)性,高度重復(fù)區(qū)(如著絲粒)具有更高的完整性。比較基因組學(xué)分析確定了廣泛的結(jié)構(gòu)變異可能發(fā)生在多倍化后,在14條染色體臂內(nèi)和臂間的倒位十分突出。研究中構(gòu)建了漸滲系群體,以導(dǎo)入從海島棉到陸地棉的有利染色體片段。從而使得研究人員可以識(shí)別與優(yōu)質(zhì)纖維質(zhì)量相關(guān)的13個(gè)數(shù)量性狀基因座。?這些資源將加速棉花的進(jìn)化和功能基因組研究,并為未來(lái)的纖維改良育種計(jì)劃提供新的信息。

研究背景

棉花是世界上*大的天然紡織纖維來(lái)源,每年纖維產(chǎn)量的90%以上來(lái)自異源四倍體棉花(G. hirsutumG. barbadense),它起源于大約1-2百萬(wàn)年前的異源多樣化事件,隨后是數(shù)千年的不對(duì)稱(chēng)亞基因組選擇。陸地棉(G. hirsutum)由于其高產(chǎn)而在全世界種植。G. barbadense以其卓越的纖維質(zhì)量而受贊譽(yù)。為了培育產(chǎn)生纖維更長(zhǎng),更細(xì)和更強(qiáng)韌的陸地棉(G. hirsutum)品種,一種合理有效的方法是將海島棉(G. barbadense)的優(yōu)良纖維性狀引入陸地棉?;蚪M學(xué)啟動(dòng)的育種策略需要對(duì)基因組組織進(jìn)行詳細(xì)而有力的理解。

材料方法

材料:高度純合陸地棉(Texas Marker-1TM-1)?;海島棉(3-79);
基因組denovo策略:三代測(cè)序組裝(PacBio RS II,SMRT+光學(xué)圖譜(BioNano optical mapping+Hi-C染色體掛載;
研究方法:基因組組裝:Canu (version 1.3)?BLASR (version 1.3.1)?,BWA (version 0.7.10-r789)?Pilon?(version 1.22)?;光學(xué)圖譜糾錯(cuò):核酸內(nèi)切酶Nt.BssSI23,AutoDetect,IrysSolveHi-C染色體掛載:核酸內(nèi)切酶HindIII,BWAversion 0.7.10-r789),LACHESIS,HiC-Pro基因組完整性評(píng)估:BUSCO評(píng)估;TE注釋?zhuān)?/b>PASTEClassifier (version 1.0);RepeatMasker (version 4.0.6);基因預(yù)測(cè)和注釋?zhuān)?/b>Genscan,Augustus (version 2.4),GlimmerHMM (version 3.0.4)GeneID (version 1.4)SNAP (version 2006-07-28);GeMoMa (version 1.3.1)假基因組預(yù)測(cè):GenBlastA (version 1.0.4),GeneWise (version 2.4.1);
著絲粒區(qū)域鑒定:blastnSPSS software (version 17.0)?;基因組共線性分析:MUMmer (version 3.23)GATK(version 3.1.1),Samtools(version 0.1.19)?,MCScanX package;結(jié)構(gòu)變異檢測(cè):MUMmer3 (version 3.23);二倍體棉重測(cè)序SNPs鑒定:Trimmomatic (version 0.32),BWA;168個(gè)CSSLs群體SNPs鑒定:染色體片段置換系(CSSLs)的構(gòu)建(圖1),測(cè)序深度(6X),插入片段:350 bp,BWAGATKSamtools;CSSLs群體QTLs定位與表達(dá)分析:QTL IciMapping (version 4.0)?TopHat2 (version 2.0.13)?;Cufflinks (version 2.2.1);STRUCTURE (version 2.3)?;TASSEL software (version 5.0)?;

1?棉花漸深系構(gòu)建流程

研究結(jié)果

1.Gossypium hirsutumGossypium barbadense基因組測(cè)序組裝
? ? ? 三代基因組denovo本研究利用單分子熒光測(cè)序技術(shù)(PacBio RSII)對(duì)異源四倍體陸地棉G. hirsutum?acc. TM-1和海島棉G. barbadenseacc. 3-79進(jìn)行基因組denovo測(cè)序研究。分別獲得了194.01 GbGossypium hirsutum)和210.98 GbGossypium barbadense)數(shù)據(jù)(均80×左右覆蓋度),陸地棉Contig L50 = 1.89 Mb,海島棉Contig L50 = 2.15 Mb(表1);利用Illumina測(cè)序數(shù)據(jù)糾正PacBio測(cè)序中低質(zhì)量的數(shù)據(jù)及插入/缺失(InDels);光學(xué)圖譜輔助組裝:通過(guò)使用來(lái)自相同種質(zhì)的光學(xué)圖譜(BioNano Genomics Irys)數(shù)據(jù)(88.9×Gossypium hirsutum155.7×Gossypium barbadense)處理這些拋光的重疊群用于雜交組裝,最終陸地棉組裝了3,434?個(gè)scaffolds,海島棉組裝了3,919?個(gè)scaffolds,scaffold L50分別為5.22 Mb6.89 Mb;Hi-C染色體掛載:通過(guò)Hi-C進(jìn)一步將scaffolds掛載到染色體水平,同時(shí)結(jié)合光學(xué)圖譜進(jìn)行組裝序列的分類(lèi)與排序。最終陸地棉組裝了2,190?個(gè)scaffolds,海島棉獲得了3,032個(gè)?scaffolds26個(gè)super-scaffolds,代表了四倍體棉所有染色體,掛載效率分別為?98.94%97.68%。
? ? ? 組裝結(jié)果驗(yàn)證:將重新組裝的陸地棉與海島棉基因組與已發(fā)表的遺傳圖譜進(jìn)行比對(duì),結(jié)果顯示,每條染色體都具有高度共線性(Gossypium hirsutum?98.86%;Gossypium barbadense?96.92%);進(jìn)一步通過(guò)36個(gè)已有的BAC文庫(kù)及二代Illuminamate-pair文庫(kù)的回比評(píng)估,并通過(guò)對(duì)陸地棉的BUSCO數(shù)據(jù)集中的1,440個(gè)高度保守的核心蛋白中的1,415個(gè)(98.2%)和對(duì)海島棉的1,420個(gè)(98.6%)的鑒定,支持了基因區(qū)組裝的完整性。與之前發(fā)表的二代基因組相比,基因組連續(xù)性顯著提高(陸地棉高出55倍,海島棉高出90倍),進(jìn)一步實(shí)現(xiàn)了gap填充,基因組高雜合區(qū)的√確組裝。本研究中陸地棉與海島棉基因組的迭代更新為后續(xù)四倍體棉花的研究提供了新版參考基因組。

1?陸地棉和海島棉基因組組裝注釋

2.Gossypium hirsutumGossypium barbadense基因預(yù)測(cè)與注釋
? ? ? 在本研究組裝的三代陸地棉與海島棉基因組中,分別預(yù)測(cè)了70,19971,297個(gè)基因,同時(shí)利用了三代(PacBio single-molecule long-read)轉(zhuǎn)錄組數(shù)據(jù)在陸地棉與海島棉中分別注釋了115,835109,778轉(zhuǎn)錄本可變剪切。在全基因組的范圍內(nèi)結(jié)合表觀遺傳修飾進(jìn)行研究(圖2),通過(guò)PacBio數(shù)據(jù)分析顯示:在全基因組范圍內(nèi),陸地棉6mA甲基化占所有腺嘌呤的0.21%,海島棉占0.22%。有趣的是,6mA甲基化修飾在每條染色體上顯示出幾乎均勻的分布模式,不同于染色體臂中相對(duì)低水平的5-甲基胞嘧啶(5mC)修飾(圖2)。
2?陸地棉和海島棉染色體特征(含表觀遺傳標(biāo)記)
? ? ??基因組高度連續(xù)性與完整性的組裝使得高重復(fù)區(qū)的組裝具有顯著的改善。研究中成功地組裝了每條染色體的著絲粒區(qū)域,通過(guò)分析著絲粒相關(guān)的長(zhǎng)末端重復(fù)(LTR)反轉(zhuǎn)錄轉(zhuǎn)座子對(duì)著絲粒區(qū)域進(jìn)行了鑒定,基于之前的Illumina短讀長(zhǎng)序列,G. hirsutum中的大部分LTR是缺失的。然而,這些區(qū)域的確具有顯著高含量的LTR反轉(zhuǎn)錄轉(zhuǎn)座子序列。
3.Gossypium hirsutumGossypium barbadense全基因組變異分析
? ? ? SNPsInDels變異分析:通過(guò)兩個(gè)棉花基因組之間的序列比較以確定陸地棉和海島棉兩種代表性種質(zhì)之間的基因組差異。共鑒定了12,816,698個(gè)SNPs,平均每kilobase5.89個(gè)SNPsA亞基因組(At)的SNP頻率為8,131,2765.95 / Kb),略大于D-亞基因組(Dt)中的SNP頻率4,685,422。染色體中SNP的分布與比較群體基因組研究中的發(fā)現(xiàn)相似,包括染色體A01中基因組變異的顯著減少(圖3)。研究中同時(shí)鑒定了2,682,689個(gè)小插入/缺失(InDels),平均每Kb1.2個(gè)。預(yù)測(cè)這些SNPsInDels對(duì)陸地棉的總共14,076個(gè)基因和海島棉的14,880個(gè)基因具有很大的功能影響,進(jìn)一步利用了兩個(gè)基因組間的這些變異數(shù)據(jù),鑒定了4,039基因受到了正向選擇(Ka/Ks >1),這些基因在幾種生物途徑中過(guò)量表達(dá),包括Ras / ARF蛋白信號(hào)轉(zhuǎn)導(dǎo)途徑。值得注意的是,觀察到在陸地棉G. hirsutum?基因組草圖序列中的缺失區(qū)域中發(fā)現(xiàn)了6.5%的SNPs7.2%的InDels,代表了四倍體棉的先前未檢測(cè)到的遺傳變異。
? ? ? 染色體結(jié)構(gòu)變異分析:高質(zhì)量的參考基因組使得研究人員能夠通過(guò)對(duì)兩種種質(zhì)的直接比較基因組分析來(lái)鑒定大的結(jié)構(gòu)變異。發(fā)現(xiàn)有170.2 Mb的基因組序列被鑒定為G. hirsutumG. barbadense之間的反轉(zhuǎn),包括120.4 MbAt亞基因組和49.8 MbDt。有趣的是,在異染色質(zhì)中,第四條和第十一條染色體中顯示出了染色體臂內(nèi)倒位。研究中在A06染色體中發(fā)現(xiàn)了4個(gè)大的倒位變異,包括3個(gè)染色體臂內(nèi)倒位(in1, in3 and in4)和1個(gè)染色體臂間倒位(in2),通過(guò)Hi-C數(shù)據(jù)在斷點(diǎn)周?chē)x散的染色質(zhì)相互作用(圖3),突出了Hi-C技術(shù)識(shí)別大規(guī)模染色體重排的優(yōu)勢(shì)。光學(xué)圖(BioNano optical maps)譜數(shù)據(jù)進(jìn)一步支持了這些反轉(zhuǎn)斷裂位點(diǎn)(圖3)。此外,發(fā)現(xiàn)在D12染色體上,存在1個(gè)大的染色體臂間倒位。在棉花中這些染色體臂間/染色體臂內(nèi)的大量變異需要進(jìn)一步探索其生物學(xué)功能,如在擬南芥,小麥和人中所述。研究人員同時(shí)還檢測(cè)到3,820個(gè)染色體易位(1,074個(gè)染色體內(nèi)易位,占據(jù)3.8 Mb;2,746個(gè)染色體間易位,占6.8 Mb)。
3?陸地棉和海島棉A06染色體倒位鑒定(左:Hi-C互作熱圖;右:光學(xué)圖譜鑒定)
? ? ? PAVs分析:?通過(guò)陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)基因組比較分析發(fā)現(xiàn)presence/absence變異?(PAVs)。研究人員在陸地棉中鑒定了9,135個(gè)片段,其總長(zhǎng)度為179.9 Mb,在海島棉中不存在,而在海島棉中的7,710個(gè)區(qū)段,總長(zhǎng)度為139.8 Mb,在陸地棉中不存在(圖4),同時(shí)發(fā)現(xiàn)陸地棉中的1,844個(gè)基因和海島棉中的1,614個(gè)基因位于這些PAV區(qū)域,在這些基因中,有220個(gè)基因在海島棉纖維發(fā)育過(guò)程中高度特異性表達(dá)。此外還發(fā)現(xiàn)在海島棉EXPANSIN基因的第3個(gè)外顯子中有450 bp片段的缺失,這導(dǎo)致多糖結(jié)合結(jié)構(gòu)域的喪失。有意思的是,截短的蛋白正與海島棉中優(yōu)良纖維質(zhì)量的形成相關(guān)。
4?陸地棉和海島棉基因組中的PAVs變異分析
4.Gossypium hirsutumGossypium barbadense多倍化過(guò)程中發(fā)生的變異

四倍體陸地棉和海島棉基因組的組裝使得研究人員能夠進(jìn)一步探索四倍體棉亞基因組和其二倍體祖先之間的基因組差異。首先通過(guò)對(duì)具有D型基因組的13份二倍體材料進(jìn)行重測(cè)序分析,分析顯示在兩種四倍體棉D-亞基因組具有相同的二倍體祖先種雷蒙德氏棉G. raimondiiD5 genome,D亞基因組供體);進(jìn)而利用二倍體雷蒙德氏棉G. raimondii直接進(jìn)行基因組比較分析,發(fā)現(xiàn)四倍體陸地棉和海島棉與雷蒙德氏棉相比,都有一些獨(dú)特的結(jié)構(gòu)變異,如在海島棉染色體D05和陸地棉D12中均存在大的染色體臂間倒位,暗示這些變異出現(xiàn)在多倍化之后(圖5)。研究人員還觀察到兩個(gè)四倍體相對(duì)于G. raimondii共有一些結(jié)構(gòu)變異,例如染色體D09中兩個(gè)四倍體發(fā)生了大的反轉(zhuǎn)(圖5)。研究中同時(shí)運(yùn)用了二倍體祖先種亞洲棉G. arboreumA2 genome,A亞基因組供體)的Hi-C數(shù)據(jù),與陸地棉和海島棉A亞基因組進(jìn)行比對(duì),檢測(cè)棉由二倍體到四倍體多倍化過(guò)程中發(fā)生的結(jié)構(gòu)變異,Hi-C具體矩陣圖顯示在13條染色體中發(fā)生了大規(guī)模的染色體重排,其中發(fā)部分變異為兩個(gè)四倍體的棉的A亞基因組共有。研究中發(fā)現(xiàn)染色體A06中*大的染色體臂間倒位(in2)在陸地棉中是特有的(圖3?左),表明這種結(jié)構(gòu)變異可能在染色體多倍化后發(fā)生。因此得出結(jié)論,二倍體棉花中的A基因組在異源多倍化后被重組,導(dǎo)致不同四倍體(陸地棉和海島棉)中發(fā)生了大染色體倒位。

圖5?陸地棉和海島棉D亞基因組與雷蒙德氏棉(DD型)基因組共線性分析
5.Gossypium hirsutum漸滲系構(gòu)建及QTLs定位

通過(guò)研究發(fā)現(xiàn)了在陸地棉(G.?hirsutum?acc. TM-1)和海島棉(G. barbadense?acc. 3-79)間存在廣泛的遺傳變異,進(jìn)一步推測(cè)這些變異的一部分可能是造成表型差異的原因,包括纖維性狀。為了利用這些變異進(jìn)行定向育種,研究人員構(gòu)建了一個(gè)漸滲系群體,旨在引入有利的變異,控制從G.barbadenseG. hirsutum等重要農(nóng)藝性狀的形成,如纖維質(zhì)量。研究人員通過(guò)分子標(biāo)記對(duì)168份漸滲系材料進(jìn)行測(cè)序,并鑒定了涵蓋所有26條染色體的466個(gè)基因滲入片段(圖6)。研究人員發(fā)現(xiàn)了在染色體D12中含有漸滲片段的漸滲系,其具有有限的絨毛纖維,類(lèi)似于其供體親本G.barbadense?3-79(圖6,圖7上),基因滲入片段的位置與無(wú)絨天然突變體G. hirsutum?Xuzhou142fl的圖譜測(cè)序所示的位置相同,然而其遺傳基礎(chǔ)以前未被充分了解(圖7下)。這些結(jié)果表明,陸地棉(G. hirsutum)中無(wú)絨毛突變體的遺傳變異與海島棉(G. barbadense)中的數(shù)量性狀基因座(QTL)共定位。該漸滲片段與天然纖維突變體的特征將有助于比較分析海島棉和陸地棉之間的絨毛纖維起始機(jī)制。

6?棉花群體漸滲系構(gòu)建???????????7?漸滲系N29纖維特征(上);海島棉Xuzhou142fl測(cè)序比對(duì)結(jié)果(下)

為了鑒定海島棉(G. barbadense)中優(yōu)質(zhì)纖維質(zhì)量的有益等位基因,研究人員對(duì)漸滲群體中的纖維品質(zhì)相關(guān)性狀進(jìn)行了QTL分析。研究中共計(jì)鑒定了5個(gè)性狀的13個(gè)QTLs位點(diǎn),其中控制纖維長(zhǎng)度位點(diǎn)2個(gè),控制纖維強(qiáng)度位點(diǎn)4個(gè),馬克隆值位點(diǎn)2個(gè),纖維伸長(zhǎng)率位點(diǎn)2個(gè),纖維均勻度位點(diǎn)3個(gè)(圖8 a-c)。在這些QTLs位點(diǎn)中,9個(gè)位點(diǎn)之前未被鑒定出,通過(guò)檢驗(yàn)13個(gè)QTLs中的基因表達(dá)水平,研究人員檢測(cè)到了235個(gè)在纖維發(fā)育過(guò)程中高度表達(dá)的基因,同時(shí)還整合了基因組變異數(shù)據(jù)來(lái)預(yù)測(cè)候選基因,而這些基因值得進(jìn)一步進(jìn)行精細(xì)定位以確認(rèn)對(duì)這些性狀具有重要影響的基因。研究人員發(fā)現(xiàn)A02染色體上的1個(gè)QTL位點(diǎn)與纖維長(zhǎng)度相關(guān),在這個(gè)QTL中,一個(gè)未鑒定過(guò)的基因(Ghir_A02G003440),編碼預(yù)測(cè)的糖基磷脂酰肌醇錨定的脂質(zhì)轉(zhuǎn)移蛋白,該基因在纖維伸長(zhǎng)期的表達(dá)水平和深入系中纖維長(zhǎng)度呈負(fù)相關(guān),并可能與海島棉中長(zhǎng)纖維的發(fā)育相關(guān)。這些QTL數(shù)據(jù)為海島棉基因組片段的詳細(xì)功能分析提供了框架,并應(yīng)通過(guò)基因滲入育種進(jìn)一步開(kāi)發(fā)具有優(yōu)質(zhì)性狀的栽培棉花。

??為了深入研究這些基因可能的轉(zhuǎn)錄調(diào)控機(jī)制,研究人員對(duì)這168個(gè)漸滲系在開(kāi)花后10天(DPA)對(duì)纖維的轉(zhuǎn)錄組進(jìn)行了測(cè)序,在235個(gè)基因中,鑒定了125個(gè)QTLs位點(diǎn)(eQTL上)。發(fā)現(xiàn)在染色體A02(如上所述)上的QTL位點(diǎn)與D09號(hào)染色體上的2個(gè)基因的表達(dá)相關(guān)(Ghir_D09G014120和?Ghir_D09G014460)?,這2個(gè)基因分別編碼泛素延伸蛋白和微管相關(guān)蛋白,且預(yù)測(cè)這2個(gè)基因可能作為纖維強(qiáng)度的候選基因。通過(guò)eQTLs研究表明這些基因的表達(dá)可能與某些長(zhǎng)距離的或染色體間的基因座位相關(guān)。

總結(jié)

通過(guò)陸地棉(Gossypium hirsutum)和海島棉(Gossypium barbadense)兩種栽培棉種質(zhì)基因組的重新組裝,研究人員鑒定了大量的變異,這些變異應(yīng)與其它種質(zhì)的基因組分析相結(jié)合,以充分挖掘兩種種質(zhì)基因組間的差異。研究人員通過(guò)構(gòu)建滲入系,在兩種代表性種質(zhì)間探索研究了具有潛在優(yōu)質(zhì)纖維質(zhì)量性狀的基因組序列信息,而這在棉花育種中,可用于理想性狀的培育;這些資源將極大的促進(jìn)棉花功能基因組學(xué)與進(jìn)化基因組學(xué)的研究,并將為棉花纖維質(zhì)量的改良提供信息。
回顧整個(gè)2018年,百邁客NG文章收獲滿滿,于20185月與中國(guó)農(nóng)業(yè)科學(xué)院棉花研究所杜雄明研究員合作成功完成了亞洲棉基因組的升級(jí),又在201810月與福建農(nóng)林大學(xué)基因組研究中心明瑞光課題組合作,完成了同源多倍體甘蔗基因組密碼的破譯。同時(shí),于2018年巨資投入,引進(jìn)三代測(cè)序Nanopore單分子納米孔測(cè)序儀,成為了國(guó)內(nèi)動(dòng)植物基因組denovo研究第一家。
想獲取更多關(guān)于棉花研究案例,請(qǐng)點(diǎn)擊下方按鈕,我們將免費(fèi)為您設(shè)計(jì)文章方案!
另外,還可以獲贈(zèng)100元在線培訓(xùn)課程代金券!

 

 

 

最近文章
聯(lián)系我們