2021年4月,中國熱帶農(nóng)業(yè)科學(xué)院李開綿研究員團(tuán)隊牽頭完成了高質(zhì)量單倍型木薯基因組,相關(guān)研究成果“Allele-defined Genome Reveals Biallelic Differentiation during Cassava Evolution”發(fā)表于國際期刊Molecular Plant(IF:13.162)。近日,該團(tuán)隊再次牽頭完成了木薯群體研究,該研究以“Resequencing of 388 cassava accessions identifies valuable loci and selection for variation in heterozygosity”為題見刊Genome Biology(IF:13.584)。百邁客有幸作為共同作者參與這兩項(xiàng)研究。接下來,隨小編一起來看看兩篇文章如何克服物種高雜合的困難,并以此為突破點(diǎn)開展系列研究。
木薯基因組

文章亮點(diǎn)
本研究首先通過PacBio平臺構(gòu)建具有“冗余”特征的基因組,再進(jìn)一步結(jié)合Hi-C互作信號,將二倍體兩套的基因組進(jìn)行拆分,最終獲得具有18對同源染色體的雙單倍型基因組。前期研究結(jié)合本次同源對基因組的差異比較,進(jìn)一步說明了同源染色體之間不同遺傳位點(diǎn)的組合對生物表型有重要影響。該研究為廣大科研工作者提供了一個重要的研究思路:無雙親本背景下,構(gòu)建高雜合物種的單倍型基因組。通過單倍型的分析,為解析物種重要性狀形成的遺傳機(jī)制奠定了重要基礎(chǔ)。
研究背景
通過種間或種內(nèi)雜交產(chǎn)生雜合子基因組有助于維持植物多樣性并成為新物種的潛在來源。由于缺乏高質(zhì)量的參考基因組和有限的基因組資源,木薯基因組學(xué)和育種研究相對滯后。木薯(Manihot esculenta Crantz;2n=36)是非洲和其他熱帶地區(qū)的主要作物,其具有很高的雜合性,是研究雙等位基因分化的理想系統(tǒng)。
材料方法
基因組:木薯栽培品種SC205;~98.5X PacBio;~35X Hi-C
轉(zhuǎn)錄組:種下后100-340天(每隔40天取樣)的塊根;以及根莖葉和塊根組織
研究結(jié)果
木薯基因組組裝
作者通過PacBio和Hi-C技術(shù)進(jìn)行基因組的初始組裝,組裝大小為1.1Gb(流式預(yù)估單套大小770.3 Mb),表明在基因組的雜合區(qū)域組裝了兩個單倍型。作者通過自對z確定了冗余區(qū)域,并將非冗余木薯基因組作為參考,稱為SC205-ref。組裝基因組的連續(xù)性指標(biāo)ContigN50=1.1 Mb,Scaffold N50=34.5 Mb,并經(jīng)過BUSCO(92.8%)評估、LAI評估(18.46)、高密度遺傳圖譜(相關(guān)系數(shù)ρ>0.99)等多種評估方式,表明了本次構(gòu)建了一個參考級的高質(zhì)量基因組。
進(jìn)一步使用ALLHiC算法進(jìn)行等位基因定義的基因組組裝,組裝1.52Gb木薯基因組,構(gòu)建了18對同源染色體高質(zhì)量單體型基因組圖譜,鑒定了24128個雙等位基因(Bialleles)。并通過Hi-C信號、同源染色體間共線性比對、遺傳圖譜比對、二代/三代Reads回比、同源對BUSCO評估、雙等位基因鑒定等方式對本次單倍型基因組進(jìn)行驗(yàn)證。
圖1 木薯雙單倍型基因組特征
不對稱演化
通過同源染色體比對,鑒定到3,107,171 個SNPs、 500,018 個indels、57,643 個PAVs以及632 個倒位。高雜合度區(qū)域的進(jìn)化速度比其他區(qū)域更快。
蛋白質(zhì)編碼基因、不同等位基因和顯性表達(dá)的雙等位基因的密度,發(fā)現(xiàn)它們都傾向于富集在高度雜合的區(qū)域,通常位于染色體的一端或兩端附近。通過對不同種植時間和組織部位的轉(zhuǎn)錄組分析發(fā)現(xiàn)除了第1、15和17對染色體外,幾乎所有同源染色體對中,雙等位基因間廣泛發(fā)生表達(dá)不平衡,并且淀粉和蔗糖代謝途徑上的雙等位基因表現(xiàn)出顯著的表達(dá)分化;
等位基因進(jìn)化
顯性表達(dá)的等位基因的啟動子和CDS的序列差異顯著大于同等表達(dá)的雙等位基因。根據(jù)非同義和同義核苷酸替換的比率(Ka/Ks)將等位基因?qū)Ψ譃?個亞群。等位基因組進(jìn)化分析揭示了基因組快速進(jìn)化可能是木薯高雜合性形成的重要驅(qū)動力,且基因組方向性選擇驅(qū)動等位基因表達(dá)分化。
圖2 木薯等位基因組表達(dá)與進(jìn)化分析
總結(jié)
本研究通過構(gòu)建高質(zhì)量的木薯單倍型參考基因組,深化了對木薯雙等位基因變異遺傳基礎(chǔ)的理解,有助于探索雙等位基因的分化和表達(dá)優(yōu)勢及其潛在的進(jìn)化驅(qū)動力,為木薯改良的戰(zhàn)略性開發(fā)提供了可能。這些基因組資源將為創(chuàng)新木薯和其他高雜合作物的育種策略提供新的見解。
木薯群體進(jìn)化
文章亮點(diǎn)
本研究突破前期純合子等位基因變異與物種關(guān)鍵農(nóng)藝性狀的相關(guān)性研究,進(jìn)一步聚焦高雜合物種的等位基因變異。發(fā)現(xiàn)不同基因位點(diǎn)的純合與雜合變異涉及到塊根重量、淀粉含量、抗病性等多種木薯關(guān)鍵的農(nóng)藝性狀。闡明了雜合位點(diǎn)的
保持對于優(yōu)異性狀的形成具有重要貢獻(xiàn),為高雜合物種研究提供了一個新穎的研究思路。
研究背景
許多野生物種通過人工選擇馴化為栽培作物,隨著人類遷移、定向選擇和進(jìn)一步的性狀改良以滿足人類需求,栽培作物在性狀上獲得了區(qū)域特異性差異。利用基因組測序技術(shù),我們可以追蹤作物馴化和育種歷史,從而更好地了解人類選擇如何形成作物基因組。群體中基因型和表型之間的關(guān)聯(lián)顯示純合子等位基因變異與許多作物的關(guān)鍵農(nóng)藝性狀顯著相關(guān),從而加速了育種過程。然而,許多作物是高度雜合的,雜合性變異對農(nóng)藝性狀的影響尚不清楚。
栽培木薯是6000多年前從亞馬遜流域的野生祖先Manihot esculenta ssp. flabellifolia馴化而來。木薯的馴化產(chǎn)生了包括年生長周期、高初始生長率、產(chǎn)量增加和高淀粉含量在內(nèi)的特征,這使得木薯成為人類消費(fèi)和工業(yè)生物燃料應(yīng)用的理想能源。但由于基因組資源有限,木薯基因組學(xué)和育種研究相對滯后。群體基因組資源的開發(fā)將加速這一重要作物的遺傳改良進(jìn)程。
材料方法
代表來自全球15個國家主要木薯生產(chǎn)區(qū)的388份木薯種質(zhì)(14份野生、38份地方品種和336份栽培品種);51份材料來自發(fā)表重測序數(shù)據(jù),337份在本研究中測序??偣伯a(chǎn)生3.35 Tb數(shù)據(jù),平均測序深度為9.45×。對本次測序的337份木薯,進(jìn)行三年的33個形態(tài)性狀GWAS分析。
研究結(jié)果
基因組變異圖譜與系統(tǒng)發(fā)育關(guān)系
通過與參考基因組比對,共鑒定1,344,463個SNPs以及1,018,832個InDels。系統(tǒng)發(fā)育和主成分分析(PCA)將388份木薯材料分為兩大類(圖1c,d),第一組包括13個野生祖先,第二組包含所有地方品種、栽培品種以及自巴西的野生祖先FLA433-2(具類似木薯的塊根)。結(jié)果支持了FLA433-2是木薯野生祖先種的假說。系統(tǒng)進(jìn)化及FST、p的分析結(jié)果與考古證據(jù)相符,表明南美和非洲木薯種群之間以及非洲和亞洲種群之間存在著密切的系統(tǒng)發(fā)育關(guān)系,提出了木薯從南美洲到非洲再到亞洲的傳播馴化路徑。

圖1 木薯全基因組變異圖譜及其親緣關(guān)系
全基因組關(guān)聯(lián)分析(GWAS)
GWAS分析鑒定出與23個重要農(nóng)藝性狀關(guān)聯(lián)的52遺傳標(biāo)記。表皮類型(光滑或粗糙)和疤痕嚴(yán)重影響木薯塊根的外觀質(zhì)量。10號染色體上Sc10g01040中的三個和Sc10g02050中的七個非同義SNP與塊根表皮型相關(guān)。在10號染色體Sc10g01040、Sc10g01050以及3號染色體Sc03g001750、13號染色體Sc13g000920中攜帶雜合等位基因和雜合單倍型的木薯材料比攜帶純合等位基因和純合單倍型的木薯材料具有更高的塊根平滑表皮頻率。木薯地上部分的重量反映了植物的生長活力,并成為其用作飼料的一個重要因素;塊根支鏈淀粉含量決定木薯的工業(yè)價值。5號染色體上Sc05g013530、11號染色體上Sc11g000910攜帶雜合子等位基因的材料表現(xiàn)出顯著更高的地上重量和支鏈淀粉含量。2號染色體Sc02g008280攜帶AT或TT等位基因的材料具更高紅色內(nèi)皮顏色頻率,18號染色體Sc18g013220攜帶雜合子AC等位基因的材料比攜帶純合子CC或AA等位基因的材料顯示出顯著更低的螨感染指數(shù)。對這些候選基因的表達(dá)水平進(jìn)行檢測,發(fā)現(xiàn)都在塊根發(fā)育的不同組織或階段大量表達(dá)。種種結(jié)果表明,雜合性等位基因變異在關(guān)鍵農(nóng)藝性狀中的潛在作用,其中每個候選基因中攜帶雜合等位基因的木薯材料比攜帶相應(yīng)純合等位基因的木薯材料具有更理想的表型。

圖2 GWAS鑒定與關(guān)鍵農(nóng)藝性狀相關(guān)的雜合性變異候選基因
作者鑒定了79個與塊根中淀粉積累相關(guān)的高度雜合子片段,其中20個雜合塊與6個GWAS信號重疊。此外,在1號染色體上攜帶高度雜合子片段的木薯材料比攜帶相應(yīng)純合子片段的木薯材料表現(xiàn)出更高的塊根紅色內(nèi)皮細(xì)胞頻率。這些結(jié)果進(jìn)一步支持雜合性變異與關(guān)鍵農(nóng)藝性狀相關(guān)的假設(shè)。
木薯雜合性的選擇特征
為了追蹤雜合性的可能進(jìn)化場景,作者根據(jù)參考基因組的雜合SNP將木薯基因組分為雜合區(qū)和純合區(qū)。然后比較了374個品種的雜合區(qū)和純合區(qū)的基因組多樣性。在大多數(shù)(18條染色體中的16條)染色體中,雜合區(qū)具有顯著高于純合區(qū)的遺傳多樣性(π值)和正Tajima’s D值,表明平衡選擇有助于維持基因組雜合性。在品種和野生祖先之間的大多數(shù)染色體(18個染色體中的14個)中,雜合區(qū)的FST值低于純合區(qū)的FST值也支持了這一發(fā)現(xiàn)。檢測到81個雜合度和核苷酸多樣性降低的選擇性位點(diǎn),包含548個基因,這些基因在多種生物過程中富集,包括生長、發(fā)育、激素代謝和反應(yīng)以及免疫相關(guān)過程。
圖3 木薯雜合性的選擇特征
馴化使木薯塊根的產(chǎn)量和淀粉含量顯著增加。栽培品種的塊根重和淀粉含量分別比野生后代高約60倍和3倍(圖4a,b)。選擇性清除分析結(jié)合轉(zhuǎn)錄組分析發(fā)現(xiàn)2號染色體MeT
R1周圍雜合性降低的選擇信號,并且MeTIR1在攜帶GG等位基因的材料中的表達(dá)顯著高于攜帶CG和CC等位基因的材料(圖4i),說明MeTIR1純合變異促使塊根淀粉含量提升。并通過瞬時過表達(dá)和沉默技術(shù)進(jìn)一步驗(yàn)證了MeTIR1在木薯中的功能。進(jìn)一步結(jié)合關(guān)聯(lián)分析發(fā)現(xiàn),對2號染色體攜帶MeAHL17 AA等位基因的材料,經(jīng)選擇馴化促使塊根產(chǎn)量提升的同時導(dǎo)致木薯細(xì)菌性枯萎病抗性丟失。
圖4 木薯高淀粉含量塊根馴化相關(guān)雜合性降低的選擇作用
圖5 木薯細(xì)菌性枯萎病候選基因MeAHL17的鑒定
MeAHL17和MeTIR1位于2號染色體上相同的選擇性清除區(qū)內(nèi)。連鎖不平衡分析發(fā)現(xiàn),兩個基因緊密連鎖,攜帶AG(MeAHL17)和GG(MeTIR1)等位基因組合的品種顯示出較高的淀粉含量和對木薯細(xì)菌性枯萎病的高抗性頻率。
圖6 MeAHL17和MeTIR1等位基因組合對性狀變異的影響
總結(jié)
本研究提供了388份木薯材料的變異圖譜,鑒定了23個農(nóng)藝性狀的52個位點(diǎn),揭示了與關(guān)鍵農(nóng)藝性狀和木薯馴化相關(guān)的雜合性等位基因變異。檢測到81個雜合度和核苷酸多樣性降低的選擇性位點(diǎn),相關(guān)基因在多種生物過程中富集,包括生長、發(fā)育、激素代謝和反應(yīng)以及免疫相關(guān)過程。人工選擇MeTIR1和MeAHL17中的純合等位基因有助于大淀粉塊根的馴化。而在MeAHL17中選擇純合子等位基因與增加塊根重和木薯細(xì)菌性枯萎病易感性相關(guān)。本研究將有助于闡明與關(guān)鍵農(nóng)藝性狀和木薯馴化相關(guān)的雜合性變異的遺傳基礎(chǔ),并對木薯馴化過程中雜合性的變異提供了見解,為木薯和其他高雜合物種育種改良的戰(zhàn)略發(fā)展提供依據(jù)。
寫在最后:
大多數(shù)二倍體基因組組裝都忽略了同源染色體之間的差異,將基因組組裝成一個假的單倍體序列(嵌合型)。但隨著研究的深入,發(fā)現(xiàn)僅單套的基因組數(shù)據(jù)難以完全演示該物種的全面信息,例如在木薯、馬鈴薯、茶樹等物種中已有相關(guān)研究(Zhou Q et al., Nature Genetics.2020;Zhang X et al., Nature Genetics.2021; Wang P et al.,Horticulture Research)。同源多倍體中問題尤其明顯,同源染色體之間不同遺傳位點(diǎn)的組合對生物表型有重要影響,如動植物中的雜種優(yōu)勢、某些物種雜交不育現(xiàn)象等。
單倍型等位基因間差異對基因表達(dá)、功能及其表型都有著重要影響,大多數(shù)雜交品種的優(yōu)勢表型都受等位基因調(diào)控。通過單倍型的分析,可為解析物種重要性狀形成的遺傳機(jī)制奠定重要基礎(chǔ)。
無論是單倍型基因組的構(gòu)建還是泛基因組的構(gòu)建,單個的樣本往往不具有性狀分析的普適性,需要進(jìn)一步通過群體規(guī)模的大樣本檢測,挖掘與自然人工馴化、性狀功能關(guān)聯(lián)的關(guān)鍵位點(diǎn),為物種的育種改良與相關(guān)基因研究奠定重要理論基礎(chǔ)。
百邁客自2009年成立以來深耕于群體遺傳研究,同時具有近10年基因組分析經(jīng)驗(yàn)?,F(xiàn)已在基因組、Hi-C、遺傳圖譜等技術(shù)上擁有實(shí)驗(yàn)+生信分析雙保障。并與國內(nèi)外70余所科研單位在國際期刊合作發(fā)表500余篇高質(zhì)量文章,累計影響因子3000+。
為了答謝大家長期以來的信任與支持,百邁客特在年末之際,推出多項(xiàng)優(yōu)惠活動,助力科研! 詳情請咨詢當(dāng)?shù)劁N售經(jīng)理或撥打電話:400-600-3186