基因組(Denovo sequencing),即基因組從頭測(cè)序,指在不依賴參考基因組的情況下繪制該物種的全基因組序列圖譜,從而獲取該物種的全部遺傳信息。高連續(xù)性基因組的獲得,對(duì)后續(xù)功能基因定位,結(jié)構(gòu)變異檢測(cè)具有重要的意義。結(jié)合近幾年的文章我們不難發(fā)現(xiàn),基因組研究主要以下面幾種方向?yàn)槌霭l(fā)點(diǎn)開展:
1)大型/多倍體/超復(fù)雜物種基因組破譯,技術(shù)創(chuàng)新改革;
2)0 Gap基因組/單體型基因組構(gòu)建,序列優(yōu)化打磨;
3)未知基因組破譯聯(lián)合多組學(xué)分析,經(jīng)濟(jì)價(jià)值挖掘;
4)品種泛基因組構(gòu)建解析功能變異,覆蓋多樣表型;
5)科屬水平譜系基因組構(gòu)建與分析,探索進(jìn)化功能;
6)多種基因組聯(lián)合多組學(xué)比對(duì)剖析,解析性狀特征。 … …
前5種好理解,第6種方向能做什么呢?其實(shí)我們想要了解一個(gè)物種,往往單一基因組難以完整解析,例如該物種不同性別如何引起性狀差異?性別決定基因在哪里?例如表型明顯差異的種質(zhì)間的基因有哪些異同?例如兩個(gè)物種表型相似但分類水平卻存在爭(zhēng)議?例如多倍體物種的演化歷程模糊?等等棘手但是卻又熱門的研究話題。
接下來小編將通過百邁客最近三篇?jiǎng)又参锷系某晒Π咐龓Т蠹铱纯?,如何通過數(shù)個(gè)材料基因組結(jié)合多組學(xué)的手段解析性狀特征。
案例一
合作單位:中科院南海海洋研究所
發(fā)表期刊:Science Advances
影響因子:14.131
發(fā)表時(shí)間:2021.08
研究材料:
Denovo: 雌性與雄性草海龍(Phyllopteryx taeniolatus);雌性與雄性綠海龍(Syngnathoides biaculeatus)
個(gè)體重測(cè)序:2只雄性草海龍
RNA-seq:腦、眼、鰓、肝、腸、肌肉、鰭、皮膚和附葉
測(cè)序方案
Denovo:雌性、雄性草海龍與雄性綠海龍PacBio平臺(tái);雌性綠海龍Nanopore平臺(tái),雌性、雄性草海龍與雄性綠海龍進(jìn)行Hi-C測(cè)序。三代測(cè)序技術(shù)對(duì)應(yīng)測(cè)序數(shù)據(jù)如下表所示:
個(gè)體重測(cè)序:~30X PacBio
研究?jī)?nèi)容
1.兩種海龍基因組組裝與進(jìn)化關(guān)系
草海龍最終組裝大小為 ~659 Mb(♂)與 ~663 Mb(♀), contig N50分別為10.0 Mb與12.1 Mb。綠海龍分別組裝~637 Mb(♂)與~648 Mb(♀),contig N50分別為18.0Mb與21.0 Mb。4個(gè)基因組BUSCO評(píng)估顯示范圍在94.00- 94.40%。并分別在草海龍和綠海龍中確定了31個(gè)和33個(gè)發(fā)生擴(kuò)張的基因家族。通過19條鰭魚類全基因組數(shù)據(jù)集進(jìn)行系統(tǒng)發(fā)育分析,明確草海龍與綠海龍?jiān)谙到y(tǒng)發(fā)育地位上屬于海龍亞科(Syngnathinae)的姊妹群,并于27.3 百萬年前左右發(fā)生分化。
2.“附葉”相關(guān)基因研究
草海龍的頭部、頸部、腹部、背部和尾部區(qū)域有葉子狀的附屬物,可以與周圍環(huán)境相融合,使草海龍以完美擬態(tài)隱匿于海草床中。這些結(jié)構(gòu)是該物種的一種適應(yīng)性進(jìn)化產(chǎn)物,主要由骨基質(zhì)和富含膠原纖維的結(jié)締組織組成。通過轉(zhuǎn)錄組學(xué)分析,發(fā)現(xiàn)其表達(dá)基因(如msx, dlx, fgf)主要從皮膚和鰭等器官募集而來,暗示了相關(guān)基因?qū)π缕鞴佼a(chǎn)生和維持的重要作用。而“附葉”與鰭相比缺乏肢體發(fā)育特異性的hox基因。草海龍的附葉在捕食者的襲擊中經(jīng)常受到損傷,為了研究相關(guān)機(jī)制,作者通過轉(zhuǎn)錄組分析研究發(fā)現(xiàn)在其附葉中炎癥和損傷修復(fù)相關(guān)基因表現(xiàn)出高表達(dá)水平,說明這些基因可能與其附葉的快速愈合和再生能力相關(guān)。同時(shí)草海龍?zhí)禺愋詳U(kuò)張的MHC I基因也在附葉中顯著高表達(dá),能為其提供額外的免疫保護(hù)。
圖1 草海龍附葉形態(tài)及關(guān)鍵基因表達(dá)特征
3.性別決定位點(diǎn)分析
通過雄性和雌性葉海龍Illumina reads正反比對(duì)雄性和雌性的全基因組序列,來確定葉海龍中假定的性染色體和性別基因座。結(jié)果顯示Chr4上的一個(gè)~47-kb區(qū)域僅在雄性中存在, 且reads覆蓋度為Chr4平均值的一半,該片段經(jīng)Hi-C互作分析結(jié)果支持。注釋及比較分析發(fā)現(xiàn)草海龍和綠海龍的性別決定基因均為amhr2的雄性特異性拷貝amhr2y,但兩者的基因座不相同。系統(tǒng)發(fā)育分析表明,amhr2y起源于它們最近共同祖先的重復(fù)事件,而黃鱸amhr2y是從其譜系中的獨(dú)立重復(fù)事件進(jìn)化而來。研究發(fā)現(xiàn)amhr2y比amhr2受到的選擇壓力更強(qiáng),其整體結(jié)構(gòu)與amhr2相似。
圖2 草海龍與綠海龍性別決定基因進(jìn)化
4.無牙研究
草海龍與其他海龍科物種一樣具有缺乏牙齒的管狀吻。研究表明,大部分富含 P/Q 的分泌型鈣結(jié)合磷蛋白(SCPP)基因的缺失可能是導(dǎo)致syngnathids無牙的原因。為了驗(yàn)證海龍科中因假基因化喪失功能這一點(diǎn),作者使用CRISPR-Cas9技術(shù)構(gòu)建了兩個(gè)斑馬魚scpp5突變系,發(fā)現(xiàn)scpp5-/-突變體斑馬魚牙齒的數(shù)量減少且頜骨中存在用于附著牙齒的凹坑。
研究結(jié)論
該研究通過雌雄性海龍基因組的破譯,結(jié)合重測(cè)序分析、轉(zhuǎn)錄分析、比較基因組分析等研究揭示了海龍科物種性別決定基因的產(chǎn)生和演化歷程,為海洋魚類的環(huán)境適應(yīng)性進(jìn)化研究提供了重要理論依據(jù)。
案例二
合作單位:浙江大學(xué)
發(fā)表期刊:Plant Biotechnology Journal
影響因子:9.801
發(fā)表時(shí)間:2021.08
研究材料:
Denovo:Brassica juncea菜用芥菜T84-66、油用芥菜AU213;
個(gè)體重測(cè)序:12個(gè)油菜品種;
遺傳進(jìn)化:183份油用與菜用芥菜;
測(cè)序方案
Denovo:菜用芥菜分別146 Gb Illumina(~150X)+ 251 Gb PacBio(~200X)+Hi-C(~200X );油用芥菜147 Gb Illumina(~150X)+205 Gb PacBio(~200X)+Hi-C(~200X )
個(gè)體重測(cè)序:~20X Nanopore
遺傳進(jìn)化與GWAS:~10X illumina
研究?jī)?nèi)容
1.菜用芥菜T84-66與油用芥菜AU213基因組Denovo
本研究在首次完成榨菜基因組組裝基礎(chǔ)上(Nature Genetics,2016 【項(xiàng)目文章】NG芥菜基因組文章解讀),進(jìn)一步優(yōu)化與解析低硫苷油用芥菜變種AU213的染色體水平基因組。調(diào)研圖評(píng)估菜用與油用芥菜大小結(jié)果分別為968 Mb與938 Mb,且contigN50分別為3.36 Mb及4.4 Mb,*大的scaffold近乎跨越了完整的染色體序列。T84-66與AU213基因組BUSCO(97.7 %與98.3%)、CEGMA(99.6 %與99.8 %)、二代數(shù)據(jù)回比(97.12 %與96.18 %)、GOGGs驗(yàn)證以及與前期基因組版本比較等方式,共同表明本次基因組組裝的高完整性。兩種芥菜中分別預(yù)測(cè)了100,829及100,048個(gè)基因,與16年已發(fā)表的 T84-66 (V1) 版本相比有所增加。芥菜型油菜的Hi-C圖譜顯示常染色質(zhì)(A)和異染色質(zhì)(B)的分布對(duì)比顯示,在著絲粒附近的異染色質(zhì)狀態(tài)中具有相對(duì)較低的基因表達(dá)模式。
圖1 芥菜表型與基因組特征以及三維基因特征
2.結(jié)構(gòu)變異研究
系統(tǒng)地鑒定了T84-66 和 AU213 的A和B亞基因組中的全基因組單核苷酸多態(tài)性 (SNP)、插入/缺失 (InDels)和存在/缺失變異(PAV)。在T84-66和AU213之間的A和B亞基因組中鑒定了24,768個(gè)PAV(> 100 bp),其中3,634個(gè)PAV導(dǎo)致6,425個(gè)基因的變異。隨機(jī)選擇了幾個(gè)PAV并使用PCR來確保這些PAV的保真度。其中一些基因組變異位于基因區(qū)域內(nèi),預(yù)計(jì)會(huì)影響T84-66和AU213作物中涉及生物和非生物脅迫的基因功能。
為了破譯芥菜基因組菜用和油用品種之間SVs衍生的功能差異,作者基于Nanopore重測(cè)序技術(shù),系統(tǒng)比較了菜用和油用芥菜群體基因組結(jié)構(gòu)變異(structural variation,SV),挖掘到包括1, 354個(gè)高可信度的插入、缺失、重復(fù)、倒位、易位等變異。其中兩個(gè)重要的基因位點(diǎn)TGA1和HSP20在ChrA06和ChrB08,可能與B.juncea基因組的菜用與油用品種之間對(duì)生物和生物應(yīng)力的反應(yīng)的自然變異有關(guān)。這些變異研究為菜用芥和油用芥兩個(gè)典型分化群體的演化提供了基因組變異基礎(chǔ)。
3.群體進(jìn)化與GWAS分析
使用T84-66作為參考基因組,對(duì)183份油用與菜用芥菜進(jìn)行進(jìn)化關(guān)系分析,并通過SGS-GWAS(scored genomic SNPs based GWAS)基因定位,在A02和A09中發(fā)現(xiàn)了兩個(gè)參與控制芥菜硫苷(GSL)積累變異的關(guān)鍵遺傳位,并首次發(fā)現(xiàn)A09中的MYB28與B. jucnea中GSL的積累有關(guān)。經(jīng)過進(jìn)一步研究并同過ONT驗(yàn)證發(fā)現(xiàn),MYB28基因的拷貝數(shù)變異(copy number variations,CNVs)是導(dǎo)致芥菜種群中硫苷積累差異的原因,該基因的拷貝數(shù)變異在低硫苷芥菜群體中普遍存在。
研究小結(jié)
該研究將為多倍基因組進(jìn)化研究和√確基因組選擇研究提供重要研究信息,對(duì)芥菜風(fēng)味品質(zhì)和油脂質(zhì)量的分子遺傳改良具有重要科學(xué)和應(yīng)用價(jià)值。
案例三
合作單位:華中農(nóng)業(yè)大學(xué)
發(fā)表期刊:Molecular Biology And Evolution
影響因子:16.241
發(fā)表時(shí)間:2021.05
研究材料:
基因組、Hi-C:圓葉棉G. rotundifolium(K2) 、亞洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鮮葉片
測(cè)序方案
denovo:illumina K2、A2和D5分別 108×, 118×, 132×;Nanopore K2、A2和D5分別124×, 131×, 167×
Hi-C掛載:6堿基酶HindⅢ;K2、A2和D5分辨率分別為20kb、20kb、10kb
Hi-C互作:4堿基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb
研究?jī)?nèi)容
1.圓葉棉、亞洲棉、雷蒙德氏棉基因組組裝注釋
利用Nanopore測(cè)序技術(shù)組裝了圓葉棉(K2)基因組,組裝大小為2.44Gb(contigN50 = 5.33 Mb);提升了亞洲棉(A2)和雷蒙德氏棉(D5)的基因組,組裝大小分別為1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C掛載率均超過99%,BUSCO結(jié)果分別為 92.5%, 93.9%,及95.4%。
重復(fù)序列注釋表明,相對(duì)于D5,K2和A2中棉種特異的反轉(zhuǎn)錄轉(zhuǎn)座子擴(kuò)增是造成這三個(gè)基因組大小三倍變化的原因, 特別是Gypsy和DIRS類型。全長(zhǎng)轉(zhuǎn)座子插入時(shí)間分析表明K2基因組中轉(zhuǎn)座子插入*古老,A2基因組有更多新的轉(zhuǎn)座子。
圖1 圓葉棉基因組組裝特征
2.比較基因組學(xué)和進(jìn)化
比較基因組分析表明,A2和K2基因組在Chr01與Chr02染色體間存在一個(gè)大的易位;K2和D5基因組在Chr13與Chr05染色體間存在一個(gè)大的易位。三個(gè)棉種在57-71 百萬年前存在一次共同的全基因組復(fù)制事件,并在5.1-5.4百萬年前發(fā)生物種分化,基因共線性分析表明每個(gè)基因組大約有15%特異的基因家族。
3.A/B compartment演化
通過HiC染色質(zhì)互作數(shù)據(jù)揭示三個(gè)棉種染色體大小的規(guī)律,A2與K2比D5多了約7000個(gè)基因,三個(gè)基因組中17%的共線性同源基因表現(xiàn)為A/B區(qū)室的染色質(zhì)狀態(tài)改變,這與活躍的轉(zhuǎn)座子擴(kuò)增相關(guān)。
K2與A2及與D5相比更多的傾向于A向B的轉(zhuǎn)化。K2和A2中有更多的基因處于A compartment,D5中有更多的基因處于B compartment。
4.TAD結(jié)構(gòu)演化及轉(zhuǎn)座子擴(kuò)增對(duì)TAD結(jié)構(gòu)影響研究
大約60%的拓?fù)浣Y(jié)構(gòu)域(TAD)在三個(gè)基因組中發(fā)生了重新組織,K2基因組中有更多特異的TAD?;谶吔鏣E覆蓋度,邊界TE表達(dá)以及TE插入時(shí)間分析,發(fā)現(xiàn)K2不保守的TAD邊界存在特異的和較新的轉(zhuǎn)座子(物種分化后爆發(fā)的TE)插入。這些結(jié)果表明最近在K2和A2基因組中表達(dá)的TEs的擴(kuò)增可能有助于在三個(gè)物種分化后形成譜系特異性TAD邊界?;谶@些結(jié)果,作者提出了三個(gè)棉種分化過程中,基因組擴(kuò)張-轉(zhuǎn)座子擴(kuò)增介導(dǎo)的A/B 區(qū)室轉(zhuǎn)換和TAD重組的進(jìn)化模型。
圖2 三種棉TAD特征
研究小結(jié)
本次研究首次公布了棉屬中二倍體圓葉棉基因組,并對(duì)亞洲棉和雷蒙德氏棉基因組進(jìn)行了升級(jí),解析了轉(zhuǎn)座子活動(dòng)驅(qū)動(dòng)的基因組大小進(jìn)化特征,從轉(zhuǎn)座子擴(kuò)增和染色質(zhì)空間結(jié)構(gòu)角度為棉花物種進(jìn)化提供新的見解,為植物中轉(zhuǎn)座子活動(dòng)介導(dǎo)的轉(zhuǎn)錄調(diào)控進(jìn)化研究提供參考。