基因組(Denovo sequencing),即基因組從頭測序,指在不依賴參考基因組的情況下繪制該物種的全基因組序列圖譜,從而獲取該物種的全部遺傳信息。高連續(xù)性基因組的獲得,對后續(xù)功能基因定位,結(jié)構(gòu)變異檢測具有重要的意義。結(jié)合近幾年的文章我們不難發(fā)現(xiàn),基因組研究主要以下面幾種方向為出發(fā)點開展:
1)大型/多倍體/超復雜物種基因組破譯,技術(shù)創(chuàng)新改革;
2)0 Gap基因組/單體型基因組構(gòu)建,序列優(yōu)化打磨;
3)未知基因組破譯聯(lián)合多組學分析,經(jīng)濟價值挖掘;
4)品種泛基因組構(gòu)建解析功能變異,覆蓋多樣表型;
5)科屬水平譜系基因組構(gòu)建與分析,探索進化功能;
6)多種基因組聯(lián)合多組學比對剖析,解析性狀特征。 … …
前5種好理解,第6種方向能做什么呢?其實我們想要了解一個物種,往往單一基因組難以完整解析,例如該物種不同性別如何引起性狀差異?性別決定基因在哪里?例如表型明顯差異的種質(zhì)間的基因有哪些異同?例如兩個物種表型相似但分類水平卻存在爭議?例如多倍體物種的演化歷程模糊?等等棘手但是卻又熱門的研究話題。
接下來小編將通過百邁客最近三篇動植物上的成功案例帶大家看看,如何通過數(shù)個材料基因組結(jié)合多組學的手段解析性狀特征。
案例一
合作單位:中科院南海海洋研究所
發(fā)表期刊:Science Advances
影響因子:14.131
發(fā)表時間:2021.08
研究材料:
Denovo: 雌性與雄性草海龍(Phyllopteryx taeniolatus);雌性與雄性綠海龍(Syngnathoides biaculeatus)
個體重測序:2只雄性草海龍
RNA-seq:腦、眼、鰓、肝、腸、肌肉、鰭、皮膚和附葉
測序方案
Denovo:雌性、雄性草海龍與雄性綠海龍PacBio平臺;雌性綠海龍Nanopore平臺,雌性、雄性草海龍與雄性綠海龍進行Hi-C測序。三代測序技術(shù)對應測序數(shù)據(jù)如下表所示:
個體重測序:~30X PacBio
研究內(nèi)容
1.兩種海龍基因組組裝與進化關(guān)系
草海龍最終組裝大小為 ~659 Mb(♂)與 ~663 Mb(♀), contig N50分別為10.0 Mb與12.1 Mb。綠海龍分別組裝~637 Mb(♂)與~648 Mb(♀),contig N50分別為18.0Mb與21.0 Mb。4個基因組BUSCO評估顯示范圍在94.00- 94.40%。并分別在草海龍和綠海龍中確定了31個和33個發(fā)生擴張的基因家族。通過19條鰭魚類全基因組數(shù)據(jù)集進行系統(tǒng)發(fā)育分析,明確草海龍與綠海龍在系統(tǒng)發(fā)育地位上屬于海龍亞科(Syngnathinae)的姊妹群,并于27.3 百萬年前左右發(fā)生分化。
2.“附葉”相關(guān)基因研究
草海龍的頭部、頸部、腹部、背部和尾部區(qū)域有葉子狀的附屬物,可以與周圍環(huán)境相融合,使草海龍以完美擬態(tài)隱匿于海草床中。這些結(jié)構(gòu)是該物種的一種適應性進化產(chǎn)物,主要由骨基質(zhì)和富含膠原纖維的結(jié)締組織組成。通過轉(zhuǎn)錄組學分析,發(fā)現(xiàn)其表達基因(如msx, dlx, fgf)主要從皮膚和鰭等器官募集而來,暗示了相關(guān)基因?qū)π缕鞴佼a(chǎn)生和維持的重要作用。而“附葉”與鰭相比缺乏肢體發(fā)育特異性的hox基因。草海龍的附葉在捕食者的襲擊中經(jīng)常受到損傷,為了研究相關(guān)機制,作者通過轉(zhuǎn)錄組分析研究發(fā)現(xiàn)在其附葉中炎癥和損傷修復相關(guān)基因表現(xiàn)出高表達水平,說明這些基因可能與其附葉的快速愈合和再生能力相關(guān)。同時草海龍?zhí)禺愋詳U張的MHC I基因也在附葉中顯著高表達,能為其提供額外的免疫保護。
圖1 草海龍附葉形態(tài)及關(guān)鍵基因表達特征
3.性別決定位點分析
通過雄性和雌性葉海龍Illumina reads正反比對雄性和雌性的全基因組序列,來確定葉海龍中假定的性染色體和性別基因座。結(jié)果顯示Chr4上的一個~47-kb區(qū)域僅在雄性中存在, 且reads覆蓋度為Chr4平均值的一半,該片段經(jīng)Hi-C互作分析結(jié)果支持。注釋及比較分析發(fā)現(xiàn)草海龍和綠海龍的性別決定基因均為amhr2的雄性特異性拷貝amhr2y,但兩者的基因座不相同。系統(tǒng)發(fā)育分析表明,amhr2y起源于它們最近共同祖先的重復事件,而黃鱸amhr2y是從其譜系中的獨立重復事件進化而來。研究發(fā)現(xiàn)amhr2y比amhr2受到的選擇壓力更強,其整體結(jié)構(gòu)與amhr2相似。
圖2 草海龍與綠海龍性別決定基因進化
4.無牙研究
草海龍與其他海龍科物種一樣具有缺乏牙齒的管狀吻。研究表明,大部分富含 P/Q 的分泌型鈣結(jié)合磷蛋白(SCPP)基因的缺失可能是導致syngnathids無牙的原因。為了驗證海龍科中因假基因化喪失功能這一點,作者使用CRISPR-Cas9技術(shù)構(gòu)建了兩個斑馬魚scpp5突變系,發(fā)現(xiàn)scpp5-/-突變體斑馬魚牙齒的數(shù)量減少且頜骨中存在用于附著牙齒的凹坑。
研究結(jié)論
該研究通過雌雄性海龍基因組的破譯,結(jié)合重測序分析、轉(zhuǎn)錄分析、比較基因組分析等研究揭示了海龍科物種性別決定基因的產(chǎn)生和演化歷程,為海洋魚類的環(huán)境適應性進化研究提供了重要理論依據(jù)。
案例二
合作單位:浙江大學
發(fā)表期刊:Plant Biotechnology Journal
影響因子:9.801
發(fā)表時間:2021.08
研究材料:
Denovo:Brassica juncea菜用芥菜T84-66、油用芥菜AU213;
個體重測序:12個油菜品種;
遺傳進化:183份油用與菜用芥菜;
測序方案
Denovo:菜用芥菜分別146 Gb Illumina(~150X)+ 251 Gb PacBio(~200X)+Hi-C(~200X );油用芥菜147 Gb Illumina(~150X)+205 Gb PacBio(~200X)+Hi-C(~200X )
個體重測序:~20X Nanopore
遺傳進化與GWAS:~10X illumina
研究內(nèi)容
1.菜用芥菜T84-66與油用芥菜AU213基因組Denovo
本研究在首次完成榨菜基因組組裝基礎(chǔ)上(Nature Genetics,2016 【項目文章】NG芥菜基因組文章解讀),進一步優(yōu)化與解析低硫苷油用芥菜變種AU213的染色體水平基因組。調(diào)研圖評估菜用與油用芥菜大小結(jié)果分別為968 Mb與938 Mb,且contigN50分別為3.36 Mb及4.4 Mb,*大的scaffold近乎跨越了完整的染色體序列。T84-66與AU213基因組BUSCO(97.7 %與98.3%)、CEGMA(99.6 %與99.8 %)、二代數(shù)據(jù)回比(97.12 %與96.18 %)、GOGGs驗證以及與前期基因組版本比較等方式,共同表明本次基因組組裝的高完整性。兩種芥菜中分別預測了100,829及100,048個基因,與16年已發(fā)表的 T84-66 (V1) 版本相比有所增加。芥菜型油菜的Hi-C圖譜顯示常染色質(zhì)(A)和異染色質(zhì)(B)的分布對比顯示,在著絲粒附近的異染色質(zhì)狀態(tài)中具有相對較低的基因表達模式。
圖1 芥菜表型與基因組特征以及三維基因特征
2.結(jié)構(gòu)變異研究
系統(tǒng)地鑒定了T84-66 和 AU213 的A和B亞基因組中的全基因組單核苷酸多態(tài)性 (SNP)、插入/缺失 (InDels)和存在/缺失變異(PAV)。在T84-66和AU213之間的A和B亞基因組中鑒定了24,768個PAV(> 100 bp),其中3,634個PAV導致6,425個基因的變異。隨機選擇了幾個PAV并使用PCR來確保這些PAV的保真度。其中一些基因組變異位于基因區(qū)域內(nèi),預計會影響T84-66和AU213作物中涉及生物和非生物脅迫的基因功能。
為了破譯芥菜基因組菜用和油用品種之間SVs衍生的功能差異,作者基于Nanopore重測序技術(shù),系統(tǒng)比較了菜用和油用芥菜群體基因組結(jié)構(gòu)變異(structural variation,SV),挖掘到包括1, 354個高可信度的插入、缺失、重復、倒位、易位等變異。其中兩個重要的基因位點TGA1和HSP20在ChrA06和ChrB08,可能與B.juncea基因組的菜用與油用品種之間對生物和生物應力的反應的自然變異有關(guān)。這些變異研究為菜用芥和油用芥兩個典型分化群體的演化提供了基因組變異基礎(chǔ)。
3.群體進化與GWAS分析
使用T84-66作為參考基因組,對183份油用與菜用芥菜進行進化關(guān)系分析,并通過SGS-GWAS(scored genomic SNPs based GWAS)基因定位,在A02和A09中發(fā)現(xiàn)了兩個參與控制芥菜硫苷(GSL)積累變異的關(guān)鍵遺傳位,并首次發(fā)現(xiàn)A09中的MYB28與B. jucnea中GSL的積累有關(guān)。經(jīng)過進一步研究并同過ONT驗證發(fā)現(xiàn),MYB28基因的拷貝數(shù)變異(copy number variations,CNVs)是導致芥菜種群中硫苷積累差異的原因,該基因的拷貝數(shù)變異在低硫苷芥菜群體中普遍存在。
研究小結(jié)
該研究將為多倍基因組進化研究和√確基因組選擇研究提供重要研究信息,對芥菜風味品質(zhì)和油脂質(zhì)量的分子遺傳改良具有重要科學和應用價值。
案例三
合作單位:華中農(nóng)業(yè)大學
發(fā)表期刊:Molecular Biology And Evolution
影響因子:16.241
發(fā)表時間:2021.05
研究材料:
基因組、Hi-C:圓葉棉G. rotundifolium(K2) 、亞洲棉G. arboreum(A2)、雷蒙德氏棉G. raimondii(D2)新鮮葉片
測序方案
denovo:illumina K2、A2和D5分別 108×, 118×, 132×;Nanopore K2、A2和D5分別124×, 131×, 167×
Hi-C掛載:6堿基酶HindⅢ;K2、A2和D5分辨率分別為20kb、20kb、10kb
Hi-C互作:4堿基酶DpnⅡ;分辨率20 Kb, 50 Kb, 100 Kb
研究內(nèi)容
1.圓葉棉、亞洲棉、雷蒙德氏棉基因組組裝注釋
利用Nanopore測序技術(shù)組裝了圓葉棉(K2)基因組,組裝大小為2.44Gb(contigN50 = 5.33 Mb);提升了亞洲棉(A2)和雷蒙德氏棉(D5)的基因組,組裝大小分別為1.62 Gb (contigN50 = 11.69 Mb)和0.75 Gb(contigN50 =17.04 Mb )。Hi-C掛載率均超過99%,BUSCO結(jié)果分別為 92.5%, 93.9%,及95.4%。
重復序列注釋表明,相對于D5,K2和A2中棉種特異的反轉(zhuǎn)錄轉(zhuǎn)座子擴增是造成這三個基因組大小三倍變化的原因, 特別是Gypsy和DIRS類型。全長轉(zhuǎn)座子插入時間分析表明K2基因組中轉(zhuǎn)座子插入*古老,A2基因組有更多新的轉(zhuǎn)座子。
圖1 圓葉棉基因組組裝特征
2.比較基因組學和進化
比較基因組分析表明,A2和K2基因組在Chr01與Chr02染色體間存在一個大的易位;K2和D5基因組在Chr13與Chr05染色體間存在一個大的易位。三個棉種在57-71 百萬年前存在一次共同的全基因組復制事件,并在5.1-5.4百萬年前發(fā)生物種分化,基因共線性分析表明每個基因組大約有15%特異的基因家族。
3.A/B compartment演化
通過HiC染色質(zhì)互作數(shù)據(jù)揭示三個棉種染色體大小的規(guī)律,A2與K2比D5多了約7000個基因,三個基因組中17%的共線性同源基因表現(xiàn)為A/B區(qū)室的染色質(zhì)狀態(tài)改變,這與活躍的轉(zhuǎn)座子擴增相關(guān)。
K2與A2及與D5相比更多的傾向于A向B的轉(zhuǎn)化。K2和A2中有更多的基因處于A compartment,D5中有更多的基因處于B compartment。
4.TAD結(jié)構(gòu)演化及轉(zhuǎn)座子擴增對TAD結(jié)構(gòu)影響研究
大約60%的拓撲結(jié)構(gòu)域(TAD)在三個基因組中發(fā)生了重新組織,K2基因組中有更多特異的TAD?;谶吔鏣E覆蓋度,邊界TE表達以及TE插入時間分析,發(fā)現(xiàn)K2不保守的TAD邊界存在特異的和較新的轉(zhuǎn)座子(物種分化后爆發(fā)的TE)插入。這些結(jié)果表明最近在K2和A2基因組中表達的TEs的擴增可能有助于在三個物種分化后形成譜系特異性TAD邊界?;谶@些結(jié)果,作者提出了三個棉種分化過程中,基因組擴張-轉(zhuǎn)座子擴增介導的A/B 區(qū)室轉(zhuǎn)換和TAD重組的進化模型。
圖2 三種棉TAD特征
研究小結(jié)
本次研究首次公布了棉屬中二倍體圓葉棉基因組,并對亞洲棉和雷蒙德氏棉基因組進行了升級,解析了轉(zhuǎn)座子活動驅(qū)動的基因組大小進化特征,從轉(zhuǎn)座子擴增和染色質(zhì)空間結(jié)構(gòu)角度為棉花物種進化提供新的見解,為植物中轉(zhuǎn)座子活動介導的轉(zhuǎn)錄調(diào)控進化研究提供參考。