花生作為我國重要的經(jīng)濟作物,廣泛種植于熱帶和亞熱帶地區(qū),是提供重要的蛋白和油料的基礎。作為豆科的重要分支之一,花生屬一共包括30個二倍體品種,1個異源四倍體野生花生(A.monticola)和1個異源四倍體栽培花生(A.hypogaea)(2n = 4x = 40)。作為栽培花生農藝性狀改良的重要野生資源供體,野生四倍體花生的基因組也一直是國內外學者的研究熱點。成功破譯四倍體野生花生的基因組有助于科學家和育種專家對A.hypogaea起源及馴化過程的理解。河南農業(yè)大學殷冬梅教授團隊與北京百邁客生物科技有限公司、中國科學院等多家單位聯(lián)合攻關,成功破譯復雜的異源四倍體野生花生基因組密碼,相關成果于2018年6月19日發(fā)表在GigaScience上:“Genome of an allotetraploid wild peanut Arachis monticola: a de novo assemble”。
該團隊充分考慮野生花生中高度同源的異源四倍體基因組的復雜性,充分利用SMRT + Hi-C + IRYS + Illumina等測序平臺技術優(yōu)勢,采用基因組組裝技術成功破譯了四倍體野生花生基因組,最終得到染色體水平的高質量野生花生參考基因組。組裝基因組大小為2.62Gb,為預計基因組大小的97%,contigs N50和scaffolds N50分別為106.66Kb,124.92Mb,其中96.07%的序列掛載到20條染色體上,91.83%的序列可以確定順序和方向。野生花生基因組的發(fā)布對于理解花生屬和豆科作物進化具有重要的科學價值,促進花生以及其他油料作物的功能基因組學發(fā)展和分子育種。
野生異源四倍體花生基因組的難點
????????通過K-mer分析預測該基因組的大小為2.42Gb(實際大小約為2.7Gb),重復序列為75%,基因組雜合度為0.1%。通過2015年發(fā)表在Nature Genetics上的2個祖先種序列可知A和B兩套亞基因組的同源性高達93%,屬于高度同源的異源四倍體基因組,甚至同源性超越了某些同源多倍體的基因組。
該基因組的難點不是僅僅獲得一個高的Contig N50指標,而是能夠將四倍體的序列信息組裝完整,并進行區(qū)分。因為亞基因組的高度同源,又具有75%的高重復序列這給組裝的完整性帶來極大的困難。該基因組的雜合度僅有0.1%,低雜合對于二倍體物種來說是有利于基因組組裝的,但其對于多倍體物種,非常不利于亞基因組的區(qū)分(因為兩套基因組序列太類似,甚至連SNP都很少)。
百邁客對野生異源四倍體花生的組裝策略
????????在這項研究中,研究人員以野生四倍體花生A.monticola為研究材料,進行測序得到36X SMRT subreads + 76X HiC data + 210X Bionano Irys data + 50X Illumina reads的測序數(shù)據(jù),整合多種組裝工具的優(yōu)勢,最終獲得了參考基因組水平的高質量組裝結果,如下所示:
最終組裝出2.62Gb的基因組序列,保證組裝的完整性,又利用BioNano和Hi-C等方法對基因組進行區(qū)分最終A.monticola得到的subgenome與祖先A基因組A.duranensis、祖先B基因組A.ipaensis之間的比較如表2所示,野生花生A and B subgenomes與對應的基因組大小相近,基因組的完整性和連續(xù)性都有了顯著提升,為后續(xù)的功能基因組研究打下了堅實的基礎。
百邁客對野生異源四倍體花生組裝的Hi-C熱圖評估
????????除了常規(guī)基因組的評估手段之外,我們還利用更直觀的Hi-C對該基因組序列進行準確性評估,并與其祖先種A和祖先種B進行了比較。比較栽培種A.monticola得到的subgenome與祖先A基因組A.duranensis, 祖先B基因組A.ipaensis的Hi-C熱圖,整體熱圖一致性非常高。(A圖是A.monticola的HiC熱圖,B圖祖先A基因組A.duranensis, 祖先B基因組A.ipaensis的Hi-C熱圖)
該研究整合使用SMRT subreads + HiC + Optical data等多種測序手段并開發(fā)了一套全新的denovo組裝策略,最終獲得染色體級別的高質量的異源四倍體基因組,相比較于之前發(fā)表的基因組,contigs N50有了將近5倍的提升,并且包含了97%的野生花生的基因組序列。此項研究表明這種全新的組裝策略對于異源四倍體基因組的組裝是可行的,并且這也是野生花生基因組公布,對于研究祖先二倍體花生與栽培四倍體花生的進化,起源等研究起到了”橋梁”的作用。該項目得到國家基金委、河南省產(chǎn)業(yè)技術體系、河南省科技廳等諸多項目的資助。
針對這篇文獻,您有哪些想法與我們交流?我們將免費為您進行文章思路設計。