近日,中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所陳四清研究員團(tuán)隊(duì)與北京百邁客生物科技有限公司合作完成了中國(guó)真蛸(Octopus sinensis)染色體水平基因組,相關(guān)研究成果發(fā)表在知名期刊Molecular Ecology Resources上。該研究是陳四清研究員團(tuán)隊(duì)繼今年5月發(fā)表超高質(zhì)量綠鰭?cǎi)R面鲀基因組后在水生生物基礎(chǔ)研究領(lǐng)域取得的又一項(xiàng)重要研究成果。
中文題目:基于PacBio測(cè)序和Hi-C技術(shù)的中國(guó)真蛸(Octopus sinensis)染色體水平基因組組裝
研究單位:中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所
研究背景:頭足類(lèi)是軟體動(dòng)物門(mén)中一類(lèi)高度多樣的海洋物種,分布于世界各地,在海洋生態(tài)系統(tǒng)中扮演著重要角色,也是一種重要的漁業(yè)資源。它們進(jìn)化出一些類(lèi)似脊椎動(dòng)物的生物學(xué)結(jié)構(gòu),表現(xiàn)出復(fù)雜的行為特征,生活方式高度活躍,能夠適應(yīng)多種海洋環(huán)境,是研究趨同進(jìn)化機(jī)制和環(huán)境適應(yīng)性的模式物種。高質(zhì)量的基因組必將有助于頭足類(lèi)生物學(xué)研究,但基因組大和重復(fù)序列含量高一直制約著頭足類(lèi)基因組學(xué)的發(fā)展。目前,頭足綱僅報(bào)道了5個(gè)物種的基因組數(shù)據(jù)(長(zhǎng)蛸、加州雙斑蛸、真蛸、中國(guó)真蛸和夏威夷短尾魷魚(yú)),本研究是頭足綱中染色體水平的基因組。
研究材料
denovo:成年雌性中國(guó)真蛸(Octopus sinensis)腎臟組織
Hi-C:胴部肌肉組織
轉(zhuǎn)錄組輔助基因預(yù)測(cè):11個(gè)樣本(肌肉、心臟、腎臟、肝胰腺、鰓、性腺、大腦、后唾液腺、吸盤(pán)、眼睛和皮膚)
主要結(jié)果
使用72.21X Illumina+90.08X PacBio sequel(Reads N50~14 Kb)+77.93X Hi-C進(jìn)行真蛸基因組組裝(表1)。調(diào)研圖預(yù)估基因組大小為2.76 Gb,雜合度為0.34%,重復(fù)性為39.8%(如圖1)。實(shí)際組裝2.72 Gb,Contig N50為503.7kb。二代回比率為98.04%,BUSCO評(píng)估結(jié)果為80.2%。最終經(jīng)過(guò)Hi-C校正后的基因組大小為2.72 Gb,其contig N50和scaffold N50分別為490 Kb和105.9 Mb,并將96.41%組裝序列掛載至30條染色體上。本次組裝的中國(guó)真蛸的基因組是目前已發(fā)表的頭足類(lèi)中染色體水平的基因組,且具有*高的連續(xù)性和較高的完整性?(表2),表明PacBio測(cè)序技術(shù)可有效地用于大而復(fù)雜的基因組的測(cè)序和組裝。
圖1?中國(guó)真蛸基因組調(diào)研圖
圖2 Hi-C熱圖
表1 中國(guó)真蛸基因組測(cè)序數(shù)據(jù)
表2 中國(guó)真蛸基因組與已發(fā)表的頭足類(lèi)基因組比較
2.?基因注釋
本次研究在真蛸基因組中共注釋出1.15 Gb(42.26%)的重復(fù)序列,主要類(lèi)別為L(zhǎng)INEs (12.38%), LARDs (17.41%)以及 TIRs (16.62%)?;趶念^預(yù)測(cè)、同源蛋白預(yù)測(cè)以及RNA-seq的方法預(yù)測(cè)出31676個(gè)蛋白質(zhì)編碼基因。并通過(guò)NR、TrEMBL、KOG、GO和KEGG數(shù)據(jù)庫(kù)的比對(duì),成功地注釋了26207個(gè)預(yù)測(cè)基因。根據(jù)GenBlastA和GeneWise分析,共鑒定出8213個(gè)假基因,總長(zhǎng)度為18,187,167 bp,平均長(zhǎng)度為2,214 bp,并鑒定出5245個(gè)ncRNA,其中1726個(gè)rRNA,2452個(gè)tRNA,32個(gè)miRNA,1028個(gè)snRNA,7個(gè)snoRNA。
3.?基因組進(jìn)化
比較基因組學(xué)分析發(fā)現(xiàn)預(yù)測(cè)到的31676個(gè)基因中有24698個(gè)基因可被聚類(lèi)到17020個(gè)基因家族。其中有741個(gè)基因家族為10個(gè)物種共有,包含有10653個(gè)同源基因。利用10個(gè)物種的238個(gè)單拷貝同源基因構(gòu)建進(jìn)化樹(shù),結(jié)果表明長(zhǎng)蛸的分化時(shí)間早于中國(guó)真蛸和加州雙斑蛸,而中國(guó)真蛸與加州雙斑蛸關(guān)系更近,其分化時(shí)間約為13.88 Mya(圖3)。
圖3 中國(guó)真蛸與其它9個(gè)物種種系統(tǒng)進(jìn)化分析
基因家族聚類(lèi)分析表明中國(guó)真蛸特有的基因家族有1179個(gè),包含5090個(gè)基因(圖4),這些特有的基因家族可能對(duì)中國(guó)真蛸的特有性狀具有重要作用?;蚴湛s和擴(kuò)張分析表明中國(guó)真蛸擴(kuò)張的基因家族有629個(gè),擴(kuò)張基因家族中的基因主要參與中國(guó)真蛸代謝和免疫過(guò)程。其中,C2H2鋅指基因家族和鈣粘蛋白基因家族僅在長(zhǎng)蛸、加州雙斑蛸和中國(guó)真蛸中發(fā)現(xiàn)擴(kuò)張,而在夏威夷短尾魷魚(yú)和其它物種的基因組中沒(méi)有發(fā)現(xiàn)。
圖4 頭足綱基因家族聚類(lèi)分析
小編有言
高質(zhì)量的染色體水平基因組能夠?yàn)楹罄m(xù)研究打下堅(jiān)實(shí)的基礎(chǔ),而簡(jiǎn)單基因組的快速組裝和基礎(chǔ)分析已是現(xiàn)在物種資源研究的大勢(shì)所趨。除了中國(guó)真蛸的成功見(jiàn)刊,下面小編將分享給大家?guī)灼?lèi)似的百邁客新增成功案例,希望廣大研究者能從中找尋屬于你的研究方向~
Part 1
1
影響因子:6.286
物種:油桐
合作單位:中南林業(yè)科技大學(xué)
主要研究?jī)?nèi)容:
2020年1月四川大學(xué)劉建全團(tuán)隊(duì)破譯了中國(guó)特有的瀕危物種珙桐(Davidia involucrata)基因組,相關(guān)成果發(fā)表在期刊Molecular Ecology Resources上。四川大學(xué)劉建全教授和楊勇志博士為該論文的通訊作者,陳陽(yáng)和馬濤教授為并列一作。該研究利用單分子實(shí)時(shí)測(cè)序SMRT和北京百邁客生物技術(shù)有限公司的Hi-C技術(shù)組裝了一個(gè)高質(zhì)量、染色體體水平的珙桐基因組,研究發(fā)現(xiàn)苞片中光合作用相關(guān)基因幾乎缺失或表達(dá)減少,而抗菌、抗冷、抗水等抗逆相關(guān)基因在苞片中高度表達(dá),突出了苞片在保護(hù)花和吸引授粉者中的重要作用。有效群體大小等研究分析了珙桐的生存機(jī)制和瀕危原因。在未來(lái)氣候持續(xù)變暖的背景下,研究結(jié)果為保護(hù)這獨(dú)特的瀕危物種提供了依據(jù)。
2
影響因子:6.286
物種:綠鰭?cǎi)R面鲀
合作單位:中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所
主要研究?jī)?nèi)容:
2020年5月,中國(guó)水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所陳四清研究員團(tuán)隊(duì)與北京百邁客生物科技有限公司合作完成了超高質(zhì)量的綠鰭?cǎi)R面鲀基因組,相關(guān)研究成果發(fā)表在知名期刊Molecular Ecology Resources上。本次研究基于納米孔測(cè)序技術(shù)(Nanopore)和染色體構(gòu)象捕獲技術(shù)(Hi-C)完成的基因組僅包含242個(gè)Contigs,Contig N50高達(dá)22.46 Mb,并將99.44%序列掛載到20條染色體上,實(shí)現(xiàn)了海洋魚(yú)類(lèi)基因組組裝質(zhì)量質(zhì)的飛躍。
Part 2
1
影響因子:5.404
物種:簸箕柳
合作單位:南京林業(yè)大學(xué)
主要研究?jī)?nèi)容:
2020年2月南京林業(yè)大學(xué)尹佟明教授課題組成功破譯柳樹(shù)基因組,相關(guān)研究成果發(fā)表在Horticulture Research上。該研究利用百邁客生物科技有限公司的PacBio測(cè)序和Hi-C技術(shù),獲得了一個(gè)高質(zhì)量染色體版本的簸箕柳參考基因組。新組裝的簸箕柳基因組大小為356 Mb,Contig N50為263,908bp,并通過(guò)Hi-C,將95.29%的簸箕柳基因組序列掛載到19條染色體上。新組裝的簸箕柳為木本植物研究提供了高質(zhì)量的基因組資源。
2
影響因子:5.404
物種:油柿
合作單位:浙江大學(xué)、亞林所
主要研究?jī)?nèi)容:
2019年12月Horticulture Research在線(xiàn)發(fā)表了由浙江大學(xué)、中國(guó)林業(yè)科學(xué)研究院亞熱帶林業(yè)研究所等單位合作完成的二倍體油柿(2n=2x=30)基因組研究論文。研究中使用百邁客生物科技有限公司的PacBio測(cè)序組裝了849.53 Mb油柿基因組序列,進(jìn)一步通過(guò)Hi-C技術(shù)將其中799.71 Mb(占全基因組序列的94.14%)的序列定位到15條染色體上,并通過(guò)slaf簡(jiǎn)化測(cè)序獲得的遺傳圖譜分析研究了其進(jìn)化關(guān)系。
3
影響因子:5.404
物種:板藍(lán)根(菘藍(lán))
合作單位:四川大學(xué)
主要研究?jī)?nèi)容:
2020年2 月1日,四川大學(xué)生命科學(xué)學(xué)院劉建全課題組與華中農(nóng)業(yè)大學(xué)作物遺傳改良國(guó)家重點(diǎn)實(shí)驗(yàn)室李再云課題組首次完成了菘藍(lán)(Isatis indigotica,2n=14)染色體級(jí)別基因組圖譜繪制。該研究利用Pacbio測(cè)序(140X)結(jié)合北京百邁客生物技術(shù)有限公司的Hi-C技術(shù)(284X)組裝得到294Mb高質(zhì)量基因組(contigN50=1.2Mb)?;谕此阉骱凸δ茏⑨?zhuān)_定了該物種主要化合物(如吲哚類(lèi)、萜類(lèi)、黃酮、木脂素等物質(zhì))的可能生物合成通路和相關(guān)的候選基因。該研究強(qiáng)調(diào)了基因組測(cè)序在鑒定藥用植物代謝產(chǎn)物合成候選基因中的重要性,為今后十字花科植物比較基因組等研究提供了重要遺傳信息。
Part 3

2020年2月6日,上海市農(nóng)業(yè)科學(xué)院張學(xué)英研究員團(tuán)隊(duì)于知名期刊Gigascience上首次發(fā)表枇杷基因組相關(guān)研究論文,該研究中基于北京百邁客生物科技有限公司的Nanopore測(cè)序和Hi-C染色體構(gòu)象捕獲技術(shù),構(gòu)建了高質(zhì)量的枇杷基因組。文中通過(guò)與蘋(píng)果、水蜜桃、梨、覆盆莓、月季和野草莓的蛋白質(zhì)序列比較,探索了枇杷的全基因組復(fù)制與進(jìn)化事件,并進(jìn)行了染色體重排分析。該研究提供了寶貴的染色體水平基因組數(shù)據(jù),為研究枇杷性狀提供了重要的基因組數(shù)據(jù)。
百邁客基因組成功案例
選擇百邁客的理由:
百邁客擁有專(zhuān)業(yè)的分析/合作團(tuán)隊(duì)(國(guó)際期刊Nanture Genetics合作文章高達(dá)6篇,截至2020年7月共產(chǎn)出50余篇基因組文章,IF 500+)?;蚪M及HI-C項(xiàng)目經(jīng)驗(yàn)豐富,構(gòu)建逾千個(gè)文庫(kù),HiC技術(shù)實(shí)驗(yàn)+生信雙保護(hù)。分析物種類(lèi)型多樣,高雜合高重復(fù)、多倍體物種研究經(jīng)驗(yàn)豐富(2倍體、3倍體、4倍體、6倍體、8倍體、10倍體等),疑難雜癥不在話(huà)下!