三代測(cè)序儀以其超長(zhǎng)讀長(zhǎng)的優(yōu)勢(shì),在基因組組裝中備受青睞,目前廣泛應(yīng)用的是PacBio三代單分子熒光測(cè)序和Nanopore三代單分子納米孔測(cè)序,因Nanopore測(cè)序讀長(zhǎng)更長(zhǎng)且通量高的特點(diǎn),近幾年在基因組組裝應(yīng)用中嶄露頭角,先后在Nature Biotechnology上發(fā)表了人的基因組、Plant cell上發(fā)表了野生番茄基因組、Nature Genetics上發(fā)表了高粱基因組等等,測(cè)序技術(shù)已相當(dāng)成熟。
ONT測(cè)序結(jié)果展示
作物類(部分)
林木類(部分)
動(dòng)物(部分)
水產(chǎn)(部分)
中藥材(部分)
注:Species:分析的物種信息;SeqNum:各個(gè)長(zhǎng)度范圍內(nèi)序列的數(shù)目;SumBase:指各個(gè)長(zhǎng)度范圍內(nèi)序列的總長(zhǎng)度;N50Len:reads N50長(zhǎng)度;N90Len:readsN90長(zhǎng)度;MeanLen:平均reads長(zhǎng)度;MaxLen:最長(zhǎng)reads長(zhǎng)度;MeanQual:質(zhì)量值。
以上是總結(jié)的部分作物類、林木類、動(dòng)物、水產(chǎn)和中藥材的下機(jī)數(shù)據(jù)結(jié)果展示,從以上的數(shù)據(jù)不難看出,平均raeds長(zhǎng)度幾乎均在20Kb以上,最長(zhǎng)reads高達(dá)1.6Mb以上(不同樣品DNA抽提難易程度不同,會(huì)造成一定的影響)。
基因組組裝結(jié)果展示
上表中最后一列MeanQual就是下機(jī)數(shù)據(jù)的質(zhì)量值,與堿基準(zhǔn)確度的換算公式為:準(zhǔn)確度 = 1-10^(-Q/10),經(jīng)計(jì)算? Nanopore下機(jī)數(shù)據(jù)單堿基的平均準(zhǔn)確率約為86%左右,這樣經(jīng)過(guò)校正的數(shù)據(jù)再用Canu、SMARTdenovo、WTDBG等軟件進(jìn)行基因組的組裝,再經(jīng)過(guò)二代數(shù)據(jù)的polish之后,堿基的準(zhǔn)確度可達(dá)到99.99%以上呢!
廢話少說(shuō),直接上組裝結(jié)果!
植物(部分)
動(dòng)物(部分)

注:Species:分析的物種信息;CtgNum:contig數(shù)目;CtgLen:contig總長(zhǎng)度;CtgN50:contigN50長(zhǎng)度;CtgN90:contigN90長(zhǎng)度;CtgMax:最長(zhǎng)contig長(zhǎng)度;GC(%):GC含量占比。
注:物種:分析的物種信息;Complete BUSCOs:找到完整基因數(shù);Complete and single-copy BUSCOs:其中單拷貝基因數(shù);Complete and duplicated BUSCOs:多拷貝基因數(shù);Fragmented BUSCOs:預(yù)測(cè)不完整基因數(shù);Missing BUSCOs:沒(méi)有預(yù)測(cè)出來(lái)的基因數(shù)。
評(píng)估結(jié)果顯示基因完整度均在90%以上??!說(shuō)明Nanopore數(shù)據(jù)的組裝連續(xù)性和完整性都是非常好的,是值得廣大科研工作者信賴的哦!
百邁客ONT平臺(tái)發(fā)展歷程
?
