三年成全在线观看大全,中文字幕av一区二区,免费看的黄色视频,中文字幕无码在线
 分類: 基因組測序

眾所周知,要獲得基因組的完整圖片,就必須組裝reads,以目前主要的測序技術來看,短讀長測序提供了很高的z確性,但僅提供了少量數(shù)據(jù)片段,從而只能得到不完整的圖片;而傳統(tǒng)的長讀長測序,可提供更大的圖像,但缺乏z確性,因此很難分辨出真實的生物學變異與測序錯誤之間的區(qū)別。然而,兼顧長讀長與高精度的HiFi測序正在改變一切,今天我們就來聊聊HiFi測序以及百邁客PacBio SequelⅡ平臺HiFi產出情況吧。

一、何為 HiFi測序

HiFi reads(High Fidelity reads)是2019年由PacBio推出的基于環(huán)化共有序列(Circular Consensus Sequencing,CCS)模式產生的既兼顧長讀長(10-20kb的長度)又具有高精度(>99%z確率)的測序結果。
在CCS測序模式下(圖1),酶讀長遠大于插入片段長度,聚合酶會繞著模板進行滾環(huán)測序,插入片段會被多次測序。單次測序中產生的隨機測序錯誤,通過環(huán)形測序生成的一系列Subreads來進行自我打磨,通過算法進行自我糾錯校正,最終得到高z確度的HiFi reads。


圖1 HiFi reads是如何生成的

二、SMRTbell文庫的構建流程簡述

1.SMRTbell文庫的結構
bell即“鈴”的意思,如圖2,構建完成的bell文庫形狀就如同一個啞鈴。其主要組成部分是:發(fā)卡狀的接頭(Hairpin Adapter)和雙鏈DNA模板(Double Stranded DNA Template)。而文構建完成后、測序前還需要完成bell文庫、Sequencing Primer、DNA Polymerase的混合工作(測序引物退火結合bell文庫,然后引物-bell文庫復合物結合DNA聚合酶)。最終產物如圖3所示。

2.SMRTbell文庫構建流程
以基因組HiFi文庫為例(15-20K文庫)(圖4)。當?shù)玫絞DNA后,先利用G-tube管或Megaruptor System將基因組片段化至合適大小,而后通過去除單鏈懸突、損傷修復和末端修復等步驟,得到完整的雙鏈插入片段。接下來,通過將接頭連接至雙鏈DNA來創(chuàng)建SMRTbell文庫,從而得到環(huán)狀模板。完成接頭連接后,需要對連接產物進行純化,利用酶處理(圖5)來消化線性或內部損傷環(huán)形DNA分子(游離的Hairpin Adapter、兩端未連接Adapter的DNA模板、已成環(huán)但內部有損傷的DNA模板),酶處理完畢后,一般會利用Bulepippin或Sage ELF System切膠回收目標大小范圍內的文庫。



圖5 酶處理示意圖

三、HiFi測序的性能

1.使用HiFi Reads 進行基因組De Novo組裝的能力
在基因組從頭組裝方面,研究者利用HiFi reads應用FALCON、Canu和wtdbg2算法分別對HG002基因組進行了從頭組裝,結果顯示組裝質量均較高,contigN50超過15Mb,并且與HG002標準結果高度一致,吻合率達到99.9983%(Q47.7)[1]。

表1 不同測序技術及分析流程組裝結果

 

2.使用HiFi測序檢測人類基因組變異的能力
基因組測序中重要的自然是z確率,只有保證較高的z確率,基因組的研究才有價值。下圖展示了最近的PrecisionFDA 真實挑戰(zhàn)賽V2的結果(圖6),在單一技術參賽結果中,使用PacBio HiFi數(shù)據(jù)(粉紅色)在所有類別中,無論是全基因組范圍(“所有基準區(qū)域”),還是在難以映射的區(qū)域或是主要的組織相容性復合體(MHC)中均提供了較高的z確性。所有的多技術參賽結果(橙色)中都使用了PacBio HiFi數(shù)據(jù)[2]。


圖6 PrecisionFDA Truth Challenge V2結果

另外,由下圖可以看出(圖7),Google DeepVariant使用HiFi數(shù)據(jù)提交的結果在所有單一技術檢測全基因組范圍內的變異z確性*高,對SNV√確度和召回率可以達到99.9%,對插入缺失的√確度和召回率可以達到99.4%[2]。


圖7 不同測序技術及分析流程結果對比

四、百邁客HiFi測序數(shù)據(jù)展示

百邁客自2019年引進PacBio SequelⅡ平臺以來,在HiFi測序方面已經積累了大量的經驗,在技術人員的不斷優(yōu)化下,HiFi文庫單cell產出更是有了新的突破,下面跟大家分享一下部分HiFi文庫產出情況(表2)。在統(tǒng)計近1個月的HiFi cell中,我們單cell平均產出達416Gb。其中,單cell產出達400 Gb以上的占比達68%,同時,單cell的HiFi reads數(shù)據(jù)量高達32 Gb,占原始產出的比例*高可達7.96%。在讀長方面,平均酶讀長已超70Kb,HiFi reads長達18Kb。

表2 百邁客部分HiFi文庫下機數(shù)據(jù)產出統(tǒng)計表

HiFi數(shù)據(jù)由于其長讀長和高z確性,結合針對HiFi reads開發(fā)的組裝軟件,在基因組組裝上有著較大優(yōu)勢。一般物種,單套30×CCS數(shù)據(jù)即可滿足基因組組裝需求,且無需繁瑣的糾錯過程,縮短組裝時間,并能夠識別復雜基因組區(qū)域的細微差別,有助于增加基因組組裝的連續(xù)性、z確性和完整性。

在基因組組裝方面,HiFi測序正受到眾多科研工作者的青睞,已經成為越來越多研究者的不二之選,百邁客自2015年國內引進PacBio三代測序平臺以來,在基因組研究領域已經有近百余篇合作文章發(fā)表于世界知名期刊,累計影響因子600+,目前已經擁有成熟的從測序到分析的完整HiFi流程,歡迎各位老師前來咨詢!

 

參考文獻

[1]Wenger A M , Peluso P , Rowell W J , et al. Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome[J]. Nature Biotechnology, 2019, 37(11).

[2]PacBio.In precisionFDA Challenge,PacBio HiFi Reads Outperform Both Short Reads and Noisy Long Reads.https://www.pacb.com/blog/precisionfda-challenge/[EB/OL].2020.08.11

最近文章