英文標(biāo)題:Culture-enriched metagenomic sequencing enables in-depth profiling of the cystic fibrosis lung microbiota
機(jī)構(gòu):加拿大卡爾加里大學(xué)微生物學(xué)、免疫學(xué)和傳染病學(xué)系
發(fā)表期刊:Nature Microbiology
影響因子:15.54
發(fā)表時(shí)間:2020 Jan 20
摘要
作者將擴(kuò)增子測(cè)序與富集培養(yǎng)宏基因組測(cè)序相結(jié)合研究人類(lèi)微生物群落。以肺囊性纖維化為例,平均培養(yǎng)了82.13%的可操作分類(lèi)單元(OTUs),占痰液樣本直接測(cè)序所鑒定的相對(duì)豐度的99.3%,更重要的是,與直接測(cè)序相比,富集培養(yǎng)方法鑒定的OTUs多了63.3%。作者開(kāi)發(fā)了平板覆蓋算法(PLCA),以確定富集培養(yǎng)平板的代表性子集,從而在該子集上進(jìn)行宏基因組研究。與不依賴(lài)培養(yǎng)的方法相比,可以恢復(fù)更多的物種多樣性(包含更好的低豐度物種的組裝基因組,MAGs),更長(zhǎng)的重疊群和更好的功能注釋結(jié)果。PLCA算法也可以應(yīng)用于此前發(fā)布的腸道菌群數(shù)據(jù)集,富集培養(yǎng)分子圖譜可以更好的了解微生物菌群在人類(lèi)健康和疾病中的作用。
背景介紹
擴(kuò)增子測(cè)序(如16S rRNA基因)簡(jiǎn)單快速地鑒定出微生物菌群組成和相對(duì)豐度,而宏基因組測(cè)序除了物種之外,還可以評(píng)估群落的基因組分、潛在功能,測(cè)序數(shù)據(jù)的有效性,取決于短序列拼接成重疊群的情況。拼接質(zhì)量受菌群的復(fù)雜度、測(cè)序技術(shù)、宿主DNA污染比例等影響。宏基因組測(cè)序?qū)τ谒拗鱀NA比例較高的樣本類(lèi)型(如皮膚、組織、呼吸道)來(lái)講是一個(gè)挑戰(zhàn)。
實(shí)驗(yàn)方法
基于作者之前的研究(肺囊性纖維化患者的痰液樣本富集培養(yǎng)擴(kuò)增子測(cè)序鑒定到48科細(xì)菌,其中43科可以培養(yǎng)),收集到的樣本分別在有氧和厭氧條件下,經(jīng)過(guò)13種不同的培養(yǎng)基富集。同時(shí),對(duì)這些樣本直接進(jìn)行16S rRNA測(cè)序,富集培養(yǎng)后的共26個(gè)樣本也進(jìn)行16S測(cè)序,同時(shí)挑選了8個(gè)富集后的樣本進(jìn)行宏基因組測(cè)序。

圖1 富集培養(yǎng)宏基因組測(cè)序工作流程
實(shí)驗(yàn)結(jié)果
肺囊性纖維化痰液微生物菌群大多是可培養(yǎng)的,富集培養(yǎng)增加OTU恢復(fù)率
作者判斷OTU可培養(yǎng)的條件:1)至少10條序列;2)至少1個(gè)富集板中回收到且豐度比例至少為0.01%。直接測(cè)序鑒定到的OTU中82.13%是可培養(yǎng)的,這些可培養(yǎng)的在所有直接測(cè)序的樣本中平均豐度比例為99.3%(圖2a),富集培養(yǎng)擴(kuò)增子測(cè)序比直接測(cè)序獲得更多的OTUs(圖2b),如樣本1恢復(fù)到49個(gè)OTUs,其中42個(gè)在富集培養(yǎng)中也恢復(fù)到,富集培養(yǎng)還恢復(fù)了額外的124個(gè)OTUs(圖2a)。
圖2 肺囊性纖維化痰液微生物菌群大多是可培養(yǎng)的
培養(yǎng)OTU恢復(fù)率取決于培養(yǎng)基類(lèi)型和是否有氧
培養(yǎng)基類(lèi)型和培養(yǎng)環(huán)境對(duì)于微生物菌群多樣性是重要的。富集培養(yǎng)和直接16S測(cè)序結(jié)果中物種分布和β多樣性結(jié)果表明有氧和厭氧條件促進(jìn)了不同的物種恢復(fù)(圖3a,b)。不同培養(yǎng)基類(lèi)型的物種進(jìn)行聚類(lèi)顯示選擇性培養(yǎng)和非選擇性培養(yǎng)的重要性(圖3c),有些屬的生長(zhǎng)模式也存在OTU依賴(lài)差異(如普氏菌屬,圖3d)。作者在臨床實(shí)驗(yàn)室常用的4種典型培養(yǎng)條件的基礎(chǔ)上,擴(kuò)展了培養(yǎng)條件,獲得將近2倍的OTUs(圖3e)。富集培養(yǎng)的另一個(gè)優(yōu)點(diǎn)是可以從凍存細(xì)菌中回收感興趣的微生物。嗜麥芽窄食單胞菌從兩個(gè)凍存的脫脂牛奶塊中分離得到,其相對(duì)豐度比例很低(1.3%和1.5%),牛奶塊在特定的培養(yǎng)基類(lèi)型培養(yǎng)(圖3f)。
圖3 通過(guò)培養(yǎng)富集物種分類(lèi)多樣性增加
PLCA算法為培養(yǎng)富集的宏基因組測(cè)序提供信息
肺部蘊(yùn)藏了微生物菌群,每個(gè)個(gè)體是有差異的,雖然不同的培養(yǎng)條件是捕獲每個(gè)個(gè)體多樣性的必要條件,但是并不意味著收集到的每個(gè)樣品都需要進(jìn)行培養(yǎng)富集,這對(duì)其他人體部位菌群同樣適用,如腸道中有很多微生物在人群中普遍存在,而有些微生物則對(duì)某些個(gè)體來(lái)講是特異的。我們不能預(yù)先知道哪些樣品可以體現(xiàn)菌群狀態(tài),但我們可以采用16S rRNA測(cè)序,以確定菌群物種分布,來(lái)選擇哪些樣品適合進(jìn)行富集培養(yǎng)。
作者采用了PLCA算法,來(lái)決定需要進(jìn)行富集培養(yǎng)宏基因組測(cè)序的最小樣品數(shù),算法對(duì)任何含有大部分可培養(yǎng)富集的菌群生態(tài)均適用。PLCA算法有兩個(gè)版本,從頭 PLCA不依賴(lài)于直接測(cè)序結(jié)果再現(xiàn)富集培養(yǎng)菌群,而校正PLCA側(cè)重于直接測(cè)序結(jié)果中OTU的修復(fù),這取決于是否都對(duì)原始樣品的菌群組成感興趣。采用這兩種算法,數(shù)據(jù)集凸顯了不同樣本的獨(dú)特性:從頭PLCA顯示,每個(gè)樣本具有獨(dú)特的平板集,并且每個(gè)培養(yǎng)條件對(duì)每個(gè)樣本都是必要的;校正PLCA顯示對(duì)數(shù)據(jù)集中樣本進(jìn)行富集培養(yǎng)宏基因組測(cè)序是很有必要的(圖4a,b)。
圖4 PLCA算法確定了富集培養(yǎng)宏基因組測(cè)序的最佳平板組
富集培養(yǎng)宏基因組測(cè)序提供了更好的分類(lèi)和功能分辨率
作者選擇代表性樣品,同時(shí)采用PLCA算法的兩個(gè)版本。從頭PLCA和校正PLCA分別顯示需要進(jìn)行5個(gè)和3個(gè)富集培養(yǎng)平板的宏基因組測(cè)序。通過(guò)宏基因組樣本合并組裝、binning和物種注釋?zhuān)容^兩種算法的實(shí)驗(yàn)結(jié)果和預(yù)期結(jié)果。從頭PLCA恢復(fù)10個(gè)bins,與PLCA閾值上的10個(gè)OTUs物種比對(duì)結(jié)果一致,另有6個(gè)閾值以下的物種,校正PLCA恢復(fù)了預(yù)期10個(gè)預(yù)期的OTUs,另有14個(gè)閾值下的OTUs(圖4c)。
對(duì)從頭PLCA、校正PLCA和直接宏基因組測(cè)序的數(shù)據(jù)集分別進(jìn)行合并組裝、binning,定義完整度≥70%和污染度<10%的為MAG,閾值下為non-MAG。其中從頭校正PLCA得到7MAGs和9個(gè)non-MAG bins,校正PLCA得到12個(gè)MAGs和12個(gè)non-MAG bins,而直接宏基因組測(cè)序僅得到1個(gè)MAG和1個(gè)non-MAG bin(圖5)。直接測(cè)序的序列比對(duì)富集培養(yǎng)的bins,在從頭PLCA和校正PLCA中均只在1個(gè)bin中觀察到顯著覆蓋(圖5,藍(lán)點(diǎn))。直接測(cè)序獲得2個(gè)bins均注釋到假單胞菌的種,富集培養(yǎng)的bins注釋物種多樣性增加(14個(gè)屬,圖5)
通過(guò)富集培養(yǎng)獲得的分類(lèi)學(xué)多樣性的增加直接轉(zhuǎn)化為該微生物群落功能信息的增加(圖6)。富集培養(yǎng)測(cè)序在直系同源蛋白簇(COGs)、毒力基因、抗生素抗性基因、CRISPRs和次級(jí)代謝功能方面獲得更大的多樣性和功能鑒定數(shù)量。先前的研究已經(jīng)證實(shí)囊性纖維化氣道以及整個(gè)人類(lèi)微生物群中存在單一物種的異質(zhì)性群體。作者通過(guò)鑒定基因單倍型來(lái)計(jì)算每個(gè)宏基因組bin的遺傳變異性(圖6d)。在一些宏基因組bins中,作者鑒定到一個(gè)一致的和少量的基因單倍型,表示這個(gè)bin代表一個(gè)單一的基因組群體(即一個(gè)菌株)。在大多數(shù)bins中,作者觀察到大量的單倍型多樣性,指示異質(zhì)性群體,即多菌株。不出所料,這些區(qū)域中每個(gè)基因的單倍型數(shù)量是多種多樣的,這表明細(xì)菌基因組內(nèi)進(jìn)化壓力的已知范圍。平均而言,假單胞菌屬種中鑒定出更多的基因單倍型,富集培養(yǎng)的bins比直接測(cè)序更多。然而,直接測(cè)序鑒定了大量的普遍存在的單倍型基因離群值。Bin的完整性與平均單倍型頻率沒(méi)有相關(guān)性。
圖5 項(xiàng)目數(shù)據(jù)中第一批樣本直接測(cè)序和腹肌培養(yǎng)測(cè)序的MAG和non-MAG bins結(jié)果
圖6 直接和富集培養(yǎng)宏基因組測(cè)序的物種和功能多樣性結(jié)果
討論
測(cè)序成本的降低和測(cè)序技術(shù)的增加,徹底改變了我們研究人類(lèi)微生物群的方式,從而使人們對(duì)群落及其與健康和疾病之間的關(guān)系有了更深入的了解。腸道是目前研究最深入的人體微生物組,很多研究將其與各種疾病和狀況聯(lián)系在一起。皮膚、活檢組織、口腔微生物樣本等許多重要的與人類(lèi)相關(guān)的群落具有高比例的非微生物DNA,這些樣本的宏基因組測(cè)序數(shù)據(jù)由于宿主污染,必須通過(guò)比對(duì)過(guò)濾掉大部分序列,意味著只有群落中高豐度比例的物種可以被組裝成MAGs。作者論證了與傳統(tǒng)培養(yǎng)技術(shù)相關(guān)聯(lián)的富集宏基因組測(cè)序可以提高群落的分辨率,并且為了最有效的結(jié)合富集培養(yǎng)和直接測(cè)序,作者設(shè)計(jì)了PLCA算法,其確定了對(duì)于重現(xiàn)原始菌群(擴(kuò)增子測(cè)序),富集培養(yǎng)宏基因組測(cè)序很有必要。
富集培養(yǎng)測(cè)序與直接測(cè)序相結(jié)合觀察到更多的物種多樣性并且更深入的了解與人類(lèi)相關(guān)的微生物群落,更好的了解每種微生物的基因組成。此外,將這些微生物進(jìn)行培養(yǎng),我們可以進(jìn)行體外機(jī)制的研究,并且可以在人類(lèi)健康和疾病的背景下,更好的了解這些群落。