百邁客宏基因組分析平臺(tái)全新升級(jí),百邁客宏基因組分析平臺(tái)擁有流暢的主流程,豐富的個(gè)性化,在39種分析基礎(chǔ)上,新增13種個(gè)性化分析,另還有6種個(gè)性化分析即將上線,滿足您的定制化要求。
新增分析如下:
物種組成分析:新增upset圖,厚壁菌門/擬桿菌門比例;
個(gè)性化功能注釋:新增Ncyc數(shù)據(jù)庫注釋、分泌蛋白預(yù)測(cè)、T3SS效應(yīng)蛋白預(yù)測(cè)、TCDB轉(zhuǎn)運(yùn)蛋白分類注釋
Beta多樣性分析:PLS-DA分析、分型分析
Alpha多樣性分析:Alpha多樣性指數(shù)、稀釋曲線、香農(nóng)指數(shù)曲線、等級(jí)豐度曲線相關(guān)性與關(guān)聯(lián)分析:物種與功能貢獻(xiàn)度分析
下面給各位老師介紹其中11項(xiàng)個(gè)性化分析內(nèi)容,感興趣的老師可以聯(lián)系當(dāng)?shù)劁N售體驗(yàn),另外轉(zhuǎn)發(fā)本篇微信推文至朋友圈,集贊20+,保留12h以上,即可獲得微生物多樣性云分析一個(gè)月的免費(fèi)體驗(yàn) 或 一次宏基因組(限6個(gè)樣本)的標(biāo)準(zhǔn)分析和個(gè)性化分析體驗(yàn)權(quán)限?;顒?dòng)時(shí)間:2021.10.23-2021.11.2
宏基因組免費(fèi)課程:http://live.biocloud.net/my/course/208
宏基因組分析平臺(tái)總覽
組成物種分析
1.upset圖
維恩圖(Venn diagram)是十九世紀(jì)英國(guó)數(shù)學(xué)家約翰·維恩(John Venn)發(fā)明,用于展示集合之間大致關(guān)系的一類圖形。其中圈或橢圓重合(overlap)的部分就是集合與集合間元素的交集,非重疊部分則為特定集合的特有元素。集合圖均可用于對(duì)集合共有和特有元素信息進(jìn)行可視化,但是當(dāng)數(shù)據(jù)分組過多(>4)時(shí),維恩圖看起來會(huì)非常雜亂,而集合圖可以展示≥5個(gè)分組的集合元素共有和特有信息。統(tǒng)計(jì)樣品之間的共有、特有元素。應(yīng)用范圍:適用于微生物、轉(zhuǎn)錄組、代謝組、單細(xì)胞等組學(xué)。如分析組間共有、特有物種;分析各比較組顯著差異的共有、特有pathway/基因等。
圖1. upset示例,展示Group1/Group2兩組組間共有和特有元素的數(shù)量
2.厚壁菌門/擬桿菌門比例
圖2 展示不同樣本厚壁菌門/擬桿菌門比例
個(gè)性化功能注釋
1.Ncyc數(shù)據(jù)庫注釋
NCycDB(https://github.com/qichao1984/NCyc)是一個(gè)人工校正后的氮循環(huán)相關(guān)基因數(shù)據(jù)庫。NCycDB 共包含 68 個(gè)基因(亞)家族,涵蓋 8 個(gè) N 循環(huán)過程,分別具有 95% 和 100% 同一性截止值的84,759和219,146個(gè)代表性序列,還確定了 1958 個(gè)同源直系同源組,并在數(shù)據(jù)庫中包含了相應(yīng)的序列,以避免由于“小數(shù)據(jù)庫”問題導(dǎo)致的假陽性分配。NCycDB可用于快速而準(zhǔn)確地對(duì)氮循環(huán)基因進(jìn)行宏基因組學(xué)分析。
圖3.Ncyc數(shù)據(jù)庫注釋
2. T3SS效應(yīng)蛋白注釋
三型分泌系統(tǒng)(type Ⅲ secretion system,TTSS,T3SS)是一個(gè)由多組分蛋白復(fù)合體形成的跨膜通道,它不依賴sec通過分泌蛋白或把這些毒力蛋白直接注入宿主細(xì)胞發(fā)揮致病作用,是許多革蘭陰性致病菌中存在的復(fù)雜的分子裝置。TTSS蛋白可以分成 4類:1)細(xì)胞膜結(jié)構(gòu)裝置蛋白 ( bacterialmembrane apparatus proteins),負(fù)責(zé)分泌系統(tǒng)組裝;2) 轉(zhuǎn)位蛋白 ( tranl ocon proteins ),在細(xì)胞膜上形成使效應(yīng)蛋白得以通過的小孔;3)效應(yīng)蛋白 ( translocated effect of proteins ),與病原的致病作用密切相關(guān),能夠引起宿主細(xì)胞相應(yīng)的病理變化;4) TTSS分子伴侶 ( type Ⅲ chaper ones) ,能夠有效地轉(zhuǎn)移效應(yīng)蛋白,保護(hù)其在未分泌之前不被降解。
圖4.T3SS效應(yīng)蛋白注釋
3. TCDB轉(zhuǎn)運(yùn)蛋白分類注釋
TCDB(Transporter Classification Database)是包含各種轉(zhuǎn)運(yùn)蛋白的蛋白序列并對(duì)收錄的蛋白進(jìn)行分類的數(shù)據(jù)庫。這個(gè)數(shù)據(jù)庫的分類是依據(jù)于TC系統(tǒng)進(jìn)行的分類(Transporter Classification system),具體的類別信息由TC號(hào)(TC number)標(biāo)注,TC number由點(diǎn)分割的五組字符(D1.L1.D2.D3.D4)組成:D1(單個(gè)數(shù)字)代表相應(yīng)的轉(zhuǎn)運(yùn)蛋白類(如通道蛋白、載體等);L1(單個(gè)字母)相應(yīng)于轉(zhuǎn)運(yùn)蛋白亞類;D2(數(shù)字)代表相應(yīng)的轉(zhuǎn)運(yùn)蛋白家族;D3(數(shù)字)代表相應(yīng)的轉(zhuǎn)運(yùn)蛋白亞家族;D4(數(shù)字)相應(yīng)于具體的轉(zhuǎn)運(yùn)蛋白本身。雖然在一些家族中有些轉(zhuǎn)運(yùn)蛋白可能利用多種作用模型或者可能利用不同于該家族中的其它蛋白的機(jī)制,但是對(duì)于大多數(shù)轉(zhuǎn)運(yùn)蛋白家族來說,家族中的成分具有相似的功能和作用機(jī)制。
圖5.TCDB轉(zhuǎn)運(yùn)蛋白分類注釋
Beta多樣性分析
1.PLS-DA分析
偏最小二乘判別分析(Partialleast squares discriminant analysis,PLS-DA)是多變量數(shù)據(jù)分析技術(shù)中的判別分析法,經(jīng)常用來處理分類和判別問題。通過對(duì)主成分適當(dāng)?shù)男D(zhuǎn),PLS-DA可以有效的對(duì)組間觀察值進(jìn)行區(qū)分,并且能夠找到導(dǎo)致組間區(qū)別的影響變量。PLS-DA采用了經(jīng)典的偏最小二乘回歸模型,其響應(yīng)變量是一組反應(yīng)統(tǒng)計(jì)單元間類別關(guān)系的分類信息,是一種有監(jiān)督的判別分析方法。因無監(jiān)督的分析方法(PCA)對(duì)所有樣本不加以區(qū)分,即每個(gè)樣本對(duì)模型有著同樣的貢獻(xiàn),因此,當(dāng)樣本的組間差異較大,而組內(nèi)差異較小時(shí),無監(jiān)督分析方法可以明顯區(qū)分組間差異;而當(dāng)樣本的組間差異不明晰,而組內(nèi)差異較大時(shí),無監(jiān)督分析方法難以發(fā)現(xiàn)和區(qū)分組間差異。另外,如果組間的差異較小,各組的樣本量相差較大,樣本量大的那組將會(huì)主導(dǎo)模型。有監(jiān)督的分析(PLS-DA)能夠很好的解決無監(jiān)督分析中遇到的這些問題。
圖6.PLS-DA分析
2.分型分析
分型分析,主要通過統(tǒng)計(jì)聚類的方法研究不同樣本菌群物種/功能結(jié)構(gòu)的分型情況。分型分析過程中一般不考慮環(huán)境因子等外部因素的影響。通過分型分析,可以將菌群物種/功能結(jié)構(gòu)相似的不同樣本聚為一類,主要適用于特定環(huán)境樣本的菌群/功能分型,如腸道型(enterotypes)、口腔分型等。通常根據(jù)菌群在所選分類水平上的相對(duì)豐度,計(jì)算 Jensen-Shannon Distance和PAM (Partitioning Around Medoids)進(jìn)行聚類,通過 Calinski-Harabasz (CH)指數(shù)計(jì)算最佳聚類 K 值,然后采用 Between-class analysis (BCA)或principal coordinates analysis (PCoA)進(jìn)行可視化。
圖7.分型分析
相關(guān)性分析
1.物種與功能貢獻(xiàn)度分析
根據(jù)樣本的物種、功能的對(duì)應(yīng)關(guān)系,進(jìn)行物種與功能相對(duì)豐度的關(guān)聯(lián)分析,可以得到特定物種的功能貢獻(xiàn)度、特定功能的物種貢獻(xiàn)度。該分析既可以指定kegg、eggNOG、GO、Pfam、CAZy、CARD、VFDB、PHI-base、P450數(shù)據(jù)庫的TOP/高豐度功能或代謝途徑主要存在于哪些物種,也可以分析TOP/高豐度物種的主要功能或代謝途徑。
圖8.功能對(duì)物種貢獻(xiàn)度圖
圖9.物種對(duì)功能貢獻(xiàn)度圖
2、普式分析(即將上線)
Procrustes分析(Procrustes Analysis,普魯克分析)是一種通過分析形狀分布,比較兩組數(shù)據(jù)一致性的方法。數(shù)學(xué)上來講,就是不斷迭代,尋找標(biāo)準(zhǔn)形狀(canonical shape),并利用最小二乘法尋找每個(gè)對(duì)象形狀到這個(gè)標(biāo)準(zhǔn)形狀的仿射變化方式。該過程也稱為最小二乘正交映射(least-squares orthogonal mapping)。Procrustes分析在面部幾何中廣泛應(yīng)用,例如人臉識(shí)別。這里通過Procrustes Analysis分析物種組成和環(huán)境屬性的潛在一致性。
圖10.普式分析
3、VPA方差分解分析(即將上線)
VPA(Variance partitioning analysis)方差分解分析,可用于定量評(píng)估兩組或多組(2~4組)環(huán)境因子變量對(duì)響應(yīng)變量(如物種、功能組成)的單獨(dú)解釋度和共同解釋度,常配合RDA/CCA使用。
分析軟件:R語言vegan包中vpa分析。
圖11.VPA方差分解分析
4、環(huán)境因子排序回歸分析(即將上線)
線性回歸(Linear Regression)分析是利用數(shù)理統(tǒng)計(jì)中的回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法,在微生態(tài)研究領(lǐng)域運(yùn)用十分廣泛?;跇颖緦?duì)應(yīng)的環(huán)境因子(pH、有機(jī)質(zhì)含量、碳氮比等)和物種/功能豐度數(shù)據(jù),分別對(duì)物種/功能的多樣性進(jìn)行計(jì)算,然后利用線性回歸模型,對(duì)樣本對(duì)應(yīng)的環(huán)境因子數(shù)據(jù)與物種/功能的多樣性數(shù)據(jù)進(jìn)行線性回歸分析,評(píng)估環(huán)境因子與物種/功能的多樣性的一致性。當(dāng)線性回歸決定系數(shù)R2較高時(shí),表明環(huán)境因子與物種/功能多樣性的一致性較高。
圖12.環(huán)境因子排序回歸分析
以上就是百邁客宏基因組分析平臺(tái)已上線和即將上線的個(gè)性化分析內(nèi)容,百邁客也將不斷持續(xù)更新分析流程,滿足您多樣化的分析需求,為您的科研之路提供更便捷的測(cè)序及生信分析服務(wù)。