隨著測序行業(yè)的飛速發(fā)展,探究影響表型變化的因素的產(chǎn)品層出不窮,不管是從DNA水平還是RNA水平,還是現(xiàn)在火熱的代謝物水平,都有各自的組學(xué)研究系統(tǒng),這些組學(xué)之間的關(guān)系就像一條從上到下的河流,DNA水平的基因組學(xué)處于最上游,決定了河流的開始和基本屬性,好比不同的物種都有特定的基因序列特征,并且是相對保守的。但是河流的上游無法決定河流下游的去向,就像基因不能完全決定最后的表型。因?yàn)榛蚝竺孢€有表觀遺傳修飾,還有轉(zhuǎn)錄,翻譯,環(huán)境的影響,并且這些改變和影響最終都會(huì)體現(xiàn)在代謝物的差異上。所以我們可以看出,單一組學(xué)的數(shù)據(jù)難以系統(tǒng)全面地解析復(fù)雜生理過程的調(diào)控機(jī)制,多組學(xué)聯(lián)合分析可以共同探究生物體內(nèi)潛在的調(diào)控網(wǎng)絡(luò)機(jī)制,為生物體作用機(jī)制提供了更多證據(jù)。當(dāng)然,除了基因發(fā)生突變,會(huì)直接影響代謝物水平和表型,環(huán)境的影響也會(huì)體現(xiàn)在表型和代謝物水平上,比如根際微生物和植物的互作作用,腸道微生物對于宿主的影響等等。
中心法則是遺傳的基礎(chǔ),在中心法則中,RNA處于重要的中央樞紐地位,轉(zhuǎn)錄組作為生信科研中的“萬金油”,最大的特點(diǎn)就是“短平快”,是功能基因的研究利器,是利用率最高,最成熟的測序手段,在多組學(xué)聯(lián)合中扮演中重要的角色。代謝組是表型的直接體現(xiàn)者,“代謝組+ ”研究模式已經(jīng)在多個(gè)領(lǐng)域廣泛使用,成為深入研究科學(xué)問題,系統(tǒng)闡釋作用機(jī)制的利器。以下就是常見的基于這兩個(gè)組學(xué)的聯(lián)合分析策略。
今天主要先從轉(zhuǎn)錄組+代謝組方向進(jìn)行聯(lián)合分析內(nèi)容的說明。
mRNA+代謝組
轉(zhuǎn)錄組測序可以得到大量差異基因、眾多調(diào)控網(wǎng)絡(luò)。難以確定關(guān)鍵途徑,也無法鑒定控制關(guān)鍵途徑的結(jié)構(gòu),而代謝物是生命活動(dòng)最終的體現(xiàn)者,表型性狀的微小變化在代謝水平會(huì)呈指數(shù)放大,可以利用代謝組來反映表型的狀態(tài)變化,但是單獨(dú)代謝組檢測,無法解釋影響表型的基因機(jī)理。轉(zhuǎn)錄本水平的基因變化是否真的是決定表型變化的關(guān)鍵基因?這個(gè)問題需要通過轉(zhuǎn)錄組和代謝組的聯(lián)合分析進(jìn)行回答。
轉(zhuǎn)錄組+代謝組的多組學(xué)分析,可以同時(shí)實(shí)現(xiàn)從“因”和“果”兩個(gè)層面來探究生物學(xué)問題,相互間進(jìn)行驗(yàn)證,從海量的數(shù)據(jù)中篩選出關(guān)鍵基因、代謝物及代謝通路,深度解析生物系統(tǒng)的宏觀發(fā)育過程,解釋生物過程的復(fù)雜性和整體性,提高文章的水平。
樣本準(zhǔn)備
轉(zhuǎn)錄組和代謝組的聯(lián)合分析通常為一份材料同時(shí)送測兩個(gè)組學(xué),這樣對于樣本量準(zhǔn)備會(huì)有更高的要求,普通轉(zhuǎn)錄組推薦準(zhǔn)備有三個(gè)生物學(xué)重復(fù),而代謝組的要求更高,需推薦單樣本有六個(gè)生物學(xué)重復(fù),生物學(xué)重復(fù)不僅能夠消除組內(nèi)誤差、作為實(shí)驗(yàn)設(shè)計(jì)質(zhì)控點(diǎn)用于判斷實(shí)驗(yàn)設(shè)計(jì)過程是否異常、檢測離群樣本有效規(guī)避實(shí)驗(yàn)失敗的風(fēng)險(xiǎn),更重要的是可以增強(qiáng)結(jié)果的可靠性,嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)更容易發(fā)表高分文章。(特別對于臨床研究的項(xiàng)目,由于研究的對象有復(fù)雜的遺傳背景,生活方式,個(gè)體年齡性別體質(zhì)等等,導(dǎo)致難以實(shí)現(xiàn)背景一致性的樣本,所以更要通過生物學(xué)重復(fù)的設(shè)置來降低樣本間的背景差異造成的影響。)
分析思路
轉(zhuǎn)錄組通過標(biāo)準(zhǔn)分析流程得到差異表達(dá)基因功能富集等分析結(jié)果,代謝組根據(jù)不同的產(chǎn)品類型,可以鑒定得到樣本中表達(dá)的代謝物,并分析得到差異代謝物及代謝通路富集結(jié)果。將差異基因和差異代謝物在KEGG上共富集的基因和代謝物進(jìn)行聯(lián)合分析,并計(jì)算差異基因和差異代謝物的相關(guān)性,構(gòu)建相關(guān)性網(wǎng)絡(luò),可以找出引起代謝物發(fā)生變化的關(guān)鍵作用基因,確定關(guān)鍵的調(diào)控通路。
分析內(nèi)容
代謝與轉(zhuǎn)錄組聯(lián)合分析是基于兩個(gè)組學(xué)各自的標(biāo)準(zhǔn)分析結(jié)果,將差異代謝物和差異基因在代謝通路上的注釋結(jié)果進(jìn)行關(guān)聯(lián)分析,可以在代謝通路上更好地解釋轉(zhuǎn)錄調(diào)控機(jī)制。常規(guī)的聯(lián)合分析內(nèi)容主要包括代謝組和轉(zhuǎn)錄組KEGG通路分析、KEGG共富集分析、相關(guān)性分析、差異基因和差異代謝物趨勢分析、典型相關(guān)性分析、限制性對應(yīng)分析等內(nèi)容。
一、代謝組和轉(zhuǎn)錄組KEGG通路分析
差異代謝物分析結(jié)果結(jié)合轉(zhuǎn)錄組差異基因分析結(jié)果,將相同分組的差異基因及差異代謝物同時(shí)映射到KEGG通路圖上,用綠色和紅色標(biāo)注基因或代謝物表達(dá)量顯著下調(diào)或上調(diào)的節(jié)點(diǎn),藍(lán)色標(biāo)注既有上調(diào)又有下調(diào)的基因,更好的了解基因與代謝物之間的關(guān)系。
二、KEGG共富集分析
進(jìn)行KEGG注釋時(shí),差異代謝物與差異基因同時(shí)注釋的通路往往有很多。這種情況下,挑選基因和代謝的通路富集系數(shù)pvalue<0.05優(yōu)先進(jìn)行分析,這樣可以節(jié)約篩選數(shù)據(jù)的時(shí)間,快速找到與研究目的相關(guān)的通路進(jìn)行后續(xù)分析。
三、基因與代謝物相關(guān)性分析
將不同差異分組基于皮爾遜相關(guān)性(pearson)方法計(jì)算所有基因和代謝物之間的相關(guān)性,然后按照相關(guān)性系數(shù)(Correlation Coefficient,CC)和相關(guān)性的pvalue篩選表達(dá)相關(guān)性較高的基因和代謝物。并利用九象限圖對于篩選后的基因和代謝物的表達(dá)趨勢進(jìn)行分析,例如基因和代謝物表達(dá)趨勢一致或相反,表明基因可能是正向或者負(fù)向調(diào)控代謝物,或者基因/代謝物表達(dá)發(fā)生變化,但是對應(yīng)的代謝物/基因表達(dá)不變,則說明還有其他的調(diào)控機(jī)制參與到整個(gè)代謝通路中。
四、差異基因和差異代謝物趨勢分析
將各個(gè)分組對差異代謝物和差異基因分別用Kmeans進(jìn)行分類,然后按分類進(jìn)行繪圖,可找到變化趨勢一致代謝物和基因,這些趨勢一致代謝物和基因之間可能存在一定的關(guān)系,為研究提供了一定的方向。
五、相關(guān)性網(wǎng)絡(luò)圖
按通路選取經(jīng)過相關(guān)性篩選的差異基因和差異代謝物繪制網(wǎng)絡(luò)圖,通過網(wǎng)絡(luò)圖來可直觀的表示代謝物和基因之間的關(guān)系。
六、典型相關(guān)分析
典型相關(guān)分析(canonical correlation analysis, CCA),是利用綜合變量對之間的相關(guān)關(guān)系來反映兩組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。對相關(guān)性網(wǎng)絡(luò)圖中的差異基因及差異代謝物進(jìn)行典型相關(guān)分析,圖中以十字區(qū)分出四個(gè)區(qū)域,在同一個(gè)區(qū)域內(nèi),距原點(diǎn)越遠(yuǎn)關(guān)聯(lián)性越高,在同一個(gè)象限內(nèi)距離較近的代謝物和基因之間相關(guān)聯(lián)的程度高,基于此結(jié)果可進(jìn)一步挖掘和代謝物最相關(guān)的基因。
七、 限制性對應(yīng)分析
對應(yīng)分析(Correspondence Analysis)也稱關(guān)聯(lián)分析,是一種多元統(tǒng)計(jì)分析技術(shù),通過分析由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對應(yīng)關(guān)系。對通路中的差異代謝物和差異基因進(jìn)行限制性對應(yīng)分析可直觀展示他們之間的關(guān)聯(lián)關(guān)系。
以上就是轉(zhuǎn)錄組和代謝組聯(lián)合分析的主要內(nèi)容,由于生物過程具有復(fù)雜性和整體性,多種物質(zhì)共同影響生命系統(tǒng)的表型和性狀,例如環(huán)境、基因、mRNA、調(diào)控因子、蛋白、代謝等,這些組學(xué)之間,既相互獨(dú)立,又互相影響,既有很大的差別,又有相似之處。多種多樣的組學(xué)聯(lián)合分析將不同層面之間信息進(jìn)行整合,從不同的組學(xué)角度共同探究生物體內(nèi)潛在的調(diào)控網(wǎng)絡(luò)機(jī)制,深層次理解各個(gè)分子之間的調(diào)控及因果關(guān)系,從而更深入的認(rèn)識生物進(jìn)程和疾病過程中復(fù)雜性狀的分子機(jī)理和遺傳基礎(chǔ),后續(xù)我們還將推出其他常見的組學(xué)聯(lián)合分析內(nèi)容的介紹,敬請期待。
百邁客生物科技致力于多組學(xué)聯(lián)合分析的組學(xué)研究內(nèi)容,現(xiàn)已經(jīng)有非常成熟的基因組、轉(zhuǎn)錄組、代謝組、蛋白組、非編碼RNA之間的聯(lián)合分析方案及分析流程,協(xié)助客戶發(fā)表幾百篇高分文章,現(xiàn)在您可以點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費(fèi)為您設(shè)計(jì)文章研究思路方案。