2024年3月17日,凱里學院和貴州植物園在國際學術期刊Horticulture Research發(fā)表一項重要研究成果,題為:Chromosome-scale genome, together with transcriptome and metabolome, provides insights into the evolution and anthocyanin biosynthesis of?Rubus rosaefolius Sm.?(Rosaceae)。該研究通過基因組、轉錄組和代謝組的方法解析薔薇科空心藨進化和花青素合成機制。
文章標題:Chromosome-scale genome, together with transcriptome and metabolome, provides insights into the evolution and anthocyanin biosynthesis of?Rubus rosaefolius Sm.?(Rosaceae)
期刊名稱:Horticulture Research
影響因子:7.6
合作單位:凱里學院和貴州植物園
研究對象:薔薇科空心藨
研究方法:基因組、轉錄組和植物廣靶代謝組學等
百邁客生物為該研究提供了基因組、轉錄組和植物廣靶代謝組檢測和分析服務。
研究背景
薔薇屬(薔薇科)有12個亞屬,700余種,除南極洲外分布在世界各地。薔薇屬植物的組織,尤其是成熟的漿果,通常含有多種促進健康的化合物(如花青素、酚酸和類黃酮)和營養(yǎng)物質(如纖維素、維生素E和天然色素)。自古以來,它們就被用作藥物和水果。
空心藨(Rubus rosifolius Sm.)是一種天然生長在東亞、東南亞、南亞、大洋洲、非洲和馬達加斯加的紅色覆盆子??招乃懙闹?、葉、根長期以來被用于止咳、祛風、止血、濕。成熟的薔薇果實含有豐富的花青素、酚類物質、三萜、甾醇等生物活性成分。因此,它具有多種藥理作用,包括抗氧化、鎮(zhèn)痛、抗菌、防腐、抗增殖、抗癌、利尿、降壓等。此外,成熟的薔薇果實具有獨特的酸甜味道,顏色鮮艷,很有吸引力。綜上所述,薔薇是一種吸引人的野果,具有很高的商業(yè)價值,因此具有很大的馴化和栽培潛力。
實驗材料
該研究以貴州植物園覆盆子種質苗圃種植的一株薔薇為研究對象,進行了基因組、轉錄組和代謝組實驗。對幼葉進行基因組DNA提取分析。幼葉、幼莖、幼根、花萼、花瓣、雄蕊和3個幼果,發(fā)育天數分別為5、8和11天,三種著色漿果,分別發(fā)育14、17和19天,對發(fā)育21、23和25天的3個成熟果實進行RNA提取,進行轉錄組分析。同樣的漿果也被用來進行植物廣靶代謝組分析。
研究結果
1.基因組分析——基因組草圖組裝與注釋
該研究首先構建并測序了空心藨的短讀文庫(350 bp),獲得了59.76 Gb的數據和97.53%的合格reads (>Q20)。K-mer分析,估計空心藨基因組大小為220.50 Mb,重復率為33.31%,雜合度為1.64%。然后,構建空心藨長讀文庫并進行測序,組裝成241.76 Mb的基因組草圖,由141個連續(xù)序列(contigs)組成(N50 = 15.36 Mb)。最后,構建并測序了空心藨的Hi-C文庫,獲得了> 1.65億個讀對。
利用這些有效的互作讀對對初步的基因組草圖進行校正,得到了總共221.95 Mb的最終草圖,包含138個contigs (N50 = 16.13 Mb)。這些contigs進一步聚集成131個支架(N50 = 30.0 Mb)。70個支架共219.02 Mb,占總組裝序列的98.68%,占估計基因組大小的99.33%,錨定在7條假染色體上。其中,20個支架(211.23 Mb)的位置和方向被確定,占錨定序列的96.44%。通過blast of essential genes (CEG)數據庫和BUSCO數據庫來估計該草圖基因組的組裝完整性,共鑒定出458個CEG的456個同源物(99.56%)和1614個BUSCO的1590個同源物(98.51%)。這些結果表明,組裝的空心藨基因組草圖具有較高的完整性。綜合各組組或支架的組裝完整性、無間隙度、N50等指標,該研究組裝的草圖基因組超過了其他覆盆子物種。
從空心藨基因組組裝草圖中,通過從頭算預測、同源性預測和RNA-seq預測相結合,共鑒定出28067個蛋白編碼基因,在這些預測的基因中,1584個(98.14%)與BUSCOs(1614)同源,26173個(93.25%)可以被注釋為具有生物學或分子功能,這些帶注釋的轉座元件和蛋白質編碼基因不均勻地分布在紅花的染色體上(圖1)。從紅花草圖基因組中鑒定了1500多個RNA基因,主要是rRNA和tRNA基因,以及一些假基因。

圖1-基因組分析
2.基因組分析——薔薇與其他9種植物的系統(tǒng)發(fā)育關系及基因家族分析
為了研究空心藨的進化關系,該研究分析比較了玫瑰、黃連、鵝掌楸、水稻、擬南芥、月季、花薔薇、桃李、中國栗、西方栗的基因集數據。系統(tǒng)發(fā)育樹顯示,薔薇科出現(xiàn)在白堊紀,覆盆子出現(xiàn)在古近紀,空心藨和另一種紅覆盆子R. chingii在1728-3644萬年前(mya)從最近的共同祖先分化而來,隨后空心藨的211個基因家族和36個基因家族分別擴張和收縮(圖2),這些擴展家族中的基因主要富集于代謝途徑,如“DNA聚合酶”、“光合作用”、“晝夜節(jié)律”和“半乳糖代謝”。

圖2-基因組進化樹分析
3.基因組分析——基因組共線性分析和重復事件分析
所有的植物都有一個或遠或近的共同祖先。通過共線性分析發(fā)現(xiàn):在1號染色體的一端和其他6條染色體上,發(fā)現(xiàn)了完整且平行的同源物,但在1號染色體的另一端缺失了大同源塊(圖3a)。這些結果表明,空心藨和紅覆盆子之間沒有發(fā)生大的染色體變異,但在空心藨和紅覆盆子基因組草圖的組裝或注釋中隱藏了錯誤。該研究發(fā)現(xiàn),空心藨和紅覆盆子之間所有染色體的共線性幾乎是完整的(圖3b),這表明上述1號染色體的組裝或注釋錯誤可能在空心藨中沒有發(fā)生。當忽略單倍型中支架組裝方向的干擾時,1、2、3、5、7號染色體幾乎完全平行共線性,4號染色體可能發(fā)生較大反轉,6號染色體可能發(fā)生3次或更少的反轉(圖3b)。這些發(fā)現(xiàn)表明,隨著親緣關系距離的增加,復雜染色體變異的數量增加。
全基因組復制(WGD)分析發(fā)現(xiàn)。薔薇科其他成員與西方薔薇科同屬的共同祖先曾發(fā)生過WGD事件。

圖3-共線性分析?

圖4-重復事件分析
4.代謝組分析——漿果中花青素及其積累動態(tài)
已有研究表明,空心藨漿果中含有豐富的花青素,特別是矢車菊素和天竺葵素。該研究利用植物廣靶代謝組技術鑒定到1330種代謝物,包括121種氨基酸和衍生物、248種酚酸、241種黃酮類、78種生物堿和151種萜類和有機酸。在黃酮類化合物中,有17種花青素在9種不同時期的漿果中檢測到,幼齡期(N1)、著色期(N2)和成熟期(N3)分別有3個、3個和3個。在N1向N2(發(fā)育期)過渡期間,總花青素和大多數種類花青素的濃度保持相對穩(wěn)定,只有天竺葵素-3- O-葡萄糖苷、天竺葵素-3-木糖苷和天竺葵素-3-O -(6’’- O -丙二酰基)葡萄糖苷繼續(xù)增加(圖5),N2 ~ N3(發(fā)育階段)5種花青素(天竺葵素-3-O- (6 ’’-O-乙?;?糖苷和芍藥色素-3-O-糖苷)濃度保持相對穩(wěn)定,2種花青素(天竺葵素-3-O-蘆丁苷和飛燕草素- 3-O-(6’’-O-咖啡酰)糖苷)濃度略有下降,此外,總花青素和其他10種花青素均呈上升趨勢。8種(如天竺葵素-3- O -半乳糖苷和天竺葵素-3- O (6’’-O -乙?;?葡萄糖苷)略有增加,2種(天竺葵素-3- O -(6’’-O-丙二?;?葡萄糖苷)急劇增加(圖5),這些結果表明,空心藨花青素的產生主要發(fā)生在成熟階段,其主要貢獻物質是紅色色素天竺葵素3-O -葡萄糖苷和天竺葵素3- O -(6’’ -O-丙二?;??葡萄糖苷。

圖5-不同時期漿果花青素含量差異顯著
5.轉錄組分析——花青素生物合成相關的結構基因
轉錄組共鑒定出23997個基因在空心藨果實中不同水平表達。根據KEGG注釋,共鑒定出11個結構基因,其中花青素3-O-葡萄糖基轉移酶(RrBZ1)基因6個,分屬于5個家族,2個花青素3-O-葡萄糖苷2’’-O-木糖基轉移酶(RrUGT79B1)基因屬于一個家族,1個花青素3- O-葡萄糖苷5-O-葡萄糖基轉移酶(RrUGT75C1)基因和2個花青素3-O-葡萄糖苷6’-O-酰基轉移酶(Rr3AT)基因屬于兩個家族,參與了“花青素生物合成”途徑。此外,該研究還鑒定出22個結構基因,其中查爾酮異構酶(RrCHI)基因10個,屬于6個家族,5個查爾酮合成酶(RrCHS)基因,屬于4個家族,4個雙功能flavanol 4-還原酶/flavanone 4-還原酶(RrDFR)基因,分屬于3個家族,一個類黃酮3’-單加氧酶(RrCYP75B1)基因,一個柚皮素3-雙加氧酶(RrF3H)基因,和一個花青素合成酶(RrANS)基因,參與“類黃酮生物合成”,在花青素生物合成中起著至關重要的上游作用。在這33個結構基因中,Rro07G000520.1 (RrBZ1)、Rro04G036130.1 (RrBZ1)、Rro01G021400.1 (RrF3H)、Rro07G031240.1 (RrDFR)、Rro04G035990.1 (RrCHS)、Rro04G036130.1 (RrCHS)、Rro07G006550.1 (RrCHI)和Rro05G014010.1 (RrANS)在漿果組織中表達量相對較高(圖6)。該研究推測這8個基因是參與空心藨花青素生物合成的主要基因。共有33個結構基因在空心藨的花、葉和根組織中表達,但沒有一個在漿果中表達。這一發(fā)現(xiàn)表明,花青素代謝存在于空心藨的各個組織中,并不是單獨存在于果實中。

圖6-花青素生物合成相關結構基因的表達與調控
6.聯(lián)合分析——花青素生物合成的基因調控
為了探索空心藨紅漿果中花青素生物合成調控的分子機制,該研究對空心藨紅漿果幼齡期和成熟期的轉錄組和代謝組進行了相關性分析。在成熟漿果中發(fā)現(xiàn)的主要花青素——芍藥苷-3-O-葡萄糖苷和芍藥苷-3-O-(6’’-O-丙二酰基)葡萄糖苷被鑒定為顯著差異積累代謝產物(DAMs),其中11個結構基因被發(fā)現(xiàn)為差異表達基因(DEGs)。其中,Rro07G000520.1 (RrBZ1)、rro07g035990.1和rro07g036130.1 (RrCHS)、rro07g06550.1 (RrCHI)、rro07g021400.1 (RrF3H)、Rro07G031240.1 (RrDFR)和Rro05G014010.1 (RrANS)與芍藥苷-3-O-葡萄糖苷積累呈正相關,而Rro07g033620.1、Rro07g024760.1 (RrBZ1)、Rro07G009270.1 (RrUGT75C1)、Rro04G021540.1 (RrUGT79B1)與這兩種物質呈負相關(圖6b)。編碼屬于MYB、bHLH、AP2、bZIP、NAC和TCP家族轉錄因子的幾個DEGs的表達與上述一個或多個結構基因和兩個DEGs呈顯著正相關或負相關(圖6b)。這些發(fā)現(xiàn)表明轉錄因子廣泛參與了空心藨花青素生物合成的調控。通過蛋白-蛋白相互作用(PPI)分析,該研究發(fā)現(xiàn)Rro4G033620蛋白(RrBZ1)與三甲基鳥苷合成酶1 (RrTGS1)直接相互作用,Rro5G003920蛋白(RrBZ1)直接與鐵氧還蛋白C1 (RrFDX1)、CCAAT結合轉錄因子(RrNFYA)、谷氨酸合成酶1 (RrGLU1)和組蛋白樣轉錄因子(RrCBF/NF-Y)相互作用,Rro1G021400蛋白(RrF3H)直接與RrFDR和RrANR相互作用(圖6c)。上述結果表明,空心藨花青素的合成受RNA甲基化、結構基因編碼蛋白和轉錄因子的相互作用調控。
研究總結
該研究獲得了一個高質量的染色體水平基因組草圖,包含35.7%的重復序列和28067個蛋白質編碼基因。追蹤了薔薇科譜系特異性WGD事件,產生5090個目前可檢測的dgps,其中大多數進行了純化選擇??招乃懗墒旃麑嵒ㄇ嗨氐姆e累主要是由芍藥苷-3-O-葡萄糖苷和芍藥苷-3-O-(6’’-O-丙二?;?葡萄糖苷引起的。該研究發(fā)現(xiàn)了許多與花青素生物合成有關的結構基因,它們的表達可能受到轉錄因子和結構基因編碼的RNA甲基化和蛋白質相互作用等遺傳機制的調控。研究結果可為空心藨及其他薔薇屬植物的定向馴化和育種提供參考。