本期小編為各位介紹ONT全長(zhǎng)轉(zhuǎn)錄組測(cè)序應(yīng)用于聽(tīng)覺(jué)相關(guān)細(xì)胞isoform分析案例。
材料方法
單細(xì)胞RNA測(cè)序是一種強(qiáng)有力的工具,通過(guò)它可以表征低豐度細(xì)胞類型的轉(zhuǎn)錄特征,但它在內(nèi)耳的應(yīng)用受到了骨迷路、感覺(jué)細(xì)胞在組織分布稀疏和難以分離膜性耳蝸超稀少細(xì)胞的困難。
1、從p15、p30、p70和p228雄性和雌性C3-Heb/FeJ小鼠(Mus?musculus)收獲耳蝸組織,倒置顯微鏡下鑒定并使用顯微操作吸管法分離目的細(xì)胞:IHCs、OHCs和Deiters細(xì)胞(Deiters’?cells,DCs)。(內(nèi)毛細(xì)胞(inner?hair?cells,IHCs)和外毛細(xì)胞(outlier?hair?cells,OHCs);Deiters細(xì)胞是哺乳動(dòng)物耳蝸內(nèi)的一種支持細(xì)胞,與外毛細(xì)胞(OHC)的關(guān)系非常密切。)
2、SmartSeq2單細(xì)胞擴(kuò)增,IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39)進(jìn)行二代Illumina平臺(tái)轉(zhuǎn)錄組測(cè)序;12個(gè)p15小鼠OHCs進(jìn)行ONT全長(zhǎng)轉(zhuǎn)錄組測(cè)序。
研究結(jié)果
1、耳蝸非感覺(jué)細(xì)胞豐度估計(jì)與單細(xì)胞分離
與哺乳動(dòng)物耳蝸中的各種支持細(xì)胞類型相比,聽(tīng)覺(jué)HC的豐度較低。為了估計(jì)小鼠耳蝸膜迷路中可用于單細(xì)胞分離的HC數(shù)量,據(jù)報(bào)道在成熟的小鼠耳蝸中約765個(gè)IHCs,通過(guò)對(duì)小鼠顳骨中心切片,細(xì)胞核計(jì)數(shù),估計(jì)小鼠膜性迷路中的細(xì)胞數(shù)為415,395,其中IHC和OHC比例僅為0.19%和0.59%。
為了研究占比極低的目的細(xì)胞,作者進(jìn)行了細(xì)胞分離,詳細(xì)方法見(jiàn)文章。本研究主要關(guān)注具有明顯不同形態(tài)特征的IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39),同時(shí)他們來(lái)自于不同發(fā)育時(shí)期:p15(過(guò)濾后n=132)、p30(n=6)、p70(n=54)和p228(n=6)。該設(shè)計(jì)有利于時(shí)間和tono-topic差異表達(dá)分析。(聽(tīng)覺(jué)系統(tǒng)對(duì)語(yǔ)音的基本表達(dá)方式是“音調(diào)拓?fù)涞摹?tono-topic),即基底膜及毛細(xì)胞都具有頻率選擇及分解作用,可以把進(jìn)入耳蝸的聲波分解為一組不同的頻率成分,或者說(shuō)用這組頻率成分來(lái)表達(dá)原聲波信號(hào)。)
2、質(zhì)控、無(wú)偏聚類及表達(dá)譜分析
去除有表達(dá)的基因(count值>0的)少于2000個(gè)的細(xì)胞,接下來(lái)進(jìn)行主成分分析PCA分析和tSNE聚類分析。由于在所有細(xì)胞類型中Top?100高表達(dá)基因表達(dá)水平不一致,去除了7個(gè)細(xì)胞數(shù)據(jù);由于未與形態(tài)學(xué)分組聚類到一起,去除3個(gè)細(xì)胞數(shù)據(jù)。剩余的一組高質(zhì)量細(xì)胞數(shù)據(jù),在每個(gè)細(xì)胞轉(zhuǎn)錄組的總reads中含有低百分比的線粒體轉(zhuǎn)錄本,這是值得注意的,因?yàn)槊總€(gè)細(xì)胞線粒體reads數(shù)百分比增加表明細(xì)胞死亡增加。
使用Seurat進(jìn)行基于主成分1和2的無(wú)偏差聚類(圖1E)。得到的tSNE?clusters顯示IHC、OHC和DC分離明顯,形成與其形態(tài)學(xué)分組一致的無(wú)偏細(xì)胞特異性組(圖1F)。為了鑒定每種細(xì)胞類型的特征性表達(dá)模式,在AUC分類器下為每種細(xì)胞類型提取了前100個(gè)cluster定義基因(圖1G)。
為了比較細(xì)胞類型之間表達(dá)譜,計(jì)算各cluster內(nèi)所有細(xì)胞中每個(gè)基因平均表達(dá)水平。通過(guò)維恩圖對(duì)平均表達(dá)譜比較,每種細(xì)胞類型約表達(dá)700個(gè)特異基因(OHC-753;?IHC-655;?DC-713;歸一化后counts>10)。且發(fā)現(xiàn)IHCs和DC具有高比例重疊(共享750個(gè)基因,與OHC和DC共享564個(gè)基因相比),但是IHC和OHC共享771個(gè)基因表達(dá)(圖2A)。為了更嚴(yán)格地測(cè)試每種細(xì)胞類型的轉(zhuǎn)錄相似性,使用所有基因進(jìn)行Pearson相關(guān)和R2回歸分析?;貧w分析,所有3組間比較中發(fā)現(xiàn)了強(qiáng)相關(guān)性,OHCs和IHC之間的相關(guān)性最高,OHCs和DC之間的相關(guān)性最低。OHC和DC表達(dá)譜最不相似可能反映了OHC高水平特化(圖2B)。
為了定義每種細(xì)胞類型的特征性表達(dá)譜,通過(guò)cluster內(nèi)各個(gè)細(xì)胞的標(biāo)準(zhǔn)化表達(dá)水平對(duì)所有基因進(jìn)行排序。每種細(xì)胞類型的表達(dá)譜通過(guò)少量高表達(dá)基因(對(duì)數(shù)平均表達(dá)水平在2和7之間)和大量低表達(dá)基因(對(duì)數(shù)平均表達(dá)水平<2)來(lái)表征(圖2C,2E和2G)。在按細(xì)胞類型排名前50的最高表達(dá)基因中,一些基因,如Fbxo2和Skpa1,在所有3種細(xì)胞類型中高度表達(dá);而其他基因,如Ocm和Fgfr3,主要僅在一種細(xì)胞類型中表達(dá)。使用AUC排序,提取每組的cluster定義基因以鑒定特定細(xì)胞類型特異性marker基因(圖2D,2F和2H)。前10個(gè)cluter定義基因的小提琴圖揭示了眾所周知的marker基因OHC(Ocm和Slc26a5)、IHC(Otof和Atp2a3)和DC(Bace2和Ceacam16)??梢酝ㄟ^(guò)scRNA-Seq瀏覽器工具(Web資源:https://morlscrnaseq.org/)訪問(wèn)小提琴圖對(duì)應(yīng)的完整基因列表。
3、差異表達(dá)分析
已知細(xì)胞類型marker基因高度差異表達(dá),例如prestin(Slc26a5),其在OHCs中穩(wěn)健且差異表達(dá)。與公布的OHC和IHC轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行比較,搜索具有不一致排名的基因,假設(shè)通過(guò)AUC而不是表達(dá)水平對(duì)基因進(jìn)行排序?qū)⒃诟鼜V泛的表達(dá)水平上鑒定細(xì)胞類型定義基因。按AUC分類排名時(shí),兩個(gè)鈣相關(guān)基因Ocm和Sri在OHC定義基因列表中排名第一,甚至超過(guò)Slc26a5,排名第三(上圖2F)。先前已在OHC中報(bào)道了Ocm的表達(dá)。編碼蛋白質(zhì)oncomodulin(癌調(diào)蛋白)是鈣結(jié)合蛋白家族成員之一,它是耳蝸聽(tīng)力擴(kuò)增所必需的。Sri編碼sorcin(可溶性耐藥相關(guān)鈣結(jié)合蛋白),一種在心肌細(xì)胞中表達(dá)的蛋白質(zhì),是鈣介導(dǎo)的興奮-收縮偶聯(lián)所必需的,通過(guò)抑制Ryr通道(Ca2+釋放通道/RyR受體)進(jìn)行鈣離子介導(dǎo)的鈣離子釋放?(CICR)。在肌細(xì)胞中,Ryr通道介導(dǎo)CICR,能夠從肌質(zhì)網(wǎng)中快速釋放Ca2+離子,從而產(chǎn)生對(duì)于肌肉收縮必不可少的時(shí)空限制性鈣火花。
免疫熒光僅將sorcin僅定位于OHC(圖3A,3B),假設(shè)類似的機(jī)制可以調(diào)節(jié)基于prestin的運(yùn)動(dòng)(圖3C和3D,動(dòng)力蛋白?Prestin是一種高度專業(yè)化的蛋白質(zhì),可以起到驅(qū)動(dòng)耳蝸中外部毛細(xì)胞的作用,使耳蝸可以讓人們和動(dòng)物聽(tīng)到聲音)。與此可能性一致,作者確定了在OHCs中表達(dá)sorcin介導(dǎo)的興奮-收縮途徑的基本組分,包括(1)電壓門控鈣釋放通道,(2)促進(jìn)CICR的通道,(3)終止CICR的機(jī)制(sorcin),和(4)鈣泵使釋放的Ca2+返回Ca2+儲(chǔ)庫(kù)(圖3E)。本數(shù)據(jù)集和他人數(shù)據(jù)集中檢測(cè)到的第一個(gè)組分是耳聾基因Cacna1d,一種在OHCs中高表達(dá)的電壓門控鈣釋放通道,參與心動(dòng)過(guò)緩有關(guān)的綜合征性耳聾;第二個(gè)組分,即促進(jìn)CICR的通道,包括Ryr1、Ryr2和Ryr3。在通過(guò)Ryr通道誘導(dǎo)CICR后,sorcin的作用可能是通過(guò)在Ca2+存在下阻斷Ryr受體來(lái)快速終止CICR,這是先前在心肌細(xì)胞中報(bào)道的途徑。已知定位于OHC表面下池的Ca2+?ATP酶泵可從細(xì)胞溶質(zhì)中除去Ca2+。附著蛋白質(zhì)(Ocm)等結(jié)合并緩沖Ca2?+的輔助蛋白質(zhì)可能有助于這一過(guò)程。
4、轉(zhuǎn)錄本結(jié)構(gòu)分析
大多數(shù)耳聾相關(guān)基因在IHC和OHC中表達(dá),但它們?cè)谶@些細(xì)胞中的isoform結(jié)構(gòu)仍未得到很好的解析。SmartSeq2單細(xì)胞轉(zhuǎn)錄組測(cè)序,可克服細(xì)胞異質(zhì)性和低豐度表達(dá),以定義聽(tīng)覺(jué)HC中的基因產(chǎn)物結(jié)構(gòu),比如可變剪切。小鼠Myo15中檢測(cè)到已報(bào)道的3個(gè)事件:(1)可變轉(zhuǎn)錄起始位點(diǎn)TSS事件:mm10?chr11:60,480,418-60,480,621;(2)位于chr11的6bp外顯子:60,486,893-60,486,898;(3)剪接受體位點(diǎn)導(dǎo)致在位置chr11:60,497,434-60,497,576的提前終止。另外,檢測(cè)到3個(gè)新的未報(bào)道注釋的features:包括未報(bào)道的OHC特異性可變剪接受體位點(diǎn)(chr11:60,483,616-60,483,806),其中包含移碼和提前終止,表明可能的功能作為調(diào)控元件,與報(bào)道位于chr11位置的剪接受體位點(diǎn):60,497,434-60,497,576類似,以及位于chr11的剪接位點(diǎn):3’UTR中的剪切位點(diǎn):60,527,450-60,527,710。
鑒定孟德?tīng)柖@的基因中未注釋的feature,在12個(gè)聽(tīng)力喪失基因中鑒定出20個(gè)高度保守的未注釋外顯子(表1;圖4和5)。鑒定的編碼和非UTR含有外顯子的平均大小為55bp,這些外顯子位于小鼠外顯子的最小十分位數(shù)中(33%的小鼠外顯子<100bp;?6.9%<50bp)。
5、全長(zhǎng)isoform鑒定
為了解決全長(zhǎng)isoform結(jié)構(gòu),進(jìn)行了ONT全長(zhǎng)轉(zhuǎn)錄組測(cè)序,并使用Illumina短reads序列數(shù)據(jù)作為確認(rèn)的scaffold,用于nonopore長(zhǎng)讀長(zhǎng)數(shù)據(jù)比對(duì)。與150-800bp片段大小的Illumina?reads不同,Nanopore測(cè)序不需要片段化文庫(kù),并且可以產(chǎn)生跨越mRNA轉(zhuǎn)錄本長(zhǎng)度的單一reads(圖6A和6B)。對(duì)p15時(shí)間點(diǎn)的12個(gè)OHC細(xì)胞加barcaod以在4個(gè)MinION?R9.4?flow?cell上測(cè)序所有樣品,同時(shí)保持單細(xì)胞分辨率(圖6A)。因?yàn)镺HCs是最多和最差異的Illumina數(shù)據(jù)集,這有助于跨平臺(tái)比較以驗(yàn)證長(zhǎng)reads和isoform定量。
長(zhǎng)讀長(zhǎng)ONT全長(zhǎng)數(shù)據(jù)顯示出驚人的isoform異質(zhì)性。例如,檢測(cè)到445個(gè)reads比對(duì)到耳聾相關(guān)基因Cabp2。通過(guò)Mandalorion?pipeline鑒定了14種不同isoform。但當(dāng)高度相似的isoform?configurations(構(gòu)型)組合去冗余時(shí),該數(shù)量下降至5(圖6B)。通過(guò)量化每種isoform的豐度,在每個(gè)單獨(dú)的細(xì)胞和更廣泛的OHC組中鑒定了主要的isoform configurations(構(gòu)型)(圖6C-6E)。最常檢測(cè)到和大量表達(dá)的configurations是isoform1。查詢了公開(kāi)可用的鼠注釋數(shù)據(jù)庫(kù)(RefSeq,GenBank,GENCODE和UCSC基因)和數(shù)據(jù)集(來(lái)自GenBank和UCSC基因組瀏覽器的mRNA),但未發(fā)現(xiàn)該isoform的注釋。除了它在小鼠中的缺失外,還無(wú)法在RefSeq,GenBank,GENCODE和UCSC人類數(shù)據(jù)庫(kù)中鑒定出與isoform1結(jié)構(gòu)上直系同源的轉(zhuǎn)錄本。
小結(jié)
Highlight
-
單細(xì)胞RNA-seq可鑒定內(nèi)毛細(xì)胞(inner?hair?cells,IHCs)和外毛細(xì)胞(outlier?hair?cells,OHCs)定義基因;
-
Sorcin是心臟興奮-收縮的關(guān)鍵因子,是OHCs的top?marker基因;
-
對(duì)耳聾相關(guān)基因的分析鑒定了迄今未被識(shí)別的外顯子;
-
Nanopore長(zhǎng)讀長(zhǎng)RNA-seq(全長(zhǎng)轉(zhuǎn)錄組測(cè)序)揭示剪接多樣性和isoform豐度。
參考文獻(xiàn):Ranum?P?T,?Goodwin?A?T,?Yoshimura?H,? et?al.?Insights?into?the?Biology?of?Hearing?and?Deafness?Revealed?by? Single-Cell?RNA?Sequencing[J].?Cell?reports,?2019,?26(11):?3160-3171.? e3.