還在為不知如何上傳GEO數(shù)據(jù)庫而發(fā)愁嗎?還在為不愿意看繁瑣的英文幫助而不知所措嗎?一篇帖子教你如何上傳GEO數(shù)據(jù)庫,建議收藏,再也不用愁“書到用時方恨少”了。
一、創(chuàng)建賬號
如果要上傳GEO數(shù)據(jù)庫,首先要創(chuàng)建NCBI帳號, 網(wǎng)址:
https://www.ncbi.nlm.nih.gov/geo/submitter/
登錄成功后,回到GEO的主頁,點擊 ?Submission Guidelines

二、數(shù)據(jù)準備
GEO數(shù)據(jù)庫支持上傳芯片數(shù)據(jù)、高通量數(shù)據(jù)以及RT-PCR數(shù)據(jù)等,首先選擇需要上傳數(shù)據(jù)的類型,接下來以high-throughput sequence submisssions (高通量測序)為例進行詳解。
點擊進去如下圖:
可以看見我們上傳數(shù)據(jù)需要準備三個文件,分別為:Metadata spreadsheet、Processed data files、Raw data files。下面分別介紹每個文件如何填寫以及準備。
?? ? ?? 點擊下方鏈接下載該表格
該表格一共包括7個部分,以下將分別介紹如何填寫:






???? 基因表達量文件 ,如果沒有預測的新基因,文件只需要提供gene ID 和表達量如下:
如果表達量文件包含新預測的基因,還需要補充新基因(已知基因可選填)的Chromosome(染色體號)、Strand(正負鏈信息)、start(起始位置)、end(終止位置)、length(長度)。

這里需要準備clean 數(shù)據(jù)的fq文件,通常情況下fq文件很大,因此GEO數(shù)據(jù)庫要求fq文件必須壓縮。
三、數(shù)據(jù)上傳
到這里準備工作就全部做完了,下面開始上傳數(shù)據(jù)
上傳數(shù)據(jù)有以上兩種途徑,小編比較推薦第一種,利用FileZilla軟件,下載地址點擊圖片的鏈接,打開FileZilla軟件,開始上傳數(shù)據(jù),主機(H) 框填寫上圖中host對應的內(nèi)容ftp-private.ncbi.nlm.nih.gov,用戶名(U)填寫geo,密碼填寫 33%9uyj_fCh?M16H,端口號可不填,全部填好后,點擊快速連接按鈕
連接成功后,在遠程站點下的文件名展示中創(chuàng)建自己的文件,在fasp目錄下面創(chuàng)建自己的目錄(當然也可以與fasp目錄同級下創(chuàng)建),例如ABC,創(chuàng)建方法為點擊鼠標右鍵,會出現(xiàn)下圖中的創(chuàng)建空文件夾對話框,輸入自己文件夾的命名,之后點擊確認,這樣你的文件夾就創(chuàng)建成功了。
最后在本地站點中找到您要上傳的文件,雙擊就可以將文件上傳到您在GEO創(chuàng)建的路徑下了,數(shù)據(jù)上傳一般會比較慢。數(shù)據(jù)全部上傳后,需要給GEO發(fā)郵件,點擊下方的鏈接。
郵件內(nèi)容可以參考下方:
We had finished the raw data uploading .Please check according to the following? information :
GEO account username:? GEO帳號
Names of the directory and files deposited: ABC(存放數(shù)據(jù)的路徑)
Public release date :數(shù)據(jù)釋放日期
Our raw files were named as follows:
XXX.fq.gz
Our Processed data files were named as follows:
XXX.txt
and Metadata spreadsheet were named as follows: Metadata_spreadsheet.xlsThank you again for your time!