三年成全在线观看大全,中文字幕av一区二区,免费看的黄色视频,中文字幕无码在线
 分類: 醫(yī)學研究

還在為不知如何上傳GEO數(shù)據(jù)庫而發(fā)愁嗎?還在為不愿意看繁瑣的英文幫助而不知所措嗎?一篇帖子教你如何上傳GEO數(shù)據(jù)庫,建議收藏,再也不用愁“書到用時方恨少”了。

一、創(chuàng)建賬號

如果要上傳GEO數(shù)據(jù)庫,首先要創(chuàng)建NCBI帳號, 網(wǎng)址:

https://www.ncbi.nlm.nih.gov/geo/submitter/

登錄成功后,回到GEO的主頁,點擊 ?Submission Guidelines

二、數(shù)據(jù)準備

GEO數(shù)據(jù)庫支持上傳芯片數(shù)據(jù)、高通量數(shù)據(jù)以及RT-PCR數(shù)據(jù)等,首先選擇需要上傳數(shù)據(jù)的類型,接下來以high-throughput sequence submisssions (高通量測序)為例進行詳解。

點擊進去如下圖:

可以看見我們上傳數(shù)據(jù)需要準備三個文件,分別為:Metadata spreadsheet、Processed data files、Raw data files。下面分別介紹每個文件如何填寫以及準備。

1)Metadata spreadsheet文件

?? ? ?? 點擊下方鏈接下載該表格

該表格一共包括7個部分,以下將分別介紹如何填寫:

A、SERIES
主要包含文章的標題、概述、實驗整體設計、共同作者、補充材料和SAR號(SRA號為選填,如果已經(jīng)上傳了SRA,則填上,否則空著即可)

B、SAMPLE
樣品的詳細信息,包括樣品名稱、來源、器官、年齡、表達值數(shù)據(jù)和原始數(shù)據(jù)等

C、PROTOCOLS
樣品的實驗和提取建庫詳情

D、DATA PROCESSING PIPELINE
高通量數(shù)據(jù)的處理過程,主要包括堿基識別、比對、過濾、參考基因組、文件格式等

E、PROCESSED DATA FILES
基因表達量文件名稱、文件類型和MD5值(windows電腦可以使用MD5碼生成軟件,linux可以用md5sum file命令生成)

F、RAW FILES
原始數(shù)據(jù)文件名稱、格式、MD5碼、平臺類型、測序讀長和單雙端信息

G、PAIRED-ENDWEXPPERIMENTS
如果是雙末端數(shù)據(jù),需要填寫原始數(shù)據(jù)名稱、插入片段長度、標準偏差

2)、Processed data files文件

???? 基因表達量文件 ,如果沒有預測的新基因,文件只需要提供gene ID 和表達量如下:

如果表達量文件包含新預測的基因,還需要補充新基因(已知基因可選填)的Chromosome(染色體號)、Strand(正負鏈信息)、start(起始位置)、end(終止位置)、length(長度)。

3)、Raw data files文件

這里需要準備clean 數(shù)據(jù)的fq文件,通常情況下fq文件很大,因此GEO數(shù)據(jù)庫要求fq文件必須壓縮。

三、數(shù)據(jù)上傳

到這里準備工作就全部做完了,下面開始上傳數(shù)據(jù)

上傳數(shù)據(jù)有以上兩種途徑,小編比較推薦第一種,利用FileZilla軟件,下載地址點擊圖片的鏈接,打開FileZilla軟件,開始上傳數(shù)據(jù),主機(H) 框填寫上圖中host對應的內(nèi)容ftp-private.ncbi.nlm.nih.gov,用戶名(U)填寫geo,密碼填寫 33%9uyj_fCh?M16H,端口號可不填,全部填好后,點擊快速連接按鈕

連接成功后,在遠程站點下的文件名展示中創(chuàng)建自己的文件,在fasp目錄下面創(chuàng)建自己的目錄(當然也可以與fasp目錄同級下創(chuàng)建),例如ABC,創(chuàng)建方法為點擊鼠標右鍵,會出現(xiàn)下圖中的創(chuàng)建空文件夾對話框,輸入自己文件夾的命名,之后點擊確認,這樣你的文件夾就創(chuàng)建成功了。

最后在本地站點中找到您要上傳的文件,雙擊就可以將文件上傳到您在GEO創(chuàng)建的路徑下了,數(shù)據(jù)上傳一般會比較慢。數(shù)據(jù)全部上傳后,需要給GEO發(fā)郵件,點擊下方的鏈接。

郵件內(nèi)容可以參考下方:

郵件主題:Submitting high-throughput sequence data to GEO郵件正文:Dear sir,
We had finished the raw data uploading .Please check according to the following? information :
GEO account username:? GEO帳號
Names of the directory and files deposited: ABC(存放數(shù)據(jù)的路徑)
Public release date :數(shù)據(jù)釋放日期
Our raw files were named as follows:
XXX.fq.gz
Our Processed data files were named as follows:
XXX.txt
and Metadata spreadsheet were named as follows: Metadata_spreadsheet.xlsThank you again for your time!
一般GEO第二天就會給您回復郵件,告知您具體的GEO號。
最近文章