生物科學(xué)研究測序數(shù)據(jù)呈指數(shù)級別增長,如何從大量數(shù)據(jù)中挖掘其所包含的生物學(xué)意義?通常我們從公司拿到的測序數(shù)據(jù)或者項(xiàng)目報(bào)告,由于序列文件或表格文件比較龐大,在windows電腦Excel打開比較耗時(shí),甚至無法顯示完全。linux命令可以幫助大家來解決這類的問題,windows電腦也可以安裝“git”來進(jìn)入命令行操作界面,打開目錄和查看文件。
在實(shí)際運(yùn)用過程中,我們通常根據(jù)需要,通過管道符“|”同時(shí)使用好幾種生物信息學(xué)Linux命令,避免花費(fèi)大量時(shí)間找軟件、寫代碼,有些情況下可以代替Excel等辦公軟件。如下就是一些linux命令的高級使用實(shí)例。如下是一個(gè)宏基因組的NR注釋結(jié)果示例文件:




文件和目錄管理
1.1管理目錄
語法:cd <dirname>
實(shí)例:cd /path/dirname #切換到指定的/path/dirname目錄
cd ~ #切換到家目錄
cd ../ #切換到上一層目錄
cd / #切換到根目錄
命令說明:ls和ll都可以列出目錄下的文件、子目錄。ls只列出文件名或目錄名。而ll是ls -l的別名,會列出該目錄下的文件或目錄的詳細(xì)信息。
語法:ls [-alrtAFR] <dirname/filename>
常用參數(shù):-l 除文件名外,列出文件類型、權(quán)限、所有者、大小等詳細(xì)信息。
-h 文件大小的單位由字節(jié)Byte,變換為“K”、“M”、“G”、“T”(需要與-l同時(shí)使用)。
-a 顯示“.”開頭的隱藏文件。
-t 文件按照時(shí)間順序,越新的越前面。
命令說明:創(chuàng)建文件夾(目錄)。
語法:mkdir [-p] <dirname>
常用參數(shù):-p 如果需要創(chuàng)建目錄的父目錄(上層目錄)不存在,就一并創(chuàng)建父目錄。
實(shí)例:mkdir -p /new_dirname/test_dir #創(chuàng)建目錄/new_dirname/test_dir(當(dāng)new_dirname不存在的時(shí)候,一并創(chuàng)建)。
命令說明:顯示當(dāng)前工作目錄的絕對路徑。含有“.”、“..”和“~”等的路徑為相對路徑,只由目錄名稱和“/”組成的為絕對路徑。
語法:pwd
1.2處理文件
創(chuàng)建文件
1.?touch
2.?vi
文件的復(fù)制、移動、鏈接、刪除
1.?cp
命令說明:復(fù)制文件或目錄,相當(dāng)于Windows系統(tǒng)下的copy。
語法:cp?<source?dirname/filename>?<target?dirname/filename>?[-r]
常用參數(shù):-r?將源目錄及其子目錄下的所有文件,復(fù)制到目標(biāo)目錄下(復(fù)制目錄的時(shí)候,必須使用)。
實(shí)例:cp?file_a?dir_name?#將文件file_a拷貝到目錄dir_name下。
cp?file_a?file?_b?#將文件file_a復(fù)制并重新命名為file_b。
cp?-r?dir_a?dir_b?#將目錄dir_a及其子目錄下的所有文件,拷貝到目錄dir_b下。
2.?mv
命令說明:用于將文件移動到目標(biāo)目錄下;重命名文件或目錄;移動目錄到目標(biāo)目錄下。
語法:mv?<source?diename/filename>?<target?dirname/filename>
實(shí)例:mv?file_a?file_b?#將目錄file_a重命名為file_b。
mv?dir_a?dir_b?#如果目錄dir_b不存在,則將dir_a重命名為dir_b;如果目錄dir_b存在,則將dir_a移動到dir_b下。
mv?file1?file2?dirname1?test_dirname?#將文件file1和file2、目錄dirname1,移動到test_dirname下。
3.?ln
4.?rm
文件內(nèi)容查看
1.?cat
命令說明:將文件內(nèi)容顯示到標(biāo)準(zhǔn)輸出(或使用管道命令“|”傳遞作為下一個(gè)命令的標(biāo)準(zhǔn)輸入,或使用“>”重定向到其他文件)。
語法:cat?[-n]?<file1?file2?…>?[>?new_file]
常用參數(shù):-n?在每行內(nèi)容之前,加上行號顯示。
實(shí)例:cat?-n?file?#將file的內(nèi)容加行號,顯示在屏幕上。
cat?file1?file2?>?new_file?#將file1和file2的內(nèi)容,重定向到new_file中。(file1的內(nèi)容在前,file2的內(nèi)容在后。)
cat?file1?file2?>>?new_file?#將file1和file2的內(nèi)容,依次追加到new_file后。
cat?file?|?wc?-l?#使用cat查看file內(nèi)容,再傳遞到wc?-l計(jì)算文件的行數(shù)。
2.?less
命令說明:查看文件的內(nèi)容。
語法:less?[-SN]?<file>
常用參數(shù):-S?當(dāng)每行長度長于屏幕寬度的時(shí)候,默認(rèn)顯示在下一行,使用-S則不顯示在下一行。
-N?顯示行號。
實(shí)例:less?-SN?#使用less打開文件后,可以使用“Page?Up”向上翻頁,使用“Page?Down”向下翻頁,使用“/pattern”向下匹配。
3.?head
命令說明:顯示文件開頭部分的內(nèi)容。
語法:head?[-n]?<file>
常用參數(shù):-n?<number>?顯示文件前number行的內(nèi)容(默認(rèn)顯示前10行)。
實(shí)例:head?-n?20?file?#顯示文件前20行的內(nèi)容。
4.?tail
命令說明:顯示文件末尾部分的內(nèi)容。
語法:tail?[-n]?<file>
常用參數(shù):-n?<number>?顯示文件末尾number行的內(nèi)容(默認(rèn)顯示末尾10行)。
實(shí)例:tail?-n?20?file?#顯示文件末尾20行的內(nèi)容。
5.?cut
命令說明:顯示文件的每一行指定范圍內(nèi)的字符。
語法:cut?[-cdf]?<file>
常用參數(shù):-c?以字符為單位進(jìn)行分割。-c?num1-num2意為顯示文件的每一行的第num1到num2的字符。
-d?自定義域分割符,默認(rèn)tab鍵“\t”。
-f?num1-num2?顯示域分割符分割后,每行第num1到num2的域。
實(shí)例:cut?-c?1-5?file?#顯示文件的每一行的前5個(gè)字符。
cut?-d?“?”?-f?1-5?file?#顯示以空格分割后的,文件的前5列。
文件壓縮
1.?gzip
命令說明:壓縮文件或目錄,生成以“.gz”結(jié)尾的壓縮文件。
語法:gzip [-r][-1…9] <filename/dirname>
常用參數(shù):-r 對目錄下的文件進(jìn)行壓縮,但目錄本身不壓縮。
-1…9 數(shù)值越大,壓縮效率越高(默認(rèn)6),壓縮速度越慢,生成的壓縮文件越小。
實(shí)例:gzip file1 #對源文件file1進(jìn)行壓縮,生成file1.gz,并刪除源文件file1。
解壓命令:使用gunzip或gzip -d,例如gunzip file1.gz。
2.?zip
命令說明:壓縮文件或目錄,生成“.zip”結(jié)尾的壓縮文件。
語法:zip [-r][-1…9] <filename/dirname>
常用參數(shù):-r 對目錄下的所有子目錄、文件一起壓縮。
-1…9 數(shù)值越大,壓縮效率越高(默認(rèn)6),壓縮速度越慢,生成的壓縮文件越小。
實(shí)例:zip -r new.zip dirname1 #將目錄dirname1壓縮到new.zip壓縮文件內(nèi)。
解壓命令:unzip,例如unzip new.zip。
3. tar
命令說明:Linux下最常用的打包程序,生成的包通常稱為tar包(以“.tar”結(jié)尾)??梢栽趖ar包的基礎(chǔ)上,使用壓縮命令,進(jìn)一步壓縮處理。
語法:tar [-cxzvf] <tar_file>
常用參數(shù):-f 指定tar文件,后面需要立即接tar文件名,不能再接參數(shù)。
-c 創(chuàng)建一個(gè)tar文件。
-x 從tar文件中,獲取源目錄和源文件,相當(dāng)于打開tar包。
-z 和-c同用,調(diào)用gzip來壓縮tar文件;和-x同用,調(diào)用gunzip來解壓縮tar文件。
-v 顯示命令執(zhí)行的過程。
實(shí)例:tar -cf test.tar file1 dir1 #將文件file1、目錄dir1打包到test.tar中。
tar -xf test.tar #提取test.tar中的文件。
tar -czvf test.tar file1 dir1 #將文件file1、目錄dir1打包并壓縮為test.tar.gz,顯示詳細(xì)過程。
tar -xzvf test.tar file1 dir1 #將test.tar.gz解壓縮,提取其中文件。

鑒于篇幅較長,未完全展示,我們已將全文打包, 掃碼即可下載全文文檔