linux文本處理命令是一類對文件進(jìn)行操作的命令,通過使用文本處理命令,可以輕松的對文件進(jìn)行排序,拆分,合并等操作,熟練掌握文本處理命令,在生物信息文本處理中,有十分重要的意義。
一、cat?查看文件內(nèi)容命令
以下為最常用的幾個(gè)命令實(shí)例:

注意事項(xiàng):
遇到大文件的時(shí)候,不要直接cat,因?yàn)閏at會一直把所有內(nèi)容打印到屏幕上,造成長時(shí)間處于打印狀態(tài),如遇到這種情況,連續(xù)不間斷的敲擊ctrl+c組合鍵退出打印狀態(tài)
相關(guān)衍生命令:
cat還有兩個(gè)常用的相關(guān)命令:
1.zcat ?查看壓縮文件
2.tac ?從結(jié)尾往上看內(nèi)容
二、sort?排序命令
對數(shù)據(jù)的某一列按照文本,數(shù)字等排序方法進(jìn)行排序,也可以進(jìn)行字符內(nèi)排序,以下為最常用的幾個(gè)命令實(shí)例

三.uniq?去除重復(fù)命令
對相同的行去重復(fù),統(tǒng)計(jì)重復(fù),保留重復(fù)等,還可指定某一列做為去重復(fù)關(guān)鍵字去重復(fù),以下為最常用的幾個(gè)命令實(shí)例
注意事項(xiàng):
uniq需要配合sort進(jìn)行使用,把重復(fù)的內(nèi)容排序到一起,以下為最常用的幾個(gè)命令實(shí)例
四.wc?統(tǒng)計(jì)命令
統(tǒng)計(jì)指定文件中的字節(jié)數(shù)、字?jǐn)?shù)、行數(shù),并將統(tǒng)計(jì)結(jié)果顯示輸出,以下為最常用的幾個(gè)命令實(shí)例
五.grep/egrep命令
grep為過濾命令,一般情況下支持基本正則表達(dá)式,可以通過參數(shù)-E支持?jǐn)U展正則表達(dá)式,常用命令如下:
grep一般情況下支持基本正則表達(dá)式,可以通過參數(shù)-E支持?jǐn)U展正則表達(dá)式,另外grep單獨(dú)提供了一個(gè)擴(kuò)展命令叫做egrep用來支持?jǐn)U展正則表達(dá)式,這條命令和grep -E等價(jià)。雖然一般情況下,基本正則表達(dá)式就夠用了,以下為最常用的幾個(gè)命令
六.sed命令
sed是一個(gè)強(qiáng)大的按行處理的命令,常用的命令如下:
七.awk命令
是一個(gè)最強(qiáng)大的文本分析工具,以下列常用文本處理的寫法:
八.cut命令
cut命令命令從文件的列剪切字節(jié)、字符、域,并將這些字節(jié)、字符,域,輸出出來,下面為幾個(gè)常見的用法:
九.split命令
split命令可以按照行或者按照字節(jié)分割文件,以下列常用文本處理的寫法:
十.paste命令
Paste命令可按列合并命令,可以很輕松的將兩個(gè)文件按列合并,下面是常見的舉例:?
十一.xargs
xargs用作替換工具,讀取輸入數(shù)據(jù)重新格式化后輸出。Xargs命令常跟管道連用,處理管道中的數(shù)據(jù)流:
?
十二.comm
comm命令比較兩個(gè)文件的相同和不同,下面為常用的命令舉例:
注意事項(xiàng):兩個(gè)比較的文件需要排序后進(jìn)行
好了linux常用命令就介紹到這里,按照這些實(shí)例好好練習(xí),加上自己的融會貫通,相信你很快就會成為快速文本處理的高手