Linux文本處理命令:Linux文本處理命令所屬現代詞，指的是對檔案中 -百科知識中文網

Sort命令

sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項，這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上，sort命令可以被認為是一個非常強大的數據管理工具，用來管理內容類似資料庫記錄的檔案。
Sort命令將逐行對檔案中的內容進行排序，如果兩行的首字元相同，該命令將繼續比較這兩行的下一字元，如果還相同，將繼續進行比較。

語法：

sort 【選項】檔案
說明：sort命令對指定檔案中所有的行進行排序，並將結果顯示在標準輸出上。如不指定輸入檔案或使用“- ”，則表示排序內容來自標準輸入。
sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。

改變預設設定的選項主要有：

- m 若給定檔案已排好序，合併檔案。
- c 檢查給定檔案是否已排好序，如果它們沒有都排好序，則列印一個出錯信息，並以狀態值1退出。
- u 對排序後認為相同的行只留其中一行。
- o 輸出檔案將排序輸出寫到輸出檔案中而不是標準輸出，如果輸出檔案是輸入檔案之一，sort先將該檔案的內容寫入一個臨時檔案，然後再排序和寫輸出結果。
改變預設排序規則的選項主要有：
- d 按字典順序排序，比較時僅字母、數字、空格和制表符有意義。
- f 將小寫字母與大寫字母同等對待。
- I 忽略非列印字元。
- M 作為月份比較：“JAN”<“FEB” p>
- r 按逆序輸出排序結果。
＋posl - pos2 指定一個或幾個欄位作為排序關鍵字，欄位位置從posl開始，到pos2為止（包括posl，不包括pos2）。如不指定pos2，則關鍵字為從posl到行尾。欄位和字元的位置從0開始。
- b 在每行中尋找排序關鍵字時忽略前導的空白（空格和制表符）。
- t separator 指定字元separator作為欄位分隔設定。
下面通過幾個例子來講述sort的使用。
用sort命令對text檔案中各行排序後輸出其結果。請注意，在原檔案的第二、三行上的第一個單詞完全相同，該命令將從它們的第二個單詞vegetables與fruit的首字元處繼續進行比較。
$ cat text
vegetable soup
fresh vegetables
fresh fruit
lowfat milk
$ sort text
fresh fruit
fresh vegetables
lowfat milk
vegetable soup
用戶可以保存排序後的檔案內容，或把排序後的檔案內容輸出至印表機。下例中用戶把排序後的檔案內容保存到名為result的檔案中。
$ sort text>result
以第2個欄位作為排序關鍵字對檔案example的內容進行排序。
$ sort +1-2 example
對於file1和file2檔案內容反向排序，結果放在outfile中，利用第2個欄位的第一個字元作為排序關鍵字。
$ sort -r -o outfile +1.0 -1.1 example
sort排序常用於在管道中與其他命令連用，組合完成比較複雜的功能，如利用管道將當前工作目錄中的檔案送給sort進行排序，排序關鍵字是第6個至第8個欄位。
$ ls - l | sort +5 - 7
sort命令也可以對標準輸入進行操作。例如，如果您想把幾個檔案文本行合併，並對合併後的文本行進行排序，您可以首先用命令cat把多個檔案合併，然後用管道操作把合併後的文本行輸入給命令sort，sort命令將輸出這些合併及排序後的文本行。在下面的例子中，檔案veglist與檔案fruitlist的文本行經過合併與排序後被保存到檔案clist中。
$ cat veglist fruitlist | sort > clist
uniq命令
檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如，使用cat命令將兩個檔案合併後，再使用sort命令進行排序，就可能出現重複行。這時可以使用uniq命令將這些重複行從輸出檔案中刪除，只留下每條記錄的唯一樣本。
語法：
uniq 【選項】檔案
說明：這個命令讀取輸入檔案，並比較相鄰的行。在正常情況下，第二個及以後更多個重複行將被刪去，行比較是根據所用字元集的排序序列進行的。該命令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用“- ”表示，則從標準輸入讀取。
該命令各選項含義如下：
- c 顯示輸出中，在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。
- d 只顯示重複行。
- u 只顯示檔案中不重複的各行。
- n 前n個欄位與每個欄位前的空白一起被忽略。一個欄位是一個非空格、非制表符的字元串，彼此由制表符和空格隔開（欄位從0開始編號）。
+n 前n個字元被忽略，之前的字元被跳過（字元從0開始編號）。
- f n 與- n相同，這裡n是欄位數。
- s n 與＋n相同，這裡n是字元數。
例如：
1. 顯示檔案example中不重複的行。
uniq - u example
2. 顯示檔案example中不重複的行，從第2個欄位的第2個字元開始做比較。
uniq - u - 1 +1 example

Linux文本處理命令

Sort命令

語法：

改變預設設定的選項主要有：

相關詞條

Linux文本處理命令

liunx命令大全

Linux系統與網路管理教程(第2版)

Linux命令行大全

Linux從初學到精通

紅帽企業版Linux

Linux命令行技術大全

Linux命令行與shell腳本編程大全

Linux指令從初學到精通

相關搜尋

熱門詞條