Linux中國

如何在Linux中使用awk命令

最簡單的awk的任務是從標準輸入中選擇欄位;如果你對awk除了這個用途之外,從來沒了解過它的其他用途,你會發現它還是會是你身邊一個非常有用的工具。

默認情況下,awk通過空格分隔輸入。如果您想選擇輸入的第一個欄位,你只需要告訴awk輸出$ 1:

$ echo 'one two three four' | awk '{print $1}'

one

(是的,大括弧語法是有點古怪,但我保證這是我們這節課一直會遇到。)

你能猜出如何選擇第二,第三或第四個欄位么?是的,分別用$2,$ 3,$ 4。

$ echo 'one two three four' | awk '{print $3}'

three

通常在文本改寫時,你需要創建一個特定的數據格式,並且它覆蓋不止一個單詞。好消息是,awk中可以很容易地列印多個欄位,甚至包含靜態字元串:

 $ echo 'one two three four' | awk '{print $3,$1}' 

three one

$ echo 'one two three four' | awk '{print "foo:",$3,"| bar:",$1}' 

foo: three | bar: one

好吧,如果你的輸入不是由空格分隔怎麼辦?只需用awk中的'-F'標誌指定你的分隔符:

$ echo 'one mississippi,two mississippi,three mississippi,four mississippi' | awk -F , '{print $4}' 

four mississippi

偶爾間,你會發現自己正在處理欄位數量不同的數據,但你只知道你想要的最後欄位。 awk中內置的$NF變數代表欄位的數量,這樣你就可以用它來抓取最後一個元素:

$ echo 'one two three four' | awk '{print $NF}' 

four

你也可以用$NF做簡單的數學,假如你需要倒數第二個欄位:

$ echo 'one two three four' | awk '{print $(NF-1)}' 

three

甚至是中間的欄位:

$ echo 'one two three four' | awk '{print $((NF/2)+1)}' 

three

而且這一切都非常有用,同樣你可以擺脫強制使用sed,cut,和grep來得到這些結果(儘管要做更多的操作)。

因此,我將最後為你介紹awk的一個特性,維持跨行狀態。

 $ echo -e 'one 1ntwo 2' | awk '{print $2}' 

1

2

$ echo -e 'one 1ntwo 2' | awk '{sum+=$2} END {print sum}' 

3

(END代表的是我們在執行完每行的處理之後只處理下面的代碼塊)

這裡我使用的例子是統計web伺服器請求日誌的位元組大小。想像一下我們有如下這樣的日誌:

$ cat requests.log 

Jul 23 18:57:12 httpd[31950]: "GET /foo/bar HTTP/1.1" 200 344

Jul 23 18:57:13 httpd[31950]: "GET / HTTP/1.1" 200 9300

Jul 23 19:01:27 httpd[31950]: "GET / HTTP/1.1" 200 9300

Jul 23 19:01:55 httpd[31950]: "GET /foo/baz HTTP/1.1" 200 6401

Jul 23 19:02:31 httpd[31950]: "GET /foo/baz?page=2 HTTP/1.1" 200 6312

我們知道最後一個欄位是響應的位元組大小。我們已經學習了如何使用$NF來抽取他們:

$ < requests.log awk &apos;{print $NF}&apos; 

344

9300

9300

6401

6312

接著我們可以將它們累加到一個變數中來收集我們的web服務其在日誌中這段時間內的響應客戶端的位元組數量

$ < requests.log awk &apos;{totalBytes+=$NF} END {print totalBytes}&apos; 

31657

如果你正在尋找關於awk的更多資料,你可以在Amazon中花費不到15美元買到原始awk手冊的二手書。你也許還可以看看Eric Pement的單行awk命令收集這本書。

via: http://xmodulo.com/2014/07/use-awk-command-linux.html

作者:James Pearson 譯者:geekpi 校對:wxy

本文由 LCTT 原創翻譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國