千面 awk

如果你仅使用 awk 选取一行中的特定文本，那么你可能错过了它的很多功能。在这篇文章中，我们会来看看使用 awk 可以帮你做一些其他的什么事情，并提供一些例子。

提取数据列

awk 所提供的最简单与最常用的功能便是从文件或管道传输的数据中选取特定的内容。默认使用空格当做分隔符，这非常简单。

$ echo one two three four five | awk ‘{print $4}’
four
$ who | awk ‘{print $1}’
jdoe
fhenry

空格指的是一系列的 space 或 tab 字符。在下面所展示的命令里，awk 从提供的数据中筛选第一和第四项。

awk 命令也可以通过在其后增加文件名参数的方式从文本文件中获取数据。

$ awk &apos;{print $1,$5,$NF}&apos; HelenKellerQuote
The beautiful heart.

（LCTT 译注：“The best and most beautiful things in the world can not be seen or even touched , they must be felt with heart.” ——海伦凯勒）

在这个例子中，awk 挑选了一行中的第一个、第五个和最后一个字段。

命令中的 $NF 指定选取每行的最后一个字段。这是因为 NF 代表一行中的字段数量 Number of Field ，也就是 23，而 $NF 就代表着那个字段的值，也就是heart。最后的句号也包含进去了，因为它是最后一个字符串的一部分。

字段能以任何有用的形式打印。在这个例子中，我们将字段以日期的格式进行打印输出。

$ date | awk &apos;{print $4,$3,$2}&apos;
2019 Nov 22

如果你省略了 awk 命令中字段指示符之间的逗号，输出将会挤成一个字符串。

$ date | awk &apos;{print $4 $3 $2}&apos;
2019Nov21

如果你将通常使用的逗号替换为连字符，awk 就会尝试将两个字段的值相减——或许这并不是你想要的。它不会将连字符插入到输出结果中。相反地，它对输出做了一些数学计算。

$ date | awk &apos;{print $4-$3-$2}&apos;
1997

在这个例子中，它将年 “2019” 和日期 “22” 相减，并忽略了中间的 “Nov”。

如果你想要空格之外的字符作为输出分隔符，你可以通过 OFS（输出分隔符 output field separator ）指定分隔符，就像这样：

$ date | awk &apos;{OFS="-"; print $4,$3,$2}&apos;
2019-Nov-22

打印简单文本

你也可以使用 awk 简单地显示一些文本。当然了，比起 awk 你可能更想使用 echo 命令。但换句话说，作为 awk 脚本的一部分，打印某些相关性文本将会非常实用。这里有一个没什么用的例子：

$ awk &apos;BEGIN {print "Hello, World" }&apos;
Hello, World

下面的例子更加合理，添加一行文本标签来更好的辨识数据。

$ who | awk &apos;BEGIN {print "Current logins:"} {print $1}&apos;
Current logins:
shs
nemo

指定字段分隔符

不是所有的输入都以空格作为分隔符的。如果你的文本通过其它的字符作为分隔符（例如：逗号、冒号、分号），你可以通过 -F 选项（输入分隔符）告诉 awk：

$ cat testfile
a:b:c,d:e
$ awk -F : &apos;{print $2,$3}&apos; testfile
b c,d

下面是一个更加有用的例子——从冒号分隔的 /etc/passwd 文件中获取数据：

$ awk -F: &apos;{print $1}&apos; /etc/passwd | head -11
root
daemon
bin
sys
sync
games
man
lp
mail
news
uucp

筛选内容

你也可以使用 awk 命令评估字段。例如你仅仅想列出 /etc/passwd 中的用户账号，就可以对第三个字段做一些筛选。下面的例子中我们只关注大于等于 1000 的 UID：

$ awk -F":" &apos; $3 >= 1000 &apos; /etc/passwd
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
shs:x:1000:1000:Sandra Henry-Stocker,,,:/home/shs:/bin/bash
nemo:x:1001:1001:Nemo,,,:/home/nemo:/usr/bin/zsh
dory:x:1002:1002:Dory,,,:/home/dory:/bin/bash
...

如果你想为输出增加标题，可以添加 BEGIN 从句：

$ awk -F":" &apos;BEGIN {print "user accounts:"} $3 >= 1000 &apos; /etc/passwd
user accounts:
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
shs:x:1000:1000:Sandra Henry-Stocker,,,:/home/shs:/bin/bash
nemo:x:1001:1001:Nemo,,,:/home/nemo:/usr/bin/zsh
dory:x:1002:1002:Dory,,,:/home/dory:/bin/bash

如果你想要不止一行的标题，你可以通过 "n" 分隔输出：

$ awk -F":" &apos;BEGIN {print "user accountsn============="} $3 >= 1000 &apos; /etc/passwd
user accounts
=============
nobody:x:65534:65534:nobody:/nonexistent:/usr/sbin/nologin
shs:x:1000:1000:Sandra Henry-Stocker,,,:/home/shs:/bin/bash
nemo:x:1001:1001:Nemo,,,:/home/nemo:/usr/bin/zsh
dory:x:1002:1002:Dory,,,:/home/dory:/bin/bash

在 awk 中进行数学计算

awk 提供了惊人的数学计算能力，并且可以开平方，算 log，算 tan 等等。

这里有一对例子：

$ awk &apos;BEGIN {print sqrt(2019)}&apos;
44.9333
$ awk &apos;BEGIN {print log(2019)}&apos;
7.61036

想要详细了解 awk 的数学计算能力，可以看《使用 awk 进行数学计算》这篇文章。

awk 脚本

你也可以使用 awk 写一套单独的脚本。下面的例子模仿了之前写过的一个，不过还计算了系统里账户的数量。

#!/usr/bin/awk -f

# 这一行是注释

BEGIN {
    printf "%sn","User accounts:"
    print "=============="
    FS=":"
    n=0
}

# 现在开始遍历数据
{
    if ($3 >= 1000) {
        print $1
        n ++
    }
}

END {
    print "=============="
    print n " accounts"
}

注意 BEGIN 那一节是如何提供标题、指定字段分隔符和初始化计数器的，它仅在脚本初始化时期执行。这个脚本也包含 END 节，它仅在中间所有命令处理完成之后运行，显示了所有中间小节所筛选数据的最终行数（第三个字段大于等于 1000）。

作为一个长存于 Unix 之上的命令，awk 依旧提供着非常有用的服务，这也是我几十年前爱上 Unix 的原因之一。

via: https://www.networkworld.com/article/3454979/the-many-faces-of-awk.html

作者：Sandra Henry-Stocker 选题：lujun9972 译者：LuuMing 校对：wxy

本文由 LCTT 原创编译，Linux中国荣誉推出

本文转载来自 Linux 中国: https://github.com/Linux-CN/archive

对这篇文章感觉如何？

太棒了

不错

爱死了

不太好

感觉很糟

Rain

雨落清风。心向阳

提取数据列

打印简单文本

指定字段分隔符

筛选内容

在 awk 中进行数学计算

awk 脚本

对这篇文章感觉如何？

在命令行用 sort 进行排序

为何 Elementary OS 中使用 Pantheon 桌面

Leave a reply 取消回复

More in:Linux中国

捐赠 Let's Encrypt，共建安全的互联网

Let's Encrypt 正式发布，已经保护 380 万个域名

关于Linux防火墙iptables的面试问答

Lets Encrypt 已被所有主流浏览器所信任

中文操作系统论坛

关注 LinuxStory

开源学村

编程类开放书籍荟萃

如何杀死 Linux 中的僵尸进程

2022年，从学习Rust开始

使用 Linux 命令行解决Wordle 问题

5本学习 TeX 的最佳免费书籍

Makefile 简介

Linux 内核补丁提交初体验

Linux 的前世今生 – 1

特别关注

更开放的分布式事务 | Fescar 品牌升级，更名为 Seata

HeRM’s – 一个命令食谱管理器

使用 Let's Encrypt 保护你的网站

LinuxStory

加入 LinuxStory 交流群组

投票调查

最热标签

提取数据列

打印简单文本

指定字段分隔符

筛选内容

在 awk 中进行数学计算

awk 脚本

分享

对这篇文章感觉如何？

You may also like

Leave a reply 取消回复

More in:Linux中国

中文操作系统论坛

关注 LinuxStory

开源学村

特别关注

最新文章

最热标签