每個系統管理員都要知道的 30 個 Linux 系統監控工具
您需要監控 Linux 伺服器的性能嗎?試試用這些內置命令和附加工具吧!大多數 Linux 發行版都附帶了大量的監控工具。這些工具提供了獲取系統活動的相關指標。您可以使用這些工具來查找性能問題的可能原因。本文提到的是一些基本的命令,用於系統分析和伺服器調試等,例如:
- 找出系統瓶頸
- 磁碟(存儲)瓶頸
- CPU 和內存瓶頸
- 網路瓶頸
1. top - 進程活動監控命令
top
命令會顯示 Linux 的進程。它提供了一個運行中系統的實時動態視圖,即實際的進程活動。默認情況下,它顯示在伺服器上運行的 CPU 佔用率最高的任務,並且每五秒更新一次。
圖 01:Linux top 命令
top 的常用快捷鍵
常用快捷鍵列表:
快捷鍵 | 用法 |
---|---|
t |
是否顯示匯總信息 |
m |
是否顯示內存信息 |
A |
根據各種系統資源的利用率對進程進行排序,有助於快速識別系統中性能不佳的任務。 |
f |
進入 top 的互動式配置屏幕,用於根據特定的需求而設置 top 的顯示。 |
o |
互動式地調整 top 每一列的順序。 |
r |
調整優先順序(renice ) |
k |
殺掉進程(kill ) |
z |
切換彩色或黑白模式 |
相關鏈接:Linux 如何查看 CPU 利用率?
2. vmstat - 虛擬內存統計
vmstat
命令報告有關進程、內存、分頁、塊 IO、中斷和 CPU 活動等信息。
# vmstat 3
輸出示例:
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu--- r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 2540988 522188 5130400 0 0 2 32 4 2 4 1 96 0 0
1 0 0 2540988 522188 5130400 0 0 0 720 1199 665 1 0 99 0 0
0 0 0 2540956 522188 5130400 0 0 0 0 1151 1569 4 1 95 0 0
0 0 0 2540956 522188 5130500 0 0 0 6 1117 439 1 0 99 0 0
0 0 0 2540940 522188 5130512 0 0 0 536 1189 932 1 0 98 0 0
0 0 0 2538444 522188 5130588 0 0 0 0 1187 1417 4 1 96 0 0
0 0 0 2490060 522188 5130640 0 0 0 18 1253 1123 5 1 94 0 0
顯示 Slab 緩存的利用率
# vmstat -m
獲取有關活動和非活動內存頁面的信息
# vmstat -a
相關鏈接:如何查看 Linux 的資源利用率從而找到系統瓶頸?
3. w - 找出登錄的用戶以及他們在做什麼
[w 命令](https://www.cyberciti.biz/faq/unix-linux-w-command-examples-syntax-usage-2/ "See Linux/Unix w command examples for more info") 顯示了當前登錄在該系統上的用戶及其進程。
# w username
# w vivek
輸出示例:
17:58:47 up 5 days, 20:28, 2 users, load average: 0.36, 0.26, 0.24
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 10.1.3.145 14:55 5.00s 0.04s 0.02s vim /etc/resolv.conf
root pts/1 10.1.3.145 17:43 0.00s 0.03s 0.00s w
4. uptime - Linux 系統運行了多久
uptime
命令可以用來查看伺服器運行了多長時間:當前時間、已運行的時間、當前登錄的用戶連接數,以及過去 1 分鐘、5 分鐘和 15 分鐘的系統負載平均值。
# uptime
輸出示例:
18:02:41 up 41 days, 23:42, 1 user, load average: 0.00, 0.00, 0.00
1
可以被認為是最佳負載值。不同的系統會有不同的負載:對於單核 CPU 系統來說,1
到 3
的負載值是可以接受的;而對於 SMP(對稱多處理)系統來說,負載可以是 6
到 10
。
5. ps - 顯示系統進程
ps
命令顯示當前運行的進程。要顯示所有的進程,請使用 -A
或 -e
選項:
# ps -A
輸出示例:
PID TTY TIME CMD
1 ? 00:00:02 init
2 ? 00:00:02 migration/0
3 ? 00:00:01 ksoftirqd/0
4 ? 00:00:00 watchdog/0
5 ? 00:00:00 migration/1
6 ? 00:00:15 ksoftirqd/1
....
.....
4881 ? 00:53:28 java
4885 tty1 00:00:00 mingetty
4886 tty2 00:00:00 mingetty
4887 tty3 00:00:00 mingetty
4888 tty4 00:00:00 mingetty
4891 tty5 00:00:00 mingetty
4892 tty6 00:00:00 mingetty
4893 ttyS1 00:00:00 agetty
12853 ? 00:00:00 cifsoplockd
12854 ? 00:00:00 cifsdnotifyd
14231 ? 00:10:34 lighttpd
14232 ? 00:00:00 php-cgi
54981 pts/0 00:00:00 vim
55465 ? 00:00:00 php-cgi
55546 ? 00:00:00 bind9-snmp-stat
55704 pts/1 00:00:00 ps
ps
與 top
類似,但它提供了更多的信息。
顯示長輸出格式
# ps -Al
顯示完整輸出格式(它將顯示傳遞給進程的命令行參數):
# ps -AlF
顯示線程(輕量級進程(LWP)和線程的數量(NLWP))
# ps -AlFH
在進程後顯示線程
# ps -AlLm
顯示系統上所有的進程
# ps ax
# ps axu
顯示進程樹
# ps -ejH
# ps axjf
# pstree
顯示進程的安全信息
# ps -eo euser,ruser,suser,fuser,f,comm,label
# ps axZ
# ps -eM
顯示指定用戶(如 vivek)運行的進程
# ps -U vivek -u vivek u
設置用戶自定義的輸出格式
# ps -eo pid,tid,class,rtprio,ni,pri,psr,pcpu,stat,wchan:14,comm
# ps axo stat,euid,ruid,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm
# ps -eopid,tt,user,fname,tmout,f,wchan
顯示某進程(如 lighttpd)的 PID
# ps -C lighttpd -o pid=
或
# pgrep lighttpd
或
# pgrep -u vivek php-cgi
顯示指定 PID(如 55977)的進程名稱
# ps -p 55977 -o comm=
找出佔用內存資源最多的前 10 個進程
# ps -auxf | sort -nr -k 4 | head -10
找出佔用 CPU 資源最多的前 10 個進程
# ps -auxf | sort -nr -k 3 | head -10
相關鏈接:顯示 Linux 上所有運行的進程
6. free - 內存使用情況
free
命令顯示了系統的可用和已用的物理內存及交換內存的總量,以及內核用到的緩存空間。
# free
輸出示例:
total used free shared buffers cached
Mem: 12302896 9739664 2563232 0 523124 5154740
-/+ buffers/cache: 4061800 8241096
Swap: 1052248 0 1052248
相關鏈接: 1. 獲取 Linux 的虛擬內存的內存頁大小(PAGESIZE) 2. 限制 Linux 每個進程的 CPU 使用率 3. 我的 Ubuntu 或 Fedora Linux 系統有多少內存?
7. iostat - CPU 平均負載和磁碟活動
iostat
命令用於彙報 CPU 的使用情況,以及設備、分區和網路文件系統(NFS)的 IO 統計信息。
# iostat
輸出示例:
Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009
avg-cpu: %user %nice %system %iowait %steal %idle
3.50 0.09 0.51 0.03 0.00 95.86
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
sda 22.04 31.88 512.03 16193351 260102868
sda1 0.00 0.00 0.00 2166 180
sda2 22.04 31.87 512.03 16189010 260102688
sda3 0.00 0.00 0.00 1615 0
相關鏈接:如何跟蹤 Linux 系統的 NFS 目錄或磁碟的 IO 負載情況
8. sar - 監控、收集和彙報系統活動
sar
命令用於收集、彙報和保存系統活動信息。要查看網路統計,請輸入:
# sar -n DEV | more
顯示 24 日的網路統計:
# sar -n DEV -f /var/log/sa/sa24 | more
您還可以使用 sar
顯示實時使用情況:
# sar 4 5
輸出示例:
Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009
06:45:12 PM CPU %user %nice %system %iowait %steal %idle
06:45:16 PM all 2.00 0.00 0.22 0.00 0.00 97.78
06:45:20 PM all 2.07 0.00 0.38 0.03 0.00 97.52
06:45:24 PM all 0.94 0.00 0.28 0.00 0.00 98.78
06:45:28 PM all 1.56 0.00 0.22 0.00 0.00 98.22
06:45:32 PM all 3.53 0.00 0.25 0.03 0.00 96.19
Average: all 2.02 0.00 0.27 0.01 0.00 97.70
相關鏈接:
9. mpstat - 監控多處理器的使用情況
mpstat
命令顯示每個可用處理器的使用情況,編號從 0 開始。命令 mpstat -P ALL
顯示了每個處理器的平均使用率:
# mpstat -P ALL
輸出示例:
Linux 2.6.18-128.1.14.el5 (www03.nixcraft.in) 06/26/2009
06:48:11 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
06:48:11 PM all 3.50 0.09 0.34 0.03 0.01 0.17 0.00 95.86 1218.04
06:48:11 PM 0 3.44 0.08 0.31 0.02 0.00 0.12 0.00 96.04 1000.31
06:48:11 PM 1 3.10 0.08 0.32 0.09 0.02 0.11 0.00 96.28 34.93
06:48:11 PM 2 4.16 0.11 0.36 0.02 0.00 0.11 0.00 95.25 0.00
06:48:11 PM 3 3.77 0.11 0.38 0.03 0.01 0.24 0.00 95.46 44.80
06:48:11 PM 4 2.96 0.07 0.29 0.04 0.02 0.10 0.00 96.52 25.91
06:48:11 PM 5 3.26 0.08 0.28 0.03 0.01 0.10 0.00 96.23 14.98
06:48:11 PM 6 4.00 0.10 0.34 0.01 0.00 0.13 0.00 95.42 3.75
06:48:11 PM 7 3.30 0.11 0.39 0.03 0.01 0.46 0.00 95.69 76.89
相關鏈接:多處理器的 Linux 上單獨顯示每個 CPU 的使用率.
10. pmap - 監控進程的內存使用情況
pmap
命令用以顯示進程的內存映射,使用此命令可以查找內存瓶頸。
# pmap -d PID
顯示 PID 為 47394 的進程的內存信息,請輸入:
# pmap -d 47394
輸出示例:
47394: /usr/bin/php-cgi
Address Kbytes Mode Offset Device Mapping
0000000000400000 2584 r-x-- 0000000000000000 008:00002 php-cgi
0000000000886000 140 rw--- 0000000000286000 008:00002 php-cgi
00000000008a9000 52 rw--- 00000000008a9000 000:00000 [ anon ]
0000000000aa8000 76 rw--- 00000000002a8000 008:00002 php-cgi
000000000f678000 1980 rw--- 000000000f678000 000:00000 [ anon ]
000000314a600000 112 r-x-- 0000000000000000 008:00002 ld-2.5.so
000000314a81b000 4 r---- 000000000001b000 008:00002 ld-2.5.so
000000314a81c000 4 rw--- 000000000001c000 008:00002 ld-2.5.so
000000314aa00000 1328 r-x-- 0000000000000000 008:00002 libc-2.5.so
000000314ab4c000 2048 ----- 000000000014c000 008:00002 libc-2.5.so
.....
......
..
00002af8d48fd000 4 rw--- 0000000000006000 008:00002 xsl.so
00002af8d490c000 40 r-x-- 0000000000000000 008:00002 libnss_files-2.5.so
00002af8d4916000 2044 ----- 000000000000a000 008:00002 libnss_files-2.5.so
00002af8d4b15000 4 r---- 0000000000009000 008:00002 libnss_files-2.5.so
00002af8d4b16000 4 rw--- 000000000000a000 008:00002 libnss_files-2.5.so
00002af8d4b17000 768000 rw-s- 0000000000000000 000:00009 zero (deleted)
00007fffc95fe000 84 rw--- 00007ffffffea000 000:00000 [ stack ]
ffffffffff600000 8192 ----- 0000000000000000 000:00000 [ anon ]
mapped: 933712K writeable/private: 4304K shared: 768000K
最後一行非常重要:
mapped: 933712K
映射到文件的內存量writeable/private: 4304K
私有地址空間shared: 768000K
此進程與其他進程共享的地址空間
相關鏈接:使用 pmap 命令查看 Linux 上單個程序或進程使用的內存
11. netstat - Linux 網路統計監控工具
netstat
命令顯示網路連接、路由表、介面統計、偽裝連接和多播連接等信息。
# netstat -tulpn
# netstat -nat
12. ss - 網路統計
ss
命令用於獲取套接字統計信息。它可以顯示類似於 netstat
的信息。不過 netstat
幾乎要過時了,ss
命令更具優勢。要顯示所有 TCP 或 UDP 套接字:
# ss -t -a
或
# ss -u -a
顯示所有帶有 SELinux 安全上下文 的 TCP 套接字:
# ss -t -a -Z
請參閱以下關於 ss
和 netstat
命令的資料:
13. iptraf - 獲取實時網路統計信息
iptraf
命令是一個基於 ncurses 的互動式 IP 網路監控工具。它可以生成多種網路統計信息,包括 TCP 信息、UDP 計數、ICMP 和 OSPF 信息、乙太網負載信息、節點統計信息、IP 校驗錯誤等。它以簡單的格式提供了以下信息:
- 基於 TCP 連接的網路流量統計
- 基於網路介面的 IP 流量統計
- 基於協議的網路流量統計
- 基於 TCP/UDP 埠和數據包大小的網路流量統計
- 基於二層地址的網路流量統計
![Fig.02: General interface statistics: IP traffic statistics by network interface ](/data/attachment/album/201802/23/003617vegee3q22m51fng5.png "Fig.02: General interface statistics: IP traffic statistics by network interface ")
圖 02:常規介面統計:基於網路介面的 IP 流量統計
![Fig.03 Network traffic statistics by TCP connection](/data/attachment/album/201802/23/003617afed2848vd2dfufw.png "Fig.03 Network traffic statistics by TCP connection")
圖 03:基於 TCP 連接的網路流量統計
相關鏈接:在 Centos / RHEL / Fedora Linux 上安裝 IPTraf 以獲取網路統計信息
14. tcpdump - 詳細的網路流量分析
tcpdump
命令是簡單的分析網路通信的命令。您需要充分了解 TCP/IP 協議才便於使用此工具。例如,要顯示有關 DNS 的流量信息,請輸入:
# tcpdump -i eth1 'udp port 53'
查看所有去往和來自埠 80 的 IPv4 HTTP 數據包,僅列印真正包含數據的包,而不是像 SYN、FIN 和僅含 ACK 這類的數據包,請輸入:
# tcpdump 'tcp port 80 and (((ip[2:2] - ((ip[0]&0xf)<<2)) - ((tcp[12]&0xf0)>>2)) != 0)'
顯示所有目標地址為 202.54.1.5 的 FTP 會話,請輸入:
# tcpdump -i eth1 'dst 202.54.1.5 and (port 21 or 20'
列印所有目標地址為 192.168.1.5 的 HTTP 會話:
# tcpdump -ni eth0 'dst 192.168.1.5 and tcp and port http'
使用 wireshark 查看文件的詳細內容,請輸入:
# tcpdump -n -i eth1 -s 0 -w output.txt src or dst port 80
15. iotop - I/O 監控
iotop
命令利用 Linux 內核監控 I/O 使用情況,它按進程或線程的順序顯示 I/O 使用情況。
$ sudo iotop
輸出示例:
16. htop - 互動式的進程查看器
htop
是一款免費並開源的基於 ncurses 的 Linux 進程查看器。它比 top
命令更簡單易用。您無需使用 PID、無需離開 htop
界面,便可以殺掉進程或調整其調度優先順序。
$ htop
輸出示例:
相關鏈接:CentOS / RHEL:安裝 htop——互動式文本模式進程查看器
17. atop - 高級版系統與進程監控工具
atop
是一個非常強大的互動式 Linux 系統負載監控器,它從性能的角度顯示最關鍵的硬體資源信息。您可以快速查看 CPU、內存、磁碟和網路性能。它還可以從進程的級別顯示哪些進程造成了相關 CPU 和內存的負載。
$ atop
相關鏈接:CentOS / RHEL:安裝 atop 工具——高級系統和進程監控器
18. ac 和 lastcomm
您一定需要監控 Linux 伺服器上的進程和登錄活動吧。psacct
或 acct
軟體包中包含了多個用於監控進程活動的工具,包括:
ac
命令:顯示有關用戶連接時間的統計信息- [lastcomm 命令](https://www.cyberciti.biz/faq/linux-unix-lastcomm-command-examples-usage-syntax/ "See Linux/Unix lastcomm command examples for more info"):顯示已執行過的命令
accton
命令:打開或關閉進程賬號記錄功能sa
命令:進程賬號記錄信息的摘要
19. monit - 進程監控器
monit
是一個免費且開源的進程監控軟體,它可以自動重啟停掉的服務。您也可以使用 Systemd、daemontools 或其他類似工具來達到同樣的目的。本教程演示如何在 Debian 或 Ubuntu Linux 上安裝和配置 monit 作為進程監控器。
20. NetHogs - 找出佔用帶寬的進程
NetHogs 是一個輕便的網路監控工具,它按照進程名稱(如 Firefox、wget 等)對帶寬進行分組。如果網路流量突然爆發,啟動 NetHogs,您將看到哪個進程(PID)導致了帶寬激增。
$ sudo nethogs
相關鏈接:Linux:使用 Nethogs 工具查看每個進程的帶寬使用情況
21. iftop - 顯示主機上網路介面的帶寬使用情況
iftop
命令監聽指定介面(如 eth0)上的網路通信情況。它顯示了一對主機的帶寬使用情況。
$ sudo iftop
22. vnstat - 基於控制台的網路流量監控工具
vnstat
是一個簡單易用的基於控制台的網路流量監視器,它為指定網路介面保留每小時、每天和每月網路流量日誌。
$ vnstat
相關鏈接:
- 為 ADSL 或專用遠程 Linux 伺服器保留日常網路流量日誌
- CentOS / RHEL:安裝 vnStat 網路流量監控器以保留日常網路流量日誌
- CentOS / RHEL:使用 PHP 網頁前端介面查看 Vnstat 圖表
23. nmon - Linux 系統管理員的調優和基準測量工具
nmon
是 Linux 系統管理員用於性能調優的利器,它在命令行顯示 CPU、內存、網路、磁碟、文件系統、NFS、消耗資源最多的進程和分區信息。
$ nmon
相關鏈接:安裝並使用 nmon 工具來監控 Linux 系統的性能
24. glances - 密切關注 Linux 系統
glances
是一款開源的跨平台監控工具。它在小小的屏幕上提供了大量的信息,還可以工作於客戶端-伺服器模式下。
$ glances
相關鏈接:Linux:通過 Glances 監控器密切關注您的系統
25. strace - 查看系統調用
想要跟蹤 Linux 系統的調用和信號嗎?試試 strace
命令吧。它對於調試網頁伺服器和其他伺服器問題很有用。了解如何利用其 追蹤進程 並查看它在做什麼。
26. /proc 文件系統 - 各種內核信息
/proc
文件系統提供了不同硬體設備和 Linux 內核的詳細信息。更多詳細信息,請參閱 Linux 內核 /proc 文檔。常見的 /proc
例子:
# cat /proc/cpuinfo
# cat /proc/meminfo
# cat /proc/zoneinfo
# cat /proc/mounts
27. Nagios - Linux 伺服器和網路監控
Nagios 是一款普遍使用的開源系統和網路監控軟體。您可以輕鬆地監控所有主機、網路設備和服務,當狀態異常和恢復正常時它都會發出警報通知。FAN 是「全自動 Nagios」的縮寫。FAN 的目標是提供包含由 Nagios 社區提供的大多數工具包的 Nagios 安裝。FAN 提供了標準 ISO 格式的 CD-Rom 鏡像,使安裝變得更加容易。除此之外,為了改善 Nagios 的用戶體驗,發行版還包含了大量的工具。
28. Cacti - 基於 Web 的 Linux 監控工具
Cacti 是一個完整的網路圖形化解決方案,旨在充分利用 RRDTool 的數據存儲和圖形功能。Cacti 提供了快速輪詢器、高級圖形模板、多種數據採集方法和用戶管理功能。這些功能被包裝在一個直觀易用的界面中,確保可以實現從區域網到擁有數百台設備的複雜網路上的安裝。它可以提供有關網路、CPU、內存、登錄用戶、Apache、DNS 伺服器等的數據。了解如何在 CentOS / RHEL 下 安裝和配置 Cacti 網路圖形化工具。
29. KDE 系統監控器 - 實時系統報告和圖形化顯示
KSysguard 是 KDE 桌面的網路化系統監控程序。這個工具可以通過 ssh 會話運行。它提供了許多功能,比如可以監控本地和遠程主機的客戶端-伺服器模式。前端圖形界面使用感測器來檢索信息。感測器可以返回簡單的值或更複雜的信息,如表格。每種類型的信息都有一個或多個顯示界面,並被組織成工作表的形式,這些工作表可以分別保存和載入。所以,KSysguard 不僅是一個簡單的任務管理器,還是一個控制大型伺服器平台的強大工具。
![Fig.05 KDE System Guard](/data/attachment/album/201802/23/003619r9blsmq55lgw1uss.png "Fig.05 KDE System Guard KDE task manager and performance monitor.")
圖 05:KDE System Guard {圖片來源:維基百科}
詳細用法,請參閱 KSysguard 手冊。
30. GNOME 系統監控器
系統監控程序能夠顯示系統基本信息,並監控系統進程、系統資源使用情況和文件系統。您還可以用其修改系統行為。雖然不如 KDE System Guard 強大,但它提供的基本信息對新用戶還是有用的:
- 顯示關於計算機硬體和軟體的各種基本信息
- Linux 內核版本
- GNOME 版本
- 硬體
- 安裝的內存
- 處理器和速度
- 系統狀況
- 可用磁碟空間
- 進程
- 內存和交換空間
- 網路使用情況
- 文件系統
- 列出所有掛載的文件系統及其基本信息
![Fig.06 The Gnome System Monitor application](/data/attachment/album/201802/23/003620wb8m90lmmp8e4wex.png "Fig.06 The Gnome System Monitor application")
圖 06:Gnome 系統監控程序
福利:其他工具
更多工具:
- nmap - 掃描伺服器的開放埠
- lsof - 列出打開的文件和網路連接等
- [ntop](https://www.cyberciti.biz/faq/debian-ubuntu-install-ntop-network-traffic-monitoring-software/ "Debian / Ubuntu Linux Install ntop To See Network Usage / Network Status") 基於網頁的工具 -
ntop
是查看網路使用情況的最佳工具,與top
命令之於進程的方式類似,即網路流量監控工具。您可以查看網路狀態和 UDP、TCP、DNS、HTTP 等協議的流量分發。 - Conky - X Window 系統下的另一個很好的監控工具。它具有很高的可配置性,能夠監視許多系統變數,包括 CPU 狀態、內存、交換空間、磁碟存儲、溫度、進程、網路介面、電池、系統消息和電子郵件等。
- GKrellM - 它可以用來監控 CPU 狀態、主內存、硬碟、網路介面、本地和遠程郵箱及其他信息。
- mtr -
mtr
將traceroute
和ping
程序的功能結合在一個網路診斷工具中。 - vtop - 圖形化活動監控終端
如果您有其他推薦的系統監控工具,歡迎在評論區分享。
關於作者
作者 Vivek Gite 是 nixCraft 的創建者,也是經驗豐富的系統管理員,以及 Linux 操作系統和 Unix shell 腳本的培訓師。他的客戶遍布全球,行業涉及 IT、教育、國防航天研究以及非營利部門等。您可以在 Twitter、Facebook 和 Google+ 上關注他。
via: https://www.cyberciti.biz/tips/top-linux-monitoring-tools.html
作者:Vivek Gite 譯者:jessie-pang 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive