如何在 Linux 上殺死一個殭屍進程
這裡有一個和 Unix 紀元一樣古老的故事。自從有了 C 和 Unix,以及(後來的)Linux,我們就有了「 殭屍 」。具體來說,有一些進程被標記為「 殭屍進程 」。一些人誤解它,另一些人忽視它,而它對我們許多人試圖 「殺死」 這些進程的努力免疫,沒有什麼成效。這是為什麼呢?
Linux 中的進程是什麼?
這一切始於執行 Linux 中的一個程序時,當它被執行時,它的運行實例被稱為進程。你可以用 ps 命令 查看你的 Linux 環境中的所有進程:
$ ps -ax
PID TTY STAT TIME COMMAND
1 ? Ss 0:01 /usr/lib/systemd/systemd rhgb --switched-root --sys
2 ? S 0:00 [kthreadd]
3 ? I< 0:00 [rcu_gp]
4 ? I< 0:00 [rcu_par_gp]
有時一個進程啟動另一個進程,使第一個進程成為第二個進程的父進程。pstree
命令是一個很好的工具,可以讓你看到系統中進程的「家譜」:
$ pstree -psn
systemd(1)─┬─systemd-journal(952)
├─systemd-udevd(963)
├─systemd-oomd(1137)
├─systemd-resolve(1138)
├─systemd-userdbd(1139)─┬─systemd-userwor(12707)
│ ├─systemd-userwor(12714)
│ └─systemd-userwor(12715)
├─auditd(1140)───{auditd}(1141)
├─dbus-broker-lau(1164)───dbus-broker(1165)
├─avahi-daemon(1166)───avahi-daemon(1196)
├─bluetoothd(1167)
每個進程在系統中都會被分配一個編號。進程編號(PID)1 被分配給啟動過程中執行的第一個進程,PID 1 之後的每一個進程都是它的子孫。PID 1 進程是初始化進程,在大多數新版本的 Linux 中,它只是一個指向 systemd
程序的符號鏈接。
用 kill 命令結束一個進程
你可以用 kill
命令來終止 Linux 系統中的進程。儘管名字叫 「殺死」,但 kill
命令和其他一些命令,如 pkill
和 killall
,都是為向一個或多個進程發送信號而編寫/設計的。當沒有指定信號時,它發送的默認信號是 SIGTERM
信號,以終止進程。
當一個父進程死亡或被殺死,而其子進程沒有跟隨其父進程的死亡,我們稱該進程為「 孤兒進程 」。
如何殺死一個殭屍進程
另一方面,殭屍進程是不能被「殺死」的!你可能會問為什麼?因為它們已經死了!
每一個子進程,當被終止時,都會成為一個殭屍進程,然後被父進程刪除。當進程退出並釋放它所使用的資源時,它的名字仍然在操作系統的進程表中。這時,父進程的工作就是把它的名字從進程表中刪除。如果沒有刪除,我們就有了殭屍進程,它不再是一個真正的進程,而只是操作系統進程表上的一個條目。
這就是為什麼試圖對一個 失效的 (殭屍)進程執行 「殺死」 命令,即使使用 -9
(SIGKILL
)選項也不起作用,因為沒有什麼可以殺死的。
因此,要殺死一個殭屍進程,比如從進程列表(進程表)中刪除其名稱,你必須殺死其父進程。例如,如果 PID 5878 是一個殭屍進程,而它的父進程是 PID 4809,那麼要殺死殭屍進程(5878),就必須結束父進程(4809):
$ sudo kill -9 4809 # 4809 是父進程,而非殭屍
我對殭屍的最後一句警告:在殺死父進程時要非常小心。如果一個進程的父進程是 PID 1,而你殺了它,你就會重新啟動自己!
而這將是一個更可怕的故事!
via: https://opensource.com/article/21/10/linux-zombie-process
作者:Anderson Silva 選題:lujun9972 譯者:wxy 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive