當你在 Linux 上啟動一個進程時會發生什麼？

本文是關於 fork 和 exec 是如何在 Unix 上工作的。你或許已經知道，也有人還不知道。幾年前當我了解到這些時，我驚嘆不已。

我們要做的是啟動一個進程。我們已經在博客上討論了很多關於系統調用的問題，每當你啟動一個進程或者打開一個文件，這都是一個系統調用。所以你可能會認為有這樣的系統調用：

start_process(["ls", "-l", "my_cool_directory"])

這是一個合理的想法，顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是，這並不是 Linux 上的工作原理。但是，我查閱了文檔，確實有一個 posix_spawn 的系統調用基本上是這樣做的，不過這不在本文的討論範圍內。

fork 和 exec

Linux 上的 posix_spawn 是通過兩個系統調用實現的，分別是 fork 和 exec（實際上是 execve），這些都是人們常常使用的。儘管在 OS X 上，人們使用 posix_spawn，而 fork 和 exec 是不提倡的，但我們將討論的是 Linux。

Linux 中的每個進程都存在於「進程樹」中。你可以通過運行 pstree 命令查看進程樹。樹的根是 init，進程號是 1。每個進程（init 除外）都有一個父進程，一個進程都可以有很多子進程。

所以，假設我要啟動一個名為 ls 的進程來列出一個目錄。我是不是只要發起一個進程 ls 就好了呢？不是的。

我要做的是，創建一個子進程，這個子進程是我（me）本身的一個克隆，然後這個子進程的「腦子」被吃掉了，變成 ls。

開始是這樣的：

my parent
    |- me

然後運行 fork()，生成一個子進程，是我（me）自己的一份克隆：

my parent
    |- me
       |-- clone of me

然後我讓該子進程運行 exec("ls")，變成這樣：

my parent
    |- me
       |-- ls

當 ls 命令結束後，我幾乎又變回了我自己：

my parent
    |- me
       |-- ls (zombie)

在這時 ls 其實是一個殭屍進程。這意味著它已經死了，但它還在等我，以防我需要檢查它的返回值（使用 wait 系統調用）。一旦我獲得了它的返回值，我將再次恢復獨自一人的狀態。

my parent
    |- me

fork 和 exec 的代碼實現

如果你要編寫一個 shell，這是你必須做的一個練習（這是一個非常有趣和有啟發性的項目。Kamal 在 Github 上有一個很棒的研討會：https://github.com/kamalmarhubi/shell-workshop）。

事實證明，有了 C 或 Python 的技能，你可以在幾個小時內編寫一個非常簡單的 shell，像 bash 一樣。（至少如果你旁邊能有個人多少懂一點，如果沒有的話用時會久一點。）我已經完成啦，真的很棒。

這就是 fork 和 exec 在程序中的實現。我寫了一段 C 的偽代碼。請記住，fork 也可能會失敗哦。

int pid = fork();
// 我要分身啦
// 「我」是誰呢？可能是子進程也可能是父進程
if (pid == 0) {
    // 我現在是子進程
    // 「ls」 吃掉了我腦子，然後變成一個完全不一樣的進程
    exec(["ls"])
} else if (pid == -1) {
    // 天啊，fork 失敗了，簡直是災難！
} else {
    // 我是父進程耶
    // 繼續做一個酷酷的美男子吧
    // 需要的話，我可以等待子進程結束
}

上文提到的「腦子被吃掉」是什麼意思呢？

進程有很多屬性：

打開的文件（包括打開的網路連接）
環境變數
信號處理程序（在程序上運行 Ctrl + C 時會發生什麼？）
內存（你的「地址空間」）
寄存器
可執行文件（/proc/$pid/exe）
cgroups 和命名空間（與 Linux 容器相關）
當前的工作目錄
運行程序的用戶
其他我還沒想到的

當你運行 execve 並讓另一個程序吃掉你的腦子的時候，實際上幾乎所有東西都是相同的！你們有相同的環境變數、信號處理程序和打開的文件等等。

唯一改變的是，內存、寄存器以及正在運行的程序，這可是件大事。

為何 fork 並非那麼耗費資源（寫入時複製）

你可能會問：「如果我有一個使用了 2GB 內存的進程，這是否意味著每次我啟動一個子進程，所有 2 GB 的內存都要被複制一次？這聽起來要耗費很多資源！」

事實上，Linux 為 fork() 調用實現了寫時複製 copy on write ，對於新進程的 2GB 內存來說，就像是「看看舊的進程就好了，是一樣的！」。然後，當如果任一進程試圖寫入內存，此時系統才真正地複製一個內存的副本給該進程。如果兩個進程的內存是相同的，就不需要複製了。

為什麼你需要知道這麼多

你可能會說，好吧，這些細節聽起來很厲害，但為什麼這麼重要？關於信號處理程序或環境變數的細節會被繼承嗎？這對我的日常編程有什麼實際影響呢？

有可能哦！比如說，在 Kamal 的博客上有一個很有意思的 bug。它討論了 Python 如何使信號處理程序忽略了 SIGPIPE。也就是說，如果你從 Python 里運行一個程序，默認情況下它會忽略 SIGPIPE！這意味著，程序從 Python 腳本和從 shell 啟動的表現會有所不同。在這種情況下，它會造成一個奇怪的問題。

所以，你的程序的環境（環境變數、信號處理程序等）可能很重要，都是從父進程繼承來的。知道這些，在調試時是很有用的。

via: https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/

作者：Julia Evans 譯者：jessie-pang 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

當你在 Linux 上啟動一個進程時會發生什麼？

fork 和 exec

fork 和 exec 的代碼實現

上文提到的「腦子被吃掉」是什麼意思呢？

為何 fork 並非那麼耗費資源（寫入時複製）

為什麼你需要知道這麼多

對這篇文章感覺如何？

剖析內存中的程序之秘

在 Ubuntu 上體驗 LXD 容器

Leave a reply 取消回復

More in:Linux中國

捐贈 Let's Encrypt，共建安全的互聯網

Let's Encrypt 正式發布，已經保護 380 萬個域名

關於Linux防火牆iptables的面試問答

Lets Encrypt 已被所有主流瀏覽器所信任

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

使用 Linux 命令行解決Wordle 問題

5本學習 TeX 的最佳免費書籍

Makefile 簡介

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

更開放的分散式事務 | Fescar 品牌升級，更名為 Seata

HeRM’s – 一個命令食譜管理器

使用 Let's Encrypt 保護你的網站

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

fork 和 exec

fork 和 exec 的代碼實現

上文提到的「腦子被吃掉」是什麼意思呢？

為何 fork 並非那麼耗費資源（寫入時複製）

為什麼你需要知道這麼多

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤