Linux中國

當你在 Linux 上啟動一個進程時會發生什麼?

本文是關於 forkexec 是如何在 Unix 上工作的。你或許已經知道,也有人還不知道。幾年前當我了解到這些時,我驚嘆不已。

我們要做的是啟動一個進程。我們已經在博客上討論了很多關於系統調用的問題,每當你啟動一個進程或者打開一個文件,這都是一個系統調用。所以你可能會認為有這樣的系統調用:

start_process(["ls", "-l", "my_cool_directory"])

這是一個合理的想法,顯然這是它在 DOS 或 Windows 中的工作原理。我想說的是,這並不是 Linux 上的工作原理。但是,我查閱了文檔,確實有一個 posix_spawn 的系統調用基本上是這樣做的,不過這不在本文的討論範圍內。

forkexec

Linux 上的 posix_spawn 是通過兩個系統調用實現的,分別是 forkexec(實際上是 execve),這些都是人們常常使用的。儘管在 OS X 上,人們使用 posix_spawn,而 forkexec 是不提倡的,但我們將討論的是 Linux。

Linux 中的每個進程都存在於「進程樹」中。你可以通過運行 pstree 命令查看進程樹。樹的根是 init,進程號是 1。每個進程(init 除外)都有一個父進程,一個進程都可以有很多子進程。

所以,假設我要啟動一個名為 ls 的進程來列出一個目錄。我是不是只要發起一個進程 ls 就好了呢?不是的。

我要做的是,創建一個子進程,這個子進程是我(me)本身的一個克隆,然後這個子進程的「腦子」被吃掉了,變成 ls

開始是這樣的:

my parent
    |- me

然後運行 fork(),生成一個子進程,是我(me)自己的一份克隆:

my parent
    |- me
       |-- clone of me

然後我讓該子進程運行 exec("ls"),變成這樣:

my parent
    |- me
       |-- ls

當 ls 命令結束後,我幾乎又變回了我自己:

my parent
    |- me
       |-- ls (zombie)

在這時 ls 其實是一個殭屍進程。這意味著它已經死了,但它還在等我,以防我需要檢查它的返回值(使用 wait 系統調用)。一旦我獲得了它的返回值,我將再次恢復獨自一人的狀態。

my parent
    |- me

fork 和 exec 的代碼實現

如果你要編寫一個 shell,這是你必須做的一個練習(這是一個非常有趣和有啟發性的項目。Kamal 在 Github 上有一個很棒的研討會:https://github.com/kamalmarhubi/shell-workshop)。

事實證明,有了 C 或 Python 的技能,你可以在幾個小時內編寫一個非常簡單的 shell,像 bash 一樣。(至少如果你旁邊能有個人多少懂一點,如果沒有的話用時會久一點。)我已經完成啦,真的很棒。

這就是 forkexec 在程序中的實現。我寫了一段 C 的偽代碼。請記住,fork 也可能會失敗哦。

int pid = fork();
// 我要分身啦
// 「我」是誰呢?可能是子進程也可能是父進程
if (pid == 0) {
    // 我現在是子進程
    // 「ls」 吃掉了我腦子,然後變成一個完全不一樣的進程
    exec(["ls"])
} else if (pid == -1) {
    // 天啊,fork 失敗了,簡直是災難!
} else {
    // 我是父進程耶
    // 繼續做一個酷酷的美男子吧
    // 需要的話,我可以等待子進程結束
}

上文提到的「腦子被吃掉」是什麼意思呢?

進程有很多屬性:

  • 打開的文件(包括打開的網路連接)
  • 環境變數
  • 信號處理程序(在程序上運行 Ctrl + C 時會發生什麼?)
  • 內存(你的「地址空間」)
  • 寄存器
  • 可執行文件(/proc/$pid/exe
  • cgroups 和命名空間(與 Linux 容器相關)
  • 當前的工作目錄
  • 運行程序的用戶
  • 其他我還沒想到的

當你運行 execve 並讓另一個程序吃掉你的腦子的時候,實際上幾乎所有東西都是相同的! 你們有相同的環境變數、信號處理程序和打開的文件等等。

唯一改變的是,內存、寄存器以及正在運行的程序,這可是件大事。

為何 fork 並非那麼耗費資源(寫入時複製)

你可能會問:「如果我有一個使用了 2GB 內存的進程,這是否意味著每次我啟動一個子進程,所有 2 GB 的內存都要被複制一次?這聽起來要耗費很多資源!」

事實上,Linux 為 fork() 調用實現了 寫時複製 copy on write ,對於新進程的 2GB 內存來說,就像是「看看舊的進程就好了,是一樣的!」。然後,當如果任一進程試圖寫入內存,此時系統才真正地複製一個內存的副本給該進程。如果兩個進程的內存是相同的,就不需要複製了。

為什麼你需要知道這麼多

你可能會說,好吧,這些細節聽起來很厲害,但為什麼這麼重要?關於信號處理程序或環境變數的細節會被繼承嗎?這對我的日常編程有什麼實際影響呢?

有可能哦!比如說,在 Kamal 的博客上有一個很有意思的 bug。它討論了 Python 如何使信號處理程序忽略了 SIGPIPE。也就是說,如果你從 Python 里運行一個程序,默認情況下它會忽略 SIGPIPE!這意味著,程序從 Python 腳本和從 shell 啟動的表現會有所不同。在這種情況下,它會造成一個奇怪的問題。

所以,你的程序的環境(環境變數、信號處理程序等)可能很重要,都是從父進程繼承來的。知道這些,在調試時是很有用的。

via: https://jvns.ca/blog/2016/10/04/exec-will-eat-your-brain/

作者:Julia Evans 譯者:jessie-pang 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國