Podman:一個更安全的運行容器的方式
在進入本文的主要主題 Podman 和容器之前,我需要了解一點 Linux 審計功能的技術。
什麼是審計?
Linux 內核有一個有趣的安全功能,叫做審計。它允許管理員在系統上監視安全事件,並將它們記錄到audit.log
中,該文件可以本地存儲或遠程存儲在另一台機器上,以防止黑客試圖掩蓋他的蹤跡。
/etc/shadow
文件是一個經常要監控的安全文件,因為向其添加記錄可能允許攻擊者獲得對系統的訪問許可權。管理員想知道是否有任何進程修改了該文件,你可以通過執行以下命令來執行此操作:
# auditctl -w /etc/shadow
現在讓我們看看當我修改了 /etc/shadow
文件會發生什麼:
# touch /etc/shadow
# ausearch -f /etc/shadow -i -ts recent
type=PROCTITLE msg=audit(10/10/2018 09:46:03.042:4108) : proctitle=touch /etc/shadow type=SYSCALL msg=audit(10/10/2018 09:46:03.042:4108) : arch=x86_64 syscall=openat success=yes exit=3 a0=0xffffff9c a1=0x7ffdb17f6704 a2=O_WRONLY|O_CREAT|O_NOCTTY| O_NONBLOCK a3=0x1b6 items=2 ppid=2712 pid=3727 auid=dwalsh uid=root gid=root euid=root suid=root fsuid=root egid=root sgid=root fsgid=root tty=pts1 ses=3 comm=touch exe=/usr/bin/touch subj=unconfined_u:unconfined_r:unconfined_t:s0-s0:c0.c1023 key=(null)`
審計記錄中有很多信息,但我重點注意到它記錄了 root 修改了 /etc/shadow
文件,並且該進程的審計 UID(auid
)的所有者是 dwalsh
。
內核修改了這個文件了么?
跟蹤登錄 UID
登錄 UID(loginuid
),存儲在 /proc/self/loginuid
中,它是系統上每個進程的 proc 結構的一部分。該欄位只能設置一次;設置後,內核將不允許任何進程重置它。
當我登錄系統時,登錄程序會為我的登錄過程設置 loginuid
欄位。
我(dwalsh
)的 UID 是 3267。
$ cat /proc/self/loginuid
3267
現在,即使我變成了 root,我的登錄 UID 仍將保持不變。
$ sudo cat /proc/self/loginuid
3267
請注意,從初始登錄過程 fork 並 exec 的每個進程都會自動繼承 loginuid
。這就是內核知道登錄的人是 dwalsh
的方式。
容器
現在讓我們來看看容器。
sudo podman run fedora cat /proc/self/loginuid
3267
甚至容器進程也保留了我的 loginuid
。 現在讓我們用 Docker 試試。
sudo docker run fedora cat /proc/self/loginuid
4294967295
為什麼不一樣?
Podman 對於容器使用傳統的 fork/exec 模型,因此容器進程是 Podman 進程的後代。Docker 使用客戶端/伺服器模型。我執行的 docker
命令是 Docker 客戶端工具,它通過客戶端/伺服器操作與 Docker 守護進程通信。然後 Docker 守護程序創建容器並處理 stdin/stdout 與 Docker 客戶端工具的通信。
進程的默認 loginuid
(在設置 loginuid
之前)是 4294967295
(LCTT 譯註:2 32 - 1)。由於容器是 Docker 守護程序的後代,而 Docker 守護程序是 init 系統的子代,所以,我們看到 systemd、Docker 守護程序和容器進程全部具有相同的 loginuid
:4294967295
,審計系統視其為未設置審計 UID。
cat /proc/1/loginuid
4294967295
怎麼會被濫用?
讓我們來看看如果 Docker 啟動的容器進程修改 /etc/shadow
文件會發生什麼。
$ sudo docker run --privileged -v /:/host fedora touch /host/etc/shadow
$ sudo ausearch -f /etc/shadow -i type=PROCTITLE msg=audit(10/10/2018 10:27:20.055:4569) : proctitle=/usr/bin/coreutils --coreutils-prog-shebang=touch /usr/bin/touch /host/etc/shadow type=SYSCALL msg=audit(10/10/2018 10:27:20.055:4569) : arch=x86_64 syscall=openat success=yes exit=3 a0=0xffffff9c a1=0x7ffdb6973f50 a2=O_WRONLY|O_CREAT|O_NOCTTY| O_NONBLOCK a3=0x1b6 items=2 ppid=11863 pid=11882 auid=unset uid=root gid=root euid=root suid=root fsuid=root egid=root sgid=root fsgid=root tty=(none) ses=unset comm=touch exe=/usr/bin/coreutils subj=system_u:system_r:spc_t:s0 key=(null)
在 Docker 情形中,auid
是未設置的(4294967295
);這意味著安全人員可能知道有進程修改了 /etc/shadow
文件但身份丟失了。
如果該攻擊者隨後刪除了 Docker 容器,那麼在系統上誰修改 /etc/shadow
文件將沒有任何跟蹤信息。
現在讓我們看看相同的場景在 Podman 下的情況。
$ sudo podman run --privileged -v /:/host fedora touch /host/etc/shadow
$ sudo ausearch -f /etc/shadow -i type=PROCTITLE msg=audit(10/10/2018 10:23:41.659:4530) : proctitle=/usr/bin/coreutils --coreutils-prog-shebang=touch /usr/bin/touch /host/etc/shadow type=SYSCALL msg=audit(10/10/2018 10:23:41.659:4530) : arch=x86_64 syscall=openat success=yes exit=3 a0=0xffffff9c a1=0x7fffdffd0f34 a2=O_WRONLY|O_CREAT|O_NOCTTY| O_NONBLOCK a3=0x1b6 items=2 ppid=11671 pid=11683 auid=dwalsh uid=root gid=root euid=root suid=root fsuid=root egid=root sgid=root fsgid=root tty=(none) ses=3 comm=touch exe=/usr/bin/coreutils subj=unconfined_u:system_r:spc_t:s0 key=(null)
由於它使用傳統的 fork/exec 方式,因此 Podman 正確記錄了所有內容。
這只是觀察 /etc/shadow
文件的一個簡單示例,但審計系統對於觀察系統上的進程非常有用。使用 fork/exec 容器運行時(而不是客戶端/伺服器容器運行時)來啟動容器允許你通過審計日誌記錄保持更好的安全性。
最後的想法
在啟動容器時,與客戶端/伺服器模型相比,fork/exec 模型還有許多其他不錯的功能。例如,systemd 功能包括:
SD_NOTIFY
:如果將 Podman 命令放入 systemd 單元文件中,容器進程可以通過 Podman 返回通知,表明服務已準備好接收任務。這是在客戶端/伺服器模式下無法完成的事情。- 套接字激活:你可以將連接的套接字從 systemd 傳遞到 Podman,並傳遞到容器進程以便使用它們。這在客戶端/伺服器模型中是不可能的。
在我看來,其最好的功能是作為非 root 用戶運行 Podman 和容器。這意味著你永遠不會在宿主機上授予用戶 root 許可權,而在客戶端/伺服器模型中(如 Docker 使用的),你必須打開以 root 身份運行的特權守護程序的套接字來啟動容器。在那裡,你將受到守護程序中實現的安全機制與宿主機操作系統中實現的安全機制的支配 —— 這是一個危險的主張。
via: https://opensource.com/article/18/10/podman-more-secure-way-run-containers
作者:Daniel J Walsh 選題:lujun9972 譯者:wxy 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive