關於編譯代碼你應該知道的
用這個方便的捕鼠器比喻來理解編譯代碼。
源代碼必須要經過編譯才能夠運行程序,而對於開源軟體,每個人都可以獲取源代碼。無論你是自己編寫了代碼,想要編譯和運行它,還是下載了某人的項目來嘗試它,了解如何通過 編譯器 處理源代碼,以及編譯器如何處理這些代碼,這都很有用。
創建一個更好的捕鼠器
一般情況我們不會將一個捕鼠器比作電腦,但不管你信不信,它確實與你正在使用的設備(手機或電腦)的 CPU 有一些相似之處。經典的捕鼠器(我說的不是 ?)有兩種狀態:打開或者釋放。你可以認為 打開 是將捕鼠器設置好準備捕獲老鼠,以及 釋放 是捕鼠器被老鼠觸發。某種意義上來說,捕鼠器就像是一台有滑鼠的電腦。你可以想像一下這個代碼,用一種虛構的語言來描述這個過程:
if mousetrap == 0 then
There's a mouse!
else
There's no mouse yet.
end
換句話說,你可以基於捕鼠器的狀態發現是否有老鼠(數據)。當然,捕鼠器不是萬無一失的,有可能有一隻老鼠在捕鼠器旁邊,由於老鼠還沒有觸發捕鼠器,所以它的狀態還是 打開 的。因此該程序可以進行改進,這都是非常典型的。
開關
總的來說,捕鼠器就是一個開關。你會在家裡使用開關打開燈。可以從開關中獲得許多信息。比如,人們會從你家燈的狀態了解到你是否在家。
你可以根據鄰居家燈的狀態來改變行為。如果鄰居家所有的燈都熄滅了,那麼請關掉你大聲的音樂,因為人們可能已經上床睡覺了。
CPU 也使用這樣的邏輯,只不過乘以幾個數量級,縮小到了微觀級別。當 CPU 在特定寄存器上接收到電信號時,可以觸發其他一些寄存器,然後觸發另一個,以此類推。如果這些寄存器有特定的意義,那麼就可以通信。也許激活同一主板上某處的晶元,或者使 LED 亮起,或者改變屏幕上的像素顏色。
種瓜得瓜,種豆得豆。如果你真的想在多個位置而不是僅限於一處發現老鼠,但是你只有一個捕鼠器,那你應該開發一個應用才行。使用網路攝像頭和一些基本的圖像識別軟體,你可以建立空廚房的模型,然後掃描變化。當老鼠進入廚房,在原先沒有老鼠的圖像上會有像素的變化。記錄下這些數據,如果有無人機可以追蹤老鼠並捕獲會更好,這樣就可以將老鼠趕出廚房了。這時,你通過打開和關閉信號的魔法,創造了一個更好的捕鼠器。
編譯器
代碼編譯器將人們可閱讀的代碼轉換成 CPU 可以理解的機器語言。這是非常複雜的過程,因為 CPU 非常複雜(甚至比捕鼠器更加複雜),同時因為該過程比嚴格「需要」的更加靈活。並不是所有的編譯器都很靈活。有一些編譯器只有一個目標,它們只會處理特定格式的代碼文件,處理過程也因此而簡單明了。
幸運的是,現代的通用編譯器並不簡單。它們允許你編寫不同語言的代碼,也允許你用不同的方式鏈接庫文件,並且可以生成運行在不同架構上的文件。GNU 編譯器集合(GCC)的 gcc
編譯器 --help
會輸出超過 50 行的選項,LLVM 的 clang
編譯器的 --help
輸出超過 1000 行。GCC 指導手冊的字數超過 10 萬。
當你在編譯代碼時會有很多選項。
當然,大多數人並不需要知道所有的選項。我從未讀過 GCC 的手冊頁,因為它們是針對 Objective-C、Fortran 以及我從未聽說過的晶元架構的。不過我重視它將代碼編譯為不同的架構 —— 64 位或者 32 位 —— 的能力,以及在其他行業已經落後的計算機上運行開源軟體的能力。
編譯生命周期
同樣重要的是,理解編譯代碼的不同階段。這是一個簡單的 C 語言程序的生命周期:
- 帶有宏定義的 C 源代碼
.c
文件,用cpp
預處理為.i
文件。 - 擴展了宏定義的 C 源代碼
.i
文件,會被gcc
轉譯成.s
文件。 - 以彙編語言寫的文本文件
.s
文件被彙編為目標.o
文件。 - 帶有 CPU 指令的二進位目標代碼,以及其他目標文件和庫
*.o
文件,以內存區域無關的偏移量,使用ld
鏈接以生成可執行文件。 - 最終的二進位文件要麼包含所有需要的目標,要麼設置以動態鏈接庫
*.so
文件載入。
你可以試試這個簡單示例(可能需要對庫路徑做一些調整):
$ cat << EOF >> hello.c
#include
int main(void)
{ printf("hello worldn");
return 0; }
EOF
$ cpp hello.c > hello.i
$ gcc -S hello.i
$ as -o hello.o hello.s
$ ld -static -o hello
-L/usr/lib64/gcc/x86_64-slackware-linux/5.5.0/
/usr/lib64/crt1.o /usr/lib64/crti.o hello.o
/usr/lib64/crtn.o --start-group -lc -lgcc
-lgcc_eh --end-group
$ ./hello
hello world
可獲得的知識
計算機已經變得非常強大,並且用戶友好。請不要走向這兩種可能的極端中的任何一種:計算機不像捕鼠器和電燈開關那麼簡單,但它們也不是無法理解的。你可以了解編譯代碼、如何鏈接以及針對不同架構進行編譯。一旦你知道了,你就可以更好地調試代碼。你可以理解你下載的代碼,甚至可以修復其中的一兩個錯誤。同時從理論上來講,你可以建造一個更好的捕鼠器,或者用捕鼠器造一個 CPU。由你決定。
via: https://opensource.com/article/22/10/compiling-code
作者:Alan Smithee 選題:lkxed 譯者:Donkey-Hao 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive