Linux中國

關於編譯代碼你應該知道的

用這個方便的捕鼠器比喻來理解編譯代碼。

源代碼必須要經過編譯才能夠運行程序,而對於開源軟體,每個人都可以獲取源代碼。無論你是自己編寫了代碼,想要編譯和運行它,還是下載了某人的項目來嘗試它,了解如何通過 編譯器 處理源代碼,以及編譯器如何處理這些代碼,這都很有用。

創建一個更好的捕鼠器

一般情況我們不會將一個捕鼠器比作電腦,但不管你信不信,它確實與你正在使用的設備(手機或電腦)的 CPU 有一些相似之處。經典的捕鼠器(我說的不是 ?)有兩種狀態:打開或者釋放。你可以認為 打開 是將捕鼠器設置好準備捕獲老鼠,以及 釋放 是捕鼠器被老鼠觸發。某種意義上來說,捕鼠器就像是一台有滑鼠的電腦。你可以想像一下這個代碼,用一種虛構的語言來描述這個過程:

if mousetrap == 0 then
  There's a mouse!
else
  There's no mouse yet.
end

換句話說,你可以基於捕鼠器的狀態發現是否有老鼠(數據)。當然,捕鼠器不是萬無一失的,有可能有一隻老鼠在捕鼠器旁邊,由於老鼠還沒有觸發捕鼠器,所以它的狀態還是 打開 的。因此該程序可以進行改進,這都是非常典型的。

開關

總的來說,捕鼠器就是一個開關。你會在家裡使用開關打開燈。可以從開關中獲得許多信息。比如,人們會從你家燈的狀態了解到你是否在家。

你可以根據鄰居家燈的狀態來改變行為。如果鄰居家所有的燈都熄滅了,那麼請關掉你大聲的音樂,因為人們可能已經上床睡覺了。

CPU 也使用這樣的邏輯,只不過乘以幾個數量級,縮小到了微觀級別。當 CPU 在特定寄存器上接收到電信號時,可以觸發其他一些寄存器,然後觸發另一個,以此類推。如果這些寄存器有特定的意義,那麼就可以通信。也許激活同一主板上某處的晶元,或者使 LED 亮起,或者改變屏幕上的像素顏色。

種瓜得瓜,種豆得豆。如果你真的想在多個位置而不是僅限於一處發現老鼠,但是你只有一個捕鼠器,那你應該開發一個應用才行。使用網路攝像頭和一些基本的圖像識別軟體,你可以建立空廚房的模型,然後掃描變化。當老鼠進入廚房,在原先沒有老鼠的圖像上會有像素的變化。記錄下這些數據,如果有無人機可以追蹤老鼠並捕獲會更好,這樣就可以將老鼠趕出廚房了。這時,你通過打開和關閉信號的魔法,創造了一個更好的捕鼠器。

編譯器

代碼編譯器將人們可閱讀的代碼轉換成 CPU 可以理解的機器語言。這是非常複雜的過程,因為 CPU 非常複雜(甚至比捕鼠器更加複雜),同時因為該過程比嚴格「需要」的更加靈活。並不是所有的編譯器都很靈活。有一些編譯器只有一個目標,它們只會處理特定格式的代碼文件,處理過程也因此而簡單明了。

幸運的是,現代的通用編譯器並不簡單。它們允許你編寫不同語言的代碼,也允許你用不同的方式鏈接庫文件,並且可以生成運行在不同架構上的文件。GNU 編譯器集合(GCC)的 gcc 編譯器 --help 會輸出超過 50 行的選項,LLVM 的 clang 編譯器的 --help 輸出超過 1000 行。GCC 指導手冊的字數超過 10 萬。

當你在編譯代碼時會有很多選項。

當然,大多數人並不需要知道所有的選項。我從未讀過 GCC 的手冊頁,因為它們是針對 Objective-C、Fortran 以及我從未聽說過的晶元架構的。不過我重視它將代碼編譯為不同的架構 —— 64 位或者 32 位 —— 的能力,以及在其他行業已經落後的計算機上運行開源軟體的能力。

編譯生命周期

同樣重要的是,理解編譯代碼的不同階段。這是一個簡單的 C 語言程序的生命周期:

  1. 帶有宏定義的 C 源代碼 .c 文件,用 cpp 預處理為 .i 文件。
  2. 擴展了宏定義的 C 源代碼 .i 文件,會被 gcc 轉譯成 .s 文件。
  3. 以彙編語言寫的文本文件 .s 文件被彙編為目標 .o 文件。
  4. 帶有 CPU 指令的二進位目標代碼,以及其他目標文件和庫 *.o 文件,以內存區域無關的偏移量,使用 ld 鏈接以生成可執行文件。
  5. 最終的二進位文件要麼包含所有需要的目標,要麼設置以動態鏈接庫 *.so 文件載入。

你可以試試這個簡單示例(可能需要對庫路徑做一些調整):

$ cat << EOF >> hello.c
 #include
 int main(void)
 { printf("hello worldn");
   return 0; }
   EOF
$ cpp hello.c > hello.i
$ gcc -S hello.i
$ as -o hello.o hello.s
$ ld -static -o hello 
  -L/usr/lib64/gcc/x86_64-slackware-linux/5.5.0/ 
  /usr/lib64/crt1.o /usr/lib64/crti.o hello.o 
  /usr/lib64/crtn.o  --start-group -lc -lgcc 
  -lgcc_eh --end-group
$ ./hello
hello world

可獲得的知識

計算機已經變得非常強大,並且用戶友好。請不要走向這兩種可能的極端中的任何一種:計算機不像捕鼠器和電燈開關那麼簡單,但它們也不是無法理解的。你可以了解編譯代碼、如何鏈接以及針對不同架構進行編譯。一旦你知道了,你就可以更好地調試代碼。你可以理解你下載的代碼,甚至可以修復其中的一兩個錯誤。同時從理論上來講,你可以建造一個更好的捕鼠器,或者用捕鼠器造一個 CPU。由你決定。

via: https://opensource.com/article/22/10/compiling-code

作者:Alan Smithee 選題:lkxed 譯者:Donkey-Hao 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國