從零開始,運用 Ruby 語言創建一個 DNS 查詢
大家好!前段時間我寫了一篇關於「如何用 Go 語言建立一個簡易的 DNS 解析器」的帖子。
那篇帖子里我沒寫有關「如何生成以及解析 DNS 查詢請求」的內容,因為我覺得這很無聊,不過一些夥計指出他們不知道如何解析和生成 DNS 查詢請求,並且對此很感興趣。
我開始好奇了——解析 DNS 能 花多大功夫?事實證明,編寫一段 120 行精巧的 Ruby 語言代碼組成的程序就可以做到,這並不是很困難。
所以,在這裡有一個如何生成 DNS 查詢請求,以及如何解析 DNS 響應報文的速成教學!我們會用 Ruby 語言完成這項任務,主要是因為不久以後我將在一場 Ruby 語言大會上發表觀點,而這篇博客帖的部分內容是為了那場演講做準備的。?
(我盡量讓不懂 Ruby 的人也能讀懂,我只使用了非常基礎的 Ruby 語言代碼。)
最後,我們就能製作一個非常簡易的 Ruby 版本的 dig
工具,能夠查找域名,就像這樣:
$ ruby dig.rb example.com
example.com 20314 A 93.184.216.34
整個程序大概 120 行左右,所以 並不 算多。(如果你想略過講解,單純想去讀代碼的話,最終程序在這裡:dig.rb。)
我們不會去實現之前帖中所說的「一個 DNS 解析器是如何運作的?」,因為我們已經做過了。
那麼我們開始吧!
如果你想從頭開始弄明白 DNS 查詢是如何格式化的,我將嘗試解釋如何自己弄明白其中的一些東西。大多數情況下的答案是「用 Wireshark 去解包」和「閱讀 RFC 1035,即 DNS 的規範」。
生成 DNS 查詢請求
步驟一:打開一個 UDP 套接字
我們需要實際發送我們的 DNS 查詢,因此我們就需要打開一個 UDP 套接字。我們會將我們的 DNS 查詢發送至 8.8.8.8
,即谷歌的伺服器。
下面是用於建立與 8.8.8.8
的 UDP 連接,埠為 53(DNS 埠)的代碼。
require 'socket'
sock = UDPSocket.new
sock.bind('0.0.0.0', 12345)
sock.connect('8.8.8.8', 53)
關於 UDP 的說明
關於 UDP,我不想說太多,但是我要說的是,計算機網路的基礎單位是「 數據包 」(即一串位元組),而在這個程序中,我們要做的是計算機網路中最簡單的事情:發送 1 個數據包,並接收 1 個數據包作為響應。
所以 UDP 是一個傳遞數據包的最簡單的方法。
它是發送 DNS 查詢最常用的方法,不過你還可以用 TCP 或者 DNS-over-HTTPS。
步驟二:從 Wireshark 複製一個 DNS 查詢
下一步:假設我們都不知道 DNS 是如何運作的,但我們還是想儘快發送一個能運行的 DNS 查詢。獲取 DNS 查詢並確保 UDP 連接正常工作的最簡單方法就是複製一個已經正常工作的 DNS 查詢!
所以這就是我們接下來要做的,使用 Wireshark (一個絕贊的數據包分析工具)。
我的操作大致如下:
- 打開 Wireshark,點擊 「 捕獲 」 按鈕。
- 在搜索欄輸入
udp.port == 53
作為篩選條件,然後按下回車。 - 在我的終端運行
ping example.com
(用來生成一個 DNS 查詢)。 - 點擊 DNS 查詢(顯示 「Standard query A example.com」)。 (「A」:查詢類型;「example.com」:域名;「Standard query」:查詢類型描述)
- 右鍵點擊位於左下角面板上的 「 域名系統(查詢) 」。
- 點擊 「 複製 」 ——> 「 作為十六進位流 」。
- 現在
b96201000001000000000000076578616d706c6503636f6d0000010001
就放到了我的剪貼板上,之後會用在我的 Ruby 程序里。好欸!
步驟三:解析 16 進位數據流並發送 DNS 查詢
現在我們能夠發送我們的 DNS 查詢到 8.8.8.8
了!就像這樣,我們只需要再加 5 行代碼:
hex_string = "b96201000001000000000000076578616d706c6503636f6d0000010001"
bytes = [hex_string].pack('H*')
sock.send(bytes, 0)
# get the reply
reply, _ = sock.recvfrom(1024)
puts reply.unpack('H*')
[hex_string].pack('H*')
意思就是將我們的 16 位字元串轉譯成一個位元組串。此時我們不知道這組數據到底是什麼意思,但是很快我們就會知道了。
我們還可以藉此機會運用 tcpdump
,確認程序是否正常進行以及發送有效數據。我是這麼做的:
- 在一個終端選項卡下執行
sudo tcpdump -ni any port 53 and host 8.8.8.8
命令 - 在另一個不同的終端指標卡下,運行 這個程序(
ruby dns-1.rb
)
以下是輸出結果:
$ sudo tcpdump -ni any port 53 and host 8.8.8.8
08:50:28.287440 IP 192.168.1.174.12345 > 8.8.8.8.53: 47458+ A? example.com. (29)
08:50:28.312043 IP 8.8.8.8.53 > 192.168.1.174.12345: 47458 1/0/0 A 93.184.216.34 (45)
非常棒 —— 我們可以看到 DNS 請求(」這個 example.com
的 IP 地址在哪裡?「)以及響應(「在93.184.216.34」)。所以一切運行正常。現在只需要(你懂的)—— 搞清我們是如何生成並解析這組數據的。
步驟四:學一點點 DNS 查詢的格式
現在我們有一個關於 example.com
的 DNS 查詢,讓我們了解它的含義。
下方是我們的查詢(16 位進位格式):
b96201000001000000000000076578616d706c6503636f6d0000010001
如果你在 Wireshark 上搜索,你就能看見這個查詢它由兩部分組成:
- 請求頭:
b96201000001000000000000
- 語句本身:
076578616d706c6503636f6d0000010001
步驟五:製作請求頭
我們這一步的目標就是製作位元組串 b96201000001000000000000
(藉助一個 Ruby 函數,而不是把它硬編碼出來)。
(LCTT 譯註: 硬編碼 指在軟體實現上,將輸出或輸入的相關參數(例如:路徑、輸出的形式或格式)直接以常量的方式撰寫在源代碼中,而非在運行期間由外界指定的設置、資源、數據或格式做出適當回應。)
那麼:請求頭是 12 個位元組。那些個 12 位元組到底意味著什麼呢?如果你在 Wireshark 里看看(亦或者閱讀 RFC-1035),你就能理解:它是由 6 個 2 位元組大小的數字串聯在一起組成的。
這六個數字分別對應查詢 ID、標誌,以及數據包內的問題計數、回答資源記錄數、權威名稱伺服器記錄數、附加資源記錄數。
我們還不需要在意這些都是些什麼東西 —— 我們只需要把這六個數字輸進去就行。
但所幸我們知道該輸哪六位數,因為我們就是為了直觀地生成字元串 b96201000001000000000000
。
所以這裡有一個製作請求頭的函數(注意:這裡沒有 return
,因為在 Ruby 語言里,如果處在函數最後一行是不需要寫 return
語句的):
def make_question_header(query_id)
# id, flags, num questions, num answers, num auth, num additional
[query_id, 0x0100, 0x0001, 0x0000, 0x0000, 0x0000].pack('nnnnnn')
end
上面內容非常的短,主要因為除了查詢 ID ,其餘所有內容都由我們硬編碼寫了出來。
什麼是 nnnnnn
?
可能能想知道 .pack('nnnnnn')
中的 nnnnnn
是個什麼意思。那是一個向 .pack()
函數解釋如何將那個 6 個數字組成的數據轉換成一個位元組串的一個格式字元串。
.pack
的文檔在 這裡,其中描述了 n
的含義其實是「將其表示為」 16 位無符號、網路(大端序)位元組序』」。
(LCTT 譯註: 大端序 :指將高位位元組存儲在低地址,低位位元組存儲在高地址的方式。)
16 個位等同於 2 位元組,同時我們需要用網路位元組序,因為這屬於計算機網路範疇。我不會再去解釋什麼是位元組序了(儘管我確實有 一幅自製漫畫嘗試去描述它)。
測試請求頭代碼
讓我們快速檢測一下我們的 make_question_header
函數運行情況。
puts make_question_header(0xb962) == ["b96201000001000000000000"].pack("H*")
這裡運行後輸出 true
的話,我們就成功了。
好了我們接著繼續。
步驟六:為域名進行編碼
下一步我們需要生成 問題本身(「example.com
的 IP 是什麼?」)。這裡有三個部分:
- 域名(比如說
example.com
) - 查詢類型(比如說
A
代表 「IPv4 Address」) - 查詢類(總是一樣的,
1
代表 INternet)
最麻煩的就是域名,讓我們寫個函數對付這個。
example.com
以 16 進位被編碼進一個 DNS 查詢中,如 076578616d706c6503636f6d00
。這有什麼含義嗎?
如果我們把這些位元組以 ASCII 值翻譯出來,結果會是這樣:
076578616d706c6503636f6d00
7 e x a m p l e 3 c o m 0
因此,每個段(如 example
)的前面都會顯示它的長度(7
)。
下面是有關將 example.com
翻譯成 7 e x a m p l e 3 c o m 0
的 Ruby 代碼:
def encode_domain_name(domain)
domain
.split(".")
.map { |x| x.length.chr + x }
.join + "