Linux中國

HTTP 簡史

譯註:本文來源於 2013 年出版的《High Performance Browser Networking》的第九章,因此有些信息略有過時。事實上,現在 HTTP/2 已經有相當的不是,而新的 HTTP/3 也在設計和標準制定當中。

介紹

超文本傳輸協議 Hypertext Transfer Protocol (HTTP)是互聯網上最普遍和廣泛採用的應用程序協議之一。它是客戶端和伺服器之間的通用語言,支持現代 Web。從最初作為單個的關鍵字和文檔路徑開始,它已成為不僅僅是瀏覽器的首選協議,而且幾乎是所有連接互聯網硬體和軟體應用程序的首選協議。

在本文中,我們將簡要回顧 HTTP 協議的發展歷史。對 HTTP 不同語義的完整討論超出了本文的範圍,但理解 HTTP 的關鍵設計變更以及每個變更背後的動機將為我們討論 HTTP 性能提供必要的背景,特別是在 HTTP/2 中即將進行的許多改進。

HTTP 0.9: 單行協議

蒂姆·伯納斯·李 Tim Berners-Lee 最初的 HTTP 提案在設計時考慮到了簡單性,以幫助他採用他的另一個新想法: 萬維網 World Wide Web 。這個策略看起來奏效了:注意,他是一個有抱負的協議設計者。

1991 年,伯納斯·李概述了這個新協議的動機,並列出了幾個高級設計目標:文件傳輸功能、請求超文檔存檔索引搜索的能力,格式協商以及將客戶端引用到另一個伺服器的能力。為了證明該理論的實際應用,構建了一個簡單原型,它實現了所提議功能的一小部分。

  • 客戶端請求是一個 ASCII 字元串。
  • 客戶端請求以回車符(CRLF)終止。
  • 伺服器響應是 ASCII 字元流。
  • 伺服器響應是一種超文本標記語言(HTML)。
  • 文檔傳輸完成後連接終止。

然而,即使這聽起來也比實際複雜得多。這些規則支持的是一種非常簡單的,對 Telnet 友好的協議,一些 Web 伺服器至今仍然支持這種協議:

$> telnet google.com 80

Connected to 74.125.xxx.xxx

GET /about/

(hypertext response)
(connection closed)

請求包含這樣一行:GET 方法和請求文檔的路徑。響應是一個超文本文檔,沒有標題或任何其他元數據,只有 HTML。真的是再簡單不過了。此外,由於之前的交互是預期協議的子集,因此它獲得了一個非官方的 HTTP 0.9 標籤。其餘的,就像他們所說的,都是歷史。

從 1991 年這些不起眼的開始,HTTP 就有了自己的生命,並在接下來幾年裡迅速發展。讓我們快速回顧一下 HTTP 0.9 的特性:

  • 採用客戶端-伺服器架構,是一種請求-響應協議。
  • 採用 ASCII 協議,運行在 TCP/IP 鏈路上。
  • 旨在傳輸超文本文檔(HTML)。
  • 每次請求後,伺服器和客戶端之間的連接都將關閉。

流行的 Web 伺服器,如 Apache 和 Nginx,仍然支持 HTTP 0.9 協議,部分原因是因為它沒有太多功能!如果你感興趣,打開 Telnet 會話並嘗試通過 HTTP 0.9 訪問 google.com 或你最喜歡的網站,並檢查早期協議的行為和限制。

HTTP/1.0: 快速增長和 Informational RFC

1991 年至 1995 年期間,HTML 規範和一種稱為 「web 瀏覽器」的新型軟體快速發展,面向消費者的公共互聯網基礎設施也開始出現並快速增長。

完美風暴:1990 年代初的互聯網熱潮

基於蒂姆·伯納斯·李最初的瀏覽器原型,美國國家超級計算機應用中心(NCSA)的一個團隊決定實現他們自己的版本。就這樣,第一個流行的瀏覽器誕生了:NCSA Mosaic。1994 年 10 月,NCSA 團隊的一名程序員 Marc Andreessen 與 Jim Clark 合作創建了 Mosaic Communications,該公司後來改名為 Netscape(網景),並於 1994 年 12 月發布了 Netscape Navigator 1.0。從這一點來說,已經很清楚了,萬維網已經不僅僅是學術上的好奇心了。

實際上,同年在瑞士日內瓦組織了第一次萬維網會議,這導致 萬維網聯盟 World Wide Web Consortium (W3C)的成立,以幫助指導 HTML 的發展。同樣,在 IETF 內部建立了一個並行的 HTTP 工作組 HTTP Working Group (HTTP-WG),專註於改進 HTTP 協議。後來這兩個團體一直對 Web 的發展起著重要作用。

最後,完美風暴來臨,CompuServe,AOL 和 Prodigy 在 1994-1995 年的同一時間開始向公眾提供撥號上網服務。憑藉這股迅速的浪潮,Netscape 在 1995 年 8 月 9 日憑藉其成功的 IPO 創造了歷史。這預示著互聯網熱潮已經到來,人人都想分一杯羹!

不斷增長的新 Web 所需功能及其在公共網站上的應用場景很快暴露了 HTTP 0.9 的許多基礎限制:我們需要一種能夠提供超文本文檔、提供關於請求和響應的更豐富的元數據,支持內容協商等等的協議。相應地,新興的 Web 開發人員社區通過一個特殊的過程生成了大量實驗性的 HTTP 伺服器和客戶端實現來回應:實現,部署,並查看其他人是否採用它。

從這些急速增長的實驗開始,一系列最佳實踐和常見模式開始出現。1996 年 5 月, HTTP 工作組 HTTP Working Group (HTTP-WG)發布了 RFC 1945,它記錄了許多被廣泛使用的 HTTP/1.0 實現的「常見用法」。請注意,這只是一個信息性 RFC:HTTP/1.0,如你所知的,它不是一個正式規範或 Internet 標準!

話雖如此,HTTP/1.0 請求看起來應該是:

$> telnet website.org 80

Connected to xxx.xxx.xxx.xxx

GET /rfc/rfc1945.txt HTTP/1.0 ❶
User-Agent: CERN-LineMode/2.15 libwww/2.17b3
Accept: */*

HTTP/1.0 200 OK ❷
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 01 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 1 May 1996 12:45:26 GMT
Server: Apache 0.84

(plain-text response)
(connection closed)
  • ❶ 請求行有 HTTP 版本號,後面跟請求頭
  • ❷ 響應狀態,後跟響應頭

前面的交互並不是 HTTP/1.0 功能的詳盡列表,但它確實說明了一些關鍵的協議更改:

  • 請求可能多個由換行符分隔的請求頭欄位組成。
  • 響應對象的前綴是響應狀態行。
  • 響應對象有自己的一組由換行符分隔的響應頭欄位。
  • 響應對象不限於超文本。
  • 每次請求後,伺服器和客戶端之間的連接都將關閉。

請求頭和響應頭都保留為 ASCII 編碼,但響應對象本身可以是任何類型:HTML 文件、純文本文件、圖像或任何其他內容類型。因此,HTTP 的「超文本傳輸」部分在引入後不久就變成了用詞不當。實際上,HTTP 已經迅速發展成為一種超媒體傳輸,但最初的名稱沒有改變。

除了媒體類型協商之外,RFC 還記錄了許多其他常用功能:內容編碼、字符集支持、多部分類型、授權、緩存、代理行為、日期格式等。

今天,幾乎所有 Web 上的伺服器都可以並且仍將使用 HTTP/1.0。不過,現在你應該更加清楚了!每個請求都需要一個新的 TCP 連接,這會對 HTTP/1.0 造成嚴重的性能損失。參見三次握手,接著會慢啟動

HTTP/1.1: Internet 標準

將 HTTP 轉變為官方 IETF 互聯網標準的工作與圍繞 HTTP/1.0 的文檔工作並行進行,並計劃從 1995 年至 1999 年完成。事實上,第一個正式的 HTTP/1.1 標準定義於 RFC 2068,它在 HTTP/1.0 發布大約六個月後,即 1997 年 1 月正式發布。兩年半後,即 1999 年 6 月,一些新的改進和更新被納入標準,並作為 RFC 2616 發布。

HTTP/1.1 標準解決了早期版本中發現的許多協議歧義,並引入了一些關鍵的性能優化:保持連接,分塊編碼傳輸,位元組範圍請求,附加緩存機制,傳輸編碼和請求管道。

有了這些功能,我們現在可以審視一下由任何現代 HTTP 瀏覽器和客戶端執行的典型 HTTP/1.1 會話:

$> telnet website.org 80
Connected to xxx.xxx.xxx.xxx

GET /index.html HTTP/1.1 ❶
Host: website.org
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4)... (snip)
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: __qca=P0-800083390... (snip)

HTTP/1.1 200 OK ❷
Server: nginx/1.0.11
Connection: keep-alive
Content-Type: text/html; charset=utf-8
Via: HTTP/1.1 GWA
Date: Wed, 25 Jul 2012 20:23:35 GMT
Expires: Wed, 25 Jul 2012 20:23:35 GMT
Cache-Control: max-age=0, no-cache
Transfer-Encoding: chunked

100 ❸
<!doctype html>
(snip)

100
(snip)

0 ❹

GET /favicon.ico HTTP/1.1 ❺
Host: www.website.org
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4)... (snip)
Accept: */*
Referer: http://website.org/
Connection: close ❻
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.3
Cookie: __qca=P0-800083390... (snip)

HTTP/1.1 200 OK ❼
Server: nginx/1.0.11
Content-Type: image/x-icon
Content-Length: 3638
Connection: close
Last-Modified: Thu, 19 Jul 2012 17:51:44 GMT
Cache-Control: max-age=315360000
Accept-Ranges: bytes
Via: HTTP/1.1 GWA
Date: Sat, 21 Jul 2012 21:35:22 GMT
Expires: Thu, 31 Dec 2037 23:55:55 GMT
Etag: W/PSA-GAu26oXbDi

(icon data)
(connection closed)
  • ❶ 請求的 HTML 文件,包括編、字符集和 cookie 元數據
  • ❷ 原始 HTML 請求的分塊響應
  • ❸ 以 ASCII 十六進位數字(256 位元組)表示塊中的八位元的數量
  • ❹ 分塊流響應結束
  • ❺ 在相同的 TCP 連接上請求一個圖標文件
  • ❻ 通知伺服器不再重用連接
  • ❼ 圖標響應後,然後關閉連接

哇,這裡發生了很多事情!第一個也是最明顯的區別是我們有兩個對象請求,一個用於 HTML 頁面,另一個用於圖像,它們都通過一個連接完成。這就是保持連接的實際應用,它允許我們重用現有的 TCP 連接到同一個主機的多個請求,提供一個更快的最終用戶體驗。參見TCP 優化

要終止持久連接,注意第二個客戶端請求通過 Connection 請求頭向伺服器發送顯示的 close。類似地,一旦傳輸響應,伺服器就可以通知客戶端關閉當前 TCP 連接。從技術上講,任何一方都可以在沒有此類信號的情況下終止 TCP 連接,但客戶端和伺服器應儘可能提供此類信號,以便雙方都啟用更好的連接重用策略。

HTTP/1.1 改變了 HTTP 協議的語義,默認情況下使用保持連接。這意味著,除非另有說明(通過 Connection:close 頭),否則伺服器應默認保持連接打開。

但是,同樣的功能也被反向移植到 HTTP/1.0 上,通過 Connection:keep-Alive 頭啟用。因此,如果你使用 HTTP/1.1,從技術上講,你不需要 Connection:keep-Alive 頭,但許多客戶端仍然選擇提供它。

此外,HTTP/1.1 協議還添加了內容、編碼、字符集,甚至語言協商、傳輸編碼、緩存指令、客戶端 cookie,以及可以針對每個請求協商的十幾個其他功能。

我們不打算詳細討論每個 HTTP/1.1 特性的語義。這個主題可以寫一本專門的書了,已經有了很多很棒的書。相反,前面的示例很好地說明了 HTTP 的快速進展和演變,以及每個客戶端-伺服器交換的錯綜複雜的過程,裡面發生了很多事情!

要了解 HTTP 協議所有內部工作原理,參考 David Gourley 和 Brian Totty 共同撰寫的權威指南: The Definitive Guide。

HTTP/2: 提高傳輸性能

RFC 2616 自發布以來,已經成為互聯網空前增長的基礎:數十億各種形狀和大小的設備,從台式電腦到我們口袋裡的小型網路設備,每天都在使用 HTTP 來傳送新聞,視頻,在我們生活中的數百萬的其他網路應用程序都在依靠它。

一開始是一個簡單的,用於檢索超文本的簡單協議,很快演變成了一種通用的超媒體傳輸,現在十年過去了,它幾乎可以為你所能想像到的任何用例提供支持。可以使用協議的伺服器無處不在,客戶端也可以使用協議,這意味著現在許多應用程序都是專門在 HTTP 之上設計和部署的。

需要一個協議來控制你的咖啡壺?RFC 2324 已經涵蓋了超文本咖啡壺控制協議(HTCPCP/1.0)- 它原本是 IETF 在愚人節開的一個玩笑,但在我們這個超鏈接的新世界中,它不僅僅意味著一個玩笑。

超文本傳輸協議(HTTP)是一個應用程序級的協議,用於分散式、協作、超媒體信息系統。它是一種通用的、無狀態的協議,可以通過擴展請求方法、錯誤碼和頭,用於超出超文本之外的許多任務,比如名稱伺服器和分散式對象管理系統。HTTP 的一個特性是數據表示的類型和協商,允許獨立於傳輸的數據構建系統。

RFC 2616: HTTP/1.1, June 1999

HTTP 協議的簡單性是它最初被採用和快速增長的原因。事實上,現在使用 HTTP 作為主要控制和數據協議的嵌入式設備(感測器,執行器和咖啡壺)並不罕見。但在其自身成功的重壓下,隨著我們越來越多地繼續將日常互動轉移到網路 —— 社交、電子郵件、新聞和視頻,以及越來越多的個人和工作空間,它也開始顯示出壓力的跡象。用戶和 Web 開發人員現在都要求 HTTP/1.1 提供近乎實時的響應能力和協議 性能,如果不進行一些修改,就無法滿足這些要求。

為了應對這些新挑戰,HTTP 必須繼續發展,因此 HTTPbis 工作組在 2012 年初宣布了一項針對 HTTP/2 的新計劃:

已經有一個協議中出現了新的實現經驗和興趣,該協議保留了 HTTP 的語義,但是沒有保留 HTTP/1.x 的消息框架和語法,這些問題已經被確定為妨礙性能和鼓勵濫用底層傳輸。

工作組將使用有序的雙向流中生成 HTTP 當前語義的新表達式的規範。與 HTTP/1.x 一樣,主要傳輸目標是 TCP,但是應該可以使用其他方式傳輸。

HTTP/2 charter, January 2012

HTTP/2 的主要重點是提高傳輸性能並支持更低的延遲和更高的吞吐量。主要的版本增量聽起來像是一個很大的步驟,但就性能而言,它將是一個重大的步驟,但重要的是要注意,沒有任何高級協議語義收到影響:所有的 HTTP 頭,值和用例是相同的。

任何現有的網站或應用程序都可以並且將通過 HTTP/2 傳送而無需修改。你無需修改應用程序標記來利用 HTTP/2。HTTP 伺服器將來一定會使用 HTTP/2,但這對大多數用戶來說應該是透明的升級。如果工作組實現目標,唯一的區別應該是我們的應用程序以更低的延遲和更好的網路連接利用率來傳送數據。

話雖如此,但我們不要走的太遠了。在討論新的 HTTP/2 協議功能之前,有必要回顧一下我們現有的 HTTP/1.1 部署和性能最佳實踐。HTTP/2 工作組正在新規範上取得快速的進展,但即使最終標準已經完成並準備就緒,在可預見的未來,我們仍然必須支持舊的 HTTP/1.1 客戶端,實際上,這得十年或更長時間。

via: https://hpbn.co/brief-history-of-http/#http-09-the-one-line-protocol

作者:Ilya Grigorik 選題:lujun9972 譯者:MjSeven 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國