並發伺服器（五）：Redis 案例研究

這是我寫的並發網路伺服器系列文章的第五部分。在前四部分中我們討論了並發伺服器的結構，這篇文章我們將去研究一個在生產系統中大量使用的伺服器的案例—— Redis。

Redis logo

Redis 是一個非常有魅力的項目，我關注它很久了。它最讓我著迷的一點就是它的 C 源代碼非常清晰。它也是一個高性能、大並發的內存資料庫伺服器的非常好的例子，它是研究網路並發伺服器的一個非常好的案例，因此，我們不能錯過這個好機會。

我們來看看前四部分討論的概念在真實世界中的應用程序。

本系列的所有文章有：

事件處理庫

Redis 最初發佈於 2009 年，它最牛逼的一件事情大概就是它的速度 —— 它能夠處理大量的並發客戶端連接。需要特別指出的是，它是用一個單線程來完成的，而且還不對保存在內存中的數據使用任何複雜的鎖或者同步機制。

Redis 之所以如此牛逼是因為，它在給定的系統上使用了其可用的最快的事件循環，並將它們封裝成由它實現的事件循環庫（在 Linux 上是 epoll，在 BSD 上是 kqueue，等等）。這個庫的名字叫做 ae。ae 使得編寫一個快速伺服器變得很容易，只要在它內部沒有阻塞即可，而 Redis 則保證 ^注1 了這一點。

在這裡，我們的興趣點主要是它對文件事件的支持 —— 當文件描述符（如網路套接字）有一些有趣的未決事情時將調用註冊的回調函數。與 libuv 類似，ae 支持多路事件循環（參閱本系列的第三節和第四節）和不應該感到意外的 aeCreateFileEvent 信號：

int aeCreateFileEvent(aeEventLoop *eventLoop, int fd, int mask,
                      aeFileProc *proc, void *clientData);

它在 fd 上使用一個給定的事件循環，為新的文件事件註冊一個回調（proc）函數。當使用的是 epoll 時，它將調用 epoll_ctl 在文件描述符上添加一個事件（可能是 EPOLLIN、EPOLLOUT、也或許兩者都有，取決於 mask 參數）。ae 的 aeProcessEvents 功能是「運行事件循環和發送回調函數」，它在底層調用了 epoll_wait。

處理客戶端請求

我們通過跟蹤 Redis 伺服器代碼來看一下，ae 如何為客戶端事件註冊回調函數的。initServer 啟動時，通過註冊一個回調函數來讀取正在監聽的套接字上的事件，通過使用回調函數 acceptTcpHandler 來調用 aeCreateFileEvent。當新的連接可用時，這個回調函數被調用。它調用 accept ^注2 ，接下來是 acceptCommonHandler，它轉而去調用 createClient 以初始化新客戶端連接所需要的數據結構。

createClient 的工作是去監聽來自客戶端的入站數據。它將套接字設置為非阻塞模式（一個非同步事件循環中的關鍵因素）並使用 aeCreateFileEvent 去註冊另外一個文件事件回調函數以讀取事件 —— readQueryFromClient。每當客戶端發送數據，這個函數將被事件循環調用。

readQueryFromClient 就讓我們期望的那樣 —— 解析客戶端命令和動作，並通過查詢和/或操作數據來回復。因為客戶端套接字是非阻塞的，所以這個函數必須能夠處理 EAGAIN，以及部分數據；從客戶端中讀取的數據是累積在客戶端專用的緩衝區中，而完整的查詢可能被分割在回調函數的多個調用當中。

將數據發送回客戶端

在前面的內容中，我說到了 readQueryFromClient 結束了發送給客戶端的回復。這在邏輯上是正確的，因為 readQueryFromClient 準備要發送回復，但它不真正去做實質的發送 —— 因為這裡並不能保證客戶端套接字已經準備好寫入/發送數據。我們必須為此使用事件循環機制。

Redis 是這樣做的，它註冊一個 beforeSleep 函數，每次事件循環即將進入休眠時，調用它去等待套接字變得可以讀取/寫入。beforeSleep 做的其中一件事情就是調用 handleClientsWithPendingWrites。它的作用是通過調用 writeToClient 去嘗試立即發送所有可用的回復；如果一些套接字不可用時，那麼當套接字可用時，它將註冊一個事件循環去調用 sendReplyToClient。這可以被看作為一種優化 —— 如果套接字可用於立即發送數據（一般是 TCP 套接字），這時並不需要註冊事件 ——直接發送數據。因為套接字是非阻塞的，它從不會去阻塞循環。

為什麼 Redis 要實現它自己的事件庫？

在第四節中我們討論了使用 libuv 來構建一個非同步並發伺服器。需要注意的是，Redis 並沒有使用 libuv，或者任何類似的事件庫，而是它去實現自己的事件庫 —— ae，用 ae 來封裝 epoll、kqueue 和 select。事實上，Antirez（Redis 的創建者）恰好在 2011 年的一篇文章中回答了這個問題。他的回答的要點是：ae 只有大約 770 行他理解的非常透徹的代碼；而 libuv 代碼量非常巨大，也沒有提供 Redis 所需的額外功能。

現在，ae 的代碼大約增長到 1300 多行，比起 libuv 的 26000 行（這是在沒有 Windows、測試、示例、文檔的情況下的數據）來說那是小巫見大巫了。libuv 是一個非常綜合的庫，這使它更複雜，並且很難去適應其它項目的特殊需求；另一方面，ae 是專門為 Redis 設計的，與 Redis 共同演進，只包含 Redis 所需要的東西。

這是我前些年在一篇文章中提到的軟體項目依賴關係的另一個很好的示例：

依賴的優勢與在軟體項目上花費的工作量成反比。

在某種程度上，Antirez 在他的文章中也提到了這一點。他提到，提供大量附加價值（在我的文章中的「基礎」依賴）的依賴比像 libuv 這樣的依賴更有意義（它的例子是 jemalloc 和 Lua），對於 Redis 特定需求，其功能的實現相當容易。

Redis 中的多線程

在 Redis 的絕大多數歷史中，它都是一個不折不扣的單線程的東西。一些人覺得這太不可思議了，有這種想法完全可以理解。Redis 本質上是受網路束縛的 —— 只要資料庫大小合理，對於任何給定的客戶端請求，其大部分延時都是浪費在網路等待上，而不是在 Redis 的數據結構上。

然而，現在事情已經不再那麼簡單了。Redis 現在有幾個新功能都用到了線程：

「惰性」內存釋放。
在後台線程中使用 fsync 調用寫一個持久化日誌。
運行需要執行一個長周期運行的操作的用戶定義模塊。

對於前兩個特性，Redis 使用它自己的一個簡單的 bio（它是「Background I/O" 的首字母縮寫）庫。這個庫是根據 Redis 的需要進行了硬編碼，它不能用到其它的地方 —— 它運行預設數量的線程，每個 Redis 後台作業類型需要一個線程。

而對於第三個特性，Redis 模塊可以定義新的 Redis 命令，並且遵循與普通 Redis 命令相同的標準，包括不阻塞主線程。如果在模塊中自定義的一個 Redis 命令，希望去執行一個長周期運行的操作，這將創建一個線程在後台去運行它。在 Redis 源碼樹中的 src/modules/helloblock.c 提供了這樣的一個示例。

有了這些特性，Redis 使用線程將一個事件循環結合起來，在一般的案例中，Redis 具有了更快的速度和彈性，這有點類似於在本系統文章中第四節討論的工作隊列。

注1： Redis 的一個核心部分是：它是一個 內存中 資料庫；因此，查詢從不會運行太長的時間。當然了，這將會帶來各種各樣的其它問題。在使用分區的情況下，伺服器可能最終路由一個請求到另一個實例上；在這種情況下，將使用非同步 I/O 來避免阻塞其它客戶端。
注2：使用 anetAccept；anet 是 Redis 對 TCP 套接字代碼的封裝。

via: https://eli.thegreenplace.net/2017/concurrent-servers-part-5-redis-case-study/

作者：Eli Bendersky 譯者：qhwdw 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

並發伺服器（五）：Redis 案例研究

事件處理庫

處理客戶端請求

將數據發送回客戶端

為什麼 Redis 要實現它自己的事件庫？

Redis 中的多線程

對這篇文章感覺如何？

如何在 Linux 上使用 Vundle 管理 Vim 插件

搭建私有云：OwnCloud

Leave a reply 取消回復

More in:Linux中國

捐贈 Let's Encrypt，共建安全的互聯網

Let's Encrypt 正式發布，已經保護 380 萬個域名

關於Linux防火牆iptables的面試問答

Lets Encrypt 已被所有主流瀏覽器所信任

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

使用 Linux 命令行解決Wordle 問題

5本學習 TeX 的最佳免費書籍

Makefile 簡介

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

更開放的分散式事務 | Fescar 品牌升級，更名為 Seata

HeRM’s – 一個命令食譜管理器

使用 Let's Encrypt 保護你的網站

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

事件處理庫

處理客戶端請求

將數據發送回客戶端

為什麼 Redis 要實現它自己的事件庫？

Redis 中的多線程

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤