Linux中國

在 Apache Cassandra 中定義和優化數據分區

Apache Cassandra 是一個資料庫,但又不是一個簡單的資料庫;它是一個複製資料庫,專為可擴展性、高可用性、低延遲和良好性能而設計調整。Cassandra 可以幫你的數據在區域性中斷、硬體故障時,以及很多管理員認為數據量過多的情況下幸免於難。

全面掌握數據分區知識,你就能讓 Cassandra 集群實現良好的設計、極高的性能和可擴展性。在本文中,我將探究如何定義分區,Cassandra 如何使用這些分區,以及一些你應該了解的最佳實踐方案和已知問題。

基本概念是這樣的: 供資料庫關鍵函數(如數據分發、複製和索引化)使用的原子單元,單個這樣的數據塊就是一個分區。分散式數據系統通常會把傳入的數據分配到這些分區中,使用簡單的數學函數(例如 identity 或 hashing 函數)執行分區過程,並用得到的 「分區鍵」 對數據分組,進一步再形成分區。例如,假設傳入數據是伺服器日誌,使用 「identity」 分區函數和每個日誌的時間戳(四捨五入到小時值)作為分區鍵,我們可以對這些數據進行分區,實現每個分區各保存一小時的日誌的目的。

Cassandra 中的數據分區

Cassandra 作為分散式系統運行,並且符合前述數據分區原則。使用 Cassandra,數據分區依賴於在集群級別配置的演算法和在表級別配置的分區鍵。

![Cassandra data partition](/data/attachment/album/202110/22/103701lce6rqfx117cxfhw.png "Cassandra data partition")

Cassandra 查詢語言(CQL)使用大家很熟悉的 SQL 表、行、列等術語。在上面的示例圖中,表配置的主鍵中包含了分區鍵,具體格式為: 主鍵 Primary Key = 分區鍵 Partition Key + [ 聚簇列 Clustering Columns ] 。

Cassandra 中的主鍵既定義了唯一的數據分區,也包含著分區內的數據排列依據信息。數據排列信息取決於聚簇列(非必需項)。每個唯一的分區鍵代表著伺服器(包括其副本所在的伺服器)中管理的若干行。

在 CQL 中定義主鍵

接下來的四個示例演示了如何使用 CQL 語法表示主鍵。定義主鍵會讓數據行分到不同的集合里,通常這些集合就是分區。

定義方式 1(分區鍵:log_hour,聚簇列:無)

CREATE TABLE server_logs(
   log_hour TIMESTAMP PRIMARYKEY,
   log_level text,
   message text,
   server text
   )

這裡,有相同 log_hour 的所有行都會進入同一個分區。

定義方式 2(分區鍵:log_hour,聚簇列:log_level)

CREATE TABLE server_logs(
   log_hour TIMESTAMP,
   log_level text,
   message text,
   server text,
   PRIMARY KEY (log_hour, log_level)
   )

此定義方式與方式 1 使用了相同的分區鍵,但此方式中,每個分區的所有行都會按 log_level 升序排列。

定義方式 3(分區鍵:log_hour,server,聚簇列:無)

CREATE TABLE server_logs(
   log_hour TIMESTAMP,
   log_level text,
   message text,
   server text,
   PRIMARY KEY ((log_hour, server))
   )

在此定義中,serverlog_hour 欄位都相同的行才會進入同一個分區。

定義方式 4(分區鍵:log_hour,server,聚簇列:log_level)

CREATE TABLE server_logs(
   log_hour TIMESTAMP,
   log_level text,
   message text,
   server text,
   PRIMARY KEY ((log_hour, server),log_level)
   )WITH CLUSTERING ORDER BY (column3 DESC);

此定義方式與方式 3 分區相同,但分區內的行會依照 log_level 降序排列。

Cassandra 如何使用分區鍵

Cassandra 依靠分區鍵來確定在哪個節點上存儲數據,以及在需要時定位數據。Cassandra 通過查看錶中的分區鍵來執行這些讀取和寫入操作,並使用 令牌 tokens (一個 -2^{63}−263 到 +2^{63}-1+263−1 範圍內的 long 類型值)來進行數據分布和索引。這些令牌通過分區器映射到分區鍵,分區器使用了將分區鍵轉換為令牌的分區函數。通過這種令牌機制,Cassandra 集群的每個節點都擁有一組數據分區。然後分區鍵在每個節點上啟用數據索引。

![Cassandra cluster with 3 nodes and token-based ownership](/data/attachment/album/202110/22/103702i80t0rnirm3100fi.png "Cassandra cluster with 3 nodes and token-based ownership")

圖中顯示了一個三節點的 Cassandra 集群以及相應的令牌範圍分配。這只是一個簡單的示意圖:具體實現過程使用了 Vnodes

數據分區對 Cassandra 集群的影響

用心的分區鍵設計對於實現用例的理想分區大小至關重要。合理的分區可以實現均勻的數據分布和強大的 I/O 性能。分區大小對 Cassandra 集群有若干需要注意的影響:

  • 讀取性能 —— 為了在磁碟上的 SSTables 文件中找到分區,Cassandra 使用緩存、索引和索引摘要等數據結構。過大的分區會降低這些數據結構的維護效率,從而對性能產生負面影響。Cassandra 新版本在這方面取得了長足的進步:特別是 3.6 及其以上版本的 Cassandra 引擎引入了存儲改進,針對大型分區,可以提供更好的性能,以及更強的應對內存問題和崩潰的彈性。
  • 內存使用 —— 大分區會對 JVM 堆產生更大的壓力,同時分區的增大也降低了垃圾收集機制的效率。
  • Cassandra 修復 —— 大分區使 Cassandra 執行修復維護操作(通過跨副本比較數據來保持數據一致)時更加困難。
  • 「墓碑」刪除 —— 聽起來可能有點駭人,Cassandra 使用稱為「 墓碑 tombstones 」的獨特標記來記錄要刪除的數據。如果沒有合適的數據刪除模式和壓縮策略,大分區會使刪除過程變得更加困難。

雖然這些影響可能會讓人更傾向於簡單地設計能產生小分區的分區鍵,但數據訪問模式對理想的分區大小也有很大影響(有關更多信息,請閱讀關於 Cassandra 數據建模 的深入講解)。數據訪問模式可以定義為表的查詢方式,包括表的所有 select 查詢。 理想情況下,CQL 選擇查詢應該在 where 子句中只使用一個分區鍵。也就是說,當查詢可以從單個分區,而不是許多較小的分區獲取所需數據時,Cassandra 是最有效率的。

分區鍵設計的最佳實踐

遵循分區鍵設計的最佳實踐原則,這會幫你得到理想的分區大小。根據經驗,Cassandra 中的最大分區應保持在 100MB 以下。理想情況下,它應該小於 10MB。雖然 Cassandra 3.6 及其以上版本能更好地支持大分區,但也必須對每個工作負載進行仔細的測試和基準測試,以確保分區鍵設計能夠支持所需的集群性能。

具體來說,這些最佳實踐原則適用於任何分區鍵設計:

  • 分區鍵的目標必須是將理想數量的數據放入每個分區,以支持其訪問模式的需求。
  • 分區鍵應禁止無界分區:那些大小可能隨著時間無限增長的分區。例如,在上面的 server_logs 示例中,隨著伺服器日誌數量的不斷增加,使用伺服器列作為分區鍵就會產生無界分區。相比之下,使用 log_hour 將每個分區限制為一個小時數據的方案會更好。
  • 分區鍵還應避免產生分區傾斜,即分區增長不均勻,有些分區可能隨著時間的推移而不受限制地增長。在 server_logs 示例中,在一台伺服器生成的日誌遠多於其他伺服器的情況下使用伺服器列會產生分區傾斜。為了避免這種情況,可以從表中引入另一個屬性來強制均勻分布,即使要創建一個虛擬列來這樣做,也是值得的。
  • 使用時間元素和其他屬性的組合分區鍵,這對時間序列數據分區很有幫助。這種方式可以防止無界分區,使訪問模式能夠在查詢特定數據時使用時間屬性,而且能夠對特定時間段內的數據進行刪除。上面的每個示例都使用了 log_hour 時間屬性來演示這一點。

還有一些工具可用於幫助測試、分析和監控 Cassandra 分區,以檢查所選模式是否高效。通過仔細設計分區鍵,使解決方案的數據和需求保持一致,並遵循最佳實踐原則來優化分區大小,你就可以充分利用數據分區,更好地發揮 Cassandra 的可擴展性和性能潛力。

via: https://opensource.com/article/20/5/apache-cassandra

作者:Anil Inamdar 選題:lujun9972 譯者:unigeorge 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國