認識存儲:塊、文件和對象
現在,對於那些創建或消費數據的公司來說,處理數量巨大的生成數據是個非常大的挑戰。而對於那些解決存儲相關問題的科技公司來說,也是一個挑戰。
Red Hat 存儲首席產品營銷經理 Michael St. Jean 說,「數據每年呈幾何級增長,而我們發現數據大量增長的主要原因是由於消費增長和為拓展價值而進行的產業轉型,毫無疑問,物聯網對數據增長的貢獻很大,但對軟體定義存儲來說最重要的挑戰是,如何處理用戶場景相關的數據增長。「
任何挑戰都意味著機遇。Azure 存儲、介質和邊緣計算總經理 Tad Brockway 說,「今天,新舊數據源產生的海量數據為我們滿足客戶在規模、性能、靈活性、治理方面急劇增長的需求提供了一個機遇。」
現代軟體定義存儲的三種類型
這裡有三個不同類型的存儲解決方案 —— 塊、文件、和對象 —— 雖然它們每個都可以與其它的共同工作,但它們每個都有不同的用途。
塊存儲是數據存儲的最古老形式,數據都存儲在固定長度的塊或多個塊中。塊存儲適用於企業存儲環境,並且通常使用光纖通道或 iSCSI 介面。根據 SUSE 的軟體定義存儲高級產品經理 Larry Morris 的說法,「塊存儲要求一個應用去映射存儲設備上存儲數據塊的位置。」
塊存儲在存儲區域網和軟體定義存儲系統中是虛擬的,它是處於一個共享的硬體基礎設施上的抽象邏輯設備,其創建和存在於伺服器、虛擬伺服器、或運行在基於像 SCSI、SATA、SAS、FCP、FCoE、或 iSCSI 這樣的協議的系統管理程序上。
St. Jean 說「塊存儲將單個的存儲卷(如一個虛擬或雲存儲節點、或一個老式硬碟)分割成單獨的被稱為塊的實體。」
每個塊獨立存在,並且能夠用它自己的數據傳輸協議和操作系統格式化 —— 給用戶完全的配置自主權。由於塊存儲系統並不負責像文件存儲系統那樣的文件查找職責,所以,塊存儲是一個非常快的存儲系統。由於同時具備速度和配置靈活性,使得塊存儲非常適合原始伺服器存儲或富媒體資料庫。
塊存儲適合於宿主機操作系統、應用程序、資料庫、完整虛擬機和容器。傳統上,塊存儲僅能夠被獨立的機器訪問,或呈現給集群中的機器訪問。
基於文件的存儲
基於文件的存儲使用一個文件系統去映射存儲設備上數據的存儲位置。這種技術在直連或網路附加存儲系統應用領域中處於支配地位。它需要做兩件事情:組織數據並呈現給用戶。St. Jean 說,」使用文件存儲時,數據在伺服器側的存儲方式與客戶端用戶所看到的是完全相同的。這就允許用戶通過一些唯一標識符(像文件名、位置、或 URL)去請求一個文件,使用特定的數據傳輸協議與存儲系統溝通。
其結果就是一種能夠從上到下進行瀏覽的分層的文件結構。文件存儲處於塊存儲之上,允許用戶去查看和訪問文件、文件夾這樣的數據,但是被限制訪問處於這些文件和文件夾之下的數據塊。
Brockway 解釋說,「文件存儲一般用於像 NFS 和 CIFS/SMB 這種很多伺服器基於 IP 網路進行訪問的共享文件系統上。訪問控制通過用戶和組的許可權實現在文件、目錄和導出級別上。基於文件的存儲可用於被多個用戶和機器、二進位應用程序、資料庫、虛擬機所需要的文件的存儲上,以及容器上。「
對象存儲
對象存儲是最新的數據存儲形式,它為非結構化數據提供一個倉庫,它將內容從索引中分離出來,並允許多個文件連接到一個對象上。一個對象就是與任何相關元數據配對的一個數據塊,這些元數據提供對象中包含的位元組的上下文(比如數據創建時間和數據大小等)。也就是說這兩樣東西 —— 數據和元數據 —— 構成了一個對象。
對象存儲的一個好處是每個數據塊都關聯了一個唯一標識符。訪問數據需要唯一標識符,並且不需要應用程序或用戶知道數據的真實存儲位置。對象數據是通過 API 來訪問的。
St. Jean 說,「對象中存儲的數據是沒有壓縮和加密的,對象本身被組織在對象存儲(一個填滿其它對象的中心庫)中或容器(包含應用程序運行所需要的所有文件的一個包)中。與文件存儲系統的層次結構相比,對象、對象存儲和容器在本質上是平面的 —— 這使得它們在存儲規模巨大時訪問速度很快。」
對象存儲可以擴展到很多 PB 位元組大小,以適應巨大的數據集,因此它是圖像、音頻、視頻、日誌、備份、和分析服務所使用的數據存儲的最佳選擇。
結論
現在你已經知道了各種類型的存儲以及它們的用處。後面我們將繼續研究這個主題的更多內容,敬請關注。
via: https://www.linux.com/blog/2018/9/know-your-storage-block-file-object
作者:Swapnil Bhartiya 選題:lujun9972 譯者:qhwdw 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive