Linux中國

如何使用 rsync 的高級用法進行大型備份

很明顯,備份一直是 Linux 世界的熱門話題。回到 2017,David Both 為 Opensource.com 的讀者在使用 rsync 備份 Linux 系統方面提了一些建議,在這年的更早時候,他發起了一項問卷調查詢問大家,在 Linux 中你的 /home 目錄的主要備份策略是什麼,在今年的另一個問卷調查中,Don Watkins 問到,你使用哪種開源備份解決方案

我的回復是 rsync。我真的非常喜歡 rsync!市場上有大量大而複雜的工具,對於管理磁帶機或者存儲庫設備,這些可能是必要的,但是可能你需要的只是一個簡單的開源命令行工具。

rsync 基礎

我為一個大概擁有 35,000 開發者並有著幾十 TB 文件的全球性機構管理二進位倉庫。我經常一次移動或者歸檔上百 GB 的數據。使用的是 rsync。這種經歷使我對這個簡單的工具充滿信心。(所以,是的,我在家使用它來備份我的 Linux 系統)

基礎的 rsync 命令很簡單。

rsync -av 源目錄 目的地目錄

實際上,在各種指南中教的 rsync 命令在大多數通用情況下都運行的很好。然而,假設我們需要備份大量的數據。例如包含 2,000 個子目錄的目錄,每個包含 50GB 到 700GB 的數據。在這個目錄運行 rsync 可能需要大量時間,尤其是當你使用校驗選項時(我傾向使用)。

當我們試圖同步大量數據或者通過慢的網路連接時,可能遇到性能問題。讓我給你展示一些我使用的方法來確保好的性能和可靠性。

rsync 高級用法

rsync 運行時出現的第一行是:「正在發送增量文件列表。」 如果你在網上搜索這一行,你將看到很多類似的問題:為什麼它一直運行,或者為什麼它似乎掛起了。

這裡是一個基於這個場景的例子。假設我們有一個 /storage 的目錄,我們想要備份到一個外部 USB 磁碟,我們可以使用下面的命令:

rsync -cav /storage /media/WDPassport

-c 選項告訴 rsync 使用文件校驗和而不是時間戳來決定改變的文件,這通常消耗的時間更久。為了分解 /storage 目錄,我通過子目錄同步,使用 find 命令。這是一個例子:

find /storage -type d -exec rsync -cav {} /media/WDPassport ;

這看起來可以,但是如果 /storage 目錄有任何文件,它們將被跳過。因此,我們如何同步 /storage 目錄中的文件呢?同樣有一個細微的差別是這些選項將造成 rsync 會同步 . 目錄,該目錄是源目錄自身;這意味著它會同步子目錄兩次,這並不是我們想要的。

長話短說,我的解決方案是一個 「雙-遞增」腳本。這允許我分解一個目錄,例如,當你的家目錄有多個大的目錄,例如音樂或者家庭照片時,分解 /home 目錄為單個的用戶家目錄。

這是我的腳本的一個例子:

HOMES="alan"
DRIVE="/media/WDPassport"

for HOME in $HOMES; do
cd /home/$HOME
rsync -cdlptgov --delete . /$DRIVE/$HOME
find . -maxdepth 1 -type d -not -name "." -exec rsync -crlptgov --delete {} /$DRIVE/$HOME ;
done

第一個 rsync 命令拷貝它在源目錄中發現的文件和目錄。然而,它將目錄留著不處理,因此我們能夠通過 find 命令迭代它們。這通過傳遞 -d 參數來完成,它告訴 rsync 不要遞歸目錄。

-d, --dirs 傳輸目錄而不遞歸

然後 find 命令傳遞每個目錄來單獨運行 rsync。之後 rsync 拷貝目錄的內容。這通過傳遞 -r 參數來完成,它告訴 rsync 要遞歸目錄。

-r, --recursive 遞歸進入目錄

這使得 rsync 使用的增量文件保持在一個合理的大小。

大多數 rsync 指南為了簡便使用 -a (或者 archive) 參數。這實際是一個複合參數。

-a, --archive 歸檔模式;等價於 -rlptgoD(沒有 -H,-A,-X)

我傳遞的其他參數包含在 a 中;這些是 -l-p-t-g-o

-l, --links 複製符號鏈接作為符號鏈接
-p, --perms 保留許可權
-t, --times 保留修改時間
-g, --group 保留組
-o, --owner 保留擁有者(只適用於超級管理員)

--delete 選項告訴 rsync 刪除目的地目錄中所有在源目錄不存在的任意文件。這種方式,運行的結果僅僅是複製。你同樣可以排除 .Trash 目錄或者 MacOS 創建的 .DS_Store 文件。

-not -name ".Trash*" -not -name ".DS_Store"

注意

最後一條建議: rsync 可以是破壞性的命令。幸運的是,它的睿智的創造者提供了 「空運行」 的能力。如果我們加入 n 選項,rsync 會顯示預期的輸出但不寫任何數據。

`rsync -cdlptgovn --delete . /$DRIVE/$HOME`

這個腳本適用於非常大的存儲規模和高延遲或者慢鏈接的情況。一如既往,我確信仍有提升的空間。如果你有任何建議,請在下方評論中分享。

via: https://opensource.com/article/19/5/advanced-rsync

作者:Alan Formy-Duval 選題:lujun9972 譯者:warmfrog 校對:wxy

本文由 LCTT 原創編譯,Linux中國 榮譽推出


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國