Linux中國

命令行生存指南:拆分與合併

操作概述

備份文件時常常涉及到大文件傳輸的問題,遇到網路質量不佳或者其他問題常常會導致傳輸中斷,而不得不進行重傳。如果採用先將大文件拆分成多個小文件進行傳輸、待全部傳輸完成後合併所有文件的方式,往往可以改善傳輸體驗。

這一節將會介紹 Linux 命令行下的文件拆分與合併操作。

概念和術語

拆分,顧名思義,就是將一個大的文件分割成若干個較小的文件,這些小文件按次序拼接後可以還原大文件。通常情況下,根據文件大小進行拆分是較為常見的方式;但由於文本文件具有行數特徵,所以除了按大小拆分之外,也可以按行數拆分。

合併,就是將若干個較小的文件拼接成一個較大文件。通常只需要按次序連接即可,相對比較簡單。

通常情況下,為確保拆分前和合併後的兩個文件相同,需要進行驗證。

操作實戰

場景一:使用 split 拆分文件

難度
演示用發行版 Fedora 32
涉及命令 split

split 是 Linux 環境提供的文件拆分實用程序,同時支持二進位文件和文本文件。通常情況下已經隨 coreutils 內置於系統中,無需另行安裝。

按大小拆分

二進位文件和文本文件按大小拆分時使用的選項不同:

  • 二進位文件使用 -b 選項指定分割後的文件大小。
  • 文本文件則使用 -C 選項指定分割後的文件大小。

二者用法類似,只需要:

split [選項] [大小] [待拆分文件] [拆分後的前綴(可選)]

以將 debian-live-10.5.0-amd64-lxqt.iso(約 2.4 GB)按 100MB 大小進行拆分為例:

> split -b 100M debian-live-10.5.0-amd64-lxqt.iso debian-live-

可以看到原文件被拆分成 25 個更小的文件,從 aa 到 ay:

debian-live-aa  debian-live-ad  debian-live-ag  debian-live-aj  debian-live-am  debian-live-ap  debian-live-as  debian-live-av  debian-live-ay
debian-live-ab  debian-live-ae  debian-live-ah  debian-live-ak  debian-live-an  debian-live-aq  debian-live-at  debian-live-aw
debian-live-ac  debian-live-af  debian-live-ai  debian-live-al  debian-live-ao  debian-live-ar  debian-live-au  debian-live-ax

場景二:使用 cat 合併文件

難度
演示用發行版 Fedora 32
涉及命令 catdiff

cat 是 linux 環境提供的文件連接實用程序,能夠連接文件並將其輸出到標準輸出。通常情況下已經隨 coreutils 內置於系統中,無需另行安裝。

值得注意的是,為了保證合併後的文件和原始文件一致,在有條件的情況下,可以用 diff 命令驗證。

合併拆分後的文件

使用 cat 合併文件可以採用 cat [文件...] > [合併後的文件名] 的格式,此方法對二進位文件和文本文件均有效。

以之前的 debian-live-aa 到 debian-live-ay 為例,合併時可以使用此命令:

> cat debian-live-* > debian-live.iso

可以看到目錄下會生成合併後的 debian-live.iso 文件。

debian-live-aa  debian-live-ad  debian-live-ag  debian-live-aj  debian-live-am  debian-live-ap  debian-live-as  debian-live-av  debian-live-ay
debian-live-ab  debian-live-ae  debian-live-ah  debian-live-ak  debian-live-an  debian-live-aq  debian-live-at  debian-live-aw  debian-live.iso
debian-live-ac  debian-live-af  debian-live-ai  debian-live-al  debian-live-ao  debian-live-ar  debian-live-au  debian-live-ax

使用 diff 驗證文件

只需要按 diff [原文件] [現文件] 的格式執行即可。如果沒有輸出,則證明兩個文件之間沒有差異。

以對比 debian-live-10.5.0-amd64-lxqt.isodebian-live.iso 為例:

> diff debian-live-10.5.0-amd64-lxqt.iso debian-live.iso
> # 無輸出,表示二者是相同的。

小練習

  • 嘗試以不同方式拆分系統中的日誌文件。

拓展閱讀


本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何?

太棒了
0
不錯
0
愛死了
0
不太好
0
感覺很糟
0
雨落清風。心向陽

    You may also like

    Leave a reply

    您的電子郵箱地址不會被公開。 必填項已用 * 標註

    此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據

    More in:Linux中國