如何使用 pdfgrep 從終端搜索 PDF 文件

諸如 grep 和 ack-grep 之類的命令行工具對於搜索匹配指定正則表達式的純文本非常有用。但是你有沒有試過使用這些工具在 PDF 中搜索？不要這麼做！由於這些工具無法讀取PDF文件，因此你不會得到任何結果。它們只能讀取純文本文件。

顧名思義，pdfgrep 是一個可以在不打開文件的情況下搜索 PDF 中的文本的小命令行程序。它非常快速 —— 比幾乎所有 PDF 瀏覽器提供的搜索更快。grep 和 pdfgrep 的最大區別在於 pdfgrep 對頁進行操作，而 grep 對行操作。grep 如果在一行上找到多個匹配項，它也會多次列印單行。讓我們看看如何使用該工具。

安裝

對於 Ubuntu 和其他基於 Ubuntu 的 Linux 發行版來說，這非常簡單：

sudo apt install pdfgrep

對於其他發行版，只要在包管理器里輸入「pdfgrep」查找，它就應該能夠安裝它。萬一你想瀏覽其代碼，你也可以查看項目的 GitLab 頁面。

測試運行

現在你已經安裝了這個工具，讓我們去測試一下。pdfgrep 命令採用以下格式：

pdfgrep [OPTION...] PATTERN [FILE...]

OPTION 是一個額外的屬性列表，給出諸如 -i 或 --ignore-case 這樣的命令，這兩者都會忽略匹配正則中的大小寫。
PATTERN 是一個擴展正則表達式。
FILE 如果它在相同的工作目錄就是文件的名稱，或文件的路徑。

我對 Python 3.6 官方文檔運行該命令。下圖是結果。

![pdfgrep search](/data/attachment/album/201801/16/132005kwnwdjgo6d76wigi.png "pdfgrep search")

紅色高亮顯示所有遇到單詞「queue」的地方。在命令中加入 -i 選項將會匹配單詞「Queue」。請記住，當加入 -i 時，大小寫並不重要。

其它

pdfgrep 有相當多的有趣的選項。不過，我只會在這裡介紹幾個。

-c 或者 --count：這會抑制匹配的正常輸出。它只顯示在文件中遇到該單詞的次數，而不是顯示匹配的長輸出。
-p 或者 --page-count：這個選項列印頁面上匹配的頁碼和頁面上的該匹配模式出現次數。
-m 或者 --max-count [number]：指定匹配的最大數目。這意味著當達到匹配次數時，該命令停止讀取文件。

所支持的選項的完整列表可以在 man 頁面或者 pdfgrep 在線文檔中找到。如果你在批量處理一些文件，不要忘記，pdfgrep 可以同時搜索多個文件。可以通過更改 GREP_COLORS 環境變數來更改默認的匹配高亮顏色。

總結

下一次你想在 PDF 中搜索一些東西。請考慮使用 pdfgrep。該工具會派上用場，並且節省你的時間。

via: https://www.maketecheasier.com/search-pdf-files-pdfgrep/

作者：Bruno Edoh 譯者：geekpi 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

如何使用 pdfgrep 從終端搜索 PDF 文件

安裝

測試運行

其它

總結

對這篇文章感覺如何？

讓 history 命令顯示日期和時間

剖析內存中的程序之秘

Leave a reply 取消回復

More in:Linux中國

捐贈 Let's Encrypt，共建安全的互聯網

Let's Encrypt 正式發布，已經保護 380 萬個域名

關於Linux防火牆iptables的面試問答

Lets Encrypt 已被所有主流瀏覽器所信任

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

使用 Linux 命令行解決Wordle 問題

5本學習 TeX 的最佳免費書籍

Makefile 簡介

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

更開放的分散式事務 | Fescar 品牌升級，更名為 Seata

HeRM’s – 一個命令食譜管理器

使用 Let's Encrypt 保護你的網站

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

安裝

測試運行

其它

總結

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤