在 Linux 上使用 gImageReader 從圖像和 PDF 中提取文本

為了簡化事情，gImageReader 在從 PDF 文件或包含任何類型文本的圖像中提取文本時非常方便。

無論你是需要它來進行拼寫檢查還是翻譯，它都應該對特定的用戶群體有用。

以列表總結下功能，這裡是你可以用它做的事情：

從磁碟、掃描設備、剪貼板和截圖中添加 PDF 文檔和圖像
能夠旋轉圖像
常用的圖像控制，用於調整亮度、對比度和解析度。
直接通過應用掃描圖像
能夠一次性處理多個圖像或文件
手動或自動識別區域定義
識別純文本或 hOCR 文檔
編輯器顯示識別的文本
可對對提取的文本進行拼寫檢查
從 hOCR 文件轉換/導出為 PDF 文件
將提取的文本導出為 .txt 文件
跨平台（Windows）

在 Linux 上安裝 gImageReader

注意：你需要安裝 Tesseract 語言包，才能從軟體管理器中的圖像/文件中進行檢測。

你可以在一些 Linux 發行版如 Fedora 和 Debian 的默認倉庫中找到 gImageReader。

對於 Ubuntu，你需要添加一個 PPA，然後安裝它。要做到這點，下面是你需要在終端中輸入的內容：

sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt update
sudo apt install gimagereader

你也可以從 openSUSE 的構建服務中找到它，Arch Linux 用戶可在 AUR 中找到。

所有的倉庫和包的鏈接都可以在他們的 GitHub 頁面中找到。

gImageReader 使用經驗

當你需要從圖像中提取文本時，gImageReader 是一個相當有用的工具。當你嘗試從 PDF 文件中提取文本時，它的效果非常好。

對於從智能手機拍攝的圖片中提取，檢測很接近，但有點不準確。也許當你進行掃描時，從文件中識別字元可能會更好。

所以，你需要親自嘗試一下，看看它是否對你而言工作良好。我在 Linux Mint 20.1（基於 Ubuntu 20.04）上試過。

我只遇到了一個從設置中管理語言的問題，我沒有得到一個快速的解決方案。如果你遇到此問題，那麼可能需要對其進行故障排除，並進一步了解如何解決該問題。

除此之外，它工作良好。

試試吧，讓我知道它是如何為你服務的！如果你知道類似的東西（和更好的），請在下面的評論中告訴我。

via: https://itsfoss.com/gimagereader-ocr/

作者：Ankush Das 選題：lujun9972 譯者：geekpi 校對：wxy

本文由 LCTT 原創編譯，Linux中國榮譽推出

本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive

對這篇文章感覺如何？

太棒了

不錯

愛死了

不太好

感覺很糟

Rain

雨落清風。心向陽

在 Linux 上使用 gImageReader 從圖像和 PDF 中提取文本

在 Linux 上安裝 gImageReader

gImageReader 使用經驗

對這篇文章感覺如何？

學習使用 GDB 調試代碼

9 個 Node.js 開發人員最喜歡的開源工具

Leave a reply 取消回復

More in:Linux中國

捐贈 Let's Encrypt，共建安全的互聯網

Let's Encrypt 正式發布，已經保護 380 萬個域名

關於Linux防火牆iptables的面試問答

Lets Encrypt 已被所有主流瀏覽器所信任

中文操作系統論壇

關注 LinuxStory

開源學村

編程類開放書籍薈萃

如何殺死 Linux 中的殭屍進程

2022年，從學習Rust開始

使用 Linux 命令行解決Wordle 問題

5本學習 TeX 的最佳免費書籍

Makefile 簡介

Linux 內核補丁提交初體驗

Linux 的前世今生 – 1

特別關注

更開放的分散式事務 | Fescar 品牌升級，更名為 Seata

HeRM’s – 一個命令食譜管理器

使用 Let's Encrypt 保護你的網站

LinuxStory

加入 LinuxStory 交流群組

投票調查

最熱標籤

在 Linux 上安裝 gImageReader

gImageReader 使用經驗

分享

對這篇文章感覺如何？

You may also like

Leave a reply 取消回復

More in:Linux中國

中文操作系統論壇

關注 LinuxStory

開源學村

特別關注

最新文章

最熱標籤