pytesseract.pytesseract.TesseractNotFoundError: tesseract 未安装或不在您的 PATH 中.有关详细信息,请参阅 README 文件. - Shell-Bash (1) - 芒果文档

📌 相关文章

📜 pytesseract.pytesseract.TesseractNotFoundError: tesseract 未安装或不在您的 PATH 中.有关详细信息,请参阅 README 文件. - Shell-Bash (1)

📅 最后修改于: 2023-12-03 15:18:51.548000 🧑 作者: Mango

pytesseract.pytesseract.TesseractNotFoundError: tesseract 未安装或不在您的 PATH 中.有关详细信息,请参阅 README 文件.

当您使用pytesseract进行OCR文字识别时，可能会遇到上述错误。

问题描述

该错误是由于系统无法找到Tesseract OCR引擎导致的。Tesseract OCR引擎是一种用于文字识别的免费开源的软件库。它是由Google开发的，能够读取多种图像格式，并且具有高精度的文字识别能力。

解决方案

为了解决该问题，您需要安装Tesseract OCR引擎并将其添加到系统的环境变量中。

步骤 1：下载Tesseract OCR引擎

您可以从以下网站下载Tesseract OCR引擎：

Windows 用户：https://github.com/UB-Mannheim/tesseract/wiki
Linux 用户：https://github.com/tesseract-ocr/tesseract

步骤 2：安装Tesseract OCR引擎

请按照Tesseract OCR引擎的安装说明进行安装。

Windows 用户：请下载已编译版本并按照说明安装。
Linux 用户：请使用系统的包管理器进行安装。例如，Debian/Ubuntu用户可以使用以下命令进行安装：

sudo apt-get install tesseract-ocr

步骤 3：将Tesseract OCR引擎添加到PATH

在安装完成后，您需要将Tesseract OCR引擎添加到系统的环境变量PATH中。这样，系统便可以找到tesseract命令。

Windows 用户：请按照以下步骤操作：
1. 在桌面上右键单击“此电脑”，然后单击“属性”。
2. 点击左侧的“高级系统设置”。
3. 在“高级”选项卡下，单击“环境变量”。
4. 在“系统变量”下，找到“Path”变量，然后单击“编辑”。
5. 在“变量值”框中添加Tesseract OCR引擎的安装路径，例如：“C:\Program Files\Tesseract-OCR”
6. 单击“确定”关闭所有打开的对话框。
Linux 用户：将以下命令添加到您的bashrc脚本中：

export PATH=$PATH:/usr/share/tesseract-ocr/4.00/tessdata/

步骤 4：重新运行脚本

完成上述步骤后，您应该重新运行您的脚本。如果一切正常，您应该能够成功使用pytesseract进行OCR文字识别。

结论

如果您遇到 TesseractNotFoundError 错误，请按照以上步骤安装并设置 Tesseract OCR 引擎。这将确保您能够成功进行OCR文字识别。