📌  相关文章
📜  pytesseract.pytesseract.TesseractNotFoundError: tesseract 未安装或不在您的 PATH 中.有关详细信息,请参阅 README 文件. - Shell-Bash (1)

📅  最后修改于: 2023-12-03 15:18:51.548000             🧑  作者: Mango

pytesseract.pytesseract.TesseractNotFoundError: tesseract 未安装或不在您的 PATH 中.有关详细信息,请参阅 README 文件.

当您使用pytesseract进行OCR文字识别时,可能会遇到上述错误。

问题描述

该错误是由于系统无法找到Tesseract OCR引擎导致的。Tesseract OCR引擎是一种用于文字识别的免费开源的软件库。它是由Google开发的,能够读取多种图像格式,并且具有高精度的文字识别能力。

解决方案

为了解决该问题,您需要安装Tesseract OCR引擎并将其添加到系统的环境变量中。

步骤 1:下载Tesseract OCR引擎

您可以从以下网站下载Tesseract OCR引擎:

  • Windows 用户:https://github.com/UB-Mannheim/tesseract/wiki
  • Linux 用户:https://github.com/tesseract-ocr/tesseract
步骤 2:安装Tesseract OCR引擎

请按照Tesseract OCR引擎的安装说明进行安装。

  • Windows 用户:请下载已编译版本并按照说明安装。

  • Linux 用户:请使用系统的包管理器进行安装。例如,Debian/Ubuntu用户可以使用以下命令进行安装:

    sudo apt-get install tesseract-ocr

步骤 3:将Tesseract OCR引擎添加到PATH

在安装完成后,您需要将Tesseract OCR引擎添加到系统的环境变量PATH中。这样,系统便可以找到tesseract命令。

  • Windows 用户:请按照以下步骤操作:

    1. 在桌面上右键单击“此电脑”,然后单击“属性”。
    2. 点击左侧的“高级系统设置”。
    3. 在“高级”选项卡下,单击“环境变量”。
    4. 在“系统变量”下,找到“Path”变量,然后单击“编辑”。
    5. 在“变量值”框中添加Tesseract OCR引擎的安装路径,例如:“C:\Program Files\Tesseract-OCR”
    6. 单击“确定”关闭所有打开的对话框。
  • Linux 用户:将以下命令添加到您的bashrc脚本中:

    export PATH=$PATH:/usr/share/tesseract-ocr/4.00/tessdata/

步骤 4:重新运行脚本

完成上述步骤后,您应该重新运行您的脚本。如果一切正常,您应该能够成功使用pytesseract进行OCR文字识别。

结论

如果您遇到 TesseractNotFoundError 错误,请按照以上步骤安装并设置 Tesseract OCR 引擎。这将确保您能够成功进行OCR文字识别。