📜  使用 Tesseract 从图像中读取文本(1)

📅  最后修改于: 2023-12-03 15:36:34.600000             🧑  作者: Mango

使用 Tesseract 从图像中读取文本

Tesseract 是一个开源 OCR(Optical Character Recognition,光学字符识别)引擎,可以将图像中的文本转换为可编辑的文本。它支持多种语言,并且可以与不同编程语言一起使用。

在本文中,我们将介绍如何使用 Tesseract 从图像中读取文本,并提供Python代码示例。下面是步骤:

步骤一:安装 Tesseract

要使用 Tesseract,您需要在计算机上安装 Tesseract 引擎。可以从Github下载,并使用简单的配置进行安装。有关详细信息,请参阅此文档:https://github.com/tesseract-ocr/tesseract

步骤二:安装 pytesseract 库

pytesseract 是一个 Python 库,它提供与 Tesseract 引擎进行交互的接口。您可以使用pip命令直接安装库。例如:

pip install pytesseract
步骤三:读取图像

要从图像中读取文本,我们需要将图像加载到 Python 中。Python 中有一个名为 Pillow 的库,它支持多种图像格式。在本文中,我们将使用 Pillow 来加载图像。

from PIL import Image

# 加载图像
img = Image.open('image.png')
步骤四:使用 Tesseract 从图像中提取文本

现在我们有了 img 对象,可以使用 pytesseract 库从该图像中提取文本。以下是使用 pytesseract 的示例代码:

import pytesseract

# 设置 Tesseract 引擎路径(可选)
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# 从图像中提取文本
text = pytesseract.image_to_string(img)

text 现在包含提取的文本字符串。如果您有图像中的特定区域要提取,请参见pytesseract.image_to_boxes。

使用这些步骤,您可以轻松地从图像中提取文本,并使用提取的文本进行各种任务。


以上就是使用 Tesseract 从图像中读取文本的步骤及Python代码示例。使用 Tesseract 引擎和 pytesseract 库使得光学字符识别更为方便,同时也提升了识别的准确性。