使用 Tesseract 从图像中读取文本(1)

📌 相关文章

📜 使用 Tesseract 从图像中读取文本(1)

📅 最后修改于: 2023-12-03 15:36:34.600000 🧑 作者: Mango

使用 Tesseract 从图像中读取文本

Tesseract 是一个开源 OCR（Optical Character Recognition，光学字符识别）引擎，可以将图像中的文本转换为可编辑的文本。它支持多种语言，并且可以与不同编程语言一起使用。

在本文中，我们将介绍如何使用 Tesseract 从图像中读取文本，并提供Python代码示例。下面是步骤：

步骤一：安装 Tesseract

要使用 Tesseract，您需要在计算机上安装 Tesseract 引擎。可以从Github下载，并使用简单的配置进行安装。有关详细信息，请参阅此文档：https://github.com/tesseract-ocr/tesseract

步骤二：安装 pytesseract 库

pytesseract 是一个 Python 库，它提供与 Tesseract 引擎进行交互的接口。您可以使用pip命令直接安装库。例如：

pip install pytesseract

步骤三：读取图像

要从图像中读取文本，我们需要将图像加载到 Python 中。Python 中有一个名为 Pillow 的库，它支持多种图像格式。在本文中，我们将使用 Pillow 来加载图像。

from PIL import Image

# 加载图像
img = Image.open('image.png')

步骤四：使用 Tesseract 从图像中提取文本

现在我们有了 img 对象，可以使用 pytesseract 库从该图像中提取文本。以下是使用 pytesseract 的示例代码：

import pytesseract

# 设置 Tesseract 引擎路径（可选）
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# 从图像中提取文本
text = pytesseract.image_to_string(img)

text 现在包含提取的文本字符串。如果您有图像中的特定区域要提取，请参见pytesseract.image_to_boxes。

使用这些步骤，您可以轻松地从图像中提取文本，并使用提取的文本进行各种任务。

以上就是使用 Tesseract 从图像中读取文本的步骤及Python代码示例。使用 Tesseract 引擎和 pytesseract 库使得光学字符识别更为方便，同时也提升了识别的准确性。