tesseract 多个 oem 配置 (1) - 芒果文档

📌 相关文章

📜 tesseract 多个 oem 配置 (1)

📅 最后修改于: 2023-12-03 14:47:56.891000 🧑 作者: Mango

Tesseract多个OEM配置

Tesseract是一个开源的OCR（Optical Character Recognition）引擎，目前由谷歌在维护。它能够从图像中识别出文字内容，并将其转化为计算机可处理的格式。而OEM（OCR Engine Mode）则是Tesseract提供的不同OCR算法的配置，用户可以根据不同的应用场景选择不同的OEM来实现更好的识别效果。

可选的OEM

Tesseract目前提供了以下几种OEM供用户选择：

OEM 0: Legacy OCR Engine（遗留OCR引擎）

该OEM使用较老的OCR算法，对于文本字体的多样性、图像背景的干扰能力较弱，但具有良好的文件格式兼容性。

OEM 1: Neural nets LSTM（深度学习模型OCR引擎）

该OEM使用现代的深度学习模型，能够较好地处理不同文本字体、各种复杂背景干扰、模糊等情况下的OCR识别问题。但该算法复杂度较大，在硬件性能有限的设备上可能受到一定限制。

OEM 2: Legacy OCR Engine + LSTM（遗留OCR引擎+深度学习模型OCR引擎）

该OEM结合了遗留OCR算法的优势和深度学习模型的性能，能够在一定程度上平衡精度和效率。

OEM 3: Default（默认OEM）

该选项让Tesseract自行选择最优的算法进行识别，一般情况下是OEM 1，即深度学习模型OCR引擎。

使用方法

在Tesseract中指定OEM的方法如下：

tesseract image_path output_path -l lang -oem OEM_option

其中OEM_option可选参数为0、1、2或3，分别对应上述四种OEM。需要注意的是，不同的OEM可能对应的识别结果不同，具体需要根据应用场景进行选择。

总结

Tesseract提供了多种OCR算法的配置，用户可以根据具体的应用场景选择不同的OEM实现更好的识别效果。正确选择合适的OEM可以提高Tesseract的识别准确率和效率，提高OCR技术的应用价值。