📜  tesseract 多个 oem 配置 (1)

📅  最后修改于: 2023-12-03 14:47:56.891000             🧑  作者: Mango

Tesseract多个OEM配置

Tesseract是一个开源的OCR(Optical Character Recognition)引擎,目前由谷歌在维护。它能够从图像中识别出文字内容,并将其转化为计算机可处理的格式。而OEM(OCR Engine Mode)则是Tesseract提供的不同OCR算法的配置,用户可以根据不同的应用场景选择不同的OEM来实现更好的识别效果。

可选的OEM

Tesseract目前提供了以下几种OEM供用户选择:

  • OEM 0: Legacy OCR Engine(遗留OCR引擎)

该OEM使用较老的OCR算法,对于文本字体的多样性、图像背景的干扰能力较弱,但具有良好的文件格式兼容性。

  • OEM 1: Neural nets LSTM(深度学习模型OCR引擎)

该OEM使用现代的深度学习模型,能够较好地处理不同文本字体、各种复杂背景干扰、模糊等情况下的OCR识别问题。但该算法复杂度较大,在硬件性能有限的设备上可能受到一定限制。

  • OEM 2: Legacy OCR Engine + LSTM(遗留OCR引擎+深度学习模型OCR引擎)

该OEM结合了遗留OCR算法的优势和深度学习模型的性能,能够在一定程度上平衡精度和效率。

  • OEM 3: Default(默认OEM)

该选项让Tesseract自行选择最优的算法进行识别,一般情况下是OEM 1,即深度学习模型OCR引擎。

使用方法

在Tesseract中指定OEM的方法如下:

tesseract image_path output_path -l lang -oem OEM_option

其中OEM_option可选参数为0、1、2或3,分别对应上述四种OEM。需要注意的是,不同的OEM可能对应的识别结果不同,具体需要根据应用场景进行选择。

总结

Tesseract提供了多种OCR算法的配置,用户可以根据具体的应用场景选择不同的OEM实现更好的识别效果。正确选择合适的OEM可以提高Tesseract的识别准确率和效率,提高OCR技术的应用价值。