光学字符读取器(OCR)有助于通过字符的形状区分字符的存在。 OCR被用作数据输入设备,以从打印机,打字机等产生的预打印文档中读取数字和字母数字字符。
准确扫描字符的准确度取决于书写的清晰程度。扫描仪经过改进,可以阅读不同样式和大小的文本,也可以作为整洁的笔迹。使用OCR扫描的文本具有最高的准确性,但是由于有些字母经常被误读,因此也需要进行检查。 OCR用于在分拣办公室自动识别信件上的邮政编码。
在OCR中,扫描仪配有字符识别软件,该软件可将字符的位图图像转换为等效的ASCII码。整个过程的第一步是创建文档图像的位图,然后借助软件OCR将网格点的数组转换为ASCII文本,PC可以将其理解为字母,数字和特殊字符并将字符。
OCR软件会处理每个字符的位图,并将其与字符集进行比较,机器会对其进行编程以确认该位图将位图转换为文本,无论其匹配还是几乎匹配的字符模式都将被考虑作为字符读取。如果扫描的字符与任何已存储的字符模式都不匹配,则将其拒绝。
光学字符读取器(OCR)的优点:
以下是OCR的优缺点:
- OCR的信息可以高度准确地读取。平板扫描仪非常准确,可以产生相当高质量的图像。
- OCR信息的处理速度很快。通常会快速输入大量文本。
- 基于纸质的表格通常成为电子表格,可以直接存储或通过邮件发送。
- 这比付钱给某人手动输入大量文本数据要便宜。而且,在电子表格内转换所需的时间更少。
- 最新的软件还可以将表重新创建为原始布局。
- 与手动将信息输入系统相比,此过程要快得多
- 高级版本甚至可以重新创建表,列,甚至生成网站。
光学字符读取器(OCR)的缺点:
以下是OCR的优缺点:
- OCR文本仅对打印的文本有效,而对手写文本无效。手写必须由计算机学习。
- OCR系统很昂贵。
- 产生的图像需要大量空间。
- 在此过程中,图像质量可能会下降。
- 最终图像的质量取决于第一张图像的质量。
- 必须仔细检查所有文件,然后手动更正。
- 并非100%准确,方法期间可能会犯一些错误。
- 少量文本不值得做。