项目理念 | (图像字符识别)
目的:该项目的目的是开发这样一个工具,它以图像作为输入并从中提取字符(字母、数字、符号)。图像可以是手写文件或打印文件。它可以用作从打印记录中输入数据的一种形式。
工具:这个项目是基于机器学习的,我们可以提供大量的数据集作为软件工具的输入,这些数据将被机器识别并从中提取出类似的模式。我们可以使用 Matlab 或 Octave 作为该产品的构建工具,但建议在初始状态下使用 Octave,因为它免费且易于使用。
研究:很多研究都在这个产品上进行,并且仍在继续。研究领域包括图像处理、自然语言处理、人工智能和机器学习。
实施:这种工具的实施取决于两个因素——特征提取和分类算法。因此,您可以使用在线提供的各种分类器,还可以阅读有关基本特征提取算法的信息。该产品的基本版本(精度较低)可以在 Octave 中实现,具有有限的训练数据集和简单的组件分析。有关实施和正在进行的研究的更多信息,请参阅以下链接。
http://perun.pmf.uns.ac.rs/radovanovic/dmsem/completed/2006/OCR.pdf
http://crypto.stanford.edu/~dwu4/papers/ICDAR2011.pdf
http://yann.lecun.com/exdb/publis/pdf/matan-90.pdf
还有在线可用工具从图像中识别字符并将它们转换为 doc 或 txt 格式的机器编码字符- http://www.onlineocr.net/
此类工具的领域太大,您可以通过为正在进行的项目做出贡献或从头开始创建自己的项目来学习很多关于上述技术的知识。
这个想法是由 Utkarsh Trivedi 贡献的。如果您还想在这里展示您的项目创意,请发送电子邮件至 review-team@geeksforgeeks.org。