OCR光学字符识别技术原理讲解

工程师 2019-03-02 20770

电子说

1.3w人已加入

描述

　　OCR （光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

　　ocr识别的过程如下：

　　1、图像输入：要进行ocr识别，第一步便要采集所要识别的图像，可以是名片、身份证、护照、行驶证、驾驶证、公文、文档等等都可以，然后将图像输入到识别核心。

　　2、图像预处理：此过程包含二值化（将图像上的像素点灰度值设置为0或255，也就是将整个图像呈现出明显的只有黑和白的视觉效果）、去噪、倾斜度矫正等。

　　3、版面分析：将所要识别的文档分段、分行处理

　　4、字符切割：此时需要字符定位和字符切割，定位出字符串的边界，然后分别对字符串进行单个切割，单个分割出来的字符再做识别。

　　5、字符特征提取：提取字符特征，为后面的识别提供依据。

　　6、字符识别：将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配，识别出字符。

　　7、版面回复：将识别结果按照原来的版面排班，输出Word或pdf格式的文档。

　　8、后处理校正：根据特定的语言上下文的关系，对识别结果进行较正的算法。

打开APP阅读更多精彩内容