logo

淘丁数据标注:数据标注中的OCR图像技术

来源:淘丁集团

淘丁数据标注:数据标注中的OCR图像技术

OCR图像识别技术

OCR图像识别技术是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,再通过文字识别技术将图像信息转换为可使用的计算机输入技术。简单来说,就是提取图像上的信息。通常情况下,OCR图像识别与文本标注,有着相辅相成的关系。

OCR图像识别技术的用途非常广泛,它能够识别证件、车牌、名片以及营业执照等等。在日常生活中我们也经常接触到它。

淘丁数据标注:数据标注中的OCR图像技术插图
淘丁数据标注:数据标注中的OCR图像技术

标注的几个过程OCR图像识别技术

图像输入:针对不同格式的图像,有着不同的存储格式和压缩方式。

预处理:预处理主要包括二值化、噪声去除和倾斜较正。

版面分析:将文档图片分段落、分行的过程叫做版面分析。

字符切割:由于拍照条件的限制,经常会造成字符粘连、断笔等情况,此时就需要文字识别软件具备字符切割的功能。

版面恢复:一般我们希望识别后的文字,仍按照原文档图片那样排列着,然后在输出到文档中,这个过程就叫版面恢复。

后处理、核对:不同的语言环境中,语言的逻辑顺序是不同的。因此,需要根据语言特征的上下文,对识别后的结果进行校正,这个过程就是后处理。