万千字符 1个对策——深度学习OCR收藏

网友投稿 185 2024-01-25


OCR知多少    OCR(Optical Character Recognition)是指光学字符识别,通过光学技术和计算机技术将印在物体表面的字符转换成计算机可以识别的信息    在工业领域,OCR技术被普遍应用在食药品包装、3C电子、汽车零配件生产、烟草等行业,实现生产日期、批号、产品编号等信息的自动识别。

万千字符 1个对策——深度学习OCR收藏

OCR的应用行业

   在工业生产中,对OCR的识别率要求较高,一般识别率需大于99.9%大部分工业应用场景环境固定,产品一致性较好,字体规范,识别率较高但是, 面对并不理想环境或复杂字符,业内的综合识别率只有90%甚至更低。

这样的识别率远远达不到实际应用的需求

   在以上场景中,深度学习OCR以其泛化能力强,在复杂场景下表现更好的特点,从机器视觉众多方案中脱颖而出,开始应用于各种行业中产品与方案海康威视深度学习OCR技术在2017年3月刷新了ICDARRobustReading竞赛数据集的全球最好成绩。

   其基本的技术原理为:通过设计一个数十层的卷积神经网络来完成待识别字符图像的信息编码,然后使用启发式的注意力模型,实现从特征到字符的解码其中,专为字符识别设计的启发式机制,模拟人脑的思维模式对注意力模型提取的特征进行合理性评估,使注意力模型在复杂场景中具有的强大适应性,可实现大于99.9%的极高字符识别率。

原理架构图    在产品方案中,我们通常使用PC-Base+VM算法平台的方式搭建视觉检测系统,主要有以下几个部分组成:

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:2020年的信息安全:人工智能(AI)在各种信息安全系统中的广泛涌现收藏
下一篇:堡盟工业相机:优化“阴影恢复形状”应用收藏
相关文章

 发表评论

暂时没有评论,来抢沙发吧~