『OpenCV』如何构建识别图像中字符的自动程序？一文解读OCR与HTR |图像处理|Medium|数据库|

选自Medium
作者：Ajinkya Khalwadekar机器之心编译参与：Panda、蛋酱
在机器学习和计算机视觉领域，光学字符识别（OCR）和手写文本识别（HTR）长期以来都是人们研究的重要主题。本文将帮助计算机视觉爱好者大致了解如何对文档图像中的文本进行识别。
光学字符识别和手写文本识别是人工智能领域里非常经典的问题。 OCR 很简单，就是将文档照片或场景照片转换为机器编码的文本；而 HTR 就是对手写文本进行同样的操作。作者在文章中将这个问题分解成了一组更小型的问题，并制作了如下的流程图。

本文插图
图 1.1：应用流程图按文档边框裁剪图像在图像处理中，通常需要对图像进行预先编辑，以便获得更好的表征。裁剪是图像编辑中最常用的操作之一，这可以移除图像中不需要的部分，也可以向图像添加所需的特征。你可以使用 OpenCV 来轻松地找到图像中文档的边缘，查找图像中文档边缘的最佳方法是使用阈值图像。 OpenCV 提供了不同的阈值样式，这是由其函数的第 4 个参数决定的。在这个函数中，第一个参数是源图像，这应该是一张灰度图像；第二个参数是用于分类像素值的阈值；第三个参数是 maxVal ，这是当像素值超过（有时是低于）阈值时所要给出的值。下面的代码将能帮助你找到阈值图像，然后确定文档边缘的轮廓，你可以将这些轮廓点与图像边缘进行比较，然后确定文档的边缘。
#thresholdimageret,thresh=cv2.threshold(imgray,150,255,0)cv2.imwrite('thresh.jpg',thresh)#edgecontourscontours,hierarchy=cv2.findContours(thresh,1,2) 检测和裁剪/分割文档中的所有词在有约束的受控环境中进行词检测通常可以使用启发式方法实现，比如利用梯度信息或者这样的事实：文本通常会被分组成段落以及排列成直线的字符。但是，使用启发式方法是存在缺陷的，图像中很多不需要的区域也会被检测为词，所以我们可以使用 OpenCV 的 EAST（Efficient and Accurate Scene Text）检测器。可以参考 Adrian Rosebrock 写的 EAST 检测器相关文章：https://www.pyimagesearch.com/2018/08/20/opencv-text-detection-east-text-detector/ 然后再根据 Tom Hoag 分享的方法对其进行改进：https://medium.com/@tomhoag/opencv-text-detection-548950e3494c这种方法能以很高的准确度检测出手写文本以及机器打印的文本。检测出图像中的词之后，再将它们裁剪出来并将它们全部保存下来。预处理词图像应该怎么样对图像进行预处理？这完全取决于你接下来要做什么。如果想要分类手写的和机器打印的词，需要所有图像都处于灰度模式。为了将图像转换为灰度图像，还需要使用 OpenCV：
imgray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) 这是手写词吗？这是一个分类问题：确定一张特定图像中的词是「手写词」还是「机打词」。作者浏览了多篇文章和研究论文，发现支持向量机（SVM）是解决这一问题的最佳方案，然后使用了来自 sklearn 软件包的 SVM 分类器来完成这一任务。对于用于分类的数据集，作者提到了一个很好的手写词图像有标注数据集 IAM：http://www.fki.inf.unibe.ch/databases/iam-handwriting-database对于机器打印的词图像，作者收集了大约 2000 张词图像。下面是用于预测的特征：
1. 平均像素强度
2. 像素强度的标准差
3. Otsu 阈值
4. 像素强度直方图中局部最大值的数量
5. 属于像素强度上面的四分之一的像素的百分比
6. 属于像素强度下面的四分之一的像素的百分比
【『OpenCV』如何构建识别图像中字符的自动程序？一文解读OCR与HTR】

上一页
1
2
3
下一页

推荐阅读

南投县长林明溱:以后不要再提“一中各表”，只有“九二共识”

国际航班调整后还有哪些变化？民航局权威解读来了

南方PLUS|蔚来资本、京东和携程为股东，嘀嗒出行赴港IPO：2019年扭亏

金花普洱什么是茶,什么是普洱茶

「宝宝吃奶量」一个月月龄的宝宝吃奶量是多少如何判断宝宝是否吃饱

怎么样摆脱自卑感

“以後的生活一定有奔头”——江西洪涝灾区回访记

深圳|中办、国办：支持深圳在资本市场建设上先行先试

Do早报|美方宣称将对华为实施签证限制；字节跳动或分拆TikTok为美国公司；携程回应Skyscanner裁员：将进行组织结构优化｜Do早报

火箭新星越战越勇，早点把球交给他土耳其队可能就赢了？

看看新闻Knews|倒饭三次就要被辞退，这是裁员新手段吗？

运势|7天内大富大贵，3大生肖运势上行，事业稳步上升，衣食不愁

为啥我们总是对别人笑脸相迎，却下意识地把不好的情感吐给自己亲近的人被亲近的人伤害了又改怎么样克服

穿衣搭配|被“林凤娇”惊艳到了，穿衣低调却时髦，与林青霞同框气质也不输

直观视界唱吧高管摆摊“卖唱”，地摊经济有多火？腾讯总监“摆摊招人”

当心这类诈骗手法：“微信实名认证”骗术暗藏木马

联想|联想电动牙刷史低：原价139元现在44元还包邮

8天长假，旅游市场准备好了

养肝养肾瑜伽是什么

人民日报|人民日报评论员：香港维护国家安全的法治支撑

人民网@【战“疫”说理】疫情防控中如何有效实现经济复苏？

『车家号』高低功率如何选？后期改装就能“低变高”了吗？，同一款发动机

手机、眼镜如何消毒？清洁要从细节做起

『音频』iOS如何导入百度云的音频（易剪和易剪多轨版）

十大突破性技术-NMN，叫你如何选择最好的NMN

妙家影视■如何计算低压开关柜铜排用量？这是我见过最漂亮的文章！

「史今中外s」潜伏大陆40年没被发现，结局如何？，女特务为隐藏身份嫁给农民

【妙家影视】如何计算低压开关柜铜排用量？这是我见过最漂亮的文章！

「心聆寒岁」一夜带货1.6亿！如何看待直播热潮？，商场失意直播却火了

查询个人信用征信，个人信用信息查询系统