|12306验证码为什么那么变态?都是这项深度学习应用给逼的( 二 )
相比之下 , 中国对OCR的研究起步稍晚 , 起步于70年代 , 算起来也有近50年的历史了 。
但是 , 虽然早就开始了对OCR的研究 , 科学家们也从各个方面贡献了很多颇有益处的奇思妙想 , 为后续研究奠定了坚实基础 , 但总的来说 , OCR技术的应用发展迟缓 , 直到前些年仍然处于学术研究的领域 。 不过 , 每一项科研领域的僵局都最终会被一项划时代的技术打破 , 打破OCR领域僵局的就是鼎鼎大名的深度学习技术 。
本文插图
【|12306验证码为什么那么变态?都是这项深度学习应用给逼的】2012年发生了什么事呢?发生了这么一件事 , 基于深度学习的卷积网络模型AlexNet , 在ImageNet图像分类比赛中拔得头筹 。 拔得头筹这事本身不算什么 , 毕竟只要有比赛就一定会有人拔得头筹 , 问题是在以往的比赛 , 不同模型之间的差距很小 , 第一名都是“险胜” , 第二名都是“惜败” 。
而到了2012年 , AlexNet不但赢了第一名 , 而且在识别准确率方面超过第二名10% , 相当于百米短跑我第一名冲线 , 而且我不但冲线了 , 我还在终点吃了顿饭 , 然后第二名才刚刚跑完全程 。 这种碾压式的胜利让业界对这场赛事的评论纷纷变成了B站的弹幕 , 概括来说就一句话:大人 , 时代变了 。
当然了 , 前面这段讲得很戏剧化 , 也有很多人喜欢用“石破天惊”之类的词来形容 , 但应该说 , 深度学习并不是什么凭空出现的新技术 , 它是由机器学习下面的神经网络模型发展而来的 。
人工智能、机器学习和深度学习三者之间千丝万缕的关系 , 我们在前面的文章已经进行了细致的介绍 , 不再赘述 , 但深度学习的崛起 , 确实给OCR的应用注入了全新的活力 。
深度学习很快火遍全球 , 有意思的是 , 很多面向初学者的深度学习教程不约而同选择了将使用深度学习模型识别MNIST手写数据集作为深度学习领域的“Hello World” , 从前极为困难的验证码识别 , 在深度学习时代居然变成了初学者的第一堂功课 , 这是深度学习与OCR结合最为成功的案例 。 从此 , OCR展翅飞出象牙塔 , 飞入寻常百姓家 。
不过 , 我还是想特别说明一下 , OCR是一项通用性非常强的技术 , OCR与深度学习的结合逼得12306改验证码机制 , 这只是OCR技术的能力展示 , OCR活跃的天地远比验证码广阔得多 , 我们的机器距离我们的生活差的最后一公里 , 可能就有赖OCR来打通 。
你可能会问 , 机器和生活还差最后一公里 , 我怎么没感觉到 , 这是什么意思?
本文插图
回想一下 , 我们现在的生活其实是有两套并行记录体系 , 就拿最常见的去银行办理业务来说吧 , 我们先得用笔手工填写一份纸质的表格 , 上面包含了各项信息 , 这是一套记录体系 。 然后我们给银行柜台的工作人员提交表格 , 工作人员会让我们先等一会 , 等什么呢 , 就是等工作人员通过电脑终端把信息转录到另一套记录体系 。
现代银行基本都依靠各类信息系统进行管理 , 但这些信息系统是不能直接读取纸质表格的信息 , 那怎么办呢 , 只好通过人来转录 , 这个转录的过程免不了需要消耗人的时间和精力 , 增加了办理业务的成本 , 甚至成为限制提升业务办理效率的瓶颈之一 。
两套并行记录体系对我们的影响当然远不止于银行 , 从更为宏观的视角来看 , 消耗了人类社会大量的人力物力 , 以及对于人来说更为宝贵的时间 。
你可能又要说了 , 这些都是窗口业务 , 和日常生活关系并不紧密 。 其实不然 , 举一个我们很熟悉例子 , 二维码 。
就拿春晚的观众互动来说吧 , 过去主持人是说想要和春晚互动的观众朋友 , 可以把信息发到屏幕下方公布的号码 。 那么 , 观众如果真要互动 , 就必须得把在屏幕上看到的这串长长的数字逐个逐个敲进手机 , 光是想就觉得麻烦 , 再加上有时候看错或者敲错 , 感觉就更费劲了 。
推荐阅读
- 情感|华为今天如此成功,看一下任正非的岳父是谁,你就知道为什么
- 华为手机|泪奔!等等党的心酸,为什么有些手机它偏不降价?
- 36氪|为什么说远程办公也许会毁了硅谷?
- 硅谷|为什么说远程办公也许会毁了硅谷?
- 科技造就未来|Apple为什么要使用ARM?为什么不从头开始?
- |为什么我店铺流量狂掉?淘宝竞争这么激烈还能不能做?
- 科学,探月|嫦娥五号年内升空 我们为什么要去月亮上“挖土”?
- 科学|嫦娥五号年内升空 我们为什么要去月亮上“挖土”?
- 华为手机|千元机中,为什么很多消费者首选红米?
- 怜雪的纪实|网上电脑为什么比实体店电脑便宜很多?
