量子位买它，华少别抢话，丁磊：噢买尬( 二 ) 茕茕发自凹非寺量子位报道|公众号QbitA

文章图片
Round3：极限挑战
看来面对纸质出版物，甚至是它们的电子版，有道词典笔专业版都没有在怕的。
那么，当需要翻译的文字打印在瓶瓶罐罐的非平面包装上，它还能继续跟拍照翻译App竞争吗？
比如，这样一瓶卸妆水。

文章图片
即使是对于以镜头来捕捉文字内容的拍照翻译App ，这样的柱形表面也不太友好。
只能是想看哪一句，就尽量把镜头调整到其正对面。

文章图片
那么有道词典笔表现又如何呢？

文章图片
识别成功！并且继续发挥了哪里不会扫哪里的特长。
不过，在这种情况下，词典笔的识别确实没有平面上那么丝滑。滑动太快的话，会出现还没有扫完，输入就断掉的情况。
三轮测试下来，稍稍总结一下。
无论是纸质出版物还是电子出版物，在阅读场景中，网易有道词典笔专业版的优势十分明显。符合使用习惯，反应速度很快，翻译质量过关。
具体使用起来也很方便，提笔就能使用。上一秒查英语，下一秒换日语，也不用调整设置。
而推及到其他应用场景，相比于翻译质量并不稳定的拍照翻译，只要文字能扫得进去，词典笔的表现就可圈可点。
不过，出门在外，有一些场景下，拍照翻译的功能还是词典笔所无法替代的，比如：

文章图片
背后的技术
这么看下来，是不是觉得AI词典笔这样的硬件产品，还真有两下子？
那么，我们照例扒一扒产品背后的技术。
其实，在测试环节中不难看出，网易有道词典笔专业版，最核心的AI技术包括：OCR（光学字符识别）和NMT（神经网络翻译）。
OCR：一扫就能查单词
根据有道官方数据，有道词典笔的扫描速度最快可达240mm/s ，相当于1秒最多可以识别40个汉字。
并且，平均识别准确率可以达到96.8% ，最高识别准确率超过了98.5% 。
这就有赖于网易有道基于神经网络的OCR技术。
2017年开始，网易有道就上线了卷积神经网络+循环神经网络的OCR引擎，支持26种语言文字识别，也能进行语种自动判别和混合识别。
实际上，词典笔的笔头就是一个高速摄像机，能在用户提笔扫描单词的时候，每秒拍摄100多张图像。

文章图片
然后，通过图像配准、图像融合和文本切行，实现自适应全场景文本图像拼接。

文章图片
并且，通过流式识别计算，在扫描拼接图像的同时，就将内容提取出来，交由神经网络翻译。
NMT：换行整句话翻译
除了原有的高中生词典、汉英大词典、SSAT、SAT、GRE、托福、雅思、现代汉语规范词典、有道汉英释义、有道汉语释义、有道简明释义外，有道词典笔专业版现在还新增了牛津高阶英汉双解词典第七版，累积近240万超大词库。
词库巨大，查词准确，但想要实现整句离线翻译，还是需要神经网络的加持。
网易有道的NMT模型主要采用Transformer架构，并通过模型压缩+离线推断框架的方式，精简为离线端模型。
据官方数据，部署在有道词典笔上的离线NMT模型，一秒钟可以翻译30个汉字，并且离线翻译的结果接近联网水平。

量子位买它，华少别抢话，丁磊：噢买尬( 二 )

推荐阅读

为啥当一个男生表现得很热情主动，我就会感到害怕

点茶粉如何制作,茶道用具点茶用茶道具介绍

青少年听力下降亟待关注

宁波最新消息今天宁波全面恢复!还有一地通知:8月30日起调整

藏雪莲图片和功效,藏雪莲泡水喝的功效

淘宝图片尺寸大全淘宝图片尺寸

入狱23年获无罪，吉林金哲宏申请2132万余元国家赔偿

格式化孤单|这些名人的性格测试结果居然一样

智能手机|98名员工聚集性感染日本村田工厂停产：或影响全球手机生产

黄药师最后的结局,黄药师最后一个徒弟-

济南万豪国际公寓租房__万豪国际离花园道多远？

#zol中关村在线#高画质小机身佳能专微EOS R捕捉精彩瞬间

当归地黄酒的功效与作用

埃斯特·萨拉斯|美国联邦法官一家遇袭，或牵扯一桩敏感大案？

温州市委召开专题协商座谈会为法院检察院工作建言

[香港]海外人士期待香港早日恢复稳定和发展

怎么看电脑是什么系统，不进入桌面系统怎么看电脑是什么系统

科技圈里那些事Y|用了这款智能台灯后，工作和学习都离不开它！，169元到手

王者荣耀|王者荣耀：个性化搭配和定制全面升级，6个西瓜道具别忘了兑换

不知道抖音怎么拍？抖音创意大集合，看完立马有拍抖音的冲动

量子位 买它，华少别抢话，丁磊：噢买尬( 二 )

推荐阅读

量子位买它，华少别抢话，丁磊：噢买尬( 二 )