新智元一秒一张A4纸?这个笔内置全景拼接,“一扫即查”中英日韩( 三 )
本文插图
普通拼接效果
自适应全景拼接效果
有了全景拼接 , 就能得到一个正确的文本输入图像 , 通过模型自动将这个全景图像自动切分成多行 , 就能进一步提高识别的准确率 。
有道词典笔的OCR技术实现了目前业内最快扫描速度:240mm/s , 这约等于一张A4纸的长边 , 相当于1秒可以识别40个汉字。 识别准确率方面 , 「一扫即查」的平均识别准确率 , 从2019年8月刚上市时的95.5% , 提升为目前96.8% , 远远领先业内平均 82%的水平 。
从BERT诞生以来 , NLP领域预训练语言模型取得了巨大进展 , 有道也将预训练模型引入到了 NMT神经网络翻译中 。
本文插图
理论上只要平行语料足够多 , NMT是可以实现任意两种语言的互译 , 目前有道的词典笔只加入了中英、中日、中韩三种 , 一方面是目前这几种语言场景需求最高 , 另一方面NMT模型是非常大的 , 难以直接嵌入一个小小的词典笔 , 精简模型本身 , 提高移动端离线推理的速度就显得尤为重要 。
有道采用了更加精简的离线端模型 , 在保证效果的同时极力压缩了模型尺寸 。 有道词典笔的离线神经网络翻译 , 一秒钟可以翻译30个字 , 并且离线翻译的结果接近联网水平 。
离线状态下 , 平均识别准确率超96% , 最高识别准确率超过98.5%
虽然词典笔看起来是一个非常小众的市场 , 但它却是有着非常强的刚需场景 。 点开电商平台搜一下词典笔 , 你会发现已经有不少厂家开始布局这块市场 。
学生群体自然是这些厂商的核心目标人群 , 不过 , 实际上只要是有学习外语、阅读外文文献、出国等需求的人 , 都是词典笔的潜在用户 。 如果给他们做个画像 , 将会是一个数量庞大、分布广泛、年龄跨度大的松散群体 。
小小一个词典笔 , 功能非常有限 。 让它做到「能用」很好办 , 但要让它做到「好用」 , 就需要有背后技术的强大支持力、对用户需求的深刻洞察力 , 以及对产品的设计开发能力 , 三管齐下 。
技术能力上 , 有道的AI技术让有道词典笔能够更加智能 , 识别速度快、准确率高 , 让这款小小的词典笔用起来非常顺手 。 在离线状态下 , 相比此前的版本 , 专业版的平均识别准确率从95.5%提升到了96.8% 。
此外 , 在日语和韩语的识别率方面 , 有道词典笔的表现也相当亮眼 。 离线状态下 , 专业版的日语平均识别率达到了98.77% , 韩语则达到了98.07% 。
洞察能力上 , 有道专注于用户需求的研究 , 一切功能都从用户的真实场景出发 , 不做功能的堆砌 , 最大限度的发挥一个功能的潜力 。
产品设计上 , 有道词典笔无论从原材料、美观度、握持手感等方面 , 均可圈可点 。 B站上一个专门给硬件产品做评测的账号「硬核拆解」拆开了一只词典笔 , 感叹「没想到做工这么好!」
【新智元一秒一张A4纸?这个笔内置全景拼接,“一扫即查”中英日韩】最终 , 有道词典笔为我们带来了一个闭环的、沉浸式阅读体验 。 妈妈再也不用担心我看书分神了!
推荐阅读
- 游戏动漫资讯|一张图带你回顾腾讯游戏年度发布会
- 鲨鱼嘴|美国男子海里一把抓起鲨鱼,下一秒竟徒手掰开鲨鱼嘴
- 你的绝对领域|精辟至极,不好笑的咱不发,一秒笑出腹肌的幽默段子十五则
- 企业教练詹sir|一张转款审批单,领导签名却藏着不为人知的奥秘
- 伴随着一张讯景的5500XT显卡开箱,浩南的要求是不是太高了呢
- 北青网综合|看呆!价值8000欧元“潜水艇”居然驶上街头?下一秒就“凉凉”了
- 快讯神记|送你一张图片,一般人看不出来,明日小暑
- 通信世界5G地心游记:“探秘”一张解决煤矿井下作业的5G专网
- 拳击航母网站|无人能比,邹市明竟达到无人企及的高度!一秒8拳
- 王者荣耀|KGL解说透露白虎志即将返场,下一秒惨遭打脸,李信世冠新皮肤实锤
