验证码与Duolingo的创造者,总有办法让全世界数亿人免费帮他干活( 二 )
在没有验证码的日子里 , 网络世界是杂乱无章的 。 网站无端地被注册上万个空账号 , 黄牛利用机器把演唱会门票和火车票一扫而空 。
但有了验证码 , 网站就能保证填写表格的是一个真实的人 , 因为电脑程序无法在图像上识别出扭曲的文字 , 但是人类可以 。
而Luis的思考并不止步于此 。
验证码的影响力之大 , 已经扩展到了全球范围——每天有大约2亿次的验证码输入 , 而每个验证码平均耗时10秒钟 。 如果将这个数字乘以2亿 , 那么全人类每天就在输入验证码上浪费了50万个小时 。
Luis对此表示耿耿于怀 。 于是 , 他又了一个新想法——
既然不能因为网页安全而放弃验证码 , 那么有什么方法可以利用它来做点好事呢?
人在输入验证码的10秒钟里 , 大脑精确运行着 , 这甚至是电脑所无法匹敌的 。 怎样才能让这10秒钟的工作变得有意义呢?有没有什么目前电脑无法解决 , 但是可以分割成仅用10秒就能解决的难题呢?
Luis想到了一个点子——书籍数字化 。
市面上有很多书籍数字化的项目 , 包括亚马逊的Kindle和谷歌都有这些需求 。 从一本旧书开始 , 首先扫描 , 相当于把每一页照一张数码照片 , 这样就有了这本书每一页的文字内容 。 下一步 , 电脑需要解读这些照片上的每一个字 。
这就涉及到了OCR(Optical Character Recognition)技术 , 也就是光学字符识别 。 但光学字符识别的技术并不是万能的 , 统计显示 , 五十年前的书 , 有30%的单词电脑都无法识别 。 特别对于那些墨水褪色、书页又泛黄的旧书 。
于是
Luis利用技术摘录出那些电脑无法识别的单词 , 这样广大用户在网上输入验证码时 , 就能将其识别出来 。
文章图片
但你要说了 , 这怎么能知道用户输入的就是正确答案呢?
Luis为此加入了双单词识别 。
▍
其中一个单词A是电脑无法识别的单词——因为系统不认识这个单词 , 所以无法判断输入者的答案 。
▍
另一个单词B是系统已经识别的单词——但系统不会告诉你哪个是已知哪个是未知 。
当用户输入两者的时候 , 如果能拼写正确系统已认知的那个单词B , 那么就判断该用户为真人 , 同时 , 对于单词A , 只要有10个人输入了相同的单词 , 那么这个词就确定无误了 。
文章图片
你以为你输入的仅仅是验证码 , 但其实你在免费帮忙录入陈旧的电子书 。
文章图片
成功后再创业:
让3亿人学习语言的同时免费做翻译
如今的Luis的新身份 , 是全球语言学习程序Duolingo的联合创始人 。
Luis发现 , 互联网的大部分语言是英语 。 YouTube上耶鲁大学的课程、科普视频、Amazon的书籍、新闻网站、博客等等 , 基本都是英语 ,
推荐阅读
- 创造了「验证码」的他,总有办法让全世界数亿人免费帮他干活
- 安全|由于身份验证问题 Sophos要求用户从Chrome浏览器切换到Firefox浏览器
- 智能|航天科工二院自主研发无人智能协同系统通过多次验证
- 315晚会再曝SDK暗藏玄机:短信可全部传走,包括交易验证码
- 警告!|3·15曝光手机"窃贼插件":验证码也能被传走
- 短信|手机窃贼插件曝光:短信可被全部传走,包括网络交易验证码
- 用户|这些APP赶紧卸载!央视315曝光手机里的“窃贼插件”:你的网络交易验证码也能被传走
- 3·15晚会曝光手机里的窃贼插件:你的短信可被全部传走,包括网络交易验证码!
- 中芯国际|[互动]汉钟精机:公司半导体真空设备目前在中芯国际处于测试验证阶段
- 消息资讯|荣耀MagicBook系列锐龙版A+级生产力,为艺术创造者提供优质体验
