花样繁多的验证码不断问世,难道只是为了安全所需?不,还有另一个隐藏目的:让用户免费为其打工,比如,应用于纸质书籍电子化。
验证码的发明者易斯·冯·安说,他的创造其实无意中浪费了人类最重要资源,具体来说,这种验证码每天都会让大家看2亿个单词,每个单词大约花费10秒钟,也就是每天会浪费大约50万小时的人力资源。那能不能把这些被浪费的资源利用起来呢?他发现,许多公益组织正在把旧书籍扫描成电子版,但对计算机来说,那些斑驳的文字太难识别了。书籍内容大部分是文本,验证码也是文本,把扫描版的书籍文本对接到验证码上,让用户来识别不就行了?于是,2007年路易斯推出新的验证码系统reCAPTCHA,它会提供两个单词给用户识别,这两个单词都是书籍扫描版的一部分。
计算机其实已识别出第一个单词,之所以要展示出来,就是为了测试一下用户是不是真人,不过第二个单词计算机无法识别,用户需要录入自己认为的结果。面对第二个单词,一旦有10个人输入了同样答案,那么这答案就会被当作正确答案。也就是说,真正有效的人机测试,在验证码的第一部分就完成了,而第二部分,则是用户在义务为人类文明做贡献。
粗略统计,现今全世界每天都有2亿个字符通过reCAPTCHA录入,相当于人类15万小时的工作量。在不知情的情况下,全世界用户每年免费将230万本书数字化,并在短短几周就把CNN和《纽约时报》数年累积的内容翻译成其他语言。
除了义务为人类文明做贡献,输入验证码其实也在为人工智能贡献着一份力。小伙伴们肯定遇到过街景验证码,让我们选中小轿车、路牌或是自行车等图片。在你费眼又费脑地输入它们时,你其实是在为谷歌的人工智能免费打工。因为这些图片大都来自谷歌街景,其中部分图片是AI已经识别出来的,用于识别你是否真人。
和之前的书籍电子化一样的套路,其中还夹杂了几张AI难以识别的街景。从用户这里搜集到的街景数据,帮助训练人工智能,使得人工智能可以像人眼一样准确地识别路况信息。
在用户的“辛勤喂养”之下,运用了谷歌AI技术的无人驾驶汽车Waymo,已经在自动驾驶领域处于遥遥领先的地位,被称作是世界上最可能先达到L5级别(完全自动驾驶)的公司。
如今,收购了reCAPCHA的谷歌,已把大部分验证码都升级了,用户只要点击一下“我不是机器人”的按钮,就能轻松通过验证。即使这样,验证码还是能从你身上吸点油水。因为在你点击按钮的同时,鼠标的运动轨迹甚至是你打开的网页都可能被收集,帮助验证码系统进化。