主页 > O点生活 >发明验证码的天才让全世界心甘情愿帮他工作 >

  • 发明验证码的天才让全世界心甘情愿帮他工作


    2020-06-23


    发明验证码的天才让全世界心甘情愿帮他工作

    在你购买高价爱黛儿巡迴演唱会门票时,那些奇怪扭曲符号就是验证码;你知道它们,我知道它们,大家都知道它们是什幺,但是没有人喜欢这些东西。它们存在有好一阵子了,但直到不久之前,我才认为这些为了对付机器人以及诈骗的符号是恼人的。但这带来了意外的惊喜:很多时候,验证码是具有实际意义的文字,我花在打验证码上面的五秒钟加上其他人花在这上面的五秒钟,在不知不觉中会构成强大的计算能力。

    这是旧闻,但我相信大部分人完全不知道这故事,这是一个有关验证码如何产生,以及发明它的人为什幺是个天才的故事。

    问题

    2000 年的时候, Luis von Ahn 还是卡内基梅隆大学的研究生。他和他的教授 Manuel Blum 一起进行一项只有人类可以通过,电脑不能通过的测试,用来防止黄牛用电脑程序自动购票然后以更高的价格转手卖出去。

    他们得到的解决方案是 CAPTCHA ,也就是初级的验证码,被称为「用来区分人类与电脑的全自动图灵测试」。人们通过识别系统显示的扭曲字母序列和复杂的缩写来证明自己是人类。

    问题解决了对吗?可能吧。

    虽然这种验证码对于识别诈骗机器人有效,但 von Ahn 有意识到了一个有关效率的新问题。在接受 The Walrus 採访时, Luis 说他在无意中创造了一个会浪费人类最重要资源——由一个又一个十秒钟累积而成的数万小时的人类大脑循环。

    具体来说,这种验证码每天都会让大家看 2 亿个单字,每个单词大约 10 秒钟,也就是每天会浪费大约 50 万小时的人力资源。

    发明验证码的天才让全世界心甘情愿帮他工作
    解决方法

    故事是这样的。在开车从华盛顿到匹兹堡的路上, von Ahn 想到了将那些被浪费掉的人力利用起来的

    方法,就是将杂乱无章的单词转换成有意愿的词语。用这种方法,那些被「浪费」掉的人类大脑运转时间又一次被利用了。

    他将两种低效用脑的方法结合起来,产生了一个双赢的方案。这是个天才的想法,他因此获得了 2006 年的麦克阿瑟天才奖,奖金 50 万美元。

    在光学字符识别中,有大约 20% 的扫描材料是不能被读取印刷材料的电脑程式识别的。von Anh 利用进阶版验证码程序做的第一件事就是去帮助纽约时报的档案馆数位化,档案馆建立于 1851 年,有超过 1300 万篇文章。现在,这些文章都已经被识别完可以从网上搜索到了。

    以下是维基百科对于验证码工作原理的介绍:

    Facebook 、 TicketMaster 、 Twitter 、 4chan 、 CNN.com 、 StumbleUpon, 以及 Craigslist 这些网站每天都会显示超过一亿次验证码,这些验证码正在帮助网路讯息的数位化。

    Google 也看到了验证码的价值,雄心勃勃地宣称要讲全世界每一本书都收录在内的 Google Books 也在使用验证码来扫描书籍。目前他们已经扫描了超过 2500 万本书,在全世界範围内使用了 1 亿 3000 万条验证码。

    注:你是否曾经遇到过看上去像是房子门牌号的验证码? Google 2012 年开始在验证码系统中投入街道截图,用来识别地址、街道名称和交通标誌。

    启示

    儘管验证码在区分人和机器这件事上十分重要,它依然曾经因为没有向帮助他们转录的人付劳动薪水而被批评,就像是亚马逊的 Mechanical Turk 没有向工人付薪水一样。

    事实上,验证码的词语是杂乱无章的还是一个有意义的词真的重要吗?从用户的角度看,其实没什幺区别。但我很愿意帮助到别人,就像我们在 2002 年都回去下载 SETI 的萤幕保护程式来帮助他们寻找外星人一样。

    发明验证码的天才让全世界心甘情愿帮他工作

    无论你在不知情劳动这件事上持什幺立场,你都不得不佩服 von Ahn 利用运算来完成一个伟大的想法,帮助人类完成双赢的行为。

    Kickstarter 是个做群众募资的网站,众包共同完成工作在商业上并不是什幺新鲜事。但这在基于人类的运算当中尚未得到广泛应用。 Mechanical Turk 在被正确使用时,就是一个能够将大量工作分散到成千上万人的有力工具。就好像是一个人只花了 200 美元就得到了一万张羊皮。

    更棒的是这种想法还可以在各种各样的应用程式当中使用,就像 Luis 现在工作的公司,提供免费在线学习语言服务的 Duolingo。对不熟悉的人而言,这是一个通过在网页端或 App 中通过翻译游戏来学习语言的服务。想知道这些被翻译的文字是哪来的? Duolingo 跟 BuzzFeed 和 CNN 合作,翻译他们的内容。

    通过 Duolingo 上到 2015 年 6 月为止的一亿活跃用户的努力,巴西人们将会跟我们看到同样的新闻。

    欢迎加入「Inside」Line 官方帐号,关注最新创业、科技、网路、工作讯息
    发明验证码的天才让全世界心甘情愿帮他工作


    上一篇:
    下一篇: