来自科学网博客
作者:赵斌
人类认知与机器的互联
中国有句古话:三个臭皮匠顶个诸葛亮,是指三个才能平庸的人,若能同心协力集思广益,也能提出比诸葛亮还高明的计策,比喻人多智慧大。还有一个词叫做“众人拾材火焰高”具有相同的意味。现在,互联网的发展已经将人群的智慧变成了一个有价值的、可随需应变的资源。众人的智慧变得如此强大,如果能将这些智慧通过互联网连接起来,它自身就变成了一个重要的资源。
2011年,面对全球性的大失业现象,麻省理工斯隆管理学院的两位教授Erik Brynjolfsson和Andrew McAfee合撰《与机器赛跑》(Race Against the Machine)一书,提出了一种新的观点,随着技术的高速发展,人类正与机器形成一种对抗,而在这个对抗过程中,人类肯定会输,因为与机器相比,人类需要吃饭、睡眠和休息,有情感需求,厌恶重复性劳动。因此提出,未来我们需要转换思路,别与机器赛跑,应该与机器合作,适应机器,帮助机器,体现人类对机器的价值,这样人类才可以更好地与机器协同进化,而不是被机器所淘汰。
现在,如果我们将这种想法扩展开来,人的智慧不仅仅是自己互联,而且还可以与机器连接起来,建立一种合作关系取长补短,变成一个不可战胜的重要驱动力。这个重要的资源,美国卡内基梅隆大学(Carnegie Mellon University)的Luis von Ahn在其博士论文中引入了一个术语,叫人类计算(Human computation),指的是结合人类和计算机的优势来完成某个人类和计算都不能独立完成任务的分布式系统。同时,伴随着这个词的产生的,还诞生了一个大数据行业经常拿来说事儿的故事,就是我们现在网站登陆注册时所用到的“验证码”,其英文全称是Completely Automated Public Turing test to tell Computers and Human Apart(CAPTCHA,全自动区分计算机和人类的图灵测试)。最初的CAPTCHA图片是由机器生成的,控制程序也知道正确答案,其作用纯粹就是为了防止机器恶意自动注册和机器攻击,用于验证当前正在进行的操作是人类而不是机器。
坦率地讲,许多身份验证机制的产生,是人类与技术之间的内耗,比如机场安检的逐步升级,纯粹善良大众为少数坏人买单,消耗了大量的人力和物力。CAPTCHA显然也是如此。聪明的人总是不满足现状的,既然CAPTCHA消耗了广大网民的时间资源,那么能否利用这些“浪费”的资源做一些有意义的事儿呢?后来出现的reCAPTCHA就是在这方面进行的挖掘,它除了能更好地区分人和机器外,还能“顺便”为文献数字化做贡献。具体如何实现的呢?现在新的文字材料一般都有电子版,但计算机出现之前的大量书籍、报刊等书面资料没有现存的电子化版本,要将其进行电子化显然很有意义,但任务异常繁重。随着OCR的发展,文字自动识别的水平越来越高,但有些文献由于年代久远,字迹开始变得模糊、褪色、污损等,OCR无法识别。但是,这些OCR无法识别的内容由人工辨认却相对比较简单。reCAPTCHA系统中,验证码由两个单词组成,一个是系统设定并知道答案的“control word”(对照词),另一个是来源于OCR无法识别的“unknow word”(未知词),前一个用于验证用户是否有能力识别这些文字,如果答案正确,就认为用户对“unknown word”部分的回答也是可信的。为了增强可信度,同一个的“unknown word”会被分配给多个用户,然后综合这些用户的回答来判定这个疑难字符是否被正确识别了。reCAPTCHA系统以免费服务形式的形式提供给各网站,加速了文献数字化的工作。
这种形式,也有人称之为协同智能(collaborative intelligence)或众包(crowdsourcing)。各种服务现在正在虎视眈眈地看着这些人类认知的丰富资源供应,如维基百科、使命游戏(Games with a purpose)和亚马逊土耳其机器人(Amazon Mechanical Turk)。维基百科,尽管最初人们担心其准确性,但毫无疑问现在它已成为各种基本信息的关键资源。使命游戏中的ESP,专门针对在线玩家,他们在玩一个有趣的游戏过程中,可生成有用的数据(如图像标记)。众包市场的亚马逊土耳其机器人用于协调那些为获得报酬的工人来完成任务。
多邻国(Duolingo)是一个免费语言学习网站和众包文字翻译平台。其设计理念是,当用户逐渐学习课程时,同时也在帮助翻译网站上的内容或文件。这个平台推出后很快成为全球最受欢迎的外语学习神器,是唯一一款曾被谷歌Play Store和苹果App Store都评为年度最佳的教育类应用。也就是说,在线学习过程,也可以变成一种工作,相反,工作也可以变成一种学习过程,有些人在线工作的时候可以帮助其他人学习新的技能,这可能对未来的工作和教育产生变革性的影响。基于这种思路,在放射医学领域如何从x射线照片中识别肿瘤是一个非常重要的工作,但现在这样的任务,依靠机器视觉算法还不可靠,然而人类对此擅长。一个放射医生新手刚开始也是观察易于分类的照片进行训练的,而后达到一定的熟练程度后就可以应对更困难的情形,这种进步过程,既帮助了机器,也帮助了他人。
人类计算在科学研究上所体现的非凡成就,最引人注目的当属Fold it项目了。参与者被要求尽可能以最有效的方式折叠虚拟蛋白质。该目标是为了解决分子生物学一个最重要难题:蛋白质折叠是如何这般迅速和有效的?该项目开始后不久,就发现猴免疫缺陷病毒调节蛋白的三级结构,这个问题曾经困扰了该研究群体数十年,如果得到解决可能会找到应对艾滋病病毒的新方法。另外,宇宙动物园(Zooniverse)项目要求公民科学家确定月球上的环形山,帮助翻译旧船的行船日志,在天文图像中确定星系,并发现其他恒星周围的行星,都是利用众包来进行科学研究的重要案例。
信息科学建立在这些早期的成功上,证明推进人类计算系统的潜力可以模拟和解决一些经济、环境和社会政治系统交叉的奇怪问题(那些挑战传统解决问题的方法)。从上我们看到,在过去几年里,由于众包市场和一些巧妙应用程序的出现,人类开始实现一些之前不可能完成的任务。通常情况下,这样的应用涉及到人类需要利用人类的智慧执行某些形式的计算,如图像分类、翻译、蛋白质折叠这些问题对目前最先进的人工智能算法来说也是一个几乎难于完成的挑战。
今天,由于计算机科学家、众包先驱者和远见者的努力,创造了研究人类计算的路线图,使我们能从中得到各种答案。人类计算系统已经非常成功地解决一些复杂问题,从确定螺旋星系到组织赈灾。而且,只要人类认知可以在全球范围内有效地利用,他们的潜力仍将变得越来越强大。这些目标都是非常有价值的,但会产生一些重大问题。其中最重要是伦理、法律的本质以及人类计算的社会影响。如何设计这个工作才能允许有意义的和有尊严人类的参与?获得何种结果才能让最弱势人群从中受益?机器与人类之间产生特定结果的最优分工是什么?
你能读懂这段文字吗?
人类计算系统进化历程与挑战
有关人类计算(Human computation)这个概念,我接触已经有一段时日了。上周末,终于有时间将自己的认识与有关知识进行整合,成为一篇博文《人类计算:人类认知与机器的互联》(也就是本文的前半部分——编者注)。在撰写这篇博文中,顺便检索了一些资料,现在整理这些资料,又是一次愉快的阅读之旅。
Science周刊的网站,今年开始改版了,条目编排更加清晰,字体搭配更加和谐。总之,我喜欢!而就在元旦出版的新年第1期中,发表了一篇题为“The power of crowds”(众人的力量)的文章,也是谈论与人类计算有关的话题。文章介绍了人类计算系统进化的基本历程,借助一些人类计算项目中著名的故事,探讨了如何联合人类和机器的力量解决世界的新难题,或者是历史上遗留的一些棘手问题。
为了让我们能更深刻地理解这篇文章,还是先按照作者的行文顺序,介绍一下人类计算系统进化的三个历程(图1):
图1 人类计算系统的进化(Pietro Michelucci, and Janis L. Dickinson, 2016)
(A)微任务化(microtasking):众包(crowdsourcing )一般将一个复杂的大任务分解成许多微任务(microtasks),称为微任务化,每个人都能参与完成一部分工作。这些微任务一般是机器所欠缺而人类所擅长的东西,比如借助了人类高超的视觉感知能力对图像进行分类。这样通过友好的用户界面将分解的微任务交付给一大群人来完成,然后将获得的数据聚合后进行下一步处理。例如,美国普林斯顿大学的神经科学实验室在开展一项名为Connectome的科学研究,其最终目的是解开人类大脑之谜。在项目执行过程中,就开发了一款名为EyeWire绘制大脑神经元网络的在线游戏,通过将神经细胞三维图像化的过程制成游戏,玩家需要通过从大型三维显微图像数据集中分离单个细胞来绘制结构和相应的神经元连接,并将其涂色,从而完成复杂脑神经图的三维图像,帮助研究人员探讨人的神经元细胞的连接关系,如何影响人的情绪、反应以及如何造成与神经相关的疾病等。这一过程对普通人而言是非常简单的,仅需具备一定的图像、空间识别能力,通过鼠标移动、点击等操作便能完成,但这个过程对目前世界上运算速度最快的超级计算机也是一件难事。所以,Eyewire的宣传语上说:解决大脑的奥秘,我们需要比超级计算机更为强劲的能力,那就是你。该游戏吸引了145个国家的165000多名公民科学家(玩家)的参与。这种让人们用游戏的方式参与到严肃的医学研究中,在人们在享受玩游戏乐趣的同时,还能为科学研究做贡献,真正成了有些科学大佬所说的“玩”科学。这个工作第一次提供了哺乳动物视网膜的神经元结构和组织如何产生检测运动的功能。视觉微任务化还被用来加快医疗分析,例如MalariaSpot项目,其中有22个休闲游戏玩家参与计数寄生虫,而他们工作的质量正如一个训练有素的病理学家那样准确。还有项目将居民贡献的照片拼接起来,决定在扑灭一场森林大火中从什么地方喷水更有效。
显然,微任务化非常适合于一些问题,它们可以通过重复应用相同的简单过程来解决一个更大数据集的每一个部分,如上面列举的几个例子。但是,微任务化本身在处理一些棘手问题时也是有些力不从心的,比如有关气候变化、疾病、和地缘政治冲突等问题。因为这些问题是动态的,涉及到多重、交互的系统,需要丰富的全局知识体系,进行多步推理和创造性抽象才能获得一个新的减缓策略。相信未来的人类计算生态系统有巨大的潜力来帮助解决这些棘手问题,但目前正在不太棘手的环境中进行探索。
(B)工作流程(workflow):将复杂工作流程分配给众多参与者,每个人在各步的作用就是在前一个参与者的基础上使用和增加更多信息。直到最近,由于缺乏支持性基础设施,超越简单微任务的系统不得不从头开始创建。今天,工作流工具出现了加速发展,并改善了人类计算系统的可靠性。设计日益复杂的系统还需要增加对人机反馈环的理解。例如,系统可以设计为增强人的贡献。CrowdCrit就是这样的情况,可为用户的图形设计提供专业评价,就是利用了人的输入去指导计算机实现更高效的工作。它通过将领域知识构建到工作流程中,可让非专家参与者通过指导可提供类似专家的反馈。在CrowdCrit中,计算机增强了人类的能力,但反过来也是可能的:人类的输入可指导计算机变得更加有效,正如在交互式遗传算法中所看到的,其应用自然选择的过程开发出新的解决方案。这些算法变异、重组和修剪成各种候选解决方案,以确保各思想的每一个连续世代都比之前的有所改进。然而,在真实世界的应用中实现这种算法通常需要各种场景的知识和挣脱机器限制的认知能力。通过人类的努力做到电脑不能做的步骤,如生产、结合和评估想法。
(C)解决问题的生态系统(problem-solving ecosystem):在营造解决问题的生态系统中,研究人员正开始探索如何把许多人类的认知过程与基于机器的计算结合起来,建立复杂的可信模型,这样构建的相互依赖系统,成为解决世界上最具有挑战性问题的基础。这些系统的原型提供了在线工作空间,允许参与者参与开放性活动,在现实世界中他们可贡献、结合、修改、连接、评估、并在一个共同的分析框架内集成数据和概念,在某些情况下,定制或采取行动。例如,数学家合作的在线平台“博学项目”(Polymath Project)帮助证明了一个长达80年之久的数学定理,以及面向大众的精细化新闻制作系统(ePluribus Problem Solver)只是根据分发给普通公共参与者的少量照片就产生了一个真实的准确性和构建良好的新闻文章。在这两个案例中,不同的参与者合作产生了具有实时集体智慧的新洞见,及时地交流思想创造出新的知识。而不是先收集人类的输入,然后再处理。人们串联起来,各自独立的工作,从群体社区中获得新奇的观点,并允许多个可见的解决方案。在Polymath Project中,人类贡献者坚持建立一系列基本规则,而在ePluribus中,计算机程序及其用户界面加强了这个基本规则。文章中还说,这些生态系统承诺可以更有效地应对灾害以及长期棘手问题的挑战,如气候变化和地缘政治冲突等。
人类计算需要与传统的计算机科学有所区分,并且能从基于对人类认知、动机、错误率和决策理论的集成理解的设计方法中受益。文章认为,在大多数人类的计算系统中,少量的参与者做大部分的工作。鉴于这种不寻常的工作分配,我们需要提高我们的认识,如何募集和保持最多的参与者,增强技能开发,让参与者对项目的总体贡献最大化。人类输入、信息共享和基于机器的协同处理工作对于效率最大化来说可能是更具挑战性的。机器会给出预测输出,这样错误总是可以追溯到错误代码或设计,但人类是难以根据他们的投入和工作质量进行预测的。
伴随公民科学出现的众包是志愿服务的一种形式,但现在跨越了从工作(付费的微任务)到玩耍(游戏)的整个范围。随着越来越多的工作需要在众包环境中完成,我们需要考虑劳动力、失业率和经济意味着什么。一方面,众包为企业提供了随需应变的劳动力;然而,它目前处于劳动法的管辖范围之外。所以必须保护众包工作者(crowdworkers)没有受到剥削。
一些人认为更快的计算机处理速度将最终建立起基于机器智慧和人类智慧之间的桥梁,人类计算为把人和机器各自优点进行结合中已经提供一个巨大的机会,达到短期内无法获得的能力。然而,涉及到透明度、知情同意和有意义选择的群体驱动指导是新出现的伦理和社会影响越来越普遍,并在线上参与中以不同形式出现。还有一些非法使用也可能产生一些副作用,如虚假的信息工程,其中人类计算系统是为了制造恐慌、窃取信息或操纵意志是一个重要问题,不能忽视。文章指出,以社群驱动的方式,能指引产生出透明的信息和有价值的结果,利用道德规范能让人类计算做到以人为本,服务人们的合理需求。
参考文献:
Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33
人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html
Human Computation 杂志http://hcjournal.org/ojs/index.php?journal=jhc
Managing Crowdsourced Human Computation. http://www.ipeirotis.com/wp-content/uploads/2012/01/36946.pdf
The Emerging Science of Human Computation (http://www.technologyreview.com/view/538101/the-emerging-science-of-human-computation/)
Pietro Michelucci, Janis L. Dickinson, The power of crowds. Science, 2016-01-01, Vol. 351, Issue 6268, pp. 32-33
人类计算——众人拾柴火焰高 http://sss.bnu.edu.cn/?research_show/tp/234/lid/272.html
?------------------------------------------------
加入机器之心(全职记者/实习生):hr@almosthuman.cn
投稿或寻求报道:editor@almosthuman.cn
广告&商务合作:bd@almosthuman.cn

机器之心是Comet Labs旗下的前沿科技媒体。Comet Labs是由联想之星发起、独立运作的全球人工智能和智能机器加速投资平台,携手全球领先的产业公司和投资机构,帮助创业者解决产业对接、用户拓展、全球市场、技术整合、资金等关键问题。旗下业务还包括:Comet旧金山加速器、Comet北京加速器、Comet垂直行业加速器。