硅谷专家解答人工智能 6 个最火爆问题
来源: 作者: 发布时间: 2015-11-24

Siri 的共同创立者 Cheyer 说,在做 Siri 的时候经历了一些有趣的事:当把 Start Over 输入的时候,系统却开始寻找路易安娜的 Over 公司。那一刻他顿时理解了真实数据的重要性。

美国新墨西哥大学计算机系的助理教授 David Ackley 的经历也非常有趣。当他开始研究人工智能的时候,把对 AI 的追求视为一种理解自己、人们和世界的方式。但最终却发现自己的追求转向了人工生命——听起来似乎很相似,但是AI和人工生命有不同的目标、技术和研究团体。

Vicarious的共同创立者 George 提到了一个有趣的项目,一个能源公司打算建造风力发电厂,找来了 George 要建立视频分析,通过监视录像中向不同迁徙的山羊脚印,来计算山羊总数。

人工智能属于新兴科技,很多人并没有感同身受的体验。站在专家们的肩膀上,通过他们有趣而又充满干货的分享,我们来看看人工智能最火爆的几个问题,究竟是怎么回事。

我们把六个问题摘录如下:

1.在AI研究中最令您感到恍然大悟的事情是什么?

2.AI天生似乎有一种倾向来时不时地给人启迪和惊喜的能力。你曾有过这样的经历吗?如果有,你能描述一下吗?

3.目前为止,你所见过 AI 不同寻常的使用方式是什么?

4.你见到过在谈论AI中最大的秘密是什么?

5.你认为对AI的恐惧在未来如何变化或转变?

6.你认为AI研究的下个中心是什么?

在本文的第一部分中,我们会涉及到一些AI研究的令人恍然大悟的问题,围绕这个技术中的惊喜和发现,也有一些最不同寻常的情况。

在AI研究中最令您感到恍然大悟的事情是什么?

Cheyer:在AI方面我有过的最令我恍然大悟的事情是我还在Siri公司工作的时候的事了(在苹果要求公司开发他们的语音助手之前)。在那时候,我们有Siri的原型,当时它被作为学术研究来开发了几年。Siri有一些很有趣的技术上的创意并且在完成很多任务时它看起来运作的很好。我们接着收到了第一个储存着2千万公司名字的数据,我们把它作为词汇加载到我们的系统中。我输入了最基础的自然语言命令,“重新开始(start over)”(这本来会将系统重置到一个无语境的状态),然而系统回应说,“在路易安娜的非建制地区(Start)内,寻找公司‘Over’!”那时候,我意识到英语语言中的每一个单词都是一个公司名称或者是一个地理位置,这种可能产生的,有爆炸性的歧义组合比我所预期的要多得多,并且学术原型与使用数据并根据用户提供的要求来真正解决问题,这两者之间有着很大的不同。在我的生涯中,基于这些限制条件让系统重新变得非常精确是我做过的最有趣和最重要的项目了。真实数据的重要性有点像对一个很明显道理的顿悟,但是现在回头看,这是一个我不得不亲身经历才能懂得并领悟其重要性的教训。

Ackley:我似乎只能在事后才能意识到一些重大见解。例如我把对AI的追求视为一种理解自己、人们和世界的方式,但是最后发现自己转向了人工生命——听起来似乎很相似,但是AI和人工生命有不同的目标、技术和研究团体。回想过去,智能虽然非常重要,但是也会倾向于高估它自己,这个规律变得很明显。为了明白某人在任一天任何一分钟内将要在世界上做什么,有一个事实是有很大影响力的,那就是他们是一个活着的生物,而且必须以某种方法去做一个生物要做的事情,而不特别限于一个智能的生物。(现在人工生命和AI均涉及了很多电脑编程,此外令我恍然大悟的程度较小的事情很明确,通常是天才设计的问题被解决了,或者,仍是发生很多次的事情,就是bugs突然解决了)。

George:很难挑出一个这样的事情来,所以我挑出一些杰出的神经科学的研究,这些研究我认为能够引导智能系统的发展:Hubel 和Wiesel ,Mountcastle ,Rudiger vonder Heydt , Tai Sing Lee , Joaquin Fuster ,和 Jim Dicarlo 都是一些在大脑皮层回路计算原理上做出贡献的科学家的典范。像 George Lakoff 和 Mark Johnson 这样的认知科学家在高层次概念是如何从具身经验中创造出来这一方面得出合理的理论。将所有这些知识放入到被 Judea Pearl , Geoff Hinton 研究得出的计算框架中,还有其他的事情,都是十分令人兴奋的。

AI天生似乎有一种倾向来时不时地给人启迪和惊喜的能力。你曾有过这样的经历吗?如果有,你能描述一下吗?

Cheyer:我有过很多自己研究的AI系统给我一种启迪式惊喜的经历;这是我从事AI研究众多的原因之一。这里说一个记忆犹新的故事,当我从事一个叫做 CALO 的项目时(CALO:Cognitive Assistant that Learns and Organizes,能够学习和组织的认知性助手)。这个项目是美国历史中政府资助最多的AI和机器学习项目之一。CALO的目标是构造一个智能自动化助手,它通过帮助管理信息工作者的任务、日历、文件、项目、交流等等,让信息工作者(如你和我这样的人)提高工作效率。我曾运行这个系统的一个版本,然后随着我用邮件、文件等等工作时,CALO根据我的所有信息,自动制作了一个“语义地图”,将各个项目中的员工连接起来,决定他们工作中的角色和他们应该完成的任务等等。由于CALO项目是我从事过的主要项目之一,它和其他的子项目和任务一起放在我的项目清单中。一天我和系统用自然语言互动,然后我用了CALO这个词作为一个项目的名字。CALO回应的方式与CALO被用作人名回应的方式一致(我多希望我记得那时的问题和回答)。然后我很惊讶。我记得当时在想,“CALO觉醒了并将自己当做是人了?”后来我弄清楚了这次出乎意料表现的原因。结果是CALO并没有那么觉醒,但是就在那时候,我感觉十分惊喜与兴奋。

Ackley:在一个 Michael Littman 和我从事过的早期工作中,一个惊喜发生了。工作关于利他主义的进化——对于所谓的“自私”进化来说很棘手的问题。我们编程让可进化的生物有了神经网络“大脑”,并模拟了一个环境,在这个环境中个体只有在接受很严重的风险时才会受益。我们的处理是我们测试了成组的生物,并给它们一些可进化的能力——发出起初没有任何意义的声音的能力和能够听到组内声音的能力。我们发现非交流个体总是首先出现。然而,在一些进化条件下,我们观察到后代生物们通过互相发送信号提示环境中的机会和危险而获得的分数比任何孤独的生物都高——即使这种“事实性的声音”没有给发音者直接的回报。进化是关于竞争,也关于合作;环境和细节也很重要。接下来的事情如果不够令人兴奋的话,至少令人惊讶的是起初在某些实验中,在合作性交流者出现后,一些低分的个体也存活下来并扩散。我们发现它们作为个体表现的更好了,而且它们也完全聋了,并且它们经常喊着一些无意义的声音来混淆那些不聋的生物。如此这般!

George:我们在Vicarious 构造的系统的一个特点就是它们能够想象不同的情形和相应概率的能力。想象力可以被用在无法预测的形式中,并且我们可以产生一些奇怪的组合例如半狗半车的形状。它的另一种呈现形式是幻想一些不在那里的东西,例如当我们看到云的形状时。

目前为止,你所见过 AI 不同寻常的使用方式是什么?

Cheyer: AI 被用于各种各样、可见到、很实用的任务中,但是我特别喜欢AI用于富有创造性或者艺术领域,这对于我来说,能够让我理解什么让人为“人”。我最喜欢的一些例子包括:

David Cope 在EMI (音乐智能实验)上的工作,它主要是关于电脑程序创造了很多不同形式的优美的音乐作品,从经典到爵士再到纳瓦霍式音乐。

Kim Binsted’s JAPE(“Joke Analysis andProduction Engine”),一个电脑程序,能够创造一些双关语和其他的幽默(例如 “What do you call a Martian who drinksbeer? An ale-ien!”)

像Automated Insights 和 Narrative Science 这样的故事生成公司,能够写一些总结某些事件或情况的散文。例如“27个Colonials队员来到棒球场上,这个Virginia投手战胜了他们,投了一场漂亮的比赛。在这场由他掌控的令人难忘的比赛中,他击败了10个击球手。”

Harold Cohen’s AARON ,一个机器人创造艺术作品,不是使用像素而是真正的画画。它创作了这个作品,它选择颜色,混合他们然后真真正正的画画,从开始到最后,没有任何图片和其他输入作为指导。下图是AARON 在1992年的作品。其他人也试着扩展 Harold Cohen 的感知型作品范围,例如Benjamin Grosser 的交互式机器人画画机器和 Oliver Deussen和Thomas Lindemeier 的e-DavidRobot画画机器人。

Ackley:我对最新的应用还不是很清楚,虽然近期谷歌工程师从人工神经网络生成的梦境图片很引人注目。

这个问题假定了AI的使用的普遍性,而且我认为这本身就很值得注意。社会中的技术发展依序应这样变化——新技术出现,熟悉,期望,无聊并最终谈出人们的视线而且许多 AI 创新正在这样发展,从众多语音中的语音识别到车牌号和邮政编码的图片识别到开车和煮饭的模糊逻辑。

George:许多年前,一家大的能源公司想要与我们合作一个视频分析项目。公司打算建造一个风力发电厂,他们需要一个通过监视录像中向不同方向迁徙的山羊的脚印来计数山羊总数。

你见到过在谈论AI中最大的秘密是什么?

Cheyer:我并不认为关于AI有任何真正意义上的秘密——如果非要说的话,我认为秘密就在未来的众多可能性中。然而(这是一个很大的转折),我认为人们经常过低的估计创造一个类人智能的难度,并且过高的估计我们完成AI的进度。如今有一些很有信誉的科学家如 Elon Musk 和霍金提出了一种可能性,就是真正的AI和AI觉醒不久就要发生了,这很有压力。Ray Kurzweil公开宣称在将来的30年内,“1000美金能够买到一台比所有人合起来的智力高出十亿倍的电脑。”Ray的假说主要依据硬件,例如将人脑能做的计算总量与电脑的处理速度相比。我会为此辩论,软件(例如给电脑的命令)比处理速度(处理这些命令的速度)要重要的多,并且即使是在计算机和神经科学领域最顶尖的科学家对人类智能也只是一知半解。我对我们能够完成人类级别的智能时间的预测是在百年或千年级别而不是几年或者几十年。

George:我时不时会见到两种极端看法。第一种是通用智能永远不会实现(因为大脑太复杂以至于无法理解),或者是它“明天”就会发生并且失去控制。另外,一些新的报道倾向于对AI会如何变化有很多错误理解。许多情况下,标题会夸大实际被完成的工作,或者说夸大一次发现的影响,因为浮夸的报道会带来更多的点击率。

你认为对AI的恐惧在未来如何变化或转变?

Cheyer:我在AI领域工作的时间很久,经历过几轮“对AI情绪的正弦性变化”。20世纪80年代,专家系统(用人工智能技术编成的软件,能够使用专家的知识数据库给出建议和决策,例如在医学诊断和股票中)非常热门,并且人们打算到处制造智能机器。但是后来当事实没有达到公众期望时,在20世纪90年代和21世纪初期,AI过时了。自从21世纪中期,AI蓄势重返并且有很有力的原因!在一些如图片处理、语音识别、虚拟助手、自动驾驶、机器学习等等领域中,有了实质性的进步。这些新的成功汇聚在一起,使外界对接下来会发生的事情产生了期望(和恐惧)。然而,我猜当尘埃落定后,这种关于AI的(恐惧)和期望会大概消失十年左右…回想20世纪50年代和60年代(AI很火),70年代(不火),到了今天,我认为我们看到了连续不断的、实质性进步,而在这期间公众的关注会随时间上下起伏。

Ackley:AI发展会有一个快速的、无法理解的“科技奇点”出现,这种想法是一个谜,这种想法在某些程度上看是有道理的但是最终它只是一个智能高估它本身的例子。实际世界中,变化多样发展速度是受到限制的,这种限制来源于从时间和距离到质量和能量再到法律、金钱、政治、情感等等方面。“智能”喜欢将自身看做是在操作轻舟,但实际上是操作一个很大的船,并且有四面八方的压力;而且事实上,“智能”不像是船长,而更像是研究船的史学工作者。就算接下来,我们真的创造出这样的机器,我们应该更多地关心如何正确的抚育他们,而不是与它们竞争。接下来要说的事情,它也是事实,那就是,至少不久的将来,AI技术将会继续发展而且加速经济和劳动力的错位,这也是成功的技术会引发的结果,并且作为一个社会,我们大部分没有处理过那样的事情。相似地,自动化武器问题看起来很紧迫和危险,虽然这种危险更多依附于武器(一个能够产生巨大破坏力的、被简单开关控制的机器)上,而不是依附于控制着那个开关的鼓吹战争的人、恐怖主义者、疯子或者不完美的机器上。

George:自从火的发明后,新科技总是有可能用于帮助或伤害他人。建造一些新事物的部分责任是保证你创造的事物对于人类来说是净正的(正面作用和负面作用抵消后)。我认为现在,人们对于AI有更多的恐惧是因为人们对它知之甚少。我觉得AI研究团体的能力与好莱坞或者媒体是很不连通的。我认为一旦人们了解了这些系统是如何运作,并且知道了它们的限制,人们会感到安心一些。

你认为AI研究的下个中心是什么?

Cheyer:现在,由于深度学习最近在图片识别和语音识别中的成功,深度学习(例如深度神经网络)恐怕是AI领域最火的话题。在我看来,深度学习主要与我认为是“感知”功能相关联,例如识别文字、脸和物体。我期望随着机器开始掌握这些低层次的功能,更多的注意力会不久转向高层次的功能例如计划能力和推理能力,这是人类能力的核心。在Viv实验室,我们正致力于一项这样的技术,它能够使电脑通过学习加强式的自动程序合成技术来解决一些复杂的任务,这能够促使一系列之前受人编程限制的用例的实现。

Ackley:AI的研究会有许多名字,而且不同的情况下看起来也不同,而且将来研究进度会有停滞期,但是下个十年来看,还是“机器学习所有的事情”:将大的人工神经网络和相似的技术应用到所有可以想到的,能够获取到足够数据的任务中。机器学习的硬件也将会强大而廉价,促使相应研究和发展的范围的扩大。起初,这样应用产生的结果会从巨大的数据中心出现并渗透到互联网中,在互联网中没有人知道它是机器人,然后在各个已知的信息处理任务中会有越来越多的机器竞争——虽然不能够流畅的掌握这些任务——将受到公众期望,随后逐渐变得无聊,并在我们察觉之前消失。

George:高层次概念和感应动作生成模型。深度学习在图片分类方面的进步让人很兴奋,并且有很多有用的工作正被完成,进而促使不同领域的视觉性问题的解决,如侦测、语义分割等等。

地方动态

政务热线建设发展与战略管理专题研修班在长沙圆满结训

中国信息协会会长王金平一行赴北京国脉互联信息顾问有限公司调研

杜链同志追思会在京举办

赋能未来,共创数智化新纪元:中国信息协会集团企业数字化工作委员会正式成立

  • 协会要闻
  • 通知公告