福布斯专访谷歌工程师总监:什么是人工智能的未来人工智能的未来 pdf 人工智能的未来电子版
谷歌工程师雷 库兹韦尔(Ray Kurzweil)
凤凰科技讯 北京时间5月1日消息,据《福布斯》报道,今年一月谷歌宣布雷 库兹韦尔(Ray Kurzweil)加入时,许多人想知道,为什么这位功成名就的企业家和预言家会想要加入谷歌。库兹韦尔回答:除了谷歌,没有哪家公司能够提供他所需要的计算和工程资源来完成其毕生的事业。
库兹韦尔现年65岁,自从14岁开始他就立志要打造一个真正的人工智能世界,并预言称到2029年人工智能将会赶上人脑智能。库兹韦尔一生之中有众多发明,如音乐合成器以及语音识别系统等。
现在作为谷歌工程师总监,他研发的重心即为让计算机能够真地理解甚至说自然语言。随着人工智能领域深度学习技术的崛起,库兹韦尔最终想要打造 电子计算机朋友 ,在你做什么之前就知道你想要什么。
的确,库兹韦尔的研发重心从时机上来说也颇具竞争意义。4月29日,谷歌将Google Now语音搜索应用推广至iPhone及iPad中与苹果Siri正面竞争。Facebook今年初也推出内置自然语言界面的Graph Search图谱搜索服务。很明显,搜索已经开始超越以有效搜索技术为特征的 原始阶段 。
以下为福布斯访谈纪要:
Q:在你的《如何创造思想》这本书中,你有阐述到大脑工作的理论。你能简要解释一下吗?
A:世界是具有等级的。只有哺乳动物才有新大脑皮层,而新大脑皮层的进化会帮助我们更好地理解世界的结构、更好地工作,同时也帮助我们在等级世界里解决问题。我们的思考方式也具有不同的等级。我们的第一个发明就是语言,语言也具有等级性。
深度学习(我一般称等级学习)所蕴含的理论就是,大家都有一个反映自然现象等级的模型,而大家都在学习这些自然现象,如果你不学习,你就会变得更加脆弱,更容易被表象所迷惑。
Q:那你会怎样把这个理论应用到谷歌公司呢?
A:我在谷歌的任务就是研发出能够理解自然语言、提取语言意义的特定等级方法,其实就是研发一种能够表征和模拟文本语义信息的方法,这样就会有助于搜索和回答问题。
现在谷歌搜索中越来越多的输入内容都是提问的形式,而问题本身对于搜索系统来说具有无限的复杂性,但是如果我们能够将这些语言按照不同的等级做成模型,我们就能更好地回答用户的问题,实际上我们得将这些数十亿的网页进行模型等级分类。
Q:来谷歌之前,在其他公司有过研究吗?
A:目前有一些学术项目在研发这个课题,但是还没有人提出真正完整的解决方案。我觉得IBM公司的沃特森在理解语言语义方面做的很出色,他的研究成果也表明这个项目的可行性。沃特森并没有把所有的常识都转化成手编程序。如果你想写下所有常识性的知识,结果都会显得很零碎,因为文本信息无法反应出语言和常识之间的模糊性。
沃特森最终也没这么做,而是通过维基百科以及其他基本百科全书集合资源,所以当时的百科问题回答比赛中,沃特森的机器打败了最优秀的两名选手。
Q:你为什么来谷歌呢?
A:在来谷歌之前我确实想了很久。这也是我在自己公司以外的第一份工作。我觉得谷歌很适合我。
这几年来我跟拉里 佩奇(Larry Page)在许多项目上有过合作,在人工智能方面也有过很多讨论。谷歌已经有一些学习算法,虽然不能算作深度,但是可以借助于谷歌庞大的数据资源。
去年7月我还跟拉里见面谈了我的书,当时还没出版,我给了他一本预售副本。我说我有兴趣做这个项目,也可能会创立新公司研发这些技术。但是他跟我说我应该考虑一下在谷歌这这个项目,因为谷歌拥有强大的数据资源和计算基础设施。如果在谷歌以外的企业做研发,我是没法得心应手。
Q:但是你做了年么多年的企业家,现在突然转身变成一个雇员,很多人都觉得很惊讶。
A:这是一个为世界作出改变的机会,也是一直激励我成为发明家的力量。现在大约有10亿人在使用谷歌。如果我能出一份力,一定可以帮到很多人,同时也会改变人类的知识。
而且这也不是什么小项目,这是我毕生50年来对人工智能专注的积累。我一直想着能够突破这个终极挑战,研发出真正能够理解模拟人类自然语言的技术,然后应用到实际生活中去。
Q:为什么理解人类语言成了终极的挑战呢?
A:阿兰 图灵(Alan Turing)曾经提出智能 图灵测试 ( Turing Test),这种测试是完全基于手写语言。基本上可以称为是一个即时通讯游戏。即便是在手写形式下,要真正掌握人类自然语言的意义也需要全面的人工智能技术。现在有很多机器人程序这么做,这些机器人程序或许是可以忽悠人几分钟,但是没法通过有效的图灵测试。
所以重点是,自然语言是用于研究人工智能的一块非常深刻的领域。除了在谷歌,我真得没法在其他地方开展这种研发工作。现在我在这任职了两个月,我也看到了拉里智囊团的智慧。
Q:为什么这么说呢?谷歌还有什么能够帮助你实现目标吗?
A:就拿知识图谱(Knowledge Graph)来说,谷歌知识图谱包含7亿个话题、地点、人以及其他概念。如果你想要理解自然语言,你必须理解世界上的概念和事物,包括抽象的和实际存在的。谷歌知识图谱现在有7亿个条目以及数十亿个条目连接,现在还在不断膨胀。这个是我没法创造出来的,而且这也是我们以后工作一定会用到的资源。因为如果你要把语言分成不同模型,你就必须将它与包含所有概念的知识库联系起来。另外谷歌还有很多其他技术,如句法解析等等,这些技术在谷歌以外你都是看不到的。
Q:在你的书里,你还写了一章阐述在计算机软件中如何真正创造思想的步骤。那是你在谷歌的目标吗或者说是最终目标吗?
A:我在书里只写了一个大概的方向,但是我没有把所有私人的想法都写进去,例如如何构建等级?我在书中几乎都没讲。关键是这种等级不是我们生来就有的,我们生来只有这些毫无联系的模块,还没有形成任何模型,然后我们才开始学习。
关键是新大脑皮层创建了这种等级意识,把这些模块互相联系起来,而且人要花很多年甚至几十年来能达到特定的智能水平。因此即使你能够完美地打造出一个新大脑皮层,如果没有学习经验也只是徒劳无功。所以人工智能领域的大量工作就是要去创建学习经验。
Q:那你在这方面有什么计划呢?
A:我现在已经有了初步想法,怎么样从模拟大脑皮层暴露的数据中真正地构建这种等级。这也是我在谷歌的任务。拉里对我的书感到非常兴奋,同时对人工智能领域也给予了很高的关注度。所以我有高的独立性,我不用按照别人给的特定方案来研究。
沃特森的机器能够打败了最优秀的两位选手,是因为知识规模,因为机器可以轻易地读完2亿页的书,而对于我们来说1亿页已经吃不消了。所以我的想法是收集大量的语义信息,即便不能从我们自身收集,我们也可以从每一个网页、每一本书的页面里信息。这个方向也就是搜索和知识导航总的发展方向。
Q:你和你的团队会跟谷歌的其他人工智能相关的团队合作吗?
A:我现在已经有自己的团队,有些成员是从公司内部调过来的,一些是从外面招募进来的。我会广泛利用公司里的其他资源。例如我们需要更新知识图谱,融入更多的关系集合,因为知识图谱还无法全面地表征我们在语言中所表达的关系。所以在研发自然语言理解程序的过程中,我们要做的工作之一就是不断与知识图谱的团队合作,扩大知识图谱规模融合更多的概念关系。
Q:你的最终目标是创造能够通过图灵测试的人工智能机器吗?还是通过这些技术来改善人脑?最终你会对人工智能和人脑区分对待吗?
A:我首先是一个发明家。在发明的过程中,我才进入预言主义的世界。时机很重要;所有你认识的创新者都把握住了绝佳的时机。拉里和谢尔盖把互联网链接融合起来打造搜索引擎的想法很好。如果他们早几年或晚几年这么做,你可能就不会听说他们的名字了。
我个人的目标不是打造出一台能够通过图灵测试的计算机,而是希望能够在短期内对世界作出一些贡献。自然语言理解技术需要长期研究积累,单靠某个人无法完成。
Q:使用深度学习以及神经网络会如何改变计算机的本质?
A:冯 诺依曼计算机的真实架构其实与大脑的结构很不一样。传统计算机的架构可以说是平行的,但是在大脑中,100万亿个神经节点都在同时计算,但是这些计算速度非常慢,大概每秒钟才100次,而且这些计算本身都是没有意义的,都是以任意的方式组合。计算机却不一样。
超级计算机的计算速度快于完全模拟大脑功能的计算速度。这是一个很重要的区别。那也是亨利 马克兰(Henry Markram)的蓝脑项目(Blue Brain Project),这个项目已经筹集有10亿欧元的基金。现在美国也模仿欧洲启动了类似的项目称为大脑活动图项目(Brain Activity Map),这个项目是在分子层面上来模拟大脑运作。
Q:你认为这种方法不可行?
A:怎么说呢,这个项目很庞大,但不是研发人工智能技术的正确途径。不过通过这种方式可以学习大脑,学习神经如何运作,离子通道怎么运作,通过构建大型的人脑仿真系统还能检验大脑功能。这是一种学习大脑的方式,我们可以从中学习一些方法然后利用这些从生理学而来的算法来打造人工智能系统。
Q:当我们真正迎接人工智能到来的时候会有什么改变吗?
A:这其实是一个加速循环法则。我们总能够改善既有的系统,而且通常都是成倍改善,不是线性改善。人工智能技术有助于让我们看到大脑的内部,从而让我们能够利用大脑作为生理算法的优点来打造更好的人工智能技术。(编译/小邝)