时间:2020-12-21 编辑:第四软骨鱼
未来和你LOL电竞的可能是腾讯的AI。
这个听起来有点脑洞大开的想法,并非遥不可及。腾讯的AI Lab就正在这么做。
AI正成为大公司的必争领域。相比于Google、微软、IBM、百度、阿里等公司,腾讯在AI方面的宣传并不多。事实上,2016年腾讯组建了30多人的AI Lab, 并在AI技术及应用方面进行研究。
相比于技术的研发,我们更关心腾讯AI应用方面的规划。在今天腾讯研究院的年会上,腾讯集团副总裁、腾讯人工智能实验室负责人姚星就详细阐述了这一问题。
技术方面,腾讯AI主要是基于四个垂直领域,分别会在CV(计算机视觉)、ASR、语音识别、NLP(自然语言处理)。在计算机视觉领域,除了传统的图像处理,还会引入AR、空间定位等技术。在语音识别方向,除了传统的语音识别、语音合成,还引入了自动翻译。在自然语言处理方面,除了传统的自然语言处理,还会引入监督类的机器学、无监督类的增强学习。
在应用层面,则主要会结合腾讯的业务,主要分为内容AI、社交AI、游戏AI。 内容AI方面,主要是个性化的推荐。社交和游戏是腾讯最强的两个业务,也是腾讯AI最重要的两个结合点。在社交AI方向,会面向于社交的能力去提供AI能力,未来有可能会推出聊天机器人、智能助手等。
与很多大公司不同,腾讯的AI将游戏作为了一个重要的方向。姚星设想,未来有一天,有一个AI可能会参加LOL这样的竞赛,跟人对打;而将AI应用在《王者荣耀》这样的爆款游戏中,可玩性、乐趣性都有可能增加。
为了方便大家更多的了解腾讯AI Lab的一些信息,我们也对姚星的演讲进行了整理。
以下为姚星演讲的整理
姚星:
各位朋友大家下午好。今天我演讲的题目是AI真实的希望和隐忧。
什么叫希望,希望就说明大家期待,隐忧说明大家期望过大。
第一我首先要澄清一个事情,刚刚主持人马斯特是不是腾讯做的,我要澄清,马斯特不是腾讯。
我们回顾一下互联网发展的二十年,实际上过去的二十年是信息高速发展的二十年,它经过了几个发展阶段。从我们发展的方向上面来讲,应该是在九十年代初期,中国应该第一次连上互联网,在上个世纪九十年代我们进入到互联网大家庭当中了,但是由于当时网络数据连接的问题,大部分在互联网上的应用还是只限于沟通,沟通解决了很多问题,人不再需要面对面,或者通过传统的书信的方式进行沟通,人可以通过互联网,不论在天涯海角,只要能连上互联网,总是可以触达到一些消息。随着整个设备传输的发展,网吧的兴起,大家连接网络的速度提升,你会发现我们的网络带宽提升速度越来越大,这时候人们对互联网的诉求不再仅仅是通过消息的传递沟通,更多的是分享。MSN也好,包括FaceBook,包括QQ空间,都是基于分享,人人为我,我为人人,那时候有很多东西都是通过互联网来分享喜悦和苦恼。
随着后面移动时代的发展,特别是智能手机的发展,智能终端的发展你会发现,最后在最近这五年以来,我们的移动互联网高速发展,人们不再是在指定的地点和指定的地方进行互联网连接,以前传统大家都是在网吧或者工作的地方,现在大家通过手机无时无刻连到互联网,所以整个过往的二十年是随着设备的发展,产业的发展,随着信息产业的发展而演进。伴随着过往二十年发展,腾讯二十年我们做了什么呢?实际上我们在每一个时代都有腾讯一款重量级的产品。在最早的沟通时代,在上世纪九十年代的时候,我们有QQ,QQ目前是世界上在线最大的容量,已经达到同时两亿人在线,在2000年初的时候,我们有了我们的QQ空间,QQ空间目前的日上传的照片数是超过五亿张,这个规模如果我们跟世界上最大的网站FaceBook去比,是差不多同一个量级。2013年FaceBook日上传照片数大概在2.5亿左右,目前QQ空间日上传照片数也好,总照片数也好跟FaceBook是同一个量级。
然后在移动互联网时代,毫无疑问腾讯,大家现在都知道的一个产品就是微信,这款产品不光是简单的,还是玩超级的人,它不仅是解决了沟通问题,还解决了社交、分享的问题,还是一款包括我们去线下支付,线下的打车,甚至医院挂号看病,交水电费等等一系列使用都在那一个软件上面,实际上这三款腾讯产品在世界上来讲都是领先的。整个发展史我们也看出过往的发展史是从信息时代,我们说从窄带到宽带,到移动互联网时代,它犹如生物进化一样,从早期的单细胞到多细胞到最后的智能。今年来讲实际上这个智能会更加的广义了,不仅仅是智能终端,大家更多的讨论的,今天的智能是AI。
去年2016年又是整个AI真正发展六十周年,所以在去年AI在世界上也爆发起来。包括我刚刚在小房间跟很多嘉宾在聊的时候,说腾讯是一个很低调的,的确很低调,很多人问我腾讯有没有做AI?怎么从来没有向外宣传呢?实际上腾讯有自己的AI相关的部门,从2016年4月份开始,腾讯成立了自己的部门,目前我们的情况就是,基本上有30多个科学家,90%以上的人都是博士学历以上,绝大多数人都是海外回来,然后从他们院校来讲,都是从世界最顶级的学府引进的人才,包括哈佛,康奈尔,麻省理工等等,哥伦比亚大学等等这些学校。
所以目前在腾讯里面,我们已经组织了一个AI团队,但是这个规模还在扩张。腾讯的AI可能不像其它公司的AI让人那么了解,比如说像谷歌的AI,大家很多了解在做围棋,包括他们出来很多的产品,包括他们的语音等等的很多东西,包括像百度,他们有无人车,有度蜜等等的一些产品,包括FaceBook等等,所以它做了很多图像上面的东西,等等等等,但腾讯的AI一直没有对外宣传,今天我也跟大家分享一下,腾讯在AI上面的考虑。实际上腾讯的AI我们主要是基于四个垂直领域,分别会在CV(计算机视觉),还会在ASR,语音识别,就是语音识别上面,我们还会有一个专属的垂直领域,另外在LP,自然语言处理上面也会有,每一个领域里面也会拓展到更多深层次的研究。比如我们在计算机视觉领域,我们可能除了传统的图像处理,还会引入AR的东西,增强现实的东西在里面,也会引入空间定位的技术在里面。语音识别我们除了传统的语音识别,语音合成,还会引入更多的这种,跟语音相关的,就是我们的自动翻译方面的一些,放在里面,另外除了传统的自然语言处理的这种人的认知行为的一些研究,我们还会做,比如说对话的聊天机器人这类的一些研究放在这里面,在新领域,就是我们监督类的机器学习,到增强学习,我们都会在四个领域。所以这四个领域基本上涵盖了当今整个AI基础研究领域的方方面面,这是四个基础的研究领域。
然后我们另外提出了四个专属的这种产品研究方向,这是结合了我们整个腾讯公司来进行的,我们提出了有内容的AI,我们把搜索引擎基于个性化的推荐,基于内容类的东西和搜索类的。另外我们还有我们的社交,腾讯是一个传统,就是一个非常,在社交平台上面非常厉害的公司,包括我们刚刚说的QQ空间,它都是一个社交平台,所以在社交AI上面我们会面向于社交的能力去提供AI能力,就是刚刚我说的对话,包括聊天机器人,包括我们智能助手,都会在这个方向上去研究。
另外一个方向,我觉得是跟全世界其他所有的公司不太一样的一个AI方向,大家可能会问我,也有做围棋的AI,但是它只是一个简单的围棋,它不会有太多的游戏,但对于腾讯来讲,在整个腾讯集团里面有个很大的产业是游戏,我们会在游戏里面引入更多AI能力,实际上想像空间是非常大的,大家试想一下,LOL是不是可以有一天,会有个AI可以参加这种世界竞赛,跟人对打,大家也知道今天腾讯有一款很受欢迎的手游叫做王者荣耀,如果把这里面的能力提升,是不是可玩性,乐趣性就会更多,对于腾讯来说这一块也是很关注的。除此之外我们还会提供我们很多工具类的AI,这里面就会提供我们这种能力把它开放出来,包括基于图像上人脸识别的能力,包括语音识别的能力,包括在自然语言处理的能力等等等等,包括我们在学习平台的能力。所以说整个腾讯从目前来讲,我们的研究AI基础领域是四个,然后我们的方向也是四个。
刚刚讲了很多前面的篇章,是讲腾讯,包括新产业发展二十年,腾讯在过往的产业当中二十年的情况,以及我们在AI上面的布局和考虑。现在我来讲一下整个AI,刚才讲更多的是AI的希望,现在我来讲一下AI方面的隐忧是什么。AI不是一个新的概念,发展了六十年,六十年AI一直都是有很多的起起落落,在去年突然一下大爆发了,一直延续到现在。像从五六年的会议开始,AI就开始有一个名词,中间它经过了很多起起落落,比较有名的,我相信大家知道,九十年代的IBM打败了卡斯帕罗夫。IDM也有一款基于知识图谱的知识问答类的,在危险边缘的挑战赛里面取得了冠军。大家可能记得最清楚的一件事情,可能还是去年AlphaGo打败了世界冠军,韩国的李世石,因为大家都认为围棋是在一个最古老的游戏里面,最复杂的游戏里面,在智能上面超过了人。当然整个发展史里面也有很多技术方面的演进,比较有代表性的就是2006年,在学习上面真实的突破,他带来了整个AR在发展方面极速的提升。
为什么这一次AI会让大家这么大的这种期待,或者有这么大的关注呢?我觉得这是AI发展上面最主要的原因是这一次AI底层算法在深度学习上面进行了有效突破,就是刚刚我说的,所以使得这次AI的发展在2012年开始,整个学习的方法,不像传统的方法,让人类去模仿,就跟早期的人类想学飞翔,原来的方法是粘上羽毛,像鸟一样,真正的飞翔最后的原理是要通过空气动力学去解决飞鸟的原理,这就是深度学习的一个思想。之所以现在能在很多的这种工业上面,在很多应用上面进行突破,实际上本身是掌握了它的内在的这种方法,而不是表面的方法,所以在这个上面,方法的研究方面我觉得是重要的。
第二个是模型上的提升,刚才我说了,AI的发展有六十年,机器学习在八九十年代也非常火,当时有一个叫SBM,它已经是非常厉害的一种机器学习的算法。当它达到几亿几十亿规模的时候,实际上它的计算能力就会急剧下降,做一个非常复杂的复合函数去描述这种方式,它通过DP多层连接,它达到一个指数层倍的关系,描述十亿可能我们只需要三层一千个节点的连接,就能构建十亿个特征出来。所以从本身来讲,模型上的提升这也是深度学习的突破。
另外一个东西在数学上面,就是EP上面问题的解决,反向传播的问题。首先在数学理论上进行,反向传播是一个非常复杂的问题,在神经网络里面当一个东西在传递很多层网络的时候,我们知道当它往回我们要反向收敛的时候,我们都要去逼近最优质,但是当往往层数太多的时候,会发生一个梯度消失或者梯度膨胀的问题,通过一些方法的解决,数学理论上面的解决,很好解决了这种问题,所以在数学理论上面,建立了一个比较好的基础。
正因为这三方面的优势,所以使得在AI的浪潮里面,机器学习才会如此火。而且我坚信这次浪潮会持续很远。右边这幅图就代表了在整个机器学习的一些图文,在1933年到2000年左右,整个传统的浅层机器学习的学习方法,它有一个比较好的下降过程,但是2000-2010年这十年,它进展非常快,它在方法上面,在模型上面可能都没有进行,突然在2012年左右,微软研究院他们最开始在工业界把机器学习用到语音识别里面去,取得了极大性的突破,急剧又进行收敛,所以整个过程机器学习的能力的确是在过往的五年当中,发展非常非常快的。
讲了很多机器学习的这种,刚刚说的发展,快速的发展,它的方法也很好,模型也很好,数学算法也在突破,但是现状是什么呢?就刚刚我说的,今天我谈的话题是AI期待很大,期待太大了,为什么会这么讲?作为一个从业者,我对AI上面还是有很多很多的东西,可能是需要提出来,就是这里面还是有很多的局限性。第一个就是本身深入学习的能力,就是我们说的AI跟人去相比,它有多大的差距。实际上我们发现所有现在的机器学习的方法,我们都发现不管这个方法有多么的新提出来,它的学习过程都是要从头开始学,都要把数据重新进行一次训练的过程。但这跟人的学习能力相比确实有很大的差距,人有很多的智能是与生俱来的,就像小孩刚出生,不需要多长时间就知道这个世界是三维的,当你把一个东西放在一个,把一个瓶子放在电视机的后面,他是知道的,在电视机后面有一个东西的,这是一些特征是与生俱来的,这个是跟生物的进化是相关的。所以人的这种,我们叫灵长类的动物跟单细胞动物相比,肯定是有与生俱来的能力。但是目前深度学习方法很遗憾,我们不管提出了多么优秀的模型,可能我们都要重新开始学,这是第一个跟人的学习能力相比,这是一个非常大的缺陷。第二个就是我们不管有多么好的学习的,刚才说有很多的模型,特别这几年有非常多的出来,不管有多么好的这种神经网络模型,它本质上的问题还是通过算力,计算能力去解决大数据,更多的大数据,更大的计算能力去做更好的融合的过程。过往是整个硬件发展,是顺从了摩尔定律发展,发展非常之快,但是在未来的更多的参数下面,我们还有没有这种能力,达到计算的效果,这要打上很大的问号。
比如说我们的网络模型,2006年提出来的,到后面剑桥大学出来的,再到后面谷歌提出来的,再到2015年神经网络,每一次新的模型提出都是把模型的层数加入更多,神经单元更复杂,训练结果更长,得出来的结果也最优,但是本身这种方法是不是还能像原来的方法一样可持续,这要打一个很大的问号。另外一个刚才解决的是图像方面的问题,下面我们解决感知的问题,如果我们要解决认知的问题,那差距就更大了。人的语言是一个序列问题,这个语言序列问题如果要计算的话,这个算力是无论如何解决不了的。人可以很容易在对话当中,回溯到一个很长时间语句的某个片段的关键词里面,但是在机器里面它却不一定做到这个,虽然我们也在最早的模型形成到现在长短记忆单元的模型,到后面的我们现在腾讯的,带有注意力的模型,但是总之来讲,这种模型的演进都还跟人相比是非常复杂的,是远不如人的。比如说那天我看到一个对话,是三个人在对话,两个人在聊,中间有大段聊去哪儿吃饭,突然有人问太阳呢?人知道这是描述太阳队的,因为前面很早之前有人在聊,湖人跟快船的话题,突然来个太阳大家就知道,但是机器基本上是没办法识别的。夏天能穿多少穿多少,冬天能穿多少穿多少,两句基本上一样,但是前面去描述,把少给突出来了,后面把冬天多显出来。
第二个例子我讲的是语音识别,我看了一个笑话,语音识别很难搞,您好,方便面试吗?我在重复这句话的时候,我都不知道自己在讲方便面是吗,还是方便面是吗,的确这是一个非常难的问题,但是人的理念很多东西,是由于进行反问的时候,再慢慢把这个东西带出来。所以说目前的AI情况,在图像里面,包括说人脸做的多么多么厉害,99%,但实际上它在很多的约束条件下,它正脸,它不能侧脸去做,就是完全侧脸是完全不可能的,或者说它戴帽子可能也比较难,所以它是在很多约束条件下面,达到了人脸识别,达到了9%,包括刚刚语音识别说的,语音识别也是在很干净的情况下,比如我们的噪音比较小,我们没有风噪,没有车噪的问题,可能机器在听语音识别的时候会识别出来一个比较好的效果,一旦距离远。但跟人相比,这完全不是问题,包括多人的问题,语音跟踪的问题,所以在我刚刚说的感知的能力,它跟人基本的能力相比还差距很大,更别说它在认知方面,在LP这种语意方面。
所以在整个AI上面,隐忧我觉得是我们期待太好了,我们要回归现实,AI现在这个能力刚刚起来,但是这个趋势很好。未来AI发展方向是什么呢?我觉得AI跟人,包括机器学习跟人的能力上面有些差距,怎么去补齐差距呢?第一个我觉得跟人相比要创造,我们现在所有都是基于大数据,这些数据从何而来,这是非常重要的。这个数据现在是传统的获得而来,但更多的数据是本身能创造出来,当然这条方法通过刚刚主持人介绍的,包括AlphaGo已经在验证这样的问题,通过增强学习去产生人类从未下过的棋,这是一种创造数据的能力,通过创造数据的能力产生更多的数据,不一定是人创造了这些,去把这些东西更多的穷尽出来,这是一种我觉得在未来,如果在这方面发展的话,可能我们在增强学习方面,我们要进行更多的发展和突破。第二个就是举一反三,什么叫举一反三,AlphaGo下围棋能下倒世界冠军,但是他的下棋方法到现在已经不行了。因为他的方法并不是为下棋而创造的,他不会进行推导。当我们验证大数据和一个非常好的效果的时候,我们数据量很小的时候,怎么把原来的模型迁移过来,这是非常重要的研究方向。
第三个方向和人相比就是归纳总结。人是非常能进行一些总结的,包括像牛顿的第一定律,包括牛顿的万有引力,都是人总结出来的,包括我们很多公理,但是目前机器学习是没办法进行归纳总结的,我们之所以结果好,它并没有提炼出公理和定律的关系。所以这方面未来我们要在归纳总结,特别是无间度学习上面,分类问题是有目标去学习的,但聚类问题没有目标的时候,我们怎么把它聚好。所以在这三个能力上面,我相信这是我们未来在AI上面要进行提升的。第二个就是在整个的发展方向上面,刚刚讲了很多说机器学习通过数据方法,它从传统的浅层学习里面,我们所有的,通过统计学的概率论,完备的统计学概率论理论来支撑它,我们说到求这种函数极限的问题,我们有很多完备的数学公式去证明,我们一定能解决它的问题,但是恰恰在我们机器学习上面,虽然前面我们用了随机去找局部最优,但是它本身数学领域,它只是一个框架,我们在很多上面,还是一个启发式的约束,包括我们的初始化参数多少,包括我们学习率是多少,这都是有启发性的。在未来如果机器学习要继续往下走的话,我们在数学理论上面一定要有强大的支撑,特别传统的机器学习,数学完备型,要迁移到我们机器学习上来。
大家知道神经网络的提出,很多来自于原来的脑神经学科和生物系统,在本身这个上面,我相信未来AI的发展要引入更多,不光是我们数学学科,计算机学科,还要引入脑学科神经去引,因为脑的神经结构就是,刚刚我提到了蝉纱神经网,已经连接脑神经的概念了,进行跨层连接,达到一个非常好的效果。当然更多的东西我希望就是未来,可能在交叉学科上面,包括刚刚说的生物,脑神经,包括哲学都要去引进来,这样的话整个AI可能才有更多完备型的发展。另外一个地方就是,在当今世界里面,AI我觉得是对所有公司来讲,对所有人来讲都应该是平等的,所以我们一定要开放,比较好的是当今世界所有的,在AI领域里面的大公司都在做,包括腾讯也会,我们看到很多包括谷歌的Open,包括FaceBook它也Open了非常多的网络模型,包括我们了解现在很火的OpenAI等等这些大的这种机器学习,AI的这种先行者,腾讯在未来也会去进行很多Open,把我们部分行为的数据,就是这种环境,应该是环境,让更多的人来参与进来,进行测试。所以整个过程就在未来AI的发展,我相信第一方面就是在能力上面,要跟人去匹敌的话,要进行提升,第二个在整个学习的完备型,数学完备,学科完备上要进行丰富,第三个就是所有的这种大的公司,AI的参与者,我们以更加开放的心态去面对AI,这才是未来AI,AI的未来。
说到这里我又要再次强调一下AI对腾讯来讲非常重要,对中国整个互联网都很重要。在当今世界里面,曾经我们可能在整个最开始的互联网时代,我们跟美国去比,可能还会,美国最强的公司去比,可能还会有一些差距,包括我们原来的工业时代,跟西方最强的发达领域,整个AI的时代我坚信我们整个互联网公司,包括腾讯上面,是跟世界一流的公司是有匹敌之处的,为什么?第一我们数据足够多,中国的互联网人数是其它国家可能互联网人数的总和,中国的互联网是世界上最大的互联网总数的人数,所以我们每天产生的数据足够多,在腾讯里面,包括微信,包括QQ,产生了无数的数据,我相信在中国其它的互联网公司,包括我们的店商,包括我们的搜索也会产生很多的数据,这对中国公司来讲,这是非常好的一个优势。
第二是应用场景,作为腾讯来讲,我们有很多的这种把AI这种遥不可及的技术跟落地的机会,我们可以在微信里面,在我们的游戏里面,在我们的新闻里面QQ里面去落地AI场景,哪怕小到一点语音识别,或者图像,或者是说聊天机器人等等,这都是我们可以去落地的地方。
第三个地方就是人才,人才是有数据统计,目前的机器学习相当一大部分人,虽然我们国内人在机器学习上的专业还比较少,这个学科也比较少,但是在整个世界上来看,这个领域的华人是非常多的,我参加过2016年的ICML,有三千人,我敢说大概3-40%人都是华人,那里面40%的文章都是华人写出来的。所以在这个上面,人才结构上面我觉得中国是有非常好的这种人才的基础,说正是基于我们数据的优势,我们场景落地的优势,我们人才结构的优势,我觉得在腾讯也好,中国其它互联网对AI的未来大有可为。最后讲一下腾讯的AI使命。我们的AI使命,让AI无所不在,谢谢大家。