Yann Lecun:Facebook最新AI变革研发成果“无监督学习”

3年前

        假如穿越回两千五百年前,当你问欧洲人万物从何而生时,他们大多数给到你的答复是荷马史诗中众神创世神话。只有极少数开始理性思考的哲人会告诉你,万物的创生是水,泰勒斯;是气,阿那克西美尼;是火,赫拉克利特;是数学,毕达哥拉斯。直到他们的思考被恩培多克勒系统综合,认为构成万物的元素主要有四种:水、火、土、气。

        其中,除了毕达哥拉斯认为万物起始于数学是抽象思维,水、火、土、气都是物质实在。

        如今,如果你要问世人,万物因何而生?受过现代科学教育的人给到的回答会是进化论、宇宙大爆炸、原子论、量子力学……

        两千多年来,人类的认知一直因循着逻辑辩证不断穷究。直到今天,人类开始思考,除了我们所能耳闻目睹的物质,以及抽象的思维意识之外,还有哪些事物可以“生”万物?

        对于这个问题,GMIC北京2018“AI生万物”主题峰会给到你关于“AI”的答案。

blob.png

        本届会议,不仅邀请到创新工场董事长兼首席执行官李开复,Facebook人工智能团队首席AI科学家Yann Lecun,卡内基梅隆大学计算机科学学院机器学习系主任Tom Mitchell,百度总裁张亚勤,以及红杉资本全球执行合伙人沈南鹏等世界顶尖人工智能专家学者、企业高层、投资人等参会演讲,业界一众科技独角兽、新兴企业也齐聚一堂。

blob.png

        在古希腊,除了探索自然的哲学家外,还有探索人类和社会本身的社会科学哲学家。苏格拉底、柏拉图和亚里士多德是探索人类哲学的“希腊三杰”。作为探索以人工智能为代表的新兴科学现代“三杰”之一,Yann Lecun在本届会议上第一个带来了“AI的最新技术趋势”主题演讲。

以下是整理后的演讲实录:

blob.png

        杨立昆(Yann Lecun):大家晚上好。我这边是晚上,你们那边应该是上午。非常抱歉我不能亲自到会场。我是杨立昆(Yann Lecun),来自Facebook,以及纽约大学人工智能研究团队。今天我想讲一下关于人工智能目前的进展情况,同时也介绍下深度学习的未来,以及我们所面临的关于深度学习各方面挑战,如何让机器变得更加智能。

        首先,我们看一下当下的AI系统,目前所有的应用,不管是影像、声音,还是图像识别,翻译,以及测试等等,这些都是AI的应用。通过深度学习我们可以训练机器,比如说向它展示一个车的图像,它就会知道这是一辆车,下次向机器展示同一个图像你就会得到想要的答案。你可以看到在这种指导下的学习对于计算机学习来说是非常重要的。

        深度学习,比如科学培训,机器进行端到端的培训可以完成各种任务,它会告诉你最后输出的是什么。机器会学习整个过程,是端到端的学习过程,通过这种方式机器计算机会更好的了解我们的世界。关于人工神经智能,我们知道神经网络是非常强大的。我只有在非常强大的计算机上才可以运用,需要有CPU加以辅助。在深度学习变得比较普遍之前,我们需要确保什么样的系统可以进行应用。

blob.png

        举个例子,这是我们在2009年、2010年在纽约大学合作的一个实验(见上图),可以看到它可以识别图像,可以看出马路上的建筑,天空以及路上的车和人等等。我们可以利用这样的技术识别一些车辆。

        在这里大家可以看到在网络当中使用的几个层,比如说有100层或者180层的一些人工神经网络,在Facebook当中我们会广泛使用。因为有了这样的一些应用,可以看到识别错误率在不断下降,有的时候表现甚至比人还要好。它的性能非常好,已经成为一种标杆。另外它实际上比CPU识别图像或者对象要更加复杂一些。它不仅仅能够识别对象,同时能够进行本地化处理。

        这个是在Facebook人工智能部门我们所做的研究,叫做Marsk RCNN,可以看到它的结果,它可以标记这样的图像,就像我刚才给大家展示的例子非常像的,展示出非常好的性能。如果能够展示这种效果的话,它不仅仅可以识别出每个人,同时它会为每个人加一个Marsk,所以可以很容易区分出是一个人还是一只狗,在这里大家可以看到它可以识别电脑、酒杯、人、桌子,都可以识别出来。如果五年之前问系统这些问题的话,我们当时认为需要10-20年时间才能达到今天呈现的效果。

        这也是Facebook所做的一些研究,叫做Techaround。大家可以下载上面的代码,它可以探测200多种不同的类别,这也是Facebook在AI方面的一些研究,我们不仅仅发布了一些论文,同时连代码也都发布出来了,世界各地都可以更好的熟知这种技术。

        对于我们研究团队来说,不仅仅要开发对我们公司非常有用的技术,同时我们也希望所开发的技术能够引导整个社区,能够解决我们所感兴趣的问题。我们认为AI不仅仅会帮助我们解决问题,同时还会帮助我们解决很多人类自己无法解决的挑战,所以我们会与我们的科学团队一起朝这方面努力。这里是在过去的几年里,IFRR所发布的一些开源项目,包括像深度学习网络、深度学习框架,这是关于深度学习的应用。

        我刚才讲到每天都会有一些新的应用发布,也可以进行语言的翻译甚至过滤,安全诊断,以及面部识别等等。另外,可以看到深度学习也被广泛应用来进一步推动科学方面的研究。我们会看到在接下来几年里深度学习会发生更大的革命。

        接下来我们再来看一下差异化编程,我们可以从另外一个角度来学习深度学习。实际上它是一个固定架构,涉及到编程,可以用人工神经网络解释。这个编程一共有三个指数,它实际上和人工神经网络非常类似,它会根据所展示的数据有所不同。

        另外,根据数据系统也会有所变化。所以现在的问题是,我们是否有一种方法可以自动地生成一个自己的程序。同时可以对其进行培训完成某个具体任务,这也就是我们所说关于编程的想法。现在人们已经开始在做一些深度学习方面的研究。

        大家看到这里是我们最近深度学习的成就,之后我们来看一下关于AI有没有我们触及到的。对于新技术,我们可以进入到更多的领域中,大家看到这里我们可以进行更多的影像分析。关于医学方面,我们还可以进行更多翻译,或者是有更多的其他的领域。在这个方面我们觉得对于机器确实可以拥有一定的人工智能,但是关于机器人分辨出它有些功能,比如我们还需要更多的功能,比如像洗碗机之类这样的功能我们都要探讨。

        在机器学习方面,我们在这儿可以看到有一些具体的图像,我们有些新的方法。在实际的生活当中其实这种方式不太成功,因为关于深度学习方面我们要进行深入的挖掘,因为对于机器本身它会有不同的解决方案,比如在实际生活中是不能够去实施的。

        有时候让机器学习很长时间才能玩游戏,比如100个小时。所以,确实核心功能方面我们现在还没有触及到。尽管这些机器是能够做到的,但是我们还没有挖掘出来。我们也可以对机器本身进行更深入的培训。比如说我们要让系统进行成千上万次的培训,之后它们才能进行学习。

        有些学习是力学方面的,但是在实际生活中不可能实时进行,所以我们只够进行模拟,但是它也需要我们进行很多的尝试才能够让机器学到。对于婴儿他们怎么去学习呢?如果我们让婴儿展示的话,比如说就好像左下角的这幅图像展示的,六个月以下的婴儿,他们可能不太了解比如物理方面的运动,可是他们在满了八个月之后,他们的能力就变得非常惊奇,已经知道自由落体的作用。我的一位朋友,她在巴黎工作,给我们展示了婴儿怎么学会一些概念,而且他们也能够了解到一些物理基本的原理。

blob.png

        对于婴儿,他们能够了解到背景知识,学会常识。另外我们在向动物展示这样的情景,比如大猩猩,它们在幼年的时候由培训员给它们一些展示,大猩猩会觉得很有意思,面对这样的魔术会笑出来,所以大家会把它们当做世界最起初的原型来看待。但是我们希望机器能够建立一些样本,最终机器学会学习,进行一些预测,什么是可行的,我们就可以使得机器像人一样有效运行。我们有这样的监督或者学习,就能够使得机器得到培训,它们能够进行规划,进行反映,这是我们需要它们建立起的一个系统。

        我觉得下次变革应该是无监督的学习,是自我监督或者无监督的一种学习。

        我们最近做的一些非常有意义的事情,这是对于一些预测性的模型,由机器进行规划,根据它们的尝试进行预测。所以这里的理念在于我们关于人工智能的元素,它会对民众社会进行预测,在它们实际参与,之前它们会预测有一些什么样的反映。所以大家会看到在整个的过程当中,它并不太多涉及到机器学习。我们认为在一个民众社会当中我们希望机器应该基于自己的行动进行预测,之后得到一些模型,来进行设计。

        关于具体的细节,有的人已经就这方面的培训进行了工作,他们接受教育,比如机器在一些简单情景当中怎么来做。比如说我们对机器,有哪些物体有可能会跌落下来,有什么样的预测性,它的大概概率有多少,都可以使得机器做出一些预测。

        最近几年我们找到了一个理念,对于这个问题的确定性要进行预测,根据我们的输入进行概率的培训和预测。通过对机器进行一些深入的学习,可以使得它预测一些结果。而且它可能会根据不同的场景,可能跌落,有可能不跌落等等,能够对一些可能性结果进行预测。这里的结果不仅仅是唯一正确的,还可能有多种的结果。

        大家看一下这个教授在进行培训,其实我们进行了对抗性的培训,比如说我们可以培训每个分项是看起来不错的,更可能的,或者在实际的生活当中会发生什么样的结果。而且对于培训者他也会告诉机器,在实际的社会当中又有什么样的结果。对于发生性它也会做出预测,可能有的时候有的结果是虚假的,不是真实的。通过这么做我们就能够得到不同机器产生的结果,之后得到了更多的影像和图片。

        我们再回顾几年之前,大家看到这是Facebook,在这幅图上大家可能也相信,通过机器学习确实是奏效的。但是这里有一些是虚假的图像,之后大家由机器所得出来的这样的图像,它们看起来是真实的,但是其实只是一些虚像,一些幻景,所以我们现在也对系统进行了培训之后,产生出了一系列的人脸。大家看到这是一些名人他们的面孔。总之,我们希望把这个工具之后能够融入到我们机器学习当中。

        下面我给大家举几个例子,如何来帮助我们进行预测。这样的预测是由我们机器深入学习展示的,有几帧的视频给大家展示一下,因为针对不同的情境我们给大家展示出如何来进行预测。比如说这里是一个人行道,我们看到人们在穿过这样的人行道,而且关于其中的预测是由人工智能所展示的,我们可以进行监督的学习,看一下这个机器在今后几年是不是能够得到很好的进展。

        最后做一下总结,我觉得接下来最新的趋势是关于监督学习,它可能是不能够被替代的。不管是无监督的学习还是其他的学习方式都不能够替代。所以这点已经引起了很多人的兴趣,就是接下来几年还会持续的发展。还有一点我也不断的重复给大家,就是说我们要使得机器能够推理,来看一下深入学习能给我们什么样的推理能力,也要来回顾一下在AI的时代机器它的推理能力有多高,它的逻辑性有多强。

        接下来我相信我们会不断的进行演变,而且我们也要朝着可差异化的智能学习的方向持续发展,这就需要我们来进行对抗性训练研究。当然了,还会出现更多的有关深度学习的变革,比如说包括了一些多渠道的发展或者是复杂的架构,而且会出现更多的理论,在这个领域会不断的出现。

        关于技术的趋势是这样的,很显然接下来的监督会不断的弱化,甚至会消失,这就使得我们出现一些新的理论,比如新的语言,或者是出现并行的文本,我相信之后应该有多维度的可能性。我们会发现出现一些新的框架,包括些动态的影像或者是更多的幻象。

        我们和微软、亚马逊会进行更多的合作,也会不断开源。当然了,现在我们的工作量很大,但是关于我们的移动工具和其他工具变得越来越流行了,Facebook的用户每天能够推出大概20亿个不同的影像,所以我觉得之后可能大家出于不同的目的去参与,我们希望能够充分发挥这方面的力量,它是很强的驱动能力。另外,我们要不断的强化硬件,以便用户的需求能够得到专业化的处理。感谢各位的倾听。

相关推荐