一年一度的中国绿公司年会在郑州召开,马云、马蔚华等知名企业家在大会上做了演讲,依图科技创始人朱珑与人工智能学界很资深的一个人士,美国计算机协会2015年的杰出科学家、IEEE Fellow院士、阿里巴巴集团人工智能研究机构的资深总监华先胜,围绕人工智能做了深度分享。以下是两人的现场分享内容。
朱珑对话华先胜:
今天的人工智能比肩工业革命毫不夸张
Q&A
商业被技术解锁是加速度的,今天人工智能比肩或者超越工业革命
过去10年、30年所热门的东西,到今天不仅是概念,从工业级的实验数据上看到非常深远的未来。我们今天说人工智能热起来,是从结果来说的,所有领域的结果让大家感觉到信心。
人工智能应用的场景是不断被商业解锁的,技术在商业化落地的过程,商业跟技术结合越来越加速。实际的应用场景有时候是超越你想象的,今天的智能,我们的想象已经跟不上人工智能发展的速度了,千万不要担心技术跟不上我们的想像力。
技术发展的差距关键在人,人的技术远见很大程度影响了人工智能的发展速度
资源、数据、钱,会影响整个行业的发展,即便都具备了,你说大的公司敢投1亿美金吗?找不到那个人的时候,有钱也不敢投。
拥有技术的远见,能够知道数据在哪里,数据的商业价值在哪里,技术预测。行业真正一流的高手之间差距就是非常大的,最牛的人之间反而有可能是差距越来越大。同一件事情到你手里,信的人和不信的人,发展速度差别是巨大的。
最好的人只有最好的人才能判断,你只能选择信我或不信我。
越垂直、越分散的领域,创业公司有很大的机会。
AI本身不是一款产品,科学家没有特别天生的优势。技术对商业场景的理解,非常重要,需要高手。作为翻译者或沟通者,这是比AI人才更稀缺的。
依图在公安领域、医疗领域的部署,首先做好对人的理解,对部门之间的理解,其次是对产品和技术的理解。保持谦卑的学习心态,比公安的人更懂公安,比医生更懂医生。
即便是有人际关系壁垒、数据和专业知识壁垒的垂直领域,人工智能产品本身依然是最能打动人的,越垂直、越分散的领域,大公司不见得有机会,创业公司有很大的机会。
人工智能的社会影响,不止是安全问题,经济形态的巨变更值得思考
技术带来的社会影响其实是一个长久的话题,今天人工智能可能因为超越人的智能边界的时候,会更加敏感。
技术都有两面性,一定会出现有利的地方和不利的地方。目前AI技术并没有跟其他的互联网技术,或者是其他信息技术在安全性上,或者是其他层面上带来的威胁有本质的区别。
其实不是安全问题,或者不止是安全的问题。“智能”大了之后的社会分工,我觉得十年之内有巨大的动荡,不仅是中国,全世界都会面临这个问题。我为什么是我?我大学上了到底有没有用?将来的小孩到底学什么,要重新开始思考。今天我们开始重新认识自己。未来20年,人类社会分工,或者经济形态会有巨大的变化。
对话全文:
邓锋:我们请来了人工智能学界很资深的一个人士,美国计算机协会2015年的杰出科学家、IEEE Fellow院士、阿里巴巴集团人工智能研究机构的资深总监华先胜,请华先胜来和朱珑一起对话。中国人工智能是一个不是很大,全球都不是很大的圈子,现在说招一个人工智能的人才,给的工资都极高的。华先生您听了朱珑的演讲,您有什么想“挑战”朱珑的?
华先胜:我经常说一句话,叫人工智能风生水起,视觉计算遍地开花。刚才朱珑前面讲的更多的是视觉内容,就是这些花开了能不能结果其实是很难讲的。
我们回忆一下人工智能的发展,人工智能其实不是一个年轻的概念,大概60年前1952年的时候提出来的,那个时候大家也非常的兴奋,十年以后人工智能就要超越人类了,大概过了十几年以后发现不行,这个人工智能不下去了,到了80年代的时候,因为这个神经网络的出现,而不是今天的深度学习网络,包括这个一批算法的出现,大家又很激动很激动,这个人工智能来了,又要来了,过了十几年以后又进展不下去了。那么我想问朱珑一个问题就是,这一次人工智能起来以后,我怎么能知道它不是一个虚假的春天呢?前面两个春天都已经证明这其实不是“幻象”,今天有什么不一样呢?
朱珑:我自己的理解,首先讲不一样的程度吧。我觉得说今天人工智能比肩或者超越工业革命毫不夸张。
很多人在谈论的时候是用了这个词汇,但实际行动上并不是这么大定义的,他实际嘴上说说,如果是这么大的,你应该把房子卖了都放进来对吧,但是实际行动是跟不上说话的这个程度,这个是讲定义的程度。
第二个事情跟以前不一样,以前讲的概念,或者是30年前人工智能比较热的时候,今天2012年那场会,2013年深度学习热起来,深度学习我在那个实验室待着,就是刚才说了很多科学家或者是年轻人并不爱学这个,它是一个冷门。
概念其实在那里躺着,已经躺了超过10年时间,算法和模型并没有本质的变化,今天热起来是从结果来说的,是所有的领域的结果让大家感觉到信心,比如谷歌把钱给砸下去了。以前的热是说有钱人跑到MIT说,听说你在做脑科学,1000万美金给你,我们一定要参与一下这种脑科学计划,能不能做成。
今天是因为商业价值,看到了商业巨大的进展,这跟过去十年、过去30年所有的热门的东西,不仅是概念,是在实验数据上,工业级的实验数据上看到非常深远,或者说这种科学意义上的统计意义上的,我觉得这是最重要的不同。
华先胜:OK,这个我觉得是有道理的,跟以前不一样了,我们现在看到了一些结果,尽管我们看到的结果其实也是一个局部的,当然还有关于深度学习技术真正在大规模的计算环境下能够计算,这个深度学习技术的发展,计算能力的提升,网络的提升,网络带宽的提升,数据产生的容易,包括这个用户的参与,用户的参与本身就是一个强的反馈,是看到的成果可能会更向前发展,真正产生作用。
那么第二个问题是想问问你这家创业公司,因为我本身也是做视觉技术的,在高手之间,算法的差别几乎是越来越小,对于数据而言一家创业公司跟BAT相比好像也毫无优势,从计算平台的角度来讲小公司更没有计算平台了,阿里云有计算平台,百度有没有不好说,至少微软、谷歌这些公司都有大的计算平台。从商业的角度来讲,创业公司跟这些公司也是很难比的,那么怎么样让一个创业公司在这里面能够胜出呢?我打一个比方,假如有一天,微软、阿里云免费了,这些技术免费了,媒体同事请注意,我没有说阿里云免费我只是打一个比方,不然我回去就被炒了,假如有一天这些大公司免费了,你怎么办呢?
朱珑:这个问题在我创业的第一天就被问过。因为我自己的身份还是有一定的立场能讲这句话,什么意思呢?我在全球最好的人工智能实验室待过,所以我天生回来的时候就很平静的。有人问我,问百度就是问谷歌说做的怎么怎么样,我知道我师弟几斤几两在那边做的,不是因为谷歌强他就牛逼了,这是由做人工智能领域最强的那个人决定的。
有数据有钱,1亿美金给他,他能不能做成,不见得!这个差很远的,但我这个观点不代表是为所有的创业者说话,而是说,这个事情的本质是由最强的那个人决定的,大的公司之间的博奕,微软和谷歌之间谁有那1亿美金呀,大家都有,现在创业公司1亿美金都很轻松,钱也不是问题。
资源、数据、都有钱,你说大的公司敢投1亿美金吗?找不到那个人的时候,有钱也不敢投。
邓锋:刚才我理解,听出点火药味来了,我们这儿人还是很牛,但是数据是关键,人家比你数据多。
朱珑:首先数据是非常关键的,但是这里谈技术的时候,我经常被同事们问。技术有几个层次,其中有一个叫做技术的远见或者技术的insight,大家是不谈的,大家只是谈算法,远见是什么意思呢?
技术未来在哪里,就是说其实对技术的理解能够让你知道数据在哪里,继续值钱到哪里,这不是大公司就一定知道的。大公司太多了,你看BAT跟谷歌对数据的理解还千差万别,他敢投这个人工智能科学家,敢投5000人3000人下去,BAT是不敢投这么多人的,他不知道business在哪里,也不知道技术的预测。其实最一流的高手他差距就是非常大的,最牛的人之间反而有可能是差距越来越大。
创业公司有数据的瓶颈,四、五年前数据是约束我们的,这个倒是真的。但还要看你要进入哪个市场,比如医疗市场,医疗是一个非常分割的市场,今天没有哪个大公司把这个数据通吃或者垄断了。
哪一些市场是特殊的?有用户场景的。有大量用户场景是大公司的强优势,我觉得小公司基本没戏,既使是你有技术。这要区分来看,有一些领域,比如说人脸,大家都做人脸识别,那用网络上的数据,其实大公司小公司都没有太大差异,都能收集到1亿、2亿的数据,但是到比如刚才说的ATM机刷脸取款的那些场景,既使是非常大众化的人脸识别这个领域,BAT也没有ATM机的数据,你也得从最简单的开始做起。越垂直、越分散的领域,大公司不见得有优势,这是创业公司很大的机会。
华先胜:看来你对于自己的科学家的团队还是很有信心的,实际上我觉得大家都知道,人工智能技术落地确实是有很多的因素在里面,有科学家,或者叫算法,算法是由科学家发明的,所以我把他混在一起来谈,有数据,有平台,有商业模式,有用户,这些因素基本上是缺一不可的,他可能应用强调这部分更多一点,有一些应用可能强调另外一个因素更多一点,其实我有些同意刚才朱珑的一些看法,特别是讲到要深入一个行业去,我觉得是非常重要的。人工智能远远还没有到我想到一个算法然后就work,不是这样的。还差的远的很。
第三个问题,刚才讲到很多监控的问题,智能的发展对将来会不会产生一些负面的影响?比如安全方面,隐私方面,这些将来带来的问题,带来的困扰。就相当于计算机发展的过程当中刚开始PC的时候有病毒,后来网络有木马,现在数据和web2.0、3.0等等这些概念出来,假新闻等等之类的都会带来负面的一些因素。我想问一下,虽然跟你的创业公司不见得有直接相关,我想问一下你在这方面有什么样的看法。
朱珑:技术带来的社会影响其实是一个长久的话题,人工智能可能今天因为超越人的智能边界的时候,会更加敏感。
我觉得两个方面,第一个方面就是它其实不是安全问题,或者不止是安全的问题。“智能”大了之后的社会分工,我觉得十年之内有巨大的动荡,不仅是中国,全世界都会面临这个问题。我为什么是我?我大学上了到底有没有用?大家如果家里有小孩,今天可以开始思考到底学什么。这个课题在过去的教育学家的课题可能这一页应该翻过去了,要重新开始思考。
没有人是特别知道应对30年后的世界,现在学什么才是对的,因为今天我们开始重新认识自己。未来20年,人类社会分工,或者经济形态会有巨大的变化。以前大家都学车,那以后无人车都有了,你学车就被人笑话对不对。
第一个层面是说,这个会有非常不平衡的情况出现,而且政府一定是滞后的,因为这个时间越长,没有人有特别强的预测能力和管控能力,所以这是第一个层面;
第二个事情是,目前AI技术并没有跟其他的互联网技术,或者是其他信息技术在安全性上,或者是其他层面上带来的威胁有本质的区别。技术都有两面性,一定会出现有利的地方和不利的地方,在过去因为有黑客互联网就不发展了?不太可能。我觉得AI并没有特别强的特殊性。
华先胜:刚才朱珑讲到了一个非常有意思的关于人脸识别技术,机器识别的能力,但是其实还有另外一点,机器识别的局限性。比如我们对一个人的时候,哪怕这个人的侧面,哪怕是一个背影,哪怕是灯光灰暗的,哪怕是有人遮挡的,人是能够识别的,机器很多情况下就歇菜了,也就是说这个机器是在某一个方面是强的,在某一方面是弱的。
比如说,现在还有一个例子就是对话这件事,你在某一个行业里面,或者说你只是问他一些,告诉它订机票,查天气,叫个车,那是很好的,你要随便跟他聊聊天,说这个北京天气怎么样,饭馆怎么样,或者是杭州呢?它就说杭州有美丽的西湖,就不知道你的联系到说杭州的天气怎么样。那么人工智能的局限会不会限制将来的发展?到底怎么样结合人的智能和机器的智能的这个长处去产生真正的影响?
朱珑:刚才这个问题也比较普遍会被问道到。我本来给大家解释那条曲线,稍微有点复杂,我刚才跳过去了。那条曲线,横轴是不同的年限,纵轴是错误率,大概是这么一条下滑的曲线,曲线上不同的点是什么呢?就是每一万人当中把你识别出来超过95%的这种点,再往下是10万人,100万人,1000万人,1亿人,10亿人。技术是这样子发展的。什么意思?
刚才1万人、10万人对应的是算法的识别性能,也是对应算法适用的场景性能在10倍、10倍的提高。场景是不断被解锁的,而且这个过程是一个非常大非常大的加速的过程。
过去我们很难想象ATM机这种边界是可以做的,实际的应用场景有的时候是超越你想象的。我们是业界最前沿的,有时候都会受到惊讶,举个例子,警察拿着人脸识别去辨认尸体,这不是设计者最初能够设计到的,我也不是这么弄的,警察说这个也可以,尸体不知道身份,他就可以查出来。他应用于这个事情的时候,大大超越设计者的想象。今天的智能,我们的想象已经跟不上人工智能发展的速度了,所以千万不要担心人工智能技术跟不上我们的想象。
邓锋:我举一个例子,你虽然做的很准,但是你很难应用。拿医学图像处理来说,大家知道照X光,或者是各种各样的CT,MRI,你可能有很多东西,如果你的影象科医生是很好的,医生他看的比较准,不好的医师可能看不好,经验不丰富看不了那么准。人工智能来做非常好,现在这个准确率也有提高,但是问题在哪儿呢?因为我们用了深度学习的方法,导致什么呢?他看的图片以后,他可能看了几百万的图片,其中有可能有几十万是病人,他就告诉你这个可能是有癌症,或者说准确率多高有癌症,但是他解释不出来为什么。你要给到这个临床医生他给你看,他说,你这个左胸和右胸的这个纹理不够清晰,或者是哪儿不够清晰,结节的形状,结节的大小等等,他会说一些这个东西,可是人工智能给你回答的只是说你这个疑似癌症。这怎么在实际当中用?你没法跟病人解释怎么办?
朱珑:我来解释一下,刚刚那个片子可能大家没有细节看,我没有展开。我刚才有一个CT的片子,我们出的报告恰恰是你说的,里面对结节的大小,它的体积、可疑性等都有描述,我们会出诊断报告。就是说它是可以被解读、可以跟医生交流的,他是做一个描述性的东西,不是只回答患癌或健康。
邓锋:你已经不是简单的深度学习了,你已经走到结合其他的东西来做的方向了。
朱珑:可以这么说吧。刚才说的问题是有一部分存在的,甚至是大部分存在的。时间就是2017年比2016年快太多,2016年比2015年快太多。
我举一个例子,2016年我们的产品能够被部署到医院,就用了半年时间。在公安系统同样的这个事情我做了两年半的时间。
就是说技术在商业化落地的过程,商业跟技术结合的过程越来越加速。当然这个可能是我们一家公司的特例,或者说不是现在市面上的公司都这样,但我觉得总体趋势是这样的。
邓锋:加速是最恐怖的一个事儿。
朱珑:对。
邓锋:我们下面开放给下面的听众,大家可以提问。
听众:您好,想问一下朱总,人工智能在技术层面还有在发生哪些重要的变化吗?短期之内是否,还有像Hinton2006年时发的那个同等重量级的那种论文的出现。刚刚您也在自己的演讲中提到,AI的技术在这两年有跳跃性的进步,想问一下您指的跳跃性的进步都有哪些?
朱珑:这个算法或者说技术本身十年前就有了,不是在这十年有跳跃性的发展。整个世界认识它是跳跃性的,这些科学家憋着,憋着,也不是因为那个GPU、大数据,也是也不是,什么意思呢?当年我在MIT的时候,全球就少数的几家团队用GPU,就敢用GPU,他就相信那么大的数据能够上去有效果。既使是发明的这个人,他当时并不如Hinton那么坚定。
就是说,同一个件事情到你手里,信的人和不信的人,发展速度差别是巨大的。因为任何的转型,或者说往前突破都有风险和成本。
大家不要有一个误区是最近有什么特别明显的发展,这个技术是这几年有逐渐的增加。跳跃性的意思不是代表这个技术,或者科学家理解上的跳跃性,是说这个东西在工业上或者说在应用上会有跳跃性的发展。
比如说,今天大家开始探讨记忆,因为我们很多是识别大脑的智能的一些比较单一的功能,现在记忆推理都可以,或者说在尝试并且是科学可验证的手段,向人的水平逼近,所以这些能做了,好多事情就能够实现,包括人机对话等等。
听众:谢谢,我想问朱总一个问题,刚才朱总提到,现在这个阶段人工智能的技术也是没有特别的权威,很多算法也是并不是什么特别创新的,或者是特别的算法,我想请教,作为一个商业机构依图科技最核心的竞争能力是什么?您如果要往前发展,希望成为下一代BAT或者是成为一个独角兽的话,您最核心的战略推动是什么?谢谢。
朱珑:讲到技术好不好理解、投资机构怎么辨别。我讲一个笑话,红杉资本周逵总最后要投我们的时候,问我你这个技术,你说你最好,这个能判断吗?我说怎么判断?你判断不了,你只有信我或不信我,最好的人你是不可能有能力判断的,你只能选择信我或不信我,我是说“最好的人”,不是前10%的人,最好的人只有最好的人才能判断。
那最好的人判断他其实也不是通过这个结果,他有很多细节,他输入的很多观点是一致的,他是有体系的,三年前他是可以,三年后可以被验证的,是有信用的,不是只是一句话喊对了,他100句话都说对了,他不是只是这一点上说对了。
我讲一个具体的。今天很流行的说法是AI要跟to B结合,投资人或其他很多人认为这是想当然的事情。但是5年前,进我办公室的人第一句话都是在问,你为什么不做to C?潜台词是没有to B这件事情的。
今天to B变成人们一个共识了,投资人还是问我怎样去辨别团队。我觉得AI本身不是一款产品,科学家没有特别天生的优势。AI的任何技术不是产品。比如说在公安系统中,我们的后台不是只有算法,而是端到端的。公安的业务平台,对他的科技口、刑侦口和交通口的战法应用,以及业务部门怎么分发到派出所,怎么配合,这些对产品的定义理解非常重要。医疗行业也是一样,只是一个算法或截面的改动,对算法的要求差距就很大。这就非常需要对技术和商业场景相结合的理解,非常需要高手。作为翻译者或沟通者,这个角色非常重要。这是比AI人才更稀缺的。
邓锋:我解读一下,举一个例子,拿医疗影像处理来说,很多团队都在做静态图像对比。大家看到大量的数据公司做的很好,但是实际应用中发现不太好用,为什么会这样?因为最大的问题是图片。技术员拍摄的X光、CT,可能因为拍摄水平不高,图像不标准。如果只是从技术的角度上考虑,不从产品的角度考虑,做的再好也没用。怎么能够让产品帮助技术员实时的把照片拍好,这可能是产品很重要的点。这跟人工智能和影像识别没有太大的关系。这点我很同意,我们要从行业切入,从用户的刚需和痛点做好产品。再往后推,可能是人工智能的技术。还有问题吗?
听众:我们是做医疗方面的,刚刚朱总谈到您觉得进入医疗领域还蛮快的,我自己在行业里面觉得这个过程还挺慢。我特别认同场景这件事情。您举了几个例子,我自己的感觉是它没有在创造价值的场景下发挥作用。您觉得在进入医疗行业时,会不会有一些阻碍的因素?
朱珑:我们做医疗并不是第一次做垂直行业。我们首先做的是公安领域。这是一个很深的而且不是那么好做的垂直行业。这里面存在进入垂直行业的共性方法。这些方法和经验是对人的理解,对部门之间的理解。这是对进入医疗行业有帮助的。
其次,对产品和技术的理解,在垂直行业中也会碰到,在医疗行业也会有共性。所以我们在公安领域里面有一个口号,就是我要比公安的人更懂公安。医疗也是类似的情况,所以我们会有比较谦卑的学习心态,让我们比医生更懂医生。我要和医生、生物学家、药厂、投资人聊,比他们都懂这个行业。我觉得这个是很关键的。
邓锋:我问的问题可能更直接,其实进入医疗行业是强关系型的,跟技术和产品的关系不大,主要是靠客户管理,对吧。
朱珑:是。
邓锋:人工智能这个时代,是不是还要通过强关系才能交易,才能进医院。
朱珑:你刚才说的是现状。我们在医疗行业感受到的和公安领域非常相近的地方是产品真的能打动人。我第一天进入医疗行业,一点医疗的算法和产品都不具备,但是我只问一句话,就是你最突出的问题是什么,或者哪些是有数据基础可以做的。两个月之后我就带来一个样本在这里试验。他们真的关心这件事情,因为能解决他们的问题,真的有用。做的时间要足够快,从算法定制到产品研发到给出结果,这个威力是非常大的。
邓锋:非常好,我知道观众还有很多的问题,但是时间有限。最后大家一起感谢我们的演讲人和嘉宾。