4月22日,一年一度的中国绿公司年会在郑州召开,马云、马蔚华等知名企业家在大会上做了演讲,依图科技创始人朱珑也受邀前往,围绕人工智能做了深度分享。
以下为朱珑演讲全文:
我们在新闻当中看到都是推崇本科生创业,甚至推崇没毕业的本科生去创业。我比较极端一点,我是博士后,还好,中国人比较尊敬这个学历。
但其实学术界的人来创业,也是一个重新学习的过程。尤其商业领域上,如果不是特别有天赋,从履历上来讲天生是一个短板。
所以我是一个非典型的创业,这种非典型的创业也给我有一个非常特殊的视角,对科学、对学术的理解,以及我创业几年来,有些共同点和不同点,也有一些不同的思考。
我有三段学术历史,前2段历史,邓总(注:北极光创投创始人邓锋)刚才介绍的比较多了,我拿天使轮融资的时候,见到真格基金徐小平老师,讲到MIT我的第二段学术经历,徐老师就要投了。去年我碰见徐老师,我才和他说我是人工智能的行家,因为我第三段的学术背景。
深度学习是在2013、2014年开始在全世界火起来的,我第三个实验室的老板(Yann Lecun ,现任Facebook人工智能实验室的负责人)在深度学习领域从业了30年。在我创业的时候,也就是2012年,在全球深度学习相对而言都是一个非常冷门的专业,非常好的博士生并不去到这样的实验室、这个学科中来。
直到2013年,到中国可能是2014年,一夜之间全球的博士开始跳到这个专业来学习,那就凸现了过去在这个专业领域里人才储备的不足。讲这个过程是说,非常短的时间里有非常巨大的变化。
人工智能比较火,谈的人比较多,对我来说是非常难谈的。我先给两个定义:
一个是,难辨的技术,
真假非常难辨,泡沫非常难辨。
但是谈的人又多,专家非常多,无论是投资人、高校的人,还有创业的从业者。我自己有一个理解,现在是一个没有权威的时代。
我今年年初在硅谷呆了一个月,有一些体会跟大家分享一下。什么是难辨的技术?
人工智能属于科学的范畴,科学是离大众很远的。不要说,我们最好的实验室,去评价另外一个实验室的工作,如果只看论文,看公开流通的文章,不是那么容易评论,评估成本是很高的,还要根据多年来两个实验室的交流,以及互相理解的基础,才能评价他们的工作。这对圈内人已经是比较难,更何况现在流动非常大。
我们对科学预设了一个立场,就是客观事实。但很多在市面上评价的东西都是比较主观的,很多科学家、教授、研究员并不在业界的一线,尽管他是全职教授,或者是名牌大学的教授,很多他听到的进展,更多来自于新闻。比如说依图科技的进展,他也是看新闻了解到。但新闻可能不是最核心、最领先的一些技术,以这个不是那么严谨的素材做预测和评论的时候,其实是和真相差距比较大的。
科学是一个很严肃的东西,是一个客观存在的东西,但是谈的时候这个误差是比较大的,容易被谈的这个人的身份有一个预设的牵引。
另外一个是,这是一个没有权威的时代。
我在美国最好的实验室呆过,他们要了解今天全球最先进的技术在发生什么,也不是了解的那么全面。为什么?因为现在人工智能发展的速度太快了,甚至在各地都有跳跃性的发展。
谷歌一个AI的总监不见得理解透自己公司的另外一个部门的所有进展,对他们来讲是比较困难的;全球最好的专家要理解全球最好的技术,不见得是全面的。更不用说今天在美国顶级的学术界或者名牌学校里面的老教授,它已经很难很难点评全球最好的技术在发生什么。
这和10年前的学术界是不一样的,学术界3个全球最好的教授,实验室师兄弟几个人凑在一起,差不多把全球的进展,甚至未来3年的进展就都预测了。
这就是一个没有权威的时代,任何一个今天新的技术,有可能是有突破性的社会意义和学术价值。这是我的一个体会。
因为科学很难谈,所以我先从不需要任何专业背景,不需要跨越文化的东西,就是知识的东西,来看看AI今天是一个什么状态。
大家可以看一下这四对图,你看哪一组是同一个人,哪一组不是同一个人。你们通过这个过程来感受一下你到底是怎么认识人的,当你辨别人的时候,到底是看眼睛像不像,还是嘴巴像不像。结论是右下角这组。
机器很容易找到一张图来迷惑或者超过人的辨识边界。这个话题很有意思,在非常早期的时候,大概3年前,出现了非常重要的边界线。机器做的识别,跟普通的人作为一个识别的基础比较的话,机器的识别能力已经超过人类,这是一个很重要的界线。
很多最基础的功能上机器超过人类,机器就可以替代人从事这部分工作,有太多场合可以替代,比如机器几乎不会存在速度和体力的问题,一秒钟看1个人,还是1秒钟看1亿人机器都可以,很多场合都可以被替代,这是很重要的分界线。
刚识别这四组人像的问题,有的人可能会问,在座的100多位都不认识这几个人,有可能识别不了,大家对陌生人的识别能力下降,可是对熟悉的、我的朋友的辨识,机器不太可能超越我。
我们做了一个实验。我们有一个公安的客户,他在一千万数据库当中,把他女朋友的照片放进去搜索,然后拿出相似的前十名出来,打乱了出来,问他哪个是他女朋友,他辨别不出来的,有可能是一个是证件照一个是生活照的原因,有可能因为年龄的原因,也可能有化妆的原因。
所以你非常熟悉的人,比如你女朋友,你不见得比机器更认识你的女朋友,因为光照角度、化妆,人是很容易受主观性的影响。今天机器做到一个程度,对非常熟悉的人的辨识,机器也可以很稳定的超越人类。
再拓展一点,到更专业的领域,医学上,一个专家他可能训练了3年或者5年,机器还是可能超越人类。我们还做了一个统计,我们尝试想回答一个问题,在中国大约13亿人中有多少人和你长得一样?
长得一样的标准,就是你妈辨别不清楚谁是谁,这个问题纯粹是对世界的好奇。结论是每一亿个人中有一个人和你一样,全中国平均有12个人跟你长得一样。你找得到12个“替身”,而且是你妈辨别不出来。
这是很重要的一个科学统计的结果,这是在其他任何地方都不知道的结论。
这是什么意思呢?我们做人工智能,除了产业化的意义意外,今天的人工智能,把机器的边界不断往前推进的时候,它能够帮助人类看到我们的智慧、天生的能力边界在哪里。从前这个课题没法被讨论没法被回答,以前没有这么大规模的科学手段,这非常有意义。
虽然人脸识别非常普罗大众,大家讨论智能,容易讲AlphaGo,讲棋手。我对智能有一个很重要的理解,人工智能应该是先解决一件什么事情?其中应该是人天生就具备的能力,它应该是3岁、5岁小孩就应该有的能力。
这是人成为人的一个最重要的基础,它的很多智能是由这些衍生出来的,不是人掌握的那些知识。这种智能就是体现差异的,不是棋手才有的智能,也不是英国人美国人特有的智能,也不是上了大学的人才有的智能,只要你是人就会有这个智能。谈论这个事情,是回答人最本质的东西。
再往下,我们谈一谈社会上的意义。
有的人可能听说过这个案子,我们布了全球最大的人脸搜索引擎,公安可以通过这个搜索引擎追逃逃犯。这个案子是十几年前的杀人犯,逃到庙里做主持,通过一个系统交叉比对,把这个通缉犯和现有的十几亿人或者一个省的一亿人,做大规模的几万亿次的或者几十万亿次的交叉比对。大部分逃犯可能都是改了证件、做了漂白,这可以说是大海捞针的方式。
另外一个是在派出所,老人带着小孩走丢了,他说不清楚自己是谁,记不起身份证号码。以前这个很难办,公安也不知道该去收容所还是社保,很难处理这件事。现在在派出所拍一下就知道这个人是谁,也比较简单。
这个是讲这个摄像头用到了哪些位置,像是在公共的摄像头,办案过程已经锁定嫌疑人,公共摄像头抓拍到了嫌疑人,比较远而且是运动的、模糊的、低清像素的情况下,基本都能识别出来。
这是在网吧,以前的小案件很难报案,几百块或者几千块钱,比如手机被人偷,既没法查也比较难抓,现在是这种角落里的摄像头,即便有角度的差异,也基本上可以查出来。
还有比较典型的应用是在ATM机上,以前比较难做。ATM机上的鱼眼摄像头拍到的人像,现在也可以用这些人像抓捕疑犯。
中国的人工智能局面,先进的技术结合垂直的场景,具有世界范围内领先意义。
今天的人脸识别技术在不同的区域、不同的场景下,能做到非常多事情。作为从业者,特别是从科学到创业圈,还是非常激动人心的。我和一线的民警聊,过去民警工作中希望用到的科技手段,这2年下来基本都能做到了,更重要的意义是,你们看过的美国科幻大片里面的场景,我可以回答,我们都能做,而且基本上只有中国能做到。
美国和其他国家,像这种视频条件和人脸识别的技术都很难做到。美国的人脸识别技术很好,好在哪里?美国只是谷歌的技术好,最多再加一个Facebook的技术好,但它的创业氛围和政府的圈子的意识不见得是最领先的。
今天的局面是,像我这样的留学生回国的比较多,中国出现这种先进的技术和垂直领域相结合的产品是比较有代表性的,做出来不只是解决中国的问题,在世界范围内都是非常领先的。
我们刚介绍做人脸识别,其实我们还做其他方面。这是新的统计建模和人工智能在城市管理的应用。
做一件什么事情呢?在杭州试点,把道路上的车和灯以及路,比如有多少个车道,道路上车辆通过的速度,这些参数拿进来进行建模,能够给交通一些优化的建议,比如说红灯可以从50秒调到40秒,能使道路通行的速度提高5%或10%,类似的预测在宏观上做交通管理。
如果有个大的事件或活动,要做个预测,过去都是凭着政府管理者的经验,都是经验型的,不是大数据驱动的决策机制。现在可以靠真正的科学来辅助决策。
还有比较直接的应用,是在医学领域的肺的CT片,科学统计结果,今天机器可以做到和医院副主任医师看CT片子相当的水平。
这是属于自然语言理解的范畴,大家看左上角,这是机器对小孩发烧状况的描述,机器是可以通过技术,把专业的医学中的自由文本转化成带有语意结构的,比如身体的部位,病灶程度、属性等,全部能精确的摘要出来,形成智能的决策,给出相似的可能性的症状,以及相似的病例和一些诊疗方案。
以上就是一些不同的人工智能在今天在不同场所应用,希望给大家一些人工智最前沿的传达。
AI在今天发展速度是非常快的,即使现在非常热的情况下,以BAT、创业者或是投资人,大家还是低估AI最前沿的技术有可能有跳跃性的进步。