“2018中国绿公司年会”于4月22日-24日在天津举行,主题为:智能商业时代 高质量发展与价值创造。出门问问创始人兼CEO李志飞出席【全会-AI专场】并演讲。
以下为李志飞演讲全文:
李志飞:标题是“AI语音怎样如何打造企业竞争力”。出门问问干了两件事情,自己开发语音交互技术,从麦克风的阵列到环形,到语音识别,到对接、TTS,一整套的端到端的语音交互技术,在全世界或者中国创业公司比较特别一点的,因为一般的创业公司是开发一个单一技术,而出门问问是开发端到端的语音交互技术,在中国和全世界都是比较少见的,这是第一件事情。
第二件事情,出门问问把语音交互运用到智能硬件场景下,主要是自己直接面对消费者,跟全世界99%的AI创业公司不太一样,主要业务是ToC,因为一般的AI公司是ToB。
过去大概五年多的时间我们做了很多探索,对AI到底怎么落地消费场景有一些想法。第一,软硬结合是落地ToC的主要方式,今天听起来比较容易理解,但在2013、2014年做智能硬件的时候,很多人觉得为什么算法公司一定要做硬件,不太理解。举两个例子,一个是谷歌,一个是我们自己。谷歌在过去硬件方面,比如智能手机、智能音箱、智能耳机,这是非常非常严肃的事情。可能以前大家理解谷歌更多的是服务、软件公司,但它在硬件方面,尤其是过去两年花了很大的血本做硬件。出门问问,智能音响、智能手表做了很多硬件尝试。很多人问为什么谷歌和出门问问做AI落地,为什么自己做硬件,而不像以前安卓系统,像谷歌开发安卓,很多合作伙伴做硬件,这是时代的变化,阶段也不太一样,今天最主要的原因我认为是AI技术非常不成熟,不像一个查检直接插到另外一个地方拼起来就可以直接用。在这种情况下,如果想把AI落地,想依赖于合作伙伴跟你有同样的想法,对AI有同样的态度,是比较难的,过去无数次证明,每次做一个证明都发现很难找到合适的合作伙伴,连谷歌都存在这样的问题。软硬件结合才能做出好的用户体验,这是最主要的核心问题。
当然,另外一个观点,可能是因为AI的商业化如果纯粹靠软件是比较难以商业化的,必须通过硬件作为一个载体进行AI的商业化,如果AI是灵魂,各种硬件就是体,灵魂需要护体才能产生价值,至少未来一两年,软硬结合是AI落地最主要的方式。
语音交互大家都觉得很重要,但如果大家去做一个调查,在日常生活中,语音交互不是主流的交互方式,最主要的还是用键盘、触摸屏,为什么?未来语音交互是不是一定没有希望?接下来讲一下我们的观察,解释这几个问题。
首先看一下欲活跃,大家都用过各种设备,手表、音箱,出门问问做ToC,在所有设备商都做过语音交互运用。手机的欲活跃非常低,一百个手机用户,可能四个用语音交互。我们曾经做过谷歌语音搜索应用,2014年,中国80%以上的谷歌硬件都装在我们的语音搜索应用,那个场景下,用户打开谷歌,可能90%的用户都会用到语音交互,因为那是唯一的交互方式。智能手表、音像的活跃率远远大于手机。为什么语音交互今天没有成为主流的交互方式呢?非常量化的看这个问题,原因就是因为今天95%的智能设备都是智能手机,像智能手表、音箱、耳机、收集、智能车载,这是今天主要的交互设备是智能手机,但活跃度不是很高,导致语音交互没有成为一个主流的交互方式。未来语音交互是不是没有希望了?也不是,因为大家要看到一个大的趋势,未来几年,非手机类的智能设备增长幅度远远超过手机,这是以前的数据。上一个季度,中国智能手机不但没有增长,可能是负增长,智能手机设备饱和率非常高,已经很难再有大规模增长,但是其它类别,耳机、音箱的增长都是30%、50%、100%。做一个简单的数学,今天的绝对数量,再算一下未来的增长率,可以很快的做一个判断,在将来三年、五年会看到非手机类的智能设备超过30%以上,美国会走的更快一点,其次是欧洲,然后才是中国。
为什么非手机类的设备占到30%以上如此重要?因为非手机类的智能设备语音交互方式是非常重要的方式,30%的设备都是非手机类的时候,首先这些设备都是小型化的,第二,是便携的。美国计算机博物馆,随着年代的进程,网络、村存储、计算的设备都是小型的、便携化的,无论是耳机还是手表和其它车载设备都是小型化、便携化,没有屏幕了,没有键盘了,而且是随身携带的,在路上很不方便用键盘、触摸屏,在车里很不方便用触摸屏、键盘。30%的设备都是非手机类的,而且没有屏幕、键盘,语音交互就是非常重要的,甚至在某种程度下是唯一的交互方式,这个时候语音交互才会成为一个主流的交互方式。
作为AI公司,怎么打造语音的竞争力,我从出门问问的角度,或者怎么帮助第三方的角度讲一下。任何一个AI公司,要有比较大的竞争力,关键的一句话,找到可以掌控的规模化场景。过去很多人一直讨论到底AI是数据重要还是算法重要、技术重要还是场景重要?到了一定规模下,一定是场景更重要,特别重要的是场景是可以掌控的,比如谷歌为什么一定做AI,一定要做硬件,只有硬件才是他自己可以掌控的场景,而且是规模化的场景,这是今天很多AI公司做到所谓独角兽阶段要面临的问题,怎么打造自己可掌控而且是规模化的场景,数据、算法只是敲门砖,不能构成绝对的壁垒。
出门问问具体到怎么打造规模化的场景?都是大白话,很多时候特别忙,是不是每天都能思考一下几个点,是不是打造一个可控的、规模化的使用场景。出门问问有几点,第一,持续的迭代提升语音交互核心技术,虽然技术不能构成绝对的壁垒,但必须持续性的保持领先,才有可能保持竞争力。第二,不停打造语音交互可以应用的场景,无论是车载还是家居,还是智能的可穿戴。当产品打造出来,特别重要的是真正规模化,而不是做一下PR或者融一下资,搞一个发布会就结束了。今天很多AI公司确实都没有找到,当你做一个硬件达到一百万台,是特别重要的指标。出门问问为了做销量,无论做线下还是国际化,还是做线上,都花了很多精力,比如国际化,今天的智能手表在美国、欧洲、德国都是排前五名的,包括进入美国最主流的best Buy的营销渠道。
由于今天的营销规模不够大,必须把ToB也能渗透到ToC里去。2012年首先做技术、场景,第一次做软硬结合的闭环,最近持续把闭环更大规模上循环的叠加。过去做了很多产品,有智能手表、音箱、耳机、车载设备,在市场上有一些产品表现的不错,放在第三方的合作伙伴的场景。ToB,更多是利用在ToC打造的端到端的产品体验,帮助合作伙伴提升他们的体验,像谷歌或者大众汽车都是ToB的合作,有麦克风的阵列,也有智能语音机器人,包括对智能、新零售,所有的都是语音交互方式,放到ToB的环境里,给客户提供更好的体验。
谢谢大家!
邓锋:
算法、数据、场景,从场景入手,找到可控制的规模化场景很好。但是大家都这么想,选择场景有规模,但很多人都在做,包括亚马逊、BAT、小米,作为一个小公司,靠什么建立竞争壁垒,跟这些大公司竞争?
李志飞:
这是特别难但是又必须回答的问题,比如出门问问做智能手表,已经不算小公司,200名工程师专门做智能手表场景,大公司的项目特别多,怎样建立竞争,没有大家想象得那么可怕,但是确实在特别关键的场景,比如智能家居,这是现在面临最大的竞争,在美国有谷歌,中国有百度、腾讯、阿里,都在做智能音箱,对我们来说唯一能够生存的方式不是硬碰硬,唯一能做的就是垂直化,比如智能音箱,我们的产品是儿童ID,给儿童看的,整个语音交互,从唤醒到内容,到语音识别都是为儿童场景优化的,这就是垂直化的例子,因为谷歌、阿里很难在这一刻说专注儿童的场景,这是我们选择的一个方式。
邓锋:
还有一个问题,语音交互可简单,可复杂。从你的角度看,中国做语音交互的技术,不光是语音识别,跟世界最先进的水平到底有差别吗?差多远?
李志飞:
邓总讲了特别核心的话题,一说到语音交互,就说是语音识别,其实最难的问题是加上对话,物理世界特别复杂,很多东西不可预测,这是确实必须承认有难度。具体说中国到美国,在核心算法上可能有一点点差距,但是还是场景,做通用的对话系统,我觉得很难,基本上现在不太可能。但是做车载的时候,就那么几个事情,导航、听音乐、打电话,不会硬要聊天,谈情说爱,在这种情况下,中国公司反而会做得更好,因为我们落地更快,而且更接地气。
邓锋:
家恩你们也做语音交互,也是这方面的专家,业务上不知道有多少重叠,你应该理解很深。
梁家恩:
语音交互也是我们认为未来物联网落地非常关键的环节。语音交互,用户想要的并不是交互,而是内容跟服务,做C端的产品应用,后边的内容、服务如何跟百度这样的巨头竞争?
李志飞:
今天的内容反而不是太大的问题,比如大众点评、高德的API数据都是开放的,对他们来说要的是更多用户使用。我们在2013年就跟他们产生了关系,开始做端到端的服务,用户不是为了交互,而是为了用后面的内容。今天反而出门问问作为第三方的公司,内容不是问题。为什么?百度内容再多,也不可能把所有的内容都做到,阿里也是,腾讯也是,至少目前来说我们不是瓶颈,他们愿意开放给我们去用。
邓锋:
未来发展,如果内容可以跟他们对接,你就做前端的产品。
李志飞:
我们就是给用户提供新的交互方式。
余凯:
志飞的尝试,在人工智能创业厉害是很独特的,从技术走到产品,走到ToC,我一直在想苹果除了做无疑伦比的软硬件产品,还创造了APP Store非常强大的生态,生态本身也成为一个壁垒,志飞有没有想过在哪一个层面上打造生态?做音箱、耳机、车载、手表,有可能做着做着,是不是越来越像小米了?硬件的生态,还是想在硬件的平台之上,是软件应用的生态,怎么思考未来路径问题?
李志飞:
首先出门问问是一个小公司,谈不上生态,还是踏实一点,先做了智能手表是不是卖的好,做的智能音箱是不是卖得好,这是第一层思考。如果未来出门问问真能够成为不错的公司,或者一个大公司,一定是独一无二的,也不是苹果,也不是小米。
余凯:
要不要开线下体验店?今年会开吗?
李志飞:
一定会。做这到一步,再继续往下做,中间没有回头路,这是非常坚决的。
邓锋:
所以听起来,未来更像硬件公司。
李志飞:
我不承认,未来的商业不会存在像过去纯硬件公司,我们还是以AI为核心的软硬件公司。
邓锋:
家恩问的问题比较客气,我稍微问的更尖锐一点,百度有内容,有用户,有搜索技术,你刚才讲的不是完全交互、全内容的任何场景下的对话,百度的搜索技术也很强,提供这个平台,跟硬件厂商合作,甚至类似于小米或者跟其它的硬件厂商合作,像百度的阿波罗一样,开放平台你去做,那个时候你们怎么做?
李志飞:
任何东西都有时间性的,比如未来一两年,为什么谷歌在AI落地上不能像安卓那么成功,这就是原因,第一是技术不成熟,第二,硬件厂商认识到了数据跟软件、服务的价值,不会心甘情愿把这些东西交给你。我想知道百度今天,包括讯飞做了这么久,能够控制小米、华为这样的情况下的掌控力吗?没有,三年以后有可能有变化,但是那个时候我相信出门问问要么自己的硬件已经非常成功了,要么这个公司不存在了,都有这种可能性。对我们来说,要的就是今天能够把AI技术做好,把场景做好,把场景规模做好。