林宜立:大家好,我是来自出门问问的林宜立,我今天的题目是说人工智能技术产品化的讨论。在我讲之前我先做一个小调查,今天在座的这些朋友有一些是在互联网相关或者AI相关公司工作的,还有一些学生。我大概了解一下大家的兴趣点,一会儿我们也可以讨论一下。我们公司叫出门问问,可能有一些朋友知道,尤其做AI这个圈子的朋友知道,这个名字很好记,不知道的话出门问问就可以了。
我们公司是由志飞博士2012年10月从谷歌回国创立的,我们目前为止是拿到了红杉、真格等公司的投资,在去年的年底,我们拿到了google的C轮的投资。那应该也是google离开中国五年之后回归时投资的第一家公司,也代表了我们在这个领域的一些比较有技术深度的一些小的自豪和骄傲。
我们公司做什么?首先讲一下出门问问的核心技术,其实出门问问被很多朋友知道是在人工智能语音AI方面技术的积累,具体而言,我们公司在语音识别、语意分析、智能推送、TTS以及第三方对接垂直搜索数据这块,我们是拥有全套垂直的核心技术。
在去年的时候,我们跟google也达到了官方的战略合作,所以在中国大陆地区的AndroidWear智能手表里面的语音搜索服务是由出门问问提供的,也就是说今天各位如果去市面上买,摩托360二代的智能手表,买华为的智能手表再对它做一个你好安全唤醒的语音服务,这个就是由我们提供的。
作为一家成长型的创业公司,尤其是主打AI的一家公司,我们是怎么样来思考这样的一件事情,我们跟其他同类的公司有哪些不同的思考,这一点上我觉得在我们出门问问团队看来我们还是有一些可能跟别人不太一样的尝试。举个最简单的例子,可能很多做AI、做这种技术出身的公司,会选择做2B的这条道路。也就是说我有一项很牛逼的技术,那么我把它包装成一个ATI、包装成一个很好的借口,那么我去提供给其他的公司用。
那对于我们来讲,我们选择一条比较难的模式×××,就是说我们希望不光自己核心技术能够自己研发,我们还希望能直接做到2C的消费者产品。所以在过去的几年里,我们都陆续在这个上面做了几个尝试,比如说我们可能最早launch了一个出门问问的微信公众号,在这个公众号里面(当时可能微信还是比较早期的),我们的技术能做到让用户用语音对着我们的公众号说一段话的时候,就能返回一个非常好理解你意图的一个搜索结果。
在2014年底包括到2015年的6月,我们开发了叫ticwear的智能手表操作系统,同时也发布了这款叫ticwatch的智能手表,在座我不知道有多少的朋友听说过这个手表(就是我手上戴的这款),这款表现在在京东和天猫所有的主要电商渠道都有,一会儿我会具体讲一下这个表到目前为止取得的一些成绩。
那么这款表有什么特点?其实我刚才提到了AndroidWer中文版的操作系统,为什么谷歌最后会选择我们,很重要的一个原因可能是因为我们不光有这个技术,我们在智能手表领域有自己的软件操作系统,就是ticwear的这套操作系统以及手表的交互,其实经过若干版本的迭代已经取得了不错的用户体验和反馈。同时出门问问自己也有一个硬件的设计研发团队,所以目前在市面上的这款ticwatch应该是一款真正的软硬结合的体验不错、口碑不错的产品,那可能也是我们区别于其他公司的一个很大的特点。
目前为止,可以跟大家透露一下,从去年的6月发布,我们9月正式在京东和天猫上拍卖,到现在我们卖了将近10万块,销售额有1亿左右,那这个数可能大家觉得好像一听跟一些手机企业比也算不上什么,但是大家真正去看作为一家人工智能的创业公司,或者说在智能手表这个品类里面,这个成绩是相当不容易的。如果大家一会儿用手机打开京东,去看看applewatch在京东上的消费者的review有多少,看看ticwatch有多少条,你可能就能发现区别。目前为止我们可能有11000或者12000多条用户的真实反馈,苹果手表可能大概有3万多条,所以大家去看这个,其实熟悉电商的朋友可以去推一下这个比例,你就知道我们销量的真实数据是什么样的。
所以这是我们在过去做的一些尝试,刚才举的这几个例子就是说怎么去实现从技术到消费级产品的一条道路,也就是说怎么样把人工智能的这些技术真正做到商业化,作为一个公司你怎么样通过这样的技术转化为产品,甚至一个生意,怎样能够生存并且活下去,能赚钱活得更好。
我们公司总结下来可能就是说走的是一条平稳的道路,我刚才介绍了我们可能最早是一个极客的团队,在我加入这家公司的时候,可能公司也就几十个人,基本上都是工程师,然后做了一些酷炫的东西,对着一个机器说一句话能识别和反馈一些很酷炫的内容,但是都没有产品。
到后来我们慢慢的就说能做一些什么,到2014年6月的时候我们开始做了我们的ticwear智能操作系统,然后到了去年,我们开始有自己的硬件产品了,那么今年我们会继续在可穿戴上有更多、更好的、更能体现我们自己对技术、对产品坚持的的新产品出来,希望各位能够期待。
在中间这条线还是我们在AI技术上会持续开发我们新的技术,比如说我们今年会逐渐的上线我们的对话系统,在语音合成方面也会有自己的技术,所以这些可能市面上能够把语音这套完全做下来的创业公司就没有几家了,比如说像一些特别大的友商,大家都明白×××。
另外一条线就是我们在探索语音还有哪些应用场景,那很自然的我们就想到车载,其实在2014、2015年的时候我们做了一些事,只不过说并没有很大规模的去宣传,因为可能我们的风格相对来说不是一个PPT发布会公司,所以我们更希望做一些好的事,觉得差不多了或者是稍微靠谱一点的时候我们再放出来。
那么我们跟博士的团队一直在做一些探索,同时今年我们也会跟福特的apline的这套方案做一些产品化的体验。今天稍后我也会给大家展示几个小的demo。
我觉得这样的尝试,以后会有更多更好的东西出来。可能在座也有朋友知道表,包括我们公司在不同场合也讲了很多表,所以今天更多的想讲一下车载的东西。
说为什么要做车载的产品,这个话题肯定也在业内被讨论了无数次,就是说汽车可能是移动互联网的第四屏幕,包括去年到今年,整个互联网汽车这块的创业公司也是特别火,包括我本人,其实我大学时代学的是汽车工程,然后大学毕业其实是上汽工作了一段时间,所以我对汽车也特别有感情,所以除了手机、电脑还有电视,可能是几个比较主流的互联网品类以外,可能汽车未来会真正成为移动互联网,物联网世界的第四块屏幕,所以它非常重要,而且语音本身就是一个非常天然的适合车载场景的一个交互方式。
那么车载的产品怎么做?其实首先一点就要理解开车或者说在车载环境里面痛点在哪里,我们也是做了大量的调研,包括跟很多朋友去聊,所以我们自己总结下来可能有这么三点:
第一点:你的眼睛不要离开路。
第二点:手不要离开方向盘。
第三点:你的注意力不要被分散。
当然我说的都是在无人驾驶真正实现之前的车载产品需要这么做,但如果说真的有一天这个车很智能了,那么你的思维和注意力可以进一步被解放出来。可能在这之前,所以的车载产品都要关注和解决这么几个大的原则。
那么车载的应用到底有哪些可以做,如果今天有做车载方面的朋友,其实大家也可以探讨一下,那我们自己总结下来可能有六大领域:导航、娱乐资讯、通讯、安全、用车的×××、车辆管控,基本上这边应该涵盖了你们在汽车领域能玩的所有话题,我觉得逃不出这个。
那我们一开始会做些什么,所以通常说的这几个点,就是说我们可能大而全的东西首先有套路,第二就是我们的能力也有限,所以可能作为一家创业公司,我们一开始会在某些点上做一些尝试,所以像导航、娱乐、通讯我们认为是更轻的,更容易被切入的一个切入点。
其实在上周,我们也开了一个小型的媒体沟通会,实际上就是做一个小的产品叫“开车问问”,是一个安卓手机应用,我们希望能够把我们的技术先落地到一个车载行情里,看看我们能帮用户解决一些什么样的痛点。
什么样才是一个比较好的车载AI助手应用?我们觉得首先语音交互很重要,这一点必须能够做到它很智能、很自然的跟你去沟通。第二,我们选择一个横频的UI,因为我觉得在车里面这个横频的UI相对来说会比竖频更加自然、更加符合人的这种所谓横向的移动的人机交互习惯,同时这个按钮×××。最后我们还是来关注一些核心场景,解决一些核心场景的需求。
这边是几个界面,这个看起来也很简单、简洁,非常大方,关键这是突出我们的一个语音的应用。在这个应用里面,无论任何时候你只要说你好问问(这是我们自己的一个热词),那就不用手去摸这个APP的屏幕,我们的APP就会被唤醒,然后它能帮你导航、查路况、搜索周边的一些toi、一些餐厅、一些好的景点,那么通讯(打电话、发短信)自然是能做的。然后查一些资讯、听歌什么的,这些都可以用语音来完成。
同时我们也可以设计一些比较好玩的,或者是更人性化的一些语音合成或者是语音的反馈,因为其实作为一个科技产品来说,有人性化的接触是非常重要的。
(小视频)
出门问问对于车载这个事有什么考虑?就是怎么来做这件事,我们为什么觉得很自信,说作为一家创业公司,我们敢切入这个领域,那我觉得我们的核心优势有:
优势一:就是说我们的自然语音交互技术(我知道今天也有一些做语音交互的友商在场),当然我们是一家小公司,但是我们很自豪的就是说,在这个领域我们是完全用独立自主的核心技术,然后全套我们都能做,我觉得这块是有助于我们去快速迭代的。
优势二:软硬结合的产品是我们选择的一个道路,就是我们这些软件团队和硬件团队非常紧密,会去做一些不同的尝试。
那么本地化的服务,这块也是我们一直在做的,就是说希望通过我们的技术去对接各个垂直领域最好的信息和服务的结构化的信息。那么当然在前装领域,我们也会以一个比较恰当的形式去切入,当然因为我们也有很多朋友是车厂出来的,包括我自己也有一些整车厂的经验,可能汽车公司在做一些事情的时候,它的思维和思路是不一样的,所以这一块我们也不会去做一些太R×××的事情。
当然后装这个就比较灵活,所以我们今年也会有一些好的东西出来。这边我在给大家看另一个demo,这个是我们用的ticwatch和博士的×××技术以及搜狗地图,我们一起做了一个叫多频联动的小的demo,其实这个demo要在马上开幕的北京车展上展示,大家如果去博士的展台应该也能看到,今天提前透露给各位。(这个视频质量不会太好,不过大家看看这个有意思的用户场景。)
(小视频)
有些朋友说为什么要在车里对着手表说话,其实它有几个点:
第一点:我刚才提到的多频的一个联动,就是说可能这个表戴在你的手上,它能提供一个很自然的触觉反馈,在你遇到拐弯或者一些紧急情况的时候能提供再多一层的信息提示。
第二点:它解决了一个在车里面难解决的问题,就是车载的一些噪音的场景,如果你要对着这块车机或者车的音频去说一些语音指令的时候,某些情况下可能比较困难,但是手表其实是很巧妙的解决了这个问题,可能你只要轻轻地把手一抬,抬到你嘴巴边上,那么你只要悄悄对它说这个语音指令,它就一定能听懂,并且它的私密性会好很多,所以这是一个小的demo。
那后面,比如说我们的一些出门问问、开车问问产品,我们现在也在利用福特汽车的平台,也会后续做一些产品,如果各位有买车的打算,可能又比较喜欢福特,有可能你就会在除了福特汽车自己的一套技术以外,你还可以用到出门问问的刚才看到的比较自然的、非常简单的、好用的语音交互系统,你也有机会用得上。
最后给大家看一小段demo,大家感受一下这个小巧的车载语音助手,看完这个视频之后,有什么问题大家可以继续交流。
(视频)
未来会有更多的东西,其实你说这个APP我们团队当然是觉得非常棒的,我们倾入了很多的想法,也把整个技术和交互落地,但是我们内部觉得会有更好玩的东西,那么在今年的晚些时候,也希望各位一起期待在车载上有一些更新的、体验更好的、更激动人心的产品,谢谢各位。
主持人:下面是我们的互动环节,有问题大家可以提出来。
提问:你认为从技术最终落地到用户产品的过程中,最关键的一点是什么?
林宜立:其实这个问题其实我们每天都在思考,我认为首先能把技术做出来本身就很不容易了,但是说实话,这个技术的门槛对于真正在这个行业里的人来说,不存在说哪家能做的东西,别人做不了,这里面肯定更多的是说你怎么样通过这个技术找到一个比较合适的用户场景,或者说真正能够实现商业化的用户场景,把它落实为一个具体的产品形态。那么在这个过程中,其实非常重要的就是说一个demo到workfull的一个followtime,到一个可以量产的这么一个产品,尤其是我们自己选择了一些硬件的提升,其实里面有非常多需要能够把系统技术和产品集成到一起的这样的×××,我觉得解决这样一些实际的执行层面的问题,可能某种意义上讲会比你把这个idea想出来更加重要,这个是我们这个团队在过去的一年多对这个问题的思考。
提问:从可穿戴设备到车载,这里面最大的差距在哪?就是这两个设备之间比如说在语音交互层面有什么区别?
林宜立:我觉得肯定还是用户在用这个设备时的场景,包括有一些约束是不同的,举个例子,可能车载的产品就尽量不要让眼睛去看它,尽量不要让手去摸这块屏幕,而是更多的通过语音的交互,包括语音合成反馈来完成这么一件事情。那么它完成的任务可能也相对集中,就是说在车载领域,可能导航、音乐、资讯、微信或者一些短信需求这样的,可能是比较集中在这个几个领域。但是在可穿戴,做的事就会比较多,但是它的约束又不同,它可能屏幕特别小,在这个可穿戴上,手还是有机会去进行各种各样的点击触摸的,那么语音更多时候是解决行进中的一些衣食住行的搜索,所以这些都是由这个产品形态来决定的,在功能点上,在一些技术的角度上会有不同的侧重点。
提问:我刚才看到了你的开车问问的演示,这个非常好听的提示音是谁录的?
林宜立:我们有一位非常美丽的声优帮我们录了这么一些视频,其实当时大家听到的有一些是录好的声音,但其实里面有一些是我们自己做的语音合成,就是说我们利用叫Cicy的这位美女的声音作为这个提示音,所以这里面的反馈是这么样两个东西的组合。
提问:我有一个疑惑,比如说大家有可能需要百度的地图,它有可能会说欢迎使用百度地图,那这个语音是百度的语音吗?
林宜立:对,因为我们不是一个做地图的公司,我们这个demo里面做的是和百度的导航类似,但实际上像高德还有搜狗这些地图厂家,它都有相应开放的一些sdk,当然我们一开始也说了,我们不是要做一个大而全的产品,我觉得未来我自己会去选择大家认为最好用的地图的sdk,然后跟我们语音的这套相配合。
提问:但是这样里面会不会有一个用户体验的问题,比如说我开始使用的是你们的语音唤醒的应用,或者是其他应用,但它们自己就自带了一个语音,有可能刚才的语音突然变成郭德刚了。
林宜立:你这个问题也提得非常好,我觉得其实今天所有要做这种系统集成,或者说你要自己把产品做出来的公司,你都要面对这样的一个困境,就是说第一,你不可能在所有的技术和产品环节这些东西都是你的,所以你必然会有一些系统集成工作,但是你又不能所有的东西都是用别人的,就是这样最后导致的结果就是你的体验肯定是割裂的,尤其在行业的这个阶段,其实很多技术模块的借口都不是标准化的,你本身把它放在系统里面了。
所以回到上一个问题,就是说在导航这个领域我们肯定还是要去选择一个合作的方式,未来我们可能会有一些更深度、更完美的软硬结合的产品,我们在这一点上如果上双方有一个很强的合作意愿,这些问题都是可以被解决的。
但短期内,比如说我们的手表产品还有我们车载的产品,在一些非导航的场景下,那些东西就都是我们自己的,所以我们是有办法去控制相对×××。
这也是我一开始反复强调的,就是说我们作为小公司,怎么样能够做得跟别人不一样,就是软硬结合、AI和产品结合,这样一个把技术和产品做重,一竿子捅到底,或者说垂直整个领域的技术,可能是我们最后有机会生存的核心技术和战略支撑。