6月20日,音频分享平台喜马拉雅FM发布了旗下首款AI产品小雅AI音箱,半个月后,百度在AI开发者大会上宣布了DuerOS开放平台可以支持基于语音和图像识别的智能产品开发,当天下午,阿里人工智能实验室也发布了一款自主研发的中文语音理解引擎AliGenie平台及智能音箱天猫精灵。此前,腾讯、京东、联想、小米、酷狗等企业早已入局。据不完全估计,自今年4月以来,关于智能音箱、智能语音的发布会就已召开了几十场。
但现阶段的语音交互仍存在许多问题,人工智能技术尚处于起步期,背后搭载的开放平台需要大量的数据和训练才能掌握一定技能。
“虚火,智能音箱现在都是虚火”,喜马拉雅副总裁兼硬件事业部总经理李海波向《中国经营报》记者感慨,在技术启动期,随着关注度的提升,很多资金便会进来,到了泡沫期,众企业都在做,便是虚火最旺的时候。智能音箱是一个蓝海市场,然而,这时候很多企业并不是从用户需求出发,接下来一年到一年半的时间里,九成以上企业会淘汰掉,然后过度到一个平稳期,而现在离智能语音成熟期还很远。
群雄逐鹿的野心
7月5日,阿里智能音箱产品天猫精灵 X1面市。如今,BAT(百度、腾讯、阿里)等互联网巨头已相继发布了语音交互平台或智能音箱。其中,百度在今年1月的 CES 就推出了人工智能操作系统 DuerOS,DuerOS 可实现语音控制、日常聊天、直接提供多种 O2O 服务等的智能化转变。而此前谷歌、苹果、微软、亚马逊等国际巨头已抢先进入智能音箱领域。
今年4 月,腾讯宣布推出智能语音助手腾讯叮当;5 月,来自联想和创业公司 Rokid 的智能音箱产品正式面市;6月,问问智能音箱 Tichome、喜马拉雅FM小雅AI音箱悉数亮相。从外观或功能上看,上述音箱除了能听音乐支持设定闹钟、提醒事项、查询天气外,还能与消费者进行语言互动、控制家用智能设备。众多企业纷纷入局,被认为是巨头们在为以智能音箱为入口的AI 时代布局。
值得注意的是,智能音箱的风口也引来了更多企业参与进来。李海波介绍,目前,他所知晓的国内在做智能音箱的企业就超过百家,很多厂商及与之相关的硬件企业或技术提供商也跃跃欲试,正在不断进入这个市场。
相比于苹果及BAT巨头们在争夺未来智能生态切口的入场券,喜马拉雅、酷狗等企业还是将焦点放在了内容端。
李海波告诉记者:“你可以理解为我们想做喜马拉雅APP的实体化,我们希望能够把声音的习惯再扩展到日常其他场景去,将来他未必就长得像今天的小雅,可能是一套体系,会以床头灯、智能马桶,冰箱里头的嵌入系统而存 在。”
智能音箱为何在今年如此火爆?在多位业内人士看来,主要源于智能音箱鼻祖亚马逊发布的Amazon Echo销量大增。自Echo于2014年11月俏然上市以来,经历了三年的成长,Echo从2015年的400万台增至2016年的800万台,今年Echo的销售预期也被提至了1000万台。随后的2016年Google 正式推出了智能音箱 Google Home,2017年6月,苹果公司推出HomePod,这无疑成为重要的产业风向标。
多重难点待突破
智能音箱销量的火爆无疑让中国公司“眼红”。
京东是中国最早开启智能音箱市场的企业之一。2014年,京东成立智能集团,发布“JD+计划”。2015年初便与科大讯飞成立合资公司灵隆科技,同年8月推出叮咚智能音箱,这是目前国内销量最多的智能音箱产品。尽管如此,整个智能音箱市场却显得有些不温不火。智能音箱的主要功能依旧是听音乐,其余多样化的智能功能尚不成熟,难以捕获大量受众。
易观分析师冯超向记者分析,音箱产品不可移动,可能无法满足多种房间状态下的需求,目前许多国内消费者还缺乏对此类智能设备的依赖性。但从另一个角度看,随着技术发展,手机不再是唯一的计算中心,可穿戴设备、多种智能产品都将兴起,这必然产生大量的用户数据,产品之间互联互通进行数据的交互,万物互联模式将成为主流趋势。
智能音箱所代表的是一种全新的人工智能交互方式,代表着未来人工智能在家庭应用场景中的落地。随着亚马逊Echo的成功,各个巨头与国内众多公司并非仅在抢夺智能音箱市场,更多的是在关注未来家庭入口的进场券。为了减少自己的试错成本,他们开始“模仿”Echo,然而由于地域市场不同,中国企业所面临的难度更大。
“由于中国方言多,发音多,汉字在不同的语境中,有可能音是一样,字却不一样,如何将语音转化成文本比翻译英文难得多。”国内某知名智能音箱的产品经理小许告诉记者,口语转化成汉字、用户表达的口语化如何让背后的机器能识别,服务的整合能力都是智能语音发展的难点。以往用户在百度、淘宝输入都属于文本类的规范化信息,语音时代,需要把口语化的东西处理成背后机器能识别的完全口语化搜索。
在小许看来,技术的壁垒,靠时间和数据各大公司之间相对来说还是比较容易达成的。但数据和服务的累积不是简简单单能解决的,多个服务平台如何达到整合还有很长的路要走,提供内容服务的硬件厂商需要克服版权等壁垒问题。
“虚火”在燃烧?
从无人机和机器人,到AR和VR技术,再到如今的智能音箱、人工智能,科技界的风口热潮是否会消退?
近日,李海波在接受记者独家采访时表示,智能音箱、语音交互的发展符合技术咨询机构Gartner公司提出的Gartner曲线,根据Gartner曲线,新技术从概念、胚胎发展到成熟的过程划分为技术启动期、期望值高峰期、幻灭的低谷期、领悟的爬坡期、效率的饱和期五个区间,今年是人工智能充分竞争的一年,现阶段的智能音箱、语音交互就明显处于资本泡沫化高峰。
“智能音箱是个蓝海市场,当资本进入,众多企业都想要挤进来,但很多企业根本不是从用户需求出发,接下来一年到一年半的时间,从这几百家里面,90%的企业会淘汰掉,然后到一个平稳时期。”李海波认为,小公司机会少,未来的智能音箱不是企业买几个模组拼接到一块就能做成,相关模组形成的方案,后端需要大量技术人员进行组合,数据与技术的修正支持及适配、验证。
“既是虚火也是趋势,下一代的自然语音方式一定会替代掉触屏的方式,只是今天还在一个成长期,还没到成熟期。”多位业内人士告诉记者,这个趋势不可扭转,下一步应该是所有的服务,不管是打车、预定航班还是购物,都会进入到一个介于视觉语言和语音这两种更便捷的体验,因为这免去了很多中间环节。
在业内看来,语音交互的风口其实伴随着语音助手、各类语音应用早已到来,尤其在行车等不便于用手操控的场合中,语音交互发挥了较大的作用。易观分析师冯超认为,未来这个风口将同人工智能一样,持续发展,将会应用于越来越多的场景中。智能音箱现在正处于抢占市场红利的时期,虽然多方势力涌入,但还会经历一番大浪淘沙,品质好、服务优、技术强、系统完善的产品最终将占据市场,持续时间的长短还要看市场的检验。