3月22日,阿里巴巴人工智能实验室推出了第二代中文人机交流系统AliGenie2.0。新一代系统在此前“听”和“说”的基础上引入了视觉能力,能够进行视觉认知、多模态交互、情景感知。
阿里巴巴人工智能实验室负责人浅雪表示,AliGenie 2.0的视觉能力将首先落地在天猫精灵X1上。据了解,天猫精灵只需要装载一个XHolder硬件,然后通过手机APP中的“精灵火眼”功能,就可以实现视觉识别能力。
目前,“精灵火眼”功能主要聚焦在儿童和老人场景。对于儿童,精灵火眼可以通过图像识别,结合智能语音互动、声音朗读,帮助儿童读书、识字;对于老人,精灵火眼具备识别药盒的功能,只要扫一扫药盒,就能用语音播报药名、功效、过期日等信息。
据悉,精灵火眼目前已能识别117套图书、4万个药盒。此外,精灵火眼还具备一个3D虚拟形象,可提供自然交互的表情拟态动画。目前,这个虚拟形象可实现20多种拟态动画,用户触摸其不同部位,它能够产生不同的反馈和互动。
浅雪表示,天猫精灵的本质是一个家庭智能终端,将具备认知能力、理解力,执行力。未来,它不仅是一个智能音箱,还可以连接其他家电、家居产品进行智能控制。
所以在浅雪看来,智能音箱是否带屏幕并不重要,重要的是视觉认知的能力。浅雪表示,智能音箱终极形态是家庭机器人,从“听”“说”,到“视觉交互”,再到“行动力”,阿里巴巴希望通过引入视觉能力加速这种进化。
阿里巴巴人工智能实验室作为阿里巴巴智联网战略的一部分,未来的主要研究方向便是将语音交互、视觉交互、机器行动力等结合在一起,推动家庭智联网的落地。
截至目前,天猫精灵的销量已经达到200万台,连接的家用电器数量超4500万台,并累计为用户执行了9亿次任务。
|