暴风AI电视VP候光敏:人工智能在电视人机交互中的应用

AI百科3个月前发布 快创云
59 0

  摘要:无论是传统电视还是智能电视,其核心目标一致,即“如何让用户便捷地获取内容”。关键要素包括“便捷性”和“内容”。在便捷性方面,传统电视和互联网电视相似,均依赖遥控器进行人机交互;而内容则是两者的主要差异点。随着人工智能技术的飞速发展,这两个关键点上均显著提升了用户体验。

  关键词:人工智能、人机交互、深度学习、远场语音、NLP、自然语言处理、ASR、语音识别

  在探讨电视应用人工智能技术之前,需明确一些基本概念:人工智能是模拟人类智能的行为,能够模仿人的思考方式,也可能与人类完全不同。目前的研究重点在于“自我学习”。机器学习是人工智能的一个分支,而深度学习又是机器学习的一个分支。那些与人类思考方式完全不同的研究,则属于更为深奥的哲学范畴。

  无论是传统电视还是互联网电视,其目标一致,即“如何让用户便捷地获取内容”。在便捷性上,两者相似,均基于遥控器进行人机交互;而内容则是两者的主要差异点。人工智能技术的快速发展,在这两个关键点上均显著提升了用户体验。

  首先,在便捷性方面,由于人工智能技术在自然语言处理(NLP)领域已能达成90%的意图识别率,因此直接使用自然语言控制电视获取内容成为可能。这里需强调的是“自然语言”,如“给我推荐类似《教父》的欧洲黑帮电影”,而非某些品牌常用的“将音量增加20%”这样的“机械语言”。对自然语言的理解和反应是衡量一台电视机人工智能水平的关键指标之一。

  过去几年中,仅支持固定指令的语音遥控电视并不能被称为人工智能电视。真正的人工智能电视不仅能理解自然语言,还能通过联网自我学习,理解更多用户意图,越用越精准。

  在对话过程中,人类会自然地根据上下文进行交互。例如,用户首次询问“有什么好看的电影”,接下来可能会问“不要好莱坞的”或“只看今年的”。这种基于上下文的对话被称为多轮对话。能否支持多轮对话也是衡量一台电视人工智能水平的关键指标。

  此外,便利性还体现在远场收音能力上。它让用户无需拿着遥控器“按住说话”,而是在客厅的任何位置都能与电视对话。典型场景包括:“推荐一些近期好看的电影”、“鱼香肉丝怎么做?”、“明早七点提醒我去机场”。

  远场收音通过话筒阵列实现,这一技术过去一直是实验室的研究工具,直到亚马逊推出Echo智能音箱后才实现大规模应用。话筒阵列至少需要两颗话筒,目前市场上有4Mic、6Mic甚至8Mic方案。阵列能从背景噪音中感知用户说话的特定波形,通过波束成形技术精确地向用户所在方向定向收音,忽略其他方向的杂音。厂商会根据设备特性选择不同的话筒阵列,一般而言电视使用线性话筒,智能音箱则采用环形话筒。

  笔者一直关注亚马逊Echo的发展,在实际体验中发现,纯粹的语音交互目前还存在较大不足,而将远场语音应用于电视后体验更佳。例如,面对完全没有显示的智能音箱,用户基本不知道该如何操作;而面对有屏幕的电视,用户的重要性会增强许多,因为屏幕时刻提醒用户可以通过说什么来控制电视。这种交互方式被称为“视觉反馈”,并被谷歌应用于今年10月刚发布的“Google Assistant for Android TV”系统中,目前狂风AI电视的交互也采用类似形式。

  自然语言理解能力和远场语音处理能力最终将使电视机用户摆脱遥控器,在人机交互上实现巨大飞跃,这种飞跃不亚于当年苹果推出没有键盘只有触摸屏的iPhone手机。

  再说内容方面,除自然语言理解外,人工智能在个性化内容推荐上的应用更为广泛。AI能从大量用户对话和行为中抽象出用户的“画外音”,了解用户的喜好习惯,然后基于这些特征自动推荐用户可能喜欢的内容。

  有时,系统会推荐用户从未接触过的内容类型,用户会惊讶“原来这个这么好看”,他甚至自己都没有意识到这类内容会符合自己的口味。这种智能推荐已在互联网产品中广泛应用,典型代表是今日头条。

  传统的个性化内容推荐主要基于标签系统。首先运营人员要对所有内容“打标签”,如“恐怖”、“热血”、“二次元”、“都市”等,工作量巨大且准确性完全依赖于运营人员的水平;然后系统再根据用户行为对用户进行画像,抽取标签进行匹配。这个过程中产生了各种专业的推荐算法,技术人员随时调整各项参数以优化算法、提高点击率。

  基于AI的个性化推荐系统与传统推荐系统既有区别也有联系,最大的区别在于标签系统。AI推荐系统中的“标签”实际上是系统自动从内容和行为日志等记录中自动提取的,无需运营人员介入。例如从电影的元数据(主演、导演简介等)中分词提取属性标签;从用户的微博、豆瓣评论中分词提取用户的属性标签;然后依赖GPU芯片进行大规模矩阵运算将高维向量数据逐步降维最后简化到三维空间根据三维空间中的聚集情况给出推荐。原理类似于传统推荐系统中的“协同过滤”。简单来说就是如果一个人喜欢某部电影那么他的好友也可能喜欢那部电影。

  “千人千面”的个性化推荐反过来又推动了电视界面的变革。传统电视用“节目排播表”概念来编排频道用户爱看不看错过了就等下次;互联网电视则完全基于点播形式海量内容随你看找不到别怪我;基于AI的智能电视则是把传统的“人找内容”变成了“内容找人”AI把你可能喜欢的菜端到你眼前先尝后买。

  “尝”就是给用户预览完整影片中的精彩片段用短片引导用户看长片降低了用户的选择难度节省了用户的时间。

  更大的可能性:人工智能在电视的应用场景不仅限于人机交互和影视内容推荐它还能用于任何内容服务的推荐。前面提到应用远场语音改变了电视的人机交互形式因此电视界面不再受传统电视的树状菜单布局限制可以容纳更多的内容服务而且用户可以切换服务。具有人工智能特色的电视典型的应用方式如下:帮我找个八十年代的经典文艺片看看;随便放点周杰伦的歌;再买点上次买过的那种三元牛奶对再买两盒;去大鸭梨怎么走对对就是最近的那家;半小时后提示我关火;晚安(关闭家里的智能家电设备而且让电视机休眠)。可以看出应用人工智能技术的电视机已经大大超出了传统电视机的使用方式和范围。电视机能帮助用户筛选内容筛选服务帮助用户控制智能家电提醒用户备忘甚至帮用户下单购买日常用品等上述场景不是假设而是已经成为现实。电视还是电视但电视机早已不是电视机它已成为家庭助手的大屏终端而这个“家庭助手”的大脑就是人工智能。

© 版权声明

相关文章