聪明好音质——小豹AI音箱体验

AI百科15小时前发布 快创云
3 0

  如此前所说,我们很快又见面了。😄 闲言少叙,前一篇已经说了很多。值得一提的是,文末有个笑话,别忘了笑一笑哦!😊


  最近一两年,搭载不同硬件和软件平台的产品层出不穷。这次我参与众测的是一款名为小豹AI的产品。那么,这款产品到底有多智能?又有哪些精彩之处呢?让我为大家一一解答。

1. 外观和做工

  拿到快递的第一感觉是——重!作为一个俗人,我觉得重的物品往往质量更好,尤其是音箱。包装比较简单,顶盖上有小豹AI音箱的字样。正面是音箱的图片,背面则是各种Logo,看上去应该是合作的相关方。

  打开包装后,可以看到被包覆的小豹音箱,移除包装后就能见到小豹AI音箱的本体了。配件部分只有一个,两页很简单的说明书。电源是90度弯头设计,27W供电。说明书也颇为简洁,一张是关于产品的一些参数以及保修卡,另一张则是以图表方式展现了语音命令卡。

  小豹AI音箱的整体尺寸大概有100mm直径,120mm高度,但重量不小、感觉很瓷实。顶面是小豹AI音箱的输入/输出界面,分布了四个按键(音量控制,Mic开关和主开关),六个Mic圆孔和一个环状的LED显示灯(图形化输出界面,用来展示小豹音箱的状态)。音箱底部则是电源的输入端,90度插头刚好隐藏在这个角落。

2. 功能展示

  连接过程需要通过APP完成。网络配置过程很容易,小豹AI音箱会自己捕捉到附近信号最强力的SSID然后询问是否要连这个,并输入密码。如果需要音乐则需要登陆到QQ音乐,剩下的就是告诉小豹你的想法了。

  声纹部分,第一次我尝试失败了,而且放弃的时候程序提示我是错误的。清掉APP后再次尝试,可以录制声纹,但声纹的主要功能是用来快捷支付。如果声纹识别可以比较靠谱的话,能不能把“小豹小豹”这个命令提示符去掉呢?🤔

  控制和显示部分:调整音量时,圆形LED灯会以不同深浅的蓝色来表示音量的大小。和小豹AI音箱对话时,LED也会以不同深浅的蓝色来显示声音的方向(时间很短,所以拍照只能在模拟比较近的位置)。需要Internet连接时,LED会一直以橙色光旋转。

  APP端则分为了几个界面,但涉及到功能的较少,大多数都是引导性的介绍。语音控制部分可以实现这些功能,比如选择内容(谁的歌,什么歌,或者什么节目),内容控制(上一首和下一首,循环播放),设备控制(声音大小,蓝牙开关,休眠等),以及询问比如天气等。

3. 挑战

  关于中文语音识别的题外话:前几天刚送走了一个不像葡萄牙人的葡萄牙同事(据说欧洲人少吃辣,也少吃内脏一类,这位同事吃辣吃的甚欢),在我们一起吃日式料理的时候他说起了关于学习中文的囧事。他说韩语好写不好读,日语好读不好写,中文……有TMD不好读又不好写。其实简言之,对于中文不仅要判断出来语音还要判断出来语义还要结合上下文。猜测AI开发团队也有像我一样无聊的人——给小豹准备了这三个问题的答案——你是谁、你从哪里来、你要到哪里去……

  从简单的开始尝试:霉霉的Shake it off。从语音识别可以看出来我发音还是很准的只是不知道为什么没有断句啊。第二个是关于推断的:比如我很喜欢梁静茹的歌也很喜欢光良的歌那么问题就来了如果我点《勇气》出来的会是谁呢?逻辑上如果正在听《第一次》或者《爱你不是两三天》换成《勇气》应该是不同人的。我为了强化一下人物属性先点了“光良的《第一次》”然后“换成《童话》”然后“换成《勇气》”前奏一起还是梁静茹的……第三个是关于控制的:想听梁静茹的歌单曲循环然后再命令切换下一首会是另一个人的么?结果是……不会的但如果点了某个人的某首歌比如光良的《童话》跳出循环的时候就会变成另一个人的另一首歌。小豹应该自己有个List。第四个是关于记忆的:比如我点了《夜空中最亮的星》然后要听女生版或者别人唱的那么小豹的反应如何?小豹基本上男女不分应该是属性上的问题……男声版的《勇气》小豹也找不到……第五是外号和译名这个也很常见比如霉霉的歌或者老鹰乐队的加州旅馆实际上加州旅馆和Hotel California找到的是两首歌——加州旅馆找到的是某年墨尔本演唱会的录音Hotel California找到的是专辑版本然后我恶趣味的说了下“Eagles的Hotel California” 由于太高小豹Hold不住了……第六是中文挑战了。我问了两个问题的翻译“中国完胜日本”和“中国完败日本”。实际上看来小豹的翻译水平还是有待提高的……最后我让小豹帮我搜索了一下想要的专业内容比如金风风电在2017年的装机容量或者上海到石家庄的机票结果很清晰风电这个太专业了机票太复杂了看来后期会有所更新。

  总结:对于小豹AI音箱体验还是很神奇的。首先要说的是小豹的音质是真心不错的我很喜欢用来听流行音乐或者一些音频内容再合适不过。语音控制方面小豹的中文语音识别还是比较准的英语部分还需要学习。不过如果距离略远比如3m+就需要比较大的声音或者两次才能唤醒小豹李健也被听成过吕健这个距离对于土豪来说可能有些近了但对于一般用户来说还是够了。AI方面很明显我的测试主要集中在了音频方面并没有搭配设备对于音频的检索、播放、控制和一些逻辑我觉得已经做得很到位了一些日常助理工作小豹也算得心应手。如果APP端能结合语音反馈回来可显示的结果不知道会不会更有意思。不足之处也有一些最重要的是这个声音为啥不可调呢?高德地图都有志玲姐姐的声音……最后的最后给大家讲个笑话:最近项目来了一批又一批的外国同事做支持都是欧洲的吃饭非常是问题好在我们接待的这批大部分什么都吃还能吃辣的难度小多了然后来了个Boss智能产品玩的很66一路从魔都靠Google翻译和司机聊了一路来了之后就把Google翻译安利给了所有人第二天吃饭团队很兴奋因为终于他们“不需要”我们用很low的英语告诉他们吃的是什么了!但你想一下他们自己还说sheep meat的时候有什么理由厌烦我们说lamp的人矫情!然后在一家不大的饭馆他们发现了满墙的菜单第一个是“牛肉拉面”Google给的解释大致是Beef noodles很兴奋然后跟我说“LEE我们今天自己点!!”然后第二个是“红烧牛肉烩面”第三个是“红烧牛肉面”第四个反正也是牛肉什么面Google给的全是Beef noodles……你能想象到他们被打击的样子么?就像是到考试的时候作弊小条没有被老师发现自己却发现NND带错了科目!

© 版权声明

相关文章