谷歌最近在8月14日举办的“Made by Google 2024”大会上扔下了一颗重磅炸弹,他们正式推出了Gemini Live,一款智能语音AI助手。这可是个大新闻,因为它的功能和OpenAI之前推出的GPT-4o语音模式有得一拼,都是多模态智能助手,能听懂自然语言,还能识别图像、视频和语音。
举个例子,你用Gemini Live拍张清明上河图,然后让它给你讲解这幅画的历史,它会像个朋友一样跟你聊天,你随时可以打断它。而且,你还可以授权Gemini Live访问你的邮箱、地图和通讯录,让它帮你安排约会、找餐馆什么的,就像钢铁侠的AI助理贾维斯一样。
虽然OpenAI的GPT-4o语音模式早在5月就出来了,但到现在还在小范围测试,而谷歌直接就领先一步,发布了Gemini Live,抢占了安卓手机的市场。用户们都说,谷歌这次真的走在了OpenAI前面。
Gemini Live的演示现场也挺有趣的。主持人拍了个日历,问Gemini Live他有没有空去见朋友,但Gemini Live一开始没反应。主持人问了三遍,第三次才回答,说:“我发现她将于2024年11月9日来旧金山。我查看了你的日历,那段时间你没有任何活动。” 现场的人都惊呆了,主持人也汗流浃背。虽然有点小尴尬,但这也展示了Gemini Live的真实能力。
Gemini Live的使用方法很简单,长按电源按钮或者喊一声“Hey Google”,就能开始用。除了能理解语音、图片、视频,Gemini Live还能生成图片,直接用在谷歌生态应用里。谷歌说,Gemini Live已经和他们的邮件、云盘、相册、天气等原生应用集成了,未来还会扩展到Keep、Tasks、Utilities等知名应用,帮你自动完成更多日常任务。
Gemini Live不仅能听懂你的话、识别图片和视频,还能自己动手生成图片。比如说,你想庆祝生日,只需对它说一声“帮我设计一张生日庆祝的图片”,它就能立刻做出一张符合你需求的图片,而且你还能直接把这张图片用在谷歌的各种应用里。
如果你用的是安卓手机,并且订阅了Gemini Advanced英文版,那么你就可以体验到Gemini Live了。它提供了10种不同的语音选项和45种语言,让你能以自己的方式与它交流。而且,谷歌计划在接下来的几周内把Gemini Live扩展到iOS系统,并且增加更多语言,这样就能让更多的人用上它了。
谷歌的Gemini Live展示了他们在智能语音助手领域的创新和进步,可能对市场产生重要影响,尤其是在与OpenAI的竞争中。我们拭目以待,看看Gemini Live能带来什么新花样吧!
想了解更多AI行业资讯信息请关注AITOP100平台AI资讯专区:https://www.aitop100.cn/infomation/index.html