家人们,大模型加持的AI神器,真的救了大命了。就在几天前,我被老板要求整理AI大神何恺明在MIT的第一课内容,时间紧迫,全英文的各种专有名词让我一头雾水。幸运的是,朋友给我推荐了阿里的通义听悟,他们刚推出了新的AI音视频问答助手“小悟”,据称在业界首次支持单记录、跨记录、多语言超长音视频自由提问。
我试着上传了一个时长1小时15分钟的视频文件,结果出乎意料地好用。它不仅能一键提取出关键词、全文概要,还能自动划分好章节,并提供要点回顾,连PPT都被一一提取出来,可全部导出为pdf。
接下来,“小悟”的表现更是让我眼前一亮。它不仅能根据音视频记录给出答案,还会在最后标出引用出处及对应时间戳,点击时间戳就能自动跳转到原视频对应位置,方便返回原文求证,效率大大提升。
除了“小悟”,通义听悟还新增了更多功能。比如一键AI改写功能,可以将音视频的口语化表达快速转换为更具逻辑性、规范性和可读性的书面表达;还有思维导图生成功能,最多支持五层脑图展示,能导出为多种格式,方便分享和保存。此外,通义听悟还能自动识别音视频文件语种,无需手动选择,目前支持中、英、日、粤,即将支持韩语。
在AI大模型产品竞争激烈的背景下,阿里总能造出实用工具收获大批忠实粉丝。这得益于产品细节上的改进,如一键“回到顶部”和“回到当前播放位置”按钮,让用户无需一直滚动鼠标翻看转写内容;多级文件夹管理让用户上传的文件也能归类整理;支持将单个记录的原文、译文、笔记、PPT一次性导出等。
值得一提的是,通义听悟还发起了“高校公益计划”,所有中国大陆高校师生通过教育邮箱认证后,均可直接获赠500小时转写时长。对于经常需要处理一大堆录音、发布会视频的用户来说,这无疑是一个巨大的福利。
总的来说,通义听悟的这次升级不仅提升了效率,还增加了许多实用功能,对于学习和工作都有很大的帮助。如果你还没有尝试过这个工具,不妨去体验一下,相信你会有不一样的感受。