这篇文章,可以说是我在探讨技术革新与用户体验方面的一次独特尝试。
当你点击屏幕右上角的三个点,选择“听全文”功能时,你会发现,这次听到的,不再是一个千篇一律的男声,而是我独特的音色,这是由AI克隆而来的。这一变化,虽然只是微信的一次小更新,却是AI技术的一大进步。
周末时,我登录手机端公众号后台,意外地发现公众号版本已经更新到了2.29.1。这次更新中,最让我感兴趣的是“朗读音色”这一新功能。以前,这样的功能是不存在的,而对于我这样依赖公众号的人来说,后台的任何细微变化都会被我敏锐地捕捉到。
点击“朗读音色”后,你可以创建一个属于自己的音色。系统会要求你现场朗读一句话,甚至可能会从你之前的文章中抽取片段让你朗读,这个过程非常有趣。至于为什么微信、豆包、kimi等产品在做AI音色克隆时,都选择让你现场读文本而不是上传音频,这主要是因为合规和风控的考虑。前段时间的AI音频事件和AI雷军在微博上连续7天的“骂人”事件,都提醒我们,一旦放开AI克隆音色的限制,可能会带来大量的诈骗风险。
现在这种方式,即实时录制并朗读文本上的随机句子,不仅提高了门槛,也降低了风险。完成朗读后,你的声音示例很快就会生成。
音色克隆的效果几乎完美,虽然情绪的表达还是TTS的老问题,但整体听感还算不错。这一功能目前可能只适用于新发布的文章,所以只有这篇发出来我才能确切知道我的声音是否生效。
其实,我曾幻想过公众号会通过AI技术实现怎样的赋能。虽然我想过AI创作、起标题、搜索、总结等,但没想到第一个应用会是AI音色克隆。但仔细想想,这也合情合理。公众号作为长图文领域的王者,一直存在IP化困难的问题。这是因为公众号的内容载体是冷冰冰的文字,而短视频则通过具象化的人和声音来传递情感和信息。这次更新让微信公众号也拥有了声音这一维度来传递情感。
对于我个人而言,我乐于看到微信的每一次变化特别是与AI相关的更新。当AI技术像空气一样融入我们的生活时我们就真正感受到了它的成功。而微信作为国内最大的超级APP其影响范围之广让人惊叹。未来的某一天或许所有的公众号都将拥有专属的声音那时我们或许不再关心这是否是AI因为这一切本就如此自然。