爱诗科技创始人王长虎: 生成更长AI视频是接下来要做的事情

AI百科5个月前更新 快创云
51 0

  《科技前沿》6月15日消息,近日,在2024北京智源大会上,一位创始人指出,当前AI视频生成产品主要局限于3至5秒的短视频,尽管延长视频长度会伴随误差增大,但这仍是未来发展的方向。作为通用人工智能的关键领域,AI视频生成自去年以来取得了显著进步,催生了多款热门应用。然而,该领域仍面临诸多挑战,如视频时长限制和输出质量差异。

  此次大会于6月14日至15日在北京中关村展示中心举行,汇聚了AI行业的精英,共同探讨了AI视频生成的历史脉络、最新技术进展、未来趋势及所面临的挑战。会上,一位资深专家回顾了AI视频生成的发展历程,将其分为三个主要阶段:初期依赖检索技术完成视频制作,随后发展到部分生成阶段,以及当前热门的仅凭图片生成视频的技术。特别是自2014年视频生成技术起步以来,随着生成对抗网络(GAN)的兴起,该技术才真正走向实用。2023年,众多视频生成工具和产品如雨后春笋般涌现,其中Sora的推出尤为引人注目。

  关于Sora的贡献,该创始人强调其验证了AI视频生成的规模定律,即模型规模扩大与高质量数据增加成正比,进而提升生成效果。当高质量数据增加4至32倍时,生成质量将显著提升。

  面对未来挑战,该专家建议首先需优化运动建模和场景理解,以提高AI生成视频的成功率。同时,考虑到当前技术限制主要聚焦于短时长视频,未来发展方向将涉及如何生成更长的视频内容,并有效管理误差。此外,当前AI视频生成多聚焦于单镜头场景,而实际应用往往要求多镜头组合。因此,如何在模型中有效表达和应用镜头语言成为另一大挑战。

© 版权声明

相关文章