阿里4个月发了6个AI视频项目，最新EMO让赫本、张国荣“复活”

　　年初，英伟达科学家Jim Fan曾预言，2024年将是AI视频技术的突破之年。这一预言似乎正在逐步成真，从Sora的横空出世，到Genie、Stable diffusion video、LTX Studio等AI视频应用的不断涌现，AI视频领域正经历着前所未有的创新与变革。

　　最近，阿里巴巴也加入这一行列，推出了一款名为EMO的音频驱动肖像视频生成框架。EMO通过单一参考图像和音频输入，如说话或唱歌，能够生成表情丰富、头部动作多样的AI视频。其视频长度与输入音频的长度相对应，使得内容创作、虚拟角色开发、动画制作和学术研究等领域得以受益。

　　EMO的特点包括：

音频驱动的视频生成：根据输入的音频和参考图像，生成具有表情变化和头部动作的虚拟角色视频。
多语言支持：支持多种语言的音频输入，为不同语言的歌曲生成相应的表情和动作。
表情和动作同步：确保生成的视频中的角色表情和头部动作与音频输入的节奏和情感相匹配。
风格多样性：为不同的肖像风格赋予动态和逼真的动作，并保持角色的一致性和身份特征。
跨文化和多语言应用：在多语言和多文化背景下，为角色提供表演和独白的能力。

　　然而，EMO的发布也引发了一些关于开源问题的讨论。虽然项目发布在开源社区GitHub上，且目前GitHub Star数已达5.1k，但网友们发现项目仓库里并未包含实际代码，只有一个展示界面和视频。这一情况在GitHub Issues上引起了热议，有人质疑这不符合GitHub的开源精神，也有人认为这是刷Star混KPI的行为。不过，无论外界如何议论，EMO的推出无疑为AI视频领域带来了新的可能性。

　　值得一提的是，阿里在AI视频领域的布局远不止于此。据统计，仅在过去四个月内，阿里就推出了包括“全民舞王”在内的6个AI视频项目。这些项目涵盖了从3D模型替换视频角色到无文本标注视频的多用途生成方案等多个方面，展现了阿里在AI视频技术上的深厚积累和创新实力。

AI百科 # 开发 # 开源 # 风格

本网站上的所有资源均来源于本网站，所有网址和文章版权均归原作者所有。如有侵权行为，请将相关证明发送至以下电子邮件地址：dxsen@qq.com

阿里4个月发了6个AI视频项目，最新EMO让赫本、张国荣“复活”

ChatGPT中国小程序人工智能初体验，简单对话级水平

它是全球AI服务器的龙头，国内市占率连续5年第一

相关文章

Adobe Illustrator CS6中文版免费下载

以AI解锁春节高品质生活，多款三星AI神系列产品推荐

AI绘画进阶！爷爷都能看懂的 Midjourney 教学（附超多实战案例）

平面设计在网上有哪些接单渠道？看完不再盲目

网址

PPT模板、PP案例、PPT课件免费下载网站

【官网】闪剪

怪兽AI数字人

蝉镜

慧播星·百度电商数字人直播

音视频内容 AI

热门网址

Huawei Enterprise: Accelerate Industrial Intelligence

快写红薯通AI

畅问AI

慧星云

新壹科技

星火网文助手

滴文

标书制作

AI小说家

百度作家平台

阿里4个月发了6个AI视频项目，最新EMO让赫本、张国荣“复活”

ChatGPT中国小程序人工智能初体验，简单对话级水平

它是全球AI服务器的龙头，国内市占率连续5年第一

相关文章

Adobe Illustrator CS6中文版免费下载

以AI解锁春节高品质生活，多款三星AI神系列产品推荐

AI绘画进阶！爷爷都能看懂的 Midjourney 教学（附超多实战案例）

平面设计在网上有哪些接单渠道？看完不再盲目

网址

PPT模板、PP案例、PPT课件免费下载网站

【官网】 闪剪

怪兽AI数字人

蝉镜

慧播星·百度电商数字人直播

音视频内容 AI

热门网址

Huawei Enterprise: Accelerate Industrial Intelligence

快写红薯通AI

畅问AI

慧星云

新壹科技

星火网文助手

滴文

标书制作

AI小说家

百度作家平台

【官网】闪剪