AI探索实践17 – 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

AI百科2个月前发布 快创云
26 0

  大家好,欢迎关注公众号,让我们一起探索AI的奇妙世界。如果这篇文章对你有所帮助,请点赞、分享,并在下方留言分享你的见解。

  本文将介绍一种方法,无需编程和专业技能,就能以极低的成本快速制作出数字人视频。

  制作数字人视频的过程大致分为三步:

  1. 创建视频内容:输入文稿内容,确定数字人将要播放的内容。
  2. 生成数字人:通过工具,结合视频内容生成数字人形象并播放语音。
  3. AI换脸:利用AI工具,将数字人的脸替换为你指定的形象,以便以你的品牌形式进行宣传。

  首先,你需要准备一段视频播放的文字内容。这些文字可以是产品介绍、课程讲解、游戏攻略等任何你希望推广、让大家了解的内容。当然,你也可以利用AI来生成这段文字。

  例如,我使用了约500字的内容,制作了一个大约1分30秒的视频。接下来,我们使用剪映App对视频进行简单的处理。剪映是一款功能强大的视频编辑软件,个人免费版就足够我们实现制作目的。在剪映中,点击“开始创作”,进入创作页面。

  选择顶部工具栏中的“文本”,并点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。然后,将准备好的文字内容替换默认文本内容。

  视频内容准备就绪后,将为数字人提供语音播放的内容,并生成与文字内容相对应的口型。在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象。当我选择一个数字人形象时,软件会立即播放出该数字人的声音。判断声音是否符合需求后,点击右下角的“添加数字人”,将选择的数字人添加到当前视频中。剪映将根据之前提供的内容生成对应的音视频,并添加到当前视频文件的轨道中。

  左下角会提示你渲染何时完成。之后,你可以点击预览按钮查看生成的数字人效果。接下来,可以直接删除先前导入的文本内容,因为视频中的音频已经包含文字内容了。删除文本后,为了让视频更美观,我们可以为视频增加背景图片。点击左上角的“媒体”菜单,并点击“导入”按钮选择本地的一张图片上传。

  我选择了一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号将这个图片添加到视频的轨道上(会覆盖数字人)。为了让图片在整个视频播放时都显示,可以点击轨道最右侧的竖线向右拖拽,直到视频的最后端对齐。此时背景图片所在的轨道是选中状态。如果没选中鼠标点击一下这个轨道即可。在显示区域拖动背景图的一个角将其放大到适合的尺寸比如覆盖视频窗口并将数字人拖动到合适的位置。

  点击“文本-智能字幕-识别字幕”然后点击“开始识别”。软件会自动将文字智能分段并形成字幕。至此数字人视频就完成了点击右上角的“导出”按钮导出视频以作备用。

  如果你希望将数字人的脸替换成自己的面孔可以使用另一个工具进行换脸操作。有多个AI产品可以实现换脸效果这里介绍一个开源免费的解决方案:facefusion。开源地址:https://github.com/facefusion/facefusion 这个软件需要python环境以及安装视频解码器等多个依赖的软件因此如果你想在本地电脑上安装需要一定的编程知识可以参考网站:https://docs.facefusion.io/ 说明来进行本地的安装。由于facefusion的运行推理计算的速度非常依赖于GPU因此如果本地计算机没有GPU或者GPU显存较小那么执行的速度将会非常缓慢。我的笔记本是Macbook Pro M1 16GB内存集成GPU对一个1分30秒的视频换脸需要1300秒因此无论从环境配置还是计算速度来说都不推荐本地化安装实现。另一个可选的方案是利用云厂商已经提供好的大模型运行环境和计算能力比如阿里云的PAI和AutoDL注:这种方案需要产生一定的费用。我选择的是AutoDL其官网是:https://www.autodl.com/home 4.2.1 租赁GPU服务器 注册完成后在算力市场中选择你能接受价格的算力服务器建议选取GPU配置更高的算力设备。4.2.2 通过模型镜像启动GPU服务器 在算法社区查找facefusion镜像:这些已经制作好的镜像包含了模型所需要的各种环境软件的安装可以直接启动facefusion点击右下角的创建实例按钮创建实例并启动这个实例将会看到在容器实例列表中刚才创建的实例点击快捷工具中顶部的JupyterLab打开这个工具这个工具提供了执行python程序的说明和控制服务器的终端使用我们需要通过终端来启动facefusion此处是唯一需要一点技术能力的地方点击顶部的+号选项卡我们新打开一个终端窗口:点击终端区域启动一个终端的选项卡:在打开的终端窗口中输入3条命令做3件事情:查看文件列表输入ls并按回车显示当前位置所在目录下的文件列表进入facefusion目录输入cd facefusion并按回车进入程序目录启动facefusion输入:python run.py –execution-providers cuda cpu 启动程序注意:后面的参数–execution-providers cuda cpu非常重要如果不加cuda则默认不使用GPU能力推理将非常慢当出现这个提示信息时说明启动成功:4.2.3 打开facefusion软件 打开facefusion软件需要返回实例列表点击自定义服务按钮这样我们才能够通过web浏览器来访问facefusion提供的UI界面:在facefusion软件上上传准备好的图片视频后在右侧可以看到预览效果点击下方的开始按钮执行换脸处理执行完成后在输出的位置会出现处理后的视频你可以导出到本地最后来看看效果:通过剪映制作的数字人视频变脸后的数字人视频最终花费:时间:大约10分钟制作数字人视频:免费数字人换脸:约0.8元如上图所示GPU服务器此次整体运行时长所需花费0.97元facefusion软件运行其实只占服务器运行时长的一部分所以换脸的成本应该在0.8元左右。

© 版权声明

相关文章