AI 翻唱总体步骤指南

AI百科6个月前更新 快创云
56 0

  一、数据净化:消除背景噪音

  1.   工具选择:推荐使用UVR5(Ultimate Vocal Remover),这是一款高效且开源免费的工具,擅长于人声与伴奏的分离。

  2.   操作步骤:

      a. 选择输入:从文件系统中选取待处理的音频文件。

      b. 指定输出:设定处理后的音频文件的存放位置。

      c. 配置选项:根据需求调整集成参数。

      d. 仅乐器输出:启用此功能,仅保留原曲,消除所有背景噪音。

      e. 开始处理:点击开始按钮,处理完成后,在指定位置找到净化后的音频。

  二、数据分割:调整音频长度

  1.   准备工作:创建一个新文件夹,用于存放待分割的音频文件。

  2.   操作步骤:

      a. 启动音频分割软件Slicer – GUI(Audio Slicer)。

      b. 将音频文件拖入软件界面中。

      c. 设置最小间隔为100毫秒。

      d. 设置最大沉默时长为300毫秒。

      e. 配置完成后,点击输出按钮进行分割。

  三、批量重命名:整理文件名

  1.   前期处理:首先删除未分割的原始文件。

  2.   操作步骤:

      a. 使用批处理文件(.bat)对分割后的文件进行重命名。以下是一个示例代码:

@echo off
SETLOCAL ENABLEDELAYEDEXPANSION
set /A num=0
FOR /F "tokens=*" %%i in ('dir /A-D /B /OD /TC') do (
IF NOT "%%i"=="%~n0%~x0" (
set /A num+=1
if !num! LSS 10 (
ren "%%i" "00000!num!%%~xi"
) else if !num! LSS 100 (
ren "%%i" "0000!num!%%~xi"
) else if !num! LSS 1000 (
ren "%%i" "000!num!%%~xi"
) else if !num! LSS 10000 (
ren "%%i" "00!num!%%~xi"
) else (
ren "%%i" "0!num!%%~xi"
)
)
)
ENDLOCAL
exit
``` 复制上述代码至文本文件,并更改其后缀为.bat。
执行该批处理文件即可对文件夹内的文件按编号进行重命名。

四、数据预处理:优化音频质量

1. 工具介绍:该步骤通常依赖于第三方集成的程序,其前端界面采用gradio设计。
2. 操作流程:将经过分割和重命名的文件夹放置在dataset_raw目录下,随后启动webui.bat,按照以下顺序操作:训练 -> 识别数据集 -> 数据预处理 -> 重新生成配置文件 -> 清空数据信息 -> 写入配置文件 -> 从头开始训练。此流程将确保音频数据在模型训练前的最佳状态。

五、应用训练好的数据集:实现AI翻唱(初级)
1. 操作流程简述:首先选择推理功能,随后挑选适当的配置文件并加载模型。接着上传音频文件,根据实际需求调整转换参数。这一系列操作将使你能够利用训练好的数据集进行AI翻唱的基础应用。
© 版权声明

相关文章