在训练过程中,我们使用了名为 diffusion-test
的实验配置,并加载了预训练的 HifiGAN 模型,该模型来源于 pretrain/nsf_hifigan/model
路径。为了准备训练数据,我们移除了权重归一化,并从 exp/diffusion-testmodel_0.pt
恢复了模型状态。数据加载自 data/train
路径。然而,在数据加载阶段遇到了一个错误,具体是在 get_data_loaders
函数中,当尝试创建 AudioDataset
实例时出现了问题。错误信息显示,多说话者训练(Muiti-speaker training)中的 spk_id
必须是一个从 1 到 n_spk
的正整数。这个错误提示我们检查数据集中说话者ID的设置是否正确,以确保它们符合训练要求。正确的设置是确保每个说话者的ID都是唯一的正整数,并且从1开始递增。
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com