ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.
项目特点
- 对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
- 细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
- 更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
相关提示词
口语化 :[oral]
笑声:[laugh]
停顿:[break]
资源下载
项目官网:ChatTTS: Text-to-Speech For Chat
Github:https://github.com/2noise/ChatTTS
网盘下载:https://www.123pan.com/s/JUgKVv-ca1D3.html
项目最低要求:GPU 至少需要 4G 显存
官方入门指南:GitHub – xiciliu/Awesome-ChatTTS-2: 官方推荐的 ChatTTS 最佳入门指南,整理和汇总了常见问题和相关资源
云端运行:2Noise/ChatTTS · Hugging Face
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com