GPT-SoVITS
GPT-SoVITS 是一个开源黑科技,只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。
它具有以下主要特性:
-
零样本 TTS:输入 5 秒的声音样本,即可体验即时的文本到语音转换。
-
少样本 TTS:只需 1 分钟的训练数据,就可以微调模型,以提高语音相似度和真实感。
跨语言支持:可以用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。集成了一些工具,包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签,帮助初学者创建训练数据集和 GPT/SoVITS 模型。

开源地址:https://github.com/RVC-Boss/GPT-SoVITS
Bark 开源文本转语音!
Bark 是 Suno 的开源文本转语音+模型;开源协议MIT,可以用来商业化!!
github源代码:
https://github.com/suno-ai/bark
国内源代码:
http://www.gitpp.com/pythonking/bark
Bark的介绍
Bark 是由 Suno 开源的一个文本转语音(Text-to-Speech, TTS)模型,这个模型不仅限于将文本转换成语音,它的独特之处在于它是一个文本到音频(Text-to-Audio, TTA)模型,能够生成包括语音、音乐、背景噪音和简单音效在内的多种音频内容。Bark 使用转换器(Transfo

GPT-SoVITS是一个开源声音克隆工具,通过少量样本实现快速且高质量的文本到语音转换。Bark则是Suno的开源文本到音频模型,不仅能生成语音,还能创作音乐和音效,具有跨语言支持和商业使用许可。这两个模型展示了AI在音频生成领域的突破,适合商业应用和个性化内容创作。

9782

被折叠的 条评论
为什么被折叠?



