【GitHub项目推荐--TTS】【转载】

原创

已于 2024-02-03 14:13:15 修改 · 2.5k 阅读

·

6

·

标签

#github

于 2024-01-30 20:51:42 首次发布

GPT-SoVITS是一个开源声音克隆工具，通过少量样本实现快速且高质量的文本到语音转换。Bark则是Suno的开源文本到音频模型，不仅能生成语音，还能创作音乐和音效，具有跨语言支持和商业使用许可。这两个模型展示了AI在音频生成领域的突破，适合商业应用和个性化内容创作。

跟随虾哥项目实践，硬件选小智就对了

xiaozhi 开源方案官方适配，二次开发文档齐全

点击查看

GPT-SoVITS

GPT-SoVITS 是一个开源黑科技，只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。

它具有以下主要特性：

零样本 TTS：输入 5 秒的声音样本，即可体验即时的文本到语音转换。
少样本 TTS：只需 1 分钟的训练数据，就可以微调模型，以提高语音相似度和真实感。

跨语言支持：可以用与训练数据集不同的语言进行推理，目前支持英语、日语和中文。集成了一些工具，包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签，帮助初学者创建训练数据集和 GPT/SoVITS 模型。

开源地址：https://github.com/RVC-Boss/GPT-SoVITS

Bark 开源文本转语音!

Bark 是 Suno 的开源文本转语音+模型；开源协议MIT，可以用来商业化！！

github源代码：

https://github.com/suno-ai/bark

国内源代码：

http://www.gitpp.com/pythonking/bark

Bark的介绍

Bark 是由 Suno 开源的一个文本转语音（Text-to-Speech, TTS）模型，这个模型不仅限于将文本转换成语音，它的独特之处在于它是一个文本到音频（Text-to-Audio, TTA）模型，能够生成包括语音、音乐、背景噪音和简单音效在内的多种音频内容。Bark 使用转换器（Transfo

跟随虾哥项目实践，硬件选小智就对了

xiaozhi 开源方案官方适配，二次开发文档齐全

点击查看

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。