安装
git clone https://github.com/FunAudioLLM/CosyVoice.git
git submodule update --init --recursive
** 基本上按照官方的方法就前面下载部分是没遇到什么问题
pip install -r requirements.txt
测试
python example.py
现在的example.py是cosyvoice3的版本,只启用了3的example,试了下之前1和2的模型,还没深入对比,只是使用也无所谓了。
情感指令词
[breath] 插入呼吸声音
<strong></strong> 强调说明
<laughter></laughter> 笑着说
[noise] 表示噪音或杂音
[laughter] 插入笑声
[cough] 插入咳嗽声
[clucking] 模拟鸡叫声
[accent] 标记或模拟带有某种口音的语音
[quick_breath] 表示快速的呼吸
[hissing] 插入嘶嘶声
[sigh] 插入叹气声
[vocalized-noise] 表示口头上的杂音或模糊的语音
[lipsmack] 插入嘴唇发出的“咂嘴”声音
[mn] 插入“嗯”的声音
问题解决记录
1
raise ErrorDuringImport(path, sys.exc_info())
pydoc.ErrorDuringImport: problem in cosyvoice.flow.flow_matching - ModuleNotFoundError: No module named 'matcha.models'; 'matcha' is not a package
export PYTHONPATH=third_party/Matcha-TTS
ImportError: TorchCodec is required for load_with_torchcodec. Please install torchcodec to use this function.
pip install torchcodec # 没有安上gpu版本的,不知道为什么
ERROR: Could not find a version that satisfies the requirement torchcodec (from versions: none)
ERROR: No matching distribution found for torchcodec

1万+

被折叠的 条评论
为什么被折叠?



