附录二:使用coqui-ai/TTS本地生成TTS音频
<p>目标:使用coqui-ai/TTS,实现在本地生成TTS音频。
项目开源地址:<a href="https://github.com/coqui-ai/TTS">https://github.com/coqui-ai/TTS</a></p>
<p>下面介绍使用docker启动一个TTS服务的步骤。(参考网址https://blog.csdn.net/Haulyn5/article/details/129069694)</p>
<ol>
<li>
<p>安装docker
请自行登录docker官网安装。
<a href="https://www.docker.com/">https://www.docker.com/</a></p>
</li>
<li>
<p>下载coqui-ai/TTS docker镜像
Power Shell执行以下命令,下载coqui-ai TTS docker镜像。
docker pull ghcr.io/coqui-ai/tts-cpu
这里实例是纯cpu版本,GPU版本的自行摸索。
国内拉取docker镜像可能访问不到。
我这里用的是国内的镜像源。
<img src="https://www.showdoc.com.cn/server/api/attachment/visitFile?sign=824361861c7d3382a296aa82c736eab7&amp;file=file.png" alt="" />
<a href="https://docker.1ms.run">https://docker.1ms.run</a>
下载coqui-ai TTS docker镜像有4GB多,需要时间。</p>
</li>
<li>
<p>启动镜像
Power Shell执行
docker run -it -p 5002:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts-cpu
启动镜像后进入命令行状态。
<img src="https://www.showdoc.com.cn/server/api/attachment/visitFile?sign=bad402cf16b3971f0c0db1db20424ecb&amp;file=file.png" alt="" /></p>
</li>
<li>
<p>查看可用model列表
Power Shell执行
python3 TTS/server/server.py --list_models #To get the list of available models
可以看到有一个支持中文的。
<img src="https://www.showdoc.com.cn/server/api/attachment/visitFile?sign=a96605706105e3a82e26312be65e467e&amp;file=file.png" alt="" />
最前面有支持多语言的,自行探索。</p>
</li>
<li>
<p>启动服务
Power Shell执行</p>
<pre><code>python3 TTS/server/server.py --model_name tts_models/zh-CN/baker/tacotron2-DDC-GST</code></pre>
<p>这里需要比较久的时间,要下载模型。
使用其他模型可能会因为网络无法访问下载失败,需科学上网。
<img src="https://www.showdoc.com.cn/server/api/attachment/visitFile?sign=fdbc404227eeac4b75fc3bd2d2bca32f&amp;file=file.png" alt="" />
启动后就可以访问了。</p>
</li>
<li>
<p>打开主页测试
浏览器打开http://localhost:5002/
<img src="https://www.showdoc.com.cn/server/api/attachment/visitFile?sign=d7015e87a6a6683ea46e96c30bf65876&amp;file=file.png" alt="" />
输入中文文本,测试。
注意中文文本要添加句号。</p>
</li>
<li>
<p>HTTP API测试
Api地址
<a href="http://localhost:5002/api/tts?text=你好,我是晓晓">http://localhost:5002/api/tts?text=你好,我是晓晓</a>。
会返回音频数据。</p>
</li>
<li>完毕</li>
</ol>