vits-simple-api 本地调用 windows搭建教程

"需要本地搭建vits-simple-api的原因

前言
需要本地搭建vits-simple-api的原因
· 目前插件市场所有的vits类插件,似乎只有open-vits可以做到多语言,我想要听中文以外的语言
· 其他vits插件限制语音模型,他们的语音模型我都不喜欢
· 语音调用他人的,可能不会很稳定,希望可以寻求本地搭建的方法
· open-vits插件默认的t4的API失效了,用不了了啊
· 我想试试自己搭建,不想依赖他人
… …

如果你只是需要 一个可以用的open-vits的API,
那你可以试试填入这个
https://artrajz-vits-simple-api.hf.space

https://dfsteve-vits-simple-api.hf.space

https://moemoechu-vits-simple-api.hf.space

更多API见【 Spaces - Hugging Face
并且其他地方内容也可以参考


/
/
总之,由于各种主观的、客观的、不可抗力的因素,我们不得不 本地搭建一个vits-simple-api来用

我是新人,不会搭建,大佬救命.jpg

大佬救命啊!我对于vits搭建什么的一窍不通啊!
image

image
image
省略*省略

所以本教程面向初次搭建vits-simple-api,但是有一定电脑基础的新人,
十分清楚地帮助你搭建自己的vits-simple-api~
(需要有一定电脑基础哦~如果啥也不会还是安心用公开的API吧)

=======================================================

————Vits-Simple-Api 本地调用 搭建 教程————

=======================================================

第一步

下载最新的release压缩包(大约1.35GB)

前往
· 1. Release 0.5.3 · Artrajz/vits-simple-api
·· ·或者
· 2.百度网盘下载 vits-simple-api.7z-百度网盘

下载好后找一个剩余空间较多的盘
image
解压到该硬盘即可(预留至少2GB)
image
解压好会得到一个【 vits-simple-api】 文件夹

第二步

下载最新的代码 !
https://github.com/Artrajz/vits-simple-api/archive/refs/heads/main.zip

从上方链接 下载最新的代码,下载好之后得到一个压缩包
解压后得到一个 vits-simple-api 文件夹
image
打开该文件夹,按下Ctrl +A 全选,并且回到第一步打开的 【 vits-simple-api 】文件夹
在 【 vits-simple-api 】文件夹,按下Ctrl + V ,然后选择 全部替换
image

即可更新到最新的代码

第三步

【 vits-simple-api 】文件夹内,有一个【模型下载链接.txt】
image
打开该txt文件,前往模型下载地址 下载模型
这里我们以【 CjangCjengh/TTSModels (github.com)】为例
/
下图每一个红框内代表一个模型
image
/
一个模型应该有两个内容:

分别为【.pth】文件和【.json】文件

/【.pth】文件一般不会小于100MB,【.json】文件一般不会超过1MB/

这里下载一对【.pth】文件和【.json】文件即可,
这里我们以第一个模型为例:

下载模型

第四步

打开【vits-simple-api】文件夹内,
打开Model文件夹
image

为了防止不同模型混淆,最好是在Model文件夹内再套上一个子文件夹
如下图
image

这里我们以下载的1374_epochs.pth和config.json为例,

这两个文件被我放到了 Model文件夹下新建的 Nene 文件夹

image

第五步

配置文件config.py

image

最好是用VScode等编辑器打开该文件(python缩进问题)

在配置文件里的 MODEL_LIST 处,修改内容
就是把前面的注释删掉,然后改对地址
image

按照第四步中我下载了【“D:\open-vits\vits-simple-api\Model\g\365_epochs.pth” 和

“D:\open-vits\vits-simple-api\Model\g\config.json”】

我们在此处修改的内容,MODEL_LIST 就应该修改为

[ABS_PATH + “/Model/Nene/1374_epochs.pth”, ABS_PATH + “/Model/Nene/config.json”],

修改完之后不要忘记保存(或者按下Ctrl+S就保存好了)

image

第六步

启动vits-simple-api

image

在windows下我们可以直接双击运行该文件夹内的start.bat

运行后出现内网地址,即代表运行成功(如下图)
image

(如果有相应的REEOR,就更新代码(教程第二步),或者注释掉一部分模型尝试启动(可能是刚刚的模型对应的 config.json 不正确,或者问问GPT(?) )

在命令提示符窗口按下Ctrl键,然后鼠标左键点击命令提示符窗口内的【http://127.0.0.1:23456

会自动打开浏览器该网页。

需要注意,在该页面按下【Ctrl+C】就会停止运行哦~

第七步

在打开的【http://127.0.0.1:23456】网页内,我们可以在最下面看到两行字

那两行的内容 就是我们需要的

回到koishi内的open-vits插件


在打开的【http://127.0.0.1:23456】网页内,最下面看到两行字
第一行对应的是

  1. 在vits服务器地址输入
    http://127.0.0.1:23456
    /

第二行对应的是

  1. http://127.0.0.1:23456/voice/speakers
    可以看到所有角色和角色对应的id

    这里的speaker-id 填入对应角色 id(是一个正整数)

之后重新开启插件/重载插件

第一次生成语音都比较慢
但之后就相较而言 都快很多

在UI网页里如果生成不了,可以尝试像这样配置选项

最后

如果遇到问题,请查看运行框内是否有相关日志
这或许会大大地帮助你解决问题

(大多是 模型 / config.json / config.py / 代码旧了 等问题)

3 个赞

有什么不会的都可以查查小学哦

2 个赞

好像用不了了哩!!!

2 个赞

这与该API的访问性有关,
如果你使用不了的话,建议更换API、自建API或者使用其他的语音插件

94ba0da94767cf83f2af3d2aae94ccc8

1 个赞

/
可以试试其他的API

https://artrajz-vits-simple-api.hf.space

https://dfsteve-vits-simple-api.hf.space

https://moemoechu-vits-simple-api.hf.space

/

2 个赞

第一个链接似乎用不了了

不过后面两个还挺好使

1 个赞

下载新的代码跟原来的不一样了,没有这些代码# Fill in the model path here
MODEL_LIST = [
# VITS
# [ABS_PATH + “/Model/Voistock/547_epochs.pth”, ABS_PATH + “/Model/Voistock/config.json”],
# HuBert-VITS (Need to configure HUBERT_SOFT_MODEL)
# [ABS_PATH + “/Model/louise/360_epochs.pth”, ABS_PATH + “/Model/louise/config.json”],
# W2V2-VITS (Need to configure DIMENSIONAL_EMOTION_NPY)
# [ABS_PATH + “/Model/w2v2-vits/1026_epochs.pth”, ABS_PATH + “/Model/w2v2-vits/config.json”],
# Bert-VITS2
# [ABS_PATH + “/Model/bert_vits2/G_9000.pth”, ABS_PATH + “/Model/bert_vits2/config.json”],
]
运行start.bat会显示这个错误
Traceback (most recent call last):
File “G:\AI\vits-simple-api-windows-gpu-v0.6.0-alpha.11\app.py”, line 4, in
import ngrok
ModuleNotFoundError: No module named ‘ngrok’
请按任意键继续. . .

2 个赞

只需要把模型放到 models 目录,现在的 vits-simple-api 会自动加载模型

2 个赞

gsv不行吧需要手动填参考音频和路径

2 个赞

那可能是新版本改了,我用的这个版本可以在 webui 设置参考音频,但我忘记是什么版本了,要回家看一下才知道

3 个赞

但是要提前准备好音频和音频的文字内容吧写在配置文件里到时候可以直接选的gsv1

3 个赞

能自己添加参考音频吗?我用的教程推荐的模型,但是只有日语是自然的,中英文都会很别扭,很大的口音。

2 个赞

gsv可以的

2 个赞