oobabooga-testbot插件的使用教程

HunterShenSmzh · 2024 年7 月 24 日 13:56

oobabooga-testbot
更新：oobabooga-testbot（3.5.5→3.6.0）

修复历史记录存储bug，改进工具调用格式
新增模块：向量库长期记忆系统

采用emb向量库系统，将用户输入进行分析总结，将模型上下文进行分析总结，可以通过语意试试读取记忆库中的相关数据。

emb模块使用教程：

首先还是安装最新版的toolkit

然后你得去按照上面的视觉模型教程去下个视觉模型

再然后你得去下这个m3e模型，这是embedding模型（其实有large和base两个版本，你要下哪个都行）

分别放在两个目录下像这样：

接下来，你需要在最新的懒人包环境内，运行

python main.py --model_path 模型路径(到文件夹)\\Florence-2-large-ft --embedding_model_path 模型路径(到文件夹)\\m3e-large --host 0.0.0.0

就可以使用GPU进行推理了。需要额外的2-3g显存。
要用CPU的话就加上上面一样的后缀就行。

插件里头一样，进行一下配置

注意 emb url里头

http://127.0.0.1:8000/embed

然后你就可以去正常聊天了。
正常来说emb系统会在模型聊天轮数超过你设定的基础的+5轮对话的时候开始自动处理，将上下文总结并加入数据库。
如果你开了debug模式，你应该可以看到这样的输出。