RWKV-Runner/README_ZH.md
2023-06-03 20:28:21 +08:00

3.5 KiB
Raw Blame History

RWKV Runner

本项目旨在消除大语言模型的使用门槛全自动为你处理一切你只需要一个仅仅几MB的可执行程序。此外本项目提供了与OpenAI API兼容的接口这意味着一切ChatGPT客户端都是RWKV客户端。

license release

English | 简体中文

视频演示 | 疑难解答 | 预览 | 下载 | 懒人包

注意 目前RWKV中文模型质量一般推荐使用英文模型体验实际RWKV能力

预设配置没有开启自定义CUDA算子加速但我强烈建议你开启它并使用int8量化运行速度非常快且显存消耗少得多。前往配置页面打开使用自定义CUDA算子加速

对于不同的任务调整API参数会获得更好的效果例如对于翻译任务你可以尝试设置Temperature为1Top_P为0.3

功能

  • RWKV模型管理一键启动
  • 与OpenAI API完全兼容一切ChatGPT客户端都是RWKV客户端。启动模型后打开 http://127.0.0.1:8000/docs 查看详细内容
  • 全自动依赖安装,你只需要一个轻巧的可执行程序
  • 预设了2G至32G显存的配置几乎在各种电脑上工作良好
  • 自带用户友好的聊天和补全交互页面
  • 易于理解和操作的参数配置
  • 内置模型转换工具
  • 内置下载管理和远程模型检视
  • 多语言本地化
  • 主题切换
  • 自动更新

API并发压力测试

ab -p body.json -T application/json -c 20 -n 100 -l http://127.0.0.1:8000/chat/completions

body.json:

{
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ]
}

Todo

  • 模型训练功能
  • CUDA算子int8提速
  • macOS支持
  • linux支持
  • 本地状态缓存数据库

相关仓库:

Preview

主页

image

聊天

image

补全

image

配置

image

模型管理

image

下载管理

image

设置

image