Skip to content

l15y/ai00_rwkv_server

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

82 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

💯AI00 RWKV Server

AI00 RWKV Server是一个基于RWKV模型的推理API服务器。

支持VULKAN推理加速,可以在所有支持VULKAN的GPU上运行。不用N卡!!!A卡甚至集成显卡都可加速!!!

无需臃肿的pytorchCUDA等运行环境,小巧身材,开箱即用!

兼容OpenAI的ChatGPT API接口。

100% 开源可商用,采用MIT协议。

如果您正在寻找一个快速、高效、易于使用的LLM API服务器,那么AI00 RWKV Server是您的最佳选择。它可以用于各种任务,包括聊天机器人、文本生成、翻译和问答。

立即加入AI00 RWKV Server社区,体验AI的魅力!

交流QQ群:30920262

💥特色

  • 基于RWKV模型,具有高性能和准确性
  • 支持VULKAN推理加速,不用该死的CUDA也能享受GPU加速!支持A卡、集成显卡等一切支持VULKAN的GPU
  • 无需臃肿的pytorchCUDA等运行环境,小巧身材,开箱即用!
  • 兼容OpenAI的ChatGPT API接口

⭕用途

  • 聊天机器人
  • 文本生成
  • 翻译
  • 问答
  • 其他所有你能想到的LLM能干的事

👻其他

安装、编译和使用

📦直接下载安装

  1. 直接从 Release 下载最新版本

  2. 下载模型后把模型放在assets/models/路径,例如assets/models/RWKV-4-World-0.4B-v1-20230529-ctx4096.st

  3. 在命令行运行

    $ ./ai00_rwkv_server --model assets/models/RWKV-4-World-0.4B-v1-20230529-ctx4096.st

📜从源码编译

  1. 安装Rust

  2. 克隆本仓库

    $ git clone https://github.com/cgisky1980/ai00_rwkv_serve.git
    $ cd ai00_rwkv_serve
  3. 下载模型后把模型放在 assets/models/路径下,例如assets/models/RWKV-4-World-0.4B-v1-20230529-ctx4096.st

  4. 编译

    $ cargo build --release
  5. 编译完成后运行

    $ cargo run --release -- --model assets/models/RWKV-4-World-0.4B-v1-20230529-ctx4096.st 

📝支持的启动·参数

  • --model: 模型路径
  • --tokenizer: 词表路径
  • --port: 运行端口

📙目前可用的API

API 服务开启于 3000 端口, 数据输入已经输出格式遵循Openai API 规范。

  • /v1/chat/completions
  • /chat/completions
  • /v1/completions
  • /completions
  • /v1/embeddings
  • /embeddings

📝TODO List

  • 支持text_completions和chat_completions
  • 支持sse推送
  • 添加embeddings
  • 集成基本的调用前端
  • batch serve 并行推理
  • int8量化支持
  • SpQR量化支持
  • LoRA模型支持
  • LoRA模型热加载、切换

👥Join Us

我们一直在寻找有兴趣帮助我们改进项目的人。如果你对以下任何一项感兴趣,请加入我们!

  • 💀编写代码
  • 💬提供反馈
  • 🔆提出想法或需求
  • 🔍测试新功能
  • ✏翻译文档
  • 📣推广项目
  • 🏅其他任何会对我们有所帮助的事

无论你的技能水平如何,我们都欢迎你加入我们。你可以通过以下方式加入我们:

  • 加入我们的 Discord 频道
  • 加入我们的 QQ 群
  • 在 GitHub 上提交问题或拉取请求
  • 在我们的网站上留下反馈 我们迫不及待地想与你合作,让这个项目变得更好!希望项目对你有帮助!

Thanks

cryscan 感谢cryscan的辛勤付出,为项目做出了杰出的贡献。

感谢下面项目的编写者们做出的杰出工作

感谢下面又好看又有眼光又优秀的杰出人士对项目的支持和无私奉献

  • QQ 群

    image

  • Github

  • Discord

我们很感激您的帮助,我们很高兴能与您合作。

Stargazers over time

Stargazers over time

BTW

About

rwkv rust server

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • CSS 90.1%
  • Rust 6.1%
  • JavaScript 1.9%
  • HTML 1.9%