RWKV能否有一个类似vllm或者SGLang高效推理框架，目前框架推理速度有点感人

limoncc · 2024 年12 月 17 日 08:51

RWKV能否有一个类似vllm或者SGLang高效推理框架，
目前runer和Ai100来做服务，推理速度有点感人。

howard · 2024 年12 月 17 日 10:00

RWKV推理还没怎么优化呢，实际上能有10个正交的方向来优化，到时候肯定快的起飞来

negligee · 2024 年12 月 17 日 15:48

in todo list.

00ffcc · 2025 年2 月 18 日 15:23

Watergem · 2025 年3 月 17 日 09:01

转gguf后使用基于llama.cpp的推理框架