SGLang-MUSA-M1000
SGLang-MUSA-M1000 v0.5.10发布版本面向摩尔线程 MUSA GPU 上的大模型推理服务,围绕 MUSA kernel 编译、SGLang 服务运行、MATE/TileLang 推理加速和 Qwen3/Qwen3.5 MoE 模型工作流进行了适配。
本版本包含 SGLang Python 服务端、sgl-kernel MUSA 扩展算子、MUSA .mu kernel、M1000 TileLang/MATE 预编译工作流以及服务启动、benchmark、cache 相关配置。