slime-rl-training | 技能详情 | OpenClaw Study

提供使用 slime(Megatron+SGLang 框架)进行 LLM 强化学习(RL)后训练的指导。在训练 GLM 模型、实现自定义数据生成工作流或需要 Megatron-LM 的紧密集成以扩展 RL 时使用。Reinforcement Learning, Megatron-LM, SGLang, GRP…

提供使用 slime(Megatron+SGLang 框架)进行 LLM 强化学习(RL)后训练的指导。在训练 GLM 模型、实现自定义数据生成工作流或需要 Megatron-LM 的紧密集成以扩展 RL 时使用。Reinforcement Learning, Megatron-LM, SGLang, GRPO,......

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português