slime-rl-training | スキル詳細 | OpenClaw Study

slime（Megatron+SGLangフレームワーク）を用いた強化学習によるLLMのポストトレーニングに関するガイダンスを提供します。GLMモデルのトレーニング、カスタムデータ生成ワークフローの実装、またはRLのスケールアップのためにMegatron-LMとの密な統合が必要な場合に使用してください。Rei…

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。