sglang | スキル詳細 | OpenClaw Study

RadixAttention のプレフィックスキャッシュを用いた LLM 向けの高速な構造化生成とサービング。JSON／正規表現出力、制約付きデコーディング、ツール呼び出しを伴うエージェントワークフロー、あるいはプレフィックス共有により vLLM より最大5倍高速な推論が必要な場合に有効です。xAI、AMD、…

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。