speculative-decoding | スキル詳細 | OpenClaw Study

推測デコーディング、メデューサの複数ヘッド、先読みデコーディング技術を使用してLLM推論を加速します。推論速度の最適化（1.5-3.6倍のスピードアップ）、リアルタイムアプリケーションの待機時間を短縮する場合、または限られた計算リソースでモデルを展開する場合に使用します。ドラフトモデル、ツリーベースのアテンシ…

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。