speculative-decoding | 技能詳情 | OpenClaw Study

使用投機式解碼、Medusa 多頭與前瞻解碼技術加速大型語言模型（LLM）推論。適用於優化推論速度（1.5–3.6× 加速）、降低即時應用延遲，或在計算資源受限的環境中部署模型。涵蓋草稿模型、樹狀注意力、雅可比迭代、並行令牌生成與生產部署策略。Emerging Techniques, Speculative…

本頁屬於 OpenClaw Skills 學習體系，涵蓋技能安裝、分類導覽與實戰連結。