speculative-decoding | 技能详情 | OpenClaw Study

使用投机式解码、Medusa 多头和前瞻解码技术加速大型语言模型（LLM）推理。适用于优化推理速度（1.5–3.6× 加速）、降低实时应用时延或在计算受限环境中部署模型。内容涵盖草稿模型、基于树的注意力、雅可比迭代、并行生成令牌以及生产部署策略。Emerging Techniques, Speculative…

本页属于 OpenClaw Skills 学习体系，覆盖技能安装、分类导航与实战链接。