mamba-architecture | 技能详情 | OpenClaw Study

与 Transformers 的 O(n²) 相比，该状态空间模型具有 O(n) 复杂度。推理约快 5×，支持百万 token 序列，无需 KV 缓存。选择性 SSM，具备面向硬件的设计。Mamba-1（d_state=16）和 Mamba-2（d_state=128，多头）。在 HuggingFace 上有…

与 Transformers 的 O(n²) 相比，该状态空间模型具有 O(n) 复杂度。推理约快 5×，支持百万 token 序列，无需 KV 缓存。选择性 SSM，具备面向硬件的设计。Mamba-1（d_state=16）和 Mamba-2（d_state=128，多头）。在 HuggingFace 上有 1...

本页属于 OpenClaw Skills 学习体系，覆盖技能安装、分类导航与实战链接。