mamba-architecture | 技能詳情 | OpenClaw Study

相較於 Transformers 的 O(n²)，此狀態空間模型具備 O(n) 複雜度。推論約快 5×，支援百萬 token 序列，無需 KV 快取。選擇性 SSM，具有硬體感知的設計。Mamba-1（d_state=16）與 Mamba-2（d_state=128，多頭）。在 HuggingFace 上提供…

相較於 Transformers 的 O(n²)，此狀態空間模型具備 O(n) 複雜度。推論約快 5×，支援百萬 token 序列，無需 KV 快取。選擇性 SSM，具有硬體感知的設計。Mamba-1（d_state=16）與 Mamba-2（d_state=128，多頭）。在 HuggingFace 上提供 1...

本頁屬於 OpenClaw Skills 學習體系，涵蓋技能安裝、分類導覽與實戰連結。