トランスフォーマーの O(n²) に対して O(n) の計算量を持つ状態空間モデル。推論は約5×高速で、百万トークン規模のシーケンスを処理でき、KV キャッシュは不要です。ハードウェアに最適化された選択的 SSM 設計を採用。Mamba-1(d_state=16)および Mamba-2(d_state=128…
トランスフォーマーの O(n²) に対して O(n) の計算量を持つ状態空間モデル。推論は約5×高速で、百万トークン規模のシーケンスを処理でき、KV キャッシュは不要です。ハードウェアに最適化された選択的 SSM 設計を採用。Mamba-1(d_state=16)および Mamba-2(d_state=128、マ...
このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。