提供使用 SAELens 訓練與分析稀疏自編碼器(SAE)的指引,將神經網路的激活分解為可解釋的特徵。於發現可解釋特徵、分析疊加(superposition)或研究語言模型中的單義表示(monosemantic representations)時使用。Sparse Autoencoders, SAE, Mec…
提供使用 SAELens 訓練與分析稀疏自編碼器(SAE)的指引,將神經網路的激活分解為可解釋的特徵。於發現可解釋特徵、分析疊加(superposition)或研究語言模型中的單義表示(monosemantic representations)時使用。Sparse Autoencoders, SAE, Mecha......
本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。