SAELensを使用してスパースオートエンコーダ(SAE)を訓練・解析し、ニューラルネットワークのアクティベーションを解釈可能な特徴に分解するためのガイダンスを提供します。解釈可能な特徴の発見、重ね合わせ(superposition)の解析、言語モデルにおける単義的表現(monosemantic repres…
SAELensを使用してスパースオートエンコーダ(SAE)を訓練・解析し、ニューラルネットワークのアクティベーションを解釈可能な特徴に分解するためのガイダンスを提供します。解釈可能な特徴の発見、重ね合わせ(superposition)の解析、言語モデルにおける単義的表現(monosemantic represen...
このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。