TransformerLens 是针对 GPT 风格语言模型的机制可解释性研究的事实标准库。由 Neel Nanda 创建并由 Bryce Meyer 维护,提供用于激活检查、执行干预和探查学习到的机制的简洁接口和工具。
TransformerLens 是针对 GPT 风格语言模型的机制可解释性研究的事实标准库。由 Neel Nanda 创建并由 Bryce Meyer 维护,提供用于激活检查、执行干预和探查学习到的机制的简洁接口和工具。
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。