obliteratus | 技能详情 | OpenClaw Study

使用 OBLITERATUS 从开放权重的 LLM 中移除拒绝(refusal)行为——采用机械可解释性技术(差异均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同时切除安全护栏。包含 9 种命令行(CLI)方法、28 个分析模块、跨 5 个算力等级的 1…

使用 OBLITERATUS 从开放权重的 LLM 中移除拒绝(refusal)行为——采用机械可解释性技术(差异均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同时切除安全护栏。包含 9 种命令行(CLI)方法、28 个分析模块、跨 5 个算力等级的 116...

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português