obliteratus | 技能詳情 | OpenClaw Study

使用 OBLITERATUS 從開放權重的 LLM 中移除拒絕(refusal)行為——採用機械可解釋性技術(差異均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同時切除安全護欄。包含 9 種命令列(CLI)方法、28 個分析模組、跨 5 個計算階層的 1…

使用 OBLITERATUS 從開放權重的 LLM 中移除拒絕(refusal)行為——採用機械可解釋性技術(差異均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等),在保留推理能力的同時切除安全護欄。包含 9 種命令列(CLI)方法、28 個分析模組、跨 5 個計算階層的 116...

本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。

English 简体中文 日本語 Español Português