obliteratus | 技能詳情 | OpenClaw Study

使用 OBLITERATUS 從開放權重的 LLM 中移除拒絕（refusal）行為——採用機械可解釋性技術（差異均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等），在保留推理能力的同時切除安全護欄。包含 9 種命令列（CLI）方法、28 個分析模組、跨 5 個計算階層的 1…

使用 OBLITERATUS 從開放權重的 LLM 中移除拒絕（refusal）行為——採用機械可解釋性技術（差異均值 diff-in-means、SVD、白化 SVD、LEACE、SAE 分解等），在保留推理能力的同時切除安全護欄。包含 9 種命令列（CLI）方法、28 個分析模組、跨 5 個計算階層的 116...

本頁屬於 OpenClaw Skills 學習體系，涵蓋技能安裝、分類導覽與實戰連結。