Meta 的 86M 參數提示注入與越獄檢測器。為 LLM 應用過濾惡意提示和第三方資料。檢測率(TPR)99%+,誤報率(FPR)<1%。速度快(GPU 上 <2ms)。多語言支援(8 種語言)。可部署到 Hugging Face 或以批次處理方式用於 RAG 的安全防護。Safety Alignment,…
Meta 的 86M 參數提示注入與越獄檢測器。為 LLM 應用過濾惡意提示和第三方資料。檢測率(TPR)99%+,誤報率(FPR)<1%。速度快(GPU 上 <2ms)。多語言支援(8 種語言)。可部署到 Hugging Face 或以批次處理方式用於 RAG 的安全防護。Safety Alignment, P......
本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。