constitutional-ai | スキル詳細 | OpenClaw Study

Anthropic が提唱する、自己改善によって無害な AI を訓練する手法。2 段階のアプローチ — 自己批評と修正を伴う教師あり学習、続いて RLAIF（AI フィードバックによる強化学習）。人手ラベルに頼らずに有害な出力を減らすための安全性整合に使用されます。Claude の安全システムを支えます。Sa…

Anthropic が提唱する、自己改善によって無害な AI を訓練する手法。2 段階のアプローチ — 自己批評と修正を伴う教師あり学習、続いて RLAIF（AI フィードバックによる強化学習）。人手ラベルに頼らずに有害な出力を減らすための安全性整合に使用されます。Claude の安全システムを支えます。Safe......

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。