agent-eval-framework | スキル詳細 | OpenClaw Study

ルーブリック、アサーション、参照比較を用いて AI エージェントの出力を体系的に評価します。時間経過による品質の変化(ドリフト)を検出します。

ルーブリック、アサーション、参照比較を用いて AI エージェントの出力を体系的に評価します。時間経過による品質の変化(ドリフト)を検出します。

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。

English 简体中文 繁體中文 Español Português