agent-eval-framework | 技能詳情 | OpenClaw Study

使用評分量表、斷言與參考比較對 AI 代理輸出進行系統性評估。偵測隨時間出現的品質漂移。

使用評分量表、斷言與參考比較對 AI 代理輸出進行系統性評估。偵測隨時間出現的品質漂移。

本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。

English 简体中文 日本語 Español Português