agent-eval-framework | 技能详情 | OpenClaw Study

使用评分量表、断言和参考比较对 AI 代理输出进行系统评估。检测随时间变化的质量漂移。

使用评分量表、断言和参考比较对 AI 代理输出进行系统评估。检测随时间变化的质量漂移。

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português