evaluation | 技能详情 | OpenClaw Study

当用户要求“评估代理性能”、“构建测试框架”、“衡量代理质量”、“创建评估量表”,或提到 LLM 作为评判、 多维评估、代理测试或代理管道的质量门时,应使用此技能。

当用户要求“评估代理性能”、“构建测试框架”、“衡量代理质量”、“创建评估量表”,或提到 LLM 作为评判、 多维评估、代理测试或代理管道的质量门时,应使用此技能。

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português