agentic-eval | 技能详情 | OpenClaw Study

用于评估和改进 AI 代理输出的模式和技术。适用场景: - 实现自我批评和反思循环 - 为质量关键的生成构建评估器—优化器管道 - 创建测试驱动的代码精修工作流 - 设计基于评分量表或以 LLM 为裁判的评估系统 - 对代理输出(代码、报告、分析)添加迭代改进 - 测量并提升代理响应质量

用于评估和改进 AI 代理输出的模式和技术。适用场景: - 实现自我批评和反思循环 - 为质量关键的生成构建评估器—优化器管道 - 创建测试驱动的代码精修工作流 - 设计基于评分量表或以 LLM 为裁判的评估系统 - 对代理输出(代码、报告、分析)添加迭代改进 - 测量并提升代理响应质量

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português