用于评估和改进 AI 代理输出的模式和技术。适用场景: - 实现自我批评和反思循环 - 为质量关键的生成构建评估器—优化器管道 - 创建测试驱动的代码精修工作流 - 设计基于评分量表或以 LLM 为裁判的评估系统 - 对代理输出(代码、报告、分析)添加迭代改进 - 测量并提升代理响应质量
用于评估和改进 AI 代理输出的模式和技术。适用场景: - 实现自我批评和反思循环 - 为质量关键的生成构建评估器—优化器管道 - 创建测试驱动的代码精修工作流 - 设计基于评分量表或以 LLM 为裁判的评估系统 - 对代理输出(代码、报告、分析)添加迭代改进 - 测量并提升代理响应质量
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。