当您有评估者、评分量表(rubric)、评审提示、评分工作流或将大型语言模型作为裁判的设置,并且需要判断其是否模糊、主观、不一致、过于宽松或容易被操控时,请使用此工具。当用户说“这个评分量表是否过于主观”、“裁判会保持一致吗”、“这能被钻空子吗”、“校准裁判”或“审计这个评估提示”时,也应使用。
当您有评估者、评分量表(rubric)、评审提示、评分工作流或将大型语言模型作为裁判的设置,并且需要判断其是否模糊、主观、不一致、过于宽松或容易被操控时,请使用此工具。当用户说“这个评分量表是否过于主观”、“裁判会保持一致吗”、“这能被钻空子吗”、“校准裁判”或“审计这个评估提示”时,也应使用。
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。