ag-Q-45-criar-cenario-benchmark | detalle de la skill | OpenClaw Study

Ag-Q-45 é um designer de cenários para QAT-Benchmark que gera cenários comparativos (app vs baseline) seguindo a metodologia de 8 dimensões, regras anti-co…

Ag-Q-45 é um designer de cenários para QAT-Benchmark que gera cenários comparativos (app vs baseline) seguindo a metodologia de 8 dimensões, regras anti-contaminação e critérios por camada (L1–L4). Gera arquivos TypeScript organizados em scenarios/fixed/ e scenarios/rotatable/; cada cenário inclui ID (BM-XX ou BM-RXXX), prompt, dimensões alvo, critérios L1–L4 e functionalChecks. Suporta invocações parametrizadas (rotatable, reasoning, teaching, safety/domain) e produz pools: fixed (30%, 12–15, imutáveis) e rotatable (70%, 50+, diversidade de complexidade/domínio/formato). Pré-requisitos: estrutura tests/qat-benchmark/scenarios/ e cenários existentes para análise de cobertura. Integra-se com ag-Q-44 (execução) e ag-Q-41 (cenários QAT absolutos). Vantagens: reprodutibilidade, comparabilidade dual-run, controle de contaminação e geração escalável de cenários de conteúdo/IA.

Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.

English 简体中文繁體中文日本語 Português

ag-Q-45-criar-cenario-benchmark | detalle de la skill | OpenClaw Study

Navegación interna