このスキルは、ユーザーが「LLMを審判/判定者として実装する」、「モデル出力を比較する」、「評価ルーブリックを作成する」、「評価バイアスを軽減する」といった要求をした場合、または直接スコアリング、ペアワイズ比較、位置バイアス、評価パイプライン、自動品質評価に言及した場合に使用します。
このスキルは、ユーザーが「LLMを審判/判定者として実装する」、「モデル出力を比較する」、「評価ルーブリックを作成する」、「評価バイアスを軽減する」といった要求をした場合、または直接スコアリング、ペアワイズ比較、位置バイアス、評価パイプライン、自動品質評価に言及した場合に使用します。
このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。