pure-trm-trainer | スキル詳細 | OpenClaw Study

Hermes上で純粋なTRMコントローラのトレーニングワークフローを構築・実行します。これには、TRMのプレイログからのコーパス組成、イベントログ、推論トレース、正規化されたJSONLデータセット、ルーターのQLoRAトレーニング、および汎化レベルを探索するヒルクライミングループが含まれます。Codexがクロ…

Hermes上で純粋なTRMコントローラのトレーニングワークフローを構築・実行します。これには、TRMのプレイログからのコーパス組成、イベントログ、推論トレース、正規化されたJSONLデータセット、ルーターのQLoRAトレーニング、および汎化レベルを探索するヒルクライミングループが含まれます。Codexがクロス環...

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。

English 简体中文 繁體中文 Español Português