knowledge-distillation | スキル詳細 | OpenClaw Study

教師モデルから生徒モデルへの知識蒸留を用いて大規模言語モデルを圧縮します。性能を維持したまま小型モデルをデプロイする場合、GPT-4の能力をオープンソースモデルへ移行する場合、あるいは推論コストを削減する場合に有効です。温度スケーリング、ソフトターゲット、逆向きKLD、ロジット蒸留、MiniLLMのトレーニン…

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。