training-llms-megatron | スキル詳細 | OpenClaw Study

NVIDIA Megatron-Core を用いて高度な並列化戦略で大規模言語モデル(2B~462Bパラメータ)を学習します。モデルが1Bパラメータを超える場合、GPU効率を最大化したい場合(H100で約47%のMFU)、またはテンソル/パイプライン/シーケンス/コンテキスト/エキスパート並列化が必要な場合に…

NVIDIA Megatron-Core を用いて高度な並列化戦略で大規模言語モデル(2B~462Bパラメータ)を学習します。モデルが1Bパラメータを超える場合、GPU効率を最大化したい場合(H100で約47%のMFU)、またはテンソル/パイプライン/シーケンス/コンテキスト/エキスパート並列化が必要な場合に使用...

このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。

English 简体中文 繁體中文 Español Português