Guía experta para entrenamiento Fully Sharded Data Parallel con PyTorch FSDP — sharding de parámetros, precisión mixta, descarga a CPU, FSDP2
Guía experta para entrenamiento Fully Sharded Data Parallel con PyTorch FSDP — sharding de parámetros, precisión mixta, descarga a CPU, FSDP2
Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.