Marco de preentrenamiento visión-lenguaje que conecta codificadores de imagen congelados con LLMs. Úsalo cuando necesites generación de descripciones de im…
Marco de preentrenamiento visión-lenguaje que conecta codificadores de imagen congelados con LLMs. Úsalo cuando necesites generación de descripciones de imág...
Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.