Esta Skill proporciona una canalización reutilizable de carga y fragmentación de documentos en múltiples formatos para proyectos basados en LangChain. Mape…
Esta Skill proporciona una canalización reutilizable de carga y fragmentación de documentos en múltiples formatos para proyectos basados en LangChain. Mapea extensiones de archivo a implementaciones de cargadores mediante LoaderConfig y DirectoryLoader (por defecto soporta.pdf,.docx,.xlsx,.csv,.txt,.md) y permite pasar kwargs específicos del cargador. Los documentos se leen desde un directorio usando patrones glob, se cargan con informe de progreso y se dividen en fragmentos manejables con chunk_size y chunk_overlap configurables (usando RecursiveCharacterTextSplitter). La función devuelve una lista de objetos de documentos fragmentados listos para embedding, indexado o tareas LLM posteriores. Casos de uso incluyen ingestión para búsqueda semántica y generación aumentada por recuperación (RAG), preguntas y respuestas sobre documentos, resumen y ETL para analítica. Las ventajas principales son una interfaz consistente entre formatos, fácil extensibilidad y división configurable para respetar las ventanas de contexto del modelo.
Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.