Esta Skill define las dependencias recomendadas a nivel de Python y del sistema para una canalización de procesamiento de PDF robusta. Instala las bibliote…
Esta Skill define las dependencias recomendadas a nivel de Python y del sistema para una canalización de procesamiento de PDF robusta. Instala las bibliotecas Python principales (pypdf para manipulación estructural, pdfplumber para extracción de texto con conciencia de diseño, reportlab para generación de PDF, pytesseract para integración OCR y pdf2image para rasterizar páginas) y el cliente de OpenAI para la conversión automática de PDF→Markdown. También requiere Poppler (pdftotext/pdftoppm) para renderizado y extracción de texto, qpdf y pdftk para reparación, división/fusión y linealización, y Tesseract OCR para documentos escaneados. Use este paquete de dependencias al crear flujos de trabajo automatizados para extracción, OCR, conversión, redacción (redaction) o generación de PDFs, o al integrar herramientas de conversión basadas en LLM. Las ventajas clave incluyen reproducibilidad, soporte de extremo a extremo tanto para PDFs basados en imagen como en texto, y compatibilidad con conversiones mejoradas por LLM cuando OPENAI_API_KEY está configurada.
Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.