html-content-analysis | detalle de la skill | OpenClaw Study

Esta herramienta analiza documentos HTML para extraer señales tecnológicas de meta generator tags, comentarios HTML, URLs de scripts y CSS, y patrones estr…

Esta herramienta analiza documentos HTML para extraer señales tecnológicas de meta generator tags, comentarios HTML, URLs de scripts y CSS, y patrones estructurales. Las características principales incluyen una operación extract_meta_generator que detecta entradas y extrae nombres y versiones de CMS usando patrones regex configurables y puntuaciones de confianza; una operación scan_html_comments que recupera comentarios "Powered by" o "Generated by"; además de reglas para identificar frameworks (p. ej., React implícito por Gatsby), librerías CSS y huellas comunes de scripts. Casos de uso: fingerprinting de CMS, reconocimiento de seguridad, planificación de migraciones, auditorías de SEO y contenido, y automatización de inventarios de la pila tecnológica para grandes pipelines de rastreo. Ventajas: análisis del lado del cliente rápido y no invasivo, extracción de versiones, conjuntos de patrones extensibles, salidas legibles por máquina (tecnología, versión, confianza, tecnologías implícitas) e integración sencilla en flujos de trabajo de rastreo o análisis.

Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.

English 简体中文 繁體中文 日本語 Português