content-extract | 技能详情 | OpenClaw Study

content-extract 提供一个统一、可追溯的“URL → 可读 Markdown”上层入口,优先用低成本的 web_fetch 探针抓取正文,遇到反爬/403/内容缺失或白名单(如微信、知乎等)则自动降级调用 MinerU(通过本地 mineru-extract 脚本)进行高保真解析。核心特性包括域…

content-extract 提供一个统一、可追溯的“URL → 可读 Markdown”上层入口,优先用低成本的 web_fetch 探针抓取正文,遇到反爬/403/内容缺失或白名单(如微信、知乎等)则自动降级调用 MinerU(通过本地 mineru-extract 脚本)进行高保真解析。核心特性包括域名白名单、Token 探针以节省成本、明确的反弹机制(失败时返回下一步动作建议),以及统一的结果合同(包含 engine、markdown、artifacts、sources 与 notes)以保证溯源与审计。典型用例:写作类 skills、github-explorer、日报与任何需要把网页转为可编辑 Markdown 的场景,优势在于成本/精度平衡、流程可复用与强审计性。

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português