content-extract | 技能详情 | OpenClaw Study

content-extract 提供一个统一、可追溯的“URL → 可读 Markdown”上层入口，优先用低成本的 web_fetch 探针抓取正文，遇到反爬/403/内容缺失或白名单（如微信、知乎等）则自动降级调用 MinerU（通过本地 mineru-extract 脚本）进行高保真解析。核心特性包括域…

content-extract 提供一个统一、可追溯的“URL → 可读 Markdown”上层入口，优先用低成本的 web_fetch 探针抓取正文，遇到反爬/403/内容缺失或白名单（如微信、知乎等）则自动降级调用 MinerU（通过本地 mineru-extract 脚本）进行高保真解析。核心特性包括域名白名单、Token 探针以节省成本、明确的反弹机制（失败时返回下一步动作建议），以及统一的结果合同（包含 engine、markdown、artifacts、sources 与 notes）以保证溯源与审计。典型用例：写作类 skills、github-explorer、日报与任何需要把网页转为可编辑 Markdown 的场景，优势在于成本/精度平衡、流程可复用与强审计性。

本页属于 OpenClaw Skills 学习体系，覆盖技能安装、分类导航与实战链接。

English 繁體中文日本語 Español Português

content-extract | 技能详情 | OpenClaw Study

站内导航