面向LLM训练的GPU加速数据清理与编目。支持文本/图像/视频/音频。具备模糊去重(比CPU快16×)、质量过滤(30+启发式规则)、语义去重、PII脱敏、NSFW检测。通过RAPIDS在多GPU环境下可伸缩。可用于准备高质量训练数据集、清理网页数据或对大规模语料进行去重。Data Processing, N…
面向LLM训练的GPU加速数据清理与编目。支持文本/图像/视频/音频。具备模糊去重(比CPU快16×)、质量过滤(30+启发式规则)、语义去重、PII脱敏、NSFW检测。通过RAPIDS在多GPU环境下可伸缩。可用于准备高质量训练数据集、清理网页数据或对大规模语料进行去重。Data Processing, NeM......
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。