LLMのトレーニング向けGPU加速データキュレーション。テキスト/画像/動画/音声をサポート。ファジー重複排除(CPU比で最大16×高速)、品質フィルタ(30以上のヒューリスティック)、セマンティック重複排除、PIIの除去、NSFW検出を備えています。RAPIDSを用いてGPU間でスケールします。高品質な学習…
LLMのトレーニング向けGPU加速データキュレーション。テキスト/画像/動画/音声をサポート。ファジー重複排除(CPU比で最大16×高速)、品質フィルタ(30以上のヒューリスティック)、セマンティック重複排除、PIIの除去、NSFW検出を備えています。RAPIDSを用いてGPU間でスケールします。高品質な学習デー...
このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。