面向LLM訓練的GPU加速資料整理與編目。支援文字/影像/影片/音訊。具備模糊去重(比CPU快16×)、品質過濾(30+啟發式規則)、語意去重、PII去識別化、NSFW偵測。透過RAPIDS在多GPU環境中可橫向擴展。可用於準備高品質訓練資料集、清理網頁資料或對大規模語料進行去重。Data Processin…
面向LLM訓練的GPU加速資料整理與編目。支援文字/影像/影片/音訊。具備模糊去重(比CPU快16×)、品質過濾(30+啟發式規則)、語意去重、PII去識別化、NSFW偵測。透過RAPIDS在多GPU環境中可橫向擴展。可用於準備高品質訓練資料集、清理網頁資料或對大規模語料進行去重。Data Processing,......
本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。