clip | 技能详情 | OpenClaw Study

OpenAI 的模型连接视觉和语言。支持零-shot 图像分类、图像-文本匹配和跨模态检索。基于 4 亿个图像-文本对进行训练。可用于图像搜索、内容审核或视觉-语言任务，无需微调。最适合通用图像理解。Multimodal, CLIP, Vision-Language, Zero-Shot, Image Cla…

OpenAI 的模型连接视觉和语言。支持零-shot 图像分类、图像-文本匹配和跨模态检索。基于 4 亿个图像-文本对进行训练。可用于图像搜索、内容审核或视觉-语言任务，无需微调。最适合通用图像理解。Multimodal, CLIP, Vision-Language, Zero-Shot, Image Class......

本页属于 OpenClaw Skills 学习体系，覆盖技能安装、分类导航与实战链接。