OpenAI 将视觉与语言连接的模型。支持零样本图像分类、图像-文本匹配和跨模态检索。基于约4亿图文对训练。在无需微调的情况下可用于图像搜索、内容审核或视觉-语言任务。最适合通用图像理解场景。
本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。