clip | 技能详情 | OpenClaw Study

OpenAI 将视觉与语言连接的模型。支持零样本图像分类、图像-文本匹配和跨模态检索。基于约4亿图文对训练。在无需微调的情况下可用于图像搜索、内容审核或视觉-语言任务。最适合通用图像理解场景。

OpenAI 将视觉与语言连接的模型。支持零样本图像分类、图像-文本匹配和跨模态检索。基于约4亿图文对训练。在无需微调的情况下可用于图像搜索、内容审核或视觉-语言任务。最适合通用图像理解场景。

本页属于 OpenClaw Skills 学习体系,覆盖技能安装、分类导航与实战链接。

English 繁體中文 日本語 Español Português