OpenAI 的通用語音識別模型。支援 99 種語言,提供轉錄、翻譯成英文與語言識別功能。六種模型尺寸,從 tiny(39M 參數)到 large(1550M 參數)。可用於語音轉文字、Podcast 轉錄或多語言音訊處理。最適合用於穩健的多語言 ASR。
OpenAI 的通用語音識別模型。支援 99 種語言,提供轉錄、翻譯成英文與語言識別功能。六種模型尺寸,從 tiny(39M 參數)到 large(1550M 參數)。可用於語音轉文字、Podcast 轉錄或多語言音訊處理。最適合用於穩健的多語言 ASR。
本頁屬於 OpenClaw Skills 學習體系,涵蓋技能安裝、分類導覽與實戰連結。