音声(トランスクリプト)と映像(フレーム抽出+画像解析)の両チャネルを用いたマルチモーダルなYouTube動画解析。表示されている内容(スクリーンショット、UIデモ、図、コード、実際の操作)が発話内容と同等に重要なハウツー動画、チュートリアル、デモ、解説動画に特に有効です。ユーザーがYouTube動画を解析・…
音声(トランスクリプト)と映像(フレーム抽出+画像解析)の両チャネルを用いたマルチモーダルなYouTube動画解析。表示されている内容(スクリーンショット、UIデモ、図、コード、実際の操作)が発話内容と同等に重要なハウツー動画、チュートリアル、デモ、解説動画に特に有効です。ユーザーがYouTube動画を解析・要約...
このページは OpenClaw Skills 学習ハブの一部で、導入手順・カテゴリ導線・実践リンクを提供します。