Google DeepMind、YouTubeショートの検索に視覚言語モデル(VLM)の「Flamingo」提供

Google DeepMindは、系列のYouTubeの「YouTubeショート」の検索に単一視覚言語モデル(SimVLM)「Flamingo」が採用されたと発表した。動画の最初のフレームを説明するテキストを生成する。これをメタデータとすることで膨大な量のショートの検索機能が強化されたとしている。…

このサイトの記事を見る

タイトルとURLをコピーしました