GPT-4Vで“動画”を分析 米Microsoftが「MM-VID」発表

米Microsoft Azure AIに所属する研究者らは、GPT-4で手書きの文字や図を読み取れるようになる技術「GPT-4V(ision)」を利用してビデオの内容を詳細なスクリプトに変換し、大規模言語モデルに高度なビデオ理解能力を与えるという研究報告を発表した。…

このサイトの記事を見る

タイトルとURLをコピーしました