ついに出た「動画生成AI」バカにできない出来映え 短い単語を入れるだけでショート動画を生成

ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

ほかの生成系AI技術と同じように、ランウェイのシステムはデジタルデータを、この場合は写真、動画、そして画像の内容を説明するキャプションを、分析して学習する。この種の技術を、ますます大量のデータで訓練すれば、その能力を急速に向上、拡大させられると研究者たちは確信している。近い将来、音楽やセリフが入ったプロ並みのミニムービーを生成できるようになると、専門家たちは考えている。

現在、このシステムが作り出すものを定義するのは難しい。写真ではない。アニメでもない。多数の画素の集合体がブレンドされ、リアルな動画になるのだ。同社は、プロのアーティストの作業をスピードアップできると同社が考えるほかのツールと共に、この技術を提供する予定だ。

オープンAIを含むいくつかのスタートアップは、「タイムズスクエアでスケートボードに乗るテディベアの写真」といった短い文から静止画を生成できる同様の技術をリリースしている。AIが生成する写真の急速な進歩は、新しい映像技術の未来を指し示しているかもしれない。

世界で拡散されたローマ法王の写真

先月、バレンシアガの白いパファーコートを着たフランシスコ・ローマ法王、86歳の法王にしては驚くほど流行の先端をいく写真が、ソーシャルメディアを賑わせた。しかし、画像は本物ではなかった。シカゴに住む31歳の建設作業員が、「Midjourney(ミッドジャーニー)」という人気のAIツールを使って、あっという間に拡散させたこのセンセーションを巻き起こしたのだ。

イソラ教授は、まずはカリフォルニア大学バークレー校の研究者として、次にオープンAIで、そして、MITの教授として、この種の技術の構築とテストに何年も費やしてきた。それでも、シャープで高解像度ではあるがまったくの偽物の、フランシスコ法王の画像に騙された。

「以前は、人々がディープフェイクを投稿しても、突飛だったり、あまり現実的でなかったりして、私を騙せなかった時期があった」と教授は話す。「現在は、インターネット上で目にする画像をそのまま鵜呑みにすることはできない」。

「Midjourney」は、短い文章からリアルな静止画を生成できる多くのサービスの1つだ。ほかにも、「Stable Diffusion(ステイブル・ディフュージョン)」や、1年前に公開されて写真生成の波を引き起こしたOpenAIの技術、「DALL-E(ダリ)」などがある。

次ページ動画生成の仕組み
関連記事
トピックボードAD
ビジネスの人気記事