人間の仕事を奪う「変革的AI」のおそるべき実力 プロ並みの写真や絵を生成、文章まで書ける
ここ数日、「DALL-E 2(ダリ2」)というアプリで遊んでいる。サンフランシスコにあるオープンAIという企業が開発したもので、入力した簡単な言葉が極めて写実的な画像に変換される。
ベータ期間中にオープンAIの誘いで試させてもらったダリ2(ピクサーの『ウォーリー』と芸術家のサルバドール・ダリをかけた名称だ)に私はたちまちハマってしまった。珍妙な指示、笑える指示、あるいは抽象的な指示を与えるのに何時間と没頭する私。対するダリ2は、私が出した指示を数秒のうちに画像に変換して出力した。それも、多くの場合は、恐るべきリアルさで。
「1920年代ギャングが自撮り」と入力するだけで…
例えば、これは私が「1920年代のギャングが自撮りしているモノクロのビンテージ写真」と入力したときにダリ2が生成した画像の1つだ。そして、その次は「青い毛糸で編んだヨットの高品質写真」の生成を指示したときの結果。
ダリ2は、もっと抽象的な画像も生成できる。例えば、この記事の最上部にあるイラストは「無限の喜び」という言葉でレンダリングを指示したときの出力結果だ(すごく気に入ったので、額に入れて壁に飾る予定でいる)。
ダリ2はそれが生成するアート作品だけでなく、その生成方法にも驚かされる。インターネット上にある既存の画像を合成するのではなく、「ディフュージョン(拡散)」と呼ばれる複雑な人工知能(AI)処理を通して、まったく新たに画像をつくっているからだ。
拡散は、ピクセルがランダムに並んだ状態から出発し、その画像を与えられた文字の描写に適合するまで繰り返し洗練させていくもの。その処理性能は急速に向上している。ダリ2の画像は、昨年発表されたばかりのオリジナルのダリから4倍も高精細になった。