イーロン・マスクが出資する非営利団体Open AIは、言語AI「GPT-3」の開発などで知られています。GPT-3は人間並みに自然な文章を生成するだけでなく、自然言語を用いたプログラミングを可能にするのではないかと期待されてきました。
Open AIがこのGPT-3を画像生成に応用し、開発したのが「DALL-E」です。このAIでテキストから画像を生成する様子を、テック系YouTuberのマーカス・ブラウンリー(MKBHD)氏が実演しています。
*Category:テクノロジー Technology|*Source:Marques Brownlee ,CNBC
「Dall-E」はインターネット上にある120億枚の画像とそのキャプションからなるデータセットで訓練されています。ちなみにこのDall-Eという名称は、スペインの画家ダリと「Wall-E」をかけ合わせたものです。
MKBHD氏が「A blue apple in a bowl of oranges(オレンジのボウルに青いりんご)」と入力すると、こんな画像が生成されました。
「An elderly kangaroo(年老いたカンガルー)」と入力するとこんな感じ。
まるで本物の写真のようで、顔つきや姿勢も年老いたカンガルーのように見えます。
「A teddy bear doing surgery on a grape in the style of a 1990s cartoon(1990年代のアニメ風の、ブドウを切り取っているテディベア)」という難しい指示でも……
細かい部分にほころびは見えますが、ほとんど完璧な漫画風のイラストが完成しました。
「A kooikerhondje using a camera on a movie set(映画のセットのカメラを使うコーイケルホンディエ)」と、犬種を間違ったスペルで書いても、それらしい画像を生成しました。
さらにMKBHD氏がテストを重ねていくと、Dall-Eは人間のような芸術センスと「創造性」の片鱗も示しました。
オリジナルサイトで読む : AppBank
イーロン・マスクが投資する「画像生成AI」がApple Carを予測した衝撃の結果