世界最強の棋士を打ち負かした囲碁AI「AlphaGo」やタンパク質構造解析アルゴリズム「AlphaFold」を開発したことで知られるAI開発企業のDeepMindが、「まったくルールの異なるゲームにも対応できるAI」を開発したことを発表しました。
さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応
世界最強の棋士を打ち負かした囲碁AI「AlphaGo」やタンパク質構造解析アルゴリズム「AlphaFold」を開発したことで知られるAI開発企業のDeepMindが、「まったくルールの異なるゲームにも対応できるAI」を開発したことを発表しました。
Open-Ended Learning Leads to Generally Capable Agents | DeepMind
https://deepmind.com/research/publications/open-ended-learning-leads-to-generally-capable-agents
Generally capable agents emerge from open-ended play | DeepMind
https://deepmind.com/blog/article/generally-capable-agents-emerge-from-open-ended-play
DeepMindが開発した囲碁AI「AlphaGo」は、世界最強の棋士を打ち負かした後も進歩を続け、2017年には囲碁だけでなく将棋やチェスの対局にも対応した「AlphaZero」が登場。このAlphaZeroを用いて「変則的なルールを学習させることで、新たなチェスのルールを作り出す」といった試みも行われています。
人間を倒してチェスのあり方を一変させたAIが「チェスの新たな可能性を広げる」ために使われている – GIGAZINE
しかし、DeepMindよるとAlphaZeroは囲碁・将棋・チェスといった複数のゲームの対応しているものの、それぞれのゲームごとに異なる学習が必要になるとのこと。DeepMindは「私たちは、AlphaZeroの限界を克服して、適応力の高いAIエージェントを開発する方法を模索しました」「新たに開発したAIは、特定のタスクに特化するのではなく、多くのタスクに広く適用できる動作を習得できます。これは、変化し続ける状況に素早く対応できるAIを開発するための重大な一歩です」と述べ、あらゆるゲームに対応可能なAIを開発したことを発表しました。
今回開発されたAIは、一人称視点のキャラクターを操作するように設計され、「旗取りゲーム」「かくれんぼ」「色合わせゲーム」といったマルチプレイゲームで比較的単純な目標を達成する方法を学習しました。AIに与えられた目標は、旗取りゲームでは「黄色い立方体を定められたエリアへ運ぶ」、かくれんぼでは「敵プレイヤーの視界に入らない」、色合わせゲームでは「同じ色の物体を近づける」というように学習するゲームごとに異なります。さらに、ゲームのステージはプログラムによってランダムに変更可能となっており、AIは自分が操作するキャラクターの周囲の色情報からステージのマップを把握する方法も学習しました。
上記の方法でAIに2000億回の学習を施した結果、AIが「特定のタスクに対して高度に最適化された動作」ではなく、「人間のように経験則で判断しているかのような動作」を示すようになったとのこと。また、AIは「マップ内の物体を用いて、他のプレイヤーの視界をさえぎる」といったマルチプレイならではの動きも習得しました。
以下のムービーでは、実際に今回開発されたAIがゲームをプレイする様子を確認できます。
Open-Ended Learning Leads to Generally Capable Agents | Results Showreel – YouTube
「かくれんぼ」では、青プレイヤーは赤プレイヤーを視界に入れることを目的とし、赤プレイヤーは青プレイヤーの視界から逃れることを目的とします。
ムービーには、マップを上から見たと映像と、青プレイヤー視点映像が表示されています。ゲーム開始直後は青色のプレイヤーが赤色のプレイヤーを視界にいれ続けていますが……
ゲーム開始からしばらく経過すると、赤プレイヤーが青プレイヤーの視界から脱出。
その後、赤プレイヤーはマップの奥へと逃げることに成功しました。
旗取りゲームでは、両プレイヤーが自分の色に合った土台の上に、2つの立方体を運び込むことを目的とします。
プレイヤーは、ビームを使って敵プレイヤーを倒すことができます。実際にゲームがスタートすると、開始直後から激しいビームの応酬。
最後には、青プレイヤーが自陣に立方体を運びこむことに成功しました。
次のゲームでは、両プレイヤーは紫色の四角錐に触れることを目的とします。
紫色の四角錐に触れる方法は多く存在。例えば大きな板状の物体で坂道を作ったり……
紫色の四角錐に物体を当てて、低い位置に落としたりと、AIがさまざまな方法で目的を達成する様子を確認できます。今回開発されたAIは、単一のゲームに特化したわけではなく、以上のゲーム全てに習熟しています。
なお、DeepMindは研究に興味を持った人に対して、研究への参加を呼びかけています。
・関連記事
世界最強の囲碁AIを開発したDeepMindが「人間を超越したFPSプレイヤー」のAIを開発 – GIGAZINE
人工知能企業DeepMindがタンパク質構造解析アルゴリズム「AlphaFold」をオープンソースで公開、誰でも利用可能に – GIGAZINE
50年前からの生物学の超難問にDeepMindの開発した「AlphaFold」がAIのパワーで道筋を示し研究が加速 – GIGAZINE
囲碁AI「AlphaGo」に敗北した世界チャンピオンが「AIを負かすことはできない」と棋士を引退 – GIGAZINE
トップ棋士に勝つ囲碁AIを開発したDeepMindはサッカーでのAI活用を目指してリヴァプールFCと協力している – GIGAZINE
DeepMindのAIは人間の医師と同等の精度で目の病気を診断できる – GIGAZINE
GIGAZINEが面倒なことは全部お任せでやってくれる超簡単な記事広告依頼の連絡、そして、実際にGIGAZINEへの広告掲載の威力がどれぐらいなのかがよくわかる媒体資料についての連絡はココをクリック!
・関連コンテンツ
Source: ギガジン
さまざまなゲームを人間のようにプレイ可能なAIをDeepMindが開発、マルチプレイにも対応