旬のトピック、最新ニュースのマピオンニュース。地図の確認も。

DeepMindの最新AI、ルールの知識ゼロから囲碁に将棋、パックマンもマスター

2020年12月24日09時34分 / 提供:マイナビニュース

学術誌Natureに「Mastering Atari, Go, chess and shogi by planning with a learned model」というDeepMindのAI「MuZero」の研究報告が掲載された。ゲームのルールを教えてもらうことなく、囲碁、チェス、将棋、そしてミス・パックマンのようなAtariのゲームを習得し、知識のない環境で勝つための戦略をプランニングする。

MuZeroは、2015年の「AlphaGo」から始まったDeepMindの強化学習の第4弾として、2019年11月に論文発表された。囲碁プログラムのAlphaGoは棋譜や人との対局から学習して成長、当時世界最強とされた囲碁棋士を破って注目を集めた。続く「AlphaGo Zero」は棋譜や人との対局ではなく、AI同士の対戦を通じて急速に成長してAlphaGoを上回った。棋譜の蓄積や人との対局には時間とコストがかかる。膨大な訓練データの確保というディープラーニングの課題に対する成果になった。第3弾の「AlphaZero」は、1つのアルゴリズムで囲碁、チェス、将棋という異なるゲームをマスターした。

あなたにおすすめの記事

関連記事

ネタ・コラムカテゴリのその他の記事

マピオンニュース ページ上部へ戻る