コンテンツにスキップ

AlphaZero

出典: フリー百科事典『ウィキペディア(Wikipedia)』

AlphaZeroDeepMindAlphaGo Zero使 2017125DeepMindAlphaGo ZeroAlphaZeroarXivAlphaZero24Stockfishelmo3AlphaGo Zero[1]24AIAlphaGo Zero8

AlphaZero4Stockfish[2][3]

AIAIAI

手法

[編集]

モンテカルロ木探索を使用した自己対戦によって、ディープラーニングを用いた強化学習をする。

AlphaGo Zeroとの関係

[編集]

AlphaZero (AZ) AlphaGo Zero (AGZ) AZAGZ[1]

AZ



AGZAZ

AZ

性能

[編集]

囲碁

[編集]

囲碁を8時間自己学習した後に前バージョンのAlphaGo Zeroと対戦して、AlphaZeroは60勝40敗であった[4]

将棋

[編集]

将棋プログラムelmoとの100局において、AlphaZeroは90勝8敗2分であった[4]。このとき、思考時間はチェス同様一手ごとに1分与えられた。

チェス

[編集]

AlphaZeroStockfish1AlphaZero25372[4]

AlphaZeroStockfishKomodoStockfish[4]KomodoAlphaZeroAlphaZero[5]

評価

[編集]

4: [2][6]WIREDAlphaZeroAI[7]AIJoanna BysoGoogleAI[4]

BBC[4]AlphaZero[2]

脚注

[編集]


(一)^ abSilver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI]

(二)^ abcKnapton, Sarah; Watson, Leon (2017126). Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours (). Telegraph.co.uk. http://www.telegraph.co.uk/science/2017/12/06/entire-human-chess-knowledge-learned-surpassed-deepminds-alphazero/ 2017126 

(三)^ Vincent, James (2017126). DeepMinds AI became a superhuman chess player in a few hours, just for fun. The Verge. https://www.theverge.com/2017/12/6/16741106/deepmind-ai-chess-alphazero-shogi-go 2017126 

(四)^ abcdef'Superhuman' Google AI claims chess crown. BBC News. (2017126). http://www.bbc.com/news/technology-42251535 2017127 

(五)^ Google's AlphaZero Destroys Stockfish In 100-Game Match - Chess.com. Chess.com. https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match 2017127 

(六)^ Badshah, Nadeem (2017127). Google's DeepMind robot becomes world-beating chess grandmaster in four hours. The Times. https://www.thetimes.co.uk/article/google-s-deepmind-alphazero-becomes-world-beating-chess-grandmaster-in-four-hours-hcppp9vr2 2017127 

(七)^ Alphabet's Latest AI Show Pony Has More Than One Trick. WIRED. (2017126). https://www.wired.com/story/alphabets-latest-ai-show-pony-has-more-than-one-trick/ 2017127