2016-05-25から1日間の記事一覧

1万年未来の棋士

AlphaGoは13層のニューラルネットを使っています。各層は192のチャネルがあり、その評価値を変化させ最適化していきます。最初に過去のプロの棋譜を学習させた後、コンピュータが自分でつくった局面から学ぶ「強化学習」と呼ばれる手法で３千万局の自己対局…