2016-05-25 1万年未来の棋士 AlphaGoは13層のニューラルネットを使っています。各層は192のチャネルがあり、その評価値を変化させ最適化していきます。 最初に過去のプロの棋譜を学習させた後、コンピュータが自分でつくった局面から学ぶ「強化学習」と呼ばれる手法で3千万局の自己対局をさせて、強くしていったそうです。 人間が1日10局指して1年で3000局ですから、1万年分指したことになります。 1万年未来の棋士と勝負したら、人間が勝つのは容易ではないでしょう。 そこが既に人間にとってのハンデです。