1万年未来の棋士

AlphaGoは13層のニューラルネットを使っています。各層は192のチャネルがあり、その評価値を変化させ最適化していきます。

最初に過去のプロの棋譜を学習させた後、コンピュータが自分でつくった局面から学ぶ「強化学習」と呼ばれる手法で3千万局の自己対局をさせて、強くしていったそうです。
人間が1日10局指して1年で3000局ですから、1万年分指したことになります。
1万年未来の棋士と勝負したら、人間が勝つのは容易ではないでしょう。
そこが既に人間にとってのハンデです。