AlphaGoは13層のニューラルネットを使っています。各層は192のチャネルがあり、その評価値を変化させ最適化していきます。 最初に過去のプロの棋譜を学習させた後、コンピュータが自分でつくった局面から学ぶ「強化学習」と呼ばれる手法で3千万局の自己対局…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。