あから2010 vs 清水市代

http://www.ipsj.or.jp/50anv/shogi/20101012.html
ディープブルーがカスパロフを破ったことを書いた論評が中学の国語の教科書に載っていたのが思いだされるニュースだ。チェスより多いとはいえ、将棋の盤面の組み合わせは有限なので、どこかの段階でコンピュータが勝つ運命にあることは想像に難くないが、もう少し時間がかかると思っていた。

とはいえ2ch界隈なんかの反応では女流は男子のアマ王者よりも弱いとかなんとか賛否両論あるようである。そこまで違うものとも思えないが・・・

この記事(http://p.booklog.jp/book/11655)なんかを見ると、コンピュータ将棋では、

が流行っているらしい。合議制は並列化の一形態ともいえるが、バギングの要領で汎化性能を上げることが目的なんだと思う。ボナンザの機械学習は最小二乗法らしい。

コンピュータの処理能力が増したとはいえ、全ての可能な指し手を何十手も総当たりで先読みすることは現状では無理だ。そこで過去の対局データから盤面の評価関数を自動的に学習する手法が流行った。コンピュータ将棋がどのような学習モデルを使ってるか詳しくは知らないが、将棋のように、離散的な行動(指し手)によって結果が全く変わってくるような問題で汎化性能の高いモデルがあるとは思えない。つまり、過去に例のない局面には弱いということになる。

そのような局面が現われた場合は総当たりや棋士の方法論をプログラム化したような古い手法の方が良い結論を出すかもしれない。そういう意味で、合議制のようなメカニズムで複数のプログラムの弱点を補い合うというのは利にかなっている。しかし今度は「どのように合議を取るのが良いのか」という新たな問題が浮上してくる。

チェスの場合は盤面の組み合わせが将棋よりもはるかに少ないため、総当たり式の力ずくの探索でうまくいった。しかしこれは人間の知能によるやりかたとは全く違っていて、これができたからといって我々が直面している様々な問題を解決できるようになるわけではなかった。

人間の直感も記憶に根差しているものなので、学習のたまものといえる。あからは機械学習を取り入れることで、ディープブルーよりもより人間的な方法で、人間を上回ろうとしているわけで、これは工学的にも科学的にも意義深いように思える(えらそう