羽生善治王位が人工知能や棋士の決断について語ったこと

羽生善治王位が人工知能棋士の決断について語ったこと

 将棋を始めとしたボードゲームの世界が激動しています。長くコンピューターには不得手と考えられていた囲碁で今春、コンピューターが人間のトップに勝ちました。日本では羽生善治王位が、コンピューターと棋士が対戦する電王戦の出場者を決める叡王戦に初めてエントリーしました。勝ち進めば来春、羽生王位とコンピューターの世紀の対局が実現します。第57期王位戦北海道新聞社主催)第3局を翌日に控えた8月8日、羽生王位が札幌での北海道政経懇話会で「決断力を磨く」と題して講演しました。棋士の思考方法や人工知能棋士の関係、棋士の未来について語ったその詳報をお伝えします。(取材・構成 電子メディア局 田中徹)=本紙記事は8月9日朝刊
棋士の戦略。3段階の思考
 よく「棋士は何手くらいを読むのですか」と質問されます。単純ですが、難しい質問です。理由は、あまり数えていないからです。必ずしも先を読んでいるわけでもありません。
 棋士は最初に直観を使います。将棋は一つの場面(局面)で平均80通りの指し手があると言われています。それを直観で2、3手に絞っています。残りの可能性は最初から考えていません。あらゆる手をしらみつぶしに考えていては、日が暮れてしまいます。蓄積した経験と照らし合わせて、ここが中心ではないかな、急所、要点ではないかなということから、3つくらいの手を選びます。直観というのはやみくもではなくて、経験や学習の集大成が瞬間的に現れたもの、と言えば分かりやすいと思います。
 次に読みに入ります。先を読む、未来を予想、シミュレーションするわけです。ここで、あっという間に数の爆発という問題にぶつかってしまいます。指し手の可能性は、足し算ではなく掛け算で増えていきます。3手に対してそれぞれに3手、さらに3手と増えていき、10手先だと3の10乗、約6万弱の可能性になってしまいます。コンピューターにとっては一瞬ですが、人間にとっては現実的ではありません。最初に9割以上の選択肢を捨てているにもかかわらず、10手先を読むことは想像以上に難しいことです。
 3番目に大局観を使います。逆の意味は「木を見て森を見ず」。具体的な一手、飛車を動かすとかではなく抽象的なこと、最初から現在までを総括し、先の戦略、方針を考えるわけです。大局観のメリットは、無駄な思考、考えを省略できることです。ここでは攻めていった方がいいという大局観があれば、攻める選択肢だけを集中して考えればよくなります。
 棋士は、この直観、読み、大局観の3つを使って考えます。世代によってその比重、割合は変わってきます。10~20代の若い時、読む力や記憶力、計算力、瞬発力が強いですから、それを中心に。年数を経て経験を積むと直観や大局観といった感覚的なものを重視する傾向があります。これは良い悪いではなく、山登りで言えば北から登るか、南から登るかの違いです。方法論として、どちらも有力と考えられます。
■コンピューターとボードゲーム。「アルファ碁」は人間の思考方法に近い
――北海道政経懇では7月、日本の人工知能研究の先駆けで、コンピューター将棋研究の第一人者、公立はこだて未来大の松原仁教授が「人工知能は世の中をどう変えるか」と題して講演した。
 前回の松原先生と重複するかもしれませんが、最近は将棋の世界でも電王戦とか叡王戦とか、コンピューター・ソフトが著しく進歩しています。たぶん10年くらい前、松原さんに言われて印象的だったのは「ハードが進歩すれば将棋ソフトは自動的に強くなりますよ」ということでした。計算処理能力が1秒間で100万手、1億手となれば、強くなりますよと。その時にはそういうものかな、と思っていたのですが、いよいよリアリティーを持ってきました。将棋と類似したものとして、チェスや囲碁があるのですが、それぞれのコンピューター・ソフトの進歩や進化は、将棋と少し違います。
 チェスで有名なのは、1997年、IBMが開発したディープ・ブルーが当時の世界チャンピオン、ロシアのガリカスパロフを破ったことです。ディープ・ブルーがどう強くなったかといいますと、データの力とハードの力によってです。ディープ・ブルーには大量の棋譜、当時でも100万局以上のデータベースが搭載されていました。プラスして1秒間に2億局面を考えられるハード。過去の膨大なデータと計算処理能力の組み合わせです。20年ほど前ですからソフトはそれほど洗練されていませんでしたが、データとハードの力で人間に勝ちました。
――5月に放送されたNHKスペシャル「天使か悪魔か 羽生善治 人工知能を探る」で、羽生王位はロンドンのディープマインドなどを取材した。ディープマインドはグーグルが買収した人工知能開発を行う会社で、囲碁ソフト「アルファ碁」が世界トップ棋士を破った。「アルファ碁」で使われたのが、ディープラーニング(深層学習、DL)という人工知能研究から生まれた機械学習の方法だ。コンピューターに大量のデータを与えて膨大な数の試行錯誤を繰り返させることで、対象の特徴やパターンを抽出、コンピューターがより最適と思われる結果や解を出力するようになる。画像や手書き文字の認識、自動運転、ニュースサイトのキュレーション(目利き、取捨選択)サービスなどあらゆる分野で実用化、応用が進んでいる。
 NHKスペシャルディープマインドを取材して、いろいろな話を聞きました。(囲碁ソフトの発展には)ハードの力もあるのですが、ディープ・ブルーのような、いわゆる力任せ(計算)ではなく、学習をさせることによって強くなったということでした。機械学習や深層学習、DLと言われているものです。
 「アルファ碁」は、すごく強いプログラムで、2段階で学習しています。基礎となるのは人間同士の対局の棋譜です。韓国のプロが使っている囲碁サイトのデータを使い、プロと同じような手が打てるように学習させました。プロと同じような手が打てるということはイコール、プロと同じように強くなるということです。そして、次は機械同士で練習を始めます。機械の学習のすごいところは、1秒で1試合、24時間、練習ができるということです。人間の概念とは違うスピードで強くなっていきます。
 データを積み上げて強くなるだけではなく、アルファ碁のすごいところは、ヒューリスティック、つまり正しい答えとは限らないけれども、概算によってだいたいの答えを求めることができるようになったことです。ヒューリスティックは、最初に話しました大局観とほぼイコール、大ざっぱな概念をつかむということです。「アルファ碁」の強さはハード、データの力もあるのですが、人間とかなり近い思考プロセスがあることと言えます。
■将棋ソフトの独自の発展。オープンソース
――オープンソース化とは、プログラム(ソースコード)を公開して、誰もが自由に利用、改良できるようにすること。OSのリナックスが有名。将棋ソフトでは、2005年に保木邦仁氏(札幌東高出身、現・電気通信大学大学院准教授)が開発・公開した当時の最強ソフト「ボナンザ」が後にソースコードを公開した。これにより、現在までボナンザをベースにしたソフトが多数開発されている。ボナンザは2007年、渡辺明竜王と対局している。
 日本の将棋ソフトの発展は、チェスや囲碁とは別の道をたどっています。幸か不幸かIBMやグーグルのような巨大資本が入ってきて強くなったわけではなく、個人がソフトを洗練させて強くなってきました。将棋のデータベースはせいぜい10万局くらいで、(アルファ碁のように)それほど巨大なハードを使う例はほぼありません。
 プログラムを洗練させて強くすることは、何が難しいのでしょうか。コンピューターにたくさん計算させるのは簡単です。一番難しいのは、正確に局面を評価させることです。評価関数と言い、一つの局面を見た時に先手と後手どちらが有利か、数値化するわけです。ここでプログラマーが切磋琢磨(せっさたくま)して細かい修正を重ね、ソフトは強くなっています。
 また、将棋ソフトが進歩してきた背景に、オープンソース化があります。市販の将棋ソフトは10年くらい前から売れなくなっています。強くなりすぎて、ビジネスとして成り立たなくなったのです。しかし、将棋ソフトを開発するプログラマーは、ほかに仕事を持っているにもかかわらず、驚異的な情熱で将棋ソフト開発に時間をかけ強くしています。
 もう10年くらい前、保木さんがつくった「ボナンザ」がオープンソースになって、それを土台にしてさらに強いプログラムがつくられ始めました。将棋ソフト同士の対局を見ると、ここ2、3年で驚異的に強くなっています。大きな理由が、このオープンソース化です。
 例えば、プロ野球北海道日本ハムファイターズ大谷翔平選手がいます。160キロの速球を投げられますが、彼がオープンソースになっているような世界を想像してください。大谷選手は1人しかいませんが、プログラムはいくらでもコピーして改良できます。大谷選手が各球団にそろうようになったら、それまでエース級だった選手が先発から外れるわけです。こうして、将棋ソフトは、自分の想像よりもはるかに速いスピードで強くなっています。
叡王戦へのエントリー。変わる美意識
――棋士とコンピューターが戦う電王戦。羽生さんは、対戦する棋士を決める第2期叡王戦にエントリーし、段位別予選で本戦トーナメント進出一番のりを決めた。本戦で勝てば、2016年春の電王戦で、世紀の対決が実現する。
 私は今度、叡王戦に参加します。優勝すればソフトと対戦することになります。一つ思っていることとして、機械学習の話をします。NHKの番組では、DLが最もホットな部分なので、これに関して質問することが多かったのです。専門家の人が口をそろえて言うのは、DLで何が起こっているのかは分からない、ということです。最初にこういう問題設定をし、こういうものができました、できたものは素晴らしいパフォーマンスを発揮します。しかし、最初と出来上がった後の間で何が起こって進化・進歩・発展したのかはまったく見えない、ブラックボックスと表現しています。将棋でも同じことが起こるでしょう。ブラックボックスが起こった時に、人間が解説、解明、あるいはそれを取り入れることができるかどうかが、将棋の世界で起こっている、行われていることと言ってもいいと思います。
 これは、ただ強くなる、進歩するというだけの話ではなく、美意識の問題とも非常に重なってきます。将棋は盤面のいい形、美しい形、あるいは愚形とか、形の良しあしをきめ細かく見極める力によって強くなります。しかしコンピューターは、そういう美意識とは合わない、違和感のある形の手を提示します。そういうものに出会った時、アレルギーを感じて取り入れない、というのも考え方です。
 コンピューターの考えを取り入れると、美意識そのものが変わる側面も出てくるでしょう。技術革新でそういうものを取り入れることは当たり前になっていくと思います。データベースや、インターネットを取り入れるのと同じく、これからの子供はそういうものを道具として使い、強くなるのかなと思っています。
■五感を使うことの大切さ。勝負師が考える運やツキ
 記憶と言っても短期、長期の記憶は違うと言われています。電話番号を聞くと、聞いた瞬間は覚えられます。しかし、5分、10分で忘れてしまいます。記憶するには24時間以内に復習するのが大事と言われています。
 パソコンの将棋データベースを使えば、早送りして1分間で1試合見ることができます。大量の情報データを分析できますが、簡単に見たものは簡単に忘れてしまい、思い出すことができません。これは本当に大切なことで、5年後、10年後も記憶しておかなくてはならない時はノートに書いたり、盤に駒を並べたり、誰かに話をしたりするようにしています。
 大切なのは五感を使うことです。人間は目から視覚からかなりの情報を得ていますが、本当に深く記憶する時には、手や口や鼻や耳…さまざまな感覚器を使うのが大事だと思っています。
 それから、運やツキの問題があります。目に見えず、科学的に証明されたわけではないのですが、勝負の世界に身を置いていると、そういうものもあるのではないかな、と思います。運やツキはヒトを魅了し、惹きつけてやみません。ギャンブルや占いがいつの時代も流行るのは、とても楽しいことだからではないでしょうか。
 しかし、あまりにツイているか、いないかを考えると、最善を尽くすことがおろそかになってしまいますから、あまり気にしないようにしています。そうは言っても、気になるのが人情です。私が、結果がでない時どうしているか、話をしてみたいと思います。
 不調なのか、実力なのか見極めることが大切です。将棋の世界では「不調も3年続くと実力」という言葉があります。自分自身の実力、シビアであるけれども努力や研鑽が足りなかった、ということがあります。そうではなく不調というケースがあります。やっていることは間違いないけど結果が出ないと。きょう始めて明日、結果が出るということほとんどなく、ある程度のタイムラグがあって実を結ぶということがあります。そういう時にやっていることを変えてしまうと、元の木阿弥になってしまいます。とは言え、気分は落ち込みやすいので、気分を変えることをするようにしています。趣味を始めたり、部屋の模様替えをしたり、服装を変えたり、朝早く起きてみたり、日常の生活の中に小さな変化やアクセントをつけることで、不調を乗り切ります。
 胸突き八丁という言葉があります。富士山の8合目あたり、そこから先は肉体も精神もきつい状況になります。(目標に対して)もう8、9合目だといいところ。自分なりの手応えを感じているから、プレッシャーを感じるのです。ですから、プレッシャーがかかることによって、才能や能力が花開きます。自分も公式戦で時間に追われている時、深く考えています。「待った」のできない時、そういう中で集中力を高めています。これは、上達、進歩することと近いことではないかと思っています。小さな子どもでも、遊んでいる時は集中しています。でも、飽きっぽいから持続しません。そこで、3分とか5分、練習することで、長い時間、集中できるようになり、気が付くとうまくなっていたのかな、となるのではないでしょうか。集中力が長く続くようにすることは、上達と密接に関係していると思っています。
棋士の未来。変わることと変わらないこと
 将棋はかつて家元制度があった伝統的な世界です。服装や駒の並べ型にその名残があり、良き伝統として今も続いています。一方で、盤上の戦術的なことは21世紀くらいからだいぶ変わってきました。まずはデータベースの登場。私が10代後半のころは、自分でファイルを作って矢倉とか四間飛車とか分類していました。データベースができて、その必要がなくなりました。検索すればいろんな条件ですぐ探せます。
 そうしたデータが体系的に分析されるようになったのが15~20年前です。それまで、データ分析というのは将棋界ではちょっと蔑まされる、軽視される傾向がありました。将棋は人間と人間の勝負、個性と個性のぶつかり合いである、データに頼るのはねじり合い、未知の局面に対応する自信がないから、などと言われました。データの蓄積というのは瞬間的な効果はないのですが、時間が経つと威力を発揮するようになりました。
 その次に起こったのは、インターネットの登場でした。以前、棋士になるには大都市に住む子供が圧倒的に有利でした。ライバルにも良い先生にも恵まれるわけですから、東京や大阪の子供が棋士になりやすかったのです。しかしネットによって、そんな地域差がなくなりました。ネットに練習や対局できる場ができ、強くなることができます。いまの20代後半、30代前半で活躍している棋士は、ネット道場みたいなところでたくさん練習して強くなってきた人たちです。
 実は私も、ネットでそういう人たちとかなり練習しました。ネットではお互い、本名は名乗りませんが、相手がプロか素人か、ちょっとやれば分かります。ひどい時は、相手が誰かまで分かります。以前、あるタイトル戦の前日にウォーミングアップとしてネットで対局したら、相手が次の日の対局相手だった、ということがありました。これはまずいなと思って、それ以来、ネット対局はしないようにしているのですが。
 ネットによって地域差がなくなってきました。これは、間違いのない現実で、将棋の世界で起こった技術革新です。いまの時代、大量のデータや情報・理論から打ち出される結論と、自分自身の持っている動物的な野生の勘みたいなものから導き出される決断を、車の両輪のように使い分けていくことが大事だと思います。
 40-50年後、棋士という職業が絶対にあるとはちょっと言い切れないという心配も本当にあります。例えば、フラッドゲード(コンピュータ将棋連続対局場所、floodgate)というサイトがあって、24時間、コンピューター同士が対局しています。見ようと思えば、レベルの高い試合がいつでもどこでも見られるようになっています。とは言え、あすからの王位戦も是非、注目してほしいと思っています。