コンピューターが複雑な戦略ゲームである囲碁のチャンピオンに勝利したところだが、この偉業は人工知能(AI)研究に多大な影響を与える可能性がある。
囲碁は西側諸国では特に人気も知名度もありませんが、世界中で人気があり、約 4,000 万人がプレイしています。囲碁トーナメントが開催され、地域チャンピオンや世界チャンピオンが決定します。
そのような著名なプレイヤーの 1 人、欧州チャンピオンの Fan Hui 氏は、Google の DeepMind によって構築されたコンピューターベースの囲碁 AI である AlphaGo によって、帽子を手渡されました (5 つのゲームを圧縮する必要があります)。
DeepMind の研究とノーホールドバード トーナメントの結果は、水曜日に Nature 誌に掲載された新しい研究で詳しく説明されています。
「これは人工知能の歴史的なマイルストーンです」と、Hui と AlphaGo プログラムの間のトーナメントに出席した Nature 上級編集者の Tanguy Chouard 氏は語った。
囲碁は「チェスの中国版」とよく言われますが、その説明では、一見単純化されたゲームの正当性がほとんど伝わりません。ゲームの目的は、ボードの過半数をコントロールすることです。これは、自分の白 (または黒) の駒 (石) をボード上に配置し、それらを使って相手の駒を囲み、強制的に除去することで行います。
チェスほど複雑ではないように思えますが、そうではありません。物事を大局的に考えると、チェスの各手には約 40 の選択肢があります。 19 行 19 列の碁のグリッド上の各手には 200 の選択肢があります。
「基板上には宇宙の原子の数よりも多くの構成が存在する」とGoogle DeepMindの研究者デイビッド・シルバー氏は、同グループの成果を解説するNatureビデオで説明した。
これは、ある見方では、1997 年に IBM のディープ ブルーがチェスのチャンピオン、ゲイリー カスパロフを破ったときと同じくらい、AI において重要な瞬間です。おそらくもっと重要なことは、このブレークスルーが予定より早く到来していることです。
2年前、ワイヤードのレポート人間の囲碁チャンピオンに勝つことができるコンピュータープログラムを誰かが構築できるようになるまでには、さらに「10年ほど」かかるかもしれないと述べた。
「囲碁はAI研究の頂点だ」とGoogle DeepMindのCEO、デミス・ハサビス氏はMashableに語り、それが「抗えない挑戦」であると付け加えた。
実際、この挑戦は非常に抗しがたいもので、グーグルのシリコンバレーの主要ライバルの一つであるフェイスブックは水曜朝、自社の囲碁の達成に近づいたと主張した。AIはわずか0.1秒で囲碁トーナメントレベルの強力な手を打つことができるというものだ。 。フェイスブックの発表マーク・ザッカーバーグCEOのFacebookページで発表されたこの記事は、世界中で最も有名な科学雑誌の1つに掲載されたことを考えると、Google関連のニュースの影響を和らげるタイミングを狙っていた可能性がある。
Go-ingを取得するには
ディープ ブルーのずっと前からチェスのプログラムがあったのと同じように、囲碁のプログラムも数多くありましたが、ゲームの駒で測定される何らかのハンディキャップを適用せずに、有力な人間のプレイヤーに勝つことができるプログラムはありませんでした。
「囲碁は総当たり検索が難しい」とディープマインドのシルバー氏は説明する。これはチェスとは対照的です。チェスは、名前付きの駒、駒の値、および 64 マスのグリッドを備えており、数秒間に何百万もの手の可能性を実行する強力なコンピューターにとってほぼ完璧です。
囲碁をマスターするには、ディープ・ブルーがチェスのチャンピオンを倒すために使用したテクニック以上の何かが必要でした。
1 年前、DeepMind の AI は、古典的なビデオ ゲーム「ブレイクアウト」のプレイ方法と勝ち方を、視聴者が見ている中で学習しました。別の Nature 研究では、DeepMind が実際に多くのことを習得したことが明らかになりました。古典的な Atari コンソール ゲームフィッシングダービー、フリーウェイ、ロボットタンクなど。 DeepMind のゲーム スキルの秘訣は、それほど秘密ではありませんが、機械学習です。
Go の場合、DeepMind は再び機械学習を適用しますが、今回は 1 つではなく、「ポリシー」と「値」と呼ばれる 2 つのニューラル ネットワークを使用します。どちらも、囲碁の無数のゲームプレイの可能性を検討していますが、それは 2 つの非常に具体的な方法で行われています。
ポリシーは、考えられる手の範囲を少数の有望なものに絞り込みますが、バリューは、考えられるすべてのゲームの結論にまで追い込むことなく、ポジティブな結果を探します。シルバー氏は、ポリシーネットワークは人間の囲碁専門家による約3000万対局を調査し、最大57%の確率で手を正確に予測すると述べた。これまでの記録は44%だった。
AlphaGo は基本的に 2 つのニューラル ネットワーク間で何百万もの対局を行い、試行錯誤と強化学習を通じてより優れた囲碁プレイヤーになる方法を学習するとシルバー氏は述べています。
アレン人工知能研究所の最高経営責任者(CEO)であるオーレン・エツィオーニ氏は、人間の囲碁チャンピオンに勝つことは「当初、AIプログラムにとっては難しすぎると考えられていた」とMashableへの電子メールで書いた。エツィオーニ氏は、ディープラーニングと強化学習を組み合わせたDeepMindのソリューションをAI研究分野への「強力な技術的貢献」と呼んだ。彼は新たな研究には関与していなかった。
囲碁をプレイするエツォーニ氏も、AI研究者は「(囲碁のような)狭いタスクでは急速な進歩を遂げているが、(自然言語理解のような)広いタスクでは非常に遅れている」ことに同意する。
勝って不思議に思う
当初、DeepMind は、標準的な PC 上で動作する AlphaGo を主要な囲碁プログラムと対戦させ、500 試合中 1 試合を除いてすべて勝利しました。
そして、ヨーロッパ囲碁チャンピオンを3回獲得したFuiと対局する時が来た。 AlphaGo はすべてのゲームで勝利しました。しかし、その試合では、DeepMind はハードウェアの条件を大幅に引き上げ、AlphaGo を数百の CPU を備えた分散システムに置きました。
囲碁ヨーロッパチャンピオンのファン・ホイ氏がAlphaGoに負けた5局。試合中、ホイは人間の特性とAIを関連付けているように聞こえるいくつかのコメントをしたようです。 クレジット: 自然
「それは私のキャリアの中で最もエキサイティングな瞬間の一つでした」と、ネイチャーズ・シュアード氏は、二階のプログラマーや、敗れたチャンピオン・フイ選手の近くにいた人々からの歓声を思い出しながら語った。 「哀れな人間が殴られるのを応援せずにはいられませんでした…見ていてゾッとしました。」
ハサビス氏は、ディープマインドはAIをめぐる倫理問題をよく認識していると述べた。
「新しい強力なテクノロジーを使用する場合は、それを倫理的に使用し、責任を持って導入する方法について非常に慎重に検討する必要があります。それらの利益が少数ではなく多数に確実に得られるようにする必要があります。」と彼は言いました。
しかし、彼はまた、Mashable に対し、「私たちはまだここでゲームについて話しています。それは非常に複雑なゲームです。」とも語った。ハサビス氏によれば、AlphaGo AI は最終的には現実世界の問題よりもコンピュータベースの問題の解決に適しているという。
次の動き
とはいえ、AI の勝利が単にゲームに勝ったり、人間の対戦相手に勝利したりすることだけを意味することはほとんどありません。 DeepMind は、この分野の他の企業と同様、長期的な視野を持っており、AphaGo のようなシステムに大きな夢を持っています。
この種の AI は、「ある種の目標を達成するために次に何をすべきかを判断するための洞察と構造、長期計画と意思決定を見つける必要がある、大量のデータがあるあらゆる問題に適用できます」と DeepMind のシルバー氏は述べています。 。
近い将来、AlphaGo の賢さはスマートフォン アシスタントのようなものになる可能性があります。 DeepMind は Google の所有物であるため、最終的には Google Now が囲碁に非常に熟達することを期待する必要があるかもしれません。
DeepMind は、さらに将来的には、AI を医療診断や、より広範には気候変動などの大きな科学の問題に適用したいと考えています。
しかし、次はAlphaGoの最新の人間囲碁プロへの挑戦だ。彼の名前はイ・セドルで、おそらく囲碁史上最も偉大な棋士である(シルバーは韓国人のことを「囲碁界のロジャー・フェデラー」と呼んだ)。セドルは3月にAlphaGoと対戦する予定だ。
ディープ・ブルーがカスパロフに勝ったことが、人間がチェスをしたり、コンピューターに勝ったりすることに終止符を打たなかったのと同じように、ハサビス氏は、AlphaGoの成功が囲碁の終わりの始まりとなるとは予想していない。
「それは、到達可能な囲碁の新たなレベルを示すかもしれない」とハサビス氏はMashableに語った。同氏は、西洋の囲碁プレイヤーには強い人はほとんどいないが、Google DeepMindのAlphaGoにアクセスできれば、アジアに拠点を移さなくても世界クラスのプレイヤーになれるかもしれないと指摘した。