Google ナレッジ グラフは検索を永久に変える可能性がある

Googleは告白しなければなりません:Googleはあなたのことを理解していません。 「米国で最も深い10の湖」と尋ねると、フレーズ内のキーワードと、それらの単語や単語のグループ化に大きな権威を持つサイトに基づいて、非常に良い結果が得られますが、Googleフェロー兼上級副社長のアミット・シンハル氏は次のように述べています。 Google には質問が理解できません。 「私たちは、ウェブ上の誰かがこれらの事柄やトピックについて書いてくれることを願っています。」

の将来グーグルただし、検索となるとまったく別の話になる可能性があります。充実した会話の中で、シンハル20 年間検索分野に携わってきた同氏は、検索を単なる言葉を超えて、エンティティ、属性、およびそれらのエンティティ間の関係の世界にまで広げる、発展途上のビジョンを概説しました。言い換えれば、Google の将来の検索エンジンは、湖の質問を理解するだけでなく、湖が水域であることを認識し、各湖の深さ、表面積、温度、さらには塩分濃度まで教えてくれるということです。

ただし、Google がどこに向かっているのかを理解するには、これまでの状況を知る必要があります。

Mashable Image

クレジット:

最終的に、Google はキーワードの調査から意味の調査に移行しました。 「『New』と『York』という単語が隣り合って現れると、両方の単語の意味が突然変わってしまうことに私たちは気づきました。」 Google は、これら 2 つの単語が一緒に出現するのは新しい種類の単語であると認識する統計ヒューリスティックを開発しました。しかし、Google は、ニューヨークが人口と特定の場所を備えた都市であることをまだ理解していませんでした。

それでも、単語の並びとそれが持つ意味には意味があるが、グーグルや最近全米工学アカデミーの会員に選出されたシンハルにとっては十分ではない。

大きな変化がやってくる

Google は現在、ページ上に表示される単語を、何かを意味し、関連する属性を持つエンティティに変換したいと考えています。これは人間の脳が自然に行うことですが、コンピューターの場合は人工知能として知られています。

大変な仕事ではありますが、取り組みはすでに始まっています。 Google は「エンティティとは何かについて社内で大規模な理解を深め、世界中にどのようなエンティティがあるのか​​、そしてそれらのエンティティについて何を知っておくべきかについてのリポジトリを構築している」とシンハル氏は述べた。

Mashable Image

クレジット:

2010 年、Google は、約 1,200 万の正規エンティティが詰め込まれたコミュニティによって構築されたナレッジ ベースである Freebase を買収しました。 1,200 万というのは良いスタートだが、シンハル氏によれば、Google は「相互接続されたエンティティとその属性の巨大なナレッジ グラフを構築する」ために大幅に投資したという。

単語ベースのインデックスからこのナレッジ グラフへの移行は、能力と複雑性を根本的に増大させる根本的な変化です。シンガル氏は、単語索引は基本的に本の巻末にある索引のようなものであると説明し、「知識ベースは単語索引に比べて巨大で、はるかに洗練され、または高度です。」

シンハル氏によれば、現在 Google は、将来のよりアルゴリズム的に複雑な検索のためのインフラストラクチャを構築中であり、その作業にはもちろん、より多くのコンピュータが含まれています。これらすべてのコンピューターは、検索巨人がナレッジ グラフを構築するのに役立っており、そのナレッジ グラフには現在「2 億以上のエンティティ」が含まれています。そのようなナレッジ グラフ (またはベース) を使って何ができるでしょうか?

最初は赤ちゃんの一歩を踏み出すだけです。この AI のような知能の証拠が Google 検索結果に現れ始めていますが、おそらくほとんどの人はそれに気づいていません。

今日の職場でのナレッジグラフ

Mashable Image

クレジット:

これが上記の従来の結果と大きく異なっているようにも、より例外的にも思えないと私が指摘すると、シンガルは、ナレッジグラフのこれに対する力を判断することは、アーティストを生後 12 か月か 24 か月のときにやった作品で判断するようなものだと警告しました。 。

Googleが、検索の主な競争相手であるMicrosoftから寄せられた主要な批判に対処しようとしているのは、いささか皮肉なことだと思われるかもしれない。ビング。ソフトウェア大手は一連の痛烈なコマーシャルを放映したが、そのコマーシャルではGoogleの名前には決して触れなかったものの、ほとんどの人が得られる検索結果が滑稽なほど文脈に欠けているものとして描かれていた。ほとんどの人は、その批判やジョークが Google に向けられたものであることを理解しており、現在 Google は結果の品質について何らかの対策を講じています。

私がシンハル氏に、Bing への批判について考えたことがあるかと尋ねたところ、Bing がその結果がリンクではなく有用な回答に重点を置いていると長い間宣伝してきたことに気づいたとき、Bing が何をしているのか、あるいはしていないのかについてはコメントできないと言って、シンハルはそらした。

また、何百万人もの人々が、Apple のおかげですでに AI 検索を利用できると信じていることも注目に値します。iPhone4Sそしてシリ、インテリジェントアシスタント。携帯電話や Web を通じてアクセスできる情報を使用して、自然言語の質問に答えます。 Google の Knowledge Graph ができることは何であれ、明らかに Siri の AI ブランドを超える必要があります。

しかし、「未来の探索」をどこまで正確に行うことができるかを正確に特定するのは、シンハルにとっては少々難しい。 「私たちは『ハドロン衝突型加速器』を構築しています。そこからどのような粒子が出てくるかは、現時点では予測できません」と彼は語った。

その一方で、シンハル氏は、スタートレックのコンピューターを構築することが自分の夢であると認めています。 Siri のように、1960 年代の SF テレビ番組に登場したこのコンピューターに事実上どんな質問をしても、インテリジェントな答えが得られます。 「社内にこのようなインフラストラクチャを導入すると、コンピューティングや AI のすべての側面が向上します」とシンハル氏は、Google が構築している膨大なナレッジ グラフについて言及し、「クエリや質問をより適切に処理できるようになり、構築に一歩近づくことができます」と述べました。スタートレックのコンピューターだ」と彼は言った。

検索を超えて

スタートレックといえば、Google のナレッジ グラフの力から恩恵を受ける可能性のあるもう 1 つのフロンティア、ロボット工学があります。シンハル氏は確かに専門家ではないが、機械エンジニアとコンピューティングの交差点に存在するロボット工学は、言語能力に関しては苦労していると指摘した。 「私たちは、ロボット工学が将来のロボットと人間の相互作用にどのように言語を組み込むかについての基礎を築きつつあると信じています」と彼は言いました。

それは刺激的な考えです。ロボットオタクである私は、シンハル氏が同意しない未来の絵を描き始めました。Google のエンティティベースの検索エンジンにアクセスできる将来のロボットは、自分たちが世話している「小さな赤ちゃん」を理解できるようになるかもしれません (What ? 赤ちゃんをロボットに預けたくないですか?) は小さく、壊れやすく、いつもお腹を空かせています。ロボットは、「常にお腹が空いている」エンティティが「赤ちゃん」であるという事実と相互参照する必要があることを認識しているため、赤ちゃんに食事を与える方法さえ知っている可能性があります。これは、ナレッジ グラフ内のエンティティでもあり、次のような属性が含まれています。 「固形物はありません。」

話しているうちに、2 億のエンティティは多いが、知識の世界は広大であることに気づきました。 Google のナレッジ グラフがすべての答えを知るには、いくつのエンティティが必要になるでしょうか?シンハルは笑いながら、数字を特定する代わりに質問を次のように展開した。