Google 検索を支える AI 技術

ユーザーが求めている情報を Google 検索がどのように理解しているのか気になったことはありますか？役立つ検索結果を提供するために必要なことはたくさんありますが、その中でも言語の理解は最も重要な能力のひとつです。AI と機械学習の進歩により、Google の検索システムはこれまで以上に人間の言語を理解することができるようになりました。本ブログ記事では、この進歩がどのようにより有用な検索結果へとつながっているかをご紹介します。

まずは、検索の歴史を振り返ってみましょう。高度な AI が登場する以前、検索が始まったばかりの時代のシステムは、単に一致する単語を探していました。たとえば「pziza」と検索した場合、まったく同じスペルミスが含まれたページがあった場合を除き、近所のピザレストランを探すには、正しいつづりを入力し直して再度検索を行う必要がありました。その後、よくある言い間違いやキーボードの打ち間違いを検出するアルゴリズムを作れるようになりました。そして現在、より高度な機械学習により、我々のシステムはより賢く想定される単語を修正候補として提案できます。

私たちは、このような AI の改善を通して、ユーザーが何を探しているかを理解する能力を絶え間なく向上させています。世界と人々の好奇心は常に変化しているため、検索を進化させ続けていくことは非常に重要です。実際に、私たちが毎日目にする検索の 15％はまったく新しいものです。想像力の限界を試すような質問に対しても、役立つ結果を表示するうえで、AI は大きな役割を果たしています。

Google の検索システムがどのように連携しているか

Google では、有用な検索結果を提供するために、初期のスペルシステムなどを含む数百のアルゴリズムを長年にわたって開発してきました。新しい AI によるシステムを導入したからと言って、既存のアルゴリズムが使われなくなるわけではありません。検索は数百のアルゴリズムと機械学習モデルで実行されており、新旧含めた全てのシステムをうまく連携させることによって検索を改善することができます。各アルゴリズムやモデルには決められた役割があり、これらをクエリごとに最適な形で組み合わせ、最も有用な検索結果を表示するために役立てています。そして、より高度なシステムのいくつかは、他のシステムよりもさらに重要な役割を果たしています。検索で実行されている主要な AI システムと、それらがどのような役割を果たしているかを詳しくご紹介します。

RankBrain：より賢いランキングシステム

Google が 2015 年に導入した RankBrain は、Google 検索にはじめて導入されたディープラーニングのシステムです。Google 検索初の AI システムであるということに加え、私たちが “言葉” と “概念” がどのように関連しているかを理解するにあたり、非常に革新的でした。これらの関係性を人間は本能的に理解できますが、コンピューターにとっては複雑な課題です。RankBrain は、検索語句が実世界の概念とどのように関連しているかをより広く理解することにより、以前は探すことができなかった情報を見つけることができるようになりました。たとえば、あなたが「食物連鎖で最上位の消費者とは」と検索した場合、Google のシステムは、様々なウェブページにおける単語の使われ方に基づいて、ここでいう「消費者」が人間の「消費者」ではなく、動物である可能性があるということを学習します。これらの単語を理解し、関連する概念と照合することで、RankBrain はあなたがいわゆる「頂点捕食者」や「高位消費者」を検索していると理解します。

こうした理解により、RankBrain は（その名が示すとおり）上位の検索結果間の順位付けに役立てられています。RankBrain は最も初期に導入したディープラーニングモデルですが、現在でも検索の主要な AI システムのひとつとして活躍しています。

ニューラルマッチング：より高度な取得エンジン

今日、最新の AI システムの多くはニューラルネットワークによって支えられていますが、ニューラルマッチングを検索に初めて導入したのは、2018 年です。Google は、“クエリ” と “ページ” の関連度をより柔軟な形で理解するために、ニューラルネットワークを活用しています。ニューラルマッチングは、クエリやページの概念のあいまいな表現を理解し、それらを照合するのに役立ちます。個々の単語ではなく、クエリまたはページ全体を把握した上で、表されている概念を表層的ではない形で理解します。たとえば「緑色　部下を管理する方法」というクエリを考えます。知り合いにいきなりこのように聞かれても困惑すると思いますが、ニューラルマッチングはこのクエリの真意を理解することができます。クエリ内の単語から連想されるより広い概念に基づき、ニューラルマッチングは検索者が個人の特性を示す４色の色分けによるタイプ診断に基づいたマネジメントのヒントを検索していることを理解できます。

このように、Google のシステムがクエリやページで表されるより広い概念を理解することで、より簡単にそれらを照合することができます。このレベルでの理解により、クエリに関連する可能性のあるコンテンツのインデックスをスキャンする際に、より広い範囲を含むことができます。大規模で絶えず変化する情報ストリームから関連ドキュメントを取得するうえで、ニューラルマッチングが不可欠となっているのはこれが理由です。

BERT：“意味” と “意図” を理解するためのモデル

2019 年に導入した BERT は、自然言語理解における大きな飛躍であり、“単語の組み合わせ” がさまざまな “意味” や “意図” をどのように表現しているかを理解するために活用されています。BERT は、個々の単語に一致するコンテンツを単に検索するのではなく、単語の組み合わせが複雑な概念をどのように表現しているかを理解できます。BERT はクエリの単語の並びを、それぞれの単語が互いにどのように関連しているかを理解できるので、クエリに含まれている重要な単語を見落としません。それがたとえ些細に見えたとしてもです。たとえば、あなたが「薬局誰か受け取り」といったような内容を検索した場合、あなたが知りたいことは、本人以外が薬を受け取ることができるかどうかだということを理解します。BERT 導入前は、「誰か」の部分が重要な点であることを理解せずに、処方箋の受け取り方法に関する結果を主に表示していました。BERT により、検索においては短い単語が時として大きな意味を持つことを理解できるようになりました。

現在、BERT は英語のほぼすべてのクエリで重要な役割を果たしています。これは、BERT システムが、関連性の高い検索結果を提供する上で最も重要な 2 つのタスクであるランク付けと取得に優れているためです。その複雑な言語理解に基づいて、BERT はドキュメントを非常に素早く関連度に基づいて順位付けできます。Google は、BERT の学習法を利用してレガシーシステムの改善も行っており、ランキングに関連するドキュメントを取得するのに役立てています。BERT は検索で主要な役割を果たしていますが、単独で機能することはありません。すべてのシステムと同様に、BERT は質の高い結果を共有するために連携するシステムの一部として機能しています。

MUM：言語理解から情報理解への移行

Google は昨年 5 月に、検索の AI 技術における最新の節目となる Multitask Unified Model (MUM) を発表しました。MUM は BERT よりも 1000 倍強力で、言語の理解と生成の両方が可能です。75 の言語と多くの異なるタスクで同時にトレーニングされたもので、情報と世界の知識のより包括的な理解を深めることができます。MUM はマルチモーダルでもあります。すなわち、テキストや画像などの複数の形式（モダリティ）にわたって情報を理解できます。

MUM 活用の試みはまだ初期の段階ですが、すでに新型コロナワクチン情報の検索を改善するために使用されており、数か月以内にはテキストと Google レンズの画像の両方を組み合わせたより直感的な検索が英語の検索に登場します。ただし、これらは特定の用途に限られており、RankBrain、ニューラルマッチング、BERT システムとは異なり、MUM は現時点では検索結果のランク付けと品質の向上には使用されていません。

検索における MUM の活用が増えるにつれ、高度な言語理解から、世界の情報をより繊細にニュアンスを汲み取った情報理解へと移行がはじまります。Google は、検索で行われるすべての改善と同様に、すべての MUM の利用に厳密な評価プロセスを適用しており、責任を持った AI 利用に重点を置いています。そして、これらの MUM によるシステムが検索結果のランキングに導入される際には Google 検索がよりべんりなものになるよう既にある一連のシステムに加わる形となります。

Posted by Pandu Nayak, Google Fellow and Vice President, Search

Gadget Gate

Google 検索を支える AI 技術

Archives