ニュース
グーグルが語る検索サービスを支える3つの柱
2024年11月26日 16:23
検索を支える柱
グーグル 検索部門のパンドゥ・ナヤック チーフサイエンティストは、検索サービスを支える柱を「情報のインデックス化」「検索クエリの理解」「検索結果の順位付け」の3つと話す。
情報を整理しながら、ユーザーが何を知りたいのかを検索エンジン側が理解して適切に検索結果の順位に反映することが優れた検索エンジンの構築につながる。まずは、Webをクロールしてコンテンツを獲得し、あるコンテンツのリンク先をフォローし情報を整理(=インデックス)する必要がある。紙の書籍の索引とは違い、膨大な数になるという。
ユーザーが単に「パンケーキ」と検索した場合もパンケーキを食べたいのか、買いたいのか、レシピが知りたいのかは人それぞれ。検索エンジンがユーザーの意図を理解することが重要なものの複雑なワードの組み合わせになるほど難しくなる。近年ではAIを用いてユーザーの意図を理解しようと試みているという。
情報をインデックスし、ユーザーの意図を理解できれば検索結果のランキングの段階に入る。信頼できる情報源か、新しいか、ユーザーの現在地と紐づくかなどが考慮される。パンドゥ氏は、そのWebサイトに信頼性があるか、品質の高い情報をいかに表示するかが大切と話す。
グーグルの検索は毎日数十億に及ぶがそのうち15%は、これまでにない新しいワードの組合わせという。パンドゥ氏は優れた検索エンジンをつくることがいかに挑戦的なものかが見て取れると話す。
コンテンツの品質基準
同社では「Search Quality Rater Guidelines」として、Webサイトの品質の基準や関連性の意味づけなど同社が示す定義を文書で全ユーザーに公開している。
高品質なコンテンツの定義の一例としては、専門性や権威性、信頼性があるのか、体験も含まれているかなどを見ているという。一方で低品質なコンテンツはユーザーを騙そうとしている可能性のあるものや“釣り”、ヘイト表現などが含まれるという。
加えてスパム対策にも力を入れており、AIを活用した取り組みも実施。パンドゥ氏によれば99%の検索結果がスパムの影響を受けていないとしている。また、その情報源が本当に信頼できるかを示す「About this result」(この結果について)も日本語で利用できるようになっている。
AIとの組み合わせ
パンドゥ氏は、同社がこれまで検索に関し得さまざまな機能を展開してきたことに触れ、今後の展望も話した。
AIによる概要(AI Overviews)は、同社の調査によれば利用者は好意的にとらえており、特に18歳~24歳のユーザーがより利用の意向が高いという。Web検索の結果を組み合わせることで、より多くのリンクを表示したり、広範な検索結果を出すことでユーザーがより複雑なワードの組み合わせで検索することがあっても多様なWebサイトへのアクセスにつながるとした。
パンドゥ氏はリンクに対してのクリックがより高品質になっていると話し、リンク先のWebサイトでの滞留時間も長くなっていると説明。リンクの表示についても、モバイル版ではインラインリンクに、デスクトップでは右手のパネルにリンクを出す形にするなど、機能の改良は今後も続けていく。AIにもこれまでのプライバシー保護の考え方は受け継がれており、AIによる概要や検索結果とのコラボレーションで生成AI特有のハルシネーションなどを解決することなどを目指していくという。