クレジット:
Twitter の検索エンジニアリング チームは、検索製品の進化について説明し、驚くべき Twitter 検索の数字も共有しています。ブログ投稿リリースに関して。
今年 4 月の時点で、Twitter 検索は 1 日あたり平均 16 億のクエリを処理しています。この数字は 1 秒あたり 18,000 クエリに相当し、Twitter が検索ツールを買収して以来、ユーザーの検索活動が大幅に増加したことを示しています。要約する当時は、平均して 1 秒あたりわずか 200 件のクエリを処理していました。
この需要に応えて規模を拡大するために、Twitter は大きな変更を加えました。 2010 年の春に最初に開始されたこの書き換えには、新しいリアルタイム検索エンジンが含まれ、最近では Blender for Java サーバーへの切り替えが行われました。3回より速い検索。
プロセスの初期段階で、検索エンジニアは Twitter の最初の内部検索を使用しました。ハッカソン画像およびビデオ検索のプロトタイプを構築します。このプロジェクトは会社に非常に好評で、生産が開始されました。
しかし、画像検索とビデオ検索による検索エクスペリエンスを刷新するにあたり、Twitter はキーワード クエリに一致する結果を返すだけでなく、検索者に関連した検索結果を表示し、本質的に検索エクスペリエンスをパーソナライズする必要性も感じました。
「多くの場合、ユーザーは最も記憶に残るツイートや、他のユーザーが関与しているツイートにのみ興味を持ちます」と同社は書いている。 「新しい検索エクスペリエンスでは、特定のユーザーに最も関連性の高い検索結果が表示されます。そのため、検索結果はパーソナライズされ、他のユーザーの共感を抱かないツイートは除外されます。」
そのために、Twitter の検索インデックスには、言語やテキストなどのツイートに関する静的な情報、ユーザーとツイートのやり取りなどの動的な情報、および検索者に関する情報が組み込まれています。 「当社のランキング機能はソーシャル グラフにアクセスし、ランキング中に検索者とツイートの作成者の関係に関する知識を利用します」と同社は説明する。
Twitter は検索での重複も削除するようになり、個人関連性検索機能をモバイルにも拡張すると約束しています。 「今後数か月間で、品質を向上させ、インフラストラクチャを拡張し、インデックスを拡張し、モバイルとの関連性をもたらします。」