「」として知られるインターネットのコピーキャットを阻止するための Google の取り組みスクレーパー「裏目に出てしまった。
善意で始まったことが、Googleがコンテンツマイニングに自社のスクレーパーを使用していたことが発覚したことで、金曜日のインターネットジョークとなった。
すべては、Google のウェブスパム チームの責任者であるマット カッツ氏が、次のリンクをツイートしたときに始まりました。新しい形自分の Web サイトがスクレーパーによって複製されていることに気付いた場合に、人々が記入できるようにします。
Google で元のコンテンツ ソースを上回るスクレイパー URL を見つけた場合は、それについてお知らせください。https://t.co/WohXQmI45X
— マット・カッツ (@mattcutts)2014 年 2 月 27 日
ダン・バーカーウェブマーケターの氏は、その代表的な例を指摘した。
。@mattcutts見つけた気がするよ、マット。コンテンツ テキストの類似点に注意してください。pic.twitter.com/uHux3rK57f
— ダン・バーカー (@danbarker)2014 年 2 月 27 日
このツイートは、Google 独自のスクレイピングを強調しており、Wikipedia からその悪質な活動の定義 (「Web スクレイピングを使用して他の Web サイトからすべてのコンテンツをコピーするスパム Web サイト」) を採用し、Wikipedia のリンクの上に表示しています。
バーカー氏のちょっとした嫌味はすでに1万4000件以上のリツイートを集めている。
Barker 氏のスクリーンショットでは、Google のセマンティック検索、検索クエリが何を尋ねているかを予測し、答えを提供しようとします。
独自の形式のコンテンツファーミングに取り組みながらスクレイピングを阻止しようとするGoogleの取り組みは、迅速な回答を提供するという同社の目標と、インターネットの残りの部分へのポータルとしての役割との間の緊張を浮き彫りにしている。
[slug="google-calendar-tips" も参照]
Google は可能な限り最高の検索結果を提供することに関心を持っていますが、Google がそのままの回答をトップに表示できれば、Wikipedia はクリックを逃してしまいます。はい、Google には Wikipedia へのリンクが含まれていますが、検索アルゴリズムがセマンティック ボックスのすぐ下で Wikipedia を最初に置くという事実は、時として偽善的な検索の世界を浮き彫りにしています。
Google は、スクレイピングが引き起こす問題と、検索結果で上位に表示されることの価値を明確に認識しています。しかし、Google が独自のスクレイピングを行うだけであれば、トップページのランクがセカンドページのランクと同じように評価されることになる可能性があります。真実は、XKCD がベストを尽くします。私たちは皆、Google の検索結果の 2 ページ目に自分が表示されるほど絶望的な気分になることを嫌います。もしかしたら、Google もそうしているのかもしれません。
クレジット: