カリフォルニアの法律事務所は、提出されたAI技術を訓練するためにウェブから膨大な量のデータを「密かに盗んだ」としてGoogleを相手取った集団訴訟。
クラークソン法律事務所は、過失、プライバシーの侵害、窃盗、著作権侵害、および違法に取得した個人データから利益を得たとして、テクノロジー大手を訴えている。 「Google は、私たちのすべての個人情報と職業情報、クリエイティブな作品やコピーライトの作品、写真、さらには電子メールを取得し、事実上デジタル フットプリント全体を取得し、それを次のような商用人工知能 (「AI」) 製品の構築に使用しています。バード氏」と、カリフォルニア北部地区で7月11日に提出された訴状にはこう述べられている。
Googleに続いて訴訟が始まるプライバシーポリシーを静かに更新先週、いかなる公開情報もBardのような同社のAI製品を訓練するために使用できると主張した。 Googleは基本的に、ウェブ上に公開されるものはすべて公正なゲームであると言っているが、法律事務所は、AIモデルのトレーニングという明確な理由で、補償も同意もなしにデータをスクレイピングすることは、大規模なプライバシーの侵害であると考えている。訴状では、世界中に10億人以上のユーザーを抱える数十億ドル規模の企業であるGoogleが、ユーザーを「耐えられない」立場に追い込んでいると主張している。「インターネットを使用して、すべての個人情報と著作権で保護された情報をGoogleの飽くなきAIモデルに明け渡すか、あるいはそれを避けるかのどちらかだ」完全にインターネットです。」
マッシュ可能な光の速度
への声明でロイター, Googleの法務顧問ハリマ・デレイン・プラド氏は、この主張は「根拠がない」と述べ、「Google翻訳などのサービスの背後にあるAIモデルを責任を持って適切にトレーニングするために、オープンウェブや公開データセットに公開されている情報など、公開ソースからのデータを使用している」と述べた。私たちの AI 原則を活用してください。」
最近、クラークソンは同様の集団訴訟ChatGPTを作成した企業であるOpenAIに対して、同様のデータスクレイピング操作を使用した「個人データの盗難と悪用」の罪で訴えた。大規模な言語モデルでは、AI チャットボットをトレーニングし、会話型でインテリジェントにするために大量のデータが必要です。 Bard と ChatGPT は両方とも動作するために大規模な言語モデルに依存しているため、個人データの使用や著作権侵害に関する懸念が生じています。
最新の訴訟では、Googleが研究や教育目的でデータを無料にしている非営利団体Common Crawlなどのデータセットや、MediumやKickstarterなどのサイトのデータを流用したとしている。 Google はまた、Gmail と Google 検索からの独自のデータをモデルにフィードするために使用します。収集されたその他のデータには、デジタル ライブラリの電子書籍などの著作物、さらには海賊版 Web サイトからの著作物も含まれており、同社はこれらをアーティストや著者に補償せずに使用しています。
クラークソン氏の訴訟の鍵となるのはパブリックドメインの問題だ。しかし訴状には、「『一般公開』とは、いかなる目的でも自由に使用できるという意味では決してない」と述べられている。はい、一部のデータは購入可能ですが、それは使用状況とユーザーの同意によって異なります。はい、ユーザーはコンテンツを Web 上に公開するときにプライバシー ポリシーに同意しますが、それが他の場所で使用されているかどうかを知る権利があります。言い換えれば、クラークソン氏は「グーグルはインターネットを所有していないことをきっぱりと理解する必要がある」と述べている。