Tumblr ユーザーの皆さん、Tumblr が OpenAI と MidJourney にデータを販売することについて知っておくべきことは次のとおりです。

OpenAIサイトが精査した内部文書によると、写真ジェネレーターのMidjourneyは、Tumblrの公開コンテンツを使用してAIモデルをトレーニングするために間もなく料金を支払う予定だという。404 メディア。

404 Mediaは、Tumblrの親会社AutomatticとAI大手2社との間で合意が「差し迫っている」と報じたが、どのような種類のデータが両社に販売されるのかは明らかにできなかった。伝えられるところによると、この契約には、からのデータの販売も含まれています。ワードプレス.com、別の Automattic プロパティ。

ユーザーコンテンツが AI トレーニングにどのように使用されるかを詳しく説明した投稿が、2 月 27 日に Tumblr と両方のスタッフブログに公開されました。ワードプレス.com。しかし、投稿ではAutomatticがそのデータを販売する交渉を行っていることはユーザーに伝えられていなかった。

セールが Tumblr コンテンツに与える影響について知っておくべきことは次のとおりです。

Automattic が販売すると報じられているコンテンツはどれですか?

404メディアは、調査した文書には各企業に販売されるデータの種類が明記されていなかったと報告した。また、この契約がTumblrへの今後の投稿のみに影響するのか、それとも過去のコンテンツも対象となるのかも不明だ。オンラインで公開されているコンテンツの多くは依然として著作権で保護されているため、AI 企業はモデルのトレーニングに「公開」コンテンツを横行して使用していると批判されています。

によるとOpenAI の Web サイトのサポート記事、「ChatGPT および当社のその他のサービスは、インターネット上で公開されている情報を使用して開発されています」などの情報源があります。表向き、OpenAI はすでに一度 Tumblr で公開されたあらゆるコンテンツをスクレイピングして使用しました。そう考えると、今回の契約は、将来のすべてのTumblrコンテンツの使用料も支払うとしているOpenAIとMidjourney側にとって、一種の罪状となる可能性がある。

マッシュ可能な光の速度

Automatticはこの契約に関する404 Mediaからのコメント要請に応じなかったが、次のような声明を発表した。「ユーザーの選択を守る」その中で同社は、「現在、大手テクノロジー企業のクローラーを含む主要な AI プラットフォームクローラーをデフォルトでブロックしており、新しいクローラーがリリースされるたびにリストを更新しています。」と書いています。このサイトがいつクローラーをブロックし始めたのかは不明だが、OpenAI が公開コンテンツでアルゴリズムを何年もトレーニングしてきたことを考慮すると、これは重要である。

オプトアウトするにはどうすればよいですか?

Tumblr の公開コンテンツをサードパーティと共有しないようにするには、運営している個々のブログの設定で、新しい [サードパーティによる共有を防止する] オプションをオンに切り替える必要があります。これは、Tumblr アプリではなく、Web ブラウザーで行う必要があります。これらのアップデートはに追加されましたTumblrのサポート記事ユーザーのプライバシーについて。

すでにご選択いただいている場合ブログの検索をやめさせるこれまでは、新しい「サードパーティによる共有を防止する」オプションがデフォルトですでにオンになっていました。

しかし、今すぐ設定を切り替えるのをやめて、代わりに 3 か月後に切り替えることにした場合はどうなるでしょうか? 404 Media は、2 月 23 日にアクセスした文書の中で、Tumblr スタッフがこの問題について質問したと報告した。「ユーザーが自分のデータを第三者と共有することをオプトアウトした場合、既存のデータパートナーにそのような変更が通知され、データが削除されるという保証はあるのでしょうか？」と彼らは書いている。

Automattic の AI 責任者、アンドリュー・スピットル氏は、「オプトアウトしたユーザーについては既存のパートナーに定期的に通知します。これを継続的なプロセスにして、現在の設定に基づいて過去のコンテンツを除外することを定期的に提唱していきたいと考えています」と答えた。我々はコンテンツを削除し、今後のトレーニング実施から削除するよう要請する予定です。これまでのパートナーとの会話に基づいて、これを遵守してくれると信じています。」

これは正常ですか?

少なくとも、それが新しい常態であることは間違いありません。 OpenAIはAP通信のニュース記事のライセンス供与伝えられるところによれば、同様のことを行うために交渉中であるCNN、時間、そしてキツネ。レディットはGoogleとの連携コンテンツのデータベースを収益化するためです。

特に Tumblr でどれだけのお金を失っているかを考えると、Automattic が独自のデータを販売し始めるのは時間の問題でした。 17 年間の歴史全体を通じて、このサイトは一度も利益を上げたことはなく、Automattic はそれを立て直すことができませんでした。 11月には、テッククランチは、リソースが困難なサイトから Automattic 内の他のプロジェクトをサポートするために転用されたと報告しました。