AIが生み出すインターネットの時代はすでに到来している

これは、陰謀論または未来の予言。 AI が生成したコンテンツによってインターネットが支配されるというアイデアはすでに実現しており、それは良いものではありません。

それ以来 チャットGPTAI が生成したコンテンツは着実にインターネットに浸透しています。人工知能は何十年も前から存在しています。しかし、消費者向けの ChatGPT は AI を主流に押し上げ、高度な AI モデルと企業が積極的に活用したい需要への前例のないアクセス性を生み出しました。

その結果、企業もユーザーも同様に生成 AI を活用して大量のコンテンツを作成しています。当初の懸念は、不正確、意味不明、誤った情報を含むコンテンツが大量に存在することですが、長期的な影響は、Web コンテンツが完全に役に立たないゴミに劣化することです。

ゴミが入る、ゴミが出る

考えているなら、インターネットにはすでに無駄なゴミが大量に存在する、それは本当ですが、これは違います。経営コンサルティング会社ガートナーの副アナリスト、ネーダー・ヘネイン氏は、「世の中にはゴミがたくさんある…だが、その多様性と多様性は信じられないほどある」と語る。 LLM が互いのコンテンツをフィードし合うと、画像のコピーのコピーのように、品質が低下し、より曖昧になります。

このように考えてみてください。ChatGPT の最初のバージョンは、完全に人間が生成したコンテンツでトレーニングされた最後のモデルでした。それ以降のすべてのモデルには、検証や追跡さえ困難な AI 生成コンテンツを含むトレーニング データが含まれています。これでは信頼性が低くなり、はっきり言ってゴミデータになってしまいます。そうなると、「コンテンツの品質と精度が失われ、そしてデータ保護と人工知能を研究するヘネイン氏は、「多様性が失われる。すべてが同じものに見え始める」と語った。

「近親相姦学習」とはヘネインの言うところのことである。 「LLM は単なる 1 つの大家族であり、互いのコンテンツを消費し、他家受粉しているだけであり、世代が進むごとにゴミが増えていき、ゴミが良質なコンテンツを追い越し、そこから事態が悪化し始めます。」

より多くの AI 生成コンテンツが Web にプッシュされるにつれて、それコンテンツは AI が生成したコンテンツで訓練された LLM によって生成されますが、私たちは完全に均質でまったく信頼性の低い将来の Web を目の当たりにしています。あと、本当に退屈です。

モデルの崩壊、インターネットの崩壊

ほとんどの人がすでに感じています何かが間違っています。

ツイートは削除された可能性があります

より注目を集めた例では、ロボットによって芸術が複製されています。書籍は丸飲みされ、LLM によって複製されています著者の許可なしに。有名人の声や肖像を使用した画像や動画は、本人の同意や補償なしに作成されています。

しかし、このような違反を保護するために、既存の著作権法と知的財産法がすでに制定されています。さらに、AI 音楽クリエイターやレコード会社と収益分配契約を提案しているグライムスのような AI コラボレーションを受け入れている企業もいます。ライセンス契約AIテクノロジー企業と。政策面では、議員らは偽物禁止法AIレプリカから公人を守るため。これらすべての問題を解決するための規制は整備されていませんが、少なくとも解決することは想像できます。

しかし、オンラインのあらゆるものの全体的な品質の低下はさらに潜行的な現象であり、研究者らはなぜそれが悪化しようとしているのかを実証しました。

勉強ドイツのヨハネス・グーテンベルク大学の研究者らは、「この自己消費的なトレーニングループは、最初は質と多様性の両方を向上させる」ことを発見し、これは次に起こる可能性のあることと一致しています。 「しかし、数世代が経過すると、出力の多様性は必然的に退化します。退化の速度は実際のデータと生成されたデータの比率に依存することがわかりました。」

他に2つアカデミック 論文2023 年に発表された論文では、合成データ、つまり AI 生成データでトレーニングされた場合の AI モデルの劣化について同じ結論に達しました。オックスフォード、ケンブリッジ、インペリアル・カレッジ・ロンドン、トロント大学、エディンバラ大学の研究者らの研究によると、「トレーニングでモデル生成コンテンツを使用すると、結果として得られるモデルに不可逆的な欠陥が発生し、元のコンテンツ分布の末尾が消失してしまいます。 」 これを「モデルの崩壊」と呼んでいます。

マッシュ可能な光の速度

同様に、スタンフォード大学とライス大学の研究者らは、「自食性(自己消費型)ループの各世代に十分な新鮮な実際のデータがなければ、将来の生成モデルは品質(精度)や多様性(再現率)が徐々に低下する運命にある」と述べた。

多様性の欠如が根本的な問題だとヘネイン氏は説明する。なぜなら、AI モデルが人間の創造性を置き換えようとするとしても、それはますますそこから遠ざかってしまうからである。

AI が生成するインターネットの概要

モデルの崩壊が迫る中、AI が生成したインターネットはすでに到来しています。

Amazon には次のような新機能があります。 AIが生成した製品レビューの要約。 Google と Microsoft のツールは AI を使用してメールや文書の草稿を支援し、Indeed は 道具9 月には、採用担当者が AI によって生成された職務記述書を作成できるようになります。 DALL-E 3 や Midjourney などのプラットフォームを使用すると、ユーザーは AI によって生成された画像を作成し、Web 上で共有できます。

Amazon のように AI 生成コンテンツを直接出力する場合でも、Google、Microsoft、Indeed、OpenAI、Midjourney のようにユーザーが AI 生成コンテンツを自分で出力できるサービスを提供する場合でも、それはすでに世に出ています。

そしてそれらは、何らかの監視を行っていると称するビッグテック企業のツールや機能にすぎません。本当の加害者は、高い SEO ランキングと収益を得るために、低品質で大量の逆流コンテンツを送り出すクリックベイト サイトです。

最近の報告404 Media の調査では、「AI を使用してコンテンツを急速に量産することで他の媒体をパクっている」サイトが多数発見されました。一貫性を犠牲にして盗作を回避するこの種のコンテンツのサンプルについては、疑わしいニュース サイトをご覧ください。Worldtimetodays.com、ジーナ・カラーノの解雇に触れた2023年の物語の最初の行。スターウォーズの読み物, 「ジーナ・カラーノが解雇された後、ルーカスフィルムに対する激しい攻撃を始めてからしばらく時間が経った」星の戦争だから、良くも悪くも、私たちはその運命にあったのです。」

明らかに、この文章はAIが生成したものです。 クレジット: Worldtimetodays.com

Google Scholarでは、ユーザーを発見したキャッシュ「AI 言語モデルとして」というフレーズを含む学術論文の数。これは、論文の一部 (または誰もが知っている論文全体) が ChatGPT などのチャットボットによって書かれたことを意味します。 AI によって生成された研究論文は、ある種の学術的信頼性があると考えられていますが、信頼できる参考文献としてニュース サイトやブログに掲載されることがあります。

ツイートは削除された可能性があります

Google 検索でも、報道写真や映画の静止画の代わりに、AI が生成した有名人の肖像画が表示されることがあります。 「虹の彼方に」のウクレレカバーで知られる故ミュージシャン、イスラエル・カマカウィウォレをGoogleで検索すると、 上位の結果これは、カマカウィウォレが今生きていたらどのような姿をしていただろうかという AI による予測です。

Google でキーラ ナイトレイの画像を検索すると、ユーザーが OpenArt、Playground AI、ドーパミン ガールにアップロードした、女優の実際の写真と並んで、歪んだレンダリング結果が表示されます。

キーラにはそんな資格はない。 クレジット: Mashable

最近のことは言うまでもありませんが、ポルノディープフェイクテイラー・スウィフトの、トム・ハンクスの肖像を使って販売するインスタグラム広告歯科計画、スカーレット・ヨハンソンの顔と声を使用した写真編集アプリ彼女の同意なしにそして実際には無許可だったドレイクとザ・ウィークエンドのあの炎の歌オーディオディープフェイクそれはまさに彼らのように聞こえました。

私たちの検索エンジンの結果がすでに信頼できず、モデルがほぼ確実にこのジャンクを食い物にしているのであれば、私たちは閾値を超えてウェブの AI ゴミ時代に突入したことになります。今のところ、かつて私たちが知っていたウェブはまだある程度認識できていますが、警告はもはや抽象的ではありません。

インターネットは完全に消滅したわけではない

ChatGPT のような製品が万歳を達成せず、人間が実際に楽しいと感じる、または消費に役立つと感じる活気に満ちたエキサイティングなコンテンツを確実に生成し始めると仮定すると、次に何が起こるでしょうか?

コミュニティや組織は、コンテンツを妨害しようとする AI モデルからコンテンツを保護することで反撃することが期待されます。オープンで広告サポートのある検索ベースの Web は廃止されるかもしれませんが、インターネットは進化します。より評判の高いメディア サイトがコンテンツをペイウォールの内側に置き、信頼できる情報が購読者のニュースレターから得られることが期待されます。

著作権やライセンスをめぐる争いがさらに増えることが予想される。ニューヨーク・タイムズ紙MicrosoftとOpenAIに対する訴訟。次のようなツールがさらに増えることを期待しますナス科、著作権で保護された画像をトレーニングしたモデルを破壊しようとすることで保護する目に見えないツールです。 AI スクレイピングを防ぐ、洗練された新しい透かしツールや検証ツールの開発が期待されます。

反対に、次のような他のニュース出版物も期待できます。AP通信- そしておそらくCNN、フォックス、時間 -生成AIを採用し、OpenAIのような企業とライセンス契約を結ぶことだ。

ChatGPT や Google のようなツールとしてSGE従来の検索の代替となり、SEO に基づいて構築された収益モデルが変化すると予想されます。

しかし、モデル崩壊の希望の兆しは需要の喪失です。現在、生成 AI の普及は誇大広告によって左右されており、低品質のコンテンツでトレーニングされたモデルが役に立たなくなってしまえば、需要は枯渇します。 (できれば)残るのは、オンラインで暴言を吐き、過剰に共有し、情報を伝え、その他の方法で自分自身を表現したいという抑えられない衝動を持つ、私たち弱気な人間だけです。

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.