ソラは何を訓練されましたか？クリエイティブは答えを求めます。

木曜日、OpenAI は Sora と呼ばれるビデオ生成モデルで再び AI の世界に衝撃を与えました。

デモでは、単純なテキストプロンプトに基づいて、鮮明な詳細と複雑さを備えた写真のようにリアルなビデオが表示されました。あビデオ「東京郊外を走る電車の窓に反射」というプロンプトに基づいて、電話で撮影されたように見え、カメラワークが不安定で、電車の乗客の反射も含まれていました。奇妙な歪んだ手は見当たりません。

ツイートは削除された可能性があります

プロンプトのビデオ「赤いウールのニットのオートバイのヘルメットをかぶった 30 歳の宇宙人の冒険をフィーチャーした映画の予告編、青い空、塩の砂漠、映画のようなスタイル、35mm フィルムで撮影、鮮やかな色」というものは、クリストファー・ノーランの映画のように見えました。 -ウェス・アンダーソン・ハイブリッド。

ツイートは削除された可能性があります

雪の中で遊ぶ別のゴールデンレトリバーの子犬は、柔らかな毛皮とふわふわの雪を、手を伸ばせば触れてしまいそうなほどリアルに表現しました。

7 兆ドルの問題は、OpenAI がどのようにしてこれを達成したのかということです。 OpenAI はトレーニングデータについてほとんど何も共有していないため、実際のところはわかりません。しかし、これほど高度なモデルを作成するには、Sora は大量のビデオデータを必要としたため、インターネットの隅々から収集したビデオデータでトレーニングされたと考えられます。また、トレーニングデータには著作権で保護された作品が含まれていたのではないかと推測する人もいます。 OpenAIはソラのトレーニングデータに関するコメント要請にすぐには応じなかった。

関連項目:

OpenAIでは技術論文これらの結果を達成する方法に主に焦点を当てています。Sora は、視覚データをモデルが理解できる「パッチ」またはデータの断片に変換する拡散モデルです。しかし、視覚データがどこから来たのかについてはほとんど言及されていません。

OpenAI は、「インターネット規模のデータでトレーニングすることでジェネラリスト機能を獲得する大規模な言語モデルからインスピレーションを得ている」と述べています。信じられないほど曖昧な「インスピレーションを得る」部分は、ソラのトレーニングデータのソースへの唯一の回避的な言及です。 OpenAI は論文のさらに下で、「テキストからビデオへの生成システムをトレーニングするには、対応するテキストキャプションを備えた大量のビデオが必要である」と述べています。膨大な量の視覚データの唯一の情報源はインターネット上にあり、これもソラの出自を示すヒントです。

マッシュ可能な光の速度

AI モデルのトレーニングデータをどのように取得するかという法的および倫理的な問題は、OpenAI が ChatGPT を開始して以来存在しています。両方OpenAIそしてグーグル彼らは言語モデルをトレーニングするためにデータを「盗んだ」疑いで告発されている。言い換えれば、ソーシャルメディア、RedditやQuoraなどのオンラインフォーラム、Wikipedia、個人書籍のデータベース、ニュースサイトから収集したデータを使用したということだ。

これまで、トレーニングデータを取得するためにインターネット全体をスクレイピングする理論的根拠は、データが一般に公開されているということでした。ただし一般公開されている常に翻訳されるわけではありませんパブリックドメインにします。好例として、ニューヨークタイムズは訴訟を起こすOpenAI と Microsoft は、OpenAI のモデルが回' は一字一句正しく機能するか、ストーリーを誤って引用したものです。

OpenAI も同じことをビデオを使ってやっているようです。これが事実であれば、エンターテインメント業界の重鎮たちがそれについて何か言うだろうと予想できます。

しかし、問題は残っています。ソラの訓練データの出所がまだわかりません。「同社は（その名前にもかかわらず）モデルを何に基づいてトレーニングしたかについて、特徴的に口を閉ざしてきた。」書きました米上院AI監視委員会の公聴会で証言したAI専門家のゲイリー・マーカス氏。「多くの人が、おそらくアンリアルなどのゲームエンジンから生成されたものがそこにたくさんあるのではないかと[推測]しています。また、YouTube で多くのトレーニングが行われ、さまざまな著作権で保護された素材があったとしても、私はまったく驚きません。」マーカス氏は、「おそらくアーティストたちはここで本当にひどい目に遭っているだろう」と付け加えた。

OpenAIは秘密の漏洩を拒否しているにもかかわらず、アーティストやクリエイターは最悪の事態を想定している。映画製作者であり、SAG-AFTRA 生成 AI アドバイザーでもあるジャスティン・ベイトマン氏は、言葉を切り詰めませんでした。「このすべてのナノ秒#AIゴミは本物の芸術家によって盗まれた作品で訓練されています。」投稿されましたベイトマンはXについて「不快だ」と彼女は付け加えた。

ツイートは削除された可能性があります

クリエイティブ業界の他の人々は、Sora とビデオ生成モデルの台頭が自分たちの仕事にどのような影響を与えるかを懸念しています。「私は映画の VFX の仕事をしていますが、私の知っているほとんどの人は絶望的で憂鬱で、これから何をすべきかパニックになっています。」投稿されました@ジミーランスワース。

OpenAI は、Sora がもたらす可能性のある爆発的な影響を完全に無視していたわけではありません。しかし、それは主にディープフェイクや誤った情報に関わる潜在的な害に焦点を当てている。現在はレッドチーム化段階にあり、不適切で有害なコンテンツがないかストレステストを受けていることになる。 OpenAIは発表の終わりに向かって、「世界中の政策立案者、教育者、アーティストに彼らの懸念を理解し、この新しいテクノロジーの前向きな使用例を特定するよう働きかける」と述べた。

しかし、それはそもそもソラを作ることですでに生じているかもしれない害には対処していません。

関連記事

IAC、検索および広告ビジネスで 40% の成長を示す

Twitterの青色小切手パージは有料購読にほとんど影響を与えていない

DreamScreen: HP が洗練されたタブレットで Apple を完全に破る

タッチレスコントロールを備えたサムスンのスマートメガネはほぼ準備ができている、とレポートによると

FCCはすでにネット中立性の強制を拒否している

ビッグデータによって NBA ファンになることがこれまで以上に良くなる