最初にテキスト、次に画像、そして今度はOpenAIビデオを生成するためのモデルがあります。
木曜日には、メーカーは、チャットGPTそしてDALL-Eが発表ソラ、テキストからビデオへの拡散モデル。今日の時点で、Sora は、モデルの害やリスクを敵対的にテストするレッド チーマー、または専門家が利用できます。発表によると、このモデルは「クリエイティブな専門家にとって最も役立つようにモデルを進化させる方法についてのフィードバックを得るために」選ばれたグループやビジュアルアーティスト、デザイナー、映画制作者にも利用可能だという。
ツイートは削除された可能性があります
OpenAI は、2022 年 11 月に ChatGPT を発表して以来、猛烈なペースで生成 AI ツールを開発してきました。それ以来、GPT-4 のリリース、音声と画像のプロンプト、新しい DALL-E 3 イメージ モデルがすべて次の経由で利用可能になりました。チャットGPT。 OpenAI の API は、企業や開発者が独自の生成 AI ツールを作成できるようにすることで、AI 業界にも指数関数的な影響を与えました。現在、OpenAI はビデオ生成による AI 機能の進化に向けて、大きな次のステップを踏み出しています。
他にもビデオ生成モデルは存在しますが、Sora が作成したとされるもののようなリアルで複雑なビデオを生成できるものはありません。メタには道具短いビデオクリップを作成するため、およびグーグルは独自のテキストからビデオへのモデルに取り組んでいますが、まだ研究段階です。
マッシュ可能な光の速度
Sora を使用すると、ユーザーは詳細なシーンや複数のキャラクターを組み込んだ最大 1 分間のビデオを生成できます。発表には、曲がりくねった山道に沿ってSUVを追跡するビデオのクリップや、ゴールドラッシュ時代のカリフォルニアの「歴史的な」映像が含まれている。
次に、安全に関する細かい点について説明します。 OpenAIは、モデルのレッドチーム化とは別に、Soraが作成したビデオにC2PAガイドラインに従ってラベルを付けるツールを構築していると述べている。こちらも使用中です既存の安全方法不適切または有害なテキスト プロンプトを拒否する DALL-E に適用されます。
最後に、OpenAI は、「世界中の政策立案者、教育者、アーティストに彼らの懸念を理解し、この新しいテクノロジーの前向きな使用例を特定するよう働きかける」と述べています。同社は、人々がSoraを使用する有益な方法と有害な方法をすべて学ぶための最良の方法は、「実際の使用から学ぶことは、時間の経過とともに安全性が高まるAIシステムを作成およびリリースするための重要な要素である」と信じています。