月曜日、CEO のサム アルトマンは、Sora の公開リリースを発表してすぐにライブストリームを開始しました。本日の時点で、Sora は米国およびその他の国 (英国および EU 加盟国を除く) の ChatGPT Plus および Pro ユーザーに提供されます。
ツイートは削除された可能性があります
昨年初め、OpenAI は AI ビデオ ジェネレーターを導入しました。しかし、今日一般に公開されるまで、選ばれたテスター グループに対して密かに開発が進められてきたため、その間に多くの誇大広告が蓄積されてきました。 Sora のフォトリアリスティックな詳細と高度な物理感覚と正確さの初期のデモは、AI 愛好家を驚かせました。しかし、それはまた、引き出された論争どうやってそんなに良くなったのかについて。 OpenAIはソラが何について訓練されたのかを明らかにしていないが、伝えられるところによると、転写されたこれは、AI ビデオが、ビデオ作成者のクレジットや報酬なしにウェブ上のビデオでトレーニングされたことを示唆しています。最近、Sora の初期テスターとして働いているアーティストのグループ漏れた彼らが「アートウォッシュ」と呼ぶものに抗議して API 認証情報を公開しました。
おそらく、Sora のようなツールがクリエイターの仕事を悪用し、置き換えているという批判に対する間接的な反応として、フリン氏は「Sora はツール」であり、「Sora の背後にあるクリエイターの拡張機能」であると強調しました。
マッシュ可能な光の速度
ライブストリームでは、OpenAI 製品リーダーの Rohan Sahai 氏と製品デザイナーの Joey Flynn 氏が、時間を無駄にすることなく Sora の機能を共有しました。このツールはスタンドアロンの Web サイト上に存在します。ソラ.com、他のユーザーが作成しているものを見つけるための探索タブがあります。いずれかのビデオをクリックすると、ユーザーは、単純なテキスト プロンプト、ビデオまたは画像の拡張子、Sora のストーリーボード ツールなど、ビデオの作成に使用された方法を確認できます。
[ライブラリ] タブでは、ユーザーはテキスト プロンプトを使用して独自のビデオの作成を開始したり、画像をアップロードしたりできます。ここから、ユーザーはアスペクト比、最大 1080p の解像度、最大 20 秒の継続時間、および複数のプロンプトのバリエーションを選択できます。 「ストップ モーション」や「バルーン ワールド」などの特定のデフォルト プリセットもあります。
Sora には、Storyboard と呼ばれるより高度なツールも付属しており、これを使用すると、ユーザーは特定の方向でビデオを形作ることができます。ストーリーボードは、下部にフレーム ビューとさまざまな編集ツールを備えた他のビデオ編集ツールと同様の類似点を持っています。各「ストーリーボード カード」またはフレームは、テキスト プロンプトまたは画像のアップロードから生成できます。ユーザーは、リカット機能を使用してカードを移動したり、リミックス機能を使用してシーケンスに対する特定の変更を記述したり、ループ ツールを使用してビデオを繰り返し再生したり、ブレンドを使用して複数のシーン間のトランジションを作成したりできます。
OpenAIでは発表、同社は安全対策の一部を共有しました。 Sora が生成したすべてのビデオには、C2PA の非表示のウォーターマークと、デフォルトで表示されるウォーターマークが付いています。ソラは「児童の性的虐待素材や性的ディープフェイクなど、有害な形式の虐待」をブロックし、人のアップロードを制限する。
ChatGPT Plus ユーザーは 480p (ビデオが少ない場合は 720p) で月に 50 本のビデオを取得でき、ChatGPT Pro ユーザーは 10 倍の使用量が得られます。