最も期待されている AI 関連製品の 1 つである OpenAI の AI ビデオ ジェネレーター Sora が登場しました。打ち上げられた月曜日に会社の一環として12 日間の OpenAIイベント。
OpenAI は過去に Sora の出力をチラ見せしてきました。しかし、発売時にはどれくらい違うのでしょうか? OpenAI は確かに、一般公開に備えて AI ビデオ ジェネレーターの更新と改善に熱心に取り組んできました。
YouTuberのマーケス・ブラウンリーは、ソラを初めて見る、OpenAIが正式に発売を発表する数時間前に、最新のOpenAI製品のビデオレビューを公開しました。ブラウンリーはどう思いましたか?
ソラの得意なこと
Brownlee 氏によると、Sora のテストでは、AI ビデオ ジェネレーターが風景の作成に優れていることがわかりました。 AI が生成した自然や有名な風景の頭上からのドローンのようなショットは、まるで現実のストック映像のように見えます。もちろん、ブラウンリー氏が指摘するように、ランドマークの周囲の様子に特に精通していれば、違いを見つけることができるかもしれません。ただし、Sora が作成したこの種のクリップには、明らかに AI によって生成されたように見えるものはあまりありません。
関連項目:
Brownlee 氏によると、Sora が作成できるビデオの種類はおそらく抽象的なビデオです。背景やスクリーンセーバータイプの抽象アートは、特別な指示があっても、Sora で非常にうまく作成できます。
マッシュ可能な光の速度
Brownlee 氏はまた、ストップモーションやクレイメーション タイプのアニメーションなど、Sora が生成した特定のタイプのアニメーション コンテンツは、依然として AI ビデオを悩ませている時々ぎくしゃくした動きがスタイル上の選択のように見えるため、時々許容範囲内に見えることにも気づきました。
関連項目:
最も驚くべきことに、ブラウンリー氏は、Sora が非常に特殊なアニメーション テキスト ビジュアルを処理できることを発見しました。他の AI 画像およびビデオ生成モデルでは、単語が文字化けとして表示されることがよくあります。ブラウンリー氏は、Sora の場合、テキストが具体的である限り (タイトル カードにいくつかの単語を入力するなど)、正しいスペルでビジュアルを生成できることに気付きました。
ソラが間違っているところ
しかし、Sora は、それ以前のすべての AI ビデオ ジェネレーターが苦労してきたのと同じ問題を依然として多く抱えています。
関連項目:
Brownlee 氏が最初に言及したのは、オブジェクトの永続性です。 Sora には、ビデオの実行中に、たとえば個人の手にある特定のオブジェクトを表示する際に問題があります。場合によっては、オブジェクトが移動したり、突然消えたりすることがあります。 AI テキストと同様に、ソラの AI ビデオも幻覚に悩まされています。
そこでブラウンリーはソラの最大の問題、つまり物理学全般に直面することになる。ソラにとってフォトリアリスティックなビデオは、動きを正確に表現することができないため、非常に難しいようです。人はただ歩いているだけでも、不自然に速度を落としたり、速度を上げたりし始めます。体の一部や物体が突然、まったく別のものにワープすることがあります。
そして、Brownlee 氏はこれらのテキストの改善について言及しましたが、よほど具体的にしない限り、Sora は依然として、建物や道路標識に見られるようなあらゆる種類の背景テキストのスペルを文字化けさせます。
OpenAI が発表時に共有したように、Sora は現在進行中の作業です。他の AI ビデオ ジェネレーターよりも優れている可能性がありますが、すべての AI ビデオ モデルが課題となる領域がいくつかあることは明らかです。