Google Deepmind は AI ビデオ ジェネレーター Veo 2 を展開しています。その仕組みと試し方。

Googleディープマインドは、次世代 AI ツールである Veo 2 および Imagen 3 と、クリエイティブな方法でビジュアルをリミックスすることを目的とした遊び心のある新しい実験である Whisk を発表しました。

Veo 2 は、同社の主力ビデオ生成ツールの最新バージョンです。グーグルより高いリアリズムが可能になり、動き、物理学、映画のテクニックについての理解が深まります。 Google Deepmind はプレス リリースの中で、Veo 2 は 4K ビデオを生成し、特定のカメラ レンズや映画のようなショットなどの複雑なプロンプトを処理できると述べています。

関連項目:

プレスリリースには「Veo 2は映画撮影の独特の言語を理解している」と述べ、「ローアングルのトラッキングショット」や「浅い被写界深度」などのスタイル上の選択肢を提供できる能力を強調している。さらに同社は、奇妙なビジュアル(余分な手足など)がしばしば「幻覚」を起こす以前のモデルとは異なり、Veo 2 はこうした癖を軽減し、より自然な結果をもたらすと述べています。

マッシュ可能な光の速度

画像3、8月に発売、より豊かなテクスチャ、より明るい色、そしてフォトリアリスティックな風景からアニメまでの多様なアート スタイルにより、いくつかの改善が加えられています。このアップグレードでは、ユーザーのプロンプトにさらに忠実に従うようになります。

最も興味深い追加機能は、ユーザーが創造的なセンスで画像をリミックスできるツールである Whisk でしょう。 Google の Imagen 3 と Gemini モデルを組み合わせることで、Whisk は、説明的なキャプションを自動的に生成しながら、大まかなイメージのアイデアを「ぬいぐるみやエナメルのピン」などのデジタル アート作品に変えることができます。

Veo 2 は Google の VideoFX で展開され、Imagen 3 は 100 か国以上で ImageFX に導入され、Whisk は米国のユーザー向けに公開されています。にサインアップできます。Google Labs の順番待ちリスト今。