Openaiは、ChatGptとSoraのネイティブイメージ生成を発表します

Openaiには、ネイティブの画像生成がありますchatgptそしてソラ

CEOが率いるライブストリームでサム・アルトマンOpenaiチームのメンバーと同様に、同社はGPT-4Oモデルによって駆動される画像生成の新しい機能をデモしました。

参照:

以前は、Image GenerationはOpenaiのDall-Eテキストから画像モデルに依存していました。現在、GPT-4oは画像生成を処理します。つまり、世界の知識と文脈的理解があり、画像をよりシームレスに会話することです。モデルの応答は、画像への特定の参照なしにコンテキストプロンプトを理解し、生成された画像を繰り返すためのプロンプトに従うことができ、Openaiはテキストのレンダリングがより良いと言います。

テキストレンダリングはずっと良くなるようです。 クレジット:Openai

ChatGptの画像生成により、Openaiの目標は、単なる斬新ではなく、より便利にすることです。つまり、図、インフォグラフィック、ロゴ、ソーシャルメディアの投稿、その他のグラフィックを生成できることを意味します。 SORAでは、Midjourneyインターフェイスによく似た画像を(ビデオに加えて)生成するための新しいセクションがあります。

マッシャブルなライトスピード

ライブストリームで、アルトマンは、モデルは「創造的な自由」に傾いて、「私たちが望むことは、あなたがそれを望まないなら攻撃しないようにすることだと言っていますが、それが理にかなっているなら、人々が本当に望むものを創造させることができます」と言いました。

Altmanは、これをAnで明確にしようとしたようですx投稿「私たちが目指したいのは、あなたが望んでいない限り、ツールは攻撃的なものを作成しないということです。その場合、モデル仕様で話すように、この知的自由とコントロールをユーザーの手に置くことは正しいことだと思いますが、それがどのように進み、社会に耳を傾けることを観察します」

このツイートは現在利用できません。ロードされているか、削除されている可能性があります。

それが完全に意味がない場合も、「児童の性的虐待資料や性的ディープフェイクなど」のコンテンツポリシーに違反する画像をブロックすることに対するOpenaiの姿勢は同じままです。

付随するブログ投稿によると、すべての画像にはC2PAメタデータがあり、画像の出所を詳述する目に見えない透かしが提供されます。

CHATGPTのネイティブイメージ生成は、CHATGPT Plus、Pro、Team、および無料ユーザーのために今日利用できます。アクセスは、すぐにエンタープライズとEDUユーザーに展開されます。