現在、SGE と呼ばれる Google の AI を活用した検索実験はマルチモーダルです。 OpenAI のリリースに続いて、FROM-E 3そしてマイクロソフトのBing イメージ クリエーター, GoogleのSGEは現在、独自のAI画像生成ツールを持っています。
Google の Imagen テキストから画像への拡散モデルを利用して、SGE にアクセスできるユーザーは希望する画像を記述することができ、数秒以内に SGE は 4 種類の画像から選択できるようにします。そこから、ユーザーは説明をさらに編集して、見たい画像を調整できます。 Google の例では、元のリクエストは、シェフの帽子をかぶってベーコンを調理しているカピバラの風変わりな画像を求めるものでした。ユーザーは説明を編集して、代わりにカピバラがハッシュブラウンを調理するようにすることができます。
AI 軍拡競争、またはサンダードーム、あるいは AI 市場の優位性を争うハイテク巨人と何とでも呼びたいものでは、マルチモダリティは切望される戦略的領域です。マルチモダリティとは、画像や音声など、さまざまな種類のメディアを理解して処理する AI モデルの能力を指します。
AI チャットボットがユーザーと会話することは別のことですが、「見る」「聞く」そして創造的な出力を生み出すことは、まったく新しいレベルの AI の洗練です。 OpenAI は最近、イメージ生成ツール DALL-E 3 の最新バージョンをリリースしました。OpenAI の投資家である Microsoft は現在、Bing Image Creator に DALL-E 3 を使用しています。そして現在、Google は独自のバージョンを SGE に提供しています。
マッシュ可能な光の速度
AI 画像生成ツールへの広範なアクセスには、誤った情報や偽情報の蔓延、著作権侵害などの大きな懸念がないわけではありません。 SGE は、Google の規定に違反する有害なコンテンツや誤解を招くコンテンツをブロックするよう訓練を受けています。生成AI政策、フォトリアリスティックな人間の顔を含む画像は生成されません。さらに、著名な公人 (有名人など) が画像生成結果からブロックされ、ディープフェイクの可能性が防止されます。追加の予防措置として、このツールは 18 歳以上のユーザーを対象としています。
SGE によって作成された画像には、AI によって生成されたことを示すメタデータと埋め込み透かしが含まれます。さらに、Google の Imagen モデルは、一般に公開されているコンテンツでトレーニングされました。 MashableはGoogleに、テキストプロンプトと生成された画像からのユーザーデータがモデルのトレーニングに使用されるかどうかを尋ねた。また、オプトアウトのオプションがあるかどうかも尋ねました。応答が得られたら、このストーリーを更新します。
また、SGE には、書かれたコンテンツの下書きを作成する機能も新たに追加されました。これは、Google の AI チャットボットである Bard で利用できるものと同じ機能ですが、SGE の検索機能内から直接アクセスできるようになり、ウィンドウ間を行き来する時間を節約できます。
SGE 内で直接メッセージの下書きを作成できるようになりました。 クレジット: Google
SGE 内での画像の生成とメッセージのドラフト作成は、本日、米国のユーザーに英語で導入されます。