GPT-4に対するGoogleの反論「Gemini」が登場

GoogleはGeminiを発表し、これを「最大かつ最も有能なAIモデル」と呼んでいる。

水曜日、同社の人工知能研究所であるGoogle DeepMindは、紹介されたOpenAIを超えると伝えられる待望のモデルGPT-4主要なベンチマークについて。

OpenAIの立ち上げ以来チャットGPT1年前、大手テクノロジー企業はAIの進歩を巡る競争に巻き込まれてきた。これまでのところ、MicrosoftはAI企業への主要投資家としてOpenAIのモデルにアクセスできるため、わずかに有利だった。 Googleは、いつになくフラットな姿勢を見せてきた。 ChatGPT の競合製品である Bard の最初のリリースは次のとおりでした。失敗した。そして、Google は一般に、OpenAI や Microsoft からのリリースに遅れをとっています。Bing と副操縦士。しかし、Google Gemini は、OpenAI を飛び越えるほど大きな進歩となる可能性があります。

ジェミニとは何ですか？

Google によると、Gemini が優れているのは、そのマルチモーダルな機能、洗練された推論、高度なコーディング能力です。最初にテキストに基づいて構築され、その後画像データを追加する他のマルチモーダル AI モデルとは異なり、Gemini はネイティブにマルチモーダルです。つまり、最初からテキストに加えて音声と画像のモダリティについても事前にトレーニングされていました。「これにより、Gemini はあらゆる種類の入力をゼロからシームレスに理解し、推論することができ、既存のマルチモーダルモデルよりもはるかに優れています」と発表では述べられています。

マッシュ可能な光の速度

多分野の知識と問題解決能力をテストするMMLU（大規模マルチタスク言語理解）のスコアは、GPT-4の86.4パーセントに対し、ジェミニは90パーセントだった。

つまり、双子座が良い成績を収めていることはわかりますが、現実の世界ではどうなのでしょうか？私たちは皆、それを見つけようとしています。 Google は、Gemini を 3 つの異なるサイズに合わせて最適化しました。Gemini Ultra は非常に複雑なタスク向けの最大のモデルで、Gemini Pro は他のほとんどのタスクを実行できる中量モデルで、Gemini Nano は携帯電話に搭載できるほど小型の効率的なモデルです。

そういえば、今日から Gemini Nano はGoogle ピクセル 8 プロ。今のところ、Gemini Nano はデバイス上の 2 つの機能を強化します。レコーダーアプリでトランスクリプトを要約することができ、携帯電話のキーボード (Gboard) のスマートリプライに対する応答も提案します。

Android ユーザーでなくても、今日から Google Bard で Gemini をテストできます。推論、計画、理解において全体的な改善が見られることが期待されます。 Gemini Pro は Bard を強化しますが、プロンプトはテキストのみです。

マルチモダリティはすぐに実現します。来年、Google は Gemini Ultra を搭載した Bard の高度なバージョンを発表する予定です。