OpenAIの月曜日の大きな発表は、開発中と伝えられている音声アシスタントかもしれない。
によると情報, OpenAIは、音声、テキスト、画像認識を1つの製品にまとめた技術に取り組んでおり、家庭教師の子供たちの数学の宿題を手助けしたり、翻訳や車のトラブルの手伝いといった「周囲の情報を人々に提供したり」できるという。
金曜日、OpenAIは、今週の月曜日にライブ配信します(特に、Google の開発者カンファレンスである Google I/O の前日)。当初は、ChatGPT 検索エンジン、またはのお披露目GPT-5, CEOのサム・アルトマンはそれらの噂を一蹴し、「私たちは人々が気に入ると思われるいくつかの新しいことに一生懸命取り組んできました!」とXに投稿した。その新しいものは音声アシスタントかもしれない。
Mashable は OpenAI にコメントを求めており、返答があればこの記事を更新する予定です。
昨年 9 月に OpenAI が展開されました音声と画像の機能、「ChatGPTは今、目で見て、聞いて、話すことができる」と主張しています。 (補足: ChatGPT は技術的にはできませんするそれは生き物ではありませんが、人間の感覚を模倣して画像と音声をリアルタイムで処理できるためです。)
マッシュ可能な光の速度
発表の中で、OpenAI は、自転車のシートの問題をトラブルシューティングする ChatGPT の機能と、合成音声の助けを借りて、テキストで応答する代わりにユーザーと気軽にチャットできる機能をデモしました。同アウトレットは、新しいモデルはこれらのモダリティを統合すると報じた。
The Informationは、音声アシスタントは現時点では大きすぎて個人のデバイス上で実行できないが、クラウドベースのサービスを顧客サービス担当者向けに導入すれば、顧客が皮肉を言っているときを認識できる可能性があると指摘した。
しかし、このテクノロジーがユーザーの手に渡った瞬間が、その変革の可能性が明らかになります。
そういえば、OpenAI は Apple と次のことについて話し合っていると伝えられている。ChatGPT と iOS 18 の統合、一般の人々は Apple の開発者カンファレンスでさらに詳しく聞くことを期待していますWWDC6月に。同時に、Apple は音声アシスタント Siri の大規模な見直しを計画しています。ニューヨーク・タイムズ。
それでも十分でない場合、Googleは火曜日の開発者カンファレンスGoogle I/OでGeminiのアップデートを発表すると予想されている。 Google も Apple と次のことについて協議していると伝えられているGemini を iPhone に導入。そのため、OpenAI と Microsoft の緊密な関係にもかかわらず、Apple との関係深化に関する報道は、たとえ Apple が Google とも話し合っていると伝えられているにもかかわらず、生成 AI が不安な提携関係にある絡み合ったスーパーエンティティの構築に役立っている可能性を示唆している。
しかし、そこで何が起こっても、Google I/OそしてApple WWDC、それは月曜日のOpenAIの謎の発表に続いて行われた。