一部の鋭い観察者によると、ChatGPT の待望の視覚機能が間もなく登場する可能性があります。
Android 権限アドバンストでいくつかのコード行を見つけました音声モード最新の ChatGPT v1.2024.317 ベータ ビルドの一部で、「ライブ カメラ」と呼ばれるものを指します。このコードは、「健康や安全に影響を及ぼす可能性のあるライブナビゲーションや決定のために」ライブカメラを使用しないようユーザーに警告しているようだ。
コードの別の行には、「カメラ アイコンをタップして、ChatGPT で周囲の状況を表示およびチャットできるようにする」という視覚機能に関する指示が示されているようです。
マッシュ可能な光の速度
関連項目:
ChatGPT の進化する機能: ビジョン、音声、その他
ChatGPT の情報を視覚的に処理する機能は、OpenAIイベント昨年5月に発売GPT-4o。イベントのデモでは、GPT-4o がモバイルまたはデスクトップのカメラを使用して被写体を識別し、ビジュアルの詳細を記憶する方法が示されました。ある特定のデモでは、GPT-4o がテニス ボールで遊んでいる犬を識別し、その名前が「クッパ」であることを思い出しました。
OpenAI イベントとそれに続く数人の幸運なアルファ テスターへの早期アクセス以来、ビジョンを備えた GPT-4o についてはあまり語られていません。一方、OpenAI は出荷されましたアドバンストボイスモード9 月に ChatGPT Plus および Team ユーザーに提供。
コードが示すように、ChatGPT のビジョン モードが差し迫っている場合、ユーザーは、昨年の春に公開された新しい GPT-4o 機能の両方のコンポーネントを間もなくテストできるようになります。
ツイートは削除された可能性があります
OpenAI は、次のような報告にもかかわらず、最近多忙を極めています。収益の逓減将来のモデルとともに。先月発売されましたChatGPT検索、AI モデルを Web に接続し、リアルタイムの情報を提供します。それはまた、噂のコードの作成や Web の閲覧など、ユーザーに代わって複数のステップのタスクを実行できる何らかのエージェントに取り組んでおり、おそらく 1 月のリリースが予定されています。