OpenAIはChatGPTのAdvancedに新しい音声を追加しているようです音声モード—そして私たちは彼らがどのようなサウンドになるかを知るかもしれません。
新しいレポートでは、最終的に ChatGPT の現在のオプションに追加される可能性のある 8 つの新しい音声が発見されました。テストカタログリバースエンジニアリングを行って、潜在的な新しい音声オプションを見つけてエンジニアリングしましたティボル・ブラホXに投稿された、それぞれの声がどのように聞こえるかについての詳細なサンプル。
ChatGPT の報告された新しい音声をチェックしてください
新しい音声オプションとされるものは、ファゾム、グリマー、ハープ、メイプル、オービット、レインボー、リーフ、リッジ、ヴェイルです。
ツイートは削除された可能性があります
これは、ChatGPT の既存の音声である Ember、Juniper、Cove、Breeze に追加されます (申し訳ありませんが、もう空はないその後、スカーレット・ヨハンソン全体が大失敗) 伝えられるところによると、新しい声は性別やアクセントが異なるようで、ファゾムとヴェイルは上品な英国人のように聞こえ、リーフはオーストラリア人のように聞こえます。
マッシュ可能な光の速度
OpenAI は昨年 5 月、テキスト、ビジョン、オーディオ モダリティを 1 つのモデルに統合する新モデル GPT-4o の一部として ChatGPT 音声モードを発表しました。 GPT-4o の優れた機能は、デモ音声の不気味な女優スカーレット・ヨハンソンとの比較と、モデルに自分の声を使用するというサム・アルトマンの要求を断ったという彼女自身のその後の声明によって、いくぶん影が薄くなった。
それにもかかわらず、ChatGPT 音声モード展開された7 月に一部の ChatGPT Plus ユーザーに公開されましたが、それ以来、音声モードに関するニュースはほとんど沈黙を保っていました。
興味深いことに、Blaho のデモには、犬の鳴き声やカラスの声が含まれる一節を読み上げる音声が含まれています。声は動物の鳴き声を表現するために最善を尽くしており、成功の程度はさまざまです。声の中には、単に「ワン」や「カー」と言っているように見えるものもあれば、実際に犬やカラスの鳴き声を真似しようとするものもあります。これらの模倣がなければ、その中には小さくてロボットのように聞こえるものもあり、それが AI によって生成された音声であるとは気づかないでしょう。
ChatGPT の音声モードは非常に新しいものです。実際、非常に新しいため、音声モダリティはまだ少数の ChatGPT Plus ユーザーのみが利用できます。オーディオ機能がいつより多くのユーザーに展開されるかは不明であるため、ChatGPT がより多くの音声を取得することに関する詳細も不明です。