OpenAI が音声機能を開始でチャットGPT昨年の9月。さて、その会社は、Voice Engine というモデルのプレビュー、単一の 15 秒オーディオ クリップとテキスト プロンプトを使用して、より長いオーディオを生成できます。 OpenAI は、音声エンジンがロボットのドローンではなく、抑揚とトーンを備えた本物のような音声を生成すると自慢しています。
OpenAI のブログ投稿によると、音声エンジンは 2022 年に初めて開発されました。ChatGPT の読み上げ機能テキスト読み上げも同様です。それ以来、OpenAI はさまざまなシナリオで音声エンジンをテストしてきました。言語能力のない人々や、その他の理由で声を失ってしまった人々のため。そして翻訳。これらのそれぞれのケースについて、OpenAI はそれぞれの分野の企業と提携しています。
OpenAI はブログ投稿の大部分を費やして、音声エンジンが安全に構築されていることを保証していますが、悪名高いものについては言及していません。ジョー・バイデンのロボコール明らかに、それは暗示されている。「人々の声に似た言論を生成することには重大なリスクがあることを認識しており、それは特に選挙の年には最大の関心事である」とポストは述べている。 「私たちは、政府、メディア、エンターテインメント、教育、市民社会などの米国および国際的なパートナーと協力して、開発の際に彼らのフィードバックを確実に取り入れています。」
マッシュ可能な光の速度
のバイデンのロボコールは、イレブンラボ社のソフトウェアで作られた可能性が高い、OpenAI 製品ではありませんが、Voice Engine は同じ機能を保持している可能性があります。投稿の最後で、OpenAI は、「AI の安全性へのアプローチと、(安全性、セキュリティ、信頼性への)自発的な取り組み」を理由に、現時点では音声エンジンを広くリリースしていないと述べています。
「私たちは、Voice Engine のこのプレビューがその可能性を強調するとともに、これまで以上に説得力のある生成モデルによってもたらされる課題に対する社会の回復力を強化する必要性を促進することを願っています」と投稿では述べています。 OpenAI はその後、セキュリティ対策として音声認証の段階的廃止を要求します。 AIにおける人々の声の利用を保護する政策。教育;そして、本物でない音声を識別するためのさらなる技術も、すべて独自の技術のおかげです。
OpenAI のブログ投稿で音声エンジンの例を読んで聞いてください。合成音声の課題と機会を乗り越える。