Meta launches AudioCraft, an open-source AI music generator

Meta の新しい AI 音楽ジェネレーターは、このテクノロジー企業が最近リリースした多数の AI 製品の最新のものです。

水曜日に、メタのリリースを発表しましたオーディオクラフト、テキスト プロンプトからオーディオと音楽を作成するオープンソースの生成 AI。 AudioCraft には、音楽作曲用の MusicGen、サウンドエフェクト作成用の AudioGen、AI を使用して MP3 形式を上回るオーディオ圧縮を支援する EnCodec の 3 つのモデルがあります。

著作権の問題について疑問がある場合のために付け加えておきますが、MusicGen はメタが所有し、ライセンスを取得した音楽についてトレーニングを受けています。

Meta は、OpenAI、Google、Microsoft と競合して、AI を活用したツールを大衆に提供することを積極的に推進してきました。 7月にオープンソースをリリースしたラマ2、LLM (大規模言語モデル) の最新バージョン。

OpenAI の GPT-4 や Google の PaLM 2 とは異なり、Llama 2 はオープンソースであり、AI 開発の透明性を信じる開発者や倫理学者の間でメタ ポイントを獲得しています。 Metaのローンチの噂もあるAI「人」Instagram、Facebook、WhatsApp の別名チャットボット。

マッシュ可能な光の速度

AudioCraftはミュージシャンやサウンドデザイナーを念頭に置いて設計されており、「インスピレーションを提供し、人々が素早くブレインストーミングを行い、新しい方法で楽曲を反復できるよう支援する」と発表文にはある。

ブログ投稿の例には、「風が吹いて口笛を吹く」というプロンプトのオーディオ サンプルと、「キャッチーなメロディー、トロピカルなパーカッション、陽気なリズムがビーチにぴったりのポップ ダンス トラック」が含まれており、それらの説明のようにうまく聞こえます。

最近の生成 AI 開発の多くは、より単純なプロセスであるテキストと画像の生成に焦点を当てています。

Text-to-audio はさらに複雑な取り組みですが、Meta はそれを解読したようです。 AudioCraft は、独自の EnCodec ニューラル オーディオ コーデックを使用して生の信号からオーディオ トークンを学習し、モデルの新しい「語彙」を作成します。

次に、この音声語彙に基づいて言語モデルをトレーニングし、モデルが音声とテキストの関連性を理解できるようにします。 AudioCraft はオープンソースでもあるため、コードは GitHub で入手でき、ユーザーは自分で調べてテストできます。

Leave a Reply

Your email address will not be published. Required fields are marked *

Subscribe Now & Never Miss The Latest Tech Updates!

Enter your e-mail address and click the Subscribe button to receive great content and coupon codes for amazing discounts.

Don't Miss Out. Complete the subscription Now.