音楽生成AI「Music Gen」と「SOUNDRAW」を触ってみた!

音楽生成AI「Music Gen」と「SOUNDRAW」を触ってみた!

はじめまして、システム部のサカイです。

最近話題の生成系AIですが、文章生成AIや画像生成AIがクオリティの高い成果物ができることに驚いています。ということで自分も生成系AIを使って何か作ってみようと思い、今回は楽曲生成AIを使って曲を作ってみることにしました。

ひとえに曲を作るといっても適当に作るのではなく、目標を決めてどれだけ近づけるかで使いやすさの指標にしたいと思います。

ということで今回の目標は「ビル・エヴァンスっぽい曲を作る」にします。ビル・エヴァンスは20世紀のジャズ界で活躍したピアニストですね。ビル・エヴァンスと言ってもいろいろな曲がありますので、ざっくりと「ゆったりとしたピアノで奏でるジャズ」を今回の成果物の目標にしたいと思います。

「っぽい」という点は個人の感覚に因るところが大きいですが、さていったいどうなるでしょうか?
まず驚いたのは楽曲生成系のサービスがたくさんあることです、その数20件弱。その中から今回はMetaが開発したMusic Genと日本の会社が開発したSOUNDRAWという2つのサービスを使用することにしました。(本当はGoogleの開発したMusicLMを使用したかったのですが、待てど暮らせどwait listのまま使用できる見込みが立ちませんでした… )

結論から言いますと、
Music Genはそれっぽい曲ができ、soundrawではそれっぽい曲はできませんでした。

ただし、この結論は今回の目標に限っての話になります。別のテーマで作曲をした場合はまた違った結果になると思います。

Music Genを使ってみた

Music Genとは?

「MusicGen」は、AIにより、プロンプト(命令文)や既存のメロディーから音楽を生成できる音楽自動生成ツールで、テキストにより作曲したい音楽の説明文を入力すると約12秒のオーディオを作成できるほか、口笛や、ハミング、既存の曲(MP3形式)などからメロディーの候補となる音源も参照できます。

Music Genの特徴

①驚くべき音楽生成
Music Genの大きな特徴は、その多様性とアクセシビリティです。それは、さまざまな音楽ジャンルやスタイルを生成する能力を持っています。それらはクラシック音楽からポップス、ジャズまでと幅広いです。

②直感的なUI
このツールは誰でも簡単に使えるよう設計されています。特別な音楽知識がなくても、独自の曲を作成することができます。これは、音楽制作を民主化するというMetaの目標を反映しています。

③プロジェクトへの活用
Music Genは、AIと音楽がどのように相互作用しうるかを示す素晴らしい一例です。AIが従来の作曲プロセスをどのように補完し、音楽家が新しい方法で音楽を創り出すのを助けることができるのかを示しています。

Music Genを実際に使ってみた

こちらがMusic Genで音楽を作成する画面です。
ファイルを読み込ませることも可能ですが、今回はテキストベースで作成していきます。


まず、箇条書きで曲のイメージを伝えます。
まずは試しに「bill evans, piano, slow, carm」という文字列を与えて作成(Genrate)してみました。数十秒程で曲が完成します。

おー、とても簡単に曲ができました。しかし、何か途中で和音がごちゃっとしていてちょっと微妙ですね。もうちょっと聞きやすくならないかなと、少しプロンプトを変えてみます。

そういえばですが、「Jazz」というキーワードを入れていませんでした。

「ビル・エヴァンス」のキーワードを入れれば分かるかなと思っていましたが、より明確な指示を与えて結果を確認してみます。
「carm」を削除して「night」というキーワードも追加し、「bill evans, jazz, piano, slowly, night」という文字列で生成してみました。さてどうなるでしょうか?

おお、なかなかいい感じですね。生成できる時間が15秒ということで物足りなさはありますがイメージに近いものができたと思います。

今度は箇条書きではなく文章にしてプロンプトに入れてみました。

「ビル・エヴァンスが演奏しているかのような、リラックスした穏やかなピアノ音楽」をDeepLで「Relaxed and calm piano music as if Bill Evans were playing.」と翻訳してプロンプトに入れてみました。その結果はこちら、

これは不要な音が多く聴きづらいですね。音数を減らせばより目標に近い成果物ができると思いました。現時点で生成した音源の編集はできませんが、たとえばMIDIで編集できたりするとかなり使いやすくなるなと思いました。

こちらで紹介したものはすべて無料で使うことができます。
作成した楽曲のダウンロードも曲の右上についているボタンを押すだけでダウンロードできるので、気軽に試すことができるのはとても嬉しいですね。

SOUNDRAWを使ってみた

SOUNDRAWとは?

SOUNDRAWは、AI技術を活用して自動的に楽曲を生成してくれるサービスです。ウェブブラウザ上で動作し、ムードやジャンル、テンポ、曲の長さなどの条件を指定すると、AIがそれに応じたオリジナルの楽曲を作成してくれます。さらに、生成された楽曲は商用利用可能とのことで、プロジェクトにも活用できるとのことです。

SOUNDRAWの特徴

①インターフェースの使いやすさ
SOUNDRAWのウェブインターフェースは非常に使いやすく、直感的な操作が可能です。必要な条件を設定するだけで、簡単に楽曲を生成できました。特に、ムードやジャンルのバリエーションが豊富で、自分のイメージに合った音楽を見つけるのが楽しかったです。

②生成された楽曲の質と独自性
AIによる自動生成という点で、楽曲の質や独自性には若干のバラつきがありました。条件によっては素晴らしい楽曲が生成される一方で、時折単純なパターンの反復と感じることもありました。ただし、それでも商用利用が可能な点は大きな魅力だと感じました。

③利用シーンの幅広さ
SOUNDRAWで生成された楽曲は、様々な用途で活用できると感じました。自分のYouTubeチャンネルのBGMや、プロモーションビデオ、プレゼンテーションなど、様々なコンテンツに音楽を追加することができます。

SOUNDRAWを実際に使ってみた

こちらの画像が楽曲作成画面です。

基本的にはジャンルやムードなどのカテゴリから自分のイメージに合う選択肢を選ぶだけで自動的に音楽が生成されます。

今回はテーマに沿ってカテゴリを選んでいきたいと思います。

と思いきやさっそくジャンルに「JAZZ」がないことに気付きました。

しょうがないので近い物ができそうだと思われるジャンル「Lofi Hip Hop」を選ぶことにしました。あと「R&B」も近そうなのでこの際どっちも選んでみました。

テンポは「Slow」にして

楽器は「ピアノ」のみにします。

しかし、ここで他の楽器のチェックを外してもドラムとベースなどのいわゆるバッキングの音が必ず入ります。あくまでもメインの楽器が選択できるだけのようです。

SOUNDRAWではカテゴリなどを選ぶたびに楽曲が何曲も自動生成されます。

その中から自分のイメージに合った楽曲を探す作業になります。
また、楽曲の右側にあるPro modeをクリックすると細かい調整ができます。
次の画像がPro modeが展開された状態です。

この中になんと楽器を選ぶ項目がありますね。もしかしてピアノ以外をOFFにできるかと思い選択してみるものの、ベースやドラムの種類(音色)が変えられるだけでした。

小一時間いろいろといじってみましたが爽快なビートを止めることができず、ここで心が折れ、最終的に仕上がった曲は以下のリンクから聴けます。だいぶ目標からはかけ離れた曲になりました。

https://soundraw.io/edit_music?m=64c7bd033e28f00015955366

今回は目標がJAZZ縛りだったので期待する成果物はできませんでしたが、最近流行りの作業系チルいミュージックなどは簡単にできました。Youtubeにありそうな作業系BGMです。

またHipHopで使われるようなドープなトラックも簡単にできそうだったので、方向性の合うクリエイターが使ったら無限に曲が作れるのでは?と思いました。ちなみに作った楽曲をダウンロードするには課金が必要です。

上記のようにリンクを作ってシェアするのみなら無料でできます。

まとめ

AIが自動生成する音楽がすばらしく多様性に溢れ、手軽に使用できることが分かりました。しかし、生成される音楽には不協和音やリズムの異常等の問題が生じることがありました。AIの音楽はしばしば「予測可能」で、そこには物足りなさを感じました。

それでも、AIの生み出す音楽の独自性と品質は素晴らしいものであり、その発展に大いに期待しています。ただし、創造力を持つ人間とAIがバランスを取りながら、いかに新たな音楽を作り上げるかが大切だと感じました。

前の記事
«
次の記事
»

技術カテゴリの最新記事