Web3における音楽制作を変革する人工知能の役割

2023年4月、ワーナーミュージックグループの最高デジタル責任者でビジネス開発のエグゼクティブバイスプレジデントであるオアナ・ルクサンドラ氏は、KocooのThe Hashに語り、人工知能(AI)によって駆動される音楽ツールが「これまでにないように世界を開放し、音楽やエンターテイメント産業全体で『新しい創造性やサブジャンル』を醸成することを期待している」と述べました。

ルクサンドラ氏の見通しは楽観的ですが、多くのミュージシャンたちの懸念を認識しています。「非常に注意深くなる必要がある」と彼女は述べ、「アーティストの創造性と権利を保護することが重要である」と指摘しました。ルクサンドラ氏がThe Hashに出演する数日前、AIによって生成された偽物の音楽トラックである「Heart On My Sleeve」が話題になりました。この曲は、シンガーソングライターのドレイクとウィークエンドの声を模倣していましたが、どちらのアーティストもその制作に参加していなかったのです。代わりに、曲の制作者たちは、アーティストの音楽を使って人工知能ボットをトレーニングしました。これにより、レーベルオーナーのユニバーサルミュージックグループが怒りました。

他のミュージシャンたちは、新しい技術を歓迎する傾向にあります。その後1週間も経たないうちに、エレクトロポップミュージシャンのグライムスは、彼女の声を使用してAIダビングされた曲を作成するようファンに招待し、印税を50/50で分ける提供をしました。これは、AIディープフェイクのジレンマに対する創造的な解決策の一つを示しています。

知的財産の問題を念頭に置きながら、AI音楽ツールがアーティストの手の届く新しい表現形態を提供できることは疑いの余地がありません。時には、AIは、アーティストの能力に技術的または知的なギャップを埋めることによって、野心的なコンセプトをクリック数で現実のものにすることができます。これらのツールは、サウンドエンジニアリングのタスクをより効率的に実行することもでき、音楽をリリースするまでの障壁や時間を低下させることができます。

Web3を見据えると、企業やアーティストは、メタバースをはじめとする没入型、インタラクティブなユーザー生成コンテンツと音楽を組み合わせることで、AIをさらに進化させています。

Web3のAI音楽ツール

すでにいくつかのクリプトネイティブのミュージシャンやプラットフォームが、AIツールを実践に取り入れるための創造的な方法を見つけています。

例えば、VNCCIIは、シドニーを拠点とする女性プロデューサーのサマンサ・トーバーのメタバース初の別名です。業界をリードするリアルタイム3Dクリエーションツールであるアンリアルエンジンを利用して、トーバーは彼女のアバターを身に着け、メタバースからライブ放送のインタビューをストリーミングしたり、バーチャルコンサートやショーでパフォーマンスを行ったりしています。どんなセットや衣装の変更と同様に、VNCCIIの芸術的アイデンティティのデジタルコンポーネントは、彼女の芸術性の境界を拡張しています。

Web3音楽会社Pixelnyxは、拡張現実(AR)体験とメタバースゲームを組み合わせ、アーティストがファンにとって忘れられない体験を構築するのを支援することに焦点を当てています。電子音楽プロデューサーのDeadmau5が共同設立したPIXELYNXは、The Sandboxでファンをクエストに送ったり、Decentralandでショーを開催したりすることで知られており、AI、Web3、ユーザー生成コンテンツ(UGC)を利用して、従来のファンダムの概念を進化させることを目指しています。

PIXELNYXは4月に、公式ライセンスを取得したアーティストコンテンツを使用してAIパワードの音楽コンパニオンを作成できるツール「Korus」をリリースしました。

このように使用される場合、AI音楽ツールは、アーティストの創造的スタイルを支援、拡張、または強化することができます。これらのツールはまだアーティストを置き換えるには十分に優れていませんが、人間との相互作用を継続することで、印象的で「学習する」ことができます。Spotifyが独自のバージョンの人工音楽キュレーションをテストした後、ミュージシャンをAIで置き換えることは決して人気があるとは言えませんでした。しかし、AIに関する論争にもかかわらず、今日の音楽アーティストは、クラフトを尊重する方法でAI支援の音楽制作を利用することで利益を得ることができるかもしれません。

アイデアとコラボレーション

自己適応型のAI音楽プラットフォームであるWarpSoundは、ビジネス提供にブロックチェーンベースのコレクタブルとデジタルアバターを統合する方法をいくつか見つけました。同社は、音楽コンテンツ、非代替可能トークン(NFT)、およびソーシャルエクスペリエンスを生産し、スタイルの範囲でノートごとにオリジナルの音楽を作曲するソフトウェアAPIを近日中にリリースする予定です。

創業者兼CEOのクリス・マッギャリー氏は、以前FacebookのVRユニットのオクルスで音楽担当を務め、WarpSoundのツールがアーティストが創造的なプロセスに新しいインスピレーションとソース素材を見つけるのを助けると述べています。同社は、The SandboxのGame Maker Fundの受賞者であり、アーティストが生成音楽を実験できる場所をプラットフォーム内に構築する計画を立てています。

また、同社は、グローバルペイメントプロバイダのマスターカードとパートナーシップを組んで、AI音楽スタジオアーティストアクセラレータを立ち上げ、クリエイティブプロセスに新しいメリットがあることを確認しています。

「先週、私はプログラムに参加しているアーティストたちとバーチャルスタジオセッションに参加していました」とマッギャリー氏は述べています。「私たちは、ジェネレーティブAI音楽インターフェースを使って一連の音楽アイデアを提示し、アーティストがそれらを形作り、自分に共鳴する本質的なものを作り出し、自分たちが取り組むことを動機づけられたものにするまで繰り返しました」。

WarpSoundは、トライベッカ映画祭とYouTubeと提携して、アーティストと観客の間でインタラクティブで遊び心のある音楽体験を創造することにも取り組んでいます。

作曲と編曲

もしもあなたの音楽プロジェクトがライブパフォーマンスよりも完成した製品に重点を置いている場合、たとえばポッドキャスト、メタバースイベント、YouTubeチャンネル、Web3ビデオゲーム、教育コンテンツなどのためにオリジナル楽曲を作曲する場合は、AIを使って作曲と編曲のプロセスを加速することができます。もちろん、世界で最も才能のある奏者たちはおそらく音楽のスケールを寝ている間にも弾けるでしょうが、音響・映像制作の要素が多岐にわたるため、AIを使ってオリジナル楽曲に速いスケール、アルペジオ、ラン、ハーモニーを挿入することが標準的な手法になっています。

Riffusionのようなツールを使えば、ユーザーが提供したテキストプロンプトが音楽に変換されます。Soundfulは、人々がロイヤリティフリーのトラックを生成してダウンロードできる別のAIプラットフォームです。

さらに歌詞を加えたい場合は、万能なツールChatGPTを使えば、最低限のプロンプティングでプレコーラス、コーラス、ブリッジ、アウトロを含む2節の歌を30秒以内に書くことができます。もちろん、歌詞はやや単純であり、チーズ風味のものもありますが、それでもいくつかの最高の曲がそうであるように。

ほとんどの場合、AIによって生成された曲は、機械によって作られたため米国の知的財産法によって保護されることはなく、ライセンス料を支払う必要はありません。ただし、ほとんどのプラットフォームでは定期購読料がかかります。

これらの音はNFTとして発行され、OpenSeaのようなマーケットプレイスで販売することができます。Royal.ioのようなプラットフォームでは、アーティストはサイトに参加して、彼らの曲を分割されたNFTとして提供し、ファンにロイヤルティ支払いを提供することができます。

もっと読む: ミュージックNFTとは何ですか?

AI音楽制作の限界

おそらく、あなたはすでに音楽AIツールはまだそれほど洗練されていないことを聞いたことがあるでしょう、特に最新のAIテキストから画像を生成するツールと比較した場合(これらはすでに完全なコミックブックコレクションを作成するために使用されています)、また、オープンAIのチャットボットChat GPT(報告によるとバー試験に合格したとされています)と比較した場合。

音声制作は、静止したテキストや画像の出力よりも多くの計算能力を必要とするため、その分野では遅れていると専門家らが指摘しています。音楽研究ネットワークWater & Musicのテックおよびストラテジー責任者であるAlexander Floresは、テクノロジーのイノベーションは一般的に最もデータ集約的なフォーマットから最も豊かなフォーマットへと移行すると述べています。AIの場合、AIオーディオやビデオのレンダリングよりもチャットボットのほうが開発が早いのは理にかなっています。

あるオンラインディスカッションスレッドでは、Redditユーザーがこれらの制限を指摘し、AIチャットボットの出力をライターが数秒で校正・編集できるのに対し、曲を聴くのに数分、編集するのに数時間かかると強調しました。機械学習もAIデータセットから学ぶのに遅れており、音声ファイルにはファイルの属性(ジャンル、テンポ、キー、楽器など)について教える包括的なテキスト説明がほとんど含まれていないため、テキストや画像ベースのAIは数千の単語やビジュアルを素早くトロールすることができます。

“コンテンツを消費するのにかかる時間は非常に重要です。”とFlores氏は述べています。 “曲の場合、3分間ロックインされます。それを速くすることはできません。なぜなら、曲を実際に書かれたものとして体験しなくなってしまうからです。”

さらに、画像は静止しているのに対し、曲はより動的です。「オーディオは単純に次元が高いだけです」と、クリエイティブテクノロジーラボであるSony CSLのマネージングリサーチャーであるStefan Lattnerは、Water & Musicの最初のWavelengths Summitでのパネルで述べています。「画像には固定されたピクセル数がありますが、音声には生成する秒数が可変です。」

それでも、Water & Musicは創造的なAIを、音楽業界におけるNapster以来の最も破壊的なテクノロジーと呼んでいます。Napsterは音楽配信をほぼ無料にし、国境を越えて許可なく配信することができるようにしたピアツーピアのファイル共有アプリケーションであり、クリプトネイティブには馴染みのある概念です。

ロージー・パーパーによる編集。

We will continue to update Kocoo; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

ブロックチェーン

NFTの取引量は減少しているが、それは開発者がWeb3に参入するのを止めていない

アルケミーのQ2 Web3開発レポートによると、NFTの取引量は41%減少しましたが、EthereumやPolygonなどのチェーン全体で約600万...

ブロックチェーン

「エムルゴ、カルダノから「欠けている」とされる21の領域に投資して埋める予定:エムルゴのCEO」

エムルゴのCEOであるKen Kodamaは、ギャップの中でも、採用を妨げる最も緊迫した問題は開発者の経験だと述べました

ブロックチェーン

「フロア価格の下落に伴い、主要なNFTコレクションは月間の損失が2桁に達しています」

「NFT市場の損失は、1か月間で9.6%減少したイーサリアムの下落を上回っています」

ブロックチェーン

「東南アジアのスーパーアプリGrab、Web3ムーブメントに参加し、ブロックチェーン報酬を導入」

東南アジアのオールインワンアプリであるGrabは、PolygonベースのWeb3ウォレットと非代替可能トークン(NFT)バウチャーのサ...

NFT

ナイキ、FortniteゲームとのNFT統合を示唆

ナイキは、人気のあるゲーム「フォートナイト」内でスニーカーをテーマにしたNFTコレクションを発売する可能性を示唆しています

NFT

ボアードエイプヨットクラブのNFTの床価格が20ヶ月ぶりの低水準に下落

ユガラボのNFTコレクションの床価格は日曜の夜に27.4 ETH(約53,000ドル)まで下落し、その後わずかに回復しました