AI News HubLIVE
サイト内リライト1 分で読了

大西洋誌、AIトレーニングに使用された音楽の検索可能なデータベースを作成

大西洋誌の記者Alex Reisner氏は、AIモデルのトレーニングに使用されている4つの音楽データセットを発見し、一般公開しました。そのうち2つは1200万曲と900万曲という巨大なものです。GoogleとStability AIがこれらのデータセットの使用を確認しています。

ソースThe Verge AI著者: Terrence O’Brien

大西洋誌の記者アレックス・ライスナー氏は、AIモデルのトレーニングに使用されている4つの音楽データセットを最近発見し、一般公開しました。そのうち2つは1200万曲と900万曲という巨大なもので、残りの2つはそれぞれ10万曲以上と小規模ながらも重要なトレーニングデータです。ライスナー氏によると、これらのデータセットは数千回ダウンロードされており、GoogleとStability AIが研究論文で使用を確認しています。また、Free Music Archiveのようなデータセットは個人のストリーミングは無料ですが、商用利用にはライセンスが必要です。

データセットは理論上インターネット上で自由に入手可能ですが、トレーニングデータとして使用するのはZIPファイルをダウンロードしてAIモデルに入力するほど単純ではありません。ライスナー氏は、データセットのうち3つがYouTubeやSpotifyの曲へのリンクリストとして配布されており、AI開発者は自動化ツールを使用して実際の音声をダウンロードします。これらのツールはログイン、広告、クリエイターに収益をもたらす可能性のある仕組みを回避できるものもあり、プラットフォームの利用規約に違反します。この慣行は著作権やデータセットの使用に関する法的問題を引き起こしています。

データセットには、レディー・ガガ、フレッド・アゲイン..、レディオヘッド、エイフェックス・ツイン、ウータン・クラン、ブルース・スプリングスティーン、実験音楽家のハインバッハなど、多くの有名アーティストが含まれています。大西洋誌のAI Watchdogサイトでは、これらの曲や書籍、その他のメディアを検索できます。このデータベースは一般に前例のない透明性を提供する一方で、AIトレーニングデータの出典と著作権問題についての幅広い議論を呼んでいます。