「MusicGenはChatGPTなどの大規模言語モデルと同様にTransformerを利用したモデルです。言語モデルは文の次の言葉を予測しますが、MusicGenは音楽の次のセクションを予測する仕組み。トレーニングには2万時間分のライセンスされた音楽が利用されており、具体的には1万個の内部データセットのほか、ShutterstockとPond5のデータを利用したと述べられています」 Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように - GIGAZINE https://gigazine.net/news/20230612-audiocraft-music-gen/
[Mastodon] 2023-06-16 21:53:37
|