نرم افزار هوشمند تولید موسیقی متا منتشر شد

متا مولفه نرم افزاری خود را با قابلیت هوش مصنوعی برای تولید موسیقی منتشر کرده است و بر خلاف گوگل، آن را به صورت منبع باز عرضه کرده است.

به گزارش تکناک، ابزار تولید موسیقی متا به نام MusicGen، که نمونه آن در اینجا قابل مشاهده است، می تواند یک توصیف متنی را (مانند “یک آهنگ پاپ رانندگی با درام های سنگین و پدهای سینت در پس زمینه دهه 80”) به حدود 12 ثانیه صدا تبدیل کند.

در صورت نیاز، با استفاده از صدای مرجع همچون یک آهنگ موجود، می توان MusicGen را “هدایت” کرد تا هم توصیف و هم ملودی را دنبال کند.

متا می‌گوید که MusicGen با

We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf
— Felix Kreuk (@FelixKreuk) June 9, 2023

20,000 ساعت موسیقی آموزش دیده است که شامل 10,000 قطعه موسیقی با گواهی نامه با کیفیت بالا و 390,000 قطعه موسیقی فقط با نوازندگی از ShutterStock و Pond5، که کتابخانه بزرگی از رسانه‌های موجودی دارد، می باشد. شرکت کدی که برای آموزش مدل استفاده کرده است ارائه نداده ، اما مدل‌های پیش آموزش‌دیده را که هر کسی با سخت افزار مناسب به ویژه GPU با حدود 16GB حافظه می‌تواند اجرا کند را در دسترس قرار داده است.

MusicGen چطور عمل می‌کند؟

باید بگوییم اگرچه مطمئناً آنقدر خوب نیست که نوازندگان انسانی را بیکار کند اما قطعات موسیقی آن به اندازه کافی ملودیک هستند، حداقل برای دستورات پایه مانند “موسیقی Chiptunes محیطی” و دستورات همسطح با نتایج تولید شده توسط AI MusicLM گوگل، اما هیچ جایزه‌ای نخواهند گرفت.

سپس، می توانید دستورات پیچیده تری بدهید تا MusicGen را به مشکل بیندازید: “Lofi slow BPM electro chill با نمونه‌های ارگانیک”. به طرز شگفت انگیزی، MusicGen در ارتباط با هماهنگی موسیقی، MusicLM را شکوفا می کند و چیزی تولید کرد که با راحتی در Lofi Girl قرار می‌گرفت.

برای تغییر فضا، می توانید با استفاده از هر دو ابزار سعی کنید یک سرود پیانویی به سبک George Gershwin تولید کنید. اگر از واژه “سعی کنید” استفاده می کنیم به این دلیل است که گوگل در تلاش برای جلوگیری از مشکلات حق تکثیر موسیقی در ابزارهای تولید موسیقی، فیلتری را در نسخه عمومی MusicLM پیاده کرده است که دستوراتی که در آن نام خاص هنرمندان ذکر شده باشد، را مسدود می‌کند.

MusicGen چنین فیلتری ندارد اما باید بگوییم که نتایج برای “موسیقی پیانوی پس‌زمینه به سبک Gershwin”، مطلوبیتی نداشت.

بدیهی است که موسیقی تولیدی (مانند Riffusion، Dance Diffusion و OpenAI’s Jukebox) در حال بهبود است. اما مسائل اخلاقی و قانونی عمده هنوز باید حل شوند. AI مانند MusicGen با “یادگیری” از موسیقی‌های موجود، برای تولید اثرات مشابه استفاده می کند که این یک واقعیت است که با آن، همه هنرمندان – یا کاربران AI مولد – راحت نیستند.

با گسترش استفاده از AI تولیدی در موسیقی، آهنگ‌های خانگی که از هوش مصنوعی مولد برای ایجاد صداهای آشنا استفاده می‌کنند و می‌توان آن‌ها را معتبر یا حداقل به اندازه کافی نزدیک دانست، در فضای مجازی منتشر می‌شوند. شرکت های موسیقی با استناد به نگرانی‌های مربوط به مالکیت معنوی به سرعت آنها را به شرکای استریم معرفی کردند – و پیروز شده‌اند. اما هنوز روشن نیست که آیا موسیقی «deepfake» حق چاپ هنرمندان، برچسب‌ها و سایر دارندگان حقوق را نقض می‌کند یا خیر.

ممکن است طولی نکشد که راهنمایی در این مورد منتشر شود. چندین دعوای قضایی در حال جریان هستند که به احتمال زیاد تاثیراتی بر AI مولد موسیقی خواهند گذاشت، از جمله یکی مربوط به حقوق هنرمندانی که آثارشان برای آموزش سیستم‌های هوش مصنوعی بدون اطلاع یا رضایت آنها استفاده می‌شود.

متا به نوبه خود، محدودیتی در استفاده از MusicGen اعمال نمی‌کندو می‌گوید که تمام موسیقی‌هایی که MusicGen بر آنها آموزش دیده است، از جمله یک توافق با Shutterstock “تحت قراردادهای قانونی با صاحبان حقوق” پوشش داده شده‌اند.