متا مولفه نرم افزاری خود را با قابلیت هوش مصنوعی برای تولید موسیقی منتشر کرده است و بر خلاف گوگل، آن را به صورت منبع باز عرضه کرده است.
به گزارش تکناک، ابزار تولید موسیقی متا به نام MusicGen، که نمونه آن در اینجا قابل مشاهده است، می تواند یک توصیف متنی را (مانند “یک آهنگ پاپ رانندگی با درام های سنگین و پدهای سینت در پس زمینه دهه 80”) به حدود 12 ثانیه صدا تبدیل کند.
در صورت نیاز، با استفاده از صدای مرجع همچون یک آهنگ موجود، می توان MusicGen را “هدایت” کرد تا هم توصیف و هم ملودی را دنبال کند.
متا میگوید که MusicGen با
We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf— Felix Kreuk (@FelixKreuk) June 9, 2023
20,000 ساعت موسیقی آموزش دیده است که شامل 10,000 قطعه موسیقی با گواهی نامه با کیفیت بالا و 390,000 قطعه موسیقی فقط با نوازندگی از ShutterStock و Pond5، که کتابخانه بزرگی از رسانههای موجودی دارد، می باشد. شرکت کدی که برای آموزش مدل استفاده کرده است ارائه نداده ، اما مدلهای پیش آموزشدیده را که هر کسی با سخت افزار مناسب به ویژه GPU با حدود 16GB حافظه میتواند اجرا کند را در دسترس قرار داده است.
MusicGen چطور عمل میکند؟
باید بگوییم اگرچه مطمئناً آنقدر خوب نیست که نوازندگان انسانی را بیکار کند اما قطعات موسیقی آن به اندازه کافی ملودیک هستند، حداقل برای دستورات پایه مانند “موسیقی Chiptunes محیطی” و دستورات همسطح با نتایج تولید شده توسط AI MusicLM گوگل، اما هیچ جایزهای نخواهند گرفت.
سپس، می توانید دستورات پیچیده تری بدهید تا MusicGen را به مشکل بیندازید: “Lofi slow BPM electro chill با نمونههای ارگانیک”. به طرز شگفت انگیزی، MusicGen در ارتباط با هماهنگی موسیقی، MusicLM را شکوفا می کند و چیزی تولید کرد که با راحتی در Lofi Girl قرار میگرفت.
برای تغییر فضا، می توانید با استفاده از هر دو ابزار سعی کنید یک سرود پیانویی به سبک George Gershwin تولید کنید. اگر از واژه “سعی کنید” استفاده می کنیم به این دلیل است که گوگل در تلاش برای جلوگیری از مشکلات حق تکثیر موسیقی در ابزارهای تولید موسیقی، فیلتری را در نسخه عمومی MusicLM پیاده کرده است که دستوراتی که در آن نام خاص هنرمندان ذکر شده باشد، را مسدود میکند.
MusicGen چنین فیلتری ندارد اما باید بگوییم که نتایج برای “موسیقی پیانوی پسزمینه به سبک Gershwin”، مطلوبیتی نداشت.
بدیهی است که موسیقی تولیدی (مانند Riffusion، Dance Diffusion و OpenAI’s Jukebox) در حال بهبود است. اما مسائل اخلاقی و قانونی عمده هنوز باید حل شوند. AI مانند MusicGen با “یادگیری” از موسیقیهای موجود، برای تولید اثرات مشابه استفاده می کند که این یک واقعیت است که با آن، همه هنرمندان – یا کاربران AI مولد – راحت نیستند.
با گسترش استفاده از AI تولیدی در موسیقی، آهنگهای خانگی که از هوش مصنوعی مولد برای ایجاد صداهای آشنا استفاده میکنند و میتوان آنها را معتبر یا حداقل به اندازه کافی نزدیک دانست، در فضای مجازی منتشر میشوند. شرکت های موسیقی با استناد به نگرانیهای مربوط به مالکیت معنوی به سرعت آنها را به شرکای استریم معرفی کردند – و پیروز شدهاند. اما هنوز روشن نیست که آیا موسیقی «deepfake» حق چاپ هنرمندان، برچسبها و سایر دارندگان حقوق را نقض میکند یا خیر.
ممکن است طولی نکشد که راهنمایی در این مورد منتشر شود. چندین دعوای قضایی در حال جریان هستند که به احتمال زیاد تاثیراتی بر AI مولد موسیقی خواهند گذاشت، از جمله یکی مربوط به حقوق هنرمندانی که آثارشان برای آموزش سیستمهای هوش مصنوعی بدون اطلاع یا رضایت آنها استفاده میشود.
متا به نوبه خود، محدودیتی در استفاده از MusicGen اعمال نمیکندو میگوید که تمام موسیقیهایی که MusicGen بر آنها آموزش دیده است، از جمله یک توافق با Shutterstock “تحت قراردادهای قانونی با صاحبان حقوق” پوشش داده شدهاند.