شرکت انویدیا به تازگی از ابزار هوش مصنوعی جدیدی با نام Fugatto رونمایی کرده است که توانایی تولید صداها، موسیقی و گفتاری را دارد که پیش از این هرگز شنیده نشدهاند.
به گزارش تکناک، این ابزار میتواند بر اساس ورودیهای متنی یا صوتی، صداهایی جدید و متفاوت ایجاد کند، که حتی در دادههای آموزشی آن نیز وجود نداشتهاند.
شرکت انویدیا اعلام کرده است که Fugatto قادر است «صداهایی که هرگز شنیده نشدهاند» بسازد، مانند صدای ترومپتی که بهجای صدای معمول، صدای میومیو کردن گربه را تولید میکند.
این ابزار، علاوه بر تولید صدا، امکان ویرایش موسیقی و تغییر ویژگیهای صوتی را نیز ارائه میدهد.
فهرست مطالب
تواناییهای منحصر به فرد ابزار هوش مصنوعی Fugatto
یکی از قابلیتهای قابل توجه Fugatto، تولید آهنگها و افکتهای صوتی پیچیده بر اساس درخواستهای متنی خاص است.
به عنوان مثال، این ابزار میتواند آهنگی را ایجاد کند که با توصیفی مانند «ساکسیفونی که زوزه میکشد، واقواق میکند و سپس به موسیقی الکترونیکی همراه با صدای سگها تغییر میکند»، تطابق داشته باشد.
همچنین این ابزار توانایی ایجاد افکتهای صوتی منحصربهفرد بر اساس توصیفهایی نظیر «ضربانهای بم عمیق همراه با صدای زیر دیجیتال متناوب، شبیه به صدای بیدار شدن یک ماشین عظیم هوشمند» را دارد.
این قابلیتها نشاندهنده دامنه گسترده امکانات ابزار هوش مصنوعی Fugatto در دنیای تولید صوت و موسیقی هستند.
تغییر صدا و ویرایش موسیقی
ابزار هوش مصنوعی Fugatto میتواند صدای افراد را نیز تغییر دهد، از جمله میتوان به تغییر لهجه یا ایجاد لحنهای احساسی متفاوت، مانند: خشمگین یا آرام اشاره کرد.
همچنین این ابزار در ویرایش موسیقی نیز تواناییهای پیشرفتهای دارد، مانند جدا کردن صدای خواننده از یک آهنگ، افزودن سازهای جدید یا حتی تغییر ملودی اصلی، مثل جایگزینی صدای پیانو با خواننده اپرا، که از جمله تواناییهای آن است.
جزئیات آموزشی و چالشهای حقوقی
به نقل از ورج، مقالهای که همراه با معرفی Fugatto منتشر شده است، نشان میدهد که این ابزار با مجموعه دادهای شامل میلیونها نمونه صوتی آموزش دیده است.
یکی از این منابع، کتابخانه افکتهای صوتی BBC بوده است. به گفته انویدیا، دستورالعملهای خاصی برای گسترش دامنه وظایف این مدل طراحی شدهاند، که امکان انجام وظایف جدید بدون نیاز به دادههای اضافی را فراهم کرده است.
در حالی که ابزارهای صوتی هوش مصنوعی دیگری نیز توسط شرکتهایی نظیر Stability AI، OpenAI، Google DeepMind، ElevenLabs و Adobe توسعه یافتهاند، اما Fugatto با ادعای تولید صداهای کاملاً جدید، یک قدم جلوتر قرار دارد.
این در حالی است که برخی از استارتآپهای فعال در زمینه موسیقی مبتنی بر هوش مصنوعی با شکایات حقوقی مرتبط با نقض حق تألیف روبهرو شدهاند.
گزارشهای اخیر نیز نشان دادهاند که انویدیا و دیگر شرکتها، مدلهای خود را با استفاده از زیرنویسهای هزاران ویدیوی یوتیوب آموزش دادهاند.
دسترسی عمومی به Fugatto
شرکت انویدیا هنوز اعلام نکرده است که ابزار Fugatto چه زمانی در دسترس عموم قرار خواهد گرفت یا اینکه آیا به صورت عمومی منتشر میشود یا خیر. با وجود این، قابلیتهای نوآورانه این ابزار میتواند تحولی بزرگ در دنیای تولید و ویرایش صدا ایجاد کند.