آمازون از مجموعه جدید مدل‌های چندوجهی هوش مصنوعی رونمایی کرد

شرکت آمازون در جریان کنفرانس سالانه re:Invent، مجموعه جدیدی از مدل‌های مولد هوش مصنوعی چندوجهی به نام Nova را معرفی کرد.

به گزارش تک‌ناک، این مجموعه شامل چهار مدل تولید متن با نام‌های Micro، Lite، Pro و Premier است. مدل‌های Micro، Lite و Pro از هم‌اکنون برای مشتریان شرکت آمازون قابل‌ استفاده هستند و مدل Premier در اوایل سال ۲۰۲۵ در دسترس قرار خواهد گرفت.

همچنین مدل‌های تولید تصویر Nova Canvas و تولید ویدیو Nova Reel نیز معرفی شدند، که هر دو از صبح سه‌شنبه روی پلتفرم شرکت آمازون عرضه شدند.

اندی جسی، مدیرعامل آمازون، در این کنفرانس اعلام کرد: «ما به کار روی مدل‌های پیشرفته خود ادامه داده‌ایم و این مدل‌ها در ماه‌های اخیر پیشرفت‌های چشمگیری داشته‌اند. اگر ما توانسته‌ایم از این مدل‌ها بهره‌مند شویم، شما نیز به طور قطع ارزشمند بودن آنها را تجربه خواهید کرد.»

01
از 04
ویژگی‌های مدل‌های هوش مصنوعی Nova آمازون

مدل‌های چندوجهی هوش مصنوعی Nova شرکت آمازون که برای ۱۵ زبان مختلف (بیشتر انگلیسی) بهینه‌سازی شده‌اند، از نظر اندازه و قابلیت‌ها متنوع هستند، که این ویژگی‌ها عبارت‌انداز:

Micro: این مدل تنها قادر به پردازش و تولید متن است، اما با کمترین تأخیر، پاسخ‌ها را سریع‌تر از سایر مدل‌ها تولید می‌کند.
Lite: این مدل علاوه بر متن، ورودی‌های تصویر و ویدیو را نیز پردازش می‌کند و از سرعت پردازش مناسبی برخوردار است.
Pro: مدلی متعادل از نظر دقت، سرعت و هزینه، که برای طیف وسیعی از وظایف مناسب است.
Premier: قدرتمندترین مدل در این خانواده که برای وظایف پیچیده طراحی شده است و بیشتر به‌ عنوان یک مدل «آموزش‌دهنده» برای تولید مدل‌های سفارشی استفاده می‌شود.

مدل‌های Lite، Pro و Premier توانایی تحلیل متن، تصاویر و ویدیو را دارند و برای وظایفی مانند: پردازش اسناد، خلاصه‌سازی نمودارها و جلسات طراحی شده‌اند.

اندی جسی ادعا کرد که این مدل‌ها از سریع‌ترین و کم‌هزینه‌ترین نمونه‌های موجود در بازار هستند و از طریق پلتفرم شرکت آمازون در دسترس کاربران قرار دارند.

02
از 04
معرفی Canvas و Reel

همچنین شرکت آمازون از دو مدل مولد رسانه‌ای به نام‌های Nova Canvas و Nova Reel رونمایی کرد:

Canvas: این مدل به کاربران اجازه می‌دهد تصاویر را بر اساس ورودی‌ها (مانند حذف پس‌زمینه) تولید و ویرایش کنند. همچنین کاربران می‌توانند طرح رنگ و چیدمان تصاویر را تنظیم کنند.
Reel: مدلی پیشرفته‌تر که امکان تولید ویدیوهای کوتاه حداکثر 6 ثانیه‌ای را از ورودی‌ها یا تصاویر مرجع فراهم می‌کند. کاربران می‌توانند حرکات دوربین را تنظیم و ویدیوهایی با افکت‌های Pan، چرخش ۳۶۰ درجه و زوم تولید نمایند.

رونمایی آمازون از خانواده جدید مدل‌های چندوجهی هوش مصنوعی

نسخه فعلی Reel تنها قادر به تولید ویدیوهای 6 ثانیه‌ای می‌باشد، اما شرکت آمازون اعلام کرده است که به‌ زودی نسخه‌ای با قابلیت تولید ویدیوهای دو دقیقه‌ای عرضه خواهد شد.

آمازون خانواده جدید مدل‌های چندوجهی هوش مصنوعی خود را معرفی کرد

03
از 04
آینده مدل‌های هوش مصنوعی Nova آمازون

مدل‌های Nova دارای پنجره متنی پیشرفته‌ای هستند. مدل Micro می‌تواند تا ۱۲۸,۰۰۰ توکن (معادل حدود ۱۰۰,۰۰۰ کلمه) را پردازش کند، در حالی که مدل‌های Lite و Pro پنجره‌های متنی با ظرفیت ۳۰۰,۰۰۰ توکن دارند، که معادل ۲۲۵,۰۰۰ کلمه یا ۳۰ دقیقه ویدیو است.

این در حالی است که در اوایل سال ۲۰۲۵، ظرفیت پنجره متنی برخی مدل‌ها به بیش از ۲ میلیون توکن افزایش خواهد یافت.

شرکت آمازون اعلام کرد که این مدل‌های چندوجهی هوش مصنوعی دارای سیستم‌های داخلی برای استفاده مسئولانه هستند. این تدابیر شامل واترمارک‌گذاری، مدیریت محتوای تولیدی و جلوگیری از انتشار محتوای مضر است.

همچنین اندی جسی خبر از توسعه مدل‌های گفتار به گفتار برای سه‌ماهه اول ۲۰۲۵ و مدل‌های «هر ورودی به هر خروجی» برای اواسط سال ۲۰۲۵ داد.

این مدل‌ها قرار است که ورودی‌هایی مانند: متن، گفتار، تصویر و ویدیو را دریافت و انواع مشابهی از خروجی را تولید کنند.

04
از 04
شفافیت در داده‌های آموزشی

شرکت آمازون جزئیات دقیقی درباره داده‌های مورد استفاده برای آموزش مدل‌های خود ارائه نکرده و تنها اعلام کرده است که این داده‌ها ترکیبی از منابع اختصاصی و دارای مجوز هستند.

همچنین این شرکت سیاست‌هایی برای حمایت از مشتریان در صورت بروز مسائل مربوط به حق کپی‌رایت ارائه کرده است.