شرکت آمازون در جریان کنفرانس سالانه re:Invent، مجموعه جدیدی از مدلهای مولد هوش مصنوعی چندوجهی به نام Nova را معرفی کرد.
به گزارش تکناک، این مجموعه شامل چهار مدل تولید متن با نامهای Micro، Lite، Pro و Premier است. مدلهای Micro، Lite و Pro از هماکنون برای مشتریان شرکت آمازون قابل استفاده هستند و مدل Premier در اوایل سال ۲۰۲۵ در دسترس قرار خواهد گرفت.
همچنین مدلهای تولید تصویر Nova Canvas و تولید ویدیو Nova Reel نیز معرفی شدند، که هر دو از صبح سهشنبه روی پلتفرم شرکت آمازون عرضه شدند.
اندی جسی، مدیرعامل آمازون، در این کنفرانس اعلام کرد: «ما به کار روی مدلهای پیشرفته خود ادامه دادهایم و این مدلها در ماههای اخیر پیشرفتهای چشمگیری داشتهاند. اگر ما توانستهایم از این مدلها بهرهمند شویم، شما نیز به طور قطع ارزشمند بودن آنها را تجربه خواهید کرد.»
فهرست مطالب
ویژگیهای مدلهای هوش مصنوعی Nova آمازون
مدلهای چندوجهی هوش مصنوعی Nova شرکت آمازون که برای ۱۵ زبان مختلف (بیشتر انگلیسی) بهینهسازی شدهاند، از نظر اندازه و قابلیتها متنوع هستند، که این ویژگیها عبارتانداز:
- Micro: این مدل تنها قادر به پردازش و تولید متن است، اما با کمترین تأخیر، پاسخها را سریعتر از سایر مدلها تولید میکند.
- Lite: این مدل علاوه بر متن، ورودیهای تصویر و ویدیو را نیز پردازش میکند و از سرعت پردازش مناسبی برخوردار است.
- Pro: مدلی متعادل از نظر دقت، سرعت و هزینه، که برای طیف وسیعی از وظایف مناسب است.
- Premier: قدرتمندترین مدل در این خانواده که برای وظایف پیچیده طراحی شده است و بیشتر به عنوان یک مدل «آموزشدهنده» برای تولید مدلهای سفارشی استفاده میشود.
مدلهای Lite، Pro و Premier توانایی تحلیل متن، تصاویر و ویدیو را دارند و برای وظایفی مانند: پردازش اسناد، خلاصهسازی نمودارها و جلسات طراحی شدهاند.
اندی جسی ادعا کرد که این مدلها از سریعترین و کمهزینهترین نمونههای موجود در بازار هستند و از طریق پلتفرم شرکت آمازون در دسترس کاربران قرار دارند.
معرفی Canvas و Reel
همچنین شرکت آمازون از دو مدل مولد رسانهای به نامهای Nova Canvas و Nova Reel رونمایی کرد:
- Canvas: این مدل به کاربران اجازه میدهد تصاویر را بر اساس ورودیها (مانند حذف پسزمینه) تولید و ویرایش کنند. همچنین کاربران میتوانند طرح رنگ و چیدمان تصاویر را تنظیم کنند.
- Reel: مدلی پیشرفتهتر که امکان تولید ویدیوهای کوتاه حداکثر 6 ثانیهای را از ورودیها یا تصاویر مرجع فراهم میکند. کاربران میتوانند حرکات دوربین را تنظیم و ویدیوهایی با افکتهای Pan، چرخش ۳۶۰ درجه و زوم تولید نمایند.
نسخه فعلی Reel تنها قادر به تولید ویدیوهای 6 ثانیهای میباشد، اما شرکت آمازون اعلام کرده است که به زودی نسخهای با قابلیت تولید ویدیوهای دو دقیقهای عرضه خواهد شد.
آینده مدلهای هوش مصنوعی Nova آمازون
مدلهای Nova دارای پنجره متنی پیشرفتهای هستند. مدل Micro میتواند تا ۱۲۸,۰۰۰ توکن (معادل حدود ۱۰۰,۰۰۰ کلمه) را پردازش کند، در حالی که مدلهای Lite و Pro پنجرههای متنی با ظرفیت ۳۰۰,۰۰۰ توکن دارند، که معادل ۲۲۵,۰۰۰ کلمه یا ۳۰ دقیقه ویدیو است.
این در حالی است که در اوایل سال ۲۰۲۵، ظرفیت پنجره متنی برخی مدلها به بیش از ۲ میلیون توکن افزایش خواهد یافت.
شرکت آمازون اعلام کرد که این مدلهای چندوجهی هوش مصنوعی دارای سیستمهای داخلی برای استفاده مسئولانه هستند. این تدابیر شامل واترمارکگذاری، مدیریت محتوای تولیدی و جلوگیری از انتشار محتوای مضر است.
همچنین اندی جسی خبر از توسعه مدلهای گفتار به گفتار برای سهماهه اول ۲۰۲۵ و مدلهای «هر ورودی به هر خروجی» برای اواسط سال ۲۰۲۵ داد.
این مدلها قرار است که ورودیهایی مانند: متن، گفتار، تصویر و ویدیو را دریافت و انواع مشابهی از خروجی را تولید کنند.
شفافیت در دادههای آموزشی
شرکت آمازون جزئیات دقیقی درباره دادههای مورد استفاده برای آموزش مدلهای خود ارائه نکرده و تنها اعلام کرده است که این دادهها ترکیبی از منابع اختصاصی و دارای مجوز هستند.
همچنین این شرکت سیاستهایی برای حمایت از مشتریان در صورت بروز مسائل مربوط به حق کپیرایت ارائه کرده است.