با انتشار رسمی مدل هوش مصنوعی Gemma 3n، گوگل امکان اجرای هوش مصنوعی پیشرفته را روی دستگاههایی با حافظه رم اندک فراهم کرده است.
به گزارش تکناک، گوگل بهتازگی از مدل هوش مصنوعی جدید خود با نام Gemma 3n پردهبرداری کرده است. این مدل با تمرکز بر کاربری دروندستگاهی توسعه یافته و در مقایسه با نسلهای قبلی، با پیشرفتهای درخورتوجهی در عملکرد و معماری و قابلیتهای چندرسانهای همراه شده است. نسخه نهایی این مدل پساز معرفی اولیه در رویداد Google I/O، اکنون بهطور رسمی منتشر شده است و قابلیت اجرای مستقیم روی سختافزارهای موبایلی را دارد.
مدل Gemma که برخلاف مدل اختصاصی جمنای مدلی متنباز محسوب میشود، برای استفاده توسعهدهندگان طراحی شده است تا امکان دانلود و ویرایش و شخصیسازی آن را داشته باشند. نسخه جدید این مدل، Gemma 3n، اکنون میتواند بهصورت بومی دادههایی همچون تصویر و صدا و ویدئو را تحلیل و برمبنای آنها متن تولید کند. این درحالی است که نسخههای پیشین فقط مبتنیبر متن بودند.
نئووین مینویسد که یکی از ویژگیهای اصلی مدل هوش مصنوعی Gemma 3n، توانایی اجرای آن روی دستگاههایی با حافظه رم ۲ یا ۳ گیگابایت است. این مدل در دو نسخه با نامهای E2B و E4B منتشر شده است که بهترتیب ۵ و ۸ میلیارد پارامتر دارند؛ اما به لطف نوآوریهای معماری، میتوانند با منابعی معادل مدلهای ۲ و ۴ میلیاردی اجرا شوند.
گوگل برای این مدل معماری جدیدی با نام MatFormer طراحی کرده است که انعطافپذیری محاسباتی را افزایش میدهد. این معماری مانند عروسکهای تودرتوی روسی (ماتریوشکا) طراحی شده است و امکان اجرای مدل در ابعاد مختلف را برای وظایف متنوع فراهم میسازد.

از دیگر بهبودهای مهم این مدل میتوان به پشتیبانی از ۱۴۰ زبان متنی، قابلیت درک چندرسانهای در ۳۵ زبان، ارتقای عملکرد در حل مسائل ریاضی، کدنویسی و استدلال اشاره کرد. همچنین با استفاده از رمزگذار جدید MobileNet-V5، مدل هوش مصنوعی مذکور میتواند ویدئو را با نرخ ۶۰ فریمبرثانیه روی دستگاههایی همچون پیکسل گوگل پردازش کند. قابلیت تبدیل گفتار به متن و ترجمه زنده نیز ازطریق رمزگذار صوتی دقیق دروندستگاهی پشتیبانی میشود.
درحالحاضر، مدل Gemma 3n ازطریق پلتفرمهای توسعهمحور مانند Hugging Face و Kaggle و Google AI Studio در دسترس علاقهمندان و توسعهدهندگان قرار دارد و امکان آزمایش و توسعه مستقیم بر بسترهای محلی را فراهم کرده است. این اقدام گوگل گامی مهم برای عمومیکردن هوش مصنوعی و افزایش بهرهوری مدلهای زبانی روی سختافزارهای کمقدرت و همراه به شمار میآید.