شرکت گوگل از نسل جدید مدلهای هوش مصنوعی متنباز Gemma 4 با تمرکز بر استدلال پیشرفته، اجرای آفلاین و پشتیبانی از ۱۴۰ زبان، همچنین توان پردازشی بالاتر با نیاز سختافزاری کمتر رونمایی کرد.
به گزارش سرویس هوش مصنوعی تکناک، این شرکت اعلام کرده است که Gemma 4 پیشرفتهترین مجموعه مدلهای باز آن تا امروز به حساب میآید و با هدف پاسخ به نیازهای جدید توسعهدهندگان در حوزه جریانهای کاری عاملمحور طراحی شده است. به گفته گوگل، این مدلها نسبت به اندازه خود، سطح بیسابقهای از «هوش به ازای هر پارامتر» ارائه میدهند.
بر اساس دادههای منتشرشده گوگل، مدلهای Gemma از زمان معرفی نسل اول تاکنون بیش از ۴۰۰ میلیون بار دانلود شدهاند و جامعهای متشکل از ۱۰۰ هزار نسخه مختلف پیرامون آنها شکل گرفته است. گوگل با تکیه بر همین استقبال، اکنون نسل چهارم را با قابلیتهای گستردهتر و تحت مجوز Apache 2.0 به صورت عمومی عرضه کرده است.
خانواده Gemma 4 در چهار اندازه مختلف شامل E2B، E4B، مدل 26B مبتنی بر معماری Mixture of Experts و مدل 31B Dense ارائه شده است. این مدلها فراتر از کاربردهای چت ساده عمل میکنند و توانایی پردازش منطق پیچیده، برنامهریزی چندمرحلهای و اجرای وظایف خودکار را دارند.
شرکت گوگل تأکید کرده است که در حال حاضر مدل 31B در رتبه سوم بهترین مدلهای متنباز جهان در رتبهبندی Arena AI قرار دارد و مدل 26B نیز رتبه ششم را به دست آورده است. نکته قابل توجه این است که این مدلها توانستهاند عملکردی بهتر از مدلهایی تا ۲۰ برابر بزرگتر از خود ارائه دهند.

در بخش کاربردهای عملی، مدلهای سبکتر E2B و E4B برای اجرا روی دستگاههای لبه مانند: گوشیهای هوشمند و تجهیزات اینترنت اشیا طراحی شدهاند. این مدلها با تمرکز بر مصرف پایین انرژی، تأخیر بسیار کم و پشتیبانی از ورودیهای چندرسانهای، امکان اجرای کامل آفلاین را فراهم میکنند. شرکت گوگل اعلام کرده است که این مدلها با همکاری شرکتهایی مانند کوالکام و مدیاتک توسعه یافتهاند.
از سوی دیگر، مدلهای بزرگتر 26B و 31B برای اجرا روی رایانههای شخصی و ایستگاههای کاری توسعهدهندگان بهینه شدهاند. نسخههای اصلی این مدلها روی یک GPU قدرتمند مانند NVIDIA H100 اجرا میشوند، اما نسخههای کوانتیزهشده آنها قابلیت اجرا روی کارتهای گرافیک مصرفی را نیز دارند.
هوش مصنوعی Gemma 4 مجموعهای از قابلیتهای پیشرفته را ارائه میدهد که شامل استدلال چندمرحلهای، پشتیبانی از فراخوانی توابع، تولید خروجی ساختاریافته در قالب JSON، تولید کد به صورت آفلاین و پردازش تصویر، ویدیو و صوت است. همچنین این مدلها دارای پنجره متنی گسترده تا ۲۵۶ هزار توکن هستند و از بیش از ۱۴۰ زبان پشتیبانی میکنند.
همچنین گوگل تأکید کرده است که این مدلها برای اجرا و تنظیم بهینه روی طیف وسیعی از سختافزارها، از دستگاههای اندرویدی گرفته تا زیرساختهای ابری طراحی شدهاند. توسعهدهندگان میتوانند این مدلها را به صورت محلی اجرا کنند یا از طریق Google Cloud در مقیاس بزرگ به کار بگیرند.
از نظر مجوز، Gemma 4 تحت مجوز Apache 2.0 منتشر شده است که به توسعهدهندگان اجازه استفاده تجاری، تغییر و توزیع آزادانه را میدهد. این تصمیم در راستای تقویت اکوسیستم متنباز و افزایش دسترسی به فناوریهای پیشرفته هوش مصنوعی اتخاذ شده است.
در نهایت، گوگل اعلام کرده است که این مدلها با رعایت استانداردهای سختگیرانه امنیتی توسعه یافتهاند و سازمانها میتوانند با اطمینان از آنها در پروژههای حساس استفاده کنند. همچنین این شرکت با ارائه پشتیبانی گسترده از ابزارهایی مانند: Hugging Face، Ollama و Docker، تلاش کرده است تا فرایند توسعه و استقرار را برای کاربران سادهتر کند.
با معرفی Gemma 4، رقابت در حوزه مدلهای متنباز هوش مصنوعی وارد مرحله تازهای شده است و اکنون توسعهدهندگان به ابزارهایی دسترسی دارند که میتواند فاصله میان مدلهای باز و اختصاصی را بیش از پیش کاهش دهد.
















