مدل هوش مصنوعی Gemma 4 با پشتیبانی از ۱۴۰ زبان معرفی شد

شرکت گوگل از نسل جدید مدل‌های هوش مصنوعی متن‌باز Gemma 4 با تمرکز بر استدلال پیشرفته، اجرای آفلاین و پشتیبانی از ۱۴۰ زبان، همچنین توان پردازشی بالاتر با نیاز سخت‌افزاری کمتر رونمایی کرد.

به گزارش سرویس هوش مصنوعی تک‌ناک، این شرکت اعلام کرده است که Gemma 4 پیشرفته‌ترین مجموعه مدل‌های باز آن تا امروز به حساب می‌آید و با هدف پاسخ به نیازهای جدید توسعه‌دهندگان در حوزه جریان‌های کاری عامل‌محور طراحی شده است. به گفته گوگل، این مدل‌ها نسبت به اندازه خود، سطح بی‌سابقه‌ای از «هوش به ازای هر پارامتر» ارائه می‌دهند.

بر اساس داده‌های منتشرشده گوگل، مدل‌های Gemma از زمان معرفی نسل اول تاکنون بیش از ۴۰۰ میلیون بار دانلود شده‌اند و جامعه‌ای متشکل از ۱۰۰ هزار نسخه مختلف پیرامون آنها شکل گرفته است. گوگل با تکیه بر همین استقبال، اکنون نسل چهارم را با قابلیت‌های گسترده‌تر و تحت مجوز Apache 2.0 به‌ صورت عمومی عرضه کرده است.

خانواده Gemma 4 در چهار اندازه مختلف شامل E2B، E4B، مدل 26B مبتنی بر معماری Mixture of Experts و مدل 31B Dense ارائه شده است. این مدل‌ها فراتر از کاربردهای چت ساده عمل می‌کنند و توانایی پردازش منطق پیچیده، برنامه‌ریزی چندمرحله‌ای و اجرای وظایف خودکار را دارند.

شرکت گوگل تأکید کرده است که در حال حاضر مدل 31B در رتبه سوم بهترین مدل‌های متن‌باز جهان در رتبه‌بندی Arena AI قرار دارد و مدل 26B نیز رتبه ششم را به دست آورده است. نکته قابل توجه این است که این مدل‌ها توانسته‌اند عملکردی بهتر از مدل‌هایی تا ۲۰ برابر بزرگ‌تر از خود ارائه دهند.

نمودار مقایسه عملکرد مدل‌های هوش مصنوعی بر اساس امتیاز Elo در برابر تعداد پارامترها که برتری Gemma 4 را نسبت به مدل‌های بزرگ‌تر نشان می‌دهد.

در بخش کاربردهای عملی، مدل‌های سبک‌تر E2B و E4B برای اجرا روی دستگاه‌های لبه مانند: گوشی‌های هوشمند و تجهیزات اینترنت اشیا طراحی شده‌اند. این مدل‌ها با تمرکز بر مصرف پایین انرژی، تأخیر بسیار کم و پشتیبانی از ورودی‌های چندرسانه‌ای، امکان اجرای کامل آفلاین را فراهم می‌کنند. شرکت گوگل اعلام کرده است که این مدل‌ها با همکاری شرکت‌هایی مانند کوالکام و مدیاتک توسعه یافته‌اند.

از سوی دیگر، مدل‌های بزرگ‌تر 26B و 31B برای اجرا روی رایانه‌های شخصی و ایستگاه‌های کاری توسعه‌دهندگان بهینه شده‌اند. نسخه‌های اصلی این مدل‌ها روی یک GPU قدرتمند مانند NVIDIA H100 اجرا می‌شوند، اما نسخه‌های کوانتیزه‌شده آنها قابلیت اجرا روی کارت‌های گرافیک مصرفی را نیز دارند.

هوش مصنوعی Gemma 4 مجموعه‌ای از قابلیت‌های پیشرفته را ارائه می‌دهد که شامل استدلال چندمرحله‌ای، پشتیبانی از فراخوانی توابع، تولید خروجی ساختاریافته در قالب JSON، تولید کد به‌ صورت آفلاین و پردازش تصویر، ویدیو و صوت است. همچنین این مدل‌ها دارای پنجره متنی گسترده تا ۲۵۶ هزار توکن هستند و از بیش از ۱۴۰ زبان پشتیبانی می‌کنند.

همچنین گوگل تأکید کرده است که این مدل‌ها برای اجرا و تنظیم بهینه روی طیف وسیعی از سخت‌افزارها، از دستگاه‌های اندرویدی گرفته تا زیرساخت‌های ابری طراحی شده‌اند. توسعه‌دهندگان می‌توانند این مدل‌ها را به‌ صورت محلی اجرا کنند یا از طریق Google Cloud در مقیاس بزرگ به کار بگیرند.

از نظر مجوز، Gemma 4 تحت مجوز Apache 2.0 منتشر شده است که به توسعه‌دهندگان اجازه استفاده تجاری، تغییر و توزیع آزادانه را می‌دهد. این تصمیم در راستای تقویت اکوسیستم متن‌باز و افزایش دسترسی به فناوری‌های پیشرفته هوش مصنوعی اتخاذ شده است.

در نهایت، گوگل اعلام کرده است که این مدل‌ها با رعایت استانداردهای سخت‌گیرانه امنیتی توسعه یافته‌اند و سازمان‌ها می‌توانند با اطمینان از آنها در پروژه‌های حساس استفاده کنند. همچنین این شرکت با ارائه پشتیبانی گسترده از ابزارهایی مانند: Hugging Face، Ollama و Docker، تلاش کرده است تا فرایند توسعه و استقرار را برای کاربران ساده‌تر کند.

با معرفی Gemma 4، رقابت در حوزه مدل‌های متن‌باز هوش مصنوعی وارد مرحله تازه‌ای شده است و اکنون توسعه‌دهندگان به ابزارهایی دسترسی دارند که می‌تواند فاصله میان مدل‌های باز و اختصاصی را بیش از پیش کاهش دهد.