گوگل و مایکروسافت مدل‌های زبانی جدید خود را معرفی کردند

گوگل و مایکروسافت با معرفی مدل‌های زبانی جدید Gemma 2 2B و Phi-3، دسترسی به فناوری هوش مصنوعی را برای توسعه‌دهندگان و کسب‌وکارها آسان‌تر کرده‌اند.

به‌گزارش تک‌ناک، گوگل برای اولین‌بار در ماه ژوئن، Gemma 2، نسل بعدی مدل‌های زبانی منبع‌بازی را رونمایی کرد که براساس معماری جدیدی برای عملکرد و کارایی بالا طراحی شده است. پیش‌از‌این، Gemma 2 در دو اندازه‌ی ۹ میلیارد (9B) و ۲۷ میلیارد (27B) پارامتر در‌دسترس بود. حالا گوگل با معرفی Gemma 2 2B با ۲ میلیارد پارامتر، خانواده‌ی Gemma 2 را گسترش داده است.

به‌نقل از نئووین، مدل Gemma 2 2B جدید ادعا می‌کند که بهترین عملکرد را ارائه می‌دهد و حتی در Chatbot Arena با کسب امتیاز ۱,۱۲۶ همه‌ی مدل‌های GPT-3.5 را شکست داده است. این مدل با سخت‌افزارهای مختلف ازجمله کامپیوترهای شخصی و دستگاه‌های لبه تا استقرارهای ابری روی Google Cloud Vertex AI نیز به‌خوبی سازگار است.

گوگل مدل Gemma 2 2B را با کتابخانه‌ی TensorRT-LLM انویدیا بهینه کرده است و توسعه‌دهندگان می‌توانند از آن به‌عنوان NIM (Nvidia Inference Microservices) انویدیا استفاده کنند.

ازآنجاکه این مدل برای کتابخانه‌ی TensorRT-LLM انویدیا بهینه شده است، روی پلتفرم‌های مختلف با استفاده از پردازنده‌های گرافیکی جی‌فورس RTX و ماژول‌های Jetson انویدیا می‌تواند اجرا شود. علاوه‌براین، Gemma 2 2B با Keras و JAX و Hugging Face و NVIDIA NeMo و Ollama و Gemma.cpp و به‌زودی با MediaPipe برای توسعه‌ی آسان ادغام می‌شود.

وزن‌های مدل Gemma 2 برای دانلود از Kaggle و Hugging Face و Vertex AI Model Garden دردسترس هستند. برخلاف مدل‌های گوگل جمنای، Gemma 2 تحت‌مجوز تجاری دوستانه در‌دسترس است. گوگل همراه با Gemma 2، مدل‌های طبقه‌بندی‌کننده‌ی محتوای ایمنی ShieldGemma و ابزار تفسیر مدل Gemma Scope را نیز معرفی کرد.

در ماه آوریل، مایکروسافت خانواده‌ی مدل‌های زبانی Phi-3 را رونمایی کرد که به‌طور مستقیم با خانواده مدل‌های Gemma گوگل رقابت می‌کند. خانواده‌ی Phi-3 از سه مدل تشکیل شده است:

Phi-3-mini مدل زبانی 3.8B است که در دو نوع طول متن 4K و 128K توکن دردسترس است.
Phi-3-Small مدل زبانی 7B است که در دو نوع طول متن 8K و 128K توکن در‌دسترس است.
Phi-3-medium مدل زبانی 14B است که در همان دو نوع طول متن در‌دسترس است.

ظهور مدل‌های زبان کوچک‌تر، اما قدرتمند مانند Gemma 2 2B گوگل و خانواده‌ی Phi-3 مایکروسافت نشان‌دهنده‌ی روندی رو‌به‌رشد در صنعت هوش مصنوعی است. این تغییر به‌سمت مدل‌های کوچک‌تر به دسترسی و کارایی اولویت می‌دهد و امکان استقرار در طیف گسترده‌تری از دستگاه‌ها و کاهش هزینه‌های محاسباتی را فراهم می‌کند.

برچسب‌ها: p6