گوگل و مایکروسافت با معرفی مدلهای زبانی جدید Gemma 2 2B و Phi-3، دسترسی به فناوری هوش مصنوعی را برای توسعهدهندگان و کسبوکارها آسانتر کردهاند.
بهگزارش تکناک، گوگل برای اولینبار در ماه ژوئن، Gemma 2، نسل بعدی مدلهای زبانی منبعبازی را رونمایی کرد که براساس معماری جدیدی برای عملکرد و کارایی بالا طراحی شده است. پیشازاین، Gemma 2 در دو اندازهی ۹ میلیارد (9B) و ۲۷ میلیارد (27B) پارامتر دردسترس بود. حالا گوگل با معرفی Gemma 2 2B با ۲ میلیارد پارامتر، خانوادهی Gemma 2 را گسترش داده است.
بهنقل از نئووین، مدل Gemma 2 2B جدید ادعا میکند که بهترین عملکرد را ارائه میدهد و حتی در Chatbot Arena با کسب امتیاز ۱,۱۲۶ همهی مدلهای GPT-3.5 را شکست داده است. این مدل با سختافزارهای مختلف ازجمله کامپیوترهای شخصی و دستگاههای لبه تا استقرارهای ابری روی Google Cloud Vertex AI نیز بهخوبی سازگار است.
گوگل مدل Gemma 2 2B را با کتابخانهی TensorRT-LLM انویدیا بهینه کرده است و توسعهدهندگان میتوانند از آن بهعنوان NIM (Nvidia Inference Microservices) انویدیا استفاده کنند.
ازآنجاکه این مدل برای کتابخانهی TensorRT-LLM انویدیا بهینه شده است، روی پلتفرمهای مختلف با استفاده از پردازندههای گرافیکی جیفورس RTX و ماژولهای Jetson انویدیا میتواند اجرا شود. علاوهبراین، Gemma 2 2B با Keras و JAX و Hugging Face و NVIDIA NeMo و Ollama و Gemma.cpp و بهزودی با MediaPipe برای توسعهی آسان ادغام میشود.
وزنهای مدل Gemma 2 برای دانلود از Kaggle و Hugging Face و Vertex AI Model Garden دردسترس هستند. برخلاف مدلهای گوگل جمنای، Gemma 2 تحتمجوز تجاری دوستانه دردسترس است. گوگل همراه با Gemma 2، مدلهای طبقهبندیکنندهی محتوای ایمنی ShieldGemma و ابزار تفسیر مدل Gemma Scope را نیز معرفی کرد.
در ماه آوریل، مایکروسافت خانوادهی مدلهای زبانی Phi-3 را رونمایی کرد که بهطور مستقیم با خانواده مدلهای Gemma گوگل رقابت میکند. خانوادهی Phi-3 از سه مدل تشکیل شده است:
- Phi-3-mini مدل زبانی 3.8B است که در دو نوع طول متن 4K و 128K توکن دردسترس است.
- Phi-3-Small مدل زبانی 7B است که در دو نوع طول متن 8K و 128K توکن دردسترس است.
- Phi-3-medium مدل زبانی 14B است که در همان دو نوع طول متن دردسترس است.
ظهور مدلهای زبان کوچکتر، اما قدرتمند مانند Gemma 2 2B گوگل و خانوادهی Phi-3 مایکروسافت نشاندهندهی روندی روبهرشد در صنعت هوش مصنوعی است. این تغییر بهسمت مدلهای کوچکتر به دسترسی و کارایی اولویت میدهد و امکان استقرار در طیف گستردهتری از دستگاهها و کاهش هزینههای محاسباتی را فراهم میکند.