شرکت فرانسوی Mistral AI مدل جدید هوش مصنوعی مولد پرچمدار خود را با نام Large 2 معرفی کرد، که دارای 123 میلیارد پارامتر است.
به گزارش تکناک، Large 2 یک مدل زبان بزرگ باز با قابلیتهای پیشرفتهای در زمینه تولید کد، ریاضیات و استدلال است و از چندین زبان پشتیبانی میکند. همچنین قابلیت اجرای توابع موازی و متوالی را دارد، که به توسعهدهندگان امکان ایجاد برنامههای هوش مصنوعی پیچیده را میدهد.
همچنین شرکت Mistral پشتیبانی چند زبانه بهبود یافته و قابلیتهای فراخوانی عملکرد پیشرفته را به Large 2 اضافه کرده است.
مدل Mistral Large 2 دارای 123 میلیارد پارامتر است که به آن امکان میدهد روی یک گره H100 با توان عملیاتی بالا کار کند. این مدل از زبانهای فرانسوی، آلمانی، اسپانیایی، ایتالیایی، پرتغالی، عربی، هندی، روسی، چینی، ژاپنی و کرهای پشتیبانی میکند. همچنین از نظر کدنویسی پشتیبانی این مدل از 80 زبان برنامهنویسی از جمله پایتون، جاوا، C، C++، جاوا اسکریپت و Bash است.
Mistral Large 2 اکنون فقط برای تحقیقات و استفاده غیرتجاری به صورت رایگان در دسترس است و برای استفاده تجاری، مجوز مورد نیاز میباشد.
عملکرد Mistral Large 2 (123B) با GPT-4o OpenAI، Claude Opus 3، و Llama 3.1 405B که به تازگی منتشر شده در معیارهای کدنویسی قابل مقایسه است. در بنچمارکهای Wild Bench، Arena Hard و MT Bench، Large 2 بهتر از Llama 3.1 405B و Claude 3 Opus عمل میکند. در معیار محبوب MMLU، این مدل جدید بهتر از Llama 3.1 70B است و با Llama 3.1 405B قابل مقایسه میباشد.
اکنون برای توسعهدهندگان، Mistral Large 2 با مهارتهای فراخوانی و بازیابی عملکرد بهبودیافته ارائه میشود. این مدل میتواند فراخوانیهای تابع موازی و متوالی را اجرا کند و توسعهدهندگان را قادر میسازد تا برنامههای کاربردی پیچیده هوش مصنوعی تجاری را بسازند.
با انتشار Large 2 شرکت Mistral در حال تثبیت نمونه کارهای مدل خود است. این شرکت دو مدل همه منظوره Mistral Nemo و Mistral Large و دو مدل تخصصی Codestral و Embed خواهد داشت. Mistral در آینده مدلهای آپاچی (Mistral 7B، Mistral 8x7B و 8x22B، Codestral Mamba، Mathstral) را متوقف خواهد کرد.
مایکروسافت و Mistral در گذشته برای عرضه مدلهای Mistral در Azure با یکدیگر شراکت داشتند. اکنون شرکت Mistral در حال گسترش همکاری خود با گوگل است تا مدلهای Mistral را در Google Cloud در دسترس قرار دهد.
انتشار Mistral Large 2 و Llama 3.1 نقطه عطف مهمی برای اکوسیستم هوش مصنوعی باز است و دو مدل قدرتمند در سطح GPT-4 را برای تحقیق و توسعه ارائه میدهد. این پیشرفت به حرکت رو به رشد چشمانداز هوش مصنوعی بازتر و مشارکتیتر، سرعت میبخشد.
منبع: Mistral