Phi-4؛ مدل زبانی کوچک مایکروسافت با ۱۴ میلیارد پارامتر

مایکروسافت مدل زبانی پیشرفته Phi-4 را با ۱۴ میلیارد پارامتر معرفی کرده است. این مدل کوچک و بهینه با تمرکز بر کاهش مصرف منابع و حفظ دقت زیاد برای کاربردهای متنوع در پردازش زبان طبیعی طراحی شده است.

به گزارش تک‌ناک، مایکروسافت جدیدترین مدل زبانی خود، Phi-4 را رونمایی کرد. این مدل زبانی کوچک با ۱۴ میلیارد پارامتر، در آزمون‌های هوش مصنوعی MATH و GPQA عملکردی بهتر از مدل بزرگ GPT-4 شرکت OpenAI از خود نشان داده و توانسته است جایگاه ویژه‌ای در عرصه فناوری مدل‌های زبانی به دست آورد.

01
از 04
معرفی Phi-4 و ویژگی‌های برتر آن

به نقل از نئووین، مایکروسافت در اوایل سال جاری خانواده مدل‌های زبانی کوچک Phi-3 را معرفی کرد و اکنون با انتشار Phi-4، سطح جدیدی از توانایی‌های مدل‌های زبانی را در دسترس قرار داده است. این مدل پیشرفته به لطف استفاده از داده‌های مصنوعی باکیفیت و گزینش دقیق داده‌های ارگانیک و بهینه‌سازی پس‌از آموزش توانسته به نتایج درخورتوجهی دست یابد.

02
از 04
دلایل موفقیت Phi-4 در آزمون‌های ریاضی

مایکروسافت اعلام کرده است که عملکرد قوی Phi-4 در مسائل مرتبط با ریاضیات به‌دلیل بهره‌گیری از داده‌های مصنوعی پیشرفته‌ای است که با تکنیک‌هایی مانند بازبینی چندعاملی و فرایندهای خودبازبینی و معکوس‌سازی دستورالعمل‌ها تولید شده‌اند. این داده‌های مصنوعی بخش عمده‌ای از داده‌های آموزشی این مدل را تشکیل می‌دهند.

مایکروسافت برای اطمینان از صحت ارزیابی‌های خود، فرایند پاک‌سازی داده‌ها را برای Phi-4 بهبود بخشیده تا از تأثیر ناعادلانه داده‌های آزمون بر نتایج جلوگیری کند. این شرکت مدل Phi-4 را در رقابت‌های ریاضی AMC-10 و AMC-12 که در نوامبر ۲۰۲۴ برگزار شد، ارزیابی کرد. این رقابت‌ها پس‌از جمع‌آوری داده‌های آموزشی مایکروسافت برگزار شده‌اند و نتایج نشان می‌دهد که Phi-4 بدون مشکل بیش‌برازش عملکرد برتری داشته است.

03
از 04
مقایسه با سایر مدل‌ها

براساس اطلاعات منتشرشده، Phi-4 نه‌تنها در مقایسه با مدل‌های مشابه با اندازه یا وزن باز عملکرد بهتری دارد؛ بلکه از مدل‌های بزرگ‌تر و پیشرفته‌ای مانند جمنای ۱.۵ پرو نیز پیشی گرفته است. این دستاورد نشان‌دهنده کیفیت و توانایی برتر Phi-4 در مواجهه با مسائل پیچیده ریاضی است.

با وجود این دستاوردها، Phi-4 همچنان با محدودیت‌هایی روبه‌رو است. اندازه کوچک این مدل باعث می‌شود تا در برخی مواقع، مانند ارائه اطلاعات واقعی، دچار توهم شود و توانایی کمتری در پیروی دقیق از دستورالعمل‌های پیچیده داشته باشد. برای شناسایی خطرهای احتمالی، تیم Phi-4 با همکاری AI Red Team (AIRT) مایکروسافت، خطرات ایمنی و امنیتی این مدل را در سناریوهای مختلف بررسی کرده است.

04
از 04
دسترسی و انتشار

مایکروسافت Phi-4 را اکنون تحت توافق‌نامه مجوز تحقیقاتی مایکروسافت (MSRLA) از‌طریق Azure AI Foundry در دسترس قرار داده است. همچنین، این مدل هفته آینده در Hugging Face منتشر خواهد شد و در اختیار علاقه‌مندان به تحقیق و توسعه قرار می‌گیرد.