مایکروسافت مدل زبانی پیشرفته Phi-4 را با ۱۴ میلیارد پارامتر معرفی کرده است. این مدل کوچک و بهینه با تمرکز بر کاهش مصرف منابع و حفظ دقت زیاد برای کاربردهای متنوع در پردازش زبان طبیعی طراحی شده است.
به گزارش تکناک، مایکروسافت جدیدترین مدل زبانی خود، Phi-4 را رونمایی کرد. این مدل زبانی کوچک با ۱۴ میلیارد پارامتر، در آزمونهای هوش مصنوعی MATH و GPQA عملکردی بهتر از مدل بزرگ GPT-4 شرکت OpenAI از خود نشان داده و توانسته است جایگاه ویژهای در عرصه فناوری مدلهای زبانی به دست آورد.
فهرست مطالب
معرفی Phi-4 و ویژگیهای برتر آن
به نقل از نئووین، مایکروسافت در اوایل سال جاری خانواده مدلهای زبانی کوچک Phi-3 را معرفی کرد و اکنون با انتشار Phi-4، سطح جدیدی از تواناییهای مدلهای زبانی را در دسترس قرار داده است. این مدل پیشرفته به لطف استفاده از دادههای مصنوعی باکیفیت و گزینش دقیق دادههای ارگانیک و بهینهسازی پساز آموزش توانسته به نتایج درخورتوجهی دست یابد.
دلایل موفقیت Phi-4 در آزمونهای ریاضی
مایکروسافت اعلام کرده است که عملکرد قوی Phi-4 در مسائل مرتبط با ریاضیات بهدلیل بهرهگیری از دادههای مصنوعی پیشرفتهای است که با تکنیکهایی مانند بازبینی چندعاملی و فرایندهای خودبازبینی و معکوسسازی دستورالعملها تولید شدهاند. این دادههای مصنوعی بخش عمدهای از دادههای آموزشی این مدل را تشکیل میدهند.
مایکروسافت برای اطمینان از صحت ارزیابیهای خود، فرایند پاکسازی دادهها را برای Phi-4 بهبود بخشیده تا از تأثیر ناعادلانه دادههای آزمون بر نتایج جلوگیری کند. این شرکت مدل Phi-4 را در رقابتهای ریاضی AMC-10 و AMC-12 که در نوامبر ۲۰۲۴ برگزار شد، ارزیابی کرد. این رقابتها پساز جمعآوری دادههای آموزشی مایکروسافت برگزار شدهاند و نتایج نشان میدهد که Phi-4 بدون مشکل بیشبرازش عملکرد برتری داشته است.
مقایسه با سایر مدلها
براساس اطلاعات منتشرشده، Phi-4 نهتنها در مقایسه با مدلهای مشابه با اندازه یا وزن باز عملکرد بهتری دارد؛ بلکه از مدلهای بزرگتر و پیشرفتهای مانند جمنای ۱.۵ پرو نیز پیشی گرفته است. این دستاورد نشاندهنده کیفیت و توانایی برتر Phi-4 در مواجهه با مسائل پیچیده ریاضی است.
با وجود این دستاوردها، Phi-4 همچنان با محدودیتهایی روبهرو است. اندازه کوچک این مدل باعث میشود تا در برخی مواقع، مانند ارائه اطلاعات واقعی، دچار توهم شود و توانایی کمتری در پیروی دقیق از دستورالعملهای پیچیده داشته باشد. برای شناسایی خطرهای احتمالی، تیم Phi-4 با همکاری AI Red Team (AIRT) مایکروسافت، خطرات ایمنی و امنیتی این مدل را در سناریوهای مختلف بررسی کرده است.
دسترسی و انتشار
مایکروسافت Phi-4 را اکنون تحت توافقنامه مجوز تحقیقاتی مایکروسافت (MSRLA) ازطریق Azure AI Foundry در دسترس قرار داده است. همچنین، این مدل هفته آینده در Hugging Face منتشر خواهد شد و در اختیار علاقهمندان به تحقیق و توسعه قرار میگیرد.