شرکت مایکروسافت مدل زبانی قدرتمند Phi-4 خود را به صورت متنباز و با مجوز MIT در پلتفرم Hugging Face منتشر کرده است.
به گزارش تکناک، این مدل زبانی پیشرفته برای کاربردهای متنوعی از جمله پردازش زبان طبیعی و یادگیری ماشینی طراحی شده است و دسترسی آزاد به آن میتواند به توسعه سریعتر ابزارهای هوش مصنوعی و گسترش همکاری در جامعه تحقیقاتی کمک کند.
این مدل اکنون برای پژوهشگران، توسعهدهندگان و حتی شرکتهای تجاری در دسترس است. اقدام مایکروسافت در انتشار مدل زبانی Phi-4 به عنوان یک پروژه متنباز، نقطه عطفی در پیشرفتهای اخیر این شرکت در زمینه هوش مصنوعی به حساب میآید.
ونچربیت مینویسد که این حرکت از سوی مایکروسافت به عنوان بخشی از استراتژی این شرکت برای توسعه مدلهای هوش مصنوعی قدرتمند و کوچکتر صورت گرفته است.
شیتال شاه، مهندس ارشد تحقیقات هوش مصنوعی مایکروسافت، در این زمینه در شبکه اجتماعی X نوشت: «ما از واکنشها به انتشار مدل زبانی Phi-4 شگفتزده شدهایم. بسیاری از افراد از ما درخواست کرده بودند که وزنها را منتشر کنیم. چند نفر حتی وزنهای دزدی Phi-4 را در پلتفرم Hugging Face آپلود کرده بودند… خوب، دیگر منتظر نباشید. امروز مدل رسمی Phi-4 را با مجوز MIT منتشر میکنیم!»
فهرست مطالب
ویژگیهای مدل زبانی Phi-4
مدل زبانی Phi-4 با ۱۴ میلیارد پارامتر، بهویژه در زمینههایی مانند: استدلال ریاضی و درک زبان چندوظیفهای عملکرد بسیار برجستهای دارد. این مدل توانسته است در معیارهای چالشی مانند: MATH و MGSM بیش از ۸۰ درصد امتیاز کسب کند و مدلهایی بزرگتر همچون Gemini Pro و GPT-4o-mini گوگل را پشت سر بگذارد.
همچنین Phi-4 در انجام وظایف پیچیده استدلال ریاضی، که در زمینههای مختلفی از جمله امور مالی، مهندسی و تحقیقات علمی اهمیت دارد، عملکرد برتری نشان داده است. علاوه بر این، مدل Phi-4 در تولید کد عملیاتی در ارزیابی HumanEval نیز نتایج چشمگیری کسب کرده است.
آموزش مدل زبانی Phi-4
مدل Phi-4 روی ۹.۸ تریلیون توکن از مجموعهدادههای انتخابی و مصنوعی آموزش دیده است. این مجموعه داده شامل اسناد عمومی با کیفیت بالا، دادههای مصنوعی به سبک کتابهای درسی در زمینه ریاضیات، کدنویسی و استدلال عمومی، همچنین کتابهای دانشگاهی و مجموعهدادههای پرسش و پاسخ بوده است.
همچنین مدل Phi-4 از محتوای چندزبانه نیز بهرهمند میباشد، هرچند که به طور عمده برای کاربردهای زبان انگلیسی بهینه شده است.
مزایای متنباز بودن
شرکت مایکروسافت با قرار دادن Phi-4 در پلتفرم Hugging Face، آن را در اختیار توسعهدهندگان و پژوهشگران قرار داده است تا بدون نیاز به منابع محاسباتی زیاد یا اجازه از مایکروسافت، آن را در پروژههای خود استفاده کنند، یا آن را برای کاربردهای خاص تنظیم نمایند.
این حرکت به توسعهدهندگان امکان میدهد که بدون محدودیتهای معمول، از این مدل برای اهداف تجاری یا تحقیقاتی استفاده کنند.
مایکروسافت با این اقدام به طور غیرمستقیم به ترند روبهرشد متنباز کردن مدلهای هوش مصنوعی پیوسته است، که به نوآوری و شفافیت در توسعه هوش مصنوعی کمک میکند.
تأکید بر ایمنی و مسئولیتپذیری
همچنین مایکروسافت بر اهمیت ایمنی در استفاده از مدلهای هوش مصنوعی تأکید کرده است. مدل زبانی Phi-4 تحت ارزیابیهای ایمنی گستردهای قرار گرفت، از جمله آزمایشهای مقابلهای، تا خطراتی مانند: تعصب، تولید محتوای مضر و اطلاعات نادرست را به حداقل برساند.
به توسعهدهندگان نیز توصیه شده است که برای کاربردهای پرخطر حفاظهای اضافی پیادهسازی کنند و خروجیها را بر اساس اطلاعات معتبر در سناریوهای حساس تنظیم نمایند.
پیامدها برای صنعت هوش مصنوعی
انتشار متنباز Phi-4 نقطهعطفی در صنعت هوش مصنوعی به حساب میآید. این مدل با ارائه قابلیتهای استدلال پیشرفته در مقایسه با مدلهای بزرگتر، نشان میدهد که مدلهای کوچکتر و بهخوبی طراحیشده، میتوانند نتایج مشابه یا برتری در زمینههای مختلف بهدست آورند.
این کارایی نه تنها هزینهها را کاهش میدهد، بلکه مصرف انرژی را نیز پایین میآورد و دسترسی به قابلیتهای پیشرفته هوش مصنوعی را برای سازمانهای متوسط و شرکتهای با بودجه محاسباتی محدودتر فراهم میکند.
شرکت مایکروسافت با این حرکت، مدل زبانی Phi-4 را به عنوان یک گزینه جذاب برای پژوهشگران، توسعهدهندگان و حتی شرکتهای تجاری مطرح کرده است. بهویژه اینکه با ارائه مدلهای قدرتمند و کوچکتر، به نظر میرسد که مایکروسافت در حال تغییر نگرشهای صنعت هوش مصنوعی در خصوص طراحی و استقرار مدلها است.
با توجه به اینکه Phi-4 به طور متنباز در دسترس قرار گرفته است، به زودی خواهیم دید که آیا این مدل میتواند به عنوان جایگزینی جدی برای مدلهای مشابه از OpenAI، Anthropic، گوگل، متا و دیگر شرکتها، مطرح شود.