مایکروسافت مدل زبانی Phi-4 را در پلتفرم Hugging Face منتشر کرد

شرکت مایکروسافت مدل زبانی قدرتمند Phi-4 خود را به‌ صورت متن‌باز و با مجوز MIT در پلتفرم Hugging Face منتشر کرده است.

به گزارش تک‌ناک، این مدل زبانی پیشرفته برای کاربردهای متنوعی از جمله پردازش زبان طبیعی و یادگیری ماشینی طراحی شده است و دسترسی آزاد به آن می‌تواند به توسعه سریع‌تر ابزارهای هوش مصنوعی و گسترش همکاری در جامعه تحقیقاتی کمک کند.

این مدل اکنون برای پژوهشگران، توسعه‌دهندگان و حتی شرکت‌های تجاری‌ در دسترس است. اقدام مایکروسافت در انتشار مدل زبانی Phi-4 به‌ عنوان یک پروژه متن‌باز، نقطه عطفی در پیشرفت‌های اخیر این شرکت در زمینه هوش مصنوعی به حساب می‌آید.

ونچربیت می‌نویسد که این حرکت از سوی مایکروسافت به‌ عنوان بخشی از استراتژی این شرکت برای توسعه مدل‌های هوش مصنوعی قدرتمند و کوچک‌تر صورت گرفته است.

شیتال شاه، مهندس ارشد تحقیقات هوش مصنوعی مایکروسافت، در این زمینه در شبکه اجتماعی X نوشت: «ما از واکنش‌ها به انتشار مدل زبانی Phi-4 شگفت‌زده شده‌ایم. بسیاری از افراد از ما درخواست کرده بودند که وزن‌ها را منتشر کنیم. چند نفر حتی وزن‌های دزدی Phi-4 را در پلتفرم Hugging Face آپلود کرده بودند… خوب، دیگر منتظر نباشید. امروز مدل رسمی Phi-4 را با مجوز MIT منتشر می‌کنیم!»

01
از 05
ویژگی‌های مدل زبانی Phi-4

مدل زبانی Phi-4 با ۱۴ میلیارد پارامتر، به‌ویژه در زمینه‌هایی مانند: استدلال ریاضی و درک زبان چندوظیفه‌ای عملکرد بسیار برجسته‌ای دارد. این مدل توانسته است در معیارهای چالشی مانند: MATH و MGSM بیش از ۸۰ درصد امتیاز کسب کند و مدل‌هایی بزرگ‌تر همچون Gemini Pro و GPT-4o-mini گوگل را پشت سر بگذارد.

همچنین Phi-4 در انجام وظایف پیچیده استدلال ریاضی، که در زمینه‌های مختلفی از جمله امور مالی، مهندسی و تحقیقات علمی اهمیت دارد، عملکرد برتری نشان داده است. علاوه بر این، مدل Phi-4 در تولید کد عملیاتی در ارزیابی HumanEval نیز نتایج چشمگیری کسب کرده است.

مدل زبانی Phi-4 مایکروسافت در پلتفرم Hugging Face منتشر کرد

02
از 05
آموزش مدل زبانی Phi-4

مدل Phi-4 روی ۹.۸ تریلیون توکن از مجموعه‌داده‌های انتخابی و مصنوعی آموزش دیده است. این مجموعه داده شامل اسناد عمومی با کیفیت بالا، داده‌های مصنوعی به سبک کتاب‌های درسی در زمینه ریاضیات، کدنویسی و استدلال عمومی، همچنین کتاب‌های دانشگاهی و مجموعه‌داده‌های پرسش و پاسخ بوده است.

همچنین مدل Phi-4 از محتوای چندزبانه نیز بهره‌مند می‌باشد، هرچند که به‌ طور عمده برای کاربردهای زبان انگلیسی بهینه شده است.

03
از 05
مزایای متن‌باز بودن

شرکت مایکروسافت با قرار دادن Phi-4 در پلتفرم Hugging Face، آن را در اختیار توسعه‌دهندگان و پژوهشگران قرار داده است تا بدون نیاز به منابع محاسباتی زیاد یا اجازه از مایکروسافت، آن را در پروژه‌های خود استفاده کنند، یا آن را برای کاربردهای خاص تنظیم نمایند.

این حرکت به توسعه‌دهندگان امکان می‌دهد که بدون محدودیت‌های معمول، از این مدل برای اهداف تجاری یا تحقیقاتی استفاده کنند.

مایکروسافت با این اقدام به‌ طور غیرمستقیم به ترند روبه‌رشد متن‌باز کردن مدل‌های هوش مصنوعی پیوسته است، که به نوآوری و شفافیت در توسعه هوش مصنوعی کمک می‌کند.

04
از 05
تأکید بر ایمنی و مسئولیت‌پذیری

همچنین مایکروسافت بر اهمیت ایمنی در استفاده از مدل‌های هوش مصنوعی تأکید کرده است. مدل زبانی Phi-4 تحت ارزیابی‌های ایمنی گسترده‌ای قرار گرفت، از جمله آزمایش‌های مقابله‌ای، تا خطراتی مانند: تعصب، تولید محتوای مضر و اطلاعات نادرست را به حداقل برساند.

به توسعه‌دهندگان نیز توصیه شده‌ است که برای کاربردهای پرخطر حفاظ‌های اضافی پیاده‌سازی کنند و خروجی‌ها را بر اساس اطلاعات معتبر در سناریوهای حساس تنظیم نمایند.

05
از 05
پیامدها برای صنعت هوش مصنوعی

انتشار متن‌باز Phi-4 نقطه‌عطفی در صنعت هوش مصنوعی به حساب می‌آید. این مدل با ارائه قابلیت‌های استدلال پیشرفته در مقایسه با مدل‌های بزرگ‌تر، نشان می‌دهد که مدل‌های کوچک‌تر و به‌خوبی طراحی‌شده، می‌توانند نتایج مشابه یا برتری در زمینه‌های مختلف به‌دست آورند.

این کارایی نه تنها هزینه‌ها را کاهش می‌دهد، بلکه مصرف انرژی را نیز پایین می‌آورد و دسترسی به قابلیت‌های پیشرفته هوش مصنوعی را برای سازمان‌های متوسط و شرکت‌های با بودجه محاسباتی محدودتر فراهم می‌کند.

شرکت مایکروسافت با این حرکت، مدل زبانی Phi-4 را به‌ عنوان یک گزینه جذاب برای پژوهشگران، توسعه‌دهندگان و حتی شرکت‌های تجاری مطرح کرده است. به‌ویژه اینکه با ارائه مدل‌های قدرتمند و کوچک‌تر، به نظر می‌رسد که مایکروسافت در حال تغییر نگرش‌های صنعت هوش مصنوعی در خصوص طراحی و استقرار مدل‌ها است.

با توجه به اینکه Phi-4 به‌ طور متن‌باز در دسترس قرار گرفته است، به‌ زودی خواهیم دید که آیا این مدل می‌تواند به‌ عنوان جایگزینی جدی برای مدل‌های مشابه از OpenAI، Anthropic، گوگل، متا و دیگر شرکت‌ها، مطرح شود.

برچسب‌ها: CES 2025