OpenAI از مدل‌های جدید GPT-4.1 برای تمرکز بر برنامه‌نویسی پرده‌برداری کرد

OpenAI در نسخه جدید مدل‌های هوش مصنوعی خود با عنوان GPT-4.1 تمرکز ویژه‌ای بر بهبود توانایی‌های کدنویسی کرده است.

به گزارش تک‌ناک، OpenAI خانواده جدیدی از مدل‌های هوش مصنوعی را با عنوان GPT-4.1 معرفی کرد؛ نسخه‌ای که ازلحاظ نام‌گذاری نیز ادامه‌‌دهنده روند پیچیده‌ این شرکت است. این خانواده شامل مدل‌های GPT-4.1 و GPT-4.1 mini و GPT-4.1 nano می‌شود که به گفته OpenAI، همگی درزمینه برنامه‌نویسی و پیروی از دستورالعمل‌ها عملکردی عالی از خود نشان می‌دهند.

این مدل‌ها فقط ازطریق API شرکت OpenAI در دسترس قرار دارند و هنوز وارد پلتفرم ChatGPT نشده‌اند. هر سه مدل پنجره متنی (Context Window) با یک میلیون توکن دارند. این یعنی می‌توانند تقریباً ۷۵۰ هزار واژه را در هر بار پردازش کنند.

به نقل از تک‌کرانچ، GPT-4.1 در حالی معرفی شده است که رقبای OpenAI نظیر گوگل و آنتروپیک در حال تقویت مدل‌های برنامه‌نویسی خود هستند. گوگل اخیراً Gemini 2.5 Pro را معرفی کرده که آن هم از پنجره متنی یک‌میلیون‌توکنی برخوردار است و در بنچمارک‌های برنامه‌نویسی درخشان ظاهر شده است. همچنین، Claude 3.7 Sonnet از آنتروپیک و نسخه جدید مدل V3 شرکت دیپ‌سیک در این حوزه رقابت می‌کنند.

هدف اصلی بسیاری از غول‌های فناوری، از‌جمله OpenAI، تربیت مدل‌هایی است که ازپس انجام کامل وظایف مهندسی نرم‌افزار بربیایند. به گفته سارا فرایر، مدیر مالی OpenAI، این شرکت در تلاش برای ساخت «دستیار مهندس نرم‌افزار» است که بتواند به‌صورت مستقل اپلیکیشن‌های کامل را توسعه دهد؛ از تضمین کیفیت و آزمایش باگ گرفته تا نگارش مستندات.

مدل‌های GPT-4.1، GPT-4.1 mini و GPT-4.1 nano

OpenAI می‌گوید GPT-4.1 گامی در همین راستاست و بر‌اساس بازخورد مستقیم توسعه‌دهندگان بهینه‌سازی شده تا عملکرد بهتری در کدنویسی فرانت‌اند ارائه کند، ویرایش‌های غیرضروری را کاهش دهد، از قالب‌ها پیروی کند، ترتیب پاسخ‌دهی را رعایت و از ابزارها به‌طور صحیح و منسجم استفاده کند.

این شرکت ادعا می‌کند که مدل کامل GPT-4.1 در بنچمارک‌هایی مانند SWE-bench عملکرد بهتری از GPT-4o و GPT-4o mini ارائه داده است. مدل‌های mini و nano نیز گرچه دقت کمتری دارند، سریع‌تر و مقرون‌به‌صرفه‌تر هستند. GPT-4.1 nano سریع‌ترین و ارزان‌ترین مدل OpenAI تاکنون شناخته می‌شود.

قیمت‌گذاری مدل‌ها بدین‌شرح است:

GPT-4.1: دو دلار به‌ازای هر یک میلیون توکن ورودی و هشت دلار برای خروجی
GPT-4.1 mini: چهل سنت برای ورودی و ۱/۶۰ دلار برای خروجی
GPT-4.1 nano: ده سنت برای ورودی و ۴۰ سنت برای خروجی

OpenAI اعلام کرده است که GPT-4.1 می‌تواند توکن‌های بیشتری از GPT-4o تولید کند (۳۲٬۷۶۸ توکن در مقابل ۱۶٬۳۸۴ توکن). این مدل در بنچمارک SWE-bench Verified بین ۵۲ تا ۵۴/۶ درصد امتیاز کسب کرده که کمتر از عملکرد Gemini 2.5 Pro گوگل (۶۳/۸ درصد) و Claude 3.7 Sonnet آنتروپیک (۶۲/۳ درصد) است. همچنین، در ارزیابی جداگانه‌ای با استفاده از Video-MME، مدل GPT-4.1 توانست به دقت ۷۲ درصدی در بخش «ویدئوهای بلند بدون زیرنویس» برسد که بهترین عملکرد در این حوزه محسوب می‌شود.

با وجود عملکرد مناسب در بنچمارک‌ها و داشتن «دانش‌نامه» به‌روزتر تا ژوئن ۲۰۲۴، OpenAI اذعان می‌کند که حتی بهترین مدل‌های فعلی هم گاهی در انجام وظایف تخصصی دچار خطا می‌شوند و ممکن است باگ یا مشکلات امنیتی تولید کنند. همچنین طبق آزمون داخلی OpenAI-MRCR، دقت مدل با افزایش حجم ورودی کاهش می‌یابد و از حدود ۸۴ درصد در ۸ هزار توکن به ۵۰ درصد در یک میلیون توکن می‌رسد. GPT-4.1 همچنین تمایل دارد پاسخ‌هایی «بیش‌از‌حد تحت‌اللفظی» بدهد و در نتیجه، به درخواست‌هایی واضح‌تر و دقیق‌تر نیاز دارد.