OpenAI در نسخه جدید مدلهای هوش مصنوعی خود با عنوان GPT-4.1 تمرکز ویژهای بر بهبود تواناییهای کدنویسی کرده است.
به گزارش تکناک، OpenAI خانواده جدیدی از مدلهای هوش مصنوعی را با عنوان GPT-4.1 معرفی کرد؛ نسخهای که ازلحاظ نامگذاری نیز ادامهدهنده روند پیچیده این شرکت است. این خانواده شامل مدلهای GPT-4.1 و GPT-4.1 mini و GPT-4.1 nano میشود که به گفته OpenAI، همگی درزمینه برنامهنویسی و پیروی از دستورالعملها عملکردی عالی از خود نشان میدهند.
این مدلها فقط ازطریق API شرکت OpenAI در دسترس قرار دارند و هنوز وارد پلتفرم ChatGPT نشدهاند. هر سه مدل پنجره متنی (Context Window) با یک میلیون توکن دارند. این یعنی میتوانند تقریباً ۷۵۰ هزار واژه را در هر بار پردازش کنند.
به نقل از تککرانچ، GPT-4.1 در حالی معرفی شده است که رقبای OpenAI نظیر گوگل و آنتروپیک در حال تقویت مدلهای برنامهنویسی خود هستند. گوگل اخیراً Gemini 2.5 Pro را معرفی کرده که آن هم از پنجره متنی یکمیلیونتوکنی برخوردار است و در بنچمارکهای برنامهنویسی درخشان ظاهر شده است. همچنین، Claude 3.7 Sonnet از آنتروپیک و نسخه جدید مدل V3 شرکت دیپسیک در این حوزه رقابت میکنند.
هدف اصلی بسیاری از غولهای فناوری، ازجمله OpenAI، تربیت مدلهایی است که ازپس انجام کامل وظایف مهندسی نرمافزار بربیایند. به گفته سارا فرایر، مدیر مالی OpenAI، این شرکت در تلاش برای ساخت «دستیار مهندس نرمافزار» است که بتواند بهصورت مستقل اپلیکیشنهای کامل را توسعه دهد؛ از تضمین کیفیت و آزمایش باگ گرفته تا نگارش مستندات.

OpenAI میگوید GPT-4.1 گامی در همین راستاست و براساس بازخورد مستقیم توسعهدهندگان بهینهسازی شده تا عملکرد بهتری در کدنویسی فرانتاند ارائه کند، ویرایشهای غیرضروری را کاهش دهد، از قالبها پیروی کند، ترتیب پاسخدهی را رعایت و از ابزارها بهطور صحیح و منسجم استفاده کند.
این شرکت ادعا میکند که مدل کامل GPT-4.1 در بنچمارکهایی مانند SWE-bench عملکرد بهتری از GPT-4o و GPT-4o mini ارائه داده است. مدلهای mini و nano نیز گرچه دقت کمتری دارند، سریعتر و مقرونبهصرفهتر هستند. GPT-4.1 nano سریعترین و ارزانترین مدل OpenAI تاکنون شناخته میشود.
قیمتگذاری مدلها بدینشرح است:
- GPT-4.1: دو دلار بهازای هر یک میلیون توکن ورودی و هشت دلار برای خروجی
- GPT-4.1 mini: چهل سنت برای ورودی و ۱/۶۰ دلار برای خروجی
- GPT-4.1 nano: ده سنت برای ورودی و ۴۰ سنت برای خروجی
OpenAI اعلام کرده است که GPT-4.1 میتواند توکنهای بیشتری از GPT-4o تولید کند (۳۲٬۷۶۸ توکن در مقابل ۱۶٬۳۸۴ توکن). این مدل در بنچمارک SWE-bench Verified بین ۵۲ تا ۵۴/۶ درصد امتیاز کسب کرده که کمتر از عملکرد Gemini 2.5 Pro گوگل (۶۳/۸ درصد) و Claude 3.7 Sonnet آنتروپیک (۶۲/۳ درصد) است. همچنین، در ارزیابی جداگانهای با استفاده از Video-MME، مدل GPT-4.1 توانست به دقت ۷۲ درصدی در بخش «ویدئوهای بلند بدون زیرنویس» برسد که بهترین عملکرد در این حوزه محسوب میشود.
با وجود عملکرد مناسب در بنچمارکها و داشتن «دانشنامه» بهروزتر تا ژوئن ۲۰۲۴، OpenAI اذعان میکند که حتی بهترین مدلهای فعلی هم گاهی در انجام وظایف تخصصی دچار خطا میشوند و ممکن است باگ یا مشکلات امنیتی تولید کنند. همچنین طبق آزمون داخلی OpenAI-MRCR، دقت مدل با افزایش حجم ورودی کاهش مییابد و از حدود ۸۴ درصد در ۸ هزار توکن به ۵۰ درصد در یک میلیون توکن میرسد. GPT-4.1 همچنین تمایل دارد پاسخهایی «بیشازحد تحتاللفظی» بدهد و در نتیجه، به درخواستهایی واضحتر و دقیقتر نیاز دارد.