شرکت OpenAI از مدل برنامه نویسی GPT-5.1-Codex-Max رونمایی کرد

شرکت OpenAI امروز مدل برنامه نویسی جدید GPT-5.1-Codex-Max را معرفی کرد که به‌ عنوان یک ابزار کدنویسی عامل‌محور برای انجام وظایف بسیار طولانی‌ طراحی شده است.

به گزارش سرویس هوش مصنوعی تک‌ناک، این شرکت هفته گذشته، مجموعه مدل‌های GPT-5.1 را برای کاربران ChatGPT و توسعه‌دهندگان عرضه کرد. مدل GPT-5.1 Instant عملکردی گرم‌تر و هوشمندتر دارد و بهتر از نسخه‌های قبلی به دستورها پاسخ می‌دهد. مدل GPT-5.1 Thinking نیز به‌عنوان یک ابزار استدلالی پیشرفته برای وظایف پیچیده معرفی شد. در کنار این دو مدل، نسخه‌ای بهینه‌سازی‌شده برای محیط‌های کدنویسی با نام GPT-5.1-Codex نیز عرضه شد که عملکرد آن در فضاهای عامل‌محور توسعه نرم‌افزار ارتقا یافته است.

اکنون شرکت OpenAI مدل برنامه نویسی GPT-5.1-Codex-Max را به عنوان نسل جدیدی از این خانواده معرفی کرده است. این مدل، چندین پنجره متنی را هم‌زمان مدیریت می‌کند و OpenAI اعلام کرده است که این سیستم می‌تواند در یک وظیفه واحد با میلیون‌ها توکن به‌صورت پایدار کار کند. همچنین OpenAI اعلام کرده است که کارایی این مدل، از نظر سرعت و مصرف توکن، بهتر از مدل استاندارد GPT-5.1 است.

شرکت OpenAI درباره این مدل نوشت: «GPT-5.1-Codex-Max بر اساس وظایف واقعی مهندسی نرم‌افزار — شامل ساخت PR، بازبینی کد، توسعه فرانت‌اند و پرسش‌وپاسخ — آموزش داده شد و در بسیاری از ارزیابی‌های frontier coding از مدل‌های قبلی ما عملکرد بهتری دارد.»

رونمایی OpenAI از مدل برنامه نویسی GPT-5.1-Codex-Max

مدل GPT-5.1-Codex پیش‌تر توانسته بود امتیازهای زیر را کسب کند:

SWE-Bench Verified: امتیاز 73.7 درصد
SWE-Lancer IC SWE: امتیاز 66.3 درصد
TerminalBench 2.0: امتیاز 52.8 درصد

مدل برنامه نویسی جدید GPT-5.1-Codex-Max این نتایج را ارتقا داده و به امتیازهای زیر رسیده است:

SWE-Bench Verified: امتیاز 77.9 درصد
SWE-Lancer IC SWE: امتیاز 79.9 درصد
TerminalBench 2.0: امتیاز 58.1 درصد

در گذشته، مدل‌های Codex عمدتاً برای محیط‌های Unix بهینه شده بودند، اما نسخه جدید GPT-5.1-Codex-Max برای کار در محیط Windows نیز آموزش دیده است.

یکی از بزرگ‌ترین چالش‌ها در رفرکتورهای پیچیده و چرخه‌های عامل‌محور طولانی‌مدت، محدودیت پنجره متن است؛ محدودیتی که باعث می‌شود بسیاری از مدل‌های فعلی پس از مدتی ناتوان شوند. مدل GPT-5.1-Codex-Max با استفاده از یک فناوری به نام compaction به‌طور خودکار محتوای جلسه را فشرده می‌کند تا از رسیدن به سقف پنجره متن جلوگیری شود. این روند اجازه می‌دهد که مدل ساعت‌ها بدون توقف کار کند. شرکت OpenAI بیان کرد که این مدل توانسته است در آزمایش‌های داخلی بیش از ۲۴ ساعت روی یک وظیفه کار کند.

علاوه بر این، مدل برنامه نویسی GPT-5.1-Codex-Max به‌دلیل استدلال مؤثرتر، توکن‌ها را به شکل بهینه‌تری مصرف می‌کند. این مدل در آزمون SWE-Bench Verified برای رسیدن به نتیجه مشابه، ۳۰ درصد توکن کمتر در بخش thinking مصرف کرده است. همچنین حالت استدلالی جدید با عنوان xhigh به مدل امکان می‌دهد برای وظایف دشوار مدت بیشتری فکر کند.

شرکت OpenAI اعلام کرد که مدل GPT-5.1-Codex-Max اکنون در Codex CLI، افزونه IDE، سرویس cloud و code review برای کاربران ChatGPT Plus، Pro، Business، Edu، و Enterprise در دسترس است. این مدل به‌زودی به API نیز اضافه می‌شود. همچنین OpenAI، مدل GPT-5.1-Codex را کنار گذاشته و GPT-5.1-Codex-Max را به‌ عنوان مدل پیش‌فرض Codex جایگزین کرده است.