شرکت OpenAI امروز مدل برنامه نویسی جدید GPT-5.1-Codex-Max را معرفی کرد که به عنوان یک ابزار کدنویسی عاملمحور برای انجام وظایف بسیار طولانی طراحی شده است.
به گزارش سرویس هوش مصنوعی تکناک، این شرکت هفته گذشته، مجموعه مدلهای GPT-5.1 را برای کاربران ChatGPT و توسعهدهندگان عرضه کرد. مدل GPT-5.1 Instant عملکردی گرمتر و هوشمندتر دارد و بهتر از نسخههای قبلی به دستورها پاسخ میدهد. مدل GPT-5.1 Thinking نیز بهعنوان یک ابزار استدلالی پیشرفته برای وظایف پیچیده معرفی شد. در کنار این دو مدل، نسخهای بهینهسازیشده برای محیطهای کدنویسی با نام GPT-5.1-Codex نیز عرضه شد که عملکرد آن در فضاهای عاملمحور توسعه نرمافزار ارتقا یافته است.
اکنون شرکت OpenAI مدل برنامه نویسی GPT-5.1-Codex-Max را به عنوان نسل جدیدی از این خانواده معرفی کرده است. این مدل، چندین پنجره متنی را همزمان مدیریت میکند و OpenAI اعلام کرده است که این سیستم میتواند در یک وظیفه واحد با میلیونها توکن بهصورت پایدار کار کند. همچنین OpenAI اعلام کرده است که کارایی این مدل، از نظر سرعت و مصرف توکن، بهتر از مدل استاندارد GPT-5.1 است.
شرکت OpenAI درباره این مدل نوشت: «GPT-5.1-Codex-Max بر اساس وظایف واقعی مهندسی نرمافزار — شامل ساخت PR، بازبینی کد، توسعه فرانتاند و پرسشوپاسخ — آموزش داده شد و در بسیاری از ارزیابیهای frontier coding از مدلهای قبلی ما عملکرد بهتری دارد.»

مدل GPT-5.1-Codex پیشتر توانسته بود امتیازهای زیر را کسب کند:
- SWE-Bench Verified: امتیاز 73.7 درصد
- SWE-Lancer IC SWE: امتیاز 66.3 درصد
- TerminalBench 2.0: امتیاز 52.8 درصد
مدل برنامه نویسی جدید GPT-5.1-Codex-Max این نتایج را ارتقا داده و به امتیازهای زیر رسیده است:
- SWE-Bench Verified: امتیاز 77.9 درصد
- SWE-Lancer IC SWE: امتیاز 79.9 درصد
- TerminalBench 2.0: امتیاز 58.1 درصد
در گذشته، مدلهای Codex عمدتاً برای محیطهای Unix بهینه شده بودند، اما نسخه جدید GPT-5.1-Codex-Max برای کار در محیط Windows نیز آموزش دیده است.
یکی از بزرگترین چالشها در رفرکتورهای پیچیده و چرخههای عاملمحور طولانیمدت، محدودیت پنجره متن است؛ محدودیتی که باعث میشود بسیاری از مدلهای فعلی پس از مدتی ناتوان شوند. مدل GPT-5.1-Codex-Max با استفاده از یک فناوری به نام compaction بهطور خودکار محتوای جلسه را فشرده میکند تا از رسیدن به سقف پنجره متن جلوگیری شود. این روند اجازه میدهد که مدل ساعتها بدون توقف کار کند. شرکت OpenAI بیان کرد که این مدل توانسته است در آزمایشهای داخلی بیش از ۲۴ ساعت روی یک وظیفه کار کند.
علاوه بر این، مدل برنامه نویسی GPT-5.1-Codex-Max بهدلیل استدلال مؤثرتر، توکنها را به شکل بهینهتری مصرف میکند. این مدل در آزمون SWE-Bench Verified برای رسیدن به نتیجه مشابه، ۳۰ درصد توکن کمتر در بخش thinking مصرف کرده است. همچنین حالت استدلالی جدید با عنوان xhigh به مدل امکان میدهد برای وظایف دشوار مدت بیشتری فکر کند.
شرکت OpenAI اعلام کرد که مدل GPT-5.1-Codex-Max اکنون در Codex CLI، افزونه IDE، سرویس cloud و code review برای کاربران ChatGPT Plus، Pro، Business، Edu، و Enterprise در دسترس است. این مدل بهزودی به API نیز اضافه میشود. همچنین OpenAI، مدل GPT-5.1-Codex را کنار گذاشته و GPT-5.1-Codex-Max را به عنوان مدل پیشفرض Codex جایگزین کرده است.

















