شرکت OpenAI روز پنجشنبه در شرایطی از مدل جدید GPT-5.2 رونمایی کرد که رقابت این شرکت با گوگل در حوزهٔ مدلهای پیشرفتهٔ هوش مصنوعی وارد مرحلهای حساس شده است.
به گزارش سرویس هوش مصنوعی تکناک، معرفی این مدل در ادامهٔ تلاشهای OpenAI برای حفظ برتری فنی و تجاری در بازار انجام میشود؛ بازاری که طی ماههای اخیر شاهد پیشروی قابلتوجه گوگل بامدل Gemini 3 و همچنین نگرانیهایی درباره کاهش ترافیک ChatGPT بوده است.
در این رونمایی، مدیران OpenAI مدل جدید را ابزاری برای توسعهدهندگان، سازمانها و کاربران حرفهای معرفی کردند؛ ابزاری که قرار است استدلال بهتر، دقت بالاتر و قابلیت اتکا در کاربردهای واقعی را ارائه دهد.
OpenAI مدل GPT-5.2 را در سه نسخه عرضه میکند: Instant، نسخهٔ سریع و سبک برای انجام وظایف روزمره نظیر جستوجوی اطلاعات، نگارش و ترجمه؛ Thinking، نسخهٔ عمیقتر با توانایی استدلال چندگامی مناسب برای تحلیل اسناد طولانی، برنامهریزی، ریاضیات و کدنویسی؛ و Pro، نسخهٔ سازمانی که برای ارائهٔ بیشترین سطح دقت و قابلیت اتکا طراحی شده است. مدیران شرکت میگویند این تقسیمبندی به کاربران اجازه میدهد با توجه به نیاز محاسباتی و نوع کاربرد، مدل مناسب را انتخاب کنند.
فیجی سیمو، مدیر ارشد محصول OpenAI، در نشست خبری اعلام کرد که OpenAI مدل ۵.۲ را با هدف «گشودن ارزش اقتصادی بیشتر برای مردم» طراحی کرده است. او گفت این مدل در تولید صفحات گسترده، ساخت ارائههای کاری، تولید کد، تحلیل تصویر، درک متن طولانی و انجام پروژههای چندمرحلهای عملکرد بهتری نشان میدهد. به گفتهٔ او، GPT-5.2 بهبودهای قابلتوجهی در سرعت، پایداری و دقت دارد و میتواند برای کسبوکارها نقش زیرساختی ایفا کند.
عرضهٔ نسخهٔ تازه در حالی صورت میگیرد که گوگل طی ماههای اخیر، بهویژه با معرفی Gemini 3 و حالت Deep Think، جایگاه قدرتمندی در جدولهای بنچمارک به دست آورده است. در اکثر معیارهای مطرح، بهجز حوزهٔ کدنویسی که همچنان در اختیار مدل Claude Opus-4.5 شرکت Anthropic است، گوگل در رتبههای بالای مقایسهها قرار دارد. تحلیلگران میگویند سرعت پیشرفت گوگل در حوزهٔ مدلهای عاملمحور، چندرسانهای و پردازش چندمرحلهای باعث نگرانی جدی OpenAI شده است.
گزارش وبسایت The Information از انتشار یک یادداشت داخلی «کد قرمز» توسط سم آلتمن، مدیرعامل OpenAI، خبر میداد؛ یادداشتی که طی آن آلتمن نسبت به کاهش ترافیک ChatGPT و تهدید تصاحب سهم بازار توسط گوگل هشدار داده بود. او در این یادداشت خواستار توقف پروژههایی مانند معرفی تبلیغات و تمرکز مجدد بر ارائهٔ تجربهٔ کاربری بهتر برای ChatGPT شد. رونمایی از GPT-5.2، بهنظر میرسد پاسخی مستقیم به همین وضعیت باشد.
با وجود این، برخی کارکنان reportedly خواستار تعویق عرضه شده بودند تا فرصت بیشتری برای تقویت مدل فراهم شود. اما OpenAI مسیر سرعتبخش خود را ادامه داد. تحلیلگران معتقدند تغییر جهت اخیر OpenAI ـ از محصولمحوری مصرفکننده به ارائهٔ قابلیتهای عمیقتر سازمانی ـ نشان میدهد شرکت در تلاش است جایگاه خود را به عنوان «لایهٔ زیرساختی» هوش مصنوعی حفظ کند.

OpenAI در هفتهٔ جاری دادههایی منتشر کرد که رشد چشمگیر استفادهٔ سازمانی از ابزارهای آن را نشان میدهد. این دادهها بیانگر آن است که شرکت بیش از پیش در مسیر تبدیلشدن به استاندارد پیشفرض برای توسعهٔ برنامههای هوش مصنوعی حرکت میکند. این در حالی است که گوگل همزمان با معرفی سرورهای مدیریتشدهٔ MCP، اتصال Agentها به سرویسهایی مانند Google Maps و BigQuery را سادهتر کرده و اکوسیستم خود را تقویت کرده است.
OpenAI اعلام کرده است که GPT-5.2 در حوزههای کدنویسی، ریاضیات، علوم، بینایی ماشین، استدلال در بافتهای طولانی و استفاده از ابزارها رکوردهای تازهای ثبت کرده است. شرکت میگوید این تواناییها امکان ایجاد «گردشکارهای عاملمحور قابلاعتمادتر» و ایجاد «کد سطح تولید» را فراهم میکند و میتواند به طراحی سیستمهای پیچیده برای پردازش دادههای واقعی کمک کند.
مدل جدید در چندین بنچمارک مهم، از جمله SWE-Bench Pro برای مهندسی نرمافزار واقعی، GPQA Diamond برای دانش علمی در سطح دکترا، و مجموعههای ARC-AGI برای استدلال انتزاعی، عملکرد بالاتری نسبت به Gemini 3 و Claude Opus-4.5 داشته است. ادین کلارک، رهبر تحقیقات OpenAI، توضیح داد که توانایی بالا در ریاضیات صرفاً حل معادلات نیست، بلکه نشانهٔ توان مدل در دنبالکردن منطق چندمرحلهای، حفظ ثبات عددی، و جلوگیری از خطاهای کوچک انباشتی است؛ ویژگیهایی که برای برنامهریزی مالی، پیشبینی و تحلیل داده اهمیت حیاتی دارند.
جدول مقایسه عملکرد GPT-5.2 Thinking و GPT-5.1 Thinking
| Benchmark / Task Category | توضیح | GPT-5.2 Thinking | GPT-5.1 Thinking (یا GPT-5) |
| GDPval | وظایف دانشمحور (Knowledge Work) | 70.9% | 38.8% (GPT-5) |
| SWE-Bench Pro (Public) | مهندسی نرمافزار | 55.6% | 50.8% |
| SWE-Bench Verified | مهندسی نرمافزار | 80.0% | 76.3% |
| GPQA Diamond (No Tools) | پرسشهای علمی سطح دکترا | 92.4% | 88.1% |
| CharXiv Reasoning (with Python) | تحلیل و استدلال روی شکلهای علمی | 88.7% | 80.3% |
| AIME 2025 (No Tools) | ریاضیات رقابتی | 100.0% | 94.0% |
| FrontierMath (Tier 1–3) | ریاضیات پیشرفته | 40.3% | 31.0% |
| FrontierMath (Tier 4) | ریاضیات پیشرفته سطح بالا | 14.6% | 12.5% |
| ARC-AGI-1 (Verified) | استدلال انتزاعی | 86.2% | 72.8% |
| ARC-AGI-2 (Verified) | استدلال انتزاعی | 52.9% | 17.6% |
در حوزهٔ کدنویسی نیز مکس شفارتزر، مدیر محصول OpenAI، اعلام کرد که GPT-5.2 «پیشرفتهای قابلتوجهی» در تولید و رفعاشکال کد ایجاد کرده است. او گفت این مدل میتواند فرایندهای پیچیدهٔ کدنویسی را مرحلهبهمرحله توضیح دهد و استارتآپهایی مانند Windsurf و CharlieCode، عملکردی در سطح «عاملهای کدنویسی پیشرفته» گزارش کردهاند. علاوه بر این، شرکت ادعا میکند نسخهٔ Thinking مدل GPT-5.2 در مقایسه با نسل قبل ۳۸ درصد خطای کمتر دارد.
تحلیلها نشان میدهد مدل جدید OpenAI بیش از آنکه بازطراحی ریشهای باشد، یک یکپارچهسازی و تقویت دو ارتقای پیشین است. GPT-5 که در ماه اوت عرضه شد، سیستم جدیدی برای جابهجایی بین حالت سریع و حالت عمیق Thinking فراهم کرد. نسخهٔ GPT-5.1 این سیستم را مکالمهایتر و مناسبتر برای وظایف عاملمحور کرد. اکنون GPT-5.2 این روند را تکمیل و مدل را به گزینهای پایدارتر برای استفادهٔ سازمانی تبدیل کرده است.
اما همزمان با این تقویت فنی، پرسشهای جدی درباره هزینههای محاسباتی OpenAI شکل گرفته است. شرکت طی سالهای آینده تعهداتی تا سقف ۱.۴ تریلیون دلار برای توسعهٔ زیرساخت محاسباتی خود ایجاد کرده است؛ تعهداتی که اکنون، با پیشروی رقبایی مانند گوگل، فشار بیشتری بر OpenAI وارد میکند. گزارش TechCrunch نشان میدهد بخش عمدهٔ هزینهٔ اجرای مدلهای OpenAI اکنون بهصورت نقدی پرداخت میشود، زیرا هزینهها از سقف اعتبارات ابری شرکای این شرکت فراتر رفتهاند.
کارشناسان هشدار میدهند که تمرکز شدید بر مدلهای استدلالی ـ که محاسبات سنگینتری مصرف میکنند ـ ممکن است OpenAI را وارد چرخهای کند که هم توسعه و هم اجرای مدلها هزینههای بسیار بالاتری ایجاد کند.
در کنار این مسائل، نبود یک مولد تصویر جدید در این رونمایی نیز پرسشبرانگیز است. سم آلتمن در یادداشت «کد قرمز» بر اهمیت پیشبرد حوزهٔ تولید تصویر تأکید کرده بود، خصوصاً پس از محبوبیت گستردهٔ Nano Banana گوگل. گوگل ماه گذشته نسخهٔ پیشرفتهتر Gemini 3 Pro Image را عرضه کرد که قدرت رندر متن بهتر و کیفیت بصری نزدیکتر به واقعیت دارد و در ابزارهایی نظیر Mixboard برای تولید خودکار ارائهها ادغام شده است. گزارشها حاکی از آن است که OpenAI قصد دارد ژانویهٔ آینده مدل تصویری جدیدی عرضه کند، هرچند شرکت این موضوع را تأیید نکرده است.
به نقل از تککرانچ، OpenAI همچنین اعلام کرد که مجموعهای از تدابیر ایمنی جدید دربارهٔ کاربردهای مرتبط با سلامت روان و همچنین احراز سن کاربران نوجوان ارائه خواهد کرد؛ هرچند این موضوع در مراسم معرفی GPT-5.2 در مرکز توجه قرار نداشت.
با معرفی GPT-5.2، OpenAI اکنون تلاش میکند جایگاه خود را در رقابت فشردهٔ صنعت حفظ کند. این مدل قرار است همزمان نیازهای توسعهدهندگان، سازمانها و کاربران حرفهای را پاسخ دهد و در برابر شتاب فنی گوگل و سایر رقبا، رویکردی دفاعی و تهاجمی توأمان ارائه کند. اما میزان موفقیت آن در بازار بستگی خواهد داشت به چگونگی مدیریت هزینههای محاسباتی، سرعت توسعهٔ قابلیتهای تصویری، و توان شرکت در ارائهٔ تجربهٔ کاربری بهبودیافته در ChatGPT؛ مسائلی که اکنون در مرکز فشارهای داخلی و رقابت خارجی قرار دارند.

















