شرکت OpenAI از دو مدل جدید هوش مصنوعی خود با نامهای o3 و o4-mini رونمایی کرد که پیشرفتهترین توانایی استدلال را در میان محصولات این شرکت دارند.
به گزارش تکناک، این مدلها نهتنها در بنچمارکهای هوش مصنوعی عملکردی در سطح SOTA (یعنی پیشرفتهترین نتایج شناختهشده) ارائه میدهند، بلکه برای نخستینبار میتوانند به ابزارهای خارجی مانند مرورگر وب، مفسر Python و موارد دیگر نیز دسترسی داشته باشند.
شرکت OpenAI اعلام کرده این مدلها بهگونهای آموزش دیدهاند که تشخیص دهند چه زمانی و چگونه باید از ابزارها استفاده کنند تا پاسخهایی دقیق، کامل و مطابق با قالب مناسب ارائه دهند. به لطف این قابلیتها، کاربران میتوانند انتظار پاسخهایی بهتر و منطقیتر نسبت به مدلهای قبلی این شرکت داشته باشند.
فهرست مطالب
ویژگی های برجسته مدل های هوش مصنوعی جدید OpenAI
مدل o3 که قدرتمندترین مدل استدلال شرکت OpenAI بهشمار میرود، در آزمونهایی مانند Codeforces، SWE-bench و MMMU رکوردهای جدیدی را بهثبت رسانده است. این مدل از آپلود و تحلیل تصاویر نیز پشتیبانی میکند و کاربران میتوانند از آن برای بررسی نمودارها و گرافهای پیچیده استفاده کنند. بهگفته کارشناسان مستقل، مدل o3 در مقایسه با o1 در وظایف پیچیده و واقعی، تا ۲۰ درصد خطای کمتری دارد.
در سوی دیگر، مدل o4-mini نسخهای کوچکتر و سبکتر است که برای ارائه استدلالهای سریع و کمهزینه طراحی شده. با وجود حجم کمتر، این مدل در حوزههایی مانند ریاضی، برنامهنویسی و تحلیلهای تصویری عملکردی همتراز با o3 دارد. بهعنوان نمونه، در آزمون AIME سال ۲۰۲۵، این مدل در ترکیب با مفسر Python موفق شد امتیاز ۹۹.۵ درصد کسب کند. بهرهوری بالاتر این مدل باعث شده که کاربران بتوانند آن را در حجم استفاده بیشتری بهکار گیرند؛ مسئلهای که آن را برای پروژههای سنگین و پرکاربرد به گزینهای ایدهآل تبدیل میکند.
طبق گفته شرکت OpenAI مدلهای جدید o3 و o4-mini توانایی تحلیل و استدلال مبتنی بر تصویر را خواهند داشت؛ به این معنا که این مدلها میتوانند تصاویر را مستقیماً وارد زنجیره تفکر خود کنند. این ویژگی زمانی کاربردی خواهد بود که کاربر تصویری از طرحهایی مانند اسکچ یا محتوای یک وایتبرد را به مدل ارائه دهد. همچنین، این مدلها قادر خواهند بود برای درک بهتر، تصویر را بهعنوان بخشی از فرآیند استدلال بزرگنمایی یا بچرخوانند.
در کنار این قابلیتها، شرکت OpenAI اعلام کرده است که مدلهای استدلالی جدیدش به مجموعه کامل ابزارهای ChatGPT از جمله مرورگر وب و ابزار تولید تصویر نیز دسترسی خواهند داشت
شرکت OpenAI همچنین اعلام کرده که این مدلها از حافظه و مکالمات قبلی نیز پشتیبانی میکنند و همین موضوع باعث میشود تعامل با آنها طبیعیتر و شبیه گفتوگوی انسانی بهنظر برسد. برای افزایش کارایی، این مدلها با استفاده از یادگیری تقویتی در مقیاس بالا آموزش دیدهاند تا هم در انجام وظایف هوشمندانهتر عمل کنند و هم بهدرستی از ابزارها بهره ببرند.
مدلهای جدید o3 و o4-mini از نظر بهرهوری و صرفهجویی، نسبت به نسخههای پیشین مانند o1 و o3-mini عملکردی بهتر و هزینهای پایینتر دارند. همچنین بر اساس چارچوب ایمنی داخلی شرکت OpenAI، هر دو مدل در تمام دستهبندیهای ارزیابی ایمنی، پایینتر از سطح “خطر بالا” قرار گرفتهاند.
ابزار هوشمصنوعی متن باز Codex CLI
همچنین شرکت OpenAI از ابزار جدیدی با نام Codex CLI رونمایی کرده است؛ یک عامل کدنویسی که بهصورت محلی از طریق نرمافزار ترمینال اجرا میشود.
این ابزار همزمان با معرفی مدلهای جدید o3 و o4-mini معرفی شده و به گفته شرکت OpenAI ،ابزار Codex CLI ارتباطی میان مدلهای هوش مصنوعی این شرکت با وظایف محلی کدنویسی و پردازشهای رایانهای برقرار میکند. از طریق این ابزار، مدلهای OpenAI میتوانند روی سیستم کاربر کدنویسی کرده، کدها را ویرایش کنند و حتی اقداماتی مانند جابهجایی فایلها انجام دهند.
Codex CLI گامی ابتدایی در مسیر چشمانداز بزرگتر شرکت OpenAI برای ساخت عوامل هوشمند برنامهنویس بهشمار میرود. اخیراً، مدیر ارشد مالی این شرکت، «سارا فرایر»، از مفهوم «مهندس نرمافزار عاملی» صحبت کرده بود؛ مجموعهای از ابزارها که قادر خواهد بود تنها با دریافت شرح پروژه، اپلیکیشنی را طراحی، پیادهسازی و حتی تست کیفی کند.
با این حال، ابزار Codex CLI در حال حاضر تا این حد پیشرفته نیست. ولی قرار است با مدلهای OpenAI از جمله o3 و o4-mini یکپارچه شود و امکان تعامل مستقیم با محیطهای خط فرمان (command-line interface) را فراهم کند.
سخنگوی شرکت در این باره می گوید:
«Codex CLI یک عامل کدنویسی سبک و متنباز است که بهصورت محلی در ترمینال اجرا میشود. هدف ما فراهم کردن یک رابط شفاف و مینیمال برای پیوند مستقیم مدلها با کدها و وظایف سیستم است.کاربران میتوانند از مزایای استدلال چندرسانهای از طریق خط فرمان بهرهمند شوند؛ به این صورت که اسکرینشاتها یا طرحهای ساده را به همراه دسترسی محلی به کدها، از طریق Codex CLI به مدل ارائه دهند.»
برای تشویق توسعهدهندگان به استفاده از این ابزار، شرکت OpenAI اعلام کرده است که یک میلیون دلار گرنت API به پروژههای منتخب توسعه نرمافزار اختصاص خواهد داد. این کمکها در قالب بستههای ۲۵ هزار دلاری اعتبار API به پروژههای واجد شرایط اعطا میشود.
قیمت و زمان عرضه
مدلهای o4-mini، o4-mini-high و o3 اکنون برای کاربران نسخههای Plus، Pro و Team از طریق منوی انتخاب مدل در دسترس هستند و جایگزین نسخههای o1، o3-mini و o3-mini-high شدهاند. کاربران سازمانی و آموزشی نیز هفته آینده به این مدلها دسترسی خواهند داشت. کاربران رایگان هم میتوانند با انتخاب گزینه “Think” در بخش نگارش، مدل o4-mini را امتحان کنند. شرکت OpenAI وعده داده نسخه o3-pro را با پشتیبانی کامل از ابزارها طی هفتههای آینده عرضه کند.
قیمت مدل o3 معادل ۱۰ دلار برای هر یک میلیون توکن ورودی و ۴۰ دلار برای هر یک میلیون توکن خروجی تعیین شده، در حالی که مدل o4-mini همان قیمت مدل قبلی o3-mini را حفظ کرده است: ۱.۱۰ دلار برای هر میلیون توکن ورودی و ۴.۴۰ دلار برای توکنهای خروجی.
توسعهدهندگان از همین حالا میتوانند از طریق APIهای Chat Completions و Responses به این مدلها دسترسی داشته باشند. API مربوط به Responses نیز اکنون از خلاصهسازی استدلالی و امکان حفظ توکنهای مربوط به منطق اطراف فراخوانی توابع برای عملکرد بهتر پشتیبانی میکند. بهزودی ابزارهای اختصاصی مانند جستجوی وب، جستجوی فایل و مفسر کد هم به فرایند استدلال این مدلها افزوده خواهد شد.