شرکت OpenAI روز سهشنبه مدل هوش مصنوعی جدیدی به نام “o3-pro” را معرفی کرد که نسخه پیشرفتهای از مدل استدلالی “o3” است.
به گزارش تکناک، این مدل برای حل مسائل به شیوه گامبهگام طراحی شده است و در حوزههایی مانند فیزیک، ریاضیات و برنامهنویسی، عملکرد قابل اطمینانی از خود نشان میدهد و طبق ادعای OpenAI قدرتمندترین مدل این شرکت تا به امروز است.
بر اساس اعلام OpenAI، مدل o3-pro از امروز برای کاربران نسخههای Pro و Team در ChatGPT در دسترس قرار گرفته و جایگزین مدل قبلی یعنی «o1-pro» شده است. کاربران سازمانی و آموزشی نیز از هفته آینده به این مدل دسترسی خواهند داشت. همچنین از بعدازظهر امروز، o3-pro از طریق API توسعهدهندگان OpenAI نیز قابل استفاده است.
هزینه استفاده از هوش مصنوعی o3-pro در API معادل ۲۰ دلار به ازای هر یک میلیون توکن ورودی و ۸۰ دلار به ازای هر یک میلیون توکن خروجی تعیین شده است. توکن ورودی به دادههایی اطلاق میشود که به مدل داده میشود و توکن خروجی مربوط به محتوایی است که مدل بر اساس آن، دادهها را تولید میکند. برای درک بهتر، یک میلیون توکن ورودی معادل تقریبی ۷۵۰ هزار کلمه است، یعنی کمی طولانیتر از رمان «جنگ و صلح» میباشد.

در گزارش تغییرات OpenAI آمده است:
«در ارزیابیهای تخصصی، بررسیکنندگان در تمامی دستههای مورد آزمون، مدل o3-pro را به o3 ترجیح دادند، بهویژه در حوزههایی مانند علم، آموزش، برنامهنویسی، کسبوکار و کمک به نگارش این موضوع دیده شد. همچنین این مدل از نظر وضوح، جامعیت، تبعیت از دستورالعملها و دقت، امتیازهای بالاتری کسب کرده است.»
شرکت OpenAI بیان کرد که مدل هوش مصنوعی o3-pro به مجموعهای از ابزارها نیز دسترسی دارد که به آن امکان میدهد جستوجو در وب، تحلیل فایلها، استدلال درباره ورودیهای تصویری، استفاده از زبان برنامهنویسی پایتون و شخصیسازی پاسخها با بهرهگیری از حافظه را انجام دهد. با وجود این، یکی از نقاط ضعف این مدل، زمان پاسخدهی طولانیتر نسبت به مدل o1-pro است.
از دیگر محدودیتهای فعلی o3-pro، غیرفعال بودن گفتوگوهای موقت در ChatGPT به دلیل «مشکل فنی» اعلامشده، عدم پشتیبانی از تولید تصویر و نبود قابلیت Canvas (محیط کاری مجهز به هوش مصنوعی OpenAI) است.
با وجود این، شرکت OpenAI اعلام کرده که o3-pro در آزمونهای استاندارد هوش مصنوعی، عملکرد چشمگیری داشته است. برای نمونه، در آزمون AIME 2024 که مهارتهای ریاضی مدلها را میسنجد، o3-pro بهتر از مدل “Gemini 2.5 Pro” از گوگل عمل کرده است. همچنین این مدل موفق شده است که در آزمون GPQA Diamond —معیاری برای سنجش دانش علمی در سطح دکترای تخصصی— از مدل قدرتمند “Claude 4 Opus” ساخت شرکت Anthropic پیشی بگیرد.