OpenAI با بهروزرسانی Codex و عرضه SDK عاملهای صوتی، گام تازهای در توسعه ابزارهای برنامهنویسی هوش مصنوعی برداشت.
به گزارش تکناک، شرکت OpenAI امروز دو بهروزرسانی مهم برای توسعهدهندگان معرفی کرد: ابزار Codex و عاملهای صوتی. این بهروزرسانیها با هدف گسترش قابلیتهای پلتفرم OpenAI برای برنامهنویسان و توسعهدهندگان اپلیکیشنهای هوش مصنوعی ارائه شدهاند.
فهرست مطالب
بهروزرسانی Codex شرکت OpenAI
Codex، عامل مهندسی نرمافزار OpenAI، اکنون برای کاربران ChatGPT Plus در دسترس قرار گرفته است. کاربران این نسخه میتوانند در مدت محدودی از محدودیتهای استفاده سخاوتمندانه بهرهمند شوند. ناگفته نماند که OpenAI اعلام کرده است که در زمانهای پرترافیک، محدودیتهایی برای استفاده در نظر گرفته خواهد شد.
یکی از ویژگیهای بهروزرسانی Codex شرکت OpenAI، امکان اتصال به اینترنت است. این قابلیت به Codex اجازه میدهد تا وابستگیها را نصب و بستهها را بهروزرسانی و تستهایی را اجرا کند که به منابع خارجی نیاز دارند و کارهای پیشرفتهتری انجام دهد. هرچند اتصال اینترنت بهصورت پیشفرض غیرفعال است، کاربران میتوانند آن را برای محیطهای خاص فعال و حتی دامنههای مجاز برای دسترسی را تعیین کنند. این ویژگی برای کاربران نسخههای Plus و Pro و Teams فعال است و بهزودی برای کاربران Enterprise نیز در دسترس قرار خواهد گرفت.

به نقل از نئووین، با بهروزرسانی جدید Codex میتواند درخواستهای نظرسنجی موجود را هنگام پیگیری وظیفه ویرایش کند. علاوهبر این، کاربران اکنون میتوانند دستورهای خود را بهصورت گفتاری به Codex دیکته کنند. در کنار این تغییرات، بهبودهای فنی درخورتوجهی در Codex اعمال شده است؛ ازجمله:
- پشتیبانی از فایلهای باینری هنگام اعمال Patch
- بهبود پیامهای خطا در اسکریپتهای نصب
- افزایش محدودیت تفاوت وظایف از ۱ به ۵ مگابایت
- افزایش زمان اجرای اسکریپت نصب از ۵ به ۱۰ دقیقه
- بهبود روند اتصال به گیتهاب
- فعالسازی مجدد قابلیت Live Activities در iOS
- حذف الزام احراز هویت دومرحلهای برای ورود با SSO یا شبکههای اجتماعی
عاملهای صوتی OpenAI
دومین بهروزرسانی مهم امروز به عاملهای صوتی OpenAI مربوط است. این شرکت SDK مخصوص عاملها را با پشتیبانی از زبان TypeScript منتشر کرده است که شامل قابلیتهایی مانند handoffs ،guardrails ،tracing ،MCP و دیگر اجزای اصلی عاملها میشود. همچنین، این بسته به توسعهدهندگان کمک میکند تا اجرای ابزار را متوقف کنند، وضعیت عامل را ذخیرهسازی کنند، تماسهای خاص را تأیید یا رد کنند و اجرای عامل را ادامه دهند.
در همین زمینه، مدل جدید گفتاربهگفتار نیز با بهبودهایی در بخش اجرای دقیق دستورها و ثبات در فراخوانی ابزارها و پاسخگویی بهتر هنگام قطع صحبت منتشر شده است. توسعهدهندگان اکنون میتوانند سرعت صحبت در هر جلسه را تنظیم کنند و به این مدل بهروزشده ازطریق gpt-4o-realtime-preview-2025-06-03 در Realtime API و gpt-4o-audio-preview-2025-06-03 در Chat Completions API دسترسی داشته باشند.
در پایان نیز داشبورد Traces با پشتیبانی از جلسات Realtime API بهروزرسانی شده است و به توسعهدهندگان امکان میدهد فعالیت عاملهای صوتی را با جزئیاتی مانند ورودی و خروجی صوتی و فراخوانی ابزارها و قطعهای رخداده بهصورت تصویری مشاهده کنند.