OpenAI ابزارهای جدیدی برای توسعه‌دهندگان هوش مصنوعی معرفی کرد

شرکت OpenAI در رویداد DevDay 2024 با معرفی چندین ابزار جدید برای توسعه‌دهندگان، تحولی بزرگ در عرصه توسعه هوش مصنوعی ایجاد کرد.

به گزارش سرویس فناوری تک‌ناک، اعلامیه نخست در زمینه API زمان واقعی یا Realtime API می‌باشد که به صورت بتا در دسترس عموم قرار گرفته است و به توسعه‌دهندگان اجازه می‌دهد تا تعاملات چندوجهی و سریع (مثل گفت‌وگوهای صوتی طبیعی) را در برنامه‌های خود پیاده‌سازی کنند.

این ویژگی مشابه حالت گفت‌وگوی پیشرفته در ChatGPT عمل می‌کند و از شش صدای از پیش تنظیم‌شده پشتیبانی می‌نماید. برای توسعه‌دهندگانی که به سرعت بالای API زمان واقعی نیازی ندارند، OpenAI قابلیت پردازش صدا را نیز به API تکمیل چت اضافه کرده است.

توکن‌های ورودی متن API زمان واقعی 5 دلار برای هر 1 میلیون و 20 دلار برای هر 1 میلیون توکن خروجی هزینه خواهند داشت. ورودی صوتی 100 دلار برای هر 1 میلیون توکن و خروجی 200 دلار برای هر 1 میلیون توکن هزینه خواهد داشت. بنابراین هزینه تقریبی هر دقیقه ورودی صوتی 0.06 دلار و هر دقیقه خروجی صوتی 0.24 دلار خواهد بود.

دومین اعلامیه OpenAI، معرفی قابلیت تنظیم دقیق مدل‌های زبانی بر اساس تصاویر بود. با این ویژگی جدید که به GPT-4o اضافه شده است، توسعه‌دهندگان هوش مصنوعی می‌توانند مدل را به گونه‌ای تنظیم کنند که در کنار متن، از تصاویر نیز یاد بگیرد.

این قابلیت کاربردهای گسترده‌ای از جمله بهبود جست‌وجوی تصویری، ارتقای سیستم‌های تشخیص اشیاء در خودروهای خودران و تحلیل دقیق تصاویر پزشکی دارد.

تمام توسعه‌دهندگان هوش مصنوعی می‌توانند از آخرین نسخه مدل GPT-4o، یعنی “gpt-4o-2024-08-06” برای استفاده از این ویژگی جدید بهره بگیرند.

همچنین تا پایان اکتبر 2024، شرکت OpenAI به توسعه‌دهندگان امکان می‌دهد تا یک میلیون توکن آموزشی را به صورت رایگان برای تنظیم دقیق مدل با تصاویر استفاده کنند.

پس از این مدت، هزینه هر یک میلیون توکن آموزشی 25 دلار و هزینه استنتاج نیز به ازای هر یک میلیون توکن ورودی 3.75 دلار و هر یک میلیون توکن خروجی 15 دلار خواهد بود.

سومین خبر مهم در این رویداد، ارائه پشتیبانی از Prompt Caching است. با این قابلیت، OpenAI به رقبایی همچون گوگل و Anthropic می‌پیوندد. Prompt Caching به توسعه‌دهندگان کمک می‌کند تا هزینه‌ها و زمان پردازش را کاهش دهند.

این ویژگی به صورت خودکار روی آخرین نسخه‌های مدل‌های GPT-4o، GPT-4o mini، o1-preview و o1-mini اعمال می‌شود و نیازی به تنظیمات اضافی توسط توسعه‌دهندگان نیست.

رونمایی OpenAI از ابزارهای جدید برای توسعه‌دهندگان هوش مصنوعی

در اعلامیه چهارم، OpenAI مجموعه‌ای جدید برای کوچک کردن مدل‌ها معرفی کرده است. با استفاده از این ابزار، توسعه‌دهندگان هوش مصنوعی می‌توانند مدل‌های کوچک‌تر و کم‌هزینه‌تری بسازند که عملکردی مشابه مدل‌های بزرگ و پیشرفته دارند.

در گذشته، کوچک کردن یک مدل فرایندی پیچیده و زمان‌بر بود، اما با این مجموعه جدید، OpenAI تمام مراحل این کار را ساده کرده و در یک پلتفرم واحد قرار داده است.

تا پایان اکتبر، توسعه‌دهندگان می‌توانند از میلیون‌ها توکن آموزشی رایگان برای کوچک کردن مدل‌های GPT-4o و GPT-4o mini استفاده کنند. پس از آن، هزینه استفاده از این ابزار مانند سایر خدمات تنظیم دقیق OpenAI خواهد بود.

با این ابزار جدید، شرکت OpenAI به توسعه‌دهندگان کمک می‌کند تا مدل‌های هوش مصنوعی را با هزینه کمتر و به راحتی ایجاد کنند و نوآوری در این حوزه را تسریع بخشند.