شرکت OpenAI در رویداد DevDay 2024 با معرفی چندین ابزار جدید برای توسعهدهندگان، تحولی بزرگ در عرصه توسعه هوش مصنوعی ایجاد کرد.
به گزارش سرویس فناوری تکناک، اعلامیه نخست در زمینه API زمان واقعی یا Realtime API میباشد که به صورت بتا در دسترس عموم قرار گرفته است و به توسعهدهندگان اجازه میدهد تا تعاملات چندوجهی و سریع (مثل گفتوگوهای صوتی طبیعی) را در برنامههای خود پیادهسازی کنند.
این ویژگی مشابه حالت گفتوگوی پیشرفته در ChatGPT عمل میکند و از شش صدای از پیش تنظیمشده پشتیبانی مینماید. برای توسعهدهندگانی که به سرعت بالای API زمان واقعی نیازی ندارند، OpenAI قابلیت پردازش صدا را نیز به API تکمیل چت اضافه کرده است.
توکنهای ورودی متن API زمان واقعی 5 دلار برای هر 1 میلیون و 20 دلار برای هر 1 میلیون توکن خروجی هزینه خواهند داشت. ورودی صوتی 100 دلار برای هر 1 میلیون توکن و خروجی 200 دلار برای هر 1 میلیون توکن هزینه خواهد داشت. بنابراین هزینه تقریبی هر دقیقه ورودی صوتی 0.06 دلار و هر دقیقه خروجی صوتی 0.24 دلار خواهد بود.
دومین اعلامیه OpenAI، معرفی قابلیت تنظیم دقیق مدلهای زبانی بر اساس تصاویر بود. با این ویژگی جدید که به GPT-4o اضافه شده است، توسعهدهندگان هوش مصنوعی میتوانند مدل را به گونهای تنظیم کنند که در کنار متن، از تصاویر نیز یاد بگیرد.
این قابلیت کاربردهای گستردهای از جمله بهبود جستوجوی تصویری، ارتقای سیستمهای تشخیص اشیاء در خودروهای خودران و تحلیل دقیق تصاویر پزشکی دارد.
تمام توسعهدهندگان هوش مصنوعی میتوانند از آخرین نسخه مدل GPT-4o، یعنی “gpt-4o-2024-08-06” برای استفاده از این ویژگی جدید بهره بگیرند.
همچنین تا پایان اکتبر 2024، شرکت OpenAI به توسعهدهندگان امکان میدهد تا یک میلیون توکن آموزشی را به صورت رایگان برای تنظیم دقیق مدل با تصاویر استفاده کنند.
پس از این مدت، هزینه هر یک میلیون توکن آموزشی 25 دلار و هزینه استنتاج نیز به ازای هر یک میلیون توکن ورودی 3.75 دلار و هر یک میلیون توکن خروجی 15 دلار خواهد بود.
سومین خبر مهم در این رویداد، ارائه پشتیبانی از Prompt Caching است. با این قابلیت، OpenAI به رقبایی همچون گوگل و Anthropic میپیوندد. Prompt Caching به توسعهدهندگان کمک میکند تا هزینهها و زمان پردازش را کاهش دهند.
این ویژگی به صورت خودکار روی آخرین نسخههای مدلهای GPT-4o، GPT-4o mini، o1-preview و o1-mini اعمال میشود و نیازی به تنظیمات اضافی توسط توسعهدهندگان نیست.
در اعلامیه چهارم، OpenAI مجموعهای جدید برای کوچک کردن مدلها معرفی کرده است. با استفاده از این ابزار، توسعهدهندگان هوش مصنوعی میتوانند مدلهای کوچکتر و کمهزینهتری بسازند که عملکردی مشابه مدلهای بزرگ و پیشرفته دارند.
در گذشته، کوچک کردن یک مدل فرایندی پیچیده و زمانبر بود، اما با این مجموعه جدید، OpenAI تمام مراحل این کار را ساده کرده و در یک پلتفرم واحد قرار داده است.
تا پایان اکتبر، توسعهدهندگان میتوانند از میلیونها توکن آموزشی رایگان برای کوچک کردن مدلهای GPT-4o و GPT-4o mini استفاده کنند. پس از آن، هزینه استفاده از این ابزار مانند سایر خدمات تنظیم دقیق OpenAI خواهد بود.
با این ابزار جدید، شرکت OpenAI به توسعهدهندگان کمک میکند تا مدلهای هوش مصنوعی را با هزینه کمتر و به راحتی ایجاد کنند و نوآوری در این حوزه را تسریع بخشند.