شرکت OpenAI امروز در اولین کنفرانس توسعهدهندگان خود، نسخهی بهبود یافتهی مدل هوش مصنوعی تولید متن پرچمدار خود، به نام GPT-4 Turbo را رونمایی کرد.
به گزارش تکناک، این شرکت ادعا میکند مدل جدید هم «قدرتمندتر» و هم کم هزینهتر است.
GPT-4 Turbo در دو نسخه عرضه میشود: یکی که صرفاً متن را تحلیل میکند و نسخه دومی که بافت متن و تصویر را درک میکند.
مدل تحلیل متن از امروز از طریق یک API در دسترس قرار گرفته و OpenAI (American artificial intelligence research organization) میگوید برنامهریزی میکند تا هر دو را «در هفتههای آینده» به طور کلی در دسترس قرار دهد.
قیمتگذاری آنها به ازای هر 1,000 توکن ورودی (~750 واژه) 0.01 دلار است، جایی که «توکنها» نشاندهنده قطعات متن خام هستند(مثلاً کلمه “fantastic” به “fan”، “tas” و “tic” تقسیم میشود) و 0.03 دلار برای هر 1,000 توکن خروجی محاسبه می شود. (توکنهای ورودی، توکنهایی هستند که به مدل داده میشوند، در حالی که توکنهای خروجی، توکنهایی هستند که مدل بر اساس توکنهای ورودی تولید میکند.) قیمتگذاری GPT-4 توربو که تصاویر را پردازش میکند، بسته به اندازه تصویر خواهد بود. برای مثال، ارسال یک تصویر با پیکسلهای 1080×1080 به GPT-4 توربو 0.00765 دلار هزینه خواهد داشت.
OpenAI در یک پست وبلاگی که امروز صبح با TechCrunch به اشتراک گذاشته است، نوشت: «ما عملکرد مدل هوش مصنوعی GPT را بهینه کردهایم تا بتوانیم GPT-4 توربو را با قیمتی 3 برابر ارزانتر برای توکنهای ورودی و 2 برابر ارزانتر برای توکنهای خروجی نسبت به GPT-4 ارائه دهیم.»
GPT-4 Turbo نسبت به GPT-4 چندین بهبود دارد – یکی از آنها داشتن پایگاه داده جدیدتری است که هنگام پاسخ به درخواستها از آن استفاده میکند.
مانند تمام مدلهای زبان، GPT-4 توربو اساساً یک ابزار آماری برای پیشبینی کلمات است. با تغذیه تعداد عظیمی از نمونهها، بیشتر از وب، GPT-4 توربو یاد گرفته است که کلمات بر اساس الگوها، از جمله بافت معنایی متن اطراف، چقدر احتمال دارد که رخ دهند.
GPT-4 با دادههای وب تا سپتامبر 2021 آموزش دیده است، اما آخرین دادههایی که GPT-4 توربو بر اساس آنها آموزش دیده تا آوریل 2023 است. این به این معنی است که پاسخ به سوالات در مورد رویدادهای اخیر – حداقل رویدادهایی که قبل از تاریخ جدید اتفاق افتادهاند، دقیقتر خواهد بود.
GPT-4 توربو دارای یک پنجره زمینهای گستردهتر است که تا 128,000 توکن را پشتیبانی میکند.
“Context window” یا پنجره زمینه ای به تعداد واژهها یا توکنهایی اشاره دارد که مدل میتواند در هر لحظه از آنها بهعنوان مرجع استفاده کند تا متنی که تولید میکند یا به آن پاسخ میدهد، مرتبط و معنادار باشد.
به عبارت دیگر، این پنجره معین میکند که مدل تا چه اندازهای از محتوای قبلی مکالمه را به خاطر میسپارد. در مدلهای GPT-3 و GPT-4، این پنجره معمولاً بسیار بزرگ است و میتواند هزاران واژه را در بر گیرد.
این پنجره زمینهای در بین تمام مدلهای موجود در بازار، حتی از مدل Claude 2 شرکت Anthropic نیز فراتر میرود. (Claude 2 تا 100,000 توکن را پشتیبانی میکند؛ شرکت Anthropic ادعا میکند که در حال آزمایش پنجره زمینهای به طول 200,000 توکن است، اما هنوز آن را به صورت عمومی عرضه نکرده است.)
128,000 توکن تقریباً معادل با 100,000 کلمه یا 300 صفحه است، که برای مرجع تقریباً به طول کتابهای “بلندیهای بادگیر”، “سفرهای گالیور” و “هری پاتر و زندانی آزکابان” است.
GPT-4 توربو از یک “حالت JSON” جدید پشتیبانی میکند که اطمینان حاصل میکند مدل با JSON معتبر پاسخ دهد.
این در برنامههای وب که دادهها را منتقل میکنند، مانند آنهایی که دادهها را از سرور به یک مشتری ارسال میکنند تا بر روی یک صفحه وب نمایش داده شود، مفید است.
OpenAI میگوید پارامترهای جدید و مرتبط دیگر به توسعهدهندگان اجازه خواهد داد تا مدل را برای بازگرداندن پاسخهای “ثابت”، که توسط GPT-4 توربو تولید شدهاند، تنظیم کنند.
اوپن ای آی (سازمانی تحقیقاتی در زمینهی هوش مصنوعی) مینویسد: «GPT-4 Turbo در کارهایی که نیازمند پیروی دقیق دستورالعملها هستند، مانند تولید فرمتهای خاص (مانند «همیشه در XML پاسخ دهید») بهتر از مدلهای قبلی ما عمل میکند. “و GPT-4 Turbo به احتمال زیاد پارامترهای عملکرد مناسب را برمی گرداند.”
این ارتقاء نشان میدهد که GPT-4 Turbo میتواند به طور خاص برای برنامههای کاربردی که نیازمند سطوح بالایی از دقت و انطباق با استانداردهای فرمتدهی هستند، مفید باشد.
بروزرسانی هایOpenAI برای GPT-4
امروز، شرکت OpenAI برنامه دسترسی آزمایشی برای تنظیم دقیق GPT-4 را راهاندازی میکند. در مقابل برنامه تنظیم دقیق برای GPT-3.5، نسخه قبلی GPT-4، برنامه GPT-4 شامل نظارت و راهنمایی بیشتری از تیمهای OpenAI خواهد بود، شرکت میگوید – عمدتاً به دلیل موانع فنی.
OpenAI در پست وبلاگ می نویسد: «نتایج اولیه نشان می دهد که تنظیم دقیق GPT-4 به کار بیشتری برای دستیابی به بهبودهای معنادار نسبت به مدل پایه در مقایسه با دستاوردهای قابل توجهی که با تنظیم دقیق GPT-3.5 انجام می شود، نیاز دارد.
در جای دیگر، OpenAI اعلام کرد که حد نرخ توکن در دقیقه برای همه مشتریان پرداختکننده GPT-4 را دو برابر میکند. اما قیمتگذاری همچنان یکسان باقی میماند.
به عبارتی دیگر $0.03 برای هر توکن ورودی و $0.06 برای هر توکن خروجی (برای مدل GPT-4 با پنجره زمینه 8,000 توکنی) یا $0.06 برای هر توکن ورودی و $0.012 برای هر توکن خروجی (برای GPT-4 با پنجره زمینه 32,000 توکنی).