OpenAI اعلام کرد Whisper مدل تبدیل گفتار به متن هوش مصنوعی خود را برای استفاده از طریق API و با ایجاد برخی تغییرات مهم در Policy در دسترس عموم قرار میدهد.
به گزارش تکناک، اکنون توسعه دهندگان شخص ثالث می توانند ChatGPT را از طریق یک API در برنامه ها و سرویس های خود ادغام کنند و انجام این کار به طور قابل توجهی ارزان تر از استفاده از سایر مدل های زبان موجود است.
OpenAI میگوید ChatGPT API میتواند برای چیزی بیشتر از ایجاد یک رابط چت مبتنی بر هوش مصنوعی استفاده شود. این شرکت میگوید خانواده مدلهای زبان بزرگ جدیدش به نام gpt-3.5-turbo، «بهترین مدل برای بسیاری از موارد استفاده غیر چت» است.
شایان ذکر است که احتمالاً این مدل همان مدلی نیست که بینگ از آن استفاده میکند .مایکروسافت مدل مورد استفاده در Bing را «نسل جدید مدل زبان بزرگ OpenAI» نامیده است که «حتی سریعتر، دقیقتر و توانمندتر» از ChatGPT و GPT-3.5 است. با این حال، با توجه به میزان پولی که این شرکت در OpenAI سرمایه گذاری کرده است، تعجب آور نیست که به فناوری هایی دسترسی دارد که در دسترس توسعه دهندگان عادی نیست. مایکروسافت همچنین از دوز سالمی از فناوری خود در Bing استفاده می کند.
OpenAI مقدار 1000 توکن را با قیمت 0.002 دلار ارائه میکند و میگوید که «10 برابر ارزانتر از مدلهای GPT-3.5 موجود ما» است. این قیمت پایین تا حدی به لطف «یک سری از بهینهسازیهای کل سیستم» امکان پذیر شده است. در حالی که عدد 1000 بسیار زیاد به نظر می رسد، شایان ذکر است که ارسال یک تکه متن برای API برای پاسخگویی به آن ممکن است چندین توکن هزینه داشته باشد. («Tokens» بلوکهای متنی هستند که سیستم جملات و کلمات را به آنها تقسیم میکند تا پیشبینی کند که بعداً چه متنی باید تولید کند.)
طبق اسناد OpenAI، عبارت ” ChatGPT عالی است!” شش توکن مصرف می کند. API آن را به «چت»، «G»، «PT»، «است»، «عالی» و «!» تقسیم می کند. این شرکت ابزاری را برای بررسی تعداد نشانهها برای تفسیر یک رشته متن ارائه میکند و میگوید که یک قانون کلی این است که «یک نشانه معمولاً با 4 کاراکتر در انگلیسی مطابقت دارد».
این شرکت می گوید که اگر توسعه دهندگان از طریق API حجم عظیمی از داده را اجرا کنند، می توانند نمونه اختصاصی ChatGPT را نیز دریافت کنند. انجام این کار به شما کنترل بیشتری بر روی مدلی که استفاده میکنید، مدت زمان پاسخ به درخواست، و مدت زمان مکالمه با ربات میدهد.
در حالی که ChatGPT احتمالاً بیشترین توجه را به خود جلب می کند، OpenAI همچنین API جدید دیگری را برای Whisper مدل گفتار به متن معرفی کرده است،. این شرکت می گوید می توانید از Whisper برای رونویسی یا ترجمه صدا با هزینه 0.006 دلار در دقیقه استفاده کنید. از نظر فنی، مدل Whisper منبع باز است، بنابراین شما می توانید آن را روی سخت افزار خود بدون پرداخت هزینه اجرا کنید.
با این حال، OpenAI احتمالاً به سختافزار قدرتمندتری دسترسی دارد، بنابراین اگر به دنبال یک چرخش سریع هستید یا به رونویسی در دستگاههای کم مصرف مانند تلفنها نیاز دارید، استفاده از API ممکن است یکی از گزینه ها باشد.
OpenAI همچنین برخی از تغییرات policy را اعلام می کند و می گوید این تغییرات بر اساس بازخورد توسعه دهندگان خواهد بود. یک مورد بزرگ از این تغییر policy می گوید که OpenAI دیگر از داده های دریافتی از طریق API برای آموزش مدل های زبان خود استفاده نمی کند مگر اینکه مشتریان صراحتاً این استفاده را تأیید کنند.
به عبارت دیگر، از یک سیستم انصراف به یک سیستم انتخابی تبدیل می شود. این تغییر می تواند به کاهش برخی نگرانی ها در مورد قرار دادن اطلاعات اختصاصی در ربات کمک کند، زیرا برخی از شرکت ها کارمندان را از استفاده کامل از این فناوری منع کرده اند. اگر مدل هوش مصنوعی از ورودی کاربر برای آموزش استفاده کند ، همیشه این احتمال وجود دارد هوش مصنوعی که این دادهها را به شخص دیگری بازگرداند. بنابراین وارد کردن اطلاعات حساس تجاری به این مدل می تواند برای شرکت ها خطرناک و زیان آور باشد.
این شرکت همچنین می گوید که در حال کار بر روی بهبود زمان کار خود است و “اولویت اصلی تیم مهندسی آن اکنون ثبات موارد استفاده در زمینه تولید است.”
در حالی که چندین توسعهدهنده راهحلهایی برای گنجاندن سرویسهای چت در برنامههای خود ارائه کردهاند معرفی یک API رسمی ChatGPT میتواند لحظه باز شدن دروازههای این شرکت به روی توسعه دهندگان برنامه های نرم افزاری باشد.
شرکتهای زیادی هستند که روی مدلهای ربات چت هوش مصنوعی خود کار میکنند، اما این نوع موارد برای اکثر توسعهدهندگان کاملاً دور از دسترس است. اما حالا آنها می توانند از فناوری OpenAI استفاده کنند.