Whisper در دسترس عموم قرار می گیرد

OpenAI اعلام کرد Whisper مدل تبدیل گفتار به متن هوش مصنوعی خود را برای استفاده از طریق API و با ایجاد برخی تغییرات مهم در Policy در دسترس عموم قرار می‌دهد.

به گزارش تکناک، اکنون توسعه دهندگان شخص ثالث می توانند ChatGPT را از طریق یک API در برنامه ها و سرویس های خود ادغام کنند و انجام این کار به طور قابل توجهی ارزان تر از استفاده از سایر مدل های زبان موجود است.

OpenAI می‌گوید ChatGPT API می‌تواند برای چیزی بیشتر از ایجاد یک رابط چت مبتنی بر هوش مصنوعی استفاده شود. این شرکت می‌گوید خانواده مدل‌های زبان بزرگ جدیدش به نام gpt-3.5-turbo، «بهترین مدل برای بسیاری از موارد استفاده غیر چت» است.

 

 

 

شایان ذکر است که احتمالاً این مدل همان مدلی نیست که بینگ از آن استفاده می‌کند .مایکروسافت مدل مورد استفاده در Bing را «نسل جدید مدل زبان بزرگ OpenAI» نامیده است که «حتی سریع‌تر، دقیق‌تر و توانمندتر» از ChatGPT و GPT-3.5 است.  با این حال، با توجه به میزان پولی که این شرکت در OpenAI سرمایه گذاری کرده است، تعجب آور نیست که به فناوری هایی دسترسی دارد که در دسترس توسعه دهندگان عادی نیست. مایکروسافت همچنین از دوز سالمی از فناوری خود در Bing استفاده می کند.

OpenAI مقدار 1000 توکن را با قیمت 0.002 دلار ارائه می‌کند و می‌گوید که «10 برابر ارزان‌تر از مدل‌های GPT-3.5 موجود ما» است. این قیمت پایین تا حدی به لطف «یک سری از بهینه‌سازی‌های کل سیستم» امکان پذیر شده است. در حالی که عدد 1000 بسیار زیاد به نظر می رسد، شایان ذکر است که ارسال یک تکه متن برای API برای پاسخگویی به آن ممکن است چندین توکن هزینه داشته باشد. («Tokens» بلوک‌های متنی هستند که سیستم جملات و کلمات را به آن‌ها تقسیم می‌کند تا پیش‌بینی کند که بعداً چه متنی باید تولید کند.)

نمونه ای از کد برای استفاده از API شرکت OpenAI برای استفاده GPT-3.5

طبق اسناد OpenAI، عبارت ” ChatGPT عالی است!” شش توکن مصرف می کند. API آن را به «چت»، «G»، «PT»، «است»، «عالی» و «!» تقسیم می کند. این شرکت ابزاری را برای بررسی تعداد نشانه‌ها برای تفسیر یک رشته متن ارائه می‌کند و می‌گوید که یک قانون کلی این است که «یک نشانه معمولاً با 4 کاراکتر در انگلیسی مطابقت دارد».

این شرکت می گوید که اگر توسعه دهندگان از طریق API حجم عظیمی از داده را اجرا کنند، می توانند نمونه اختصاصی ChatGPT را نیز دریافت کنند. انجام این کار به شما کنترل بیشتری بر روی مدلی که استفاده می‌کنید، مدت زمان پاسخ به درخواست‌، و مدت زمان مکالمه با ربات می‌دهد.

در حالی که ChatGPT احتمالاً بیشترین توجه را به خود جلب می کند، OpenAI همچنین API جدید دیگری را برای Whisper مدل گفتار به متن معرفی کرده است،. این شرکت می گوید می توانید از Whisper برای رونویسی یا ترجمه صدا با هزینه 0.006 دلار در دقیقه استفاده کنید. از نظر فنی، مدل Whisper منبع باز است، بنابراین شما می توانید آن را روی سخت افزار خود بدون پرداخت هزینه اجرا کنید.

نمونه ای از کد برای استفاده از API شرکت OpenAI برای استفاده Whisper

با این حال، OpenAI احتمالاً به سخت‌افزار قدرتمندتری دسترسی دارد، بنابراین اگر به دنبال یک چرخش سریع هستید یا به رونویسی در دستگاه‌های کم مصرف مانند تلفن‌ها  نیاز دارید، استفاده از API ممکن است یکی از گزینه ها باشد.

OpenAI همچنین برخی از تغییرات policy را اعلام می کند و می گوید این تغییرات بر اساس بازخورد توسعه دهندگان خواهد بود. یک مورد بزرگ از این تغییر policy می گوید که OpenAI دیگر از داده های دریافتی از طریق API برای آموزش مدل های زبان خود استفاده نمی کند مگر اینکه مشتریان صراحتاً این استفاده را تأیید کنند.

به عبارت دیگر، از یک سیستم انصراف به یک سیستم انتخابی تبدیل می شود. این تغییر می تواند به کاهش برخی نگرانی ها در مورد قرار دادن اطلاعات اختصاصی در ربات کمک کند، زیرا برخی از شرکت ها کارمندان را از استفاده کامل از این فناوری منع کرده اند. اگر مدل هوش مصنوعی از ورودی کاربر برای آموزش استفاده کند ، همیشه این احتمال وجود دارد  هوش مصنوعی که این داده‌ها را به شخص دیگری بازگرداند. بنابراین وارد کردن اطلاعات حساس تجاری به این مدل می تواند برای شرکت ها خطرناک و زیان آور باشد.

این شرکت همچنین می گوید که در حال کار بر روی بهبود زمان کار خود است و “اولویت اصلی تیم مهندسی آن اکنون ثبات موارد استفاده در زمینه تولید است.”

در حالی که چندین توسعه‌دهنده راه‌حل‌هایی برای گنجاندن سرویس‌های چت در برنامه‌های خود ارائه کرده‌اند معرفی یک API رسمی ChatGPT  می‌تواند لحظه باز شدن دروازه‌های این شرکت به روی توسعه دهندگان برنامه های نرم افزاری باشد.

شرکت‌های زیادی هستند که روی مدل‌های ربات چت هوش مصنوعی خود کار می‌کنند، اما این نوع موارد برای اکثر توسعه‌دهندگان کاملاً دور از دسترس است. اما حالا آنها می توانند از فناوری OpenAI استفاده کنند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.