شرکت OpenAI بهزودی حالت جدیدی به نام Voice Mode را برای کاربران اشتراک پلاس سرویس ChatGPT منتشر خواهد کرد.
بهگزارش تکناک، اشتراک پلاس ChatGPT بهزودی میزبان حالت صوتی جدیدی میشود. این حالت جدید که Voice Mode نام دارد، از مدل GPT-4o استفاده و امکان مکالمهی بدون تأخیر را فراهم میکند. Voice Mode هفتهی آینده بهصورت آزمایشی برای تعداد محدودی از کاربران منتشر خواهد شد.
در ماه می، هنگامیکه OpenAI مدل پیشرفتهی خود، یعنی GPT-4o را معرفی کرد، بر قابلیت درک صوتی آن بهطور ویژه تأکید کرد. مدل GPT-4o میتواند بهطور میانگین در ۳۲۰ میلیثانیه به ورودیهای صوتی پاسخ دهد که مشابه زمان پاسخگویی انسان در گفتوگوهای معمولی است.
همچنین، شرکت OpenAI اعلام کرد که قابلیت حالت صوتی ChatGPT از قابلیتهای صوتی مدل GPT-4o بهره خواهد برد تا تجربهی گفتوگوی صوتی یکپارچه را به کاربران ارائه دهد. OpenAI دربارهی قابلیتهای صوتی GPT-4o توضیح داد:
با GPT-4o مدل جدیدی را از صفر تا صد در زمینههای متن و بینایی و صوت آموزش دادهایم. این یعنی تمامی دادههای ورودی و خروجی را شبکهی عصبی واحد پردازش میکند. ازآنجاکه GPT-4o نخستین مدل ماست که این همه مدالیتهها را در خود یکپارچه میکند، همچنان در حال بررسی توانمندیها و محدودیتهای آن هستیم.
در ماه ژوئن، OpenAI اعلام کرد حالت صوتی پیشرفته که برای عرضهی آلفا به گروه کوچکی از کاربران ChatGPT Plus در اواخر ژوئن برنامهریزی شده بود، با تأخیر یکماهه مواجه خواهد شد. OpenAI گفت که بهمنظور بهبود توانایی مدل در تشخیصدادن و ردکردن محتوای خاص به زمان بیشتری نیاز است.
علاوهبراین، این شرکت در حال آمادهسازی زیرساخت خود برای ارائهی مقیاسپذیری به میلیونها کاربر با حفظ پاسخهای بلادرنگ بود. سم آلتمن، مدیرعامل OpenAI، با انتشار پستی در شبکهی اجتماعی ایکس تأیید کرد که عرضهی آلفا حالت صوتی برای مشترکان ChatGPT Plus از هفتهی آینده آغاز خواهد شد.
حالت صوتی فعلی در ChatGPT بهدلیل تأخیرهای زیاد ۲/۸ ثانیه (GPT-3.5) و ۵/۴ ثانیه (GPT-4) عملکرد چندان رضایتبخشی ندارد. حالت صوتی پیشرفتهی آیندهی مبتنیبر GPT-4o به مشترکان ChatGPT اجازه خواهد داد تا بدون تأخیر در گفتوگوهای یکپارچه شرکت کنند.
OpenAI دیروز موتور جستوجوی هوش مصنوعی SearchGPT را رونمایی کرد که نسخهی موردانتظار از جستوجوی وب با نتایج مبتنیبر پاسخهای هوش مصنوعی است. درحالحاضر، SearchGPT بهصورت نمونهی اولیه منتشر شده و ویژگیهای جستوجوی پیشرفتهی هوش مصنوعی مانند پاسخهای سریع و مرتبط از منابع معتبر را ارائه میدهد.