شرکت OpenAI روز جمعه ۷ ژوئن ۲۰۲۵ در بهروزرسانی تازهای برای حالت پیشرفته صوتی ChatGPT، صدایی طبیعیتر، بیان احساسی دقیقتر و قابلیت ترجمه همزمان را معرفی کرده است.
به گزارش تکناک، این ویژگی که نخستینبار در سال گذشته همزمان با معرفی مدل GPT-4o عرضه شد، اکنون گامی دیگر بهسوی گفتوگوهای واقعاً شبیه انسان با هوش مصنوعی برداشته است.
این حالت پیشرفته، مبتنی بر مدلهای چندوجهی بومی مانند GPT-4o عمل میکند و توانایی دارد در زمانی کمتر از ۲۳۲ میلیثانیه به ورودیهای صوتی پاسخ دهد؛ زمانی که از میانگین گفتوگوی انسانی نیز فراتر نمیرود. از ویژگیهای برجسته این سیستم، درک نشانههای غیرکلامی مانند سرعت صحبت کردن کاربر و واکنش نشان دادن با لحن احساسی است.
شرکت OpenAI اوایل سال جاری یک بهروزرسانی جزئی برای کاهش قطع شدنهای ناخواسته و بهبود لهجهها منتشر کرده بود. اما بهروزرسانی جدید، تغییرات قابلتوجهتری به همراه دارد: لحنها لطیفتر، مکثها و تأکیدها طبیعیتر، همچنین بیان احساسی در مواردی چون همدلی یا کنایه بسیار دقیقتر شده است.

«واو! صدای جدید در اپلیکیشن ChatGPT فقط صحبت نمیکند، بلکه اجرا میکند. دیگر کمتر شبیه یک هوش مصنوعی است و بیشتر مانند یک دوست انسانی میباشد. کار فوقالعادهای بود تیم OpenAI!»
این واکنش شاون رالستون، کاربر شبکه ایکس (توییتر سابق)، نمونهای از استقبال کاربران از تجربه صوتی جدید ChatGPT است.
از دیگر قابلیتهای تازه حالت پیشرفته صوتی ChatGPT، امکان ترجمه صوتی درونبرنامهای است. کاربران اکنون میتوانند از ChatGPT بخواهند که مکالمهای را ترجمه کند و این ترجمه تا زمانی که کاربر بخواهد، ادامه خواهد یافت؛ ویژگی که عملاً جایگزینی برای اپلیکیشنهای ترجمه صوتی مجزا به حساب میآید.
در حال حاضر، نسخه جدید حالت پیشرفته صوتی فقط در دسترس کاربران پولی ChatGPT قرار دارد. با وجود این، OpenAI به برخی محدودیتهای باقیمانده نیز اشاره کرده است. برای مثال، در برخی موارد کیفیت صدا با افتهای جزیی همراه است، که از جمله آن میتوان به تغییرات غیرمنتظره در تُن یا زیروبمی صدا، بهویژه در برخی گزینههای صوتی خاص اشاره کرد. همچنین پدیده «توهم صوتی» همچنان بهندرت رخ میدهد و ممکن است صداهای بیربط مانند: تبلیغات، موسیقی یا اصوات نامفهوم شنیده شود.
با وجود این کاستیهای جزئی، روند بهبود مستمر این فناوری نشان میدهد که فاصله میان انسان و هوش مصنوعی در مکالمات، روزبهروز کمتر میشود.