مدل صوتی جدید OpenAI با تمرکز بر مکالمه طبیعی و پاسخگویی همزمان، تجربهای شبیه به ارتباط با همصحبت واقعی و بدون واسطه ارائه میکند.
به گزارش سرویس هوش مصنوعی تکناک، OpenAI با تمرکز جدی بر هوش مصنوعی صوتی، گام تازهای در مسیر آینده تعامل انسان و فناوری برداشته است. در این مسیر، نقش صفحهنمایشها کمرنگ و صدا به رابط اصلی تبدیل خواهد شد. این رویکرد تازه نشان میدهد که سیلیکونولی وارد مرحلهای جدید از رقابت شده است؛ مرحلهای که هدف آن کاهش وابستگی به نمایشگرها و جایگزینی آنها با تجربهای طبیعیتر و مکالمهمحور است.
بنابر گزارش تازه وبسایت اینفورمیشن، OpenAI در دو ماه گذشته چندین تیم مهندسی و محصول و تحقیقاتی خود را ادغام کرده است تا مدلهای صوتی خود را بهطور اساسی بازطراحی کند. هدف این اقدام آمادهسازی دستگاه شخصی صوتمحور عنوان شده است که انتظار میرود در یک سال آینده معرفی شود. به گفته منابع آگاه، این پروژه فقط به بهبود صدای ChatGPT محدود نیست و بخشی از استراتژی کلان برای ورود به نسل جدید دستگاههای هوشمند به شمار میرود.
این تغییر مسیر همسو با روندی گستردهتر در صنعت فناوری است. در سالهای اخیر، بلندگوهای هوشمند دستیارهای صوتی را به بخشی عادی از زندگی روزمره تبدیل کردهاند و اکنون در بیش از یکسوم خانههای ایالات متحده حضور دارند. متا بهتازگی قابلیتی جدید برای عینکهای هوشمند ریبن خود عرضه کرده است که با استفاده از آرایهای متشکل از پنج میکروفون، شنیدن مکالمهها را در محیطهای شلوغ آسانتر میکند. قابلیت مذکور عملاً صورت انسان را به ابزار شنیداری جهتدار تبدیل میسازد.
در همین حال، گوگل آزمایش ویژگی مرورهای صوتی را آغاز کرده است که نتایج جستوجو را به خلاصههایی محاورهای و شنیداری تبدیل میکند. همزمان، تسلا نیز با ادغام چتبات گراک در خودروهای خود، بهدنبال ساخت دستیار صوتی مکالمهمحور است که بتواند از مسیریابی گرفته تا تنظیمات تهویه مطبوع را ازطریق گفتوگوی طبیعی مدیریت کند. مجموعه این تحولات نشان میدهد که صدا بهتدریج درحال تبدیلشدن به هسته اصلی تعامل با فناوری است.

در کنار غولهای فناوری، استارتاپهای متعددی نیز با همین باور وارد میدان شدهاند؛ هرچند همه آنها موفق نبودهاند. دستگاه بدون نمایشگر Humane AI Pin با وجود سرمایهگذاری چندصدمیلیوندلاری، به نمونهای هشداردهنده تبدیل شد. گردنبند Friend AI که ثبت زندگی و همراهی دائمی را وعده میدهد، نگرانیهای گستردهای درباره حریم خصوصی و پیامدهای روانی ایجاد کرده است.
درحالحاضر نیز دستکم دو شرکت ازجمله Sandbar و استارتاپی با مدیریت اریک میگیکوفسکی بنیانگذار Pebble درحال ساخت حلقههای هوشمند مبتنیبر هوش مصنوعی هستند که قرار است در سال ۲۰۲۶ معرفی شوند. با وجود تفاوت در شکل و کاربرد این محصولات، فرض اصلی یکسان است: صدا رابط کاربری آینده خواهد بود. در این چشمانداز، هر فضا از خانه و خودرو گرفته تا بدن انسان به سطحی برای تعامل و کنترل تبدیل میشود.
تککرانچ مینویسد که انتشار مدل صوتی جدید OpenAI برای اوایل سال ۲۰۲۶ برنامهریزی شده است. این مدل صدایی طبیعیتر خواهد داشت و وقفهها را مانند همصحبت واقعی مکالمه مدیریت میکند و حتی میتواند همزمان با صحبت کاربر پاسخ دهد. همچنین، گفته میشود این شرکت درحال بررسی توسعه خانوادهای از دستگاهها ازجمله عینکها یا بلندگوهای هوشمند بدون نمایشگر است که بیش از آنکه شبیه ابزار باشند، نقش همراه را ایفا کنند.
این رویکرد با دیدگاه جانی آیو، طراح ارشد سابق اپل، همراستا است. آیو پساز خرید شرکت io به تلاشهای سختافزاری OpenAI پیوسته است و کاهش اعتیاد به دستگاهها را اولویتی مهم میداند و طراحی صوتمحور را فرصتی برای جبران اشتباههای گذشته در دنیای ابزارهای دیجیتال توصیف میکند.
















