غولهای فناوری جهان نظیر گوگل و اپل و آمازون استفاده از هوش مصنوعی مولد در دستیارهای صوتی خود را در دستورکار قرار دادهاند تا آنها را بیشازپیش کاربردی کنند.
بهگزارش تکناک، اپل با ادغام هوش مصنوعی مولد در دستیار سیری، بهدنبال ارتقای سطح درک زبان و زمینه و تسهیل مکالمات طبیعیتر است. آمازون نیز با بهکارگیری هوش مصنوعی مولد در الکسای جدید، قصد دارد این دستیار را به ابزاری قدرتمند برای مدیریت هوشمندانه خانه تبدیل کند.
دستیارهای صوتی با وجود ظرفیتهای فراوانشان، در یک دههی گذشته (از زمان ورود سیریِ اپل و الکسایِ آمازون) همچنان درگیر انجام کارهای ابتدایی هستند! رقابت دستیار گوگل نتوانسته است جرقهی نوآوری در این حوزه را روشن کند و کنترل صوتی بهنوعی پسرفت کرده است. این دستیارها بهطور مکرر اشتباه میفهمند و بد میشنوند و گاهی اوقات اصلاً گوش نمیدهند.
آنها با دستیارهای دیجیتال پیشبینیکننده و باهوشی که در ابتدا معرفی شدند، فاصلهی زیادی دارند. اینجاست که نوبت به هوش مصنوعی مولد میرسد؛ فناوریای که دستیارهای صوتی برای تبدیلشدن از قابلیتی ابتدایی به ضرورتی مهم به آن نیاز دارند.
اپل این هفته در کنفرانس WWDC 2024، برنامههایش را برای تزریق این تکنولوژی نوظهور به دستیار صوتی سیری توضیح داد. این قابلیت دو مهارت اساسی دراختیار سیری قرار میدهد: ۱. درک زمینه؛ ۲. مکالمه. این همان فرمول موفقی است که وعدههای اولیه را محقق میکند یا حداقل ما را به آن نزدیکتر میکند.
اپل میگوید هوش مصنوعی جدیدش موسوم به Apple Intelligence با درک بهتر زبان و آگاهی از زمینهی شخصی و توانایی انجام اقدامات در سراسر اپلیکیشنهای گوشی، به سیری قدرتهای جدیدی میبخشد.
سیری، الکسا و… دستیارهای صوتی مجهز به هوش مصنوعی هستند؛ ماشینهایی که با ترکیبی از برنامهریزی فرمان و پاسخ و یادگیری ماشینی، هوش شبیه انسان را تقلید میکنند. با قدرت هوش مصنوعی مولد و مدلهای زبان بزرگ (LLMs)، دستیارهای صوتی میتوانند براساس آنچه یاد گرفتهاند، پاسخ ایجاد کنند، نه اینکه صرفاً با دانش موجود واکنش نشان دهند.
این قابلیتها ابزار لازم برای ایجاد دستیار صوتی هوشمندتر و مکالمهمحورتر را فراهم میکند؛ دستیاری که مفیدتربودن درمقایسهبا دستیارهای امروزی را نوید میدهد. بااینحال، تابهامروز فقط نمونههای نمایشی از این قابلیتها را شاهد بودهایم و هیچکدام از آنها هنوز در دنیای واقعی وجود ندارند.
دلیل این امر آن است که ساختن دستیار صوتی هوشمند، مشکلی بزرگ با پیامدهای بالقوهی به همان اندازه عظیم است؛ بهخصوص اگر اشتباه کند. همچنین، این کار بهسادگی انجام عمل جراحی Lobotomy روی سیری و الکسا به سبک ChatGPT نیست.
دستیارهای صوتی، بهخصوص آنهایی که به وسایل و خدمات گوشی و خانهی ما متصل هستند، با چتبات موجود در مرورگر متفاوتاند. آنها میتوانند در دنیای واقعی اقداماتی مانند کنترل ترموستات و چراغها و ارسال ایمیل و پیام را انجام دهند. این جایی نیست که بخواهید هوش مصنوعی با قابلیت توهمزایی احتمالی در کنترل داشته باشید و دلیلی است که چرا اپل ادغام ChatGPT با سیری را بهدقت در محیطی امن (Sandbox) انجام داده است.
آمازون هم روی دستیار صوتی جدید و بهبودیافته کار میکند. درحالیکه این شرکت میگوید هوش مصنوعی مولد را در اجزای الکسا ادغام کرده است، طبق گزارشی از فورچون، الکسای جدید حتی به مرحلهی نهایی نزدیک هم نیست.
پاییز گذشته، آمازون با نمایشی خیرهکننده از الکسای جدید با قابلیت یادگیری ماشینی زبان بزرگ (Alexa LLM)، الکسای کاملاً جدید و باهوشتر و مکالمهمحورتری را رونمایی کرد. در این نمایش، الکسایی معرفی شد که باید عبارات محاورهای را برای برقراری تعاملات انسانیتر درک و زمینه را مؤثرتر تفسیر و چندین درخواست را با یک دستور کامل کند.
بااینحال، از آن زمان تاکنون نشانی از این الکسا ندیدهایم و فقط اطمینانهای مبهمی مبنیبر حضور آن در پیشنمایشی محدود دریافت کردهایم. طبق گزارش فورچون، دلیل این امر احتمالاً تلاش آمازون برای ادغام الکسای قدیمی و قابلیتهایش با چشمانداز این شرکت برای دستیار صوتی نسل بعدی است.
بهطور مشابه، اپل نیز رویکردی کُند و محتاطانه اتخاذ کرده است. سیری جدید تا پاییز عرضه نخواهد شد و حتی در آن زمان، بهصورت آزمایشی ارائه میشود. همچنین، در ابتدا جایی در خانه هوشمند نخواهد داشت و روی هیچیک از دستگاههای هوشمند خانگی و مبتنیبر صدا، مانند بلندگوهای هوشمند هومپاد و اپل تیوی پشتیبانی نمیشود. ناگفته نماند که قرار نیست بهزودی برای اپل واچ نیز عرضه شود.
اگرچه بهاحتمال زیاد این دستگاهها قدرت پردازش کافی برای اجرای مدلهای مولد را ندارند، این موضوع نقصی بزرگ بهنظر میرسد. خانهی هوشمند فضای مهمی برای دستیار صوتی باهوشتر است؛ زیرا نهتنها میتواند به برقراری ارتباط بین فضای شخصی و خانه کمک کند؛ بلکه میتواند ادارهی خانهی هوشمند را بسیار آسانتر نماید.
برخلاف اپل، آمازون اعلام کرده است که الکسای جدید روی تمام بلندگوهای هوشمند اکو، ازجمله اولین اکو که در سال ۲۰۱۴ عرضه شد، کاربردی خواهد بود. این کار با انتقال پردازش به ابر امکانپذیر است. بااینحال، باتوجهبه اینکه هومپاد مینی هماکنون چهار سال قدمت دارد، ممکن است بهزودی شاهد مدل جدیدی با سختافزار بهروزرسانیشده و طراحیشده برای هوش مصنوعی باشیم. اپل نمیتواند عرصهی خانهی هوشمند را بیشازاین به الکسا واگذار کند.
بهنقل از ورج، صحنه برای ظهور دوبارهی دستیارهای صوتی چیده شده؛ اما تا پردهی اول نمایش هنوز راه زیادی باقی مانده است. همچنین، این احتمال وجود دارد که اگر این شرکتها نتوانند راهی برای ادغام مؤثر فناوری جدید روی زیرساخت قدیمی پیدا کنند، نمایش با شخصیتهای کاملاً جدیدی آغاز شود.
احتمالاً گوگل دستیار صوتی کاملاً جدیدی راهاندازی خواهد کرد. بهنظر میرسد این مسیر مدنظر گوگل است. دستیار صوتی Google Assistant هنوز تحت بازنگری اساسی هوش مصنوعی قرار نگرفته و طبق گزارشها، این شرکت تمام منابع خود را صرف دستیار جدید مبتنیبر هوش مصنوعی به نام جمنای کرده است.
باتوجهبه علاقهی گوگل به کنارگذاشتن ابزارهای قدیمی، بهنظر میرسد ادغام این دو دستیار حرکت منطقی باشد؛ اما احتمالاً این شرکت دستیار صوتی کاملاً جدیدی را برپایهی هوش مصنوعی مولد از پایه خواهد ساخت. با هر روشی که شرکتها به آن دست پیدا کنند، وعدهی این دستیارهای صوتی هوشمند هیجانانگیز است؛ بهویژه برای شرکتی که بتواند دستیار شخصی را بهطور مؤثر با خانه ادغام کند.