تحول در دستیاران صوتی مختلف با هوش مصنوعی مولد

هوش مصنوعی مولد

غول‌های فناوری جهان نظیر گوگل و اپل و آمازون استفاده از هوش مصنوعی مولد در دستیارهای صوتی خود را در دستورکار قرار داده‌اند تا آن‌ها را بیش‌ازپیش کاربردی کنند.

به‌گزارش تک‌ناک، اپل با ادغام هوش مصنوعی مولد در دستیار سیری، به‌دنبال ارتقای سطح درک زبان و زمینه و تسهیل مکالمات طبیعی‌تر است. آمازون نیز با به‌کارگیری هوش مصنوعی مولد در الکسای جدید، قصد دارد این دستیار را به ابزاری قدرتمند برای مدیریت هوشمندانه خانه تبدیل کند.

دستیارهای صوتی با وجود ظرفیت‌های فراوانشان، در یک دهه‌ی گذشته (از زمان ورود سیریِ اپل و الکسایِ آمازون) همچنان درگیر انجام کارهای ابتدایی هستند! رقابت دستیار گوگل نتوانسته است جرقه‌ی نوآوری در این حوزه را روشن کند و کنترل صوتی به‌نوعی پسرفت کرده است. این دستیارها به‌طور مکرر اشتباه می‌فهمند و بد می‌شنوند و گاهی اوقات اصلاً گوش نمی‌دهند.

آن‌ها با دستیارهای دیجیتال پیش‌بینی‌کننده و باهوشی که در ابتدا معرفی شدند، فاصله‌ی زیادی دارند. اینجاست که نوبت به هوش مصنوعی مولد می‌رسد؛ فناوری‌ای که دستیارهای صوتی برای تبدیل‌شدن از قابلیتی ابتدایی به ضرورتی مهم به آن نیاز دارند.

اپل این هفته در کنفرانس WWDC 2024، برنامه‌هایش را برای تزریق این تکنولوژی نوظهور به دستیار صوتی سیری توضیح داد‌. این قابلیت دو مهارت اساسی در‌اختیار سیری قرار می‌دهد: ۱. درک زمینه؛ ۲. مکالمه. این همان فرمول موفقی است که وعده‌های اولیه را محقق می‌کند یا حداقل ما را به آن نزدیک‌تر می‌کند.

اپل می‌گوید هوش مصنوعی جدیدش موسوم به Apple Intelligence با درک بهتر زبان و آگاهی از زمینه‌ی شخصی و توانایی انجام اقدامات در سراسر اپلیکیشن‌های گوشی، به سیری قدرت‌های جدیدی می‌بخشد.

سیری، الکسا و… دستیارهای صوتی مجهز به هوش مصنوعی هستند؛ ماشین‌هایی که با ترکیبی از برنامه‌ریزی فرمان و پاسخ و یادگیری ماشینی، هوش شبیه انسان را تقلید می‌کنند. با قدرت هوش مصنوعی مولد و مدل‌های زبان بزرگ (LLMs)، دستیارهای صوتی می‌توانند براساس آنچه یاد گرفته‌اند، پاسخ ایجاد کنند، نه اینکه صرفاً با دانش موجود واکنش نشان دهند.

این قابلیت‌ها ابزار لازم برای ایجاد دستیار صوتی هوشمندتر و مکالمه‌محورتر را فراهم می‌کند؛ دستیاری که مفیدتر‌بودن درمقایسه‌با دستیارهای امروزی را نوید می‌دهد. بااین‌حال، تا‌به‌امروز فقط نمونه‌های نمایشی از این قابلیت‌ها را شاهد بوده‌ایم و هیچ‌کدام از آن‌ها هنوز در دنیای واقعی وجود ندارند.

دلیل این امر آن است که ساختن دستیار صوتی هوشمند، مشکلی بزرگ با پیامدهای بالقوه‌ی به همان اندازه عظیم است؛ به‌خصوص اگر اشتباه کند. همچنین، این کار به‌سادگی انجام عمل جراحی Lobotomy روی سیری و الکسا به سبک ChatGPT نیست.

دستیارهای صوتی، به‌خصوص آن‌هایی که به وسایل و خدمات گوشی و خانه‌ی ما متصل هستند، با چت‌بات موجود در مرورگر متفاوت‌اند. آن‌ها می‌توانند در دنیای واقعی اقداماتی مانند کنترل ترموستات و چراغ‌ها و ارسال ایمیل و پیام را انجام دهند. این جایی نیست که بخواهید هوش مصنوعی با قابلیت توهم‌زایی احتمالی در کنترل داشته باشید و دلیلی‌ است که چرا اپل ادغام ChatGPT با سیری را به‌دقت در محیطی امن (Sandbox) انجام داده است.

آمازون هم روی دستیار صوتی جدید و بهبود‌یافته کار می‌کند. درحالی‌که این شرکت می‌گوید هوش مصنوعی مولد را در اجزای الکسا ادغام کرده است، طبق گزارشی از فورچون، الکسای جدید حتی به مرحله‌ی نهایی نزدیک هم نیست.

پاییز گذشته، آمازون با نمایشی خیره‌کننده از الکسای جدید با قابلیت یادگیری ماشینی زبان بزرگ (Alexa LLM)، الکسای کاملاً جدید و باهوش‌تر و مکالمه‌محورتری را رونمایی کرد. در این نمایش، الکسایی معرفی شد که باید عبارات محاوره‌ای را برای برقراری تعاملات انسانی‌تر درک و زمینه را مؤثرتر تفسیر و چندین درخواست را با یک دستور کامل کند.

بااین‌حال، از آن زمان تاکنون نشانی از این الکسا ندیده‌ایم و فقط اطمینان‌های مبهمی مبنی‌بر حضور آن در پیش‌نمایشی محدود دریافت کرده‌ایم. طبق گزارش فورچون، دلیل این امر احتمالاً تلاش آمازون برای ادغام الکسای قدیمی و قابلیت‌هایش با چشم‌انداز این شرکت برای دستیار صوتی نسل بعدی است.

به‌طور مشابه، اپل نیز رویکردی کُند و محتاطانه اتخاذ کرده است. سیری جدید تا پاییز عرضه نخواهد شد و حتی در آن زمان، به‌صورت آزمایشی ارائه می‌شود. همچنین، در ابتدا جایی در خانه هوشمند نخواهد داشت و روی هیچ‌یک از دستگاه‌های هوشمند خانگی و مبتنی‌بر صدا، مانند بلندگوهای هوشمند هوم‌پاد و اپل تی‌وی پشتیبانی نمی‌شود. ناگفته نماند که قرار نیست به‌زودی برای اپل واچ نیز عرضه شود.

اگرچه به‌احتمال زیاد این دستگاه‌ها قدرت پردازش کافی برای اجرای مدل‌های مولد را ندارند، این موضوع نقصی بزرگ به‌نظر می‌رسد. خانه‌ی هوشمند فضای مهمی برای دستیار صوتی باهوش‌تر است؛ زیرا نه‌تنها می‌تواند به برقراری ارتباط بین فضای شخصی و خانه کمک کند؛ بلکه می‌تواند اداره‌ی خانه‌ی هوشمند را بسیار آسان‌تر نماید.

برخلاف اپل، آمازون اعلام کرده است که الکسای جدید روی تمام بلندگوهای هوشمند اکو، ازجمله اولین اکو که در سال ۲۰۱۴ عرضه شد، کاربردی خواهد بود. این کار با انتقال پردازش به ابر امکان‌پذیر است. بااین‌حال، با‌توجه‌به اینکه هوم‌پاد مینی هم‌اکنون چهار سال قدمت دارد، ممکن است به‌زودی شاهد مدل جدیدی با سخت‌افزار به‌روزرسانی‌شده و طراحی‌شده برای هوش مصنوعی باشیم. اپل نمی‌تواند عرصه‌ی خانه‌ی هوشمند را بیش‌از‌این به الکسا واگذار کند.

به‌نقل از ورج، صحنه برای ظهور دوباره‌ی دستیارهای صوتی چیده شده؛ اما تا پرده‌ی اول نمایش هنوز راه زیادی باقی مانده است. همچنین، این احتمال وجود دارد که اگر این شرکت‌ها نتوانند راهی برای ادغام مؤثر فناوری جدید روی زیرساخت قدیمی پیدا کنند، نمایش با شخصیت‌های کاملاً جدیدی آغاز شود.

احتمالاً گوگل دستیار صوتی کاملاً جدیدی راه‌اندازی خواهد کرد. به‌نظر می‌رسد این مسیر مدنظر گوگل است. دستیار صوتی Google Assistant هنوز تحت بازنگری اساسی هوش مصنوعی قرار نگرفته و طبق گزارش‌ها، این شرکت تمام منابع خود را صرف دستیار جدید مبتنی‌بر هوش مصنوعی به نام جمنای کرده است.

با‌توجه‌به علاقه‌ی گوگل به کنار‌گذاشتن ابزارهای قدیمی، به‌نظر می‌رسد ادغام این دو دستیار حرکت منطقی باشد؛ اما احتمالاً این شرکت دستیار صوتی کاملاً جدیدی را برپایه‌ی هوش مصنوعی مولد از پایه خواهد ساخت. با هر روشی که شرکت‌ها به آن دست پیدا کنند، وعده‌ی این دستیارهای صوتی هوشمند هیجان‌انگیز است؛ به‌ویژه برای شرکتی که بتواند دستیار شخصی را به‌طور مؤثر با خانه ادغام کند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اخبار جدید تک‌ناک را از دست ندهید.