با بهرهگیری از فناوری ASG در سیری، دستیار صوتی اپل اکنون میتواند شباهتهای آکوستیک صدا را درک کند و با سرعتی باورنکردنی پاسخ دهد.
به گزارش سرویس هوش مصنوعی تکناک، درحالیکه اپل بهمنظور تقویت قابلیتهای هوش مصنوعی خود به مدلهای جمنای گوگل (Google Gemini) متوسل شده است، محققان این غول فناوری بیوقفه در تلاشاند تا راههای بومی برای بهبود چشمگیر سیری (Siri)، دستیار صوتی خود، پیدا کنند. اکنون مقاله تحقیقاتی جدیدی نشان میدهد که این شرکت راهکاری عملی برای ایجاد گفتوگوهای سریعتر و طبیعیتر با سیری کشف کرده است که میتواند تجربه کاربری را ارتقای چشمگیری بخشد.
مدلهای هوش مصنوعی کنونی معمولاً گفتار را براساس توکنها یا قطعات کوتاه از صداهای آوایی تولید میکنند که اغلب تنها چند میلیثانیه طول میکشند. سپس مدل با استفاده از بازگشت خودکار (Autoregression) انتخاب میکند که از کدام صدای آوایی (توکن گفتار) در پاسخهای خود استفاده کند. بااینحال، این رویکرد تأخیری ذاتی در پاسخها ایجاد میکند و بهدلیل تعداد محدود قطعات آوایی استفادهشده برای آموزش آن مدل هوش مصنوعی خاص، گاهی به تلفظهای غیرطبیعی یا عجیبوغریب منجر میشود.
مرتبط: فناوری ASG در سیری؛ هوش مصنوعی اپل چقدر طبیعیتر میشود؟

در مطالعهای جدید، محققان اپل استدلال میکنند که جایگزینی سیستم فعلی تطبیق توکن با سیستمی که از گروههای شباهت آکوستیک (Acoustic Similarity Groups – ASGs) استفاده میکند، میتواند به پاسخهای سریعتر و طبیعیتر از سیری منجر شود.
ASGs توکنهای گفتار را براساس شباهت درکشده آنها به یکدیگر گروهبندی میکنند که البته همپوشانیهای اجتنابناپذیری بین برخی ASGها وجود دارد. سپس با بهکارگیری جستوجوی احتمالی و بازگشت خودکار در ASGها، مدل هوش مصنوعی میتواند با سرعت بسیار بیشتری به توکن گفتار مناسب دست یابد و کارایی تولید گفتار را بهبود بخشد.
مزتبط: فناوری ASG در سیری؛ هوش مصنوعی اپل چقدر طبیعیتر میشود؟
Wccftech مینویسد که اگرچه این مقاله بهمعنای خاصی انقلابی نیست، نشاندهنده تمرکز مستمر اپل بر بهبود قابلیتهای هوش مصنوعی و یادگیری ماشین خود است. این تلاش به نوعی گواهی بر جاهطلبیهای کلی اپل برای اتخاذ راهحل هوش مصنوعی کاملاً سفارشی برای دستگاههای خود و کنارگذاشتن وابستگی به کمکهای شخص ثالث مانند مدلهای جمنای گوگل است.
این حرکت بر اهمیت استقلال فناوری و ارائه تجربهای کاملاً یکپارچه و بومی در اکوسیستم اپل تأکید میکند. این رویکرد میتواند در آینده به دستیار صوتی هوشمندتر و پاسخگوتر منجر شود که تعاملات کاربران با دستگاههایشان را بیشازپیش روان و طبیعی میسازد.
مرتبط: سیری فرمان صوتی را به مرحله تازهای برد؛ رقابت داغ با گوگل

















