بهبود عملکرد سمعک با الگوریتم الهام‌گرفته از مغز

پژوهشگران دانشگاه بوستون، الگوریتمی جدید به نام BOSSA طراحی کرده‌اند که با الهام از فرایند پردازش صدا در مغز، می‌تواند عملکرد سمعک را در محیط‌های پر سر و صدا به‌ طور چشمگیری بهبود دهد.

به گزارش تک‌ناک، این الگوریتم با استفاده از تنها دو میکروفون، سرنخ‌های فضایی طبیعی را حفظ و گفت‌وگوی افراد مختلف را از هم تفکیک می‌کند؛ عملکردی که حتی از شنوایی طبیعی و فناوری استاندارد فعلی سمعک‌ها در آزمایش‌های آزمایشگاهی بهتر بوده است.

الگوریتم BOSSA می‌تواند به کاربران کمک کند که در اتاق‌های شلوغ تنها روی یک صدا تمرکز کنند، مسئله‌ای که سمعک‌های معمولی اغلب از عهده آن برنمی‌آیند. این فناوری هنوز در مرحله توسعه قرار دارد، اما ظرفیت قابل توجهی برای تقویت ارتباطات اجتماعی و سلامت شناختی افراد کم‌شنوا از خود نشان داده و در آینده ممکن است به‌ طور پویا و حتی با ردیابی محل نگاه، هدایت شود.

در اتاق‌های شلوغ، چندین گفت‌وگو به دیواری از اصوات درهم‌آمیخته تبدیل می‌شوند. این وضعیت برای افراد کم‌شنوا، که به آن «مشکل مهمانی کوکتل» گفته می‌شود، نه‌تنها آزاردهنده است، بلکه مانعی در مسیر ارتباط اجتماعی می‌باشد و می‌تواند باعث انزوا و افت شناختی شود.

مطابق با مقاله‌ای در Communications Engineering، پژوهشگران دانشگاه بوستون با توسعه الگوریتم BOSSA موفق شده‌اند محدودیت سمعک‌های فعلی را در چنین محیط‌هایی پشت سر بگذارند.

01
از 02
بحران جهانی کم‌شنوایی

براساس گزارش سازمان جهانی بهداشت، امروزه حدود ۵۰ میلیون آمریکایی دچار کم‌شنوایی هستند و پیش‌بینی می‌شود که این رقم تا سال ۲۰۵۰، در سطح جهان به ۲.۵ میلیارد نفر برسد.

ویرجینیا بست، نویسنده اصلی این مطالعه از دانشگاه بوستون اعلام کرد: «شکایت اصلی افراد کم‌شنوا، دشواری در برقراری ارتباط در محیط‌های پر سر و صدا است. این فضاها در زندگی روزمره – به عنوان مثال در گفت‌وگوهای سر میز شام، مهمانی‌ها یا جلسات کاری – بسیار رایج و برای مردم اهمیت زیادی دارند. بنابراین، راهکارهایی که بتوانند ارتباط را در این شرایط بهبود دهند، می‌توانند اثرگذاری وسیعی داشته باشند.»

عملکرد سمعک با الگوریتم الهام‌گرفته از مغز بهبود می یابد

ناتوانی در گوش‌ دادن انتخابی برای این افراد در حدی شدید است که ارتباط و مشارکت در زندگی روزمره را با مانع جدی مواجه می‌کند؛ نتیجه‌ای که نه‌تنها باعث حذف بخش‌هایی از مکالمه می‌شود، بلکه ممکن است به افت شناختی و هزینه‌های اجتماعی و اقتصادی بیانجامد.

02
از 02
چگونگی بهبود عملکرد سمعک با الگوریتم BOSSA

این فناوری بر اساس مدل شبکه‌ای سلسله‌مراتبی از سامانه شنوایی مغز طراحی شده است، که در آن ورودی‌های دوگوشی باعث فعال شدن گروهی از نورون‌ها در موقعیت‌ها و فرکانس‌های خاص می‌شوند و پاسخ‌های عصبی آنها را به امواج صوتی قابل‌شنیدن تبدیل می‌کنند.

به بیان ساده، این فناوری تنها با دو میکروفون مانند عملکرد طبیعی گوش انسان، به تفکیک گفتار بر اساس موقعیت مکانی گویندگان می‌پردازد و به این ترتیب شنونده می‌تواند تنها روی یک صدا تمرکز کند.

پژوهشگران الگوریتم را روی بزرگسالان مبتلا به کم‌شنوایی حسی‌عصبی، رایج‌ترین نوع کم‌شنوایی دائمی، آزمایش کردند. BOSSA در آزمون‌هایی با چند گوینده هم‌زمان، همواره عملکردی بهتر از شنوایی بدون پردازش و فناوری فعلی سمعک‌ها داشت.

فناوری‌های قدیمی سمعک‌ها با کاهش ورودی‌های چندکاناله به خروجی تک‌کاناله، اطلاعات فضایی را فدا می‌کنند، موضوعی که باعث سردرگمی و دشواری در تفکیک صداها می‌شود. اما BOSSA این نشانه‌های فضایی حیاتی را حفظ می‌کند و امکان تجربه شنیداری طبیعی و در عین حال افزایش وضوح گفتار را فراهم می‌سازد.

توانایی درک گفتار کاربران با BOSSA بین ۰.۳ تا ۱۱.۳ دسی‌بل بهبود یافت؛ هرچه این عدد بیشتر باشد، بهبود قابل‌توجه‌تر است. مهم‌تر اینکه، هیچ‌کدام از شرکت‌کنندگان با استفاده از BOSSA عملکردی بدتر از حالت بدون پردازش نداشتند.

در مقابل، فناوری Beamforming فعلی سمعک‌ها با نام MVDR در سناریوهای چندگوینده‌ای مزیتی قابل‌ توجه ارائه نکرد. این روش تنها در شرایطی با نویز پس‌زمینه یکنواخت، عملکرد مناسبی داشت و در برابر گفتارهای هم‌پوشان، ناتوان بود.

با ورود شرکت‌هایی مانند Apple به بازار سمعک، سازندگان سنتی تحت فشار فزاینده‌ای برای نوآوری قرار دارند. BOSSA می‌تواند جهشی نوآورانه برای حفظ رقابت در این حوزه به‌ حساب آید.

پژوهشگران دو نسخه از الگوریتم خود را بررسی کردند —DiffMask و RatioMask— که هر دو در آزمون‌ها، عملکرد بهتری نسبت به شنوایی بدون پردازش و فناوری‌های فعلی نشان دادند. در این آزمایش‌ها، چند زن گوینده از مکان‌های فضایی مختلف، جملاتی را ادا کردند و محیطی پیچیده با گفتارهای قابل‌اشتباه فراهم شد.

در حالی که بسیاری از فناوری‌های دیگر به چندین میکروفون نیاز دارند، BOSSA تنها با دو سیگنال ورودی و دو سیگنال خروجی کار می‌کند و همچنان سرنخ‌های فضایی را حفظ می‌نماید. این الگوریتم برای استفاده در دستگاه‌های کم‌مصرف و قابل‌ پوشیدن نیز مناسب است، جایی که مصرف انرژی و اندازه دستگاه اهمیت بالایی دارد.

با بهبود درک گفتار در محیط‌های شلوغ، این فناوری می‌تواند به حفظ ارتباطات اجتماعی کمک کند و به احتمال زیاد روند افت شناختی ناشی از کم‌شنوایی را کاهش دهد.

هنوز کار برای آماده‌سازی این فناوری برای مصرف‌کنندگان و بهبود عملکرد سمعک ادامه دارد. نسخه‌های آتی BOSSA ممکن است امکان انتخاب گوینده را به‌ طور پویا فراهم کنند، شاید حتی با ردیابی چشمی مشخص کنند که شنونده به چه کسی نگاه می‌کند.

کمال سن، نویسنده همکار این مطالعه گفت: «در بلندمدت امیدوار هستیم که این فناوری را برای گروه‌های دیگری مانند افراد دارای ADHD یا اوتیسم نیز توسعه دهیم، که آنها هم هنگام وقوع چند رویداد هم‌زمان با چالش مواجه‌ هستند.»

الگوریتم‌های الهام‌گرفته از زیست‌شناسی مانند BOSSA می‌توانند کیفیت زندگی میلیون‌ها فردی را بهبود بخشند که در محیط‌های صوتی پیچیده با مشکل شنوایی روبه‌رو هستند. با افزایش سن جمعیت و شیوع کم‌شنوایی، چنین فناوری‌هایی می‌توانند شکاف بین شنیدن و فهمیدن را پر کنند و افراد را در ارتباط با گفت‌وگوها، جامعه و سلامت شناختی نگه دارند.

برچسب‌ها: p6