پژوهشگران دانشگاه بوستون، الگوریتمی جدید به نام BOSSA طراحی کردهاند که با الهام از فرایند پردازش صدا در مغز، میتواند عملکرد سمعک را در محیطهای پر سر و صدا به طور چشمگیری بهبود دهد.
به گزارش تکناک، این الگوریتم با استفاده از تنها دو میکروفون، سرنخهای فضایی طبیعی را حفظ و گفتوگوی افراد مختلف را از هم تفکیک میکند؛ عملکردی که حتی از شنوایی طبیعی و فناوری استاندارد فعلی سمعکها در آزمایشهای آزمایشگاهی بهتر بوده است.
الگوریتم BOSSA میتواند به کاربران کمک کند که در اتاقهای شلوغ تنها روی یک صدا تمرکز کنند، مسئلهای که سمعکهای معمولی اغلب از عهده آن برنمیآیند. این فناوری هنوز در مرحله توسعه قرار دارد، اما ظرفیت قابل توجهی برای تقویت ارتباطات اجتماعی و سلامت شناختی افراد کمشنوا از خود نشان داده و در آینده ممکن است به طور پویا و حتی با ردیابی محل نگاه، هدایت شود.
در اتاقهای شلوغ، چندین گفتوگو به دیواری از اصوات درهمآمیخته تبدیل میشوند. این وضعیت برای افراد کمشنوا، که به آن «مشکل مهمانی کوکتل» گفته میشود، نهتنها آزاردهنده است، بلکه مانعی در مسیر ارتباط اجتماعی میباشد و میتواند باعث انزوا و افت شناختی شود.
مطابق با مقالهای در Communications Engineering، پژوهشگران دانشگاه بوستون با توسعه الگوریتم BOSSA موفق شدهاند محدودیت سمعکهای فعلی را در چنین محیطهایی پشت سر بگذارند.
فهرست مطالب
بحران جهانی کمشنوایی
براساس گزارش سازمان جهانی بهداشت، امروزه حدود ۵۰ میلیون آمریکایی دچار کمشنوایی هستند و پیشبینی میشود که این رقم تا سال ۲۰۵۰، در سطح جهان به ۲.۵ میلیارد نفر برسد.
ویرجینیا بست، نویسنده اصلی این مطالعه از دانشگاه بوستون اعلام کرد: «شکایت اصلی افراد کمشنوا، دشواری در برقراری ارتباط در محیطهای پر سر و صدا است. این فضاها در زندگی روزمره – به عنوان مثال در گفتوگوهای سر میز شام، مهمانیها یا جلسات کاری – بسیار رایج و برای مردم اهمیت زیادی دارند. بنابراین، راهکارهایی که بتوانند ارتباط را در این شرایط بهبود دهند، میتوانند اثرگذاری وسیعی داشته باشند.»

ناتوانی در گوش دادن انتخابی برای این افراد در حدی شدید است که ارتباط و مشارکت در زندگی روزمره را با مانع جدی مواجه میکند؛ نتیجهای که نهتنها باعث حذف بخشهایی از مکالمه میشود، بلکه ممکن است به افت شناختی و هزینههای اجتماعی و اقتصادی بیانجامد.
چگونگی بهبود عملکرد سمعک با الگوریتم BOSSA
این فناوری بر اساس مدل شبکهای سلسلهمراتبی از سامانه شنوایی مغز طراحی شده است، که در آن ورودیهای دوگوشی باعث فعال شدن گروهی از نورونها در موقعیتها و فرکانسهای خاص میشوند و پاسخهای عصبی آنها را به امواج صوتی قابلشنیدن تبدیل میکنند.
به بیان ساده، این فناوری تنها با دو میکروفون مانند عملکرد طبیعی گوش انسان، به تفکیک گفتار بر اساس موقعیت مکانی گویندگان میپردازد و به این ترتیب شنونده میتواند تنها روی یک صدا تمرکز کند.
پژوهشگران الگوریتم را روی بزرگسالان مبتلا به کمشنوایی حسیعصبی، رایجترین نوع کمشنوایی دائمی، آزمایش کردند. BOSSA در آزمونهایی با چند گوینده همزمان، همواره عملکردی بهتر از شنوایی بدون پردازش و فناوری فعلی سمعکها داشت.
فناوریهای قدیمی سمعکها با کاهش ورودیهای چندکاناله به خروجی تککاناله، اطلاعات فضایی را فدا میکنند، موضوعی که باعث سردرگمی و دشواری در تفکیک صداها میشود. اما BOSSA این نشانههای فضایی حیاتی را حفظ میکند و امکان تجربه شنیداری طبیعی و در عین حال افزایش وضوح گفتار را فراهم میسازد.
توانایی درک گفتار کاربران با BOSSA بین ۰.۳ تا ۱۱.۳ دسیبل بهبود یافت؛ هرچه این عدد بیشتر باشد، بهبود قابلتوجهتر است. مهمتر اینکه، هیچکدام از شرکتکنندگان با استفاده از BOSSA عملکردی بدتر از حالت بدون پردازش نداشتند.
در مقابل، فناوری Beamforming فعلی سمعکها با نام MVDR در سناریوهای چندگویندهای مزیتی قابل توجه ارائه نکرد. این روش تنها در شرایطی با نویز پسزمینه یکنواخت، عملکرد مناسبی داشت و در برابر گفتارهای همپوشان، ناتوان بود.
با ورود شرکتهایی مانند Apple به بازار سمعک، سازندگان سنتی تحت فشار فزایندهای برای نوآوری قرار دارند. BOSSA میتواند جهشی نوآورانه برای حفظ رقابت در این حوزه به حساب آید.
پژوهشگران دو نسخه از الگوریتم خود را بررسی کردند —DiffMask و RatioMask— که هر دو در آزمونها، عملکرد بهتری نسبت به شنوایی بدون پردازش و فناوریهای فعلی نشان دادند. در این آزمایشها، چند زن گوینده از مکانهای فضایی مختلف، جملاتی را ادا کردند و محیطی پیچیده با گفتارهای قابلاشتباه فراهم شد.
در حالی که بسیاری از فناوریهای دیگر به چندین میکروفون نیاز دارند، BOSSA تنها با دو سیگنال ورودی و دو سیگنال خروجی کار میکند و همچنان سرنخهای فضایی را حفظ مینماید. این الگوریتم برای استفاده در دستگاههای کممصرف و قابل پوشیدن نیز مناسب است، جایی که مصرف انرژی و اندازه دستگاه اهمیت بالایی دارد.
با بهبود درک گفتار در محیطهای شلوغ، این فناوری میتواند به حفظ ارتباطات اجتماعی کمک کند و به احتمال زیاد روند افت شناختی ناشی از کمشنوایی را کاهش دهد.
هنوز کار برای آمادهسازی این فناوری برای مصرفکنندگان و بهبود عملکرد سمعک ادامه دارد. نسخههای آتی BOSSA ممکن است امکان انتخاب گوینده را به طور پویا فراهم کنند، شاید حتی با ردیابی چشمی مشخص کنند که شنونده به چه کسی نگاه میکند.
کمال سن، نویسنده همکار این مطالعه گفت: «در بلندمدت امیدوار هستیم که این فناوری را برای گروههای دیگری مانند افراد دارای ADHD یا اوتیسم نیز توسعه دهیم، که آنها هم هنگام وقوع چند رویداد همزمان با چالش مواجه هستند.»
الگوریتمهای الهامگرفته از زیستشناسی مانند BOSSA میتوانند کیفیت زندگی میلیونها فردی را بهبود بخشند که در محیطهای صوتی پیچیده با مشکل شنوایی روبهرو هستند. با افزایش سن جمعیت و شیوع کمشنوایی، چنین فناوریهایی میتوانند شکاف بین شنیدن و فهمیدن را پر کنند و افراد را در ارتباط با گفتوگوها، جامعه و سلامت شناختی نگه دارند.