میلیونها نفر در سراسر جهان به دلیل سکته مغزی، بیماری اسکلروز جانبی آمیوتروفیک (ALS) یا سایر آسیبهای عصبی، توانایی صحبت کردن خود را از دست دادهاند. اما خوشبختانه، یک فناوری نوآورانه در حال شکستن این مانع ارتباطی است.
به گزارش تکناک، محققان به تازگی سیستمی پیشرفته توسعه دادهاند که فعالیتهای مغزی را بهطور مستقیم و در زمان واقعی به گفتار تبدیل میکند و به افراد مبتلا به فلج شدید امکان میدهد دوباره بهطور طبیعی ارتباط برقرار کنند.
فهرست مطالب
عبور از محدودیتهای فناوریهای قبلی
برخلاف فناوریهای پیشین که مکالمات را با توقفهای ناخوشایند همراه میکردند، این نوآوری جدید تقریباً همزمان با قصد فرد برای صحبت کردن عمل میکند. این سیستم با پردازش سیگنالهای مغزی در بازههای ۸۰ میلیثانیهای، گفتاری روان و طبیعی تولید میکند.
گوپالا آنومانچیپالی، استاد مهندسی برق و علوم کامپیوتر در دانشگاه کالیفرنیا برکلی و یکی از محققان اصلی این پروژه، در بیانیهای اعلام کرد: ما توانستهایم قابلیت رمزگشایی سریع گفتار، مشابه دستگاههایی مثل الکسا و سیری را به ابزار خود بیاوریم. همچنین متوجه شدیم که میتوان دادههای عصبی را همزمان رمزگشایی کرد و برای اولین بار توانستیم گفتاری بدون وقفه و با کمترین تأخیر ارائه دهیم. نتیجه این پیشرفت، گفتاری طبیعیتر و روانتر است.
بازگرداندن توانایی ارتباط
این پژوهش بر روی یک زن ۴۷ ساله به نام آن که ۱۸ سال پیش دچار سکته مغزی در ساقه مغز شده بود، متمرکز شد. این اتفاق او را دچار فلج چهاراندام (کوادریپلژی) و آنارتریا (ناتوانی در حرکت عضلات گفتاری) کرد، اما او همچنان توانایی درک و پردازش زبان را داشت. در سالهای گذشته، او از تخته حروف شفاف و دستگاههای ردیابی چشم استفاده میکرد که سرعت ارتباطی بسیار پایین در حد ۲.۶ کلمه در دقیقه داشتند. اما این فناوری جدید به او امکان داد گفتاری نزدیک به مکالمه عادی داشته باشد.

دکتر ادوارد چانگ، جراح مغز و اعصاب و محقق ارشد این پروژه از دانشگاه کالیفرنیا سانفرانسیسکو (UCSF)، درباره این فناوری گفت: این فناوری جدید پتانسیل فوقالعادهای برای بهبود کیفیت زندگی افراد دارای فلج شدید که بر گفتار آنها تأثیر گذاشته، دارد. پیشرفتهای اخیر در هوش مصنوعی باعث شدهاند رابطهای مغز و کامپیوتر (BCI) با سرعت بیشتری به کاربردهای عملی نزدیک شوند.
فناوری پیشرفته برای گفتار همزمان
این فناوری شامل یک آرایه الکترودی با ۲۵۳ کانال است که در سطح مغز بیمار کاشته شده و ناحیه کنترلکننده عضلات گفتاری را پوشش میدهد. هنگامی که فرد تلاش میکند بدون صدا کلمات را ادا کند، این سیستم سیگنالهای عصبی را دریافت کرده و آنها را در لحظه به گفتار و متن تبدیل میکند.
چئول جون چو، یکی از پژوهشگران اصلی مطالعه، توضیح میدهد: ما سیگنالهایی را بررسی میکنیم که در مرحله تبدیل فکر به دستور حرکتی گفتار ایجاد میشوند. سپس، پس از انتخاب کلمات و برنامهریزی برای حرکت عضلات گفتاری، این سیگنالها را رمزگشایی میکنیم.
عبور از مانع تأخیر گفتاری
فناوریهای قبلی قبل از تولید گفتار، تمام دادههای عصبی را جمعآوری میکردند که باعث ایجاد یک تأخیر تقریبا ۸ ثانیه برای هر جمله میشد. اما این سیستم جدید، اطلاعات را در بازههای کوچک پردازش میکند و گفتار را تقریباً همزمان با تولید در مغز فرد بهصورت صوتی پخش میکند.
آنومانچیپالی توضیح میدهد: ما مشاهده کردیم که پس از ارسال سیگنال قصد گفتار، در کمتر از یک ثانیه، اولین صدا تولید میشود. علاوه بر این، دستگاه قادر است گفتار را بهطور مداوم رمزگشایی کند، بنابراین فرد میتواند بدون توقف به صحبت ادامه دهد.
دقت و سرعت بالا در تشخیص گفتار
این سیستم با مجموعهای از ۵۰ عبارت رایج آزمایش شد و توانست سرعت ۹۰.۹ کلمه در دقیقه را ثبت کند. حتی زمانی که دامنه واژگان به ۱۰۲۴ کلمه افزایش یافت، همچنان سرعت ۴۷.۵ کلمه در دقیقه را حفظ کرد.

این سیستم در مجموعه کلمات کوچکتر، با دقت ۸۸ درصد کار کرد. در آزمایشهای سختتر، مانند استفاده از کلمات جدیدی از الفبای آوایی ناتو (مانند Alpha، Bravo، Charlie)، به دقت ۴۶ درصد رسید. این نشان میدهد که سیستم توانایی یادگیری اصول پایه گفتار را دارد.
آینده فناوریهای ارتباطی مبتنی بر مغز
این تحقیق نشان میدهد که این فناوری محدود به یک نوع دستگاه خاص نیست و میتواند در انواع روشهای ثبت سیگنالهای عصبی نیز استفاده شود.
کایلو لیتلجان، یکی از نویسندگان ارشد مطالعه، تأکید میکند: با موفقیت آزمایش این فناوری جدید بر روی مجموعه دادههای دیگر، ما نشان دادیم که این تکنیک میتواند در روشهای مختلف ثبت سیگنال، از جمله الکترودهای سطحی و ضبط تکواحدی، استفاده شود.
آن، شرکتکننده این پژوهش، پس از آزمایش فناوری اعلام کرد که شنیدن صدای خود بهطور همزمان، احساس هویت و کنترل بیشتری به او بخشیده است.
گامهای بعدی: بازآفرینی گفتار طبیعی
محققان در حال تلاش برای افزودن ویژگیهای طبیعیتر به خروجی گفتار هستند، مانند تغییرات لحن و تأکید که در مکالمات روزمره نقش دارند. لیتلجان میگوید: افزودن ویژگیهای طبیعیتر به خروجی گفتار یکی از چالشهای قدیمی در حوزه پردازش صوت است و حل آن میتواند ما را به سمت تولید گفتاری کاملاً طبیعی سوق دهد.

امیدی برای آینده ارتباطات افراد دارای معلولیت گفتاری
این فناوری گامی بزرگ در بازگرداندن توانایی ارتباطی به افراد دارای فلج شدید است. درحالیکه رابطهای گفتاری قبلی با چالشهایی مانند سرعت پایین، محدودیت دامنه واژگان و نبود جریان طبیعی مکالمه مواجه بودند، فناوری جدید این مشکلات را برطرف کرده است.
اگرچه این فناوری هنوز به مرحله استفاده گسترده بالینی نرسیده، اما پژوهشگران با هدف بهبود دقت، کاهش تأخیر، و توسعه نسخههایی که در خارج از محیط آزمایشگاهی نیز قابلاستفاده باشند، کار خود را ادامه خواهند داد. در صورت موفقیت، این فناوری امیدی برای میلیونها نفر خواهد بود تا هیچکس به دلیل فلج، برای همیشه سکوت نکند.