کارشناسان میگویند بزرگترین مجموعه داده نوروزبانی Conduit میتواند کیفیت رمزگشایی فعالیتهای عصبی را در شرایط واقعی افزایش چشمگیری دهد.
به گزارش سرویس هوش مصنوعی تکناک، استارتآپ سانفرانسیسکویی Conduit از اجرای یکی از پروژههای بلندپروازانه داده خود در حوزه هوش مصنوعی خبر داده است. این شرکت با جمعآوری تقریباً ۱۰ هزار ساعت داده عصبی غیرتهاجمی از هزاران فرد منحصربهفرد در استودیویی زیرزمین، بزرگترین مجموعه داده نوروزبانی (Neurolinguistic) شناختهشده تابهامروز را ایجاد کرده است.
هدف اصلی این پروژه آموزش مدلهای هوش مصنوعی پیشرفتهای است که میتوانند محتوای معنایی را از فعالیت مغزی افراد ثانیههای قبلاز صحبت یا تایپکردن آنها رمزگشایی و آن را به متن تبدیل کنند. شرکتکنندگان در پروژه یادشده در جلسات دوساعته در غرفههای کوچک ازطریق گفتار یا تایپ روی کیبوردهای سادهشده با مدل زبان بزرگ (LLM) آزادانه گفتوگو میکنند.
Conduit ابتدا بر وظایف سخت و سنگین متمرکز بود؛ اما پساز مشاهده تأثیر مثبت مشارکت فعال بر کیفیت دادهها، رویکرد خود را به گفتوگوی رفتوبرگشتی شخصیسازیشده تغییر داد. این روش حداکثرسازی میزان زبان طبیعی تولیدشده در طول هر ضبط را هدف قرار میدهد؛ درحالیکه همترازی زمانی دقیق بین متن و صدا و سیگنالهای عصبی حفظ میشود.
ازآنجاکه هدست چندوجهی تجاری نمیتوانست الزامات Conduit را برآورده کند، تیم مهندسی شرکت مجبور شد سختافزار خود را توسعه دهد. آنها حسگرهای EEG و fNIRS و سایر حسگرهای برتر را در پوستههای سهبعدی سفارشیسازیشده ترکیب کردند.
دو طرح مجزا برای هدستها ایجاد شد: ۱. هدستهای آموزشی و وسایلی متراکم و سنگین (چهارپوندی) با هدف حداکثرسازی پوشش سیگنال؛ ۲. هدستهای استنتاجی که پساز بلوغ مدلها و با انجام مطالعات حذف (Ablation) شکل خواهند گرفت. تمام دادهها اکنون ازطریق فرمت Zarr 3 جریان مییابند که ورودی چندین نوع حسگر را در چهارچوبی واحد یکپارچه میکند.

در ابتدا، Conduit تداخل الکتریکی را بهعنوان تهدید اصلی کیفیت دادهها شناسایی کرد. تیم توسعهدهنده با استفاده از عایقبندی تجهیزات در لاستیک و آزمایش تهویهکنندههای برق، تلاش کرد این مشکل را حل کند. در نهایت، با قطع کامل برق اصلی و تکیه بر بستههای باتری، توانست پیک ۶۰ هرتزی رایج در ضبطهای EEG را حذف کند.
هرچند این رویکرد مشکلات خاص خود ازجمله فریمهای ازدسترفته و نیاز به تعویض ثابت باتریهای سنگین را ایجاد کرد، Conduit بعداً با افزایش مقیاس عملیات به برق عادی بازگشت. زمانی که مجموعه داده از مرز ۴,۰۰۰ تا ۵,۰۰۰ ساعت عبور کرد، مدل قابلیت تعمیمپذیری بین افراد و غرفهها و تنظیمات را آغاز کرد و ارزش کاهش نویز تهاجمی کاهش یافت.
تامزهاردور مینویسد که با افزایش مقیاس فرایند، هزینههای عملیاتی کاهش درخورتوجهی یافت. Conduit موفق شد هزینه نهایی بهازای هر ساعت داده کاربردی را بین ماههای می و اکتبر، حدود ۴۰ درصد کاهش دهد. این کاهش هزینه با بازطراحی بکاند برای شناسایی جلسات خراب در زمان واقعی و اجازهدادن به مدیران جلسه برای نظارت همزمان بر چندین غرفه از طریق دوربینها محقق شد.
همچنین، سیستم رزرو سفارشی و قیمتگذاری پویا و رزرو بیشازحد را برای پر نگهداشتن هدستها در طول یک برنامه روزانه ۲۰ ساعته معرفی کرد. Conduit اعلام کرده است که اکنون تقریباً بهطور کامل بر آموزش مدل خود متمرکز است و برنامههایی برای ارائه جزئیات سیستم رمزگشایی خود در انتشار بعدی دارد. این پیشرفتها میتوانند گام بزرگی در تحقق رابطهای مغزکامپیوتر (BCI) و ارتباط مستقیم فکر به متن بردارند.















