یک توسعهدهنده با دور زدن محدودیتهای اپل، توانایی آموزش مدلهای هوش مصنوعی را به صورت مستقیم روی موتور عصبی تراشه M4 یا همان Neural Engine ممکن کرده است.
به گزارش سرویس سخت افزار تکناک، این یک پیشرفت هیجانانگیز در دنیای Apple Silicon به حساب میآید. در حالت عادی، موتور عصبی در تراشههای M4 عمدتا برای اجرای مدلهای از پیش آموزشدیده یا همان فرایند استنتاج به کار میرود تا این کار با بیشترین بهرهوری انجام شود. با وجود این، یک پژوهشگر امنیتی و توسعهدهنده با نام کاربری @0x0SojalSec در شبکه اجتماعی X اعلام کرده است که موفق به مهندسی معکوس این محدودیتها شده است. در نتیجه این کار، امکان دسترسی به حداکثر ۱۵.۸ ترافلاپس توان پردازشی برای اجرای کامل فرایند آموزش مدلها فراهم شده است؛ قابلیتی که حتی شامل اجرای مرحله پسانتشار یا backpropagation در مدلهای ترنسفورمر نیز میشود.
این توسعهدهنده به جای تکیه بر چارچوبهای معمول اپل مانند Core ML یا Metal، یک زبان میانی اختصاصی برای مدلها با نام Model Intermediate Language یا MIL طراحی کرده است تا بتواند به طور مستقیم با موتور عصبی تراشه M4 ارتباط برقرار کند. در این روش، تمام دادهها در حافظه رم نگهداری میشوند تا از نوشتن دادهها روی حافظه ذخیرهسازی و کند شدن فرایند جلوگیری شود؛ موضوعی که باعث شده است روند آموزش مدلها به شکل قابل توجهی سریع و پایدار انجام شود. همچنین یک راهکار جایگزین با استفاده از دستور exec() کشف شده است که هنگام متوقف شدن فرایند آموزش، امکان راهاندازی دوباره آن را فراهم میکند تا عملیات ذخیره مرحلهای و ادامه آموزش بدون مشکل انجام شود.

این توسعهدهنده، پروژه مربوط به این دستاورد را در گیتهاب منتشر کرده و نشان داده است که آموزش شبکههای عصبی به طور مستقیم روی سختافزار موتور عصبی با وابستگی بسیار کم به ابزارهای اضافی امکانپذیر است. آزمایشهای اولیه نیز نتایج چشمگیری داشتهاند؛ برای مثال برخی مراحل آموزش مدلهای ترنسفورمر روی تراشههای M4 تنها در چند میلیثانیه انجام شدهاند.
شرکت اپل تاکنون به صورت رسمی امکان آموزش مدلها را روی موتور عصبی فعال یا پشتیبانی نکرده است و این بخش از تراشه را با توان حداکثر ۳۸ تریلیون عملیات در ثانیه تنها برای اجرای مدلهای آماده معرفی میکند. هرچند، این تلاش مبتنی بر مهندسی معکوس نشان میدهد که تواناییهای پنهان بسیار بیشتری در این تراشهها وجود دارد که بسیاری از کاربران از آن آگاه نبودهاند.
این موضوع برای جامعه هوش مصنوعی اهمیت زیادی دارد، چرا که میتواند مکها و آیپدهای معمولی را به ماشینهای قدرتمندتری برای آموزش محلی مدلهای کوچک تبدیل کند و نیاز به استفاده از سرویسهای ابری را کاهش دهد. در عین حال، این دستاورد بحثهای جالبی درباره رویکرد کنترلشده اپل در یکپارچهسازی سختافزار و نرمافزار نیز به همراه داشته است.
بر اساس گزارش گیزموچاینا، با ادامه آزمایشها توسط توسعهدهندگان و پژوهشگران، احتمالا کشفیات بیشتری درباره توان واقعی این تراشهها به دست خواهد آمد. در حال حاضر، این دستاورد را میتوان گامی امیدوارکننده در مسیر آزمایشهای قدرتمندتر هوش مصنوعی روی خود دستگاه در اکوسیستم اپل دانست.

















