شرکت D-Matrix از فناوری جدید حافظه پشتهای سهبعدی خود با نام 3D-IMC برای پردازشهای استنتاج هوش مصنوعی رونمایی کرد که ادعا میشود ۱۰ برابر سریعتر و بهینهتر از حافظههای HBM فعلی است.
به گزارش تکناک، HBM طی سالهای اخیر به رکن اصلی در حوزه هوش مصنوعی و ابرمحاسبات تبدیل شده است. این فناوری با چیدمان لایههای حافظه روی هم، پهنای باند بالاتری نسبت به حافظههای سنتی ارائه میدهد. با این حال، اگرچه HBM در آموزش مدلهای هوش مصنوعی بسیار حیاتی است، در بخش استنتاج (Inference) محدودیتهایی از جمله مصرف انرژی بالا، هزینه زیاد و پهنای باند محدود دارد.
تامزهاردور مینویسد که d-Matrix با معرفی تراشه آزمایشی Pavehawk 3DIMC تلاش دارد این محدودیتها را پشت سر بگذارد. طراحی این تراشه شامل قالبهای حافظه مشابه LPDDR5 است که همراه با چیپلِتهای محاسباتی DIMC روی یک اینترپوزر قرار گرفتهاند. این معماری امکان انجام محاسبات درون حافظه را فراهم میکند و بهویژه برای عملیات ضرب ماتریس–بردار که در مدلهای ترنسفورمری رایج است، بهینهسازی شده است.

سید شث، بنیانگذار و مدیرعامل d-Matrix، در پستی در لینکدین اعلام کرد: «آینده استنتاج هوش مصنوعی تنها به پردازنده محدود نمیشود، بلکه باید حافظه را نیز از نو تعریف کنیم. امروز گلوگاه اصلی استنتاج در حافظه است، نه در FLOPs. مدلها با سرعت رشد میکنند و سیستمهای HBM پرهزینه، پرمصرف و از نظر پهنای باند محدود هستند. 3DIMC قواعد بازی را تغییر میدهد.»
این شرکت همزمان از نسل بعدی تراشه خود با نام Raptor نیز خبر داده است. d-Matrix مدعی است که Raptor قادر خواهد بود در وظایف استنتاجی تا ۱۰ برابر سریعتر از HBM عمل کرده و در عین حال ۹۰ درصد مصرف انرژی کمتری داشته باشد.
ابعاد اقتصادی این فناوری نیز قابل توجه است. تولید HBM تنها در انحصار چند شرکت بزرگ مانند SK hynix، سامسونگ و میکرون قرار دارد و قیمت آن بهدلیل تقاضای فزاینده، بسیار بالا است.
برآوردها نشان میدهد بازار HBM تا سال ۲۰۳۰ هر سال بیش از ۳۰ درصد رشد خواهد کرد. در چنین شرایطی، معرفی جایگزینی کارآمدتر و ارزانتر میتواند توجه خریداران بزرگ حوزه هوش مصنوعی را جلب کند، هرچند برخی کارشناسان معتقدند ساخت حافظهای کاملاً اختصاصی برای استنتاج ممکن است محدودیتهایی در پذیرش بازار ایجاد کند.