در مطالعهای جدید، محققان دانشگاه کالیفرنیا ریورساید روشی ابداع کردند که در آن اجزای مختلف موجود در پردازندهها همزمان کار میکنند تا سرعت پردازش را افزایش و مصرف انرژی را کاهش دهند.
بهگزارش تکناک، بیشتر دستگاههای پیشرفته، از گوشیهای هوشمند و رایانههای شخصی گرفته تا سرورهای مراکز داده، از واحدهای پردازش گرافیکی (GPU) و شتابدهندههای سختافزاری برای هوش مصنوعی و یادگیری ماشین برخوردارند. نمونههای تجاری شناختهشده شامل هستههای تنسور NVIDIA، واحدهای پردازش تنسور (TPU) در سرورهای گوگل کلود، موتورهای عصبی در آیفونهای اپل و Edge TPU در گوشیهای گوگل پیکسل است.
بهنقل از وبسایت NewAtlas، هریک از این اجزا اطلاعات را جداگانه پردازش و اطلاعات را از یک واحد پردازش به واحد دیگر منتقل میکنند که این امر اغلب گلوگاههایی در جریان داده ایجاد میکند. روش جدید پردازندههای موجود در رایانههای شخصی و گوشیهای هوشمند و سایر دستگاهها را با استفاده از چهارچوب نرمافزاری پردازش موازی جدید که برای حذف گلوگاهها و استفاده همزمان از چندین تراشه طراحی شده است، برای دستیابی به قدرت و بازدهی بسیار زیاد تقویت میکند.
هانگ وی تسنگ، دانشیار مهندسی برق و کامپیوتر UCR و یکی از نویسندگان اصلی این مطالعه گفت: «شما به اضافهکردن پردازندههای جدید نیازی ندارید؛ زیرا آنها را از قبل دارید.» چهارچوب محققان با نام چندرشتهای هم زمان و ناهمگن (SHMT)، از مدلهای برنامهنویسی سنتی دور میشود که فقط میتوانند یک ناحیه از کد را بهطور انحصاری به یک نوع پردازنده اختصاص دهند؛ درحالیکه سایر منابع بیکار میمانند و به عملکرد فعلی کمک نمیکنند.
درعوض، SHMT از تنوع یا ناهمگنی اجزای متعدد بهره میبرد و عملکرد محاسباتی را برای تقسیم بین آنها تجزیه میکند. بهعبارتدیگر، این نوعی پردازش موازی است.
فهرست مطالب
نحوه عملکرد
اگر به علوم کامپیوتر علاقهمند هستید، در این بخش نمایی کلی (هنوز بسیار ابتدایی) از نحوه عملکرد SHMT ارائه میدهیم. مجموعهای از عملیات مجازی (VOP) به برنامه CPU اجازه میدهد تا یک تابع را به یک دستگاه سختافزاری مجازی انتقال دهد. در طول اجرای برنامه، سیستم زمان اجرا سختافزار مجازی SHMT را هدایت و توانایی منابع سختافزار را برای تصمیمگیریهای برنامهریزی ارزیابی میکند.
SHMT از سیاست زمانبندی سرقت کار با کیفیت (QAWS) استفاده میکند که منابع را به خود اختصاص نمیدهد؛ اما به حفظ کنترل کیفیت و تعادل بار کاری کمک میکند. سیستم زمان اجرا VOPها را به یک یا چند عملیات سطح بالا (HLOP) تقسیم میکند تا همزمان از چندین منبع سختافزاری استفاده کند. سپس، سیستم زمان اجرا SHMT این HLOPها را به صفهای کار سختافزار هدف اختصاص میدهد. ازآنجاکه HLOPها مستقل از سختافزار هستند، سیستم زمان اجرا میتواند اختصاص وظیفه را حسب نیاز تنظیم کند.
آزمایش و نتایج نمونه اولیه
برای آزمایش این مفهوم، محققان سیستمی با تراشهها و قدرت پردازشی مشابه گوشی هوشمند میانرده ساختند و چند تغییر کوچک برای بررسی قابلیتهای آن در مراکز داده اعمال کردند.
بهطور خاص، آنها پلتفرم سیستم تعبیهشده سفارشی با استفاده از ماژول NVIDIA Jetson Nano حاوی پردازنده چهارهستهای ARM Cortex-A57 (CPU) و 128 هسته GPU معماری Maxwell ساختند. Google Edge TPU ازطریق اسلات M.2 Key E به سیستم متصل شد.
CPU و GPU و TPU دادهها را ازطریق رابط PCIe داخلی تبادل کردند؛ یک رابط استاندارد برای اجزای مادربرد مانند کارت گرافیک و حافظه و دستگاههای ذخیرهسازی. حافظه اصلی سیستم 4 گیگابایت LPDDR4 شصتوچهاربیتی، 1600 مگاهرتز با سرعت 25/6 گیگابایتبر ثانیه دادههای مشترک را میزبانی میکرد. همچنین، Edge TPU حافظه دستگاه 8 مگابایتی است و Ubuntu Linux 18.04 بهعنوان سیستمعامل استفاده شد.
آنها مفهوم SHMT را با استفاده از برنامههای معیار آزمایش کردند و دریافتند که چهارچوب با بهترین عملکرد سیاست QAWS، با افزایش 1/95 برابری سرعت و کاهش درخورتوجه 51 درصدی مصرف انرژی درمقایسهبا روش پایه، عملکرد رضایتبخشی داشته است.
این همه به چه معناست؟
محققان میگویند پیامدهای SHMT بسیار گسترده است. برنامههای نرمافزاری روی گوشیها، تبلتها، رایانههای رومیزی و لپتاپهای موجود میتوانند از این کتابخانه نرمافزاری جدید برای دستیابی به برخی از افزایش عملکردهای عالی استفاده کنند. بااینحال، میتواند نیاز به اجزای گرانقیمت و با کارایی بالا را نیز کاهش دهد که به دستگاههای ارزانتر و کارآمدتر منجر میشود.
ازآنجاکه مصرف انرژی و درنتیجه نیازهای خنکسازی را کاهش میدهد، این رویکرد میتواند دو آیتم کلیدی را درصورت اجرای مرکز داده بهینه کند؛ درحالیکه انتشار کربن و مصرف آب را نیز کاهش میدهد.
همیشه تحقیقات بیشتری درباره پیادهسازی سیستم و پشتیبانی سختافزاری و اینکه چه نوع برنامههایی بیشتر از همه بهرهمند میشوند، موردنیاز استغ اما با این نوع نتایج، تصور میکنیم که تیم مشکلی برای جذب منابع برای ارائه آن نخواهد داشت. این مطالعه در MICRO 2023، پنجاهوششمین سمپوزیوم بینالمللی میکرومعماری IEEE/ACM ارائه شد.