محققان رایانهای چین با استفاده از پردازندههای گرافیکی ساخت داخل، توانستهاند عملکردی نزدیک به ده برابر سریعتر از ابررایانههای آمریکایی مجهز به پردازندههای انویدیا ارائه دهند.
به گزارش تکناک،این دستاورد، که در یک مطالعه معتبر بررسی شده است، چالش جدیدی برای تسلط دیرینه تراشههای آمریکایی در تحقیقات علمی پیشرفته ایجاد کرده و در عین حال، پیامدهای ناخواسته تحریمهای فناوری ایالات متحده را برجسته میکند.
فهرست مطالب
عبور از محدودیتهای سختافزاری با نوآوری نرمافزاری
به گزارش South China Morning Post، محققان چینی موفقیت خود را مرهون تکنیکهای بهینهسازی نوآورانه نرمافزاری میدانند که باعث افزایش بهرهوری پردازندههای گرافیکی داخلی شده است. این بهینهسازیهای نرمافزاری به آنها اجازه داده تا در محاسبات علمی خاص، از ابررایانههای سنتی آمریکایی پیشی بگیرند.
با این حال، برخی کارشناسان هشدار دادهاند که نرمافزار به تنهایی نمیتواند شکاف سختافزاری بین تراشههای چینی و تراشههای پیشرفته آمریکایی را برای همیشه پر کند. این مسئله بخشی از راهبرد کلان پکن برای کاهش وابستگی به فناوریهای تراشه غربی و مقابله با محدودیتهای اعمالشده از سوی ایالات متحده محسوب میشود.
اهمیت این پیشرفت در حوزههایی که به منابع محاسباتی گسترده نیاز دارند، بیش از پیش مشهود است. دانشمندان برای برنامهریزی دفاع در برابر سیل، تحلیل آبگرفتگی شهری و مدلسازی تغییرات اقلیمی به شبیهسازیهای بزرگ و دقیق وابسته هستند. این شبیهسازیها معمولاً به توان پردازشی بسیار بالا و زمان طولانی پردازش نیاز دارند که کاربرد گسترده آنها را محدود میکند.
با توجه به اینکه تولید پردازندههای گرافیکی پیشرفته مانند A100 و H100 شرکت انویدیا عمدتاً در اختیار تولیدکنندگان خارجی است و با محدودیتهای صادراتی ایالات متحده مواجه شده است، محققان چینی مجبور به پیدا کردن راهکارهای جایگزین شدهاند.
پیشرفت جدید با مدل محاسباتی «چندگرهای، چند GPU»
در جستجوی یک راهحل، پروفسور نان تونگچائو از آزمایشگاه کلیدی هیدرولوژی و مهندسی منابع آب دانشگاه Hohai در نانجینگ، تحقیقات جدیدی در زمینه محاسبات موازی چندگرهای، چند GPU انجام داده است. تیم او با استفاده از پردازندهها و پردازندههای گرافیکی داخلی، مدلی کارآمدتر برای ابررایانهها توسعه داده است.
یافتههای این تحقیق نشان میدهد که انتقال کارآمد دادهها و هماهنگی وظایف بین گرهها، عامل کلیدی در به حداقل رساندن افت عملکرد در محاسبات موازی است.
در سال ۲۰۲۱، محققان آزمایشگاه ملی اوک ریج در آمریکا مدل پیشبینی سیل TRITON را با استفاده از ابررایانه Summit توسعه دادند. با وجود استفاده از ۶۴ گره پردازشی، مدل TRITON تنها توانست افزایش سرعت پردازشی شش برابری را به ثبت برساند.

اما مدل جدید نان تونگچائو با ترکیب چندین GPU درون یک گره پردازشی، توانست محدودیتهای سختافزار داخلی را جبران کند. این مدل با بهینهسازی تبادل دادهها میان گرهها در سطح نرمافزار، توانست هزینههای ارتباطی را به شدت کاهش دهد.
این روش بر روی یک پلتفرم محاسباتی داخلی مبتنی بر x86 اجرا شد که شامل پردازندههای Hygon 7185 (با ۳۲ هسته، ۶۴ رشته و فرکانس ۲.۵ گیگاهرتز) و پردازندههای گرافیکی داخلی با ۱۲۸ گیگابایت حافظه و پهنای باند شبکه ۲۰۰ گیگابیت بر ثانیه بود. نتیجه این شد که مدل جدید با استفاده از تنها هفت گره، افزایش سرعت شش برابری را به دست آورد که ۸۹ درصد کاهش در تعداد گرهها نسبت به مدل TRITON را نشان میدهد.
آزمایش موفقیتآمیز در شبیهسازی سیل
تیم نان برای بررسی عملکرد این مدل، فرآیند تکامل سیل را در سد Zhuangli در استان شاندونگ شبیهسازی کرد. با استفاده از ۲۰۰ گره پردازشی و ۸۰۰ پردازنده گرافیکی، شبیهسازی تنها در سه دقیقه انجام شد که نشاندهنده افزایش سرعت بیش از ۱۶۰ برابر است.
پروفسور نان در این باره گفت:
«شبیهسازی سیل در مقیاس یک حوزه رودخانهای تنها در چند دقیقه، به معنای امکان اجرای سریع و دقیق سناریوهای مختلف بارش و رواناب در زمان واقعی است. این موضوع میتواند اقدامات کنترل سیل و پیشگیری از بلایای طبیعی را بهبود بخشد، مدیریت سدها را بهینه کند و در نهایت به کاهش تلفات جانی و مالی منجر شود.»
کد تحقیق بهصورت متنباز منتشر شده است و محققان اعلام کردهاند که یافتههای این مطالعه میتوانند در شبیهسازیهای دیگر از جمله هواشناسی آبی، رسوبگذاری و تعاملات آبهای سطحی و زیرزمینی نیز به کار گرفته شوند.
نان در ادامه افزود:
«در آینده، این روش برای کاربردهای بیشتر توسعه داده خواهد شد و پایداری آن در پروژههای مهندسی مورد آزمایش قرار خواهد گرفت.»
چین در حال کاهش وابستگی خود به فناوریهای غربی در حوزه پردازشهای فوقپیشرفته است. در عین حال، این پیشرفت میتواند تحریمهای فناوری ایالات متحده را با چالشهای جدیدی روبهرو کند.