شرکت AMD مدعی است که کارت گرافیک RX 7900 XTX در پردازش مدل هوش مصنوعی DeepSeek R1 عملکرد بهتری نسبت به RTX 4090 انویدیا دارد.
به گزارش تکناک، این ادعا در حالی مطرح شده است که انویدیا اغلب در پردازشهای هوش مصنوعی برتری قابل توجهی دارد، اما به گفته AMD، با ورود DeepSeek AI این معادله تغییر کرده است. شرکت AMD بنچمارکهایی از رقابت بین RX 7900 XTX و دو کارت گرافیک RTX 4090 و RTX 4080 Super را منتشر کرده است.
طبق گزارش دیوید مکآفی، این کارت گرافیکی مبتنی بر معماری RDNA3 توانسته در بنچمارک DeepSeek کارت گرافیک RTX 4090 را تا ۱۳ درصد و RTX 4080 Super را تا ۳۴ درصد شکست دهد.
در این آزمایشها، RX 7900 XTX هنگام اجرای DeepSeek R1 Distill Qwen 7B در برابر RTX 4090 برتری ۱۳ درصدی داشته است. همچنین این کارت در دو پیکربندی دیگر شامل Distill Llama 8B و Distill Qwen 14B به ترتیب ۱۱ و ۲ درصد سریعتر از RTX 4090 عمل کرده است.
با وجود این، در یکی از پیکربندیها که شامل Distill Qwen 32B میشد، کارت گرافیک RTX 4090 توانسته است ۴ درصد سریعتر از RX 7900 XTX عمل کند.
در آزمایشهای مربوط به RTX 4080 Super، کارت گرافیک RX 7900 XTX در تمامی پیکربندیها عملکرد بهتری از خود نشان داده است. این برتری هنگام اجرای DeepSeek R1 Distill Qwen 7B برابر با ۳۴ درصد بوده و در دو پیکربندی دیگر، شامل Distill Llama 8B و Distill Qwen 14B به ترتیب ۲۷ و ۲۲ درصد کاهش یافته است.
هرچند که این نتایج، برتری RX 7900 XTX را نشان میدهند، اما برخی کارشناسان معتقد هستند که باید آنها را با احتیاط بررسی کرد. از آنجا که این آزمایشها توسط AMD انجام شده است، مشخص نیست که کارتهای گرافیک انویدیا تحت چه تنظیماتی قرار داشتهاند.
علاوه بر این، تمام بارهای پردازشی هوش مصنوعی از حداکثر توان محاسباتی GPU استفاده نمیکنند. این موضوع در گذشته در آزمایشهای Stable Diffusion نیز مشاهده شده بود، جایی که از FP8 calculations یا TensorRT برای پردازش استفاده نشد.
هرچند که استفاده از RX 7900 XTX به عنوان یک پردازنده اختصاصی هوش مصنوعی چندان رایج نیست، اما معماری RDNA 3 این کارت گرافیک از عملیات ماتریسی پشتیبانی میکند و قابلیت پردازش BF16 و INT8 را دارد.
همچنین شرکت AMD اصطلاح “AI Accelerator” را به معماری RDNA 3 اضافه کرده است تا توان پردازشی آن را در حوزه هوش مصنوعی نشان دهد. این کارت گرافیک دارای ۱۹۲ شتابدهنده هوش مصنوعی است که میتواند عملکرد بهتری در بارهای کاری AI ارائه دهد.
شرکت AMD به تازگی یک آموزش رسمی منتشر کرده است، که در آن نشان میدهد کاربران چگونه میتوانند DeepSeek R1 را روی سختافزارهای AMD از جمله RX 7900 XTX اجرا کنند.
مدل هوش مصنوعی DeepSeek R1 که به تازگی معرفی شده، عملکردی مشابه مدلهای پیشرفته غربی ارائه میدهد، اما هزینه محاسباتی آن بهمراتب کمتر است.
این مدل از بهینهسازیهای سختافزاری متعددی استفاده میکند، که آن را ۱۱ برابر سریعتر از رقبا میسازد. یکی از این بهینهسازیها، استفاده از زبان سطح پایین PTX متعلق به انویدیا است، که نشان میدهد DeepSeek R1 حتی از تکنولوژیهای انویدیا نیز برای افزایش عملکرد خود بهره میبرد.
ادعای AMD درباره برتری RX 7900 XTX در پردازش هوش مصنوعی DeepSeek میتواند نشاندهنده تغییراتی در رقابت با انویدیا باشد. با وجود این، صحت این ادعاها هنوز نیازمند بررسیهای مستقل است.
در صورتی که معماری RDNA 3 بتواند بهینهسازیهای بیشتری در پردازشهای هوش مصنوعی داشته باشد، میتواند جایگاه AMD را در این حوزه تقویت کند و آن را به رقیبی جدی برای انویدیا در دنیای AI تبدیل نماید.