شرکت چینی دیپسیک قصد دارد مدل زبانی بزرگ DeepSeek-R2 را با معماری پیشرفته Mixture of Experts (MoE) و با ۱/۲ تریلیون پارامتر بهزودی معرفی کند.
به گزارش تکناک، شرکت دیپسیک اعلام کرد که مدل زبانی نسل بعدی خود با نام DeepSeek-R2 را بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ روانه بازار خواهد کرد. به گفته منابع آگاه، DeepSeek-R2 از معماری پیشرفتهتر Mixture of Experts (MoE) و شبکه گیتینگ هوشمندتر بهره میبرد که امکان پردازش کارآمدتر بارهای کاری سنگین در مرحله استنتاج را فراهم میکند. این مدل با ظرفیت ۱/۲ تریلیون پارامتر، تقریباً دو برابر نسخه قبلی DeepSeek-R1 با ۶۷۱ میلیارد پارامتر است؛ هرچند همچنان از ChatGPT-4/5 با بیش از ۱/۸ تریلیون پارامتر کوچکتر محسوب میشود.
گیزموچاینا مینویسد که همسو با سیاستهای چین برای خودکفایی در حوزه هوش مصنوعی، DeepSeek-R2 بهطور کامل بر روی تراشههای Ascend 910B هواوی آموزش دیده است. خوشه پردازشی هواوی با توان محاسباتی ۵۱۲ پتافلاپس FP16 و بهرهوری ۸۲ درصدی، عملکردی معادل ۹۱ درصد خوشه A100 انویدیا دارد. این اقدام علاوهبر کاهش ۹۷ درصدی هزینه آموزش در مقایسه با GPT-4، زمینه عرضه API مدل مذکور را با قیمت کمتر فراهم میکند. این موضوع میتواند معادلات قیمتگذاری بازار را تغییر دهد که درحالحاضر زیر سلطه OpenAI و آنتروپیک است.

انتشار این خبر باعث جهش ۲۰ درصدی ارزش سهام شرکت چینی Cambricon، تولیدکننده تراشههای هوش مصنوعی و عبور ارزش بازار آن از ۳۵۵ میلیارد یوان (معادل حدود ۴۹/۷ میلیارد دلار) شد.
همزمان هواوی از فریمورک جدید استنتاج هوش مصنوعی خود با نام Unified Cache Manager (UCM) پردهبرداری کرده است که با بهینهسازی مدیریت دادههای KV Cache میان سطوح حافظهای HBM و DRAM و SSD، با همکاری China UnionPay کاهش ۹۰ درصدی تأخیر و افزایش ۲۲ برابری توان عملیاتی را به ثبت رسانده است. این فریمورک قرار است در ماه سپتامبر متنباز شود.
ترکیب انتشار DeepSeek-R2 و معرفی فریمورک UCM نشان میدهد که چین در مسیر ساخت و اجرای سیستمهای هوش مصنوعی پیشرفته بدون وابستگی به تراشهها و ابزارهای نرمافزاری غربی، گامهای استراتژیک و محکمی برمیدارد.