دیپ‌سیک R2 در راه است؛ خیز چینی‌ها برای خودکفایی درزمینه هوش مصنوعی

شرکت چینی دیپ‌سیک قصد دارد مدل زبانی بزرگ DeepSeek-R2 را با معماری پیشرفته Mixture of Experts (MoE) و با ۱/۲ تریلیون پارامتر به‌زودی معرفی کند.

به گزارش تک‌ناک، شرکت دیپ‌سیک اعلام کرد که مدل زبانی نسل بعدی خود با نام DeepSeek-R2 را بین ۱۵ تا ۳۰ آگوست ۲۰۲۵ روانه بازار خواهد کرد. به گفته منابع آگاه، DeepSeek-R2 از معماری پیشرفته‌تر Mixture of Experts (MoE) و شبکه گیتینگ هوشمندتر بهره می‌برد که امکان پردازش کارآمدتر بارهای کاری سنگین در مرحله استنتاج را فراهم می‌کند. این مدل با ظرفیت ۱/۲ تریلیون پارامتر، تقریباً دو برابر نسخه قبلی DeepSeek-R1 با ۶۷۱ میلیارد پارامتر است؛ هرچند همچنان از ChatGPT-4/5 با بیش از ۱/۸ تریلیون پارامتر کوچک‌تر محسوب می‌شود.

گیزموچاینا می‌نویسد که هم‌سو با سیاست‌های چین برای خودکفایی در حوزه هوش مصنوعی، DeepSeek-R2 به‌طور کامل بر روی تراشه‌های Ascend 910B هواوی آموزش دیده است. خوشه پردازشی هواوی با توان محاسباتی ۵۱۲ پتافلاپس FP16 و بهره‌وری ۸۲ درصدی، عملکردی معادل ۹۱ درصد خوشه A100 انویدیا دارد. این اقدام علاوه‌بر کاهش ۹۷ درصدی هزینه آموزش در مقایسه با GPT-4، زمینه عرضه API مدل مذکور را با قیمت کمتر فراهم می‌کند. این موضوع می‌تواند معادلات قیمت‌گذاری بازار را تغییر دهد که درحال‌حاضر زیر سلطه OpenAI و آنتروپیک است.

انتشار این خبر باعث جهش ۲۰ درصدی ارزش سهام شرکت چینی Cambricon، تولیدکننده تراشه‌های هوش مصنوعی و عبور ارزش بازار آن از ۳۵۵ میلیارد یوان (معادل حدود ۴۹/۷ میلیارد دلار) شد.

هم‌زمان هواوی از فریم‌ورک جدید استنتاج هوش مصنوعی خود با نام Unified Cache Manager (UCM) پرده‌برداری کرده است که با بهینه‌سازی مدیریت داده‌های KV Cache میان سطوح حافظه‌ای HBM و DRAM و SSD، با همکاری China UnionPay کاهش ۹۰ درصدی تأخیر و افزایش ۲۲ برابری توان عملیاتی را به ثبت رسانده است. این فریم‌ورک قرار است در ماه سپتامبر متن‌باز شود.

ترکیب انتشار DeepSeek-R2 و معرفی فریم‌ورک UCM نشان می‌دهد که چین در مسیر ساخت و اجرای سیستم‌های هوش مصنوعی پیشرفته بدون وابستگی به تراشه‌ها و ابزارهای نرم‌افزاری غربی، گام‌های استراتژیک و محکمی برمی‌دارد.