شرکت DeepSeek با معرفی مدل جدید DeepSeekMath-V2 گام مهمی در توسعه ابزارهای مبتنی بر هوش مصنوعی برای استدلال ریاضی برداشته است.
به گزارش سرویس هوش مصنوعی تکناک، این شرکت اوایل سال 2025 با عرضه یکی از نخستین مدلهای تفکری رایگان توجه گستردهای را به خود جلب کرده بود، اکنون مدل جدید DeepSeekMath-V2 با هدف ایجاد توانایی استدلال خودتأییدشونده، تولید گامبهگام اثباتهای دقیق و حرکت بهسوی درک ساختاری ریاضیات طراحی شده است. به گفته شرکت، تمرکز اصلی این نسخه بر فرایند اثبات قضیهها است و قرار نیست صرفاً به ارائه پاسخ نهایی عددی متکی باشد.
شرکت DeepSeek اعلام کرده است که DeepSeekMath-V2 بر پایه چرخه generation-verification کار میکند. در این روش، یک verifier مبتنی بر LLM برای بررسی صحت و انسجام اثباتها آموزش داده شده و در کنار آن یک proof generator نیز توسعه یافته است، که از همین verifier به عنوان مدل پاداش استفاده میکند. این معماری باعث میشود که مدل بتواند ایرادهای موجود در استدلالهای خود را از طریق بازبینی داخلی شناسایی و اصلاح کند. علاوه بر این، DeepSeek از سازوکار verification scaling برای برچسبگذاری خودکار اثباتهای پیچیده استفاده کرده است تا دادههای آموزشی تازه برای تقویت مداوم verifier ایجاد شود.
به گزارش نئووین، این مدل در آزمونهای رقابتی مهم سالهای اخیر عملکرد قابل توجهی داشته است. مدل جدید DeepSeekMath-V2 موفق شده است مدال طلای IMO 2025 و CMO 2024 را کسب کند و با استفاده از توان پردازشی تقویتشده در مرحله اجرا، به امتیاز تقریباً کامل 118 از 120 در رقابت Putnam 2024 برسد. شرکت DeepSeek اعلام کرده است که نسخه جدید بر پایه DeepSeek-V3.2-Exp-Base ساخته شده و اکنون از طریق HuggingFace قابل دسترسی است. علاقهمندان میتوانند برای اجرای بهتر، از مخزن DeepSeek-V3.2-Exp در GitHub استفاده کنند.
بخوانید: رونمایی بایدو از مدل Ernie X1.1؛ رقیب جدی DeepSeek R1 و همتراز با GPT-5

متخصصان معتقد هستند که عرضه چنین مدلی میتواند مسیر فهم عمیقتر مفاهیم ریاضی را هموار کند و به توسعه علوم پایه، فناوریهای نوین و حتی تحقیقات حوزه سلامت، سرعت ببخشد. با وجود این، DeepSeek هشدار داده است که نباید انتظار داشت این مدل بتواند بهسرعت مسائل بسیار پیچیده مانند چالشهای هزاره را حل کند، اما توسعه ابزارهایی که توانایی تحلیل و اثبات منطقی دارند، پژوهشگران را به پاسخ این مسائل نزدیکتر میکنند. جزئیات کامل مدل، مقاله پژوهشی PDF و فایلهای اجرایی آن در پلتفرم GitHub و HuggingFace منتشر شده است.

















