استارتاپ چینی دیپ سیک (DeepSeek) نسخهای تازه از مدل استدلالی خود را تحت مجوز MIT منتشر کرد؛ مدل جدید با ۶۸۵ میلیارد پارامتر، از مدلهای پرقدرت بازار محسوب میشود.
به گزارش تک ناک؛ شرکت چینی DeepSeek، که با مدلهای پیشرفتهاش توجه جامعه هوش مصنوعی را به خود جلب کرده، صبح چهارشنبه در پیامی در ویچت از بهروزرسانی مدل استدلالی R1 خبر داد و نسخه جدید آن را در پلتفرم Hugging Face برای توسعهدهندگان منتشر کرد.
بر اساس اعلام DeepSeek، این نسخه بهروزرسانی “جزئی” از مدل R1 محسوب میشود و تحت مجوز متنباز MIT عرضه شده که به کاربران اجازه استفاده تجاری از آن را میدهد. هرچند مخزن منتشرشده در Hugging Face شامل توضیحاتی درباره عملکرد مدل نیست، اما فایلهای پیکربندی و وزنهای مدل که عملکرد آن را تعیین میکنند در دسترس قرار گرفتهاند.
مدل جدید با حجمی معادل ۶۸۵ میلیارد پارامتر (یا همان وزن) از سنگینوزنهای دنیای هوش مصنوعی به شمار میرود و بعید است بدون تغییرات، روی سختافزارهای مصرفی معمولی اجرا شود.

DeepSeek اوایل سال جاری با انتشار نسخه اولیه R1 نام خود را در کنار بازیگران بزرگ حوزه هوش مصنوعی مانند OpenAI مطرح کرد. با این حال، برخی نهادهای نظارتی در ایالات متحده این استارتاپ را تهدیدی برای امنیت ملی دانستهاند و نسبت به رشد فناوریهای آن هشدار دادهاند.
دیپ سیک یک مدل چینی است و زیاد خنگ نیست ولی گاهی کارهایی می کند که از خنگ هم خنگ تر است مثلا فاعل و مفعول را اشتباه می گیرد ، مثلا خودش را با با شما اشتباه می گیرد توضیح آن سخت است زیرا هیچ دیوانه ای اینطور اشتباه نمی کند