شرکت چینی DeepSeek با انتشار مدل زبانی هوش مصنوعی استدلالی خود به صورت متنباز، موجی از بحث و تبادل نظر در سیلیکون ولی آمریکا به وجود آورده است.
به گزارش تکناک، این مدل که قابلیتهایی نزدیک یا حتی برتر از مدل o1 شرکت OpenAI ارائه میدهد، نشاندهنده پیشرفت چشمگیر DeepSeek در حوزه هوش مصنوعی است.
مارک اندریسن، سرمایهگذار برجسته خطرپذیر، این دستاورد را به عنوان «یکی از شگفتانگیزترین و تأثیرگذارترین پیشرفتهایی که تاکنون دیده» توصیف کرده است.
این در حالی است که DeepSeek ادعا میکند آموزش مدل R1 تنها 5.6 میلیون دلار هزینه داشته است. رقمی که در مقایسه با صدها میلیون دلار هزینه شرکتهای پیشروی آمریکایی برای آموزش مدلها، بسیار پایینتر است.
موفقیت DeepSeek در شرایطی حاصل شده که تحریمهای ایالات متحده فروش تراشههای پیشرفته به شرکتهای چینی را محدود کرده است. نشریه MIT Technology Review در گزارشی اشاره میکند که این محدودیتها باعث شده است استارتآپهایی مانند DeepSeek با تمرکز بر بهرهوری، تجمیع منابع و همکاری، به راهکارهای نوآورانه دست پیدا کنند.
با وجود این، روزنامه Wall Street Journal گزارش داده است که لیانگ ونفنگ، یکی از مدیران DeepSeek، به نخستوزیر چین گفته است که محدودیتهای صادراتی آمریکا همچنان مانعی جدی برای پیشرفت این شرکت به حساب میآید.
در این میان، نایل خوسلا، مدیرعامل شرکت Curai، ادعای جنجالیتری مطرح کرده و DeepSeek را به «یک عملیات روانی دولتی چین» متهم کرده است.
وی مدعی شده که این شرکت هزینه پایین آموزش مدلهای خود را جعل کرده است تا بتواند قیمت خدمات را پایین نگه دارد و رقابتپذیری هوش مصنوعی در آمریکا را تضعیف کند.
با وجود این، یک یادداشت اجتماعی به این ادعا اضافه شده است، که نشان میدهد خوسلا برای این اظهارات خود هیچ مدرکی ارائه نکرده، همچنین پدر او، وینود خوسلا، از سرمایهگذاران OpenAI است.
هولگر شاپیتز، روزنامهنگار برجسته، معتقد است که موفقیت DeepSeek میتواند تهدیدی جدی برای بازارهای سهام ایالات متحده باشد. او میگوید که اگر یک شرکت چینی بتواند بدون دسترسی به تراشههای پیشرفته، مدلهای پیشرفتهای با هزینه پایین تولید کند، ارزش سرمایهگذاریهای میلیارد دلاری در این صنعت زیر سؤال خواهد رفت.
در واکنش، گری تن، مدیرعامل Y Combinator، نظر متفاوتی دارد و موفقیت DeepSeek را فرصتی برای رقبا میداند. او میگوید که کاهش هزینههای آموزش مدلها، میتواند تقاضا برای استفاده واقعی از هوش مصنوعی را افزایش دهد و این موضوع در نهایت باعث استفاده بهینه از منابع محاسباتی خواهد شد.
یان لوکان، مدیر ارشد علمی هوش مصنوعی متا، بیان کرده است که نباید این موفقیت را فقط از دریچه رقابت چین و آمریکا بررسی کرد. او در این باره گفت: «مدلهای متنباز در حال پیشی گرفتن از مدلهای اختصاصی هستند.»
لوکان در لینکدین نوشته است:
«شرکت چینی هوش مصنوعی DeepSeek از تحقیقات و منابع متنباز مانند PyTorch و Llama استفاده کرده و توانسته است ایدههای جدیدی بر پایه کار دیگران ایجاد کند. کار آنها متنباز است و همه میتوانند از آن سود ببرند.»
بحثهای گسترده پیرامون DeepSeek باعث شده است تا این محصول توجه مصرفکنندگان را نیز به خود جلب کند. دستیار هوش مصنوعی این شرکت اکنون به عنوان محبوبترین اپلیکیشن رایگان در فروشگاه اپل قرار دارد و حتی از ChatGPT پیشی گرفته است.