Open-R1؛ تلاش Hugging Face برای توسعه نسخه متن‌باز دیپ‌سیک

محققان Hugging Face با هدف افزایش شفافیت و دسترسی‌پذیری و امکان بهینه‌سازی در حال توسعه نسخه‌ای متن‌باز از مدل استدلالی هوش مصنوعی دیپ‌سیک به نام Open-R1 هستند.

به گزارش تک‌ناک، تنها یک هفته پس‌از انتشار مدل هوش مصنوعی استدلالی R1 دیپ‌سیک که بازارها را دچار نوسان کرد، پژوهشگران Hugging Face درصدد بازسازی این مدل از ابتدا هستند. لئاندرو فون ورا، مدیر پژوهش Hugging Face، به‌همراه گروهی از مهندسان این شرکت پروژه‌ای به نام Open-R1 را آغاز کرده‌اند. هدف این پروژه ایجاد نسخه‌ای معادل R1 و انتشار تمامی اجزای آن به‌صورت متن‌باز، از‌جمله مجموعه داده‌های آموزشی است.

به نقل از تک‌کرانچ، مهندسان این پروژه تصمیم خود را واکنشی به سیاست «جعبه سیاه» دیپ‌سیک در انتشار مدل R1 عنوان کرده‌اند. اگرچه این مدل ازنظر فنی به‌دلیل داشتن مجوز انعطاف‌پذیر «باز» محسوب می‌شود و اجرای آن محدودیت خاصی ندارد، به‌دلیل فقدان شفافیت در ابزارهای به‌کار‌رفته در توسعه آن، متن‌باز به معنای رایج نیست. دیپ‌سیک مانند بسیاری از شرکت‌های برجسته حوزه هوش مصنوعی از افشای جزئیات فنی مدل خودداری کرده است.

01
از 02
محدودیت‌های مدل DeepSeek

دیپ‌سیک آزمایشگاه هوش مصنوعی چینی است که بخشی از سرمایه آن را یکی از صندوق‌های پوشش ریسک تأمین می‌کند. هفته گذشته، این شرکت مدل R1 را معرفی کرد. این مدل در برخی از ارزیابی‌های عملکرد، نتایجی در سطح یا حتی فراتر از مدل استدلالی o1 شرکت OpenAI ارائه داده است.

مدل‌های استدلالی مانند R1 با استفاده از مکانیسم‌های بررسی درونی، امکان ارزیابی صحت پاسخ‌های خود را دارند؛ به همین دلیل، برخی از ضعف‌های رایج مدل‌های معمولی را ندارند. این مدل‌ها برای پردازش داده‌ها و ارائه پاسخ، به زمان بیشتری نیاز دارند (از چند ثانیه تا چند دقیقه)؛ اما در حوزه‌هایی مانند فیزیک و علوم و ریاضیات، دقت بیشتری دارند.

شهرت R1 زمانی اوج گرفت که چت‌بات دیپ‌سیک که دسترسی رایگان به این مدل را فراهم می‌کند، در صدر فهرست اپلیکیشن‌های رایگان اپ‌استور اپل قرار گرفت. سرعت توسعه R1 که تنها چند هفته پس‌از انتشار o1 شرکت OpenAI ارائه شد، برخی از تحلیلگران وال‌استریت و متخصصان فناوری را به این فکر واداشت که آیا ایالات متحده می‌تواند برتری خود را در رقابت جهانی هوش مصنوعی حفظ کند. بااین‌همه، تیم Open-R1 بیشتر از رقابت میان چین و آمریکا، بر شفاف‌سازی فرایند آموزش مدل‌ها تمرکز دارد.

02
از 02
مراحل بازسازی مدل R1

هدف پروژه Open-R1 بازسازی مدل R1 در مدت چند هفته است. برای این منظور، تیم Hugging Face از زیرساخت تحقیقاتی اختصاصی خود، Science Cluster که شامل ۷۶۸ پردازنده گرافیکی H100 انویدیا است، استفاده خواهد کرد.

مهندسان این پروژه قصد دارند از Science Cluster برای ایجاد مجموعه داده‌هایی مشابه داده‌های آموزشی دیپ‌سیک بهره بگیرند. همچنین، آنان برای توسعه مسیر آموزشی جامع از جامعه هوش مصنوعی و توسعه‌دهندگان در Hugging Face و گیت‌هاب کمک می‌گیرند؛ جایی که Open-R1 در حال توسعه است. پروژه Open-R1 به‌سرعت در کانون توجه جامعه فناوری قرار گرفته است. تنها در سه روز نخست، این پروژه موفق شد ۱۰ هزار ستاره در گیت‌هاب کسب کند. این نشان‌دهنده استقبال گسترده کاربران از این پروژه است.

درصورت موفقیت این پروژه، پژوهشگران هوش مصنوعی خواهند توانست مسیر آموزشی ایجاد‌شده را بهبود ببخشند و نسل بعدی مدل‌های استدلالی متن‌باز را توسعه دهند. با وجود نگرانی‌های برخی از متخصصان درباره امکان سوءاستفاده از مدل‌های متن‌باز، باکوچ، مدیرعامل Hugging Face، معتقد است که مزایای این روند بر مشکلات احتمالی آن غلبه دارد. او افزود:

هنگامی که روش بازسازی R1 تکمیل شود، هرکسی که به پردازنده‌های گرافیکی دسترسی داشته باشد، می‌تواند نسخه‌ای اختصاصی از این مدل را با داده‌های خود ایجاد و آن را به‌طور گسترده توزیع کند.