محققان Hugging Face با هدف افزایش شفافیت و دسترسیپذیری و امکان بهینهسازی در حال توسعه نسخهای متنباز از مدل استدلالی هوش مصنوعی دیپسیک به نام Open-R1 هستند.
به گزارش تکناک، تنها یک هفته پساز انتشار مدل هوش مصنوعی استدلالی R1 دیپسیک که بازارها را دچار نوسان کرد، پژوهشگران Hugging Face درصدد بازسازی این مدل از ابتدا هستند. لئاندرو فون ورا، مدیر پژوهش Hugging Face، بههمراه گروهی از مهندسان این شرکت پروژهای به نام Open-R1 را آغاز کردهاند. هدف این پروژه ایجاد نسخهای معادل R1 و انتشار تمامی اجزای آن بهصورت متنباز، ازجمله مجموعه دادههای آموزشی است.
به نقل از تککرانچ، مهندسان این پروژه تصمیم خود را واکنشی به سیاست «جعبه سیاه» دیپسیک در انتشار مدل R1 عنوان کردهاند. اگرچه این مدل ازنظر فنی بهدلیل داشتن مجوز انعطافپذیر «باز» محسوب میشود و اجرای آن محدودیت خاصی ندارد، بهدلیل فقدان شفافیت در ابزارهای بهکاررفته در توسعه آن، متنباز به معنای رایج نیست. دیپسیک مانند بسیاری از شرکتهای برجسته حوزه هوش مصنوعی از افشای جزئیات فنی مدل خودداری کرده است.
فهرست مطالب
محدودیتهای مدل DeepSeek
دیپسیک آزمایشگاه هوش مصنوعی چینی است که بخشی از سرمایه آن را یکی از صندوقهای پوشش ریسک تأمین میکند. هفته گذشته، این شرکت مدل R1 را معرفی کرد. این مدل در برخی از ارزیابیهای عملکرد، نتایجی در سطح یا حتی فراتر از مدل استدلالی o1 شرکت OpenAI ارائه داده است.
مدلهای استدلالی مانند R1 با استفاده از مکانیسمهای بررسی درونی، امکان ارزیابی صحت پاسخهای خود را دارند؛ به همین دلیل، برخی از ضعفهای رایج مدلهای معمولی را ندارند. این مدلها برای پردازش دادهها و ارائه پاسخ، به زمان بیشتری نیاز دارند (از چند ثانیه تا چند دقیقه)؛ اما در حوزههایی مانند فیزیک و علوم و ریاضیات، دقت بیشتری دارند.
شهرت R1 زمانی اوج گرفت که چتبات دیپسیک که دسترسی رایگان به این مدل را فراهم میکند، در صدر فهرست اپلیکیشنهای رایگان اپاستور اپل قرار گرفت. سرعت توسعه R1 که تنها چند هفته پساز انتشار o1 شرکت OpenAI ارائه شد، برخی از تحلیلگران والاستریت و متخصصان فناوری را به این فکر واداشت که آیا ایالات متحده میتواند برتری خود را در رقابت جهانی هوش مصنوعی حفظ کند. بااینهمه، تیم Open-R1 بیشتر از رقابت میان چین و آمریکا، بر شفافسازی فرایند آموزش مدلها تمرکز دارد.
مراحل بازسازی مدل R1
هدف پروژه Open-R1 بازسازی مدل R1 در مدت چند هفته است. برای این منظور، تیم Hugging Face از زیرساخت تحقیقاتی اختصاصی خود، Science Cluster که شامل ۷۶۸ پردازنده گرافیکی H100 انویدیا است، استفاده خواهد کرد.
مهندسان این پروژه قصد دارند از Science Cluster برای ایجاد مجموعه دادههایی مشابه دادههای آموزشی دیپسیک بهره بگیرند. همچنین، آنان برای توسعه مسیر آموزشی جامع از جامعه هوش مصنوعی و توسعهدهندگان در Hugging Face و گیتهاب کمک میگیرند؛ جایی که Open-R1 در حال توسعه است. پروژه Open-R1 بهسرعت در کانون توجه جامعه فناوری قرار گرفته است. تنها در سه روز نخست، این پروژه موفق شد ۱۰ هزار ستاره در گیتهاب کسب کند. این نشاندهنده استقبال گسترده کاربران از این پروژه است.
درصورت موفقیت این پروژه، پژوهشگران هوش مصنوعی خواهند توانست مسیر آموزشی ایجادشده را بهبود ببخشند و نسل بعدی مدلهای استدلالی متنباز را توسعه دهند. با وجود نگرانیهای برخی از متخصصان درباره امکان سوءاستفاده از مدلهای متنباز، باکوچ، مدیرعامل Hugging Face، معتقد است که مزایای این روند بر مشکلات احتمالی آن غلبه دارد. او افزود:
هنگامی که روش بازسازی R1 تکمیل شود، هرکسی که به پردازندههای گرافیکی دسترسی داشته باشد، میتواند نسخهای اختصاصی از این مدل را با دادههای خود ایجاد و آن را بهطور گسترده توزیع کند.
دیدگاهها 1