علیبابا مدل زبانی بزرگ جدیدی به نام Qwen with Questions را معرفی کرده که در مقایسه با مدل o1-preview شرکت OpenAI، در بخش استدلال قویتر است.
به گزارش تکناک، علیبابا مدل جدیدی از خانواده در حال گسترش Qwen خود به نام Qwen with Questions (QwQ) را منتشر کرده است. این مدل بهعنوان رقیب اصلی مدل استدلالیo1 شرکت OpenAI معرفی شده است. درحالحاضر، مدل جدید علیبابا در حالت پیشنمایش قرار دارد و پیشبینی میشود که نسخههای بهبودیافتهتری از آن در آینده منتشر شود.
فهرست مطالب
ویژگیهای خاص Qwen with Questions علیبابا
ونچربیت مینویسد که مدل QwQ مانند سایر مدلهای بزرگ استدلالی (LRM) از منابع پردازشی اضافی در زمان استنباط استفاده میکند. این منابع اضافی به مدل اجازه میدهند تا پاسخهای خود را بازبینی و خطاهای احتمالی را اصلاح کند. این ویژگی باعث میشود QwQ در انجام وظایف نیازمند به استدلال منطقی و برنامهریزی مانند حل مسائل ریاضی و برنامهنویسی، کارایی بیشتری داشته باشد.
نتایج آزمایشها
طبق آزمایشها، مدل QwQ در مقایسه با مدل o1-preview از OpenAI در معیارهای مختلف عملکرد بهتری از خود نشان داده است. این مدل در ارزیابیهای AIME و MATH که تواناییهای مدل در حل مسائل ریاضی را بررسی میکند، از o1-preview پیشی گرفته است. در معیار GPQA که برای سنجش استدلال علمی طراحی شده، QwQ توانسته است از مدل o1-mini نیز عملکرد بهتری داشته باشد. بااینحال، در آزمونهای LiveCodeBench که به ارزیابی مهارتهای برنامهنویسی اختصاص دارد، مدل QwQ از o1 ضعیفتر عمل میکند؛ اما هنوزهم از سایر مدلهای پیشرفته مانند GPT-4o و Claude 3.5 Sonnet بهتر است.
مزایای منبعباز و مجوز تجاری
برخلاف مدلهای مشابه مانند o1 که توسط OpenAI منتشر شدهاند، علیبابا مدل QwQ را بهصورت منبعباز در اختیار عموم قرار داده است. این یعنی توسعهدهندگان و پژوهشگران میتوانند کد و فرایندهای داخلی مدل را مشاهده کنند و از آن برای بهبود و گسترش آن استفاده کنند. این مدل تحت مجوز Apache 2.0 نیز منتشر شده است و این یعنی میتوان از آن برای اهداف تجاری نیز بهره برد.
فرایند تفکر مدل؛ کشف لحظات تأمل
علیبابا با انتشار بیانیهای مدل QwQ را معرفی کرده و فرایند تفکر آن را شرح داده است. طبق این بیانیه، هنگامی که به مدل زمان کافی برای تأمل و پرسش و بازتاب داده میشود، درک آن از مفاهیم پیچیده مانند ریاضیات و برنامهنویسی رشد میکند. به گفته تیم توسعه، این فرایند به بهبود چشمگیر در حل مسائل پیچیده و دستیابی به دستاوردهای بزرگ در این زمینهها منجر میشود.
این توضیحات مشابه به روشهای موجود در سایر مدلهای استدلالی است که معمولاً با تولید توکنهای بیشتر و بازبینی پاسخهای خود، تلاش میکنند تا اشتباهات را اصلاح کنند. مدل Marco-o1 که اخیراً علیبابا منتشر کرده است، از Monte Carlo Tree Search (MCTS) و خودبازتابی در زمان استنباط استفاده میکند تا شاخههای مختلف استدلال را ایجاد و بهترین پاسخ را انتخاب کند.
مدل Qwen with Questions علیبابا نیز با برخی محدودیتها روبهرو است. علیبابا به مشکل ترکیب زبانها و گیرکردن در حلقههای استدلال دایرهای اشاره کرده است. این مشکلات نشاندهنده نیاز به بهبود بیشتر درزمینه پردازش زبان و استدلال در مدلهای پیچیده است.
آینده مدلهای استدلالی
انتشار مدل Qwen with Questions علیبابا در شرایطی رخ داده است که رقابت درزمینه مدلهای استدلالی (LRM) در حال افزایش است. مدل o1 شرکت OpenAI بهعنوان نقطه عطفی در توسعه مدلهای استدلالی شناخته میشود. بهعلاوه، مدلهای دیگری مانند R1-Lite-Preview از آزمایشگاه DeepSeek و LLaVA-o1 که محققان چینی توسعه دادهاند، بهدنبال رقابت با o1 هستند. این مدلها عمدتاً از استراتژیهای استدلال در زمان استنباط برای بهبود عملکرد خود استفاده میکنند.
تمرکز بر مدلهای بزرگ استدلالی درحالی صورت میگیرد که روند مقیاسبندی مدلهای هوش مصنوعی با مشکلاتی مواجه شده است. طبق گزارشها، آزمایشگاههای هوش مصنوعی مانند OpenAI و دیپمایند گوگل با کاهش بازده در آموزش مدلهای بزرگ روبهرو هستند. جمعآوری دادههای باکیفیت برای آموزش مدلها بهدلیل محدودیتهای موجود در دسترسی به دادههای جدید و حجیم نیز پیچیدهتر شده است.
در این میان، استفاده از مقیاس استنباط در مدلهای استدلالی میتواند راهحلی نوآورانه برای بهبود عملکرد نسل بعدی مدلهای هوش مصنوعی باشد. گزارشها حاکی از آن است که OpenAI از مدل o1 برای تولید دادههای استدلال مصنوعی بهمنظور آموزش نسلهای بعدی مدلهای خود استفاده میکند.
انتشار مدل Qwen with Questions علیبابا نشاندهنده گام جدیدی در رقابت میان مدلهای استدلالی است. با توجه به قابلیتهای منحصربهفرد این مدل در بهبود فرایند استدلال و رفع خطاها، پیشبینی میشود که رقابت در این زمینه در آینده نزدیک شدت بیشتری پیدا کند. این مدل همراه با سایر مدلهای مشابه، میتواند تحولی در راهحلهای هوش مصنوعی و آینده استدلال مصنوعی ایجاد کند.