رونمایی از مدل هوش مصنوعی Claude 3.7 Sonnet با قابلیت استدلال طولانی‌مدت

شرکت آنتروپیک مدل هوش مصنوعی جدید Claude 3.7 Sonnet را معرفی کرده است که قابلیت «استدلال» طولانی‌مدت را دارد.

به گزارش تک‌ناک، این مدل به کاربران این امکان را می‌دهد که تعاملات عمیق‌تری با هوش مصنوعی داشته باشند و از آن برای حل مسائل پیچیده استفاده کنند.

این مدل که شرکت آنتروپیک آن را نخستین «مدل استدلال هیبریدی» در صنعت می‌نامد، قادر است هم پاسخ‌های سریع ارائه دهد و هم پاسخ‌هایی که پس از پردازش عمیق‌تر به دست می‌آیند. کاربران می‌توانند تنظیم کنند که مدل برای مدتی کوتاه یا طولانی‌ به تحلیل پرسش‌ها بپردازد.

تک‌کرانچ می‌نویسد که این مدل در راستای تلاش‌های شرکت آنتروپیک برای ساده‌سازی تجربه کاربری در تعامل با هوش مصنوعی توسعه یافته است. بسیاری از چت‌بات‌های امروزی، کاربران را ملزم به انتخاب میان مدل‌های مختلف با هزینه و قابلیت‌های متنوع می‌کنند. در مقابل، شرکت آنتروپیک قصد دارد همه این قابلیت‌ها را در قالب یک مدل یکپارچه ارائه دهد.

مدل هوش مصنوعی Claude 3.7 Sonnet از روز دوشنبه در دسترس کاربران و توسعه‌دهندگان قرار می‌گیرد، اما قابلیت‌های استدلالی آن تنها برای مشترکان نسخه پریمیوم Claude فعال خواهد بود. کاربران نسخه رایگان به مدل استاندارد، بدون قابلیت استدلالی، دسترسی خواهند داشت. شرکت آنتروپیک ادعا می‌کند که این نسخه، عملکرد بهتری نسبت به مدل Claude 3.5 Sonnet دارد.

هزینه استفاده از Claude 3.7 Sonnet برای هر یک میلیون توکن ورودی ۳ دلار و برای هر یک میلیون توکن خروجی ۱۵ دلار است. این مدل از نظر قیمت بالاتر از o3-mini شرکت OpenAI (۱.۱۰ دلار برای هر یک میلیون توکن ورودی و ۴.۴۰ دلار برای هر یک میلیون توکن خروجی) و R1 شرکت DeepSeek (۵۵ سنت برای هر یک میلیون توکن ورودی و ۲.۱۹ دلار برای هر یک میلیون توکن خروجی) قرار می‌گیرد. اما برخلاف این مدل‌ها که فقط برای استدلال طراحی شده‌اند، Claude 3.7 Sonnet یک مدل هیبریدی است که هم پاسخ‌های سریع و هم تحلیل‌های عمیق را ارائه می‌دهد.

از مدل هوش مصنوعی Claude 3.7 Sonnet با قابلیت استدلال طولانی‌مدت رونمایی شد

هوش مصنوعی Claude 3.7 Sonnet اولین مدل شرکت آنتروپیک است که به قابلیت «استدلال» مجهز شده است؛ رویکردی که بسیاری از شرکت‌های فعال در حوزه هوش مصنوعی برای بهبود عملکرد مدل‌های خود به آن روی آورده‌اند. مدل‌های استدلالی مانند: o3-mini، R1، Gemini 2.0 Flash Thinking و Grok 3 (Think) برای ارائه پاسخ‌های دقیق‌تر، مشکلات را به گام‌های کوچک‌تری تقسیم و از توان پردازشی بیشتری استفاده می‌کنند.

شرکت آنتروپیک در تلاش است تا مدل Claude بتواند به‌ طور خودکار تشخیص دهد که چقدر باید برای تحلیل یک پرسش زمان بگذارد، بدون اینکه به تنظیمات دستی کاربران نیاز داشته باشد. Diane Penn، مدیر محصول و تحقیقات این شرکت، در گفت‌وگو با TechCrunch این موضوع را مطرح کرده است.

در مطلبی که شرکت آنتروپیک منتشر کرده، آمده است:

«همان‌طور که انسان‌ها برای سؤالات سریع و پیچیده از دو مغز جداگانه استفاده نمی‌کنند، مدل‌های پیشرفته نیز باید استدلال را به‌ عنوان یکی از قابلیت‌های اصلی خود داشته باشند و آن را با سایر توانایی‌های خود ادغام کنند، نه اینکه به‌صورت مجزا ارائه دهند.»

شرکت آنتروپیک برای شفاف‌سازی نحوه پردازش اطلاعات، به مدل هوش مصنوعی Claude 3.7 Sonnet اجازه داده است تا مراحل برنامه‌ریزی داخلی خود را در یک «دفترچه نمایشی» به کاربران نشان دهد. به گفته Lee، برخی از این اطلاعات ممکن است به دلایل امنیتی و اعتماد، حذف شوند.

مدل جدید برای انجام وظایف واقعی، از جمله حل مسائل پیچیده برنامه‌نویسی یا اجرای فرایندهای خودکار، بهینه شده است. توسعه‌دهندگانی که از API این شرکت استفاده می‌کنند، می‌توانند میزان زمان و هزینه مصرفی برای پردازش پاسخ را مدیریت کنند.

Claude 3.7 Sonnet اولین مدل هوش مصنوعی استدلالی شرکت آنتروپیک معرفی شد

هوش مصنوعی Claude 3.7 Sonnet در آزمون SWE-Bench که دقت مدل در انجام وظایف برنامه‌نویسی دنیای واقعی را می‌سنجد، موفق شد امتیاز ۶۲.۳ درصد را کسب کند، در حالی‌ که مدل o3-mini شرکت OpenAI تنها ۴۹.۳ درصد دقت داشت.

همچنین در آزمون TAU-Bench، که عملکرد مدل‌ها را در شبیه‌سازی تعامل با کاربران و APIهای خارجی در محیط‌های خرده‌فروشی ارزیابی می‌کند، Claude 3.7 Sonnet امتیاز ۸۱.۲ درصد را به دست آورد، در حالی‌ که مدل o1 شرکت OpenAI به امتیاز ۷۳.۵ درصد دست یافت.

یکی از تغییرات مهم این نسخه، کاهش امتناع‌های غیرضروری از پاسخ دادن به سؤالات است. شرکت آنتروپیک مدعی است که میزان این امتناع‌ها در مدل هوش مصنوعی Claude 3.7 Sonnet نسبت به نسخه Claude 3.5 Sonnet تا ۴۵ درصد کاهش یافته است. این تغییر در زمانی اتفاق افتاده است که برخی شرکت‌های هوش مصنوعی در حال بازنگری در نحوه محدودسازی پاسخ‌های مدل‌های خود هستند.

شرکت آنتروپیک هم‌زمان با عرضه Claude 3.7 Sonnet، یک ابزار کدنویسی جدید به نام Claude Code را نیز به‌ عنوان یک نسخه تحقیقاتی معرفی کرده است. این ابزار به توسعه‌دهندگان اجازه می‌دهد تا وظایف خاصی را به صورت مستقیم از طریق ترمینال اجرا کنند.

کارکنان شرکت آنتروپیک در یکی از نمایش‌های آزمایشی، نشان دادند که Claude Code می‌تواند با دریافت یک دستور ساده مانند «ساختار این پروژه را توضیح بده»، پروژه‌ای را تحلیل کند. توسعه‌دهندگان می‌توانند از طریق زبان ساده در خط فرمان، کدهای خود را تغییر دهند، در حالی‌ که Claude Code هم‌زمان توضیحاتی درباره تغییرات ارائه می‌دهد، پروژه را بررسی و حتی آن را در GitHub منتشر می‌کند.

ابزار Claude Code در ابتدا برای تعداد محدودی از کاربران و بر اساس «اولویت ثبت‌نام» ارائه خواهد شد.

این رونمایی در حالی انجام شده که سرعت عرضه مدل‌های جدید در صنعت هوش مصنوعی به‌ شدت افزایش یافته است. شرکت آنتروپیک که اغلب رویکردی دقیق و مبتنی بر ایمنی را در پیش گرفته است، این بار قصد دارد در این رقابت پیشتاز باشد.

هرچند، این پرسش مطرح است که این برتری تا چه زمانی ادامه خواهد داشت. گفته می‌شود که OpenAI نیز در حال آماده‌سازی یک مدل هوش مصنوعی هیبریدی می‌باشد و Sam Altman، مدیرعامل این شرکت، اعلام کرده است که این مدل طی «چند ماه آینده» معرفی خواهد شد.