شرکت آنتروپیک مدل هوش مصنوعی جدید Claude 3.7 Sonnet را معرفی کرده است که قابلیت «استدلال» طولانیمدت را دارد.
به گزارش تکناک، این مدل به کاربران این امکان را میدهد که تعاملات عمیقتری با هوش مصنوعی داشته باشند و از آن برای حل مسائل پیچیده استفاده کنند.
این مدل که شرکت آنتروپیک آن را نخستین «مدل استدلال هیبریدی» در صنعت مینامد، قادر است هم پاسخهای سریع ارائه دهد و هم پاسخهایی که پس از پردازش عمیقتر به دست میآیند. کاربران میتوانند تنظیم کنند که مدل برای مدتی کوتاه یا طولانی به تحلیل پرسشها بپردازد.
تککرانچ مینویسد که این مدل در راستای تلاشهای شرکت آنتروپیک برای سادهسازی تجربه کاربری در تعامل با هوش مصنوعی توسعه یافته است. بسیاری از چتباتهای امروزی، کاربران را ملزم به انتخاب میان مدلهای مختلف با هزینه و قابلیتهای متنوع میکنند. در مقابل، شرکت آنتروپیک قصد دارد همه این قابلیتها را در قالب یک مدل یکپارچه ارائه دهد.
مدل هوش مصنوعی Claude 3.7 Sonnet از روز دوشنبه در دسترس کاربران و توسعهدهندگان قرار میگیرد، اما قابلیتهای استدلالی آن تنها برای مشترکان نسخه پریمیوم Claude فعال خواهد بود. کاربران نسخه رایگان به مدل استاندارد، بدون قابلیت استدلالی، دسترسی خواهند داشت. شرکت آنتروپیک ادعا میکند که این نسخه، عملکرد بهتری نسبت به مدل Claude 3.5 Sonnet دارد.
هزینه استفاده از Claude 3.7 Sonnet برای هر یک میلیون توکن ورودی ۳ دلار و برای هر یک میلیون توکن خروجی ۱۵ دلار است. این مدل از نظر قیمت بالاتر از o3-mini شرکت OpenAI (۱.۱۰ دلار برای هر یک میلیون توکن ورودی و ۴.۴۰ دلار برای هر یک میلیون توکن خروجی) و R1 شرکت DeepSeek (۵۵ سنت برای هر یک میلیون توکن ورودی و ۲.۱۹ دلار برای هر یک میلیون توکن خروجی) قرار میگیرد. اما برخلاف این مدلها که فقط برای استدلال طراحی شدهاند، Claude 3.7 Sonnet یک مدل هیبریدی است که هم پاسخهای سریع و هم تحلیلهای عمیق را ارائه میدهد.

هوش مصنوعی Claude 3.7 Sonnet اولین مدل شرکت آنتروپیک است که به قابلیت «استدلال» مجهز شده است؛ رویکردی که بسیاری از شرکتهای فعال در حوزه هوش مصنوعی برای بهبود عملکرد مدلهای خود به آن روی آوردهاند. مدلهای استدلالی مانند: o3-mini، R1، Gemini 2.0 Flash Thinking و Grok 3 (Think) برای ارائه پاسخهای دقیقتر، مشکلات را به گامهای کوچکتری تقسیم و از توان پردازشی بیشتری استفاده میکنند.
شرکت آنتروپیک در تلاش است تا مدل Claude بتواند به طور خودکار تشخیص دهد که چقدر باید برای تحلیل یک پرسش زمان بگذارد، بدون اینکه به تنظیمات دستی کاربران نیاز داشته باشد. Diane Penn، مدیر محصول و تحقیقات این شرکت، در گفتوگو با TechCrunch این موضوع را مطرح کرده است.
در مطلبی که شرکت آنتروپیک منتشر کرده، آمده است:
«همانطور که انسانها برای سؤالات سریع و پیچیده از دو مغز جداگانه استفاده نمیکنند، مدلهای پیشرفته نیز باید استدلال را به عنوان یکی از قابلیتهای اصلی خود داشته باشند و آن را با سایر تواناییهای خود ادغام کنند، نه اینکه بهصورت مجزا ارائه دهند.»
شرکت آنتروپیک برای شفافسازی نحوه پردازش اطلاعات، به مدل هوش مصنوعی Claude 3.7 Sonnet اجازه داده است تا مراحل برنامهریزی داخلی خود را در یک «دفترچه نمایشی» به کاربران نشان دهد. به گفته Lee، برخی از این اطلاعات ممکن است به دلایل امنیتی و اعتماد، حذف شوند.
مدل جدید برای انجام وظایف واقعی، از جمله حل مسائل پیچیده برنامهنویسی یا اجرای فرایندهای خودکار، بهینه شده است. توسعهدهندگانی که از API این شرکت استفاده میکنند، میتوانند میزان زمان و هزینه مصرفی برای پردازش پاسخ را مدیریت کنند.

هوش مصنوعی Claude 3.7 Sonnet در آزمون SWE-Bench که دقت مدل در انجام وظایف برنامهنویسی دنیای واقعی را میسنجد، موفق شد امتیاز ۶۲.۳ درصد را کسب کند، در حالی که مدل o3-mini شرکت OpenAI تنها ۴۹.۳ درصد دقت داشت.
همچنین در آزمون TAU-Bench، که عملکرد مدلها را در شبیهسازی تعامل با کاربران و APIهای خارجی در محیطهای خردهفروشی ارزیابی میکند، Claude 3.7 Sonnet امتیاز ۸۱.۲ درصد را به دست آورد، در حالی که مدل o1 شرکت OpenAI به امتیاز ۷۳.۵ درصد دست یافت.
یکی از تغییرات مهم این نسخه، کاهش امتناعهای غیرضروری از پاسخ دادن به سؤالات است. شرکت آنتروپیک مدعی است که میزان این امتناعها در مدل هوش مصنوعی Claude 3.7 Sonnet نسبت به نسخه Claude 3.5 Sonnet تا ۴۵ درصد کاهش یافته است. این تغییر در زمانی اتفاق افتاده است که برخی شرکتهای هوش مصنوعی در حال بازنگری در نحوه محدودسازی پاسخهای مدلهای خود هستند.
شرکت آنتروپیک همزمان با عرضه Claude 3.7 Sonnet، یک ابزار کدنویسی جدید به نام Claude Code را نیز به عنوان یک نسخه تحقیقاتی معرفی کرده است. این ابزار به توسعهدهندگان اجازه میدهد تا وظایف خاصی را به صورت مستقیم از طریق ترمینال اجرا کنند.
کارکنان شرکت آنتروپیک در یکی از نمایشهای آزمایشی، نشان دادند که Claude Code میتواند با دریافت یک دستور ساده مانند «ساختار این پروژه را توضیح بده»، پروژهای را تحلیل کند. توسعهدهندگان میتوانند از طریق زبان ساده در خط فرمان، کدهای خود را تغییر دهند، در حالی که Claude Code همزمان توضیحاتی درباره تغییرات ارائه میدهد، پروژه را بررسی و حتی آن را در GitHub منتشر میکند.
ابزار Claude Code در ابتدا برای تعداد محدودی از کاربران و بر اساس «اولویت ثبتنام» ارائه خواهد شد.
این رونمایی در حالی انجام شده که سرعت عرضه مدلهای جدید در صنعت هوش مصنوعی به شدت افزایش یافته است. شرکت آنتروپیک که اغلب رویکردی دقیق و مبتنی بر ایمنی را در پیش گرفته است، این بار قصد دارد در این رقابت پیشتاز باشد.
هرچند، این پرسش مطرح است که این برتری تا چه زمانی ادامه خواهد داشت. گفته میشود که OpenAI نیز در حال آمادهسازی یک مدل هوش مصنوعی هیبریدی میباشد و Sam Altman، مدیرعامل این شرکت، اعلام کرده است که این مدل طی «چند ماه آینده» معرفی خواهد شد.