مدل Claude Sonnet 5 با قابلیتهای عامل محور، استدلال پیشرفته و استفاده از ابزارهایی مانند مرورگر و ترمینال، رقیب ارزانتر و قویتر ChatGPT در کدنویسی شد.
به گزارش سرویس هوش مصنوعی تکناک، در شرایطی که ارائه قابلیتهای عاملمحور یا Agentic به یک استاندارد پایه میان شرکتهای توسعهدهنده مدلهای بنیادی تبدیل شده، آنتروپیک از این مدل جدید خود به عنوان جایگزین مدل Sonnet 4.6 رونمایی کرده است.
شرکت آنتروپیک در پستی وبلاگی اعلام کرد: «این مدل میتواند برنامهریزی کند، از ابزارهایی مانند مرورگر و ترمینال استفاده نماید و به صورت خودکار در سطحی فعالیت داشته باشد که تنها چند ماه پیش به مدلهایی بزرگتر و بسیار گرانتر نیاز داشت.»
این رویکرد شباهت زیادی به توصیفهایی دارد که OpenAI و گوگل درباره مدلهای جدید خود ارائه کردهاند. مدل GPT-5.6 Sol شرکت OpenAI هفته گذشته در قالب نسخه Preview معرفی شد و به عنوان عاملمحورترین مدل این شرکت شناخته میشود؛ مدلی که به کاربران اجازه میدهد وظایف را میان چند زیرعامل تقسیم کنند تا کارهای طولانی و خودکار انجام شود. از سوی دیگر، Gemini 3.5 Flash گوگل در ماه مه به عنوان گذار از یک چتبات مکالمهای به ابزاری عاملمحور معرفی شد، که میتواند با حداقل دخالت انسانی، برنامهریزی کند، پروژه بسازد و روی کارهای واقعی به شکل تکرارشونده فعالیت کند.
معرفی Sonnet 5 نشان میدهد که قابلیتهای عاملمحور اکنون به انتظار پایه در تمام سطوح قیمتی تبدیل شدهاند. در نتیجه، تفاوت اصلی دیگر این نخواهد بود که کدام شرکت بهترین عملکرد Agentic را ارائه میدهد، بلکه این است که با چه هزینهای و با چه میزان پایداری بدون نظارت انسانی اجرا میشوند.
مدل جدید Claude Sonnet 5 وعده عملکردی نزدیک به مدل Opus 4.8 با هزینهای به مراتب کمتر را میدهد. از روز سهشنبه، Claude Sonnet 5 به مدل پیشفرض برای کاربران نسخه رایگان و اشتراک Pro تبدیل میشود و در تمام پلنهای اشتراکی در دسترس قرار خواهد گرفت.
در زمان عرضه، هزینه استفاده از Sonnet 5 برابر با ۲ دلار به ازای هر یک میلیون توکن ورودی و ۱۰ دلار به ازای هر یک میلیون توکن خروجی تعیین شده است. این قیمت تا ۳۱ آگوست برقرار خواهد بود و پس از آن به ۳ دلار برای هر یک میلیون توکن ورودی و ۱۵ دلار برای هر یک میلیون توکن خروجی افزایش مییابد. این موضوع Sonnet 5 را ارزانتر از Opus 4.8 و مدلهای GPT-5.5 شرکت OpenAI و Gemini 3.1 Pro گوگل قرار میدهد، هرچند همچنان از Gemini 3.5 Flash گرانتر است.

بر اساس اعلام آنتروپیک، مدل جدید نسبت به نسخه قبلی یعنی Sonnet 4.6 که در ماه فوریه عرضه شد، پیشرفتهای قابل توجهی در زمینه عملکرد عاملمحور، استدلال، استفاده از ابزارها، برنامهنویسی و انجام کارهای دانشی داشته است.
برای مثال، در یکی از بنچمارکها، Sonnet 5 در بخش کدنویسی عاملمحور امتیاز ۶۳.۲ درصد را کسب کرده است؛ در حالی که Opus 4.8 امتیاز ۶۹.۲ درصد و Sonnet 4.6 امتیاز ۵۸.۱ درصد را ثبت کرده بودند. در یکی از بنچمارکهای مرتبط با کارهای دانشی، Sonnet 5 حتی اندکی بهتر از Opus 4.8 ظاهر شده است؛ مدلی که به دلیل توانایی در حل مسائل بسیار پیچیده، قضاوتهای ظریف و تحقیقات عمیق شناخته میشود.
شرکت آنتروپیک اعلام کرده است: «Opus 4.8 همچنان برای دستیابی به دقت بالاتر در این وظایف، مدل اصلی محسوب میشود، اما Sonnet 5 گزینه ارزانتری را در اختیار توسعهدهندگان قرار میدهد که کیفیت آن بسیار بالاتر از گزینههای قبلی است. کاربران میتوانند میان Sonnet 5 و Opus 4.8 سطح تلاش مورد نظر را تنظیم کنند تا به تعادل مناسبی میان هزینه و عملکرد برسند.»
بر اساس گفتههای آزمایشکنندگان نقلشده در این پست وبلاگی، Sonnet 5 در تکمیل وظایف پیچیدهای که نسخههای قبلی مدل در میانه راه متوقف میشدند نیز عملکرد بسیار خوبی دارد و حتی «بدون درخواست صریح، خروجیهای خود را بررسی میکند.»
دنیل شپرد، مهندس ارشد Zapier در بیانیهای اعلام کرد: «وظیفهای دو مرحلهای شامل بهروزرسانی سطوح حسابهای Salesforce و ارسال اطلاعیه عرضه برای مخاطبان سازمانی به Claude Sonnet 5 داده شد و این مدل جدید کل فرایند را از ابتدا تا انتها تکمیل کرد. پیش از این، فرایند در میانه راه متوقف میشد. این مدل برای اتوماسیون روزمره، انتخابی کاملا منطقی است.»
بر اساس گزارش تککرانچ، در بخش ایمنی نیز Sonnet 5 نسبت به نسخه قبلی نرخ پایینتری از «رفتارهای نامطلوب» مانند همکاری در سوءاستفادهها و فریبکاری نشان داده است و به همین دلیل برای استفاده در سناریوهای عاملمحور ایمنتر محسوب میشود. این مدل در رد درخواستهای مخرب و مقابله با حملات تزریق دستور، عملکرد بهتری دارد. همچنین میزان توهمزایی و رفتار چاپلوسانه آن نسبت به Sonnet 4.6 کمتر گزارش شده است.
هرچند، این مدل هنوز از نظر رفتارهای ناهماهنگ به سطح Opus 4.8 و Claude Mythos Preview نرسیده است. در پست وبلاگی آنتروپیک آمده است: «ارزیابیها نشان میدهند که توانایی این مدل در انجام وظایف خطرناک امنیت سایبری بسیار کمتر از مدلهای فعلی Opus است.»
فابیان هدین، همبنیانگذار Lovable نیز در بیانیهای اعلام کرد که Claude Sonnet 5 «در رد درخواستهای ناامن، عملکردی شفاف و پایدار دارد.»
وی تصریح کرد: «در Lovable ابزارهای قدرتمندی در اختیار میلیونها سازنده قرار میگیرد. مدلی که بداند چه زمانی باید نه بگوید، به اندازه همان مدلی اهمیت دارد که توانایی ساختن دارد.»
در پایان، این گزارش بهروزرسانی شده است تا مشخص شود قیمت توکنهای خروجی پس از ۳۱ آگوست، ۱۵ دلار به ازای هر یک میلیون توکن خروجی خواهد بود.

















