مدل جدید Claude Sonnet 5 در کدنویسی رقیب ارزان‌تر و قوی‌تر ChatGPT شد

مدل Claude Sonnet 5 با قابلیت‌های عامل محور، استدلال پیشرفته و استفاده از ابزارهایی مانند مرورگر و ترمینال، رقیب ارزان‌تر و قوی‌تر ChatGPT در کدنویسی شد.

به گزارش سرویس هوش مصنوعی تک‌ناک، در شرایطی که ارائه قابلیت‌های عامل‌محور یا Agentic به یک استاندارد پایه میان شرکت‌های توسعه‌دهنده مدل‌های بنیادی تبدیل شده، آنتروپیک از این مدل جدید خود به عنوان جایگزین مدل Sonnet 4.6 رونمایی کرده است.

شرکت آنتروپیک در پستی وبلاگی اعلام کرد: «این مدل می‌تواند برنامه‌ریزی کند، از ابزارهایی مانند مرورگر و ترمینال استفاده نماید و به صورت خودکار در سطحی فعالیت داشته باشد که تنها چند ماه پیش به مدل‌هایی بزرگ‌تر و بسیار گران‌تر نیاز داشت.»

این رویکرد شباهت زیادی به توصیف‌هایی دارد که OpenAI و گوگل درباره مدل‌های جدید خود ارائه کرده‌اند. مدل GPT-5.6 Sol شرکت OpenAI هفته گذشته در قالب نسخه Preview معرفی شد و به عنوان عامل‌محورترین مدل این شرکت شناخته می‌شود؛ مدلی که به کاربران اجازه می‌دهد وظایف را میان چند زیرعامل تقسیم کنند تا کارهای طولانی و خودکار انجام شود. از سوی دیگر، Gemini 3.5 Flash گوگل در ماه مه به عنوان گذار از یک چت‌بات مکالمه‌ای به ابزاری عامل‌محور معرفی شد، که می‌تواند با حداقل دخالت انسانی، برنامه‌ریزی کند، پروژه بسازد و روی کارهای واقعی به شکل تکرارشونده فعالیت کند.

معرفی Sonnet 5 نشان می‌دهد که قابلیت‌های عامل‌محور اکنون به انتظار پایه در تمام سطوح قیمتی تبدیل شده‌اند. در نتیجه، تفاوت اصلی دیگر این نخواهد بود که کدام شرکت بهترین عملکرد Agentic را ارائه می‌دهد، بلکه این است که با چه هزینه‌ای و با چه میزان پایداری بدون نظارت انسانی اجرا می‌شوند.

مدل جدید Claude Sonnet 5 وعده عملکردی نزدیک به مدل Opus 4.8 با هزینه‌ای به مراتب کمتر را می‌دهد. از روز سه‌شنبه، Claude Sonnet 5 به مدل پیش‌فرض برای کاربران نسخه رایگان و اشتراک Pro تبدیل می‌شود و در تمام پلن‌های اشتراکی در دسترس قرار خواهد گرفت.

در زمان عرضه، هزینه استفاده از Sonnet 5 برابر با ۲ دلار به ازای هر یک میلیون توکن ورودی و ۱۰ دلار به ازای هر یک میلیون توکن خروجی تعیین شده است. این قیمت تا ۳۱ آگوست برقرار خواهد بود و پس از آن به ۳ دلار برای هر یک میلیون توکن ورودی و ۱۵ دلار برای هر یک میلیون توکن خروجی افزایش می‌یابد. این موضوع Sonnet 5 را ارزان‌تر از Opus 4.8 و مدل‌های GPT-5.5 شرکت OpenAI و Gemini 3.1 Pro گوگل قرار می‌دهد، هرچند همچنان از Gemini 3.5 Flash گران‌تر است.

لوگو و نوشته سفید رنگ Claude بر روی صفحه نمایش گوشی هوشمند در حالت تاریک با پس‌زمینه ستاره‌ای نارنجی

بر اساس اعلام آنتروپیک، مدل جدید نسبت به نسخه قبلی یعنی Sonnet 4.6 که در ماه فوریه عرضه شد، پیشرفت‌های قابل‌ توجهی در زمینه عملکرد عامل‌محور، استدلال، استفاده از ابزارها، برنامه‌نویسی و انجام کارهای دانشی داشته است.

برای مثال، در یکی از بنچمارک‌ها، Sonnet 5 در بخش کدنویسی عامل‌محور امتیاز ۶۳.۲ درصد را کسب کرده است؛ در حالی که Opus 4.8 امتیاز ۶۹.۲ درصد و Sonnet 4.6 امتیاز ۵۸.۱ درصد را ثبت کرده بودند. در یکی از بنچمارک‌های مرتبط با کارهای دانشی، Sonnet 5 حتی اندکی بهتر از Opus 4.8 ظاهر شده است؛ مدلی که به دلیل توانایی در حل مسائل بسیار پیچیده، قضاوت‌های ظریف و تحقیقات عمیق شناخته می‌شود.

شرکت آنتروپیک اعلام کرده است: «Opus 4.8 همچنان برای دستیابی به دقت بالاتر در این وظایف، مدل اصلی محسوب می‌شود، اما Sonnet 5 گزینه‌ ارزان‌تری را در اختیار توسعه‌دهندگان قرار می‌دهد که کیفیت آن بسیار بالاتر از گزینه‌های قبلی است. کاربران می‌توانند میان Sonnet 5 و Opus 4.8 سطح تلاش مورد نظر را تنظیم کنند تا به تعادل مناسبی میان هزینه و عملکرد برسند.»

بر اساس گفته‌های آزمایش‌کنندگان نقل‌شده در این پست وبلاگی، Sonnet 5 در تکمیل وظایف پیچیده‌ای که نسخه‌های قبلی مدل در میانه راه متوقف می‌شدند نیز عملکرد بسیار خوبی دارد و حتی «بدون درخواست صریح، خروجی‌های خود را بررسی می‌کند.»

دنیل شپرد، مهندس ارشد Zapier در بیانیه‌ای اعلام کرد: «وظیفه‌ای دو مرحله‌ای شامل به‌روزرسانی سطوح حساب‌های Salesforce و ارسال اطلاعیه عرضه برای مخاطبان سازمانی به Claude Sonnet 5 داده شد و این مدل جدید کل فرایند را از ابتدا تا انتها تکمیل کرد. پیش از این، فرایند در میانه راه متوقف می‌شد. این مدل برای اتوماسیون روزمره، انتخابی کاملا منطقی است.»

بر اساس گزارش تک‌کرانچ، در بخش ایمنی نیز Sonnet 5 نسبت به نسخه قبلی نرخ پایین‌تری از «رفتارهای نامطلوب» مانند همکاری در سوءاستفاده‌ها و فریبکاری نشان داده است و به همین دلیل برای استفاده در سناریوهای عامل‌محور ایمن‌تر محسوب می‌شود. این مدل در رد درخواست‌های مخرب و مقابله با حملات تزریق دستور، عملکرد بهتری دارد. همچنین میزان توهم‌زایی و رفتار چاپلوسانه آن نسبت به Sonnet 4.6 کمتر گزارش شده است.

هرچند، این مدل هنوز از نظر رفتارهای ناهماهنگ به سطح Opus 4.8 و Claude Mythos Preview نرسیده است. در پست وبلاگی آنتروپیک آمده است: «ارزیابی‌ها نشان می‌دهند که توانایی این مدل در انجام وظایف خطرناک امنیت سایبری بسیار کمتر از مدل‌های فعلی Opus است.»

فابیان هدین، هم‌بنیان‌گذار Lovable نیز در بیانیه‌ای اعلام کرد که Claude Sonnet 5 «در رد درخواست‌های ناامن، عملکردی شفاف و پایدار دارد.»

وی تصریح کرد: «در Lovable ابزارهای قدرتمندی در اختیار میلیون‌ها سازنده قرار می‌گیرد. مدلی که بداند چه زمانی باید نه بگوید، به اندازه همان مدلی اهمیت دارد که توانایی ساختن دارد.»

در پایان، این گزارش به‌روزرسانی شده است تا مشخص شود قیمت توکن‌های خروجی پس از ۳۱ آگوست، ۱۵ دلار به ازای هر یک میلیون توکن خروجی خواهد بود.