شرکت Anthropic بهتازگی مدل زبانی جدید خود با نام Claude Sonnet 4.5 را معرفی کرده و مدعی است که این مدل، بهترین ابزار کدنویسی در جهان است. این مدل بهطور خاص برای ساخت عاملهای پیچیده طراحی شده و در آزمون SWE-bench Verified که توانایی مدلها در توسعه نرمافزارهای واقعی را میسنجد، موفق به کسب امتیاز 82 nvwn شده است؛ رکوردی که در حال حاضر بالاترین در نوع خود محسوب میشود.
عملکرد در بنچمارکهای تخصصی
در آزمایش داخلی، Claude Sonnet 4.5 توانست بیش از 30 ساعت بهصورت پیوسته در حالت عامل (Agent Mode) اجرا شود. در آزمون OSWorld که توانایی مدلها در انجام وظایف رایانهای واقعی را بررسی میکند، این مدل امتیاز 61.4 درصد کسب کرد؛ جهشی چشمگیر نسبت به نسخه قبلی Sonnet 4 که تنها 42.2 درصد امتیاز داشت. همچنین در آزمون Terminal-Bench، Sonnet 4.5 با امتیاز 50 درصد از مدلهای GPT-5 شرکت OpenAI و Gemini 2.5 Pro شرکت گوگل پیشی گرفت.
با این حال، در بنچمارکهای عمومی هوش مصنوعی مانند GPQA Diamond، MMMLU و MMMU، مدل جدید Claude Sonnet 4.5 هنوز از GPT-5 و Gemini 2.5 Pro عقبتر است. این تفاوت نشان میدهد که تمرکز Anthropic در توسعه این مدل بیشتر بر روی وظایف مرتبط با کدنویسی و توسعه نرمافزار بوده است.
دسترسی و قیمتگذاری
Claude Sonnet 4.5 از طریق API رسمی Anthropic با نام claude-sonnet-4-5 در دسترس توسعهدهندگان قرار گرفته و قیمت آن مشابه نسخه قبلی است: 3 دلار برای هر میلیون توکن ورودی و 15 دلار برای هر میلیون توکن خروجی. Anthropic توصیه میکند که کاربران برای تمام کاربردها به نسخه 4.5 ارتقاء دهند، زیرا عملکرد آن بهطور قابلتوجهی بهبود یافته است.
ادغام با GitHub Copilot و Amazon Bedrock
مایکروسافت نیز اعلام کرده که Claude Sonnet 4.5 اکنون در GitHub Copilot برای کاربران نسخههای Pro، Pro+، Business و Enterprise قابل استفاده است. تیم GitHub تأکید کرده که این مدل جدید در زمینه هماهنگی ابزارها، ویرایش زمینهای و قابلیتهای تخصصی دامنهای، پیشرفت چشمگیری داشته است. همچنین کاربران نسخههای Free، Pro و Pro+ میتوانند با وارد کردن کلید API خود در Visual Studio Code به این مدل دسترسی پیدا کنند. علاوه بر این، Claude Sonnet 4.5 از طریق سرویس Amazon Bedrock نیز در دسترس توسعهدهندگان قرار گرفته است؛ بستری مدیریتشده که مدلهای پایه را از طریق API ارائه میدهد.