فهرست سایت
هوش مصنوعی نوشته شده در تاریخ ۳۰ اردیبهشت ۱۴۰۵ توسط ادمین

گوگل Gemini 3.5 Flash: قوی‌ترین مدل کدنویسی خود تا به امروز

گوگل Gemini 3.5 Flash: قوی‌ترین مدل کدنویسی خود تا به امروز

گوگل در رویداد Google I/O 2026 از مدل جدید Gemini 3.5 Flash رونمایی کرد؛ یک مدل هوش مصنوعی سبک و جدید که برای اجرای گردش‌های کاری پیچیده و چندمرحله‌ای با سرعت بسیار بالا طراحی شده است. این شرکت ادعا می‌کند که این مدل قوی‌ترین مدل عامل‌محور (agentic) و کدنویسی تاکنون است. به گفته این غول فناوری مستقر در مانتین ویو، Gemini 3.5 Flash در ارزیابی کدنویسی Terminal-bench 2.1 امتیاز 76.2 درصد و در معیار عامل‌محور دنیای واقعی GDPval-AA امتیاز 1656 کسب کرده است.

این عملکرد از Gemini 3.1 Pro که در 19 فوریه 2026 عرضه شد، بهتر است. گوگل این مدل را به‌طور خاص برای وظایف افق بلند (long-horizon)، کدنویسی عامل‌محور و هماهنگی عامل‌های فرعی طراحی کرده است تا هزینه هر توکن (cost-per-token) بسیار کاهش‌یافته‌ای را برای مشتریان API سازمانی در برابر حجم کاری سنگین فراهم آورد. در زیر مقایسه جمینای 3.5 فلش با Gemini 3.1 Pro (و سایر مدل‌های رقبا) آمده است:

بنچمارک Gemini 3.5 Flash Gemini 3 Flash Gemini 3.1 Pro Claude Sonnet 4.6 Claude Opus 4.7 GPT-5.5
Terminal-bench 2.1 76.2% 58.0% 70.3% 66.1% 78.2%
SWE-Bench Pro (Public) 55.1% 49.6% 54.2% 64.3% 58.6%
MCP Atlas 83.6% 62.0% 78.2% 69.5% 79.1% 75.3%
Toolathlon 56.5% 49.4% 55.6%
OSWorld-Verified 78.4% 65.1% 76.2% 72.5% 78.0% 78.7%
Finance Agent v2 57.9% 42.6% 43.0% 51.0% 51.5% 51.8%
GDPval-AA 1656 1204 1314 1676 1753 1769
CharXiv Reasoning 84.2% 80.3% 83.3% 72.4% 82.1% 84.1%
MMMU-Pro 83.6% 81.2% 80.5% 74.5% 75.2% 81.2%
Blueprint-Bench 2 33.6% 0.0% 26.5% 6.7% 24.5% 36.2%
MRCR v2 (128k) 77.3% 67.2% 84.9% 84.9% 59.3% 94.8%
MRCR v2 (1M) 26.6% 22.1% 26.3%
Humanity’s Last Exam 40.2% 33.7% 44.4% 33.2% 46.9% 41.4%
ARC-AGI-2 72.1% 33.6% 77.1% 58.3% 75.8% 84.6%

گوگل اعلام کرد که Gemini 3.5 Flash از همین حالا به‌صورت جهانی در دسترس همه است: در برنامه Gemini و در حالت هوش مصنوعی (AI Mode) جستجوی گوگل؛ برای توسعه‌دهندگان در Google Antigravity و Gemini API در Google AI Studio و Android Studio؛ و برای سازمان‌ها در پلتفرم Gemini Enterprise Agent.

لینک کوتاه

ارسال دیدگاه

پاسخ به (لغو پاسخ)