گوگل در رویداد Google I/O 2026 از مدل جدید Gemini 3.5 Flash رونمایی کرد؛ یک مدل هوش مصنوعی سبک و جدید که برای اجرای گردشهای کاری پیچیده و چندمرحلهای با سرعت بسیار بالا طراحی شده است. این شرکت ادعا میکند که این مدل قویترین مدل عاملمحور (agentic) و کدنویسی تاکنون است. به گفته این غول فناوری مستقر در مانتین ویو، Gemini 3.5 Flash در ارزیابی کدنویسی Terminal-bench 2.1 امتیاز 76.2 درصد و در معیار عاملمحور دنیای واقعی GDPval-AA امتیاز 1656 کسب کرده است.
این عملکرد از Gemini 3.1 Pro که در 19 فوریه 2026 عرضه شد، بهتر است. گوگل این مدل را بهطور خاص برای وظایف افق بلند (long-horizon)، کدنویسی عاملمحور و هماهنگی عاملهای فرعی طراحی کرده است تا هزینه هر توکن (cost-per-token) بسیار کاهشیافتهای را برای مشتریان API سازمانی در برابر حجم کاری سنگین فراهم آورد. در زیر مقایسه جمینای 3.5 فلش با Gemini 3.1 Pro (و سایر مدلهای رقبا) آمده است:
| بنچمارک | Gemini 3.5 Flash | Gemini 3 Flash | Gemini 3.1 Pro | Claude Sonnet 4.6 | Claude Opus 4.7 | GPT-5.5 |
|---|---|---|---|---|---|---|
| Terminal-bench 2.1 | 76.2% | 58.0% | 70.3% | – | 66.1% | 78.2% |
| SWE-Bench Pro (Public) | 55.1% | 49.6% | 54.2% | – | 64.3% | 58.6% |
| MCP Atlas | 83.6% | 62.0% | 78.2% | 69.5% | 79.1% | 75.3% |
| Toolathlon | 56.5% | 49.4% | – | – | – | 55.6% |
| OSWorld-Verified | 78.4% | 65.1% | 76.2% | 72.5% | 78.0% | 78.7% |
| Finance Agent v2 | 57.9% | 42.6% | 43.0% | 51.0% | 51.5% | 51.8% |
| GDPval-AA | 1656 | 1204 | 1314 | 1676 | 1753 | 1769 |
| CharXiv Reasoning | 84.2% | 80.3% | 83.3% | 72.4% | 82.1% | 84.1% |
| MMMU-Pro | 83.6% | 81.2% | 80.5% | 74.5% | 75.2% | 81.2% |
| Blueprint-Bench 2 | 33.6% | 0.0% | 26.5% | 6.7% | 24.5% | 36.2% |
| MRCR v2 (128k) | 77.3% | 67.2% | 84.9% | 84.9% | 59.3% | 94.8% |
| MRCR v2 (1M) | 26.6% | 22.1% | 26.3% | – | – | – |
| Humanity’s Last Exam | 40.2% | 33.7% | 44.4% | 33.2% | 46.9% | 41.4% |
| ARC-AGI-2 | 72.1% | 33.6% | 77.1% | 58.3% | 75.8% | 84.6% |
گوگل اعلام کرد که Gemini 3.5 Flash از همین حالا بهصورت جهانی در دسترس همه است: در برنامه Gemini و در حالت هوش مصنوعی (AI Mode) جستجوی گوگل؛ برای توسعهدهندگان در Google Antigravity و Gemini API در Google AI Studio و Android Studio؛ و برای سازمانها در پلتفرم Gemini Enterprise Agent.