گوگل در کنفرانس I/O 2025 از مدل استدلالی جدید Deep Think برای Gemini 2.5 Pro رونمایی کرد. این مدل با استفاده از جدیدترین تحقیقات پیشرفته، توانایی بررسی چندین فرضیه پیش از ارائه پاسخ را دارد. به گفته دمیس حسابیس، مدیرعامل DeepMind، این فناوری در آزمونهای المپیاد ریاضی ایالات متحده 2025 عملکرد چشمگیری داشته است.
با این حال، گوگل قصد دارد پیش از انتشار گسترده، ارزیابیهای ایمنی بیشتری انجام دهد و از متخصصان ایمنی بازخورد دریافت کند. به همین دلیل، Deep Think ابتدا از طریق Gemini API در اختیار آزمایشکنندگان منتخب قرار میگیرد تا نظرات آنها جمعآوری شود. علاوه بر این، گوگل نسخه بهینهشده Gemini 2.5 Flash را معرفی کرده که سرعت و کارایی بیشتری دارد.
این مدل جدید مصرف توکن کمتری دارد و در آزمونهای استدلال، چندوجهی بودن، کدنویسی و پردازش متنهای طولانی امتیاز بالاتری نسبت به نسخه قبلی کسب کرده است. نسخه 2.5 Flash از اوایل ژوئن بهصورت عمومی در دسترس خواهد بود، اما هماکنون از طریق Google AI Studio برای توسعهدهندگان، Vertex AI برای مشتریان سازمانی و اپلیکیشن Gemini برای کاربران قابل استفاده است.
گوگل همچنین اعلام کرد که ویژگی “بودجه تفکر” که در 2.5 Flash معرفی شده بود، اکنون به 2.5 Pro نیز افزوده خواهد شد. این قابلیت به کاربران امکان میدهد تعادل بین مصرف توکن، دقت و سرعت خروجی را تنظیم کنند. در کنار این بهروزرسانیها، گوگل پروژه Mariner را نیز به Gemini API و Vertex AI اضافه کرده است.
Mariner مجموعهای از عاملهای هوش مصنوعی است که میتوانند صفحات وب را بررسی کرده و وظایف کاربران را انجام دهند. این قابلیت در تابستان امسال بهصورت گستردهتر عرضه خواهد شد تا توسعهدهندگان بتوانند با آن آزمایش کنند. گوگل همچنین پیشنمایشهای جدیدی برای تبدیل متن به گفتار در مدلهای 2.5 Pro و 2.5 Flash منتشر کرده است که از دو صدای مختلف در 44 زبان پشتیبانی میکند.