گوگل از مدل جدید Gemini Omni Flash پرده برداشت

۳۰ اردیبهشت ۱۴۰۵

۰ 0 زمان تقریبی مطالعه 2 دقیقه

گوگل پیش از این با Nano Banana، مدل تولید تصویر که تاکنون بیش از 50 میلیارد تصویر تولید کرده است، خبرساز بود. امسال، گوگل با مدل جدید Gemini Omni سطح کار را بالاتر برده است؛ مدلی که به ادعای این غول جستجو “می‌تواند از هر ورودی و شروع‌کننده با ویدیو هر چیزی خلق کند”. به عبارت دیگر، مدل جدید به شما امکان می‌دهد تصاویر، صدا، ویدیو و متن را به عنوان ورودی ترکیب کنید تا ویدیوهای باکیفیتی تولید کرده و آنها را از طریق پرامپت‌های مکالمه‌ای ویرایش کنید.

Gemini Omni Flash اولین مدل در این خانواده است و گوگل در آینده از سایر انواع خروجی مانند تصویر و صدا نیز پشتیبانی خواهد کرد. در جریان Google I/O 2026، این غول جستجو چندین کار را که می‌توانید با مدل جدید انجام دهید شرح داد. در حین ویرایش ویدیوها، شخصیت‌ها، توالی صحنه‌ها و سایر جنبه‌های شما ثابت می‌مانند و می‌توانید از پرامپت‌های زبان طبیعی برای افزودن یا حذف اشیاء، انتخاب زوایای دوربین متفاوت یا تغییر کامل آن‌ها استفاده کنید.

می‌توانید یک ویدیوی واقعی که ضبط کرده‌اید را به Omni بدهید و از آن بخواهید شخصیت‌ها یا اشیاء جدیدی اضافه کند، یا برخی افکت‌های CGI بپاشد. گوگل توضیح داد:

محیط، زاویه، سبک یا حتی جزئیات خاص را تغییر دهید، بدون اینکه هرگز رشته صحنه اصلی خود را از دست بدهید. در چرخ فلک تصاویر اسکرول کنید تا ببینید ویرایش‌ها چگونه روی هم ساخته می‌شوند.

این غول جستجو خاطرنشان می‌کند که Omni درک شهودی از فیزیک دارد و ساخته‌های آن بر اساس دانش Gemini درباره تاریخ، علم و بافت فرهنگی شکل می‌گیرند تا واقع‌گرایی بصری و داستان‌سرایی بهبود یابد. این مدل هوش مصنوعی می‌تواند از پرامپت‌های کوتاه، ویدیوهای توضیحی (explainer) را به همراه صداگذاری هوش مصنوعی تولید کند. می‌توانید از تصاویر شخصیت‌ها، صحنه‌ها یا نقاشی‌ها به عنوان ورودی استفاده کنید.

اگرچه از چندین فرمت ورودی پشتیبانی می‌کند، گوگل گفت که این مدل در ابتدا فقط از مرجع‌های صوتی (voice references) برای ورودی صدا پشتیبانی می‌کند و سایر انواع صدا بعداً اضافه خواهند شد. توجه داشته باشید که تمام ویدیوهای ایجاد شده با Omni دارای واترمارک SynthID خواهند بود که می‌توانید از طریق برنامه Gemini، Chrome و جستجوی گوگل تأیید کنید. همچنین می‌توانید یک آواتار یا نسخه دیجیتالی از خودتان بسازید که در ویدیوهای تولید شده توسط Omni ظاهر شود، دقیقاً شبیه شما به نظر برسد و صدای شما را داشته باشد.

Gemini Omni Flash از همین حالا در برنامه Gemini و Google Flow برای کاربرانی که اشتراک Google AI Plus/Pro/Ultra دارند، در حال عرضه است. همچنین به صورت رایگان برای کاربرانی که می‌خواهند YouTube Shorts را میکس مجدد کنند و در برنامه YouTube Create نیز در حال عرضه می‌باشد. Omni همزمان با مدل جدید Gemini 3.5 Flash عرضه شده است که قوی‌ترین مدل کدنویسی گوگل تا به امروز محسوب می‌شود.

۳۰ اردیبهشت ۱۴۰۵

۰ 0 زمان تقریبی مطالعه 2 دقیقه

گوگل از مدل جدید Gemini Omni Flash پرده برداشت

دیدگاهتان را بنویسید لغو پاسخ

رونمایی از ریلمی Narzo 100x با نمایشگر 144 هرتز و باتری 8000 میلی‌آمپر ساعتی

Canva Code 2.0 فرآیند Vibe Coding را برای همگان بسیار کم‌دغدغه‌تر کرد

شیائومی از نخستین پاوربانک مطابق با استاندارد ملی ایمنی چین رونمایی کرد

معرفی روتر 5G جدید ZTE G5 Max را با پشتیبانی از وای فای 7 و تراشه اسنپدراگون X75

سامسونگ از فناوری نمایشگر Flex Titanium برای نسل بعدی گلکسی های تاشو رونمایی کرد

عرضه نسخه کندتر SSD سامسونگ 990 پرو با قیمت بالاتز از نسخه اصلی

بخش تصاویر جستجوی گوگل تغییر چهره می‌دهد

شیائومی از سری ردمی نوت 17 پرده برداری کرد

نوشته های مشابه

ابزار جستجوی جدید لینکدین: یافتن شغل ایده‌آل با کمک هوش مصنوعی

گوگل تأیید کرد: جایگزینی کامل Assistant با Gemini در سال 2026 انجام می‌شود

فروشگاه اپلیکیشن ChatGPT راه‌اندازی شد

گوگل Photos حالا 6 قابلیت جدید مبتنی بر هوش مصنوعی دارد

دیدگاهتان را بنویسید لغو پاسخ