گوگل پیش از این با Nano Banana، مدل تولید تصویر که تاکنون بیش از 50 میلیارد تصویر تولید کرده است، خبرساز بود. امسال، گوگل با مدل جدید Gemini Omni سطح کار را بالاتر برده است؛ مدلی که به ادعای این غول جستجو “میتواند از هر ورودی و شروعکننده با ویدیو هر چیزی خلق کند”. به عبارت دیگر، مدل جدید به شما امکان میدهد تصاویر، صدا، ویدیو و متن را به عنوان ورودی ترکیب کنید تا ویدیوهای باکیفیتی تولید کرده و آنها را از طریق پرامپتهای مکالمهای ویرایش کنید.
Gemini Omni Flash اولین مدل در این خانواده است و گوگل در آینده از سایر انواع خروجی مانند تصویر و صدا نیز پشتیبانی خواهد کرد. در جریان Google I/O 2026، این غول جستجو چندین کار را که میتوانید با مدل جدید انجام دهید شرح داد. در حین ویرایش ویدیوها، شخصیتها، توالی صحنهها و سایر جنبههای شما ثابت میمانند و میتوانید از پرامپتهای زبان طبیعی برای افزودن یا حذف اشیاء، انتخاب زوایای دوربین متفاوت یا تغییر کامل آنها استفاده کنید.
میتوانید یک ویدیوی واقعی که ضبط کردهاید را به Omni بدهید و از آن بخواهید شخصیتها یا اشیاء جدیدی اضافه کند، یا برخی افکتهای CGI بپاشد. گوگل توضیح داد:
محیط، زاویه، سبک یا حتی جزئیات خاص را تغییر دهید، بدون اینکه هرگز رشته صحنه اصلی خود را از دست بدهید. در چرخ فلک تصاویر اسکرول کنید تا ببینید ویرایشها چگونه روی هم ساخته میشوند.
این غول جستجو خاطرنشان میکند که Omni درک شهودی از فیزیک دارد و ساختههای آن بر اساس دانش Gemini درباره تاریخ، علم و بافت فرهنگی شکل میگیرند تا واقعگرایی بصری و داستانسرایی بهبود یابد. این مدل هوش مصنوعی میتواند از پرامپتهای کوتاه، ویدیوهای توضیحی (explainer) را به همراه صداگذاری هوش مصنوعی تولید کند. میتوانید از تصاویر شخصیتها، صحنهها یا نقاشیها به عنوان ورودی استفاده کنید.
اگرچه از چندین فرمت ورودی پشتیبانی میکند، گوگل گفت که این مدل در ابتدا فقط از مرجعهای صوتی (voice references) برای ورودی صدا پشتیبانی میکند و سایر انواع صدا بعداً اضافه خواهند شد. توجه داشته باشید که تمام ویدیوهای ایجاد شده با Omni دارای واترمارک SynthID خواهند بود که میتوانید از طریق برنامه Gemini، Chrome و جستجوی گوگل تأیید کنید. همچنین میتوانید یک آواتار یا نسخه دیجیتالی از خودتان بسازید که در ویدیوهای تولید شده توسط Omni ظاهر شود، دقیقاً شبیه شما به نظر برسد و صدای شما را داشته باشد.
Gemini Omni Flash از همین حالا در برنامه Gemini و Google Flow برای کاربرانی که اشتراک Google AI Plus/Pro/Ultra دارند، در حال عرضه است. همچنین به صورت رایگان برای کاربرانی که میخواهند YouTube Shorts را میکس مجدد کنند و در برنامه YouTube Create نیز در حال عرضه میباشد. Omni همزمان با مدل جدید Gemini 3.5 Flash عرضه شده است که قویترین مدل کدنویسی گوگل تا به امروز محسوب میشود.