فهرست سایت
هوش مصنوعی نوشته شده در تاریخ ۳۰ اردیبهشت ۱۴۰۵ توسط ادمین

گوگل از مدل جدید Gemini Omni Flash پرده برداشت

گوگل از مدل جدید Gemini Omni Flash پرده برداشت

گوگل پیش از این با Nano Banana، مدل تولید تصویر که تاکنون بیش از 50 میلیارد تصویر تولید کرده است، خبرساز بود. امسال، گوگل با مدل جدید Gemini Omni سطح کار را بالاتر برده است؛ مدلی که به ادعای این غول جستجو “می‌تواند از هر ورودی و شروع‌کننده با ویدیو هر چیزی خلق کند”. به عبارت دیگر، مدل جدید به شما امکان می‌دهد تصاویر، صدا، ویدیو و متن را به عنوان ورودی ترکیب کنید تا ویدیوهای باکیفیتی تولید کرده و آنها را از طریق پرامپت‌های مکالمه‌ای ویرایش کنید.

Gemini Omni Flash اولین مدل در این خانواده است و گوگل در آینده از سایر انواع خروجی مانند تصویر و صدا نیز پشتیبانی خواهد کرد. در جریان Google I/O 2026، این غول جستجو چندین کار را که می‌توانید با مدل جدید انجام دهید شرح داد. در حین ویرایش ویدیوها، شخصیت‌ها، توالی صحنه‌ها و سایر جنبه‌های شما ثابت می‌مانند و می‌توانید از پرامپت‌های زبان طبیعی برای افزودن یا حذف اشیاء، انتخاب زوایای دوربین متفاوت یا تغییر کامل آن‌ها استفاده کنید.

می‌توانید یک ویدیوی واقعی که ضبط کرده‌اید را به Omni بدهید و از آن بخواهید شخصیت‌ها یا اشیاء جدیدی اضافه کند، یا برخی افکت‌های CGI بپاشد. گوگل توضیح داد:

محیط، زاویه، سبک یا حتی جزئیات خاص را تغییر دهید، بدون اینکه هرگز رشته صحنه اصلی خود را از دست بدهید. در چرخ فلک تصاویر اسکرول کنید تا ببینید ویرایش‌ها چگونه روی هم ساخته می‌شوند.

این غول جستجو خاطرنشان می‌کند که Omni درک شهودی از فیزیک دارد و ساخته‌های آن بر اساس دانش Gemini درباره تاریخ، علم و بافت فرهنگی شکل می‌گیرند تا واقع‌گرایی بصری و داستان‌سرایی بهبود یابد. این مدل هوش مصنوعی می‌تواند از پرامپت‌های کوتاه، ویدیوهای توضیحی (explainer) را به همراه صداگذاری هوش مصنوعی تولید کند. می‌توانید از تصاویر شخصیت‌ها، صحنه‌ها یا نقاشی‌ها به عنوان ورودی استفاده کنید.

اگرچه از چندین فرمت ورودی پشتیبانی می‌کند، گوگل گفت که این مدل در ابتدا فقط از مرجع‌های صوتی (voice references) برای ورودی صدا پشتیبانی می‌کند و سایر انواع صدا بعداً اضافه خواهند شد. توجه داشته باشید که تمام ویدیوهای ایجاد شده با Omni دارای واترمارک SynthID خواهند بود که می‌توانید از طریق برنامه Gemini، Chrome و جستجوی گوگل تأیید کنید. همچنین می‌توانید یک آواتار یا نسخه دیجیتالی از خودتان بسازید که در ویدیوهای تولید شده توسط Omni ظاهر شود، دقیقاً شبیه شما به نظر برسد و صدای شما را داشته باشد.

Gemini Omni Flash از همین حالا در برنامه Gemini و Google Flow برای کاربرانی که اشتراک Google AI Plus/Pro/Ultra دارند، در حال عرضه است. همچنین به صورت رایگان برای کاربرانی که می‌خواهند YouTube Shorts را میکس مجدد کنند و در برنامه YouTube Create نیز در حال عرضه می‌باشد. Omni همزمان با مدل جدید Gemini 3.5 Flash عرضه شده است که قوی‌ترین مدل کدنویسی گوگل تا به امروز محسوب می‌شود.

لینک کوتاه

ارسال دیدگاه

پاسخ به (لغو پاسخ)