گوگل اخیراً قابلیت جدیدی را برای Gemini AI معرفی کرده که به کاربران اجازه میدهد عکسها را به کلیپهای ویدیویی تبدیل کنند. این قابلیت جدید با مدل ویدیویی Veo 3 گوگل قدرت گرفته و میتواند تصاویر مرجع را به ویدیوهای هشتثانیهای با صداهای تولیدشده با هوش مصنوعی تبدیل کند (از جمله افکتهای پسزمینه، صداهای محیطی و گفتار). به گفته گوگل، این بهروزرسانی Gemini اکنون برای مشترکین Ultra و Pro در برخی مناطق خاص فعال شده است.
این قابلیت ابتدا از طریق وب در دسترس قرار گرفته و طی هفته روی دستگاههای موبایل نیز عرضه خواهد شد. کاربران Gemini میتوانند از طریق نوار ابزار در قسمت وارد کردن درخواست، گزینه “video” را انتخاب کرده و با آپلود عکس و ارائه توضیح متنی درباره نحوه حرکت تصویر، این قابلیت را فعال کنند. همچنین امکان ارائه توضیحات صوتی برای دیالوگ، افکتهای صوتی و نویز محیطی وجود دارد. گوگل میگوید این صداها با تصویر “کاملاً هماهنگ” خواهند بود.
ویدیوهای نهایی بهصورت فایل MP4 با وضوح 720p و نسبت تصویر افقی 16:9 ارائه میشوند. قابلیتی مشابه پیشتر در ابزار تولید فیلم Flow معرفی شده بود (ابزاری که گوگل در ماه مارس رونمایی کرد) اما اکنون کاربران Gemini میتوانند عکسهای خود را بدون نیاز به اپلیکیشن دیگر متحرکسازی کنند. گوگل همچنین اعلام کرد که Flow امروز در “75 کشور جدید” نیز در کنار عرضه قابلیت ویدیوی جدید Gemini راهاندازی میشود.