گوگل اعلام کرده است که با استفاده از مدل جدید Lyria 3، کاربران Gemini قادر خواهند بود بر اساس یک دستور متنی، قطعات موسیقی 30 ثانیهای تولید کنند یا یک قطعه موجود را به دلخواه خود ریمیکس کنند. این مدل جدید بر قابلیت قبلی Gemini در تولید متن، تصویر و ویدیو بنا شده است و همچنین در ویژگی “Dream Track” یوتیوب نیز در دسترس خواهد بود، جایی که میتوان از آن برای تولید آهنگهای پسزمینه (بکینگ ترک) برای ویدیوهای کوتاه (Shorts) استفاده کرد.
مانند برخی دیگر از ابزارهای تولید موسیقی، برای دریافت نتایج قابل قبول از Gemini نیازی به جزئیات زیاد در دستور نیست. نمونه دستور گوگل این است: “a comical R&B slow jam about a sock finding their match”. اما پس از کار با Lyria 3، میتوانید در صورت تمایل، در مورد اجزای مختلف یک قطعه، مانند تغییر تمپو یا سبک درامنوازی، بسیار جزئیتر عمل کنید. جمنای علاوه بر متن، میتواند بر اساس یک عکس یا ویدیو نیز موسیقی تولید کند و قطعات تولیدشده میتوانند با طرح جلدی که توسط مدل تصویری نانو بانانا (Nano Banana) گوگل ایجاد شده است، همراه شوند.
گوگل میگوید Lyria 3 در مقایسه با مدلهای قبلی تولید صدا، در توانایی ساخت قطعات “واقعیتر و از نظر موسیقی پیچیدهتر”، دادن کنترل بیشتر به کاربران بر اجزای جداگانه یک آهنگ و تولید خودکار متن ترانه، بهبود یافته است. خروجی جمنای در حال حاضر به کلیپهای 30 ثانیهای محدود است، اما با توجه به ویدیوی تبلیغاتی گوگل که این قابلیت را نشان میدهد، تصور اینکه این کلیپها طولانیتر شوند یا این مدل در برنامههای دیگری مانند پیامرسان گوگل (Google Messages) ادغام شود، کار دشواری نیست.
مانند سایر خروجیهای تولیدشده توسط هوش مصنوعی جمنای، آهنگهای ساختهشده با Lyria 3 نیز با واترمارک SynthID گوگل نشانهگذاری میشوند، بنابراین نمیتوان به این راحتی یک کلیپ تولیدشده توسط Gemini را بهعنوان اثر انسانی جا زد. گوگل عرضه ابزار شناسایی محتوای تولیدشده توسط هوش مصنوعی خود به نام SynthID Detector را در کنفرانس Google I/O 2025 آغاز کرد.
اگر کنجکاو هستید که خودتان Lyria 3 را امتحان کنید، گوگل میگوید از امروز میتوانید در جمنای درخواست ساخت قطعه موسیقی دهید، به شرطی که 18 سال یا بیشتر سن داشته باشید و به یکی از زبانهای انگلیسی، اسپانیایی، آلمانی، فرانسوی، هندی، ژاپنی، کرهای یا پرتغالی صحبت کنید.