Mi történt
A CNET AI Atlas cikke szerint a Google februárban elindította a Lyria 3-at, a DeepMind legújabb, „legfejlettebb” zenei generáló modelljét, majd márciusban jött a Lyria 3 Pro, ami a cég állítása szerint még jobb képességeket hoz. A lépés egyértelműen beleillik abba, hogy a virális AI-dalok világát eddig olyan szereplők uralták, mint a Suno és az Udio — a Google most ebből a piacból is kér.A Lyria 3-at a Google multimodális modellként írja le. Gondolj rá úgy, mint egy „többféle bemenetet értő” zeneszerzőre: nem csak szöveget tudsz megadni, hanem képet vagy hangot is feltölthetsz, és a modell ezek hangulatához, „időzítéséhez” illő zenét komponál. A cikk kiemeli, hogy a cél a jobb hangminőség és a következetesebb zenei szerkezet: természetesebb átmenetek hangról hangra, és stabilabb dallam–ritmus–stílus a track elejétől a végéig.
Elérhetőségben is nagyot nyit a Google: a Lyria 3 a Gemini-ben benne van a Google AI csomagjaiban (a fizetős csomagoknál magasabb limitekkel, és a Pro változatnál is). A Lyria 3 Pro több felületen is megjelenik, többek közt a Vertex AI-ban (Google Cloud), a Google AI Studio-ban, a Gemini API-ban, a Google Vids-ben, a Gemini appban, valamint a ProducerAI-ban.
A ProducerAI-t a Google (a cikk szerint) nem „egykattintásos dalgyárként” pozicionálja, hanem kreatív partnerként: nem csak komplett számokat tudsz generálni, hanem külön elemeket is — például beatet, melódiát vagy hookot —, amiket aztán tovább formálhatsz.
Miért fontos
Az AI-zene eddig sokaknak a „vicces, virális dal” kategória volt, de a Google láthatóan a használható, tartalomgyártásba illeszthető háttérzenére és a fejlesztői integrációra is rámegy. A cikkben idézett John von Seggern (Futureproof Music School) szerint ez különösen jól jöhet olyan helyzetekben, mint egy YouTube-videó alá „átlagos, de működő” zenei alap — vagyis nem feltétlen a slágergyártásról van szó, hanem a gyors, rugalmas zenei kitöltésről.Technikai oldalról a „strukturáltabb dal” ígérete azért érdekes, mert a generált zenéknél gyakori probléma, hogy a track „szétesik” időben: a hangulat, a ritmus vagy a hangszerelés elcsúszik. A Lyria 3 Pro-nál a Google kifejezetten említi a dalformák jobb kezelését (intro, verzék, refrén, bridge, outro), ami praktikusabbá teheti a modellt azoknak, akik nem csak 10–20 másodperces loopot akarnak.
Mire figyelj
- Ne csak kulcsszavakat adj meg: a Google a cikk szerint egy konkrét prompt-keretet javasol: [műfaj és stílus] + [hangulat] + [hangszerelés] + [tempó/ritmus] + [énekstílus és nyelv] + [dalszöveg]. Ez olyan, mint egy brief egy stúdiózenésznek: minél tisztább a „megrendelés”, annál kisebb a meglepetés.
- Iterálás vs. újrakezdés: a Lyria 3 Pro támogat „multiturn” szerkesztést (beszélgetésben finomítasz), de a Google szerint ha rossz irányba megy, gyakran egyszerűbb újrakezdeni, mint a végtelenségig javítgatni.
- Nyelvi korlátok: a Lyria 3 jelenleg 8 nyelven támogat éneket és dalszöveget (angol, spanyol, francia, német, portugál, hindi, japán, koreai). A modell képes arra is, hogy az instrukciót például angolul adod meg, de a dalt másik támogatott nyelven adja elő.
- Kimeneti forma és cél: a Gemini API-ban a cikk szerint a „clip” modellek 30 másodperces, 48 kHz-es sztereó audiót generálnak. Ez tipikusan tartalomgyártásra, demóra, vázlatra ideális — hosszabb, szerkesztett produkcióhoz már a Pro képességei és a munkafolyamat számít.
