Ha eddig a generatív AI-t szöveghez és képekhez használtad, a Google szerint ideje zenére is ugyanígy „promptolni”. A Lyria 3 lényege: pár sor leírásból (vagy akár egy képből/hangmintából) pillanatok alatt kapsz egy használható zenei alapot.

Mi történt

A CNET AI Atlas cikke szerint a Google februárban elindította a Lyria 3-at, a DeepMind legújabb, „legfejlettebb” zenei generáló modelljét, majd márciusban jött a Lyria 3 Pro, ami a cég állítása szerint még jobb képességeket hoz. A lépés egyértelműen beleillik abba, hogy a virális AI-dalok világát eddig olyan szereplők uralták, mint a Suno és az Udio — a Google most ebből a piacból is kér.

A Lyria 3-at a Google multimodális modellként írja le. Gondolj rá úgy, mint egy „többféle bemenetet értő” zeneszerzőre: nem csak szöveget tudsz megadni, hanem képet vagy hangot is feltölthetsz, és a modell ezek hangulatához, „időzítéséhez” illő zenét komponál. A cikk kiemeli, hogy a cél a jobb hangminőség és a következetesebb zenei szerkezet: természetesebb átmenetek hangról hangra, és stabilabb dallam–ritmus–stílus a track elejétől a végéig.

Elérhetőségben is nagyot nyit a Google: a Lyria 3 a Gemini-ben benne van a Google AI csomagjaiban (a fizetős csomagoknál magasabb limitekkel, és a Pro változatnál is). A Lyria 3 Pro több felületen is megjelenik, többek közt a Vertex AI-ban (Google Cloud), a Google AI Studio-ban, a Gemini API-ban, a Google Vids-ben, a Gemini appban, valamint a ProducerAI-ban.

A ProducerAI-t a Google (a cikk szerint) nem „egykattintásos dalgyárként” pozicionálja, hanem kreatív partnerként: nem csak komplett számokat tudsz generálni, hanem külön elemeket is — például beatet, melódiát vagy hookot —, amiket aztán tovább formálhatsz.

Miért fontos

Az AI-zene eddig sokaknak a „vicces, virális dal” kategória volt, de a Google láthatóan a használható, tartalomgyártásba illeszthető háttérzenére és a fejlesztői integrációra is rámegy. A cikkben idézett John von Seggern (Futureproof Music School) szerint ez különösen jól jöhet olyan helyzetekben, mint egy YouTube-videó alá „átlagos, de működő” zenei alap — vagyis nem feltétlen a slágergyártásról van szó, hanem a gyors, rugalmas zenei kitöltésről.

Technikai oldalról a „strukturáltabb dal” ígérete azért érdekes, mert a generált zenéknél gyakori probléma, hogy a track „szétesik” időben: a hangulat, a ritmus vagy a hangszerelés elcsúszik. A Lyria 3 Pro-nál a Google kifejezetten említi a dalformák jobb kezelését (intro, verzék, refrén, bridge, outro), ami praktikusabbá teheti a modellt azoknak, akik nem csak 10–20 másodperces loopot akarnak.

Mire figyelj

  1. Ne csak kulcsszavakat adj meg: a Google a cikk szerint egy konkrét prompt-keretet javasol: [műfaj és stílus] + [hangulat] + [hangszerelés] + [tempó/ritmus] + [énekstílus és nyelv] + [dalszöveg]. Ez olyan, mint egy brief egy stúdiózenésznek: minél tisztább a „megrendelés”, annál kisebb a meglepetés.
  2. Iterálás vs. újrakezdés: a Lyria 3 Pro támogat „multiturn” szerkesztést (beszélgetésben finomítasz), de a Google szerint ha rossz irányba megy, gyakran egyszerűbb újrakezdeni, mint a végtelenségig javítgatni.
  3. Nyelvi korlátok: a Lyria 3 jelenleg 8 nyelven támogat éneket és dalszöveget (angol, spanyol, francia, német, portugál, hindi, japán, koreai). A modell képes arra is, hogy az instrukciót például angolul adod meg, de a dalt másik támogatott nyelven adja elő.
  4. Kimeneti forma és cél: a Gemini API-ban a cikk szerint a „clip” modellek 30 másodperces, 48 kHz-es sztereó audiót generálnak. Ez tipikusan tartalomgyártásra, demóra, vázlatra ideális — hosszabb, szerkesztett produkcióhoz már a Pro képességei és a munkafolyamat számít.

Forrásmegjelölés

CNET AI Atlas – What Is Lyria 3? Everything to Know About Google's AI Music Generator (https://www.cnet.com/tech/services-and-software/lyria-3-google-ai-music-generator/)