Generative Musik, auch mit deutschen Texten
Lyria 3: Google Gemini generiert jetzt auch Songs
Google erweitert seine KI-Plattform Gemini um ein Werkzeug zur automatisierten Musikerstellung. Mit dem neuen Modell Lyria 3 können Nutzer kurze Musikstücke erzeugen, die auf Texteingaben oder hochgeladenen Bildern und Videos basieren.
Die generierten Tracks haben eine Länge von rund 30 Sekunden und sind ab sofort auch auf Deutsch verfügbar. Die Funktion ist direkt in Gemini integriert und richtet sich an Nutzer, die ohne musikalische Vorkenntnisse eigene Klangideen umsetzen möchten.
Genre, Stimmung und Tempo per Prompt
Lyria 3 verarbeitet beschreibende Texteingaben, die Angaben zu Genre, Stimmung, Tempo oder Gesang enthalten können. Auf dieser Basis erstellt das System sowohl Instrumentalstücke als auch Songs mit automatisch generierten Texten.
Zusätzlich lassen sich Fotos oder kurze Videos hochladen, deren Bildinhalte als Ausgangspunkt für die musikalische Gestaltung dienen. Gemini analysiert dabei Farben, Motive und Stimmung des Materials und versucht diese Eindrücke anschließend auf Rhythmus und Klangbild zu übertragen.
Die generierten Stücke werden jeweils mit einem automatisch erzeugten Coverbild versehen und können direkt gespeichert oder geteilt werden.
Mit Wasserzeichen und Künstlerschutz
Neben der Nutzung in Gemini ist Lyria 3 auch in das YouTube-Tool Dream Track eingebunden. Dort können Creator die Musikgenerierung für kurze Videos einsetzen, etwa um Hintergrundmusik oder gesungene Passagen für Shorts zu erstellen. Google will so die Anpassung von Tonspuren an visuelle Inhalte erleichtern, ohne auf externe Musikbibliotheken angewiesen zu sein.
Alle mit Lyria 3 erzeugten Audiodateien enthalten ein nicht hörbares Wasserzeichen. Dieses Kennzeichen dient dazu, KI-generierte Inhalte später identifizieren zu können. Zusätzlich lässt sich in Gemini prüfen, ob eine hochgeladene Audiodatei mit Google-KI erstellt wurde.
Google betont, dass das System nicht auf die Nachahmung konkreter Künstler ausgelegt ist. Stilangaben werden allgemein interpretiert und durch Filter ergänzt, die eine zu starke Nähe zu bestehenden Werken vermeiden sollen.

Angst essen Seele auf…
KI Musik ist höchstens, was für Menschen, die Tapeten Musik hören/brauchen. Hauptsache irgendwas dudelt im Hintergrund. Ansonsten ist das komplett seelenloses Geseier.
Du fängst an das Lied zu hören. Klingt wie ein normales Lied. Text normal. Melodie normal.
Dann bekommst du das Gefühl, dass dir das Lied irgendwie bekannt vorkommt aber irgendwie auch nicht.
Zuletzt wirst du feststellen, dass irgendwas an dem Lied fehlt. Du kannst aber nicht genau sagen was. Es fühlt sich einfach unvollständig an.
Das, was du hier schreibst er erinnert mich eher an die möchtegern Künstler der Neuzeit :D
1+
Das gilt absolut nicht für das Lied Papaoutai – Afro Soul. So viel besser als das Original!
Ohje, das Beispiel im Artikel sagt ja schon alles. Sollen sie KI Musik doch einfach beerdigen. Last den Künstlern ihre Bühne. Seitdem die Nerds die Oberhand gewinnen, ist die Welt nicht besser geworden. Die Nerds haben alle zu Nerds gemacht.
KI als nützliches Werkzeug: Ja, gerne! KI als Kunstschaffender: Nein danke.
Man versucht doch gerade, Synchronsprecher zu „überreden“, ihre Stimme der KI zum Training vorzuwerfen.
Vielleicht demnächst in jedem Plattenvertrag die gleiche Forderung?
Da wartet man irgendwie auf den grellen Blitz mit dem jemand aus dem 28. Jahrhundert zurück kommt und verhindern will, was derzeit beginnt…….;-)
Sehe ich anders. Bzw. höre ich anders. Ich generiere mit Suno Musik, die mir gefällt, statt stundenlang Songs auf Apple Music zu suchen, um eine Handvoll zu finden. Wenn man sich mit den Tools beschäftigt, kann man wahre Wunder vollbringen. Bin immer wieder geflashed.
Absolut korrekt, Suno ist top und die Musik hat Seele. Liebe meine Songs. Man kann es von beiden Seiten sehen und erleben, jedem das seine.