Generative Musik, auch mit deutschen Texten
Lyria 3: Google Gemini generiert jetzt auch Songs
Google erweitert seine KI-Plattform Gemini um ein Werkzeug zur automatisierten Musikerstellung. Mit dem neuen Modell Lyria 3 können Nutzer kurze Musikstücke erzeugen, die auf Texteingaben oder hochgeladenen Bildern und Videos basieren.
Die generierten Tracks haben eine Länge von rund 30 Sekunden und sind ab sofort auch auf Deutsch verfügbar. Die Funktion ist direkt in Gemini integriert und richtet sich an Nutzer, die ohne musikalische Vorkenntnisse eigene Klangideen umsetzen möchten.
Genre, Stimmung und Tempo per Prompt
Lyria 3 verarbeitet beschreibende Texteingaben, die Angaben zu Genre, Stimmung, Tempo oder Gesang enthalten können. Auf dieser Basis erstellt das System sowohl Instrumentalstücke als auch Songs mit automatisch generierten Texten.
Zusätzlich lassen sich Fotos oder kurze Videos hochladen, deren Bildinhalte als Ausgangspunkt für die musikalische Gestaltung dienen. Gemini analysiert dabei Farben, Motive und Stimmung des Materials und versucht diese Eindrücke anschließend auf Rhythmus und Klangbild zu übertragen.
Die generierten Stücke werden jeweils mit einem automatisch erzeugten Coverbild versehen und können direkt gespeichert oder geteilt werden.
Mit Wasserzeichen und Künstlerschutz
Neben der Nutzung in Gemini ist Lyria 3 auch in das YouTube-Tool Dream Track eingebunden. Dort können Creator die Musikgenerierung für kurze Videos einsetzen, etwa um Hintergrundmusik oder gesungene Passagen für Shorts zu erstellen. Google will so die Anpassung von Tonspuren an visuelle Inhalte erleichtern, ohne auf externe Musikbibliotheken angewiesen zu sein.
Alle mit Lyria 3 erzeugten Audiodateien enthalten ein nicht hörbares Wasserzeichen. Dieses Kennzeichen dient dazu, KI-generierte Inhalte später identifizieren zu können. Zusätzlich lässt sich in Gemini prüfen, ob eine hochgeladene Audiodatei mit Google-KI erstellt wurde.
Google betont, dass das System nicht auf die Nachahmung konkreter Künstler ausgelegt ist. Stilangaben werden allgemein interpretiert und durch Filter ergänzt, die eine zu starke Nähe zu bestehenden Werken vermeiden sollen.

Angst essen Seele auf…
KI Musik ist höchstens, was für Menschen, die Tapeten Musik hören/brauchen. Hauptsache irgendwas dudelt im Hintergrund. Ansonsten ist das komplett seelenloses Geseier.
Du fängst an das Lied zu hören. Klingt wie ein normales Lied. Text normal. Melodie normal.
Dann bekommst du das Gefühl, dass dir das Lied irgendwie bekannt vorkommt aber irgendwie auch nicht.
Zuletzt wirst du feststellen, dass irgendwas an dem Lied fehlt. Du kannst aber nicht genau sagen was. Es fühlt sich einfach unvollständig an.
Das, was du hier schreibst er erinnert mich eher an die möchtegern Künstler der Neuzeit :D
1+
Das gilt absolut nicht für das Lied Papaoutai – Afro Soul. So viel besser als das Original!
Bist du Künstler?
Ach komm, die wenigsten achten bei Musik auf deren Intention oder Grundlage… Texte werden selbst Jahrzehnte später nicht verstanden… normal produzierte Musik ist nicht automatisch besser.
Ohje, das Beispiel im Artikel sagt ja schon alles. Sollen sie KI Musik doch einfach beerdigen. Last den Künstlern ihre Bühne. Seitdem die Nerds die Oberhand gewinnen, ist die Welt nicht besser geworden. Die Nerds haben alle zu Nerds gemacht.
Wie abfällig du sprichst. Da merkt man das du dich für etwas besseres hältst. Wer sind denn Nerds?
Geh mit der Zeit, oder geh mit der Zeit.
KI als nützliches Werkzeug: Ja, gerne! KI als Kunstschaffender: Nein danke.
Oder das Gegenteil – wir überspannen den Bogen jetzt dermaßen, dass irgendwann vielleicht wieder klarer wird, was wir eigentlich alle brauchen. Und das sind keine automatisierten Wohnungen mit Robotern, wo wir seelenlose Musik hören und in Social Media Welten leben.
Man versucht doch gerade, Synchronsprecher zu „überreden“, ihre Stimme der KI zum Training vorzuwerfen.
Vielleicht demnächst in jedem Plattenvertrag die gleiche Forderung?
Da wartet man irgendwie auf den grellen Blitz mit dem jemand aus dem 28. Jahrhundert zurück kommt und verhindern will, was derzeit beginnt…….;-)
Sehe ich anders. Bzw. höre ich anders. Ich generiere mit Suno Musik, die mir gefällt, statt stundenlang Songs auf Apple Music zu suchen, um eine Handvoll zu finden. Wenn man sich mit den Tools beschäftigt, kann man wahre Wunder vollbringen. Bin immer wieder geflashed.
+1
Absolut korrekt, Suno ist top und die Musik hat Seele. Liebe meine Songs. Man kann es von beiden Seiten sehen und erleben, jedem das seine.
In der Werbebranche wird sowas steil gehen.
Aktuell scheint das gratis nicht zu funktionieren. Zitat Gemini: The reality of the Free tier is a bit of a moving target. While some features like image generation have a generous daily limit, video and high-fidelity audio generation (like Veo or Lyria) are currently reserved for the paid tiers (Pro or Ultra). My previous attempt to generate it hit that subscription wall.
Konnte grad ohne Probleme einen Track gratis erstellen. Weder Fehlermeldung noch Einschränkungen.
Perfekt für Waschsalons, Fahrstühle, die Warteschleife von Versicherungshotlines,…