Generative Musik, auch mit deutschen Texten

Lyria 3: Google Gemini generiert jetzt auch Songs

Google erweitert seine KI-Plattform Gemini um ein Werkzeug zur automatisierten Musikerstellung. Mit dem neuen Modell Lyria 3 können Nutzer kurze Musikstücke erzeugen, die auf Texteingaben oder hochgeladenen Bildern und Videos basieren.

Die generierten Tracks haben eine Länge von rund 30 Sekunden und sind ab sofort auch auf Deutsch verfügbar. Die Funktion ist direkt in Gemini integriert und richtet sich an Nutzer, die ohne musikalische Vorkenntnisse eigene Klangideen umsetzen möchten.

Genre, Stimmung und Tempo per Prompt

Lyria 3 verarbeitet beschreibende Texteingaben, die Angaben zu Genre, Stimmung, Tempo oder Gesang enthalten können. Auf dieser Basis erstellt das System sowohl Instrumentalstücke als auch Songs mit automatisch generierten Texten.

Prompt: Erstelle einen schnellen (120bpm) Soul-Funk-Track mit einer warmen, weiblichen Sopran-Stimme. Meine Freunde Kathi, Tika, Mo und ich treffen uns am Donnerstagabend im Kino. Erinnere sie mit dem Track an unser Date – und dass wir vorher noch Tacos essen gehen. Der Track soll in deutscher Sprache sein.

Zusätzlich lassen sich Fotos oder kurze Videos hochladen, deren Bildinhalte als Ausgangspunkt für die musikalische Gestaltung dienen. Gemini analysiert dabei Farben, Motive und Stimmung des Materials und versucht diese Eindrücke anschließend auf Rhythmus und Klangbild zu übertragen.

Die generierten Stücke werden jeweils mit einem automatisch erzeugten Coverbild versehen und können direkt gespeichert oder geteilt werden.

Prompt: Erstelle einen modernen Après-Ski-Track in deutscher Sprache, der diesen 5 sehr unterschiedlichen Freundinnen gefallen würde. Die Hook sollte sehr eingängig sein, gesungen wird er von einer prägnanten, tieferen Frauenstimme.

Mit Wasserzeichen und Künstlerschutz

Neben der Nutzung in Gemini ist Lyria 3 auch in das YouTube-Tool Dream Track eingebunden. Dort können Creator die Musikgenerierung für kurze Videos einsetzen, etwa um Hintergrundmusik oder gesungene Passagen für Shorts zu erstellen. Google will so die Anpassung von Tonspuren an visuelle Inhalte erleichtern, ohne auf externe Musikbibliotheken angewiesen zu sein.

Alle mit Lyria 3 erzeugten Audiodateien enthalten ein nicht hörbares Wasserzeichen. Dieses Kennzeichen dient dazu, KI-generierte Inhalte später identifizieren zu können. Zusätzlich lässt sich in Gemini prüfen, ob eine hochgeladene Audiodatei mit Google-KI erstellt wurde.

Google betont, dass das System nicht auf die Nachahmung konkreter Künstler ausgelegt ist. Stilangaben werden allgemein interpretiert und durch Filter ergänzt, die eine zu starke Nähe zu bestehenden Werken vermeiden sollen.

Dieser Artikel enthält Affiliate-Links. Wer darüber einkauft unterstützt uns mit einem Teil des unveränderten Kaufpreises. Was ist das?

18. Feb. 2026 um 19:12 Uhr von Nicolas Fehler gefunden?

10 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.

Palettenschubser 18.02.2026, 19:30 Uhr

Angst essen Seele auf…

Antworten Melden

Neroid 18.02.2026, 19:31 Uhr

KI Musik ist höchstens, was für Menschen, die Tapeten Musik hören/brauchen. Hauptsache irgendwas dudelt im Hintergrund. Ansonsten ist das komplett seelenloses Geseier.
Du fängst an das Lied zu hören. Klingt wie ein normales Lied. Text normal. Melodie normal.
Dann bekommst du das Gefühl, dass dir das Lied irgendwie bekannt vorkommt aber irgendwie auch nicht.
Zuletzt wirst du feststellen, dass irgendwas an dem Lied fehlt. Du kannst aber nicht genau sagen was. Es fühlt sich einfach unvollständig an.

loverz 18.02.2026, 19:38 Uhr

Das, was du hier schreibst er erinnert mich eher an die möchtegern Künstler der Neuzeit :D

Antworten Melden

Antworten Melden
tom_bond 18.02.2026, 19:53 Uhr

1+

Antworten Melden

Antworten Melden
Muten Roshi 18.02.2026, 20:54 Uhr

Das gilt absolut nicht für das Lied Papaoutai – Afro Soul. So viel besser als das Original!

Antworten Melden

Antworten Melden

Hertel84 18.02.2026, 19:44 Uhr

Ohje, das Beispiel im Artikel sagt ja schon alles. Sollen sie KI Musik doch einfach beerdigen. Last den Künstlern ihre Bühne. Seitdem die Nerds die Oberhand gewinnen, ist die Welt nicht besser geworden. Die Nerds haben alle zu Nerds gemacht.

dynAdZ 18.02.2026, 19:49 Uhr

KI als nützliches Werkzeug: Ja, gerne! KI als Kunstschaffender: Nein danke.

Satyrus 18.02.2026, 20:39 Uhr

Man versucht doch gerade, Synchronsprecher zu „überreden“, ihre Stimme der KI zum Training vorzuwerfen.
Vielleicht demnächst in jedem Plattenvertrag die gleiche Forderung?
Da wartet man irgendwie auf den grellen Blitz mit dem jemand aus dem 28. Jahrhundert zurück kommt und verhindern will, was derzeit beginnt…….;-)

JayT 18.02.2026, 21:10 Uhr

Sehe ich anders. Bzw. höre ich anders. Ich generiere mit Suno Musik, die mir gefällt, statt stundenlang Songs auf Apple Music zu suchen, um eine Handvoll zu finden. Wenn man sich mit den Tools beschäftigt, kann man wahre Wunder vollbringen. Bin immer wieder geflashed.

mkasaga 18.02.2026, 21:39 Uhr

Absolut korrekt, Suno ist top und die Musik hat Seele. Liebe meine Songs. Man kann es von beiden Seiten sehen und erleben, jedem das seine.

Generative Musik, auch mit deutschen Texten

Lyria 3: Google Gemini generiert jetzt auch Songs

Genre, Stimmung und Tempo per Prompt

Mit Wasserzeichen und Künstlerschutz

Redet mit. Seid nett zueinander! Antwort abbrechen