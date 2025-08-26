ifun.de — Apple News seit 2001. 44 357 Artikel

Bildbearbeitung über Text-Prompts

Gemini 2.5 Flash Image: Google jetzt mit echter KI-Bildbearbeitung
Google hat die Bildbearbeitungsfunktionen in seiner Gemini-App umfassend erweitert. Grundlage ist ein das neue Modell Gemini 2.5 Flash, das von Google DeepMind entwickelt wurde und sowohl in der App als auch über Schnittstellen für Entwickler bereitsteht. Ziel ist es, die Bearbeitung von Fotos intuitiver zu machen und dabei konsistente Ergebnisse zu liefern.
Nutzer können damit Personen oder Tiere in unterschiedlichen Szenen darstellen, Hintergründe austauschen oder Objekte hinzufügen, ohne dass die abgebildeten Charaktere verfremdet wirken. Alle erstellten oder bearbeiteten Bilder werden mit einem sichtbaren sowie einem unsichtbaren digitalen Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Ausgangsfotos auf denen Kinder abgebildet sind, werden derzeit noch nicht unterstützt.

Die Bildbearbeitung in der Gemini-App erlaubt es, Fotos Schritt für Schritt zu verändern. So können Anwender Frisuren oder Kleidung austauschen, Räume umgestalten oder mehrere Fotos zu einer neuen Szene kombinieren. Auch das Anwenden bestimmter Stile auf Objekte ist möglich, etwa indem sich Farben und Muster von einem Bild auf ein anderes übertragen lassen. Die Bearbeitung erfolgt über einfache Anweisungen in Textform. Wer möchte, kann ein bereits verändertes Foto erneut hochladen und weitere Anpassungen vornehmen. So lassen sich mehrstufige Bearbeitungen durchführen, ohne dass Details der ursprünglichen Abbildung verloren gehen.

Modell für Entwickler und Unternehmen

Parallel zur App führt Google das weiterentwickelte Modell Gemini 2.5 Flash Image auch über die Gemini-API und im Google AI Studio ein. Die API richtet sich an Entwickler und Unternehmen, die eigene Anwendungen auf Basis der Bildgenerierung aufbauen möchten. Zu den Funktionen gehören das Zusammenfügen mehrerer Bilder, gezielte Bearbeitungen auf Basis von Textbefehlen und die Möglichkeit, Charaktere oder Objekte über mehrere Szenen hinweg konsistent darzustellen. Abgerechnet wird die Nutzung nach der Menge der generierten Bilddaten, wodurch sich die Kosten transparent kalkulieren lassen.
