Fokus auf bessere Bildbearbeitung
ChatGPT: Neuer Bildgenerator und Apple-Music-Integration
OpenAI hat den Funktionsumfang von ChatGPT um eine neue Version seiner Bilderstellungsfunktion erweitert. Zudem soll Apple Music direkt in den KI-Chat integriert werden.
Apple Music in ChatGPT
Beginnen wir mit der Ankündigung, dass ChatGPT künftig in der Lage ist, mithilfe von Apple Music auf den Nutzer zugeschnittene Musikempfehlungen und Wiedergabelisten zu erstellen. Fidji Simo, bei OpenAI für die Einbindung externer Anwendungen zuständig, hat diese Ankündigung im Zusammenhang mit der Überarbeitung der Bilderstellungsfunktion von ChatGPT gemacht.
Der Beitrag wurde jedoch kurz darauf editiert und sämtliche Hinweise auf Apple Music getilgt. Man darf nun darüber spekulieren, ob hier lediglich zu früh öffentlich über ein kommendes Feature gesprochen wurde oder die komplette Integration längst noch nicht in trockenen Tüchern ist.
Bilderstellung mit ChatGPT Image 1.5
Fakt ist dagegen, dass die KI von OpenAI mit ChatGPT Image 1.5 auf ein neues Modell zur Bilderstellung setzt. Die auf der Ankündigungswebseite gezeigten Beispiele können sich sehen lassen. Das neue Modell soll die Bilderstellung nicht nur beschleunigen, sondern vor allem auch in der Lage sein, Bildinhalte gezielter zu verändern und dabei zentrale Bildelemente zu erhalten.
ChatGPT Image 1.5 stellt weniger die reine Neuerstellung von Bildern, sondern deren nachträgliche Bearbeitung in den Mittelpunkt. Hochgeladene Fotos oder Grafiken sollen sich beispielsweise durch das Hinzufügen oder Entfernen einzelner Elemente gezielt anpassen lassen. Dabei wurde laut OpenAI besonders darauf geachtet, dass Aspekte wie Lichtverhältnisse, der Bildaufbau oder das Aussehen abgebildeter Personen über mehrere Bearbeitungsschritte hinweg konsistent bleiben.
Begleitend dazu erweitert OpenAI seine Anwendung um einen eigenen Bereich für Bilder. Dort sollen Nutzer ohne ausführliche Texteingaben mit vorgegebenen Stilen und Ideen experimentieren können. Ziel sei es, den Einstieg zu vereinfachen und bessere Experimentiermöglichkeiten zu bieten.
ChatGPT Image 1.5 wird schrittweise zunächst für private Nutzer freigegeben. Geschäftskunden sollen später folgen.


Da hat der rote Alarm wohl geholfen. Der Vergleich mit Gemini bei der Erstellung von Infographiken war zuletzt deutlich zu Gunsten von Google ausgegangen.
Für meine Ansprüche genügt mir Copilot oder Gemini. ChefGPT ist mir mit der Limitierung von 4 Bildern zu beschränkt. Vor allem wenn 2 von 4 Bildern immer Murks sind. Nö. Nein, ich bezahle nicht dafür. Warum? Weil ich die Maschine täglich mit meinen Daten füttere und trainiere. Zeit ist meine Bezahlung.
Mich würden mal die Realkosten jeder einzelnen Anfrage interessieren – ich glaube die alltäglichen Nutzung von KI ist realwirtschaftlicher Irrsinn!
und wegen diesen Spielereien steigen die Hardwarepreise… da kann man nur ein Danke an alle AI fokussierten Butzen sagen… mal sehen, wie ihr auf breiter Front dieses Mega Investment in tragfähige Geschäftsmodelle transferiert.
Ich wette, sehr viele werden scheitern… und dann hats wieder keiner kommen sehen.
Was ist denn der Unterschied zwischen „Image“ und „Sora“, bis auf, dass ersteres direkt aus den Chats aufgerufen werden kann?
Image sind Bilder und Sora ist die Video Ki bei ChatGPT Plus
Ja, aber Sora macht ja auch Bilder. Wieso kann ich den Sora nicht direkt aus dem Chat ansprechen?
Mich nervt bei der Bearbeitung realer Bilder, dass die Gesichter bearbeitet werden, obwohl nur der Hintergrund angepasst werden soll.
Ich persönlich finde, dass der Image Playground von Apple den anderen weit voraus ist.
Is immer noch Ewigkeiten hinter groks Bild und Video Generierungen