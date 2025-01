Mit Operator hat das hinter ChatGPT stehende Unternehmen OpenAI einen KI-Assistenten für den Webbrowser vorgestellt. Die Software kann eigenständig Aufgaben wie das Ausfüllen von Formularen, die Planung und das Buchen von Reisen oder Online-Einkäufe übernehmen und benutzt dabei einen Webbrowser, der über Maus- und Tastaturaktionen wie Klicken, Scrollen und Tippen gesteuert wird.

Hinter der neuen KI-Funktion steht ein neues, von OpenAI „Computer-Using Agent“ (CUA) genanntes Modell. Laut Anbieter wird dabei die visuelle Erkennung von Bildschirminhalten mit einer fortgeschrittenen Entscheidungslogik kombiniert. Auf diese Weise ist der Agent in der Lage, grafische Benutzeroberflächen zu verstehen und mit diesen zu interagieren. Wenn „Operator“ auf Schwierigkeiten stößt und beispielsweise Aufgaben wie die Eingabe von Zahlungsinformationen oder die Lösung von CAPTCHAs nicht selbstständig bewältigen kann, bittet er den Nutzer um Unterstützung.

OpenAI zufolge soll die Anwendung vor allem sich wiederholende und zeitraubende Aufgaben automatisieren, beispielsweise das Bestellen von Lebensmitteln oder Reisebuchungen. Nutzer können dies auch um selbst erstellte Arbeitsabläufe ergänzen, indem sie „Operator“ spezifische Anweisungen geben. So lassen sich beispielsweise bevorzugte Fluggesellschaften oder wiederkehrende Einkaufslisten konfigurieren.

Während die neue KI-Funktion zunächst nur in den USA und dort auch nur für Pro-Abonnenten von ChatGPT verfügbar ist, gibt es auch unabhängig von den offiziellen Produktdemos bereits eindrucksvolle Beispiele. So hat der KI-Experte Rowan Cheung erste Erfahrungen mit der Software geteilt und zeigt sich hoch beeindruckt. „Operator“ hat beispielsweise eigenständig die für ein Rezept benötigten Zutaten besorgt oder eine an die Interessen und das Budget des Nutzers angepasste Reise geplant. Dabei konnte die KI auch durch selbst getroffene Entscheidungen beeindrucken. Schaut euch die insgesamt neun von Cheung veröffentlichten Beispiele am besten selbst an.

3. Crypto investment research based on tokens that are actually worth looking into

Notice how ChatGPT Operator got hit with a "Are you human" CAPTCHA, then pinged me to take control to confirm

Wild workaround pic.twitter.com/GCefL2Ki9r

— Rowan Cheung (@rowancheung) January 23, 2025