Internationaler Roll-Out in den kommenden Monaten
Einkaufen und Buchen auf Knopfdruck: OpenAI lanciert KI-Agenten "Operator"

OpenAI hat mit "Operator" seinen ersten KI-Agenten vorgestellt, der eigenständig Aufgaben wie Reservierungen und Einkäufe übernehmen kann. Der Dienst ist zunächst nur für US-amerikanische Nutzer:innen des kostenpflichtigen ChatGPT Pro verfügbar, soll jedoch in den kommenden Monaten auch international eingeführt werden.

Während klassische Chatbots wie ChatGPT vor allem Anfragen beantworten, geht Operator einen Schritt weiter: Der Agent kann eigenständig handeln. Ob Restaurant-Reservierungen, Lebensmitteleinkäufe oder die Buchung von Reisen – Operator soll Nutzer:innen dabei unterstützen, alltägliche Aufgaben zu automatisieren.

Dieses Tool ist zunächst für ChatGPT Pro-Nutzer in den USA verfügbar und basiert auf einem neuen Modell namens CUA, das die visuellen Fähigkeiten von GPT-4o mit fortgeschrittenem logischen Denken kombiniert.  Laut Reiichiro Nakano, technischem Mitarbeiter bei OpenAI, ist das Modell so programmiert, dass es wie ein Mensch mit Maus und Tastatur agiert und den Bildschirm "liest". Es benötigt keine APIs, um auf Websites zuzugreifen, und kann somit eine Vielzahl von Software nutzen, die zuvor nicht für KI zugänglich war.

The Verge berichtet, dass der KI-Agent Aufgaben im Web für Nutzer ausführen kann, indem er Webseiten durch Screenshots interpretiert und Aktionen wie Tippen, Klicken und Scrollen durchführt. OpenAI arbeitet dabei mit Unternehmen wie DoorDash, Instacart und Uber zusammen, um sicherzustellen, dass Operator den realen Bedürfnissen der Nutzer gerecht wird.

Einführung in den USA – später weltweit

Ab sofort steht Operator US-amerikanischen ChatGPT-Pro-Nutzer:innen zur Verfügung, die für den Dienst 200 Dollar monatlich zahlen. OpenAI plant, den Agenten in den kommenden Monaten auch für ChatGPT-Plus-Nutzer:innen (20 Dollar pro Monat) sowie international verfügbar zu machen.

Während eines Livestreams zur Einführung erklärte OpenAI-CEO Sam Altman, dass Operator eine "frühe Forschungsvorschau" sei. Ziel sei es, den Dienst durch Nutzerfeedback kontinuierlich zu verbessern. Zudem kündigte er an, dass OpenAI weitere spezialisierte Agenten entwickeln werde.

So funktioniert der Operator

Die Bedienung von Operator ähnelt der von ChatGPT: Nutzer:innen geben einfach eine Anfrage ein, etwa "Reservieren Sie ein Abendessen um 19 Uhr". Anschließend können sie festlegen, ob die Anfrage über eine spezifische Website wie OpenTable oder über eine Suchmaschine erfolgen soll.

Eine Besonderheit ist die Möglichkeit, Bilder hochzuladen. So kann beispielsweise eine handgeschriebene Einkaufsliste fotografiert und an Operator übermittelt werden. Der Agent kauft die Artikel dann über eine Plattform wie Instacart ein – oder nutzt eine Suchmaschine, falls keine Plattform ausgewählt wird.

Um Nutzer:innen den Prozess transparenter zu machen, fasst Operator seine Aktionen in einer Seitenleiste zusammen. So können potenzielle Fehlerquellen leichter identifiziert werden, was laut OpenAI derzeit noch ein Problem darstellt.

2025: Das Jahr der KI-Agenten

Experten hatten prognostiziert, dass 2025 das Jahr sein würde, in dem KI-Agenten ihren Durchbruch erleben. OpenAI scheint diese Vorhersage mit der Einführung von Operator zu bestätigen.

Die Vision, eine künstliche Intelligenz zu entwickeln, die eigenständig Aufgaben erledigen kann, bringt OpenAI damit ein großes Stück näher. Laut Nakano beseitigt Operator" einen weiteren Engpass auf unserem Weg zur Allgemeinen Künstlichen Intelligenz (AGI)". Dennoch räumt das Unternehmen ein, dass der Agent aktuell noch weit davon entfernt ist, menschliche Fähigkeiten bei der Navigation im Internet zu erreichen.

leadersnet.TV