OpenAI stellt AI-Agent “Deep Research” vor und prahlt mit herausragender Genauigkeit

OpenAI entwickelt ein neues KI-Modell nach dem anderen. Gerade wurde “Deep Research” vorgestellt – bitte nicht zu verwechseln mit “Deep Seek” aus China. Es handle sich dabei um einen KI-Agenten, der „intensive Wissensarbeit“ in Bereichen wie Finanzen, Wissenschaft, Politik und Technik leisten soll. Zudem könnte Deep Research beim Online-Kauf helfen, indem es sicherstellt, dass Entscheidungen auf verlässlichen Hintergrundinformationen basieren.
Durchführung tiefgreifender, komplexer Recherchen
Laut OpenAI eigne sich der AI-Agent für alle Menschen, die „gründliche, präzise und zuverlässige Forschung benötigen“, wie aus einem Blogpost des Unternehmens hervorgeht. Es gehe darum, anspruchsvolle Browsing- und Rechercheaufgaben über verschiedene Themenbereiche hinweg mithilfe von ChatGPT, auf dem der KI-Agent basiert, umzusetzen.
Aber nicht nur, so sollen beispielsweise auch Informationen zu Konsumgütern geliefert werden, „die normalerweise eine sorgfältige Recherche erfordern, wie etwa Autos, Haushaltsgeräte und Möbel“. Anders ausgedrückt: OpenAI habe Deep Research nicht für schnelle Antworten oder Zusammenfassungen konzipiert, sondern vielmehr, um sorgfältig Informationen von mehreren Websites und anderen Quellen zu berücksichtigen.
Berücksichtigung von Echtzeit-Informationen
Trainiert wurde Deep Research laut OpenAI mit End-to-End-Reinforcement-Learning. Ein KI-Modell lernt dabei im Wesentlichen durch Versuch und Irrtum, ein definiertes Ziel zu erreichen. Gleichzeitig sollen mehrstufige Strategien entwickelt werden, um Daten gezielt zu recherchieren, nachzuvollziehen und in Echtzeit auf neue Informationen zu reagieren.
Auch sei es darauf spezialisiert, so OpenAI in dem Blogpost, hochgeladene Dateien zu durchsuchen, Diagramme mit Python zu erstellen und iterativ zu verbessern. Bei den gelieferten Antworten, sollen sowohl generierte Grafiken als auch Bilder aus dem Web eingebunden und spezifische Aussagen aus Quellen zitiert werden. Noch wurden diese Features allerdings nicht ausgerollt: Die derzeitigen Ergebnisse der ChatGPT-Deep-Recherche bestehen laut TechCrunch aus reinem Text.
OpenAI gibt an, dass sein neues Modell zu Höchstleistungen im Stande sei und die KI-Anwendungen von Anthropic, Google oder DeepSeek in der Genauigkeit um mehr als das Doppelte übertrifft. Getestet wurde dies in „Humanity’s Last Exam“, einem interaktiven Quiz, das mehr als 3.000 Fragen auf Expertenebene in verschiedenen akademischen Bereichen umfasst und als KI-Benchmark dienen soll. Entwickelt wurde der Test von den US-Organisationen Scale AI und dem Center for AI Safety (CAIS).
Deep Research noch nicht vollständig ausgerollt
Derzeit ist „Deep Research“ für ChatGPT-Pro-Abonnent:innen in den USA verfügbar, mit einer Begrenzung von bis zu 100 Anfragen pro Monat. Eine „gründliche“ Recherche kann dabei zwischen fünf und 30 Minuten dauern. Erst dann sollen User:innen eine Benachrichtigung und eine Antwort auf ihre Fragen erhalten.
Bald möchte das Unternehmen sein neues KI-Modell auch für ChatGPT Plus- und Team-User:innen freischalten. Außerdem sollen die Abfragelimits für zahlende User:innen bald „deutlich höher“ sein. Ein Veröffentlichungsdatum für Europa stehe noch nicht fest.
Fehler nicht ausgeschlossen
Dennoch könne es laut OpenAI durch Deep Research zu Einschränkungen kommen – Fehler und falsche Schlussfolgerungen seien nicht ausgeschlossen. So könne es passieren, dass eine gründliche Recherche wahrheitsgemäße Informationen teilweise nicht von Gerüchten unterscheiden kann. Weiters seien Formatierungsfehler in Berichten und Zitaten nicht ausgeschlossen.
Auch wenn Deep Research, Studierenden tiefergehende Antwortlen und gut zitierte Aussagen liefert und damit wahrscheinlich verlässlicher ist als eine einfache Chatbot-Zusammenfassung, darf die echte Analyse und Doppelüprüfung nicht ausbleiben.
AI Talk #9: DeepSeek als Gefahr für OpenAI, Nvidia – und neue Chance für Startups