Künstliche Intelligenz

OpenAI stellt AI-Agent “Deep Research” vor und prahlt mit herausragender Genauigkeit

Julia Isabelle Gerber04. Februar 2025, 09:52

Übrigens: Google hat vor knapp zwei Monaten einen KI-Assistenten mit genau demselben Namen angekündigt: Jetzt gibt es Google's Deep Research und OpenAI's Deep Research. © Open AI

OpenAI entwickelt ein neues KI-Modell nach dem anderen. Gerade wurde “Deep Research” vorgestellt – bitte nicht zu verwechseln mit “Deep Seek” aus China. Es handle sich dabei um einen KI-Agenten, der „intensive Wissensarbeit“ in Bereichen wie Finanzen, Wissenschaft, Politik und Technik leisten soll. Zudem könnte Deep Research beim Online-Kauf helfen, indem es sicherstellt, dass Entscheidungen auf verlässlichen Hintergrundinformationen basieren.

Durchführung tiefgreifender, komplexer Recherchen

Laut OpenAI eigne sich der AI-Agent für alle Menschen, die „gründliche, präzise und zuverlässige Forschung benötigen“, wie aus einem Blogpost des Unternehmens hervorgeht. Es gehe darum, anspruchsvolle Browsing- und Rechercheaufgaben über verschiedene Themenbereiche hinweg mithilfe von ChatGPT, auf dem der KI-Agent basiert, umzusetzen.

Aber nicht nur, so sollen beispielsweise auch Informationen zu Konsumgütern geliefert werden, „die normalerweise eine sorgfältige Recherche erfordern, wie etwa Autos, Haushaltsgeräte und Möbel“. Anders ausgedrückt: OpenAI habe Deep Research nicht für schnelle Antworten oder Zusammenfassungen konzipiert, sondern vielmehr, um sorgfältig Informationen von mehreren Websites und anderen Quellen zu berücksichtigen.

Berücksichtigung von Echtzeit-Informationen

Trainiert wurde Deep Research laut OpenAI mit End-to-End-Reinforcement-Learning. Ein KI-Modell lernt dabei im Wesentlichen durch Versuch und Irrtum, ein definiertes Ziel zu erreichen. Gleichzeitig sollen mehrstufige Strategien entwickelt werden, um Daten gezielt zu recherchieren, nachzuvollziehen und in Echtzeit auf neue Informationen zu reagieren.

Auch sei es darauf spezialisiert, so OpenAI in dem Blogpost, hochgeladene Dateien zu durchsuchen, Diagramme mit Python zu erstellen und iterativ zu verbessern. Bei den gelieferten Antworten, sollen sowohl generierte Grafiken als auch Bilder aus dem Web eingebunden und spezifische Aussagen aus Quellen zitiert werden. Noch wurden diese Features allerdings nicht ausgerollt: Die derzeitigen Ergebnisse der ChatGPT-Deep-Recherche bestehen laut TechCrunch aus reinem Text.

OpenAI gibt an, dass sein neues Modell zu Höchstleistungen im Stande sei und die KI-Anwendungen von Anthropic, Google oder DeepSeek in der Genauigkeit um mehr als das Doppelte übertrifft. Getestet wurde dies in „Humanity’s Last Exam“, einem interaktiven Quiz, das mehr als 3.000 Fragen auf Expertenebene in verschiedenen akademischen Bereichen umfasst und als KI-Benchmark dienen soll. Entwickelt wurde der Test von den US-Organisationen Scale AI und dem Center for AI Safety (CAIS).

Deep Research noch nicht vollständig ausgerollt

Derzeit ist „Deep Research“ für ChatGPT-Pro-Abonnent:innen in den USA verfügbar, mit einer Begrenzung von bis zu 100 Anfragen pro Monat. Eine „gründliche“ Recherche kann dabei zwischen fünf und 30 Minuten dauern. Erst dann sollen User:innen eine Benachrichtigung und eine Antwort auf ihre Fragen erhalten.

Bald möchte das Unternehmen sein neues KI-Modell auch für ChatGPT Plus- und Team-User:innen freischalten. Außerdem sollen die Abfragelimits für zahlende User:innen bald „deutlich höher“ sein. Ein Veröffentlichungsdatum für Europa stehe noch nicht fest.

Fehler nicht ausgeschlossen

Dennoch könne es laut OpenAI durch Deep Research zu Einschränkungen kommen – Fehler und falsche Schlussfolgerungen seien nicht ausgeschlossen. So könne es passieren, dass eine gründliche Recherche wahrheitsgemäße Informationen teilweise nicht von Gerüchten unterscheiden kann. Weiters seien Formatierungsfehler in Berichten und Zitaten nicht ausgeschlossen.

Auch wenn Deep Research, Studierenden tiefergehende Antwortlen und gut zitierte Aussagen liefert und damit wahrscheinlich verlässlicher ist als eine einfache Chatbot-Zusammenfassung, darf die echte Analyse und Doppelüprüfung nicht ausbleiben.

AI Talk #9: DeepSeek als Gefahr für OpenAI, Nvidia – und neue Chance für Startups

Rank My Startup: Erobere die Liga der Top Founder!

OpenAI stellt AI-Agent “Deep Research” vor und prahlt mit herausragender Genauigkeit

Durchführung tiefgreifender, komplexer Recherchen

Berücksichtigung von Echtzeit-Informationen

Deep Research noch nicht vollständig ausgerollt

Fehler nicht ausgeschlossen

Specials unserer Partner

pinyya will mit Aligned-Ownership den Wohnungskauf revolutionieren

Das verflixte dritte Jahr: Warum Liquiditätsplanung über Erfolg oder Scheitern entscheidet

„Calm, competent, connected“: Wie Wien mit der ViennaUP die internationale Tech-Szene gewinnt

Der Businessplan: Warum er zählt – und wie man ihn richtig aufbaut

i2b: Niederösterreich beweist seine Innovationskraft

Von der Idee zum Scaleup: Wie StartupNOW österreichische Startups auf Wachstumskurs bringt

#glaubandich CHALLENGE: Senseven ist Startup des Jahres 2026!

SVAN ist „Female Startup“ des Jahres der #glaubandich CHALLENGE 2026

Hycobility: Wiener Startup vereint Metall und Holz zu Super-Werkstoff

Die besten Artikel in unserem Netzwerk

AIT-Bilanz 2025: 141 Millionen Euro Umsatz und 685 wissenschaftliche Publikationen

KI frisst die Software-Margen: Wie SaaS jetzt mit Token-Kosten kalkulieren muss

Heizma: Wärmepumpen-Startup erreicht 2 Millionen Euro Monatsumsatz

Anduril holt 5 Milliarden Dollar, Bewertung steigt auf 61 Milliarden Dollar

Anthropic soll mit Investoren Bewertung von 950 Milliarden Dollar verhandeln – Bericht

Space AI: Was SpaceX, Anthropic und Google da oben planen | Wasner + Steinschaden

2,1 Milliarden Dollar für Isomorphic Labs aus London für KI-getriebene Medikamentenentwicklung

Us-Inflation stieg im April auf höchstes Niveau seit drei Jahren, Irankrieg als Hauptursache

SAP steigt bei n8n ein, verdoppelt Bewertung des Berliner AI-Unicorns auf 5,2 Mrd. Dollar

Deep Dives

Wasner + Steinschaden | Der KI Podcast

Startup & Scale-up Investment Tracker 2026

RankMyStartup.com

#glaubandich CHALLENGE 2026

2 Minuten 2 Millionen | Staffel 13

IPO Spotlight

Future{hacks}

Trending Topics Tech Talk

Weiterlesen