Künstliche Intelligenz

Nvidia setzt auf Physical AI: Neues Open-Source-Modell für autonomes Fahren

Nvidia. © Unsplash
Nvidia. © Unsplash
Startup Interviewer: Gib uns dein erstes AI Interview Startup Interviewer: Gib uns dein erstes AI Interview

Nvidia hat auf der NeurIPS-Konferenz in San Diego ein neues Kapitel in der Entwicklung physischer KI aufgeschlagen. Der Tech-Gigant hat nun Nvidia Drive Alpamayo-R1 vorgestellt, das weltweit erste offene Vision-Language-Action-Modell mit Reasoning-Fähigkeiten für autonomes Fahren.

Das Modell basiert auf Nvidias Cosmos-Reason-Architektur und soll Fahrzeugen helfen, komplexe Verkehrssituationen mit „gesundem Menschenverstand“ zu bewältigen. Alpamayo-R1 ist ab sofort auf GitHub und Hugging Face verfügbar und richtet sich an Forschende, die an nicht-kommerziellen Anwendungen im Bereich autonomer Fahrzeuge arbeiten.

Das Besondere an Alpamayo-R1: Es integriert Chain-of-Thought-Reasoning in die Pfadplanung. Während frühere selbstfahrende Systeme bei nuancierten Situationen – etwa einer fußgängerreichen Kreuzung oder einer anstehenden Fahrbahnverengung – an ihre Grenzen stießen, zerlegt das neue Modell Szenarien in einzelne Schritte.

Neue Tools für Physical AI

Parallel zu Alpamayo-R1 hat Nvidia das Cosmos Cookbook veröffentlicht – einen umfassenden Leitfaden für Physical-AI-Entwickler, der von der Datenkuratierung über synthetische Datengenerierung bis zur Modellevaluierung reicht. Das Cookbook enthält Schritt-für-Schritt-Anleitungen und Quick-Start-Beispiele für die Nutzung und das Post-Training von Cosmos-basierten Modellen.

Die neuen Anwendungen sollen Vielseitigkeit demonstrieren:

  • LidarGen kann zum ersten Mal künstliche LiDAR-Daten für Simulationen autonomer Fahrzeuge erzeugen.
  • Omniverse NuRec Fixer entfernt Fehler aus KI-rekonstruierten Datensätzen.
  • ProtoMotions3 trainiert digitale Menschen und humanoide Roboter in realistischen, von Cosmos erzeugten Umgebungen.

Neben Physical AI hat Nvidia auch neue digitale KI-Tools angekündigt: MultiTalker Parakeet etwa erkennt mehrere Sprecher:innen in Echtzeit-Audio-Streams.

Strategische Ausrichtung

Nvidias Launches unterstreichen eine strategische Neuausrichtung auf Physical AI. CEO Jensen Huang hat wiederholt betont, die nächste KI-Welle sei Physical AI. Bill Dally, Chief Scientist bei Nvidia, sagt: „Ich denke, dass Roboter irgendwann eine große Rolle in der Welt spielen werden, und wir wollen im Grunde die Gehirne aller Roboter herstellen. Um das zu erreichen, müssen wir beginnen, die Schlüsseltechnologien zu entwickeln.“

Mit seinen offenen Modelle, Datensätze und Tools positioniert sich Nvidia als Infrastruktur-Provider für die nächste Generation von KI-Anwendungen – von autonomen Fahrzeugen über Roboter bis hin zu humanoiden Systemen.

Werbung
Werbung

Specials unserer Partner

Die besten Artikel in unserem Netzwerk

Powered by Dieser Preis-Ticker beinhaltet Affiliate-Links zu Bitpanda.

Deep Dives

#glaubandich CHALLENGE Hochformat.

#glaubandich CHALLENGE 2026

Österreichs größter Startup-Wettbewerb - 12 Top-Investoren mit an Bord

AI Talk

Der führende KI Podcast mit Clemens Wasner & Jakob Steinschaden

Future{hacks}

Zwischen Hype und Realität
© Wiener Börse

IPO Spotlight

powered by Wiener Börse

Startup & Scale-up Investment Tracker 2025

Die größten Finanzierungsrunden des Jahres im Überblick

Trending Topics Tech Talk

Der Podcast mit smarten Köpfen für smarte Köpfe
Die 2 Minuten 2 Millionen Investoren. © PULS 4 / Gerry Frank

2 Minuten 2 Millionen | Staffel 12

Die Startups - die Investoren - die Deals - die Hintergründe

BOLD Community

Podcast-Gespräche mit den BOLD Minds

IPO Success Stories

Der Weg an die Wiener Börse

Weiterlesen