Gemini Robotics: Googles neuestes AI-Modell läuft direkt auf Robotern

Google DeepMind veröffentlicht mit Gemini Robotics On-Device ein neues Sprachmodell, das Robotern ermöglicht, komplexe Aufgaben lokal ohne Internetverbindung auszuführen. Das Modell baut auf dem im März eingeführten Gemini Robotics auf und erlaubt die Steuerung von Roboterbewegungen. Entwickler können das System mittels natürlichsprachlicher Befehle kontrollieren und für verschiedene Anforderungen anpassen.
In Leistungstests behauptet Google, dass das Modell auf einem Niveau nahe dem cloudbasierten Gemini Robotics-Modell arbeitet. Das Unternehmen gibt an, dass es andere lokale Modelle in allgemeinen Benchmarks übertrifft, nennt diese Vergleichsmodelle jedoch nicht namentlich. Die Technologie soll besonders in Umgebungen nützlich sein, wo Internetverbindungen unzuverlässig oder nicht verfügbar sind.
Vielseitige Einsatzmöglichkeiten demonstriert
In einer Demo zeigte das Unternehmen Roboter, die mit diesem lokalen Modell Dinge wie das Öffnen von Reißverschlüssen und das Falten von Kleidung ausführen. Obwohl das Modell ursprünglich für ALOHA-Roboter entwickelt wurde, hat Google es später angepasst, um mit dem zweiarmigen Franka FR3-Roboter und dem humanoiden Apollo-Roboter von Apptronik zu arbeiten. Diese Flexibilität unterstreicht das Potenzial für verschiedene Roboterplattformen.
Besonders bemerkenswert ist die Anpassungsfähigkeit des Systems. Google behauptet, der zweiarmige Franka FR3 war erfolgreich bei der Bewältigung von Szenarien und Objekten, die er zuvor nicht ‚gesehen‘ hatte, wie zum Beispiel Montagearbeiten an einem Industrieband. Diese Fähigkeit zur Generalisierung stellt einen wichtigen Fortschritt in der Robotik dar.
Entwickler-Tools und Wettbewerbslandschaft
Google DeepMind veröffentlicht zusätzlich ein Gemini Robotics SDK. Das Unternehmen erklärt, dass Entwickler Robotern 50 bis 100 Demonstrationen von Aufgaben zeigen können, um sie mit diesen Modellen im MuJoCo-Physiksimulator für neue Aufgaben zu trainieren. Dies vereinfacht den Prozess, Roboter für spezifische Anwendungsfälle anzupassen.
Im Bereich der KI-gestützten Robotik verstärken auch andere Unternehmen ihre Aktivitäten. Nvidia entwickelt eine Plattform für Grundlagenmodelle für humanoide Roboter, Hugging Face arbeitet sowohl an offenen Modellen und Datensätzen für die Robotik als auch an eigenen Robotern, und das koreanische Startup RLWRLD konzentriert sich auf die Entwicklung von Grundlagenmodellen für Roboter. Der Wettbewerb in diesem Sektor intensiviert sich zunehmend.