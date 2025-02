Das AI-Robotik-Unternehmen Figure hat mit „Helix“ ein neues Vision-Language-Action (VLA) Modell vorgestellt, das Wahrnehmung, Sprachverständnis und Steuerung in einem System vereint. Die Innovation liegt besonders in der präzisen Kontrolle des gesamten humanoiden Oberkörpers inklusive Handgelenke, Torso, Kopf und einzelner Finger. Figure hat sich bekannterweise von den AI-Modellen von OpenAI losgesagt, weil man auf eigene Modelle setzen will.

Das System besteht aus zwei Hauptkomponenten: Einem Vision Language Model (VLM) mit 7 Milliarden Parametern für das Verstehen von Szenen und Sprache, sowie einem 80 Millionen Parameter starken Transformer-Modell für die motorische Steuerung. Während das VLM mit 7-9 Hz arbeitet, erfolgt die Bewegungssteuerung mit 200 Hz.

Fähigkeiten und Limitierungen Helix kann:

Nahezu beliebige kleine Haushaltsgegenstände greifen und manipulieren

Mit zwei Robotern gleichzeitig koordiniert arbeiten

Natürlichsprachliche Anweisungen in Echtzeit umsetzen

Auf handelsüblicher Embedded-Hardware laufen

Einschränkungen bestehen bei:

Der Größe manipulierbarer Objekte

Der Komplexität längerer Handlungsabläufe

Der Robustheit bei stark variierenden Umgebungsbedingungen

Das System wurde mit etwa 500 Stunden überwachtem Training entwickelt – deutlich weniger als vergleichbare Ansätze. Figure betont, dass dies erst der Anfang sei und plant eine massive Skalierung des Trainings.

Bedeutung für die Robotik

Helix markiert einen wichtigen Schritt in Richtung flexibler Robotersysteme für unstrukturierte Umgebungen. Die Kombination aus sprachlicher Steuerung und präziser Motorik könnte neue Anwendungen im Haushalts- und Servicebereich ermöglichen. Allerdings bleibt abzuwarten, wie robust das System im realen Einsatz funktioniert.

Figure ist neben Boston Dynamics, Tesla, Nvidia und einigen anderen Unternehmen einer jener Player, die humanoide Roboter in Industrie, aber auch im Heimeinsatz etablieren möchten. argumentiert wird dabei oft und gerne, dass es nicht um den Ersatz menschlicher Arbeitskraft geht, sondern um das Füllen von Lücken im Arbeitsmarkt, wo Fachkräfte fehlen.