MotuBrain: Das universelle Robotergehirn, das verkörperte KI neu definiert

Das ist kein Scherz – das ist tatsächlich passiert. Ein für Videotechnologie bekanntes Unternehmen hat ein universell einsetzbares “Gehirn” für Roboter entwickelt.

Im Gegensatz zu herkömmlichen spezialisierten Robotergehirnen, MotuBrain Es ist nicht nur in der Lage, die Welt vorherzusagen und zu simulieren, sondern kann auch Handlungsanweisungen ausgeben. Damit wird das Konzept “Wissen und Handeln als Einheit” wirklich verwirklicht.”

Das Modell heißt MotuBrain. Mitte April übertraf es still und leise zwei internationale Referenzwerte, doch niemand wusste, woher es kam. In der Fachwelt der verkörperten KI wurde drei Wochen lang darüber spekuliert.

Nun hat sich Shengshu Technology gemeldet und den Anspruch darauf erhoben. Ja – genau das Unternehmen, das hinter Vidu steht.

MotuBrain führt gleichzeitig zwei Benchmarks an

Ein Benchmark prüft, ob ein Modell die physikalische Welt verstehen kann.
Das andere prüft, ob es tatsächlich Maßnahmen ergreifen kann.

Das ist so, als würde jemand an einem Physikwettbewerb teilnehmen und gleichzeitig die Prüfung zum Gabelstaplerfahrer ablegen – und dabei in beiden Bereichen die Bestnote erzielen.

Auf den Anzeigetafeln:

Auf WorldArena, MotuBrain belegte den ersten Platz in den Kategorien Bewegungsqualität und Bewegungsflüssigkeit
Auf RoboTwin 2.0, MotuBrain war das einzige Modell, das in randomisierten Umgebungen einen Wert von über 95 erzielte

In den letzten Jahren war es schon schwierig, in nur einer dieser Prüfungen hervorragende Leistungen zu erbringen.
Beides gleichzeitig auf die Spitze treiben? Das hatte noch niemand zuvor geschafft.

Nun sagt Shengshu Technology: eins MotuBrain Das Modell reicht aus.

Warum MotuBrain aus einem Videounternehmen hervorgegangen ist

Auf den ersten Blick klingt es seltsam – ein Videounternehmen, das Robotergehirne entwickelt. Aber dahinter steckt eine tiefgreifende Logik.

Die Zukunft der verkörperten Intelligenz erfordert ein Weltaktionsmodell. Und dieses muss auf Videomodellen aufbauen, die die physische Welt verstehen.

In einem Video über Driftfahren muss das Modell beispielsweise Folgendes verstehen:

Warum das Auto abbiegt
Warum die Reifen qualmen
Wie es weitergeht

So gesehen ist es nicht verwunderlich, dass MotuBrain hat seinen Hintergrund im Bereich „Video first“.

MotuBrain Performance: An der Spitze beider Ranglisten

MotuBrain hat sowohl WorldArena als auch RoboTwin2.0 still und leise übertrumpft und damit in der gesamten Branche Neugier geweckt.

Nach wochenlangen Spekulationen bestätigte Shengshu Technology dies schließlich am 29. April.

Rückblickend gab es bereits Hinweise darauf.

Im Dezember 2025 stellte Shengshu „Motus“, ein allgemeines grundlegendes Weltmodell, als Open-Source-Projekt zur Verfügung. Weniger als vier Monate später, MotuBrain ist da – eine umfassend überarbeitete kommerzielle Version mit entscheidenden Funktionsverbesserungen.

MotuBrain auf WorldArena: Die physikalische Welt verstehen

WorldArena fragt:

Wenn du ein Objekt schiebst, wohin bewegt es sich dann?
Was passiert, wenn zwei Objekte zusammenstoßen?
Sind die Bewegungsabläufe flüssig und realistisch?

Zu den Kennzahlen gehören:

Qualität der Bewegung
Flow-Score
Bewegungsflüssigkeit

Stand: 21. April, MotuBrain belegte in allen drei Bereichen den ersten Platz.

Das zeigt MotuBrain erreicht eine umfassende Führungsrolle im Bereich des physikalischen Verständnisses.

MotuBrain auf RoboTwin 2.0: Handeln in der realen Welt

RoboTwin 2.0 bietet 50 Aufgaben:

Greifen, Platzieren, Schieben, Ziehen, Drehen

Zwei Umgebungen:

Sauber (festgelegte Bedingungen)
Zufällig (Wechsel von Positionen, Beleuchtung und Blickwinkeln)

MotuBrain Ergebnis:

95,8 (unbearbeitet)
96,1 (randomisiert)

Es ist das einzige Modell, das in randomisierten Studien einen Wert über 95 erreicht.

Aufgabenübergreifend:

90% erzielte mehr als 90 Punkte
Die Hälfte hat die 100 erreicht

Das ist nicht nur ein Vorsprung – das ist ein deutlicher Abstand.

MotuBrain verbindet Weltverständnis und Handeln

Ein Test misst das “Verständnis”.”
Die anderen Tests “Aktion”.”

Traditionell handelt es sich dabei um getrennte Systeme.

MotuBrain beweist, dass sie in einem einzigen Modell vereint werden können – ein entscheidender Durchbruch für die verkörperte KI.

MotuBrain-Praxisdemo: Roboter, die beim Handeln denken

Aus der offiziellen Demo, MotuBrain zeigt eine hohe Praxistauglichkeit.

Drei humanoide Roboter haben fünf Aufgaben erfüllt:

Blumenarrangements
Das Sofa aufräumen
Hotpot servieren
Cocktails mixen
Ein Waschbereich einrichten

Ein MotuBrain, mehrere Robotertypen

MotuBrain funktioniert mit verschiedenen Roboterkörpern und Sensoren.

Je mehr Roboter daran angeschlossen sind, desto besser funktioniert es.

Langfristige Aufgaben mit MotuBrain

Aufgaben wie das Arrangieren von Blumen erfordern eine kontinuierliche Planung.

Der Roboter:

Pflückt Blumen
fügt sie ein
gießt sie

Reibungslos und ohne Unterbrechungen – dank MotuBrain.

MotuBrain beweist Verständnis, bevor es zur Tat schreitet

In einem Hotpot-Szenario:

Der Roboter prüft, ob die Schöpfkelle leer ist, bevor er erneut schöpft.

Das zeigt MotuBrain kann:

Den aktuellen Stand erfassen
Ergebnisse vorhersagen
Aktionen anpassen

Im Gegensatz zu herkömmlichen Robotern wiederholt er nicht einfach blindlings.

Multitasking-Fähigkeit von MotuBrain

Beim Mixen von Getränken:

Mit einer Hand gießt man Flüssigkeit
Der andere schenkt Milch ein
und fügt sie dann zusammen
Garnitur hinzufügen

Dies spiegelt wider MotuBrain’s Fähigkeit zur Generalisierung bei mehreren Aufgaben.

Warum MotuBrain funktioniert: Das Weltaktionsmodell

Es gibt drei Hauptansätze:

Direkte Aktion (VLA)
Erst vorhersagen, dann handeln
Der Ansatz von MotuBrain: Gemeinsam vorausschauen und handeln

Vorteile von MotuBrain:

Schnellere Reaktion
Eine gemeinsame Darstellung verringert Fehler

Es funktioniert wie beim menschlichen Fahren – Vorausschau und Reaktion erfolgen gleichzeitig.

MotuBrain-Kerntechnologie: Einheitliche Modellierung

MotuBrain baut auf Motus auf:

Vereint Video und Action
Verwendet ein gemeinsames Darstellungssystem

Es ermöglicht:

Integration von Wahrnehmung, Sprache und Handeln
Weltmodellierung
Videoproduktion
Inverse Dynamik
Gemeinsame Prognose

Das haben wir alle gemeinsam gelernt MotuBrain.

Praktische Vorteile von MotuBrain

MotuBrain löst praktische Probleme:

Funktioniert mit verschiedenen Kamerakonfigurationen
Versteht natürliche Sprache
Übertragungen zwischen Robotern
Bewältigt langwierige Aufgaben

Je vielfältiger die Aufgaben sind, desto besser wird die Leistung – ein entscheidender Vorteil.

MotuBrain und Vidu: Eine Doppelstrategie

Die Strategie von Shengshu umfasst:

Digitale Welt → Vidu
Physikalische Welt → MotuBrain

Beide basieren auf derselben technischen Grundlage.

Der Wettbewerbsvorteil von MotuBrain

Den meisten Robotikunternehmen fehlen Videodaten.
Den meisten Videounternehmen fehlen Nutzungsdaten.

MotuBrain profitiert von beidem.

Diese Kombination schafft einen starken Wettbewerbsvorteil.

MotuBrain und die Zukunft der Robotergehirne

Der Fokus der Branche verlagert sich:

Von Roboter-Körpern → zu Roboter-Gehirnen

Kapital fließt in Unternehmen, die Systeme wie MotuBrain.

Sie konkurrieren um die Schnittstelle der Zukunft zur physischen Welt.

Im Moment, MotuBrain zeichnet sich durch eine doppelte Dominanz bei den Benchmarks aus.

Während andere über Ansätze diskutieren, MotuBrain zeigt, dass ein einheitlicher Weg möglich ist.

Wenn Videomodelle der KI helfen, die Welt zu verstehen,
dann MotuBrain bedeutet den Schritt hin zum tatsächlichen Handeln.