Google stellt die „Robotics Constitution“ vor, um die Entscheidungsfindung von KI-Droiden zu verbessern

In einem bahnbrechenden Schritt hat das DeepMind-Robotikteam von Google drei bedeutende Fortschritte eingeführt, die darauf abzielen, die Entscheidungsfähigkeit von Robotern zu verbessern, die in Outdoor-Umgebungen arbeiten. Zu diesen Innovationen gehört ein einzigartiges System zum Sammeln von Trainingsdaten, begleitet von dem, was Google die „Robot Constitution“ nennt. Diese Entwicklung soll es Robotern ermöglichen, schnellere, intelligentere und sicherere Entscheidungen zu treffen und gleichzeitig mit Menschen zusammenzuarbeiten.

AutoRT: ein fortschrittliches Datenerfassungssystem

AutoRT von DeepMind ist ein hochmodernes Datenerfassungssystem, das Robotern die Möglichkeit gibt, ihre Umgebung zu verstehen, sich an neue Situationen anzupassen und die am besten geeigneten Aufgaben auszuwählen. Es nutzt sowohl ein visuelles Sprachmodell (VLM) als auch ein großes Sprachmodell (LLM), die harmonisch zusammenarbeiten.

Der VLM ist dafür verantwortlich, die Umgebung des Roboters wahrzunehmen und sichtbare Objekte zu identifizieren. In der Zwischenzeit fungiert der LLM als Entscheidungsträger und schlägt Aufgaben vor, die der Roboter ausführen kann. Dieser Dual-Modell-Ansatz ermöglicht es Robotern, fundierte Entscheidungen zu treffen und ihre Umgebung effizienter zu navigieren.

Inspiriert von Asimovs „Drei Gesetze der Robotik“.

Die Roboterverfassung, inspiriert von den „Drei Gesetzen der Robotik“ des visionären Science-Fiction-Autors Isaac Asimov, fungiert als eine Reihe von Sicherheitsrichtlinien für künstlich intelligente Roboter. Diese Verfassung weist den LLM an, Aufgaben zu vermeiden, an denen Menschen, Tiere, scharfe Gegenstände und Elektrogeräte beteiligt sind, um die Sicherheit sowohl von Robotern als auch ihrer menschlichen Gegenstücke zu gewährleisten.

Verstärkte Sicherheitsmaßnahmen

DeepMind hat zusätzliche Vorkehrungen getroffen, um die Sicherheit dieser Roboter zu verbessern. Wenn die Kraft auf die Gelenke eines Roboters einen vorgegebenen Grenzwert überschreitet, stoppt der Roboter automatisch. Darüber hinaus steht menschlichen Bedienern ein physischer Notausschalter zur Verfügung, der es ihnen ermöglicht, die Roboter bei Bedarf zu deaktivieren, was für zusätzliche Sicherheit sorgt.

Praxisnahe Tests und Bereitstellung

Innerhalb von nur sieben Monaten hat Google erfolgreich 53 AutoRT-Roboter in vier Bürogebäuden eingesetzt. In dieser Zeit führten sie über 77.000 Versuche durch, um die Fähigkeiten der Roboter zu testen. Einige dieser Roboter wurden von menschlichen Bedienern ferngesteuert, während andere vordefinierten Skripten folgten oder autonom mithilfe des KI-Lernmodells Robotic Transformer (RT-2) von Google arbeiteten.

Diese Roboter haben vor allem ein praktisches Erscheinungsbild und sind mit einer Kamera, einem Roboterarm und einer mobilen Basis ausgestattet. Das Visual Language Model (VLM) ist entscheidend dabei, ihre Umgebung zu verstehen und Objekte zu identifizieren, während das Large Language Model (LLM) bei der Entscheidungsfindung hilft und dafür sorgt, dass die Roboter Aufgaben effektiv und sicher ausführen.

Vorstellung von SARA-RT: ein Durchbruch in Sachen Effizienz

Einer der bedeutendsten Durchbrüche bei diesen Bemühungen ist die Einführung von Self-Adaptive Robust Attention for Robotic Transformers (SARA-RT). Dieses System wurde entwickelt, um Robotics Transformer (RT)-Modelle zu optimieren und sie in realen Anwendungen effizienter zu machen.

Die Architektur des neuronalen RT-Netzwerks, die eine entscheidende Rolle bei den neuesten Fortschritten bei Robotersteuerungssystemen gespielt hat, insbesondere beim hochmodernen RT-2-Modell, hat erhebliche Verbesserungen erfahren. Die leistungsstärksten SARA-RT-2-Modelle zeigten eine bemerkenswerte Verbesserung der Genauigkeit um 10,6 % und eine Steigerung der Geschwindigkeit um 14 % gegenüber ihren RT-2-Gegenstücken, und das alles unter Verwendung eines prägnanten Bildverlaufs als Eingabe.

Ein Wendepunkt für die Effizienz der Robotik

Die Einführung von SARA-RT gilt als Wendepunkt im Bereich der Robotik. Es stellt den ersten skalierbaren Aufmerksamkeitsmechanismus dar, der die Recheneffizienz erheblich verbessert, ohne die Qualität der Entscheidungsfindung zu beeinträchtigen. Diese Entwicklung soll die Art und Weise, wie Roboter in realen Szenarien agieren, revolutionieren und sie leistungsfähiger, effizienter und sicherer machen.

Die jüngsten Fortschritte des DeepMind-Robotikteams von Google in der KI-gesteuerten Robotik, einschließlich der Einführung einer „Robotics Constitution“ und des innovativen SARA-RT-Systems, stellen einen bedeutenden Fortschritt in der Welt der Robotik dar. Von diesen Innovationen wird erwartet, dass sie die Entscheidungsfähigkeit von Robotern in Outdoor-Umgebungen verbessern und sie intelligenter, sicherer und effizienter machen. Anhand realer Tests und beeindruckender Ergebnisse ist Googles Engagement für die Weiterentwicklung des Bereichs Robotik klar erkennbar und verspricht eine Zukunft, in der Roboter und Menschen nahtlos und sicher zusammenarbeiten können.