Von starrer Automatisierung zu physischer KI: Die 4 Stufen der KI-gestützten Robotik, die Sie kennen sollten
- Stephan Hotz

- 12. Aug.
- 8 Min. Lesezeit
Aktualisiert: 2. Sept.

Ein pragmatischer Leitfaden für KI in der industriellen Automatisierung
Künstliche Intelligenz (KI) verändert die Robotik und industrielle Automatisierung und treibt die Branche von starren, regelbasierten Systemen hin zu flexibler, kontextbewusster Autonomie.
Da sich KI jedoch rasend schnell weiterentwickelt, kann man sich leicht in der Hype-Welle verlieren.
Dieses Positionspapier stellt ein pragmatisches 4-Stufen-Modell vor, das dabei hilft, den aktuellen Stand der KI in der Robotik zu bewerten. Jede Stufe wird aus zwei wichtigen Blickwinkeln betrachtet:
Roboterperspektive: Was Roboter auf dieser Ebene tatsächlich leisten können
Entwicklerperspektive: Wie Entwickler Roboter bauen und mit ihnen interagieren
Die überwiegende Mehrheit der heute eingesetzten Automatisierungssysteme arbeitet noch auf Stufe 0 oder Stufe 1.
Stufe 2, auf der KI die Entwicklung ergänzt, gewinnt zunehmend an Bedeutung. Die Stufen 3 und 4, die erlernte Verhaltensweisen und agentenbasierte Autonomie umfassen, beginnen sich zu etablieren, erfordern jedoch eine grundlegend neue Art von Plattform.
Wandelbots NOVA wurde als solche Plattform entwickelt. Das Wandelbots NOVA-Betriebssystem (OS) und die NOVA Cloud bieten die Infrastruktur, um die Entwicklung zu vereinheitlichen, eine groß angelegte Datenerfassung zu ermöglichen und moderne KI-Workflows auf realer Roboterhardware einzusetzen, wodurch die industrielle Realität von heute mit der intelligenten Automatisierung von morgen verbunden wird.
Die industrielle Automatisierung tritt in ihre KI-Ära ein
KI verändert die Landschaft der Robotik und industriellen Automatisierung grundlegend.
Die Geschwindigkeit, Flexibilität und Intelligenz, die KI-Systeme mit sich bringen, definieren neu, was Maschinen leisten können. Sie erschließen ein bisher unvorstellbares Maß an Produktivität, Anpassungsfähigkeit und Betriebsumfang. KI ist keine futuristische Vision mehr, sondern die treibende Kraft hinter den modernsten Fertigungs- und Robotersystemen von heute.
Doch mit den Chancen geht auch Komplexität einher.
Die rasante Entwicklung der KI hat eine unglaubliche Fülle an Tools, Modellen, Ansätzen und Richtungen hervorgebracht. Für Fachleute und Entscheidungsträger ist es wichtiger denn je, den aktuellen Stand der KI in der Robotik- und Automatisierungsbranche klar zu verstehen. Eine fundierte Perspektive hilft dabei, sich in dieser Landschaft zielgerichtet zu orientieren und Initiativen zu priorisieren, die einen echten Mehrwert bieten.
In diesem Umfeld voller Hype und hoher Erwartungen ist es unerlässlich, zwischen Schlagworten und echten technologischen Durchbrüchen zu unterscheiden. Dieser Artikel bietet einen strukturierten Rahmen, der Ihnen hilft zu beurteilen, wo KI in der Robotik konkrete Fortschritte macht, wo das größte Potenzial liegt und worauf Sie sich konzentrieren sollten, um praktische Auswirkungen zu erzielen.
Analyse des Status quo
Um sich im sich schnell entwickelnden Bereich der Robotik und KI zurechtzufinden, gliedert dieses Rahmenwerk die Entwicklung in Stufen, die sowohl die aktuellen Fähigkeiten als auch das zukünftige Potenzial verdeutlichen. Diese Stufen bieten Klarheit aus zwei Perspektiven: aus der Sicht der Roboterlösung, welche Aufgaben Roboter zuverlässig ausführen können, und aus der Sicht der Entwickler, wie Ingenieure und Programmierer mit Robotersystemen interagieren. Durch die Unterscheidung zwischen Reifegraden können Sie sowohl das Potenzial als auch die aktuellen Grenzen der KI in der Automatisierung besser einschätzen.

Level 0: Heuristik & Optimierer (keine KI)
Definition: Automatisierungsintelligenz auf Basis fest codierter Regeln, Parameteroptimierungen oder einfacher Regelkreise ohne Lernprozess.
Roboteransicht: Führt feste Aufgaben und Programme mit hoher Präzision aus, jedoch ohne Flexibilität. Typische Beispiele sind Schweiß-, Klebe- oder Palettierungsroutinen in streng kontrollierten Umgebungen.
Entwicklerperspektive: Programmiert den Roboter über proprietäre Sprachen oder Logikblöcke (z. B. RAPID, KRL, SPS). Alle Verhaltensweisen müssen explizit definiert und abgestimmt werden.
Beispiel: Ein KUKA-Roboter punktschweißt einen Fahrzeugrahmen auf einer festen Vorrichtung.
Wandelbots NOVA Kontext: NOVA ermöglicht moderne Programmieransätze auch für traditionelle regelbasierte Aufgaben, indem es herstellerspezifischen Code in Python abstrahiert und ein Zellenbetriebssystem für Bereitstellungs- und Komfortfunktionen bereitstellt. Der Intelligenzgrad bleibt unverändert, sofern keine höherwertigen Tools kombiniert werden. Die Zusammenführung aktueller Roboterzellen auf einer einheitlichen Plattform und in einer einzigen Sprache bei gleichzeitiger Öffnung proprietärer Steuerungssysteme für die Datenerfassung bildet einen entscheidenden Baustein für Physical AI.
Level 1: KI-gestützte Wahrnehmung (aufgabenspezifische, hochspezialisierte KI)
Definition: Aufgabenspezifische KI-Modelle, meist im Bereich der Bildverarbeitung, die es Robotern ermöglichen, Objekte oder Merkmale zu erkennen. Keine Schlussfolgerungen oder Lernprozesse über das anfängliche Training hinaus.
Roboterperspektive: Erlangt Wahrnehmungsfähigkeiten (z. B. Teile sehen, Fehler erkennen), um die Flexibilität in halbstrukturierten Umgebungen zu verbessern.
Entwicklerperspektive: Integriert vortrainierte Bildverarbeitungsmodelle oder -tools (z. B. Cognex, Zivid) in Roboter-Workflows für Pick-and-Place-, Inspektions- oder Schleifaufgaben.
Beispiel: Ein Yaskawa-Roboter scannt mit einer Kamera ein Werkstück, erstellt aus dem Scan eine 3D-Punktwolke und nutzt einen algorithmischen Pfadplaner, um einen Roboterpfad zu definieren und auszuführen.
Wandelbots NOVA Kontext: Bildverarbeitungsfunktionen sind und können in das Python-SDK von NOVA integriert werden, wo Objekterkennungsmodelle bestimmte Roboteraufgaben basierend auf Koordinaten oder fortschrittlichen Pfadplanern auslösen.
Level 2: KI-gestützte Programmierung (KI unterstützt den Entwickler)
Definition: KI unterstützt den Entwicklungsprozess durch Code-Vorschläge, Eingabeaufforderungen in natürlicher Sprache, Vibe-Coding oder adaptive Trajektoriengenerierung. Dies wird noch leistungsfähiger, wenn die Roboterkonfiguration mit Bildverarbeitungssystemen und Sensoren ausgestattet ist und die Programmierung weiter abstrahiert werden kann.
Roboterperspektive: Nach wie vor auf Programmierung angewiesen, jedoch mit größerer Flexibilität bei der Ausführung (z. B. Wegplanung, Interpolation).
Entwicklerperspektive: Verwendet Tools wie GitHub Copilot, LLMs oder benutzerdefinierte SDKs (z. B. NOVA Python SDK), um die Entwicklung durch Codegenerierung oder sogar einfach durch Vibe Engineering (Eingabeaufforderungen in natürlicher Sprache zur Generierung ausführbarer Fähigkeiten) zu beschleunigen.
Beispiel: Ein Entwickler optimiert eine Pick-and-Place-Anwendung mithilfe von KI-generiertem Python-Code in Microsoft Visual Studio Code (VS Code) mit Echtzeit-Simulation in NVIDIA Omniverse oder Rerun.
Wandelbots NOVA-Kontext: Entwickler verwenden NOVA Developer Tools, insbesondere die VS Code-Erweiterung, um KI-generierten Code in ihren Workflow zu integrieren. AI-Unterstützung im Stil von GitHub Copilot hilft beim Schreiben und Ändern von NOVA-Programmen und reduziert so die Einarbeitungszeit für Nicht-Experten. Da die Roboterprogrammierung in Wandelbots NOVA auf Python und dem praktischen SDK basiert, das als Standardpaket für Entwickler enthalten ist, ist sie bereit für die Verbindung mit modernsten AI-Modellen, die in Python entwickelt wurden.
Level 3.1: Lernfähige Bewegungsintelligenz (KI-gesteuerte Systeme, die sich schnell anpassen)
Definition: Roboter führen Trajektorien aus, die durch eine gelernte Richtlinie erzeugt werden, die mittels groß angelegter Vision-Language-Action (VLA)-Imitation oder Reinforcement Learning (RL) trainiert wurde. Diese Richtlinie beherrscht einfache Bewegungen in dynamischen Szenen und lässt sich auf verschiedene Teile und Posen übertragen.
Roboterperspektive: Führt komplexe Trajektorien aus, die aus unüberwachtem (oder schwach überwachtem) Training hervorgehen – oft zunächst in einer Simulation – anstatt manuell programmiert zu werden.
Entwicklerperspektive: Anstatt Bewegungscode zu schreiben, kuratieren Ingenieure Demonstrationen, Simulationsszenarien und Belohnungsanpassungen. Das Training läuft auf Simulatoren wie NVIDIA Omniverse/Isaac Sim. Die Strategie wird dann über eine Laufzeitumgebung wie Wandelbots NOVA bereitgestellt.
Beispiel: Ein Roboterarm, der als VLA-Modell auf Millionen von Vision-Sprache-Aktion-Paaren vortrainiert und dann in der Simulation leicht feinabgestimmt wurde, um eine flexible Dichtung aufzunehmen. Die endgültige Richtlinie kann mit minimalen Anpassungen auf die reale Zelle übertragen werden.
Wandelbots NOVA Kontext: Die Low-Level-Bewegungsabstraktion von NOVA und die Omniverse-Konnektivität ermöglichen es Entwicklern, VLA/RL-Richtlinien auf verschiedenen Hardwaretypen zu optimieren oder zu validieren, bevor sie in Produktion gehen. Darüber hinaus fungiert NOVA Cloud als Datensammler für alle Roboterzellen und Systeme, die unter NOVA OS laufen, und bildet somit das Datenrückgrat, das Reinforcement Learning in der gesamten Fertigung ermöglicht.
Level 3.2: Kontextbewusste agentenbasierte KI (gelernte Planungsintelligenz)
Definition: Systeme, die die Umgebung und Absichten verstehen, einen übergeordneten Befehl in eine Abfolge von Fähigkeiten zerlegen und diese Fähigkeiten autonom ausführen, wodurch sie vollständige Planungsintelligenz bieten.
Roboterperspektive: Ein einziger Sprachbefehl („Befestige diese Halterung“) löst die Wahrnehmung, die Zerlegung der Aufgabe und die dynamische Verkettung von Fähigkeiten aus, was für hochdynamische Produktionsumgebungen und Allzweck- oder humanoide Roboter unverzichtbar ist.
Entwicklerperspektive: Der Fokus verlagert sich auf die Integration einer modularen Bibliothek mit Aktions- und Wahrnehmungsfähigkeiten, die Systemintegration und die Bereitstellung multimodaler Daten (z. B. 2D/3D-Sicht, Sensordaten und technische Asset-Eingaben) sowie auf effektive Eingabeaufforderungen.
Beispiel: Ein humanoider Roboter interpretiert den Befehl „Befestige diese Halterung“ über seinen VLA-Planer und wählt dann verifizierte Fähigkeiten aus: Halterung erkennen → greifen → ausrichten → festschrauben.
Wandelbots NOVA Kontext: NOVA ist als Ausführungsebene in einem breiteren Agenten-Stack positioniert. Seine API ermöglicht die nahtlose Ausführung von Fähigkeiten innerhalb mehrstufiger Prozesse, die von einem Planungsmodell bereitgestellt werden, das in der Cloud oder in einer lokalen Infrastruktur ausgeführt wird.
Level 4: Superintelligente KI (die längerfristige Zukunft)
Definition: Theoretische KI übertrifft die menschliche Intelligenz in allen Dimensionen, einschließlich Kreativität, Strategie und körperlicher Koordination.
Robotik-Kontext: Eine unabhängige KI auf Managementebene, die Roboterflotten, Infrastruktur und sogar die Steuerung einer gesamten Fabrik verwaltet.
Beispiel: In Science-Fiction-Filmen wie „Her“, „HAL 9000“ oder „Ex Machina“ populär gemacht, aber heute noch keine Realität ... noch nicht.
Level 3 mit Wandelbots NOVA in die Praxis umsetzen
Overview
Um die Fähigkeiten von NOVA als robuste Datenerfassungs- und Ausführungsschicht für moderne Roboterlern-Workflows zu bewerten, wurde innerhalb von Omniverse Isaac Sim eine Closed-Loop-Konfiguration erstellt. In dieser Umgebung wurde die bekannte Push-T-Aufgabe mithilfe eines UR-Robotermodells aus dem NOVA-Asset-Paket nachgebildet.
Das Ziel: Den Roboter so zu steuern, dass er ein T-förmiges Objekt über einen Tisch in einen bestimmten Zielbereich schiebt. Mit Hilfe von NOVA Omniservice wurde die virtuelle Szene orchestriert, simulierte Kameras wurden angeschlossen und die API von NOVA wurde genutzt, um den Roboter zu steuern und propriozeptive Daten (Gelenkpositionen, Endeffektor-Pose) während der menschlichen Demonstration zu sammeln. Die Daten wurden über mehrere Dutzend Episoden hinweg gesammelt, wobei der Roboter über einfache Tastatureingaben gesteuert und die Echtzeitsimulation in Isaac Sim überwacht wurde. Anschließend wurde eine Diffusionsrichtlinie von Grund auf trainiert, die es dem Roboter ermöglichte, das Objekt allein auf der Grundlage von Kameraeingaben und den propriozeptiven Daten des Roboters erfolgreich an sein Ziel zu schieben.
Wichtige Erkenntnisse
NOVA war als „Bindeglied“ zwischen der Simulationsumgebung und der Robotersteuerung von unschätzbarem Wert. Seine Asset-Bibliothek beschleunigte die Zellkonfiguration, der Omniverse Connector übernahm die Randomisierung der Umgebung und die Datenerfassung, und NOVA OS übersetzte die Policy-Ausgaben in Roboterbewegungen. Es wurden die Datensätze und Trainingshilfsprogramme von LeRobot sowie die Tools für die Datenaggregation und das Modelltraining verwendet. Trotz der Benutzerfreundlichkeit des LeRobot-Frameworks und der ermutigenden Unterstützung durch die Community unterstrich die mangelnde Unterstützung für Industrieroboter die einzigartige Stärke von NOVA als Ausführungsgrundlage für reale Anwendungsfälle.
Auswirkungen
Die schnelle Synchronisierung von Kamera-Feeds, propriozeptiven Signalen und Sensordaten, wenn sich die GPUs, auf denen die Richtlinie gehostet wird, und die Controller auf unterschiedlichen Maschinen befinden, hat einen klaren Schwachpunkt aufgezeigt. Mit Blick auf die Zukunft werden optimierte Cloud-Pipelines für die automatisierte Datenerfassung, -vorverarbeitung und -überwachung unerlässlich sein, da multimodale Sensorik in der Fertigung immer mehr Verbreitung findet. Während NOVA die Einrichtung, das Laufzeitmanagement und die Robotersteuerung in der Simulationsumgebung vereinfacht, wird sich die zukünftige Arbeit auf die vollständige Automatisierung von Datenpipelines und die Bereitstellung schlüsselfertiger Inferenztools konzentrieren, die vortrainierte Modelle direkt mit Industrierobotern in Simulations- und Produktionsumgebungen verbinden. Dies ermöglicht eine detaillierte Überwachung der Leistung an einem Ort. Somit ist NOVA bereits heute gut positioniert, um Entwicklern dabei zu helfen, mit ihren Robotik- und Automatisierungsprojekten in Level 3 einzusteigen. Es ist auch einzigartig positioniert, um Entwicklern und Unternehmen dabei zu helfen, das allgemein anerkannte Problem des Datenmangels zu überwinden, das einer breiteren Anpassung physischer KI-Anwendungen in tatsächlichen Industrieumgebungen im Wege steht.

Fazit
Die produktivste Roboterautomatisierung in der Industrie arbeitet heute noch auf Stufe 0 und Stufe 1.
Diese Systeme sind ausgereift, zuverlässig und tief in die Fertigungsprozesse integriert, aber sie sind grundsätzlich durch starre Logik und hochspezialisierte KI eingeschränkt.
Derzeit gewinnt Level 2 zunehmend an Bedeutung, wo KI-gestützte Tools beginnen, die Entwicklung von Roboteranwendungen zu verbessern. Die Programmierung wird zugänglicher, die Arbeitsabläufe flexibler und die Integration mit KI-Tools immer häufiger. Um jedoch das Potenzial der nächsten Automatisierungsgeneration (Level 2 und Level 3) voll auszuschöpfen, ist eine neue Art von Plattform erforderlich.
Herkömmliche Roboter-Software-Stacks wurden nicht für die Unterstützung moderner KI-Workflows entwickelt. Um die heutigen Grenzen zu überwinden, sind folgende Voraussetzungen erforderlich:
Eine gemeinsame Abstraktionsschicht zur Vereinheitlichung der Programmierung über Roboterhersteller und Schnittstellen hinweg
Offene APIs und Datenzugriff zur Erfassung und Nutzung des gesamten Kontexts der Roboterausführung
Unterstützung für Feedback, Datenerfassung und Iterationsschleifen
Nahtlose Integration von Simulations-, Trainings- und Bereitstellungsumgebungen
Infrastruktur für die Bereitstellung und Ausführung von Fähigkeiten zur Laufzeit
Wandelbots NOVA wurde genau für diesen Wandel entwickelt. Es dient als Betriebssystem und Plattformschicht, die die KI-gestützte Entwicklung mit dem realen industriellen Einsatz verbindet. Durch die Möglichkeit der Python-basierten Programmierung, der strukturierten Datenerfassung und der Ausführung von Laufzeitrichtlinien über heterogene Roboter hinweg ebnet NOVA Entwicklern und Unternehmen den Weg, um schon heute intelligente Robotik zu entwickeln und einzusetzen.
Während sich die KI weiterentwickelt, bildet Wandelbots NOVA die Grundlage für den Übergang von der Automatisierung zur echten Autonomie.


