Leipziger Forschern ist es gelungen, in Computersimulationen künstliche Wesen mit kreativem Eigenleben und spontanem Neugierverhalten zu erschaffen.
Aus: Spektrum der Wissenschaft, Februar 2010
Heutige Roboter kranken daran, dass sie nur das können, was ihnen explizit einprogrammiert wurde. Sie sind mit einem möglichst umfassenden Satz von Regeln für jede Eventualität ausgestattet. Das macht sie starr im Verhalten und anfällig gegenüber unvorhergesehenen Situationen. Außerdem wird im Millisekundentakt jeder Parameter neu berechnet. Dadurch bewegen sich die maschinellen Wesen meist langsam und eher unnatürlich.
Neue Bestrebungen gehen dahin, Roboter so zu konstruieren, dass die Physik ihres Körpers ihre Bewegungen zum großen Teil kontrolliert, was den Rechenaufwand stark verringert und die Bewegungen fließender macht. Die Informatiker Ralf Der und Nihat Ay vom Max-Planck-Institut für die Mathematik der Naturwissenschaften in Leipzig sind auf diesem Weg nun ein beträchtliches Stück vorangekommen. Wie sie im Februarheft von Spektrum der Wissenschaft berichten, konnten sie ihre am Computer simulierten Roboter mit einem lernfähigen Selbstmodell dazu bringen, die in der Mechanik ihres Körpers schlummernden Möglichkeiten von sich aus zu entdeckten und kreativ zur Entfaltung zu bringen. Das ging so weit, dass die Kunstwesen mit ihrem Verhalten selbst ihre Schöpfer überraschten, indem sie etwa spontan einen Salto machten, der ihnen nie beigebracht worden war.
Im ersten Schritt ließen Der und Ay ihre simulierten Roboter unablässig eine sensomotorische Schleife durchlaufen – einen Zyklus, in dem eine Steuereinheit auf der Basis von Sensorwerten Motoraktionen veranlasst, welche zu neuen Sensorwerten führen, die dann wieder Ausgangspunkt für neue Motoraktionen sind. Als nächstes fügten die Forscher ein Selbstmodell hinzu. Es sagt die jeweiligen Ergebnisse der Motoraktionen voraus und vergleicht seine Vorhersage mit dem, was tatsächlich geschehen ist. Anhand des Fehlers lernt es, seine Vorhersage zu verbessern.
In einem weiteren Schritt brachten die Leipziger Informatiker die Roboter dazu, sich in ihrem Verhalten auch dem Selbstmodell anzupassen. Das führte zu ungewöhnlichen Bewegungsmustern, weil das Selbstmodell meist dem sich ändernden Verhalten hinterherhinkt und dieses mit seinen Anpassungen an das Selbstmodell ebenso wenig nachkommt. Im jedem Fall hörte der Roboter aber nach einer Weile völlig auf, sich zu bewegen. Das rührt daher, dass das Selbstmodell das Verhalten im Ruhezustand am besten vorhersagen kann.
An dieser Stelle überlegten Der und Ay, wie es wäre, wenn der Roboter in einer zeitumgekehrten Welt existieren würde. Um die Antwort zu erhalten, muss man nur einen Film seines Verhaltens rückwärts ablaufen lassen. Dann aber ist nicht der Ruhezustand stabil, sondern die ständige Bewegung. Ein ruhender Roboter würde also von sich aus Aktivität entfalten.
Leider kann niemand in der realen Welt den Zeitpfeil einfach umkehren. Der Lernvorgang des Selbstmodells aber lässt sich so gestalten, als würde er in einer zeitumgekehrten Welt ablaufen. Dazu muss man das Selbstmodell nur lehren, nicht die alten Sensorwerte zu nehmen und daraus die neuen vorherzusagen, sondern aus den neuen Sensorwerten die alten zu rekonstruieren.
Wie sich zeigte, funktioniert dieser Trick hervorragend. Die Leipziger Forscher mussten ihren Robotern nichts explizit beibringen, sondern sie nur mit der sensomotorischen Schleife und einem in der zeitumgekehrten Welt lernenden Selbstmodell ausstatten. Dann fanden die künstlichen Wesen von sich aus die ihnen gemäßen Bewegungsmöglichkeiten und probierten sie spielerisch aus. Eine Schlange etwa wand sich schlängelnd aus einem Zylinder. Ein hundeartiges Wesen trippelte tänzerisch auf seinen vier Beinen und kletterte sogar von sich aus über einen Zaun. Humanoide Roboter schließlich bewegten sich elegant auf zwei Beinen und vollführten sportliche Kunststückchen wie einen Salto.
So erfindungsreich die künstlichen Wesen sind, so vergesslich sind sie aber auch. Sie probieren immer Neues, setzen das Entdeckte aber nie gezielt zu längeren Bewegungsfolgen zusammen. So fängt der Hund nicht an zu rennen, und auch die Schlange kriecht nicht über eine größere Strecke. Als nächstes wollen Der und Ay ihre Roboter deshalb mit einem Langzeitgedächtnis ausstatten, in dem stabilere Bewegungsmuster abgespeichert werden. Mit ihnen als Bausteinen sollten dann auch komplexere Verhaltensweisen entstehen können. Außerdem eröffnet sich so die Möglichkeit, den selbstbestimmten Entwicklungsprozess von außen durch Lob und Tadel zu steuern.
"Unser Ziel ist die Realisierung einer immerwährenden, weitestgehend selbstbestimmten Entwicklung robotischer Individuen", erklären Der und Ay. Ihre bisher erzielten Ergebnisse haben sie in einer Reihe von Videodemonstrationen dokumentiert, die online zugänglich sind (http://robot.informatik.uni-leipzig.de/videos/).