Holodeck

Ich komme aus der letzten analogen Generation. Magnetische und mechanische Datenspeicher üben eine gewisse Faszination auf mich aus.

Und ich weiß, was das mit dem Bleistift und der Kassette auf sich hat.

Transparente Musikkassette mit braunem Band und gelber Bleistift auf weißem Hintergrund. Die Kassette ist mit dem Buchstaben
Von: Kay Helena

Und gleichzeitig lebe ich zu einer Zeit, in der auch ohne KI der Fortschritt der letzten 40 Jahre vollkommen irrwitzig ist. Heutige Handys waren früher mal Großrechner. Wissen ist im Übermaß zu jeder Zeit und an jedem Ort verfügbar. Digitalisierung ermöglicht Zusammenarbeit in einem Umfang und einer Geschwindigkeit, die früher nicht zu träumen waren.

Ich habe mir bisher im Laufe der Zeit verschiedene Dinge angeeignet, wenn ich etwas tun wollte, es aber noch nicht konnte. Es ging nicht anders – und ich finde es auch gut so. Es macht das Leben interessanter.

Aber seit KI breit verfügbar ist, haben wir eine interessante neue Möglichkeit: Wir können Dinge tun, die wir überhaupt nicht mehr verstehen müssen um sie zu tun.

Es ist ein wenig wie das Holodeck der NCC 1751-D USS Enterprise: Wir sagen was wir möchten – und es entsteht vor unseren Augen.

Futuristische Hologramm-Darstellung der Erde mit Datenvisualisierungen auf einer technologischen Plattform. Digitale Interfac
Von: Kay Helena (mit KI generiert)

Im Kern kann ich neben das Internet als Quelle für Wissen und Informationen nun eine KI als Quelle von Möglichkeiten und Methoden stellen – und davon lernen.

Ich habe unten den Beweis angehangen. Ein Pong-Spiel, in dem du gegen ein strohdummes neuronales Netzwerk spielen kannst. Das Netzwerk weiß zu Anfang nicht, was es tun soll – wird aber für erfolgreiches Verhalten belohnt.
Auf dieses Netzwerk wirkt ein genetischer Algorithmus, der das neuronale Netzwerk einer Evolution unterwirft, an deren Ende es immer noch strohdumm ist – dich aber besiegen wird.

Weder von neuronalen Netzwerken hatte ich Ahnung, noch von genetischen Algorithmen. Habe ich auch jetzt nicht – aber ich kann mir inzwischen etwas darunter vorstellen und damit experimentieren – weil eine KI mir die Notwendigkeit erspart, Dinge zu lernen, die ich weder im Alltag noch im Broterwerb brauche, aber für so ein Experiment Voraussetzung sind.

Ich habe inzwischen eine Entwicklungsumgebung für WordPress-Plugins, so dass ich sie mitsamt ihren Sub-Agenten und Voreinstellungen nutzen konnte (auch ein Lernprozess).

Die anfängliche Aufgabe hieß:

Programmiere einen Gutenberg-Block1, der Neuronale Netze und genetische Algorithmen veranschaulicht. Einen Demonstrator. Ich schlage vor, dass ein Netzwerk gegen einen menschlichen Spieler Pong spielt und je nach Erfolg durch genetische Algorithmen eine Evolution erfährt.
Mache einen Plan und besprich ihn mit mir. Nach Genehmigung wirst du die Aufgabe solange mit deinen Sub-Agenten Bearbeiten, bis der am Plan gemessene Erfüllungsgrad 100% beträgt. Du arbeitest autonom – Token-Limit 5M. Fragen stellst du am Anfang – ansonsten nur, wenn du ohne Antworten deine Aufgabe nicht abschließen kannst. Verwende hochwertige Quellen für fehlendes Wissen. Keine Spekulationen zulässig.

Was soll ich sagen. Hat geklappt. Dazu gehört noch ein umfangreicher Systemprompt, ein Kontextmanager, diverse Richtlinien… Aber die erspare ich uns.

Das erste Ergebnis war bereits nach 25 Minuten vorhanden und lauffähig.
Das debuggen hat noch eine Weile gedauert. Auch das habe ich, mangels tief gehender Kenntnisse die KI machen lassen.

Nun konnte ich durch Änderungen am Programm oder an Parametern probieren, was dies und das bei neuronalen Netzen bewirkt und wie genetische Algorithmen funktionieren können.
Davon „weiß“ ich noch immer nicht viel darüber… Aber ich habe eine konkretere Vorstellung davon bekommen.

Neuronale Netze

Links
Rechts
Gen0
Best
Avg
Diversität
Tot
FPS

Top Agenten

Fitness-Verlauf

Genetische Diversität

Wie funktioniert das?

Neuronales Netz

Jeder KI-Agent besitzt ein neuronales Netz mit 10 Eingabewerten: Gegner-Y, Gegner-Geschwindigkeit, eigenes Paddle-Y, eigene Geschwindigkeit, Abstände zu Ober- und Unterkante, Ball-X, Ball-Y, Ball-vX, Ball-vY. Als Ausgabe steuert es das Paddle durch Beschleunigung (nicht direkte Geschwindigkeit).

Batch-Training + Showcase

In jeder Generation spielen alle Agenten zunächst headless (unsichtbar, sofort). Danach spielen die besten zwei Agenten ein sichtbares Showcase-Spiel. Erst nach dem Showcase wird die nächste Generation gestartet.

Fitness = Reflexionen

Die Fitness misst, wie oft ein Agent den Ball zurückgespielt hat. Agenten mit null Reflexionen gelten als ‚tot‘ und werden in der nächsten Generation nicht berücksichtigt.

Genetischer Algorithmus

Die fittesten Agenten überleben und dürfen sich fortpflanzen. Als Partner wird jeweils derjenige gewählt, der möglichst fit UND genetisch möglichst anders ist – so bleibt die Population vielfältig und lernt schneller.

Bestes Genom
  1. Einen Baustein, den ich in WordPress verwenden kann, um ihn in diesen Beitrag einzufügen []
Avatar von Kay Helena

Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert