Holodeck

Un brazo robótico con conexiones de red que brillan en azul imprime un objeto blanco en espiral con una impresora 3D. El ob

Pertenezco a la última generación analógica. Los sistemas de almacenamiento de datos magnéticos y mecánicos me fascinan.

Y sé qué relación hay entre el lápiz y el casete.

Casete de música transparente con cinta marrón y un lápiz amarillo sobre fondo blanco. El casete tiene la letra
Von: Kay Helena

Y, al mismo tiempo, vivo en una época en la que, incluso sin IA, el progreso de los últimos 40 años es una auténtica locura. Los móviles de hoy eran antes superordenadores. El conocimiento está disponible en exceso en cualquier momento y lugar. La digitalización permite una colaboración a una escala y velocidad que antes eran inimaginables.

A lo largo del tiempo, he ido aprendiendo diferentes cosas cuando quería hacer algo pero aún no sabía cómo. No había otra forma, y me parece bien así. Hace que la vida sea más interesante.

Pero desde que la IA está al alcance de todos, tenemos una nueva y curiosa posibilidad: podemos hacer cosas que ya no necesitamos entender para poder llevarlas a cabo.

Es un poco como el Holodeck de la USS Enterprise NCC 1751-D: decimos lo que queremos y aparece ante nuestros ojos.

Representación holográfica futurista de la Tierra con visualizaciones de datos sobre una plataforma tecnológica. Interfaz digital
Von: Kay Helena (mit KI generiert)

En esencia, ahora puedo situar a la IA junto a Internet como fuente de posibilidades y métodos, además de conocimiento e información, y aprender de ella.

He adjuntado la prueba más abajo. Un juego de Pong en el que puedes jugar contra una red neuronal rematadamente tonta. Al principio, la red no sabe qué hacer, pero se la recompensa por su comportamiento exitoso.
Sobre esta red actúa un algoritmo genético que la somete a una evolución al final de la cual seguirá siendo tonta, pero te ganará.

No tenía ni idea de redes neuronales ni de algoritmos genéticos. Sigo sin tenerla, pero ahora puedo hacerme una idea y experimentar con ellos, porque una IA me ahorra la necesidad de aprender cosas que no necesito ni en mi día a día ni para ganarme la vida, pero que son requisitos para un experimento así.

Ya tengo un entorno de desarrollo para plugins de WordPress, así que he podido utilizarlos junto con sus subagentes y preajustes (otro proceso de aprendizaje).

La tarea inicial era:

Programa un bloque de Gutenberg1 que ilustre las redes neuronales y los algoritmos genéticos. Un demostrador. Sugiero que una red juegue al Pong contra un jugador humano y evoluione mediante algoritmos genéticos según su éxito.
Haz un plan y coméntalo conmigo. Tras la aprobación, trabajarás en la tarea con tus subagentes hasta que el grado de cumplimiento respecto al plan sea del 100%. Trabajarás de forma autónoma; límite de tokens: 5M. Haz las preguntas al principio; por lo demás, solo si no puedes completar tu tarea sin respuestas. Utiliza fuentes de alta calidad para el conocimiento que falte. No se permiten especulaciones.

¿Qué puedo decir? Ha funcionado. Esto incluye un extenso prompt de sistema, un gestor de contexto, varias directrices… Pero os ahorraré todo eso.

El primer resultado ya estaba listo y funcionando a los 25 minutos.
La depuración de errores llevó un poco más de tiempo. También dejé que la IA se encargara de eso, dada mi falta de conocimientos profundos.

Ahora, cambiando el programa o los parámetros, podía probar qué efecto tiene esto o aquello en las redes neuronales y cómo pueden funcionar los algoritmos genéticos.
Sigo sin «saber» mucho sobre el tema… Pero me he hecho una idea más concreta.

Redes neuronales

Izquierda
Derecha
Gen0
Mejor
Media
Diversidad
Muertos
FPS

Mejores agentes

Evolución del fitness

Diversidad genética

¿Cómo funciona?

Red neuronal

Cada agente de IA tiene una red neuronal con 10 valores de entrada: Y del oponente, velocidad del oponente, Y de la pala propia, velocidad propia, distancias a los bordes superior e inferior, X de la bola, Y de la bola, vX de la bola, vY de la bola. Como salida, controla la pala mediante la aceleración (no la velocidad directa).

Entrenamiento por lotes + Demostración

En cada generación, todos los agentes juegan primero de forma oculta (headless, al instante). Después, los dos mejores agentes juegan una partida de demostración visible. La siguiente generación no comienza hasta que termina la demostración.

Fitness = Rebotes

El fitness mide cuántas veces ha devuelto la bola un agente. Los agentes con cero rebotes se consideran «muertos» y no se tienen en cuenta para la siguiente generación.

Algoritmo genético

Los agentes más aptos sobreviven y pueden reproducirse. Como pareja se elige a aquel que sea lo más apto posible Y genéticamente lo más diferente posible; así la población se mantiene diversa y aprende más rápido.

Mejor genoma
  1. un componente que puedo usar en WordPress para insertarlo en esta entrada []
Avatar de Kay Helena

Comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *