Se supone que la IA resolverá problemas de la humanidad: le enseñan a jugar ‘Pokémon Rojo’ y no puede encontrar una arena después de 50,000 horas
En el mundo de los videojuegos, hemos presenciado curiosidades que trascienden más allá del simple gameplay, como eventos a través de una transmisión en Twitch, donde los usuarios utilizan la caja de comentarios, juegan a ‘Pokémon’ y logran llegar hasta una de las batallas finales. Ahora, con este mismo título, un youtuber decidió llevar las cosas a «otro nivel« enseñando a una inteligencia artificial a jugar ‘Pokémon Red‘. El resultado es interesante y peculiar, ya que parece que la IA le tiene «miedo» a los centros Pokémon.
El usuario detrás es Peter Whidden, quien explica en su canal de YouTube cómo enseñó a una inteligencia artificial a jugar ‘Pokémon Red’. Utilizando «premios» como incentivo, logró que la IA aprendiera a utilizar un control de forma independiente para avanzar en su aventura y superar cada batalla con éxito. Sin embargo, después de 40 sesiones de prueba, todavía presenta algunas dificultades que le impiden completar su desafío.
Whidden premiaba a la IA con puntos cada vez que capturaba un Pokémon, vencía a un rival o completaba un gimnasio. Sin embargo, la inteligencia artificial a veces se quedaba parada en medio de su aventura, contemplando el agua del juego. Aunque para nosotros se trata de animaciones de píxeles, es un misterio cómo el programa podría «interpretar» este escenario.
En cuanto a su «miedo» con los centros de curación para Pokémon, lo que dificulta su progreso en la aventura, ya que no puede curar a su arsenal de Poke Monsters, Whidden introdujo una recompensa para que la IA lo interpretara como algo positivo.
Esto se debe a que «dejar a los Pokémon» en otro lugar era como perderlos. Lo mismo ocurrió cuando perdió una batalla, se negó a presionar el botón A para continuar, ya que solo quería permanecer en la pantalla de batalla y evitar que le descontaran puntos.
Por otro lado, la inteligencia artificial no parece tener mucha lógica en lo que respecta a las batallas y los tipos de elementos. Por ejemplo contra Brock, la IA no entendía que los ataques de agua debilitan a los Pokémon de tipo roca. Fue después de 7,000 horas de juego que finalmente se «percató» de que el ataque de burbuja de Squirtle es efectivo y logró superar la batalla.
Cabe mencionar que esta IA tampoco tiene un sentido de orientación sólido. En múltiples ocasiones, Whidden tuvo que intervenir ya que no podía encontrar Ciudad Azuria. Además, dando vueltas por el mapa, se descubrió que no le «agradó» la Montaña Lunar, ya que al llegar allí, simplemente abandonó el lugar.
Un experimento realmente interesante. El youtuber explica que lo llevó a cabo con la ayuda de Proximal Policy Optimization para el algoritmo de aprendizaje, y, por supuesto, ChatGPT fue de utilidad.