abril 22, 2024

Una IA ha sido entrenada para jugar Minecraft con 70.000 horas de vídeo de YouTube

OpenAI, la organización de investigación de inteligencia artificial fundada por Elon Musk, ha entrenado una IA para jugar Minecraft casi tanto como los humanos. Solo tomó alrededor de 70,000 horas atiborrarse de videos de YouTube.

Una publicación de blog que detalla la hazaña revela que los investigadores usaron una técnica llamada “Video PreTraining (VPT)” para entrenar una red neuronal sobre cómo jugar Minecraft. Esto implicó recopilar 2000 horas de conjuntos de datos de muestra de humanos reales que jugaban Minecraft para incluir no solo el video sin procesar, sino también las pulsaciones exactas de teclas y los movimientos del mouse.

A partir de ahí, los investigadores entrenaron un modelo dinámico inverso (IDM) para predecir acciones futuras tomadas en cada etapa de los videos. Finalmente, al IDM “entrenado” se le mostraron 70,000 horas de videos de YouTube de Minecraft. Posteriormente, el modelo pudo copiar los comportamientos de los videos, incluida la tala de los árboles para recolectar los troncos y la transformación de los troncos en una mesa de trabajo real.

Eso no es todo lo que el modelo de IA era capaz de hacer. También puede participar en otras actividades complejas como nadar, cazar y comer. AI también podría hacer el “salto del pilar”, que consiste en mantenerte en el aire saltando repetidamente y colocando un bloque debajo de ti.

Minecraft Legends – Exhibición de juegos de Xbox y Bethesda 2022

Los investigadores pudieron crear un “modelo de tierra” basado en los datos proporcionados a la IA y, a partir de ahí, refinar los comportamientos o aprender otros nuevos. Se ha observado que la IA es capaz de realizar habilidades tempranas del juego, como construir herramientas con madera y piedra, asaltar cajas e incluso construir refugios.

Cuantas más horas de datos se introduzcan en el modelo base, mayor será la habilidad de la IA. Los investigadores incluso han utilizado el “aprendizaje de refuerzo” para “recompensar” a la IA por abordar desafíos particularmente difíciles. El sistema de recompensas se usó con tanta eficacia que el modelo pudo crear con éxito un pico de diamante, una tarea que requiere una larga secuencia de actividades.

Esta es una aplicación fascinante de aprendizaje automático y muestra cómo se pueden usar los juegos para entrenar computadoras. Quizás el modelo de IA utilizado también podría incorporarse a los propios juegos para proporcionar un desafío más natural similar a jugar contra oponentes humanos.

La IA también podría mejorar las molestas batallas contra jefes en la nueva campaña Outriders Worldslayer. En muchos sentidos, la nueva expansión de Outriders es justo lo que quieren los fans, pero también conserva algunos de los aspectos menos queridos del juego original.

David Matthews es un escritor independiente que se especializa en juegos y tecnología de consumo. También cree firmemente que el azúcar no hace arena. Síguelo en Twitter @packetstealer

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *