diciembre 6, 2024

OpenAI entrenó con éxito un bot de Minecraft usando 70,000 horas de video de juego

Porque importa: Minecraft puede no parecer una herramienta importante que apoye la investigación avanzada de IA. Después de todo, ¿qué podría tener de importante enseñarle a una máquina a jugar un juego sandbox lanzado hace más de una década? Según los esfuerzos recientes de OpenAI, un bot de Minecraft bien entrenado es más relevante para el avance de la IA de lo que la mayoría de la gente cree.

OpenAI siempre se ha centrado en la inteligencia artificial (IA) y los avances en el aprendizaje automático en beneficio de la humanidad. Recientemente, la compañía entrenó con éxito a un bot para jugar Minecraft usando más de 70,000 horas de video de juego. El resultado es mucho más que un bot jugando. Marca un gran salto adelante en el aprendizaje automático avanzado mediante la observación y la imitación.

El bot OpenAI es un excelente ejemplo de aprendizaje por imitación (también llamado “aprendizaje supervisado”) en acción. A diferencia del aprendizaje por refuerzo, donde un agente de aprendizaje es recompensado después de lograr un objetivo a través de prueba y error, el aprendizaje por imitación entrena redes neuronales para realizar tareas específicas al observar a los humanos completarlas. En este caso, OpenAI aprovechó los videos y tutoriales de juegos disponibles para enseñar a su bot a realizar secuencias de juego complejas que requerirían que el jugador típico completara aproximadamente 24 000 acciones individuales.

El aprendizaje por imitación requiere que las entradas de video estén etiquetadas para proporcionar contexto para la acción y el resultado observado. Desafortunadamente, este enfoque puede requerir mucho trabajo, lo que resulta en conjuntos de datos disponibles limitados. Esta escasez de conjuntos de datos disponibles limita en última instancia la capacidad del agente para aprender a través de la observación.

En lugar de participar en un extenso ejercicio manual de etiquetado de datos, el equipo de investigación de OpenAI utilizó un enfoque específico, conocido como Video Pre-Training (VPT), ​​​​para expandir significativamente la cantidad de videos etiquetados disponibles. Los investigadores inicialmente capturaron 2000 horas de juego de Minecraft comentado y las usaron para entrenar a un agente para asociar acciones específicas con resultados específicos en pantalla. Luego, el modelo resultante se usó para generar automáticamente etiquetas para 70 000 horas de contenido de Minecraft previamente sin etiquetar disponible en línea, lo que proporcionó al bot de Minecraft un conjunto de datos mucho más grande para revisar e imitar.

Todo el ejercicio demuestra el valor potencial de los repositorios de video disponibles, como YouTube, como recurso de capacitación de IA. Los científicos de aprendizaje automático podrían usar videos disponibles y debidamente etiquetados para entrenar a la IA para realizar tareas específicas, que van desde una simple navegación web hasta ayudar a los usuarios con necesidades físicas reales.

Enlace permanente a la historia.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *