Utilizamos cookies propias y de terceros para mejorar nuestros servicios y facilitarte el uso de la web mediante el análisis de tus preferencias de navegación. También compartimos la información sobre el tráfico por nuestra web a los medios sociales y de publicidad con los que colaboramos. Si continúas navegando, consideramos que aceptas nuestra Política de cookies .

8 de Diciembre de 2017
Inteligencia artificial

¿El fin de los programas específicos para jugar al ajedrez?

El programa AlphaZero aprende por sí mismo a jugar al ajedrez y se convierte en un contendiente fortísimo, capaz de imponerse al mejor programa específicamente diseñado para jugar al ajedrez.

El porcentaje del tiempo total de aprendizaje en que AlphaZero jugó cada una de las aperturas de ajedrez más apreciadas (aquí, diez de doce] [David Silver et al. en arXiv: 1712.01815]

El algoritmo de autoaprendizaje AlphaZero (una versión más generalizada de AlphaGo Zero, que aprendió por sí mismo a jugar al Go, complejo juego de mesa chino, hasta que llegó a batir a uno de los mejores jugadores humanos) es ahora también un extraordinario jugador de ajedrez. Como cuenta el equipo de la empresa de inteligencia artificial DeepMind en un artículo publicado en arXiv (el repositorio de prepublicaciones de física y otras disciplinas matemáticas), solo necesitó cuatro horas para lograr una competencia ajedrecística, no ya sobrehumana, sino superior a la de los mejores programas de ajedrez: jugó cien partidas contra Stockfish 8, el más poderoso hasta ahora de estos (fue campeón del mundo maquínico en 2016), y ganó 28 sin perder ninguna. Aprendió además el Go y el ajedrez japonés Shogi, y superó también convincentemente a los mejores programas para estos juegos (incluido AlphaGo Zero) con solo unas pocas horas de aprendizaje.

Los mejores programas de ajedrez han sido hasta ahora sistemas especializados, de complicado diseño, concebidos exclusivamente para jugar al ajedrez y cuya capacidad informática de análisis se había desarrollado a lo largo de décadas. AlphaZero sigue un enfoque opuesto, que ya condujo al éxito a AlphaGo Zero: el algoritmo conoce solo las reglas básicas y empieza a jugar, al principio con movimientos arbitrarios, contra sí mismo. Basándose en los resultados que va obteniendo, el programa mejora sus movimientos y aprende muy deprisa cuáles son los más convenientes. Esta forma de aprendizaje parece ser esencialmente superior a construir programas específicos para cada juego: AlphaZero los ha superado en un solo día. La era de los programas cada vez más elaborados podría haber llegado a su fin, como chess24, sitio de Internet dedicado al ajedrez, escribe en Twitter.

Lars Fischer/spektrum.de

Artículo traducido y adaptado por Investigación y Ciencia con permiso de Spektrum der Wissenschaft.

Más información en chess24.

Fuente:«Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm», de David Silver et al., en arXiv: 1712.01815v1 [cs.AI], 5 de diciembre de 2017.

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.