Utilizamos cookies propias y de terceros para mejorar nuestros servicios y facilitarle el uso de la web mediante el análisis de sus preferencias de navegación. También compartimos la información sobre el tráfico por nuestra web a los medios sociales y de publicidad con los que colaboramos. Si continúa navegando, consideramos que acepta nuestra Política de cookies .

Actualidad científica

Síguenos
  • Google+
  • RSS
  • Investigación y Ciencia
  • Septiembre 2018Nº 504
Juegos matemáticos

Teoría de juegos

Gratuito

Por qué ganar en piedra, papel o tijera no lo es todo

¿Cómo funciona el concepto de equilibrio de Nash en este popular pasatiempo?

Menear

Jugar a piedra, papel o tijera puede ser muy útil para decidir quién tiene que sacar la basura. Pero ¿ha pensado alguna vez en lo que sucede cuando, en vez de jugar una sola vez, dejamos que el pasatiempo continúe ronda tras ronda? Al principio empleamos una táctica que nos otorga ventaja, pero nuestro contrincante se da cuenta con rapidez y logra darle la vuelta a la situación. A medida que evolucionan las estrategias, se llega a un punto en el que ninguno de los dos jugadores parece ser capaz de mejorar. ¿Por qué ocurre esto?

En 1950, el matemático John Nash demostró que, en cualquier juego con un número finito de jugadores y un número finito de opciones, existe siempre una combinación de estrategias tal que ningún jugador puede obtener mejores resultados cambiando únicamente su propia táctica. La teoría que describe estos perfiles de estrategias estables, o «equilibrios de Nash», revolucionó el campo de la teoría de juegos, alteró el curso de la economía y cambió la forma en que se estudia y analiza todo, desde los tratados políticos hasta el tráfico en Internet. Y, además, le valió a Nash el premio Nobel de economía en 1994.

Estrategias puras y mixtas

Así pues, ¿cómo se produce el equilibrio de Nash en el juego de piedra, papel o tijera? Analicemos una situación en la que dos jugadores, A y B, juegan una y otra vez. En cada ronda, el ganador suma un punto, el perdedor lo resta y los empates no alteran el marcador.

Supongamos que B adopta la estrategia —no muy inteligente— de sacar papel todas las veces. Tras ganar, perder y empatar algunas rondas, es probable que A se percate de esta táctica y adopte una contraestrategia ganadora, consistente en sacar siempre tijera. Llamemos a este perfil de estrategias [tijera, papel]. Si en cada ronda se produce este enfrentamiento, el jugador A ganará siempre.

Sin embargo, B no tarda en percatarse de lo disparatado de este perfil de estrategias y, viendo la confianza que deposita A en la tijera, pasa a sacar siempre piedra. Este perfil de estrategias, [tijera, piedra], hace que B comience a ganar. Pero, evidentemente, A cambiará entonces al papel. Durante estos tramos, ambos jugadores están empleando lo que se conoce como estrategias «puras»: una única estrategia que se selecciona y se emplea repetidamente.

Está claro que en este caso no se alcanzará ningún equilibrio: para cualquier estrategia pura (como sacar siempre piedra) se puede adoptar una contraestrategia (sacar siempre papel) que provocará un nuevo cambio de tácticas. Los jugadores continuarán persiguiéndose eternamente el uno al otro alrededor de este círculo de estrategias.

Sin embargo, podemos también intentar usar una estrategia mixta. Supongamos que, en vez de escoger una única opción, en cada ronda podemos elegir aleatoriamente una de las estrategias puras. En lugar de sacar siempre piedra, una estrategia mixta podría consistir en sacar piedra la mitad de las veces y tijera la otra mitad. Nash demostró que, cuando se permite este tipo de combinaciones, todos los juegos de este estilo tienen al menos un punto de equilibrio. Tratemos de encontrarlo.

¿Qué estrategia mixta resultaría apropiada en el juego de piedra, papel o tijera? Una intuición razonable sería sacar piedra, papel o tijera con la misma probabilidad, táctica que denotaremos (1/3, 1/3, 1/3). Esto significa que elegimos piedra, papel o tijera con una probabilidad de 1/3. ¿Es ventajoso?

Supongamos que B opta por sacar siempre piedra: una estrategia pura que podemos representar como (1, 0, 0). ¿Cómo se desarrollará el juego con el perfil de estrategias (1/3, 1/3, 1/3) para A y (1, 0, 0) para B?

Para visualizar lo que ocurre, construyamos una tabla que muestre la probabilidad de cada uno de los 9 resultados que pueden producirse en cada ronda: A saca piedra y B saca piedra; A saca piedra y B saca papel; etcétera. En el cuadro que reproducimos aquí, la fila superior indica la elección del jugador B, y la columna de la izquierda, la de A:

Juegos_Tabla1.jpg

Cada entrada indica la probabilidad de que se produzca el correspondiente par de elecciones en una ronda cualquiera, la cual no es más que el producto de las probabilidades asociadas a cada jugador. Por ejemplo, la probabilidad de que A elija papel es 1/3; al mismo tiempo, la de que B opte por piedra es 1. Por tanto, la probabilidad de que ocurran ambas viene dada por 1/3 × 1 = 1/3. Por otro lado, la probabilidad de que A saque papel y B tijera es 1/3 × 0 = 0, etcétera.

¿Cuánto se beneficia el jugador A de este perfil de estrategias? Ganará una tercera parte de las veces ([papel, piedra]), perderá otra tercera parte ([tijera, piedra]) y empatará en otro tercio de las ocasiones ([piedra, piedra]). Podemos calcular el número de puntos que obtendrá en promedio el jugador A en cada ronda sumando los productos de cada resultado por la probabilidad correspondiente:

Juegos_Fórmula1.jpg

Esto quiere decir que A obtendrá una media de 0 puntos por ronda: ganará, perderá y empatará con la misma probabilidad. En promedio, el número de victorias se compensará con el de derrotas y los jugadores estarán básicamente abocados a un empate.

Pero, como hemos avanzado, A puede obtener mejores resultados cambiando de estrategia, suponiendo que el oponente no cambie la suya. Si pasa a la estrategia (0, 1, 0), sacar siempre papel, la tabla de probabilidades quedará así:

Juegos_Tabla2.jpg

Cada vez, el papel de A envolverá la piedra de su contrincante, de modo que ganará un punto por ronda.

Así pues, el par de estrategias (1/3, 1/3, 1/3) para A y (1, 0, 0) para B no constituye un equilibrio de Nash, ya que A puede obtener mejores resultados cambiando su estrategia.

En busca del equilibrio

Como hemos visto, las estrategias puras no parecen conducir al equilibrio. Pero ¿y si B prueba con una estrategia mixta, como (1/2, 1/4, 1/4)? Esta consiste en sacar piedra la mitad de las veces, y papel y tijera en una cuarta parte de las ocasiones, respectivamente. La tabla de probabilidades asociada es:

Juegos_Tabla3.jpg

También tenemos la llamada «matriz de pagos», o de ganancias. Desde la perspectiva del jugador A, esta refleja el número de puntos que recibe al producirse cada uno de los resultados:

Juegos_Tabla4.jpg

Si multiplicamos las dos últimas tablas para calcular cuántos puntos obtendrá en promedio el jugador A en cada ronda, obtenemos:

Juegos_Fórmula2.jpg

A vuelve a ganar una media de 0 puntos por ronda. Como antes, el perfil de estrategias (1/3, 1/3, 1/3) para A y (1/2, 1/4, 1/4) para B termina en empate.

Pero, también como antes, A puede mejorar sus resultados cambiando de táctica: frente a la estrategia (1/2, 1/4, 1/4) de B, el jugador A podría emplear (1/4, 1/2, 1/4). Esto produce la siguiente tabla de probabilidades:

Juegos_Tabla5.jpg

Como consecuencia, tenemos el siguiente resultado neto para A:

Juegos_Fórmula3.jpg

Con este perfil de estrategias, (1/4, 1/2, 1/4) para A y (1/2, 1/4, 1/4) para B, el jugador A obtiene una media de 1/16 puntos por ronda. Después de jugar 100 veces, habrá sumado 6,25 puntos, por lo que A tiene un gran incentivo para cambiar de estrategia. Por tanto, el perfil de estrategias dado por (1/3, 1/3, 1/3) para A y (1/2, 1/4, 1/4) para B tampoco constituye un equilibrio de Nash.

Pero consideremos ahora el par de estrategias (1/3, 1/3, 1/3) para A y (1/3, 1/3, 1/3) para B. Esto implica la siguiente tabla de probabilidades:

Juegos_Tabla6.jpg

Gracias a la simetría, resulta sencillo calcular el resultado neto:

Juegos_Fórmula4.jpg

Una vez más, el juego acabará en empate. Sin embargo, ahora la diferencia es que nadie tiene ningún aliciente para modifciar su estrategia. Si B cambiase a cualquier estrategia asimétrica, donde una de las opciones (piedra, por ejemplo) se usara más que las otras, A simplemente alteraría la suya para sacar papel más a menudo. Eso acabaría produciendo un resultado neto positivo en cada ronda para A, que es precisamente lo que ocurrió antes, cuando A adoptó la estrategia (1/4, 1/2, 1/4) en respuesta a la estrategia (1/2, 1/4, 1/4) de B.

Por supuesto, si A cambiase de (1/3, 1/3, 1/3) a una estrategia asimétrica, B podría sacar partido de un modo similar. Por tanto, ninguno de los dos jugadores puede mejorar sus resultados cambiando únicamente su propia estrategia: el juego ha alcanzado un equilibrio de Nash.

Equilibrios inalcanzables

Tal y como demostró Nash, el hecho de que para todos los juegos de este tipo exista un equilibrio es importante por distintos motivos. Uno de ellos es que hay muchas situaciones del mundo real que pueden modelizarse como si fueran juegos. Cada vez que varias personas se ven atrapadas en el tira y afloja que implica contraponer el beneficio personal y el colectivo, como ocurre durante una negociación o en la competencia por recursos compartidos, cada parte considerará distintas estrategias y evaluará los beneficios. La naturaleza ubicua de este modelo matemático explica la gran repercusión del trabajo de Nash.

Otra razón es que un equilibrio de Nash constituye, en cierto sentido, un resultado positivo para todos los jugadores. Cuando se alcanza, nadie puede mejorar cambiando su propia estrategia. Tal vez existan mejores resultados colectivos, los cuales podrían alcanzarse si todos los jugadores actuaran en perfecta cooperación. Pero, si lo único que podemos controlar es lo que hacemos nosotros, terminar en un equilibrio de Nash es lo mejor a lo que podemos aspirar.

Así pues, podríamos esperar que en «juegos» como los que aparecen en los paquetes de incentivos económicos, los sistemas tributarios, los tratados o los diseños de redes se acaben alcanzando equilibrios de Nash, donde todos los participantes, actuando sin más que en su propio interés, terminan contentos y donde los resultados son estables. Pero ¿es razonable suponer que los jugadores llegarán de manera natural a un equilibrio de Nash?

Resulta tentador pensar que sí. En nuestro ejemplo, podríamos haber adivinado que proceder de manera completamente aleatoria era lo mejor para ambos contrincantes. Pero eso ocurre, en parte, porque todos los participantes conocen las preferencias del resto: todos saben cuánto ganan y pierden los demás con cada resultado. Pero ¿y si las preferencias fueran secretas y más complejas?

Imaginemos un juego en el que B suma tres puntos cuando vence a la tijera y uno con cualquier otra victoria. Eso alteraría la estrategia mixta: B sacaría piedra más a menudo, con la esperanza de que A elija tijera y pueda así obtener la recompensa triple. Y, aunque la diferencia de puntos no afectaría directamente a las ganancias de A, el correspondiente cambio en la estrategia de B haría que A adoptase una nueva contraestrategia.

Por otro lado, si todas las ganancias del jugador B fueran diferentes y secretas, A tardaría un tiempo en descubrir la estrategia de su oponente. Pasarían muchas rondas antes de que A pudiera hacerse una idea de, por ejemplo, la frecuencia con que B elige piedra, a fin de calcular cada cuánto debería él sacar papel.

Ahora imaginemos que hay 100 personas, cada una con un conjunto diferente de ganancias secretas que dependen de a cuántos de sus 99 oponentes derrotan usando piedra, papel o tijera. ¿Cuánto tiempo tardaríamos en calcular la frecuencia con que deberíamos elegir cada opción para alcanzar un equilibrio? Probablemente mucho. Quizá más de lo que pueda durar el juego, o incluso más que el tiempo de vida del universo. Como poco, no resulta evidente que un juego así vaya a alcanzar un equilibrio, ni siquiera en el caso de jugadores perfectamente racionales, que emplean buenas estrategias y que actúan en su propio interés.

Esa es la idea central de un artículo publicado hace poco por Yakov Babichenko, del Instituto Technion de Israel, y Aviad Rubinstein, de la Universidad de California en Berkeley. Estos investigadores demostraron que no existe un método uniforme que conduzca a los jugadores a un equilibrio de Nash (ni siquiera aproximado) en todos los juegos. Eso no quiere decir que los jugadores perfectos nunca tiendan al equilibrio: a menudo lo hacen. Simplemente, significa que no hay ninguna razón para pensar que el equilibrio se alcanzará solo porque los jugadores sean perfectos.

Al diseñar una red de transporte, podríamos esperar que los «jugadores» (viajeros que buscan la manera más rápida de llegar a casa) alcancen de manera colectiva un equilibrio en el que no se gane nada al tomar una ruta diferente. Podríamos esperar que la mano invisible de John Nash los guiara para que sus intereses competitivos y cooperativos (tomar la ruta más corta posible, pero evitando al mismo tiempo crear atascos) los lleven al equilibrio.

Sin embargo, la versión compleja del juego de piedra, papel o tijera que acabamos de considerar demuestra por qué estas esperanzas podrían estar fuera de lugar. Puede que la mano invisible guíe algunos juegos, pero otros podrían evitar su control, dejando a los jugadores atrapados en una competición interminable en pos de unas ganancias que permanecerán para siempre fuera de su alcance.

Puede conseguir el artículo en:

Artículos relacionados