"Lo veo y no lo creo" -- Sabiduría popular --

El problema de Monty Hall

Imaginaos que estáis en un concurso de televisión. Estamos frente a tres puertas y una de ellas esconde el premio que nos queremos llevar, pero las otras dos nos mandan a casa con las manos vacías. En principio no tenemos más información, así que no podemos hacer nada mejor que escoger una de las puertas al azar. Después de que hayamos elegido nuestra puerta, el presentador abre una de las otras dos puertas y vemos que no contiene el premio. En este momento se nos da la oportunidad de cambiar nuestra elección. ¿Que debemos hacer?

Parece que el problema es sencillo. Al fin y al cabo, tras crear un poco de espectáculo, el presentador lo único que hace es reducir a dos el número de sitios donde puede estar el premio. Las dos puertas que quedan tienen la misma probabilidad de ser premiadas, así que la probabilidad de que el premio esté en cada puerta es del 50 % y da exactamente igual si cambiamos nuestra elección o no. ¿Está de acuerdo el lector?

Estamos ante uno de los clásicos problemas de probabilidad donde la intuición puede confundirnos bastante. La realidad es que es dos veces más probable ganar el premio si uno cambia de puerta que si no. Uno puede escribir árboles de probabilidades para demostrarlo (como hacen en la wikipedia), pero a mí me resulta más sencillo entender el problema de otra forma. Para empezar, debería estar claro que si no cambiamos de elección nuestra probabilidad de llevarnos el premio es 1/3. La razón está clara: Al principio todas las puertas tienen la misma probabilidad de tener el premio, y nosotros escogemos una de ellas con probabilidad 1/3 de acertar. Después, el presentador podrá abrir otra puerta, bailar el hula hoop, o cantar boleros, pero nada de lo que haga va a cambiar la probabilidad de que hayamos acertado a la primera. ¿Qué pasa con el caso en que cambiamos de elección? La forma más sencilla de "calcular" este caso es darse cuenta que o bien el que cambia de puerta o el que no cambia tienen que ganar. Por lo tanto las dos probabilidades tienen que sumar 1. Así que cambiando de elección acertamos 2/3 de las veces, y es dos veces más probable ganar el premio que si nos quedamos con la elección original.

Puede que este argumento, y las demás demostraciones no convenzan del todo al lector. La leyenda cuenta que el gran Paul Erdös no se convenció del resultado hasta que no le enseñaron los resultados de una simulación por ordenador. El programa monti_hall.py simula este juego, y cuenta cuántas veces perdemos y ganamos. Quizás este experimento convenza al lector de que es mejor cambiar de puerta. Un ejemplo


Jugando con  3  puertas.
  * Las puertas estan numeradas de 0 a  2

Elige una puerta:0
El presentador te muestra la puerta:  2
Con que puerta te quedas: 0
 ** Has perdido :(
  
TOTAL:  0  ganados y  1  perdidos
  

Elige una puerta:1
El presentador te muestra la puerta:  2
Con que puerta te quedas: 1
 ** Has ganado :)
  
TOTAL:  1  ganados y  1  perdidos

Diseñando un experimento

Es cierto que nuestro programa nos permite jugar unas cuantas veces, y parece que la estrategia de cambiar de elección gana más veces. Pero ¿cómo cuantificamos si esto es una casualidad (hemos tenido suerte), o si es verdad que es más fácil llevarse el premio si cambiamos de puerta? Por otro lado, también podemos tener mala suerte. A lo mejor jugamos 20 veces, 10 con cada estrategia y el resultado es que ganamos 6 veces de 10 en ambos casos (de hecho, esto me ha pasado probando el programa). Parece difícil que este tipo de experimentos convenzan a nadie que no esté convencido de antemano. ¿Podemos mejorarlo?, ¿podríamos convencer a Erdös?

Una posibilidad es simplemente hacer que el ordenador juegue con cada estrategia muchas veces, y que nos calcule cuánto gana de media cada una de las estrategias. El problema es qué significa exactamente "muchas veces". ¿10? ¿100? ¿1.000.000? Podría pasar que tengamos mala suerte con nuestro generador de números aleatorios y el resultado del experimento sea que las dos estrategias ganan el mismo número de veces. A lo mejor hemos calculado mal las probabilidades. ¿Cuándo debemos aceptar que las dos estrategias dan realmente distintas ganancias?

El problema al que nos enfrentamos es crucial en ciencia. La mayoría de las observaciones y mediciones tienen una incertidumbre, al igual que nuestro experimento numérico. ¿Debemos rechazar la teoría de la gravitación de Einstein porque un experimento contradiga los resultados de la teoría, o esta discrepancia es simplemente una fluctuación estadística? Si 5 de 20 pacientes fumadores contraen cáncer de pulmón, mientras que solo 2 de 23 no fumadores lo contraen, ¿podemos concluir que fumar provoca cáncer?

Medias y sus incertidumbres

El programa experimento.py simula el juego muchas veces, pero como resultado no solo nos dice cuánto gana de media cada una de las estrategias, sino que además nos dice el error de estas medias. Por ejemplo, una salida típica del programa es


*** RESULTADOS CON  3  PUERTAS ***
 *) Estrategia cambiar puerta 
    - gana:        65.0  de 100
    - porcentaje:  65.0 %
    - Error:       4.76969600708 %
 *) Estrategia no cambiar puerta 
    - gana:        36.0  de 100
    - porcentaje:  36.0 %
    - Error:       4.8 %
***

Al principio de la entrada hemos calculado los valores exactos: la estrategia que cambia de puerta gana un 66,66 % de las veces, mientras que la estrategia que no cambia de puerta gana un 33,33 % de las veces. Los resultados de nuestro experimento no coinciden de forma exacta con el cálculo que hemos hecho, pero sí que concuerdan si tenemos en cuenta las incertidumbres de nuestro experimento. Es decir 66,66 % está contenido en el intervalo (65 - 4,77, 65 + 4,77), y 33,33 % está también contenido en el intervalo (36 - 4,8, 36 + 4,8). Al aumentar el número de realizaciones del experimento, nuestras incertidumbres decrecen. De hecho el lector que haya leído las anteriores entradas del blog (en concreto la que trata del teorema central del límite) quizá sospeche que las incertidumbres decrecen con la raíz cuadrada del número de realizaciones: si multiplicamos por 100 el número de veces que jugamos somos capaces de determinar las medias de las dos estrategias con una incertidumbre 10 veces más pequeña.


*** RESULTADOS CON  3  PUERTAS ***
 *) Estrategia cambiar puerta 
    - gana:        6629.0  de 10000
    - porcentaje:  66.29 %
    - Error:       0.47271935649 %
 *) Estrategia no cambiar puerta 
    - gana:        3390.0  de 10000
    - porcentaje:  33.9 %
    - Error:       0.473369834273 %
***

¿Cómo se determinan las incertidumbres? Pues calculando la "desviación típica" de los datos y dividiéndola entre la raíz cuadrada del número de realizaciones del experimento. Las líneas 62 y 67 de nuestro programa nos calculan estas incertidumbres. Esta receta para calcular incertidumbres es también una consecuencia del teorema central del límite.

Para convencer a cualquier persona razonable, solo tenemos que repetir el experimento el suficiente número de veces como para que la diferencia de ganancias entre las dos estrategias sea significativa, o dicho de otra forma, que la diferencia entre las medias sea mayor que las incertidumbres. ¿Cuánto mayor? Bueno, esto depende del problema en concreto, pero digamos que cuando la diferencia de medias es 3 veces mayor que la incertidumbre, las posibilidades de que estemos viendo una diferencia donde realmente no la hay son muy pequeñas. Si somos muy exigentes, pues aumentamos el número de repeticiones hasta que la diferencia de medias sea 5 veces mayor que la incertidumbre. Normalmente se habla de efectos de "3 sigmas" o de efectos de "5 sigmas". Los físicos de partículas tradicionalmente han considerado "5 sigmas" necesario para poder afirmar sin ambigüedad que han descubierto una partícula (como ha pasado recientemente en el CERN con el descubrimiento del bosón de Higgs). En nuestro ejemplo anterior, la estrategia que cambia de puerta gana un 66,3 +-0,5 % de las veces, mientras que la estrategia que no cambia de puerta gana solo un 33,9 +-0,5 % de las veces. La diferencia entre las medias (32,4 %) es más de 50 veces más grande que las incertidumbres, por lo tanto nuestro último experimento ha encontrado (¡con "50 sigmas"!), que las dos estrategias no tienen la misma probabilidad de llevarse el premio: más allá de cualquier duda razonable.

Una lección importante: cuanto más pequeño es el efecto que queremos medir, más observaciones necesitamos. En nuestro problema podemos hacer el efecto más pequeño simplemente aumentando el número de puertas. Imaginemos que hay 25 puertas en vez de 3. El presentador nos deja elegir una, y después de que lo hayamos hecho abre una (solo una) puerta, y nos deja cambiar de elección. También en este caso gana más veces la estrategia que cambia de puerta y elige una de las 23 restantes (ni la que teníamos al principio, ni la que ha abierto el presentador), pero en este caso el efecto es más pequeño, y por lo tanto más difícil de detectar. Por ejemplo, si jugamos solo 100 veces nuestro programa modificado nos da como resultado


*** RESULTADOS CON  25  PUERTAS ***
 *) Estrategia cambiar puerta 
    - gana:        2.0  de 100
    - porcentaje:  2.0 %
    - Error:       1.4 %
 *) Estrategia no cambiar puerta 
    - gana:        4.0  de 100
    - porcentaje:  4.0 %
    - Error:       1.95959179423 %
***

Que parece indicar que las dos probabilidades son las mismas, ya que considerando las incertidumbres, ambas medias son aproximadamente iguales. ¿Sabría el lector calcularse las probabilidades de las dos estrategias en el caso con 25 puertas? ¿Cuántas repeticiones del experimento hacen falta para convencernos (a 5 sigmas) de que la estrategia que cambia de elección también es mejor en el caso con 25 puertas?

Po fueno, po fale, po malegro

El problema de Monty Hall se hizo mundialmente famoso cuando Marilyn vos Savant escribió sobre él en su columna de la revista americana Parade. Los lectores no parecieron muy convencidos de que la estrategia que cambia de elección tiene el doble de probabilidad de llevarse el premio y Marilyn vos Savant recibió más de 10.000 cartas, algunas de ellas de profesores de matemáticas de instituto y universidad, quejándose sobre la solución que había presentado del problema. Hasta el mismísimo Paul Erdös, probablemente el matemático más prolífico del siglo XX, tuvo que ver una simulación por ordenador para convencerse de que después de la en apariencia inocente intervención del presentador las dos puertas no tienen las mismas posibilidades de tener el premio.

A día de hoy a todo el mundo le parece natural aceptar el resultado de una simulación como prueba de un determinado hecho, pero esta actitud es en realidad muy moderna. Hubo un tiempo en que las fluctuaciones presentes en las medidas experimentales o simulaciones eran consideradas errores, y no incertidumbres inherentes al proceso experimental que podemos controlar, cuantificar, y minimizar con un diseño experimental adecuado. De hecho el lenguaje estadístico está aún lleno de estos prejuicios: los resultados tienen "errores experimentales" (en lugar de incertidumbres), y la dispersión de una serie de datos se mide con el "error estándar". El delicioso libro "The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century" (La dama probando té: Cómo la estadística ha revolucionado la ciencia en el siglo XX) nos cuenta la historia de este reciente cambio de paradigma.

Una vez más hemos usado un método de Monte Carlo. La idea básica es siempre la misma: usar un proceso aleatorio para resolver un problema (por fuerza bruta) que no sabemos resolver de forma exacta. Modificaciones de los programas que hemos usado hoy pueden servir para calcular las probabilidades de ganar en casi cualquier juego de azar (¿Cuál es la probabilidad de sacar solomillo de primeras dadas? ¿Y después de darme mus si me quedo con 2 cerdos y los demás se han quedado con una carta cada uno?). Este tipo de algoritmos son los que están detrás de las "calculadoras de probabilidades de póker", y muchos otros programas que resuelven problemas similares.

Alberto Ramos
Alberto Ramos

Investigador postdoctoral en DESY, Alemania

Sobre este blog

Ahora mismo usted está frente a un impresionante devorador de números, capaz de realizar más de 100.000.000.000 operaciones por segundo. Pero en este blog no nos vamos a ocupar de los ordenadores, porque a la ciencia le importan bien poco, al igual que no le interesan los tubos de ensayo ni los aceleradores de partículas. La ciencia trata sobre lo que podemos aprender usando estas herramientas. Veamos qué podemos aprender con los ordenadores.

Ver todos los artículos (9)