GETTY IMAGES/URUPONG/ISTOCK

En la sección de «Juegos Matemáticos» sobre las cadenas de Márkov [«Las leyes del azar y el libre albedrío», por Bartolo Luque; Investigación y Ciencia, junio de 2021], se dice que, al analizar las primeras 20.000 letras de la novela Eugenio Oneguin, de Alexánder Pushkin, Andréi Márkov encontró que el 43 por ciento eran vocales. Sin embargo, al calcular el vector de estados cuando el número de pasos tiende a infinito, el valor obtenido es (0,39; 0,61). Y según se dice en el artículo, «eso implica que, a la larga, cabe esperar que el 39 por ciento de las letras de la novela de Pushkin sean vocales, y el 61 por ciento, consonantes».

Esto último parece entrar en aparente contradicción con el 43 por ciento que encontró Márkov al analizar las primeras 20.000 letras. Creo que la matriz de transiciones para n = 20.000 es prácticamente la misma que para el límite infinito. ¿Quizás se trata de las probabilidades de sucesos diferentes?

Salvador González
Bilbao

 

RESPONDE LUQUE: Es cierto que 20.000 letras son muchas, pero la diferencia entre la proporción de vocales para ese fragmento y el estado estacionario para un texto infinito es solo de cuatro centésimas: 0,43 frente a 0,39, un error compatible con el tamaño de la muestra si suponemos normalidad. La información relevante de esas 20.000 letras es la matriz de transición, más que el porcentaje de vocales, como se explica en el texto: el porcentaje estacionario de vocales es independiente de su condición inicial.

Puedes obtener el artículo en...

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.