Utilizamos cookies propias y de terceros para mejorar nuestros servicios y facilitarte el uso de la web mediante el análisis de tus preferencias de navegación. También compartimos la información sobre el tráfico por nuestra web a los medios sociales y de publicidad con los que colaboramos. Si continúas navegando, consideramos que aceptas nuestra Política de cookies .

1 de Noviembre de 2019
Ciencia de datos

Comunicar la incertidumbre

Cómo explicar las probabilidades mediante diversas técnicas de visualización de datos.

JESSICA HULLMAN Y JEN CHRISTIANSEN

En síntesis

A la hora de emitir juicios relacionados con probabilidades, diversos estudios han demostrado que las personas tendemos a subestimar o malinterpretar la incertidumbre.

Algunas técnicas de visualización pueden contribuir a clarificar la incertidumbre inherente a un conjunto de datos, pero también a oscurecerla si no se usan de la manera adecuada.

Cada método de representación gráfica tiene sus propias ventajas e inconvenientes. Conocerlas resulta de gran utilidad a la hora de evaluar la probabilidad de acontecimientos futuros.

Para mostrar la evolución futura de un huracán, los meteorólogos suelen elaborar mapas con un «cono de incertidumbre». Este parte de un punto (la posición del centro de la tormenta en ese instante) y, conforme se ensancha, abarca aquellas zonas por las que el ciclón podría pasar durante los días siguientes. La línea central corresponde a la trayectoria más probable, mientras que en los bordes dicha probabilidad es menor. Sin embargo, hay un problema: mucha gente confunde el cono con la forma de la futura tormenta.

El malentendido podría evitarse si, en lugar de un cono, se representasen varias de las trayectorias posibles. No obstante, eso también puede llevar a engaño: hay quien cree que la probabilidad de sufrir daños es mayor por donde pasan las líneas y menor en el espacio situado entre ellas.

Fuentes: Centro Nacional de Huracanes de EE.UU. (<em>cono de incertidumbre</em>); «Visualizing uncertain tropical cyclone predictions using representative samples from ensembles of forecast tracks», Le Liu et al. en <em>IEEE Transactions on Visualization and Computer Graphics</em>, vol. 25, agosto de 2018 (<em>trayectorias múltiples</em>); Tiffany Farrant-Gonzalez (<em>mapas</em>)


La incertidumbre impregna los datos que usan los científicos para comunicar sus hallazgos al público. Y las representaciones visuales pueden clarificar la incertidumbre, pero también oscurecerla. Numerosos estudios sobre el razonamiento humano indican que, a la hora de emitir juicios sobre probabilidades, tendemos a subestimar la incertidumbre. En una sociedad cada vez más orientada hacia los datos, los diseñadores gráficos se esfuerzan por plasmar con acierto dicha noción.

A continuación presentamos varias maneras de visualizar las probabilidades y la incertidumbre, ordenadas aproximadamente de menor a mayor grado de efectividad. Una comparación de los distintos métodos ayuda a entender mejor tanto los datos en sí como la incertidumbre asociada.

 

SIN INCERTIDUMBRE
La peor visualización es la que no muestra la incertidumbre en absoluto. A veces, los diseñadores intentan compensar la falta de una incertidumbre especificada en los datos con una técnica que implique cierto grado de imprecisión. Por ejemplo, pueden elaborarse gráficas que empleen una variable visual difícil de concretar por el lector, como un círculo (izquierda). Sin embargo, este método hace la interpretación más proclive al error. Otra alternativa es usar un diseño que simule un trazado hecho a mano (derecha). Ambas opciones son arriesgadas.

JESSICA HULLMAN Y JEN CHRISTIANSEN (<em>gráficos</em>)

 

INTERVALOS
Probablemente sean las representaciones más habituales de la incertidumbre. Las barras de error (arriba) y las bandas de confianza (abajo) abundan. Pero, aunque parecen claras y precisas, son muy fáciles de malinterpretar, incluso por parte de los propios científicos.

JESSICA HULLMAN Y JEN CHRISTIANSEN (<em>gráficos</em>)

 

DENSIDADES DE PROBABILIDAD
El grado de incertidumbre puede plasmarse visualmente. Un gráfico de gradientes (arriba) puede usar un tono oscuro en el centro (probabilidad elevada) e ir rebajándolo hacia los extremos (probabilidad baja). En un diagrama de violín (abajo), las bandas más anchas indican una probabilidad mayor. Plasmar la densidad de probabilidad en una variable visual funciona mejor que usar intervalos (gráficas anteriores), aunque su eficacia depende del grado en que los lectores logren percibir las diferencias de sombreado, altura o de la variable en cuestión.

JESSICA HULLMAN Y JEN CHRISTIANSEN (<em>gráficos</em>)

 

ORDENACIONES DE ICONOS
La visualización de una probabilidad, como 30 por ciento, en términos de unidades enteras sencillas («tres de cada diez») puede ayudar a transmitir mejor el concepto y a que la gente lo use de la manera adecuada, ya que muchas personas lo asociarán a experiencias cotidianas.

JESSICA HULLMAN Y JEN CHRISTIANSEN (<em>gráficos</em>)

 

DISTRIBUCIONES DISCRETAS
Es posible representar una distribución de probabilidad en un formato discreto. Un ejemplo lo proporcionan los diagramas de puntos basados en cuantiles (quantile dot plots). Estos parten de una muestra representativa asociada a los cuantiles de la distribución (cuartiles, deciles, percentiles, etcétera) y distribuyen sus elementos (puntos verdes) en columnas, de manera que la altura de cada columna refleje la probabilidad asociada a cada valor. En los ejemplos inferiores se ha aproximado la probabilidad total mediante una muestra formada por 25 elementos.

JESSICA HULLMAN Y JEN CHRISTIANSEN (<em>gráficos</em>)

 

MUESTRAS ANIMADAS EN EL TIEMPO
Representar un conjunto de resultados a modo de fotogramas en una animación hace más difícil ignorar la incertidumbre. La técnica, conocida como gráfico de resultados hipotéticos, puede emplearse en visualizaciones simples y complejas. Los estudios de percepción revelan que las personas somos sorprendentemente hábiles a la hora de inferir la distribución de los datos a partir de una animación: no hace falta contar el número de veces que se repite un evento para estimar su probabilidad. La velocidad es importante. Debe ser lo bastante rápida para que el observador vea un número suficiente de muestras, pero no tanto que impida la percepción consciente.

TIFFANY FARRANT-GONZALEZ (<em>indicador de resultados electorales</em>)

 

TÉCNICAS HÍBRIDAS
Es posible crear visualizaciones efectivas de la incertidumbre combinando varias técnicas. Un ejemplo es el gráfico en abanico, que popularizó el Banco de Inglaterra (imagen). Este describe los datos hasta el momento presente (a la izquierda de la línea de puntos) así como las predicciones futuras (a la derecha). La incertidumbre pasada es un componente clave a la hora de evaluar la futura. El gráfico representa las probabilidades altas (tonos oscuros) y bajas (tonos claros) con una serie de bandas que corresponden a distintos niveles de confianza entre los que es posible elegir. La información se plasma en la posición de los márgenes de las bandas y en el contraste entre los tonos claros y oscuros. Los últimos programas para gráficos y modelos estadísticos facilitan la combinación de distintos métodos de visualización de la incertidumbre.

FUENTE: INFLATION REPORT; BANCO DE INGLATERRA, FEBRERO DE 2010

 

PARA SABER MÁS

Picturing the uncertain world: How to understand, communicate, and control uncertainty through graphical display. Harold Wainer. Princeton University Press, 2009.

Visualizing uncertainty. Claus O. Wilke en Fundamentals of data visualization. O'Reilly Media, 2019.

Uncertainty + visualization, explained. Jessica Hullman y Matthew Kay en https://medium.com/multiple-views-visualization-research-explained/uncertainty-visualization-explained-67e7a73f031b.

Puedes obtener el artículo en...

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.