Modelos, votantes y el modelo del votante

03/11/2014 9 comentarios
Menear

En este blog hablaremos a menudo de modelos físico-matemáticos sencillos, apoyados a poder ser en experimentos o datos reales, que describen sistemas complejos alejados del ámbito habitual de ambas disciplinas, preferiblemente en el terreno de las ciencias sociales o la biología. Y para esta primera entrada, qué menos que elegir un trabajo de una de las personas que me ha traído por este complicado camino, Maxi San Miguel, y que trata de uno de los modelos más tontos que conozco: el modelo del votante (wikipedia, en inglés).

 

Los modelos son descripciones muy simplificadas de algún fenómeno o proceso que permiten aprender cosas sobre ellos. Si bien Einstein dijo que los modelos deben ser lo más simples posible, pero no más simples, los modelos ultrasimplificados pueden a veces ser útiles... como mínimo para hacerse preguntas. Si uno tiene suerte y/o tino, quizá el modelo arroje luz sobre los mecanismos que intervienen en el sistema en consideración. En este sentido, no es la primera vez que cito a Turing al respecto:

Este modelo será una simplificación y una idealización, y por consiguiente una falsificación. Cabe esperar que las propiedades en las que se centra la discusión sean las más importantes en el estado actual del conocimiento.

post1fig1.jpgEl modelo que traigo hoy aquí es peor aún que una simplificación: es, si me perdonan, una chorrada, que no llega ni a "modelo de juguete". Es el llamado modelo del votante definido por unos "individuos", que pueden tener una de dos opiniones, y la red social de sus contactos o amistades. El modelo evoluciona en el tiempo en rondas o instantes discretos, en los que cada individuo elige al azar uno de sus vecinos y adopta su opinión. Y eso es todo. Eso sí, tampoco es la primera tontería que se le haya ocurrido a alguien, sino que pretende aportar luz sobre los mecanismos de imitación en grupos y colectivos. 

Siendo justos, hay que decir que el modelo se introdujo para lo que se introdujo: como un ejemplo de sistema dinámico estocástico, es decir, en el que interviene el azar en alguna medida, y como un taller en el que ensayar y desarrollar técnicas para tratar ese tipo de problemas. Hasta ahí todo perfecto. Lo que ocurre es que el modelo se "interpreta" luego, para ayudar a entender y pensar sobre lo que se obtiene de él, en términos de votantes cuya decisión sobre su opción política (por ejemplo) evoluciona de la manera citada. Y por eso digo que es una chorrada: yo no suelo votar eligiendo a un amigo al azar y haciendo lo que él, e imagino que ustedes, que tienen buen criterio salvo por estar leyendo esto, tampoco.

En este contexto aparece recientemente el trabajo "¿Es el modelo del votante un modelo de los votantes?" (publicación original en inglés, en la revista Physical Review Letters), de cinco investigadores del IFISC en Palma de Mallorca. Su objetivo es analizar la capacidad del modelo del votante para representar las elecciones reales de los votantes y proponer fundamentos "microscópicos" (es decir, referidos a los individuos) para modelar el comportamiento del electorado. Para ello lo extienden para incluir movilidad, introduciendo el modelo SRIM (del inglés Social Influence and Recurrent Mobility), que resumo a continuación.

El modelo SRIM (Figura 1) consiste en individuos distribuidos en el espacio. En cada zona en la que se subdivide el espacio hay un cierto número de ellos, que pueden trabajar en esa zona o en otras. La interacción (ingrediente fundamental de cualquier sistema complejo) entre individuos tiene lugar mediante el paradigma del votante: en cada ronda cada individuo copia la opinión de otro al azar. La novedad del modelo SRIM es que el invididuo copiado puede ser, con cierta probabilidad, de su zona de residencia, o en caso contrario de su zona de trabajo. Además, se introduce la posibilidad de que los individuos cometan errores al copiar, también con una cierta probabilidad. Esos errores pueden representar eso, errores, pero también efectos no incluidos en el modelo, como influencia de los medios, de propaganda, etc. Lo importante es que el modelo tiene sólo dos parámetros: la probabilidad de copiar a alguien de donde vivo y la probabilidad de cometer un error.

post1fig4 (original).jpg

Figura 1. Ingredientes del modelo, representados esquemáticamente. a) Flujos de personas entre zonas geográficas adyacentes. b) Interacciones entre personas bien en el lugar de trabajo o bien en el de residencia. 

Los investigadores calibraron el modelo comparándolo con datos reales... de Estados Unidos, dónde es fácil conseguir esos datos. Para estimar la probabilidad de interaccionar en uno u otro ambiente, utilizaron datos de estadísticas laborales que mostraban que la gente pasa una media de ocho horas en su lugar de trabajo, ocho en su residencia, y ocho en casa, con lo que la probabilidad de adoptar la opinión de alguien del trabajo o de la zona residencial es la misma, 1/2. Por otro lado, el censo les permitió conocer los flujos de personas entre los distintos puntos de la geografía estadounidense, a cualquier nivel administrativo (condado, estado, etc.). Y finalmente eligieron el valor de la probabilidad de cometer un error (o de adoptar la decisión libremente, véase la discusión más abajo) de tal manera que ajustase la dispersión de voto a uno de los dos partidos. Es interesante notar que el valor así elegido da también, sin ajustes adicionales, la forma de toda la distribución de probabilidad de los porcentajes de votos (referida a la media). Asimismo, proporciona una descripción correcta de las correlaciones de los votos en función de la distancia entre lugares, lo cual habla claramente en favor del modelo, como se muestra en la Figura 2. En realidad, lo más importante de este valor es que hace que el modelo se comporte de manera estable; valores inferiores de esta probabilidad hacen que las opiniones se homogeneicen en todo el territorio, acabando en la uniformidad absoluta, mientras que los superiores hacen que las decisiones sean básicamente aleatorias en cada elección. 

post1fig2.jpg

Figura 2. Ajuste de los parámetros del modelo. Arriba a la derecha izquierda, distribución de porcentajes de voto al partido demócrata referidos a la media. La gráfica representa la probabilidad de que el porcentaje de voto se aleje de la media en el porcentaje indicado. Arriba a la izquierda derecha, función de correlación del voto en zonas geográficas distintas en función de su distancia. Esta función nos dice cuán parecidos son los porcentajes de voto en dos distritos en función de su distancia. En este caso, decae lentamente, lo cuál quiere decir que distritos cercanos se comportan de manera parecida pero los alejados no son totalmente independientes. Abajo, partido ganador en las elecciones: en azul, los demócratas, en rojo, los republicanos, y la intensidad del color indica el margen de victoria. 

Una vez calibrado el modelo, llega el momento de estudiar su capacidad de predicción. Aquí hay que insistir en que el modelo no intenta predecir el voto, sino su dispersión, es decir, de las fluctuaciones en torno a la media. De lo que se trata es de ver si el modelo tiene algo que ver con la realidad, no de predecir el resultado de las próximas elecciones en Estados Unidos. Así que los investigadores ajustaron el número de rondas con el intervalo entre elecciones, y partiendo del resultado de 2000 simularon el de 2004, 2008 y 2012. El resultado, como muestran los ejemplos de la figura siguiente (véase también este video), es francamente bueno, con un error muy pequeño para lo simple del modelo en prácticamente todo el país. 

post1fig4.jpg

Figura 3. a) Predicciones del modelo para el voto a partir del año 2000 en Los Angeles (California), Blane (Idaho) y Loving (Texas). Los puntos son los datos reales, las líneas de trazos corresponden a una realización del modelo, y las líneas continuas representan la media en 100 realizaciones (se ejecuta el modelo 100 veces y se promedian los resultados), con el intervalo de confianza (la dispersión de las 100 realizaciones en torno a la media) marcado en líneas finas. b), c) y d) representan las distribuciones de voto en torno a la media (en el caso de d se recoge la acumulada, es decir, la probabilidad de que el porcentaje obtenido se aleje de la media menos de un cierto valor).

Visto el éxito del modelo en reproducir las observaciones, es fundamental reflexionar sobre lo que se aprende de él. En primer lugar, el valor de la probabilidad de cometer errores para el que se obtienen los resultados correctos es del 3%, es decir, las personas decidirían sólo un 3% de las veces en función de cosas ajenas a la presión de algún amigo o compañero de trabajo. Nótese, en todo caso, que este 3% que en principio justifiqué antes por errores (inspirado en una imagen más biológica) puede interpretarse también como "libre albedrío" de las personas, como decisiones totalmente soberanas y no originadas en presión de conocidos, algo que plantea interesantes posibilidades (sobre todo por lo pequeño de la contribución). En segundo lugar, el modelo muestra que, con el valor apropiado del ruido, esas fluctuaciones de voto en torno a la media son bastante estables en el tiempo, lo cuál implica que el modelo está conectado con la dinámica de los votantes durante un período largo y no sólamente en una elección o dos. Y en tercer lugar, la reproducción de las correlaciones espaciales (que se reflejan en la persistencia de los colores en el mapa que aparece en la Figura 2) sin ajustar ningún parámetro para ello es un mérito indudable del modelo. 

Así pues, el equipo de investigadores han demostrado que la idea básica del modelo del votante, con cierto grado de errores o libre albedrío, es capaz de reproducir propiedades estadísticas de los resultados electorales en Estados Unidos en las últimas decadas. A mí personalmente me resulta fascinante que un modelo tan tonto llegue tan lejos, y me da que pensar sobre la naturaleza humana y sobre nuestra capacidad de describirla (sobre todo cuando hablamos de grandes números de personas). Sin embargo, en este caso, como siempre que se hable de modelos, hay que ser cuidadoso y no lanzar las campanas al vuelo. Podría ser que el modelo funcionase bien por casualidad (no sería el primero). Podría ser que otros modelos expliquen igual de bien o mejor los datos, con lo cuál habría que seguir investigando para ver cuál es el correcto. En cualquier caso, ahora tenemos un posible mecanismo que podría explicar las regularidades observadas en las elecciones, y con ello el modelo del votante se gana un margen de confianza para merecer más estudios que determinen hasta donde puede llegar.