Matemáticas del derecho: decisiones predecibles, y más

02/06/2015 1 comentario
Menear

Se tiene por un tópico el decir que las matemáticas están en todas partes. Tópico o no, lo que sí es es una verdad como un templo. Una de las disciplinas que tendemos a ver como diametralmente opuesta a las matemáticas es el derecho; sin embargo, como discuto en este post, ni siquiera el derecho está libre de las matemáticas. Y para colmo, con las matemáticas del derecho se puede hasta hacer negocio... Lea, lea, amigo lector, y asómbrese del poder de las matemáticas que pueden hasta entender a los jueces, al menos a los americanos.

Math+Phil+Law.jpgComo intento leer un poco de todo, uno de los blogs que leo es ¿Hay derecho?, un blog de actualidad jurídica del que he aprendido mucho y que recomiendo vivamente a los amables lectores de "Aquí hay dragones". Publicado por la fundación del mismo nombre, el blog discute con mucho rigor noticias sobre leyes, sentencias, normas, política, etc., desde un gran conocimiento del derecho. Sin embargo, lo que no he visto todavía en ese blog es un post sobre las matemáticas del derecho, y el caso es que no se podría hacer uno, sino varios. Hoy, con mi conocida inmodestia, y en pago de sus enseñanzas, me propongo contribuir a llenar ese vacío. 

El caso es que el primer artículo que me llevó a considerar el tema de las matemáticas y el derecho fue "Network Analysis in the Legal Domain: A complex model for European Union legal sources" ("Análisis de redes en el dominio legal: un modelo complejo para las fuentes legales de la Unión Europea"), que ya mencioné en mi post sobre las matemáticas del siglo XXI. Es un trabajo interesante, aplica las ideas de redes complejas a las relaciones entre leyes y abre puertas a predecir sus cambios futuros. Pero ya que de predecir hablamos, hay otra predicción que, como veremos, no sólo tiene su interés desde el punto de vista legal sino que sirve hasta para ganar dinero. Hablo, concretamente, de la predicción de los fallos judiciales, nada más y nada menos.

 SCOTUS.jpg

Nos vamos a ocupar del Tribunal Supremo de los Estados Unidos de América (en la foto, el actual tribunal, en el curso 2014-15); como siempre, los científicos se fijan en los datos de las cosas que pasan en EE.UU. porque ya que las revistas donde intentan publicar son, en una gran mayoría, americanas, siempre es más fácil "vender" el trabajo hablando de lo que les interesa. El primer trabajo que yo leí, que no es el primero que abordó el tema, es obra de dos importantes investigadores en sistemas complejos de la Universitat Rovira i Virgili (aquí está la web de su grupo, el SEESlab). En un trabajo publicado en 2011 en la revista PLOS ONE con el título "Justice Blocks and Predictability of U.S. Supreme Court Votes" ("Bloques de jueces y predictibilidad de los votos del Tribunal Supremo de los Estados Unidos"), Roger Guimerá y Marta Sales-Pardo se plantearon la siguiente pregunta (la traducción es mía):

"¿Podríamos reemplazar a un juez del tribunal supremo por un algoritmo que no supiera nada de leyes o del caso en cuestión, pero que tenga acceso a los votos de los otros jueces y a la historia de las votaciones del tribunal?"

Su respuesta fue que con bastante precisión (aunque no de manera perfecta) sí, podríamos. Para ello, usaron también técnicas de redes complejas, aplicadas al caso de redes sociales y de afiliiación lo que les permitió, usando un procedimiento de ajuste de modelos estocásticos a las redes reales desarrollado por ellos mismos (hablé aquí de otra aplicación interesante a la predicción de conflictos), predecir asociaciones ocultas entre jueces reflejadas como enlaces no existentes. El resultado fue francamente bueno, como muestra la figura que recojo a continuación, tomada de su artículo. 

 journal.pone.0027188.g002.jpg

Las gráficas muestran la comparación entre el método de Guimerá y Sales-Pardo (líneas moradas) con una regla simple de mayoría (el voto del juez que se quiere predecir es el de la mayoría de los demás). El panel D) corresponde al casos en los que hubo unanimidad, el E) a sentencias por 8 contra 1, y el F) a sentencias por 5 contra 4. Como vemos, en este último caso, donde una regla sencilla va francamente mal, el método propuesto es correcto en el 73 % de los casos. 

Vemos así que efectivamente tenemos cierto poder de predicción de lo que va a votar un juez dado conociendo lo que han votado los otros y sabiendo algo de matemáticas y sistemas complejos. Pero, como decía Super Ratón (sí; soy así de viejo), le diré, amigo lector, que no se vaya todavía, ¡que aún hay más! Y es que muy recientemente he tropezado con otro trabajo titulado "Predicting the Behavior of the Supreme Court of the United States: A General Approach" ("Prediciendo el Comportamiento del Tribunal Supremo de los Estados Unidos: Una Aproximación General") dan el paso de utilizar solo datos del pasado para su algoritmo; en otras palabras, no tienen en cuenta lo que votan los otros jueces en el mismo caso. Su objetivo es encontrar un algoritmo general, es decir, que funcione bien siempre, sea el año que sea que consideremos; robusto, que no se ajuste demasiado a una cierta composición del tribunal de manera que si cambia deje de predecir bien; y completamente predictivo, como decía antes, utilizando sólo datos del pasado. 

Una vez más, el punto de partida son las redes, pero ahora en forma de árboles (redes o grafos sin bucles), en particular y combinadas con técnicas de machine learning (aprendizaje automático). Así, y que me perdone el lector el vocabulario, utilizan variantes de un procedimiento llamado random forest (árbol aleatorio) para combinar árboles de decisión para la predicción. A su vez, estos árboles predicen basados en una larga serie de variables disponibles sobre la historia del tribunal, tan larga que no permite una descripción del modelo en román paladino. En todo caso el lector interesado y versado en este tipo de temas encontrará el seudo-código del algoritmo y el listado de variables en el artículo. De esas variables, las que resultan tener más poder de predicción son las características individuales del caso y las tendencias de comportamiento de los jueces, sobre todo las tendencias de votación y las diferencias entre la tendencia agregada y las individuales. En todo caso, como dicen los autores, el modelo es modular y está abierto a futuras investigaciones incluyendo o sustituyendo variables. Lo que me interesa ahora, más que todo este detalle técnico, es el resultado, que se recoge en la siguiente gráfica: 

 heatmap scotus.jpg

El código de colores representa la predictibilidad de las decisiones de cada juez individual, que como vemos van del 50 % al 90 %. En el nivel agregado, el algoritmo reproduce correctamente (y recordemos, utilizando sólo información del pasado) un 70 % tanto de las sentencias confirmatorias o revocatorias como del voto individual de los jueces. Un resultado que a mi juicio es bastante impresionante, ya que muestra que las decisiones de los jueces no son puramente azarosas (lo que no deja de ser una tranquilidad) y a la vez muy útil, ya que la vida real no es como la física o la matemática: no hace falta acertar siempre, hace falta acertar más veces de las que te equivocas.

Y tanto es así, que este algoritmo es ahora una de las herramientas de un negocio. Como lo oye: los autores del trabajo participan en una compañía llamada LexPredict (no recibo comisión por anunciarlos y no recomiendo, apruebo u opino sobre sus servicios) que vende precisamente eso: predicciones. Ofrecen servicios para compañías, para consejos de administración y para el sector público en distintos aspectos de su relación con la ley. Como todas las webs modernas, esta no da mucha información, pero si uno bucea un poco en ella sí se encuentra con que el algoritmo (además de un mercado de opinión tipo sabiduría de las masas, por ejemplo) es un componente importante de su toma decisiones. Así que vea, amigo lector: no sólo tenemos, como le prometí, matemáticas del derecho, sino matemáticas del derecho que dan lugar a un negocio; ¡qué más podemos pedir! Lo mismo este post no sólo les puede gustar a los amigos de ¿Hay Derecho?, sino que también podría ser atractivo para los más orientados a la economía de Nada es Gratis, mi segundo hogar. Si es que cuando digo que las matemáticas están detrás de todo...