1543384497446.jpgComo decía antes, he estado demasiado tiempo sin ocuparme de este blog por múltiples razones, entre las que el haber asumido la dirección de mi departamento en la Universidad y el tener que cerrar un proyecto europeo que coordinaba han influido más que ninguna otra. Como además aquí soy mi propio jefe y no tengo editores que me persiguen como en Nada es Gratis, pues claro, al final lo paga mi dedicación a este blog. Bueno, pues acabado con excelentes resultados el proyecto (gracias por preguntar) y a mitad de mi mandato como director, vuelvo a buscar dragones en el proceloso océano de la física y la matemática de los sistemas complejos. Y para esta nueva etapa, he querido traer un ejemplo de simplicidad engañosa que creo que puede ser interesante para muchas aplicaciones. 

El ejemplo en cuestión es un artículo aparecido hace pocos meses y titulado "One parameter is always enough" (Un parámetro siempre es bastante), de Steven T. Piantadosi, de la Universidad de California en Berkeley. El artículo comienza citando nada menos que a John von Neumann, cuando decía que "con cuatro parámetros libres podía hacer un elefante, y con cinco que moviera la trompa", para enseguida ir a su propósito: mostrar que es posible ajustar modelos elementales con un único parámetro a conjuntos con un número arbitrariamente grande de puntos y con la precisión que se desee. Y, como vamos a ver, lo más sorprendente es que esto es una consecuencia de las propiedades de los sistemas dinámicos caóticos. Como dice el propio autor, no hay ninguna técnica matemática nueva en el artículo, pero esta consecuencia de la dinámica caótica no había sido puesta de manifiesto hasta ahora y, como discutiré al final, tiene consecuencias relevantes. 

220px-Scatter_diagram_for_quality_characteristic_XXX.svg.pngLa idea para construir un modelo que ajuste cualquier cosa con un parámetro empieza por la descripción de lo que queremos ajustar. Vamos a centrarnos en un scatterplot, o sea, un conjunto de  puntos definidos por coordenadas xy en el plano, donde podemos considerar que x es la variable independiente y que y es la dependiente. En la figura adjunta podemos ver un ejemplo. Por sencillez, vamos a suponer que los valores que toma x son los números naturales 0, 1, 2. 3, ... La herramienta que utilizaremos es la función logística, de la que ya hablé aquí, y que viene dada por m(z)=4z(1-z). Sin entrar en detalles que el lector interesado puede encontrar en el artículo de Piantadosi, esta función está muy relacionada (técnicamente, es topológicamente conjugada) con la de Bernoulli, que se define como

 Captura de pantalla 2019-01-31 a las 9.58.35.png

La relación entre ambas funciones es que una se transforma en la otra mediante un cambio de variable, y lo interesante de la función de Bernoulli es que si escribimos el número z en el sistema binario, el resultado de S(z) es simplemente eliminar el primer digito justo antes de la coma (recordemos que estamos en el intervalo entre 0 y 1) y correr los demás hacia la izquierda. Este es el punto clave del argumento, porque ahora lo que hacemos es coger los valores de y que queremos aproximar, en orden, escribirlos con la precisión que queramos (pero eso sí la misma para todos, digamos r dígitos) en binario y formar un número w poniendo todos esos dígitos uno detras de otro. Ese número coincide con el primer yy1en sus primeros r dígitos. Si ahora le aplicamos la función S r veces, obtendremos un número que coincide con y2 en sus primeros r dígitos, y así sucesivamente. Si, finalmente, utilizamos la función que transforma la de Bernoulli en la logística, podemos pasar el número w, que estábamos utilizando como condición inicial para generar los y's, a una condición inicial w' para la función logística m(z). De esta manera, obtenemos un modelo que consiste en la función m, que es infinitamente diferenciable, además, y una condición inicial w' que nos ajusta tantos cuantos puntos queramos y con la precisión que queramos. Piantadosi nos presenta en su artículo dos ejemplos impresionantes, calculando la condición inicial necesaria para ambos. Concretamente, son un elefante (como le gustaría a von Neumann) 

Captura de pantalla 2019-01-31 a las 10.15.52.png

y la firma de Miró 

Captura de pantalla 2019-01-31 a las 10.16.02.png

Si usted, amigo lector, se ha perdido un poco (o mucho) en el resumen del procedimiento, no se preocupe: en primer lugar, seguramente es culpa mía que he querido volar muy rápido sobre algunos de los detalles, y en segundo lugar, si quiere ajustar su propia figura solo tiene que ir al artículo dónde se describe todo el proceso sin omisiones. Quédese solo con la copla de que hemos demostrado que se puede ajustar cualquier conjunto de puntos en el plano con la precisión que se desee con la función logística y un único parámetro, calculable a partir de los datos de manera fácil, y que se usa como condición inicial para las iteraciones de la función logística. Suficiente con esto. 

Lo importante son las conclusiones y las precauciones que se desprenden de esto. En primer lugar, la conclusión que adelantaba al principio: elegir un modelo u otro para describir un fenómeno que da lugar a unos datos en función de que tenga más o menos parámetros no es una buena idea. Como acabamos de ver, siempre podemos construir un modelo con un único parámetro y, por tanto, tendría todas las papeletas para ser el seleccionado. Piense, sin embargo, que la ecuación logística estaría entonces describiendo prácticamente cualquier cosa, lo que obviamente no puede ser verdad. Así que cuidado con este tipo de argumentos. 

Por otro lado, podría usted pensar que ahora que tiene esta función para cualquier conjunto de puntos, puede usarla para extrapolar, es decir, para obtener valores de y en puntos intermedios entre los x, los naturales. Desafortunadamente, esto no es así, porque entre los x la función oscila salvajemente ya que hay funciones sinusoidales involucradas, y lo que tendríamos es un típico ejemplo de sobreajuste (overfitting). Lo interesante aquí es que normalmente el sobreajuste se asocia a usar demasiados parámetros, pero lo que hemos visto es que podemos estar en esta situación incluso en un modelo con un solo parámetro. Sorprendente, ¿no?

Como conclusión final, vista la potencia que tiene un único número real (nuestra condición inicial w') para codificar o recoger la información de muchísimos datos, nos debería hacer desconfiar de los procedimientos de selección de modelos que sean totalmente agnósticos, es decir, que no hagan hipótesis sobre la clase concreta de modelos en la que se quiere trabajar. A la hora de intentar encontrar modelos es necesario basarse en teorías concretas que restrinjan el tipo de modelos a utilizar (lo que normalmente excluirá a nuestra función logística y a otras similares sobre las que se podría basar otro ajuste uniparamétrico). Como siempre, solo una correcta combinación de potencia de cálculo e intuición humana nos permitirá extraer conocimiento de los datos. 

Artículos relacionados

Lee también en SciLogs

Anxo Sánchez
Anxo Sánchez
Sobre este blog

La matemática, lejos de ser la ciencia abstracta y abstrusa que muchos creen, aparece en todos lados, pero sobre todo vive, junto con los dragones de los mapas antiguos, en las zonas entre disciplinas, donde los problemas solo pueden entenderse con apoyo de modelos matemáticos. Este blog pretende reflejar cómo los investigadores luchan por acorralar a los dragones a golpe de matemáticas, de física (otra frontera más que borrosa)... y de lo que haga falta.

Ver todos los artículos (23)