Vagabundeos antropométricos

03/09/2018 6 comentarios
Menear

Correlación no quiere decir causalidad. Correlación no quiere decir previsibilidad. Correlación no quiere decir prejuicio. Correlación quiere solo decir, y en esto no cabe duda, correlación.

Instrumento antropométrico diseñado en 1913 por Arthur John Newman Tremearne (1877-1915) para medir las cabezas en individuos vivos.A menudo se dice que la ciencia busca la verdad, pero no es correcto, porque lo que busca en realidad son modelos de aquella supuesta verdad, modelos buenos, eficaces, sobre todo útiles, que nos ayuden a indagar lo que pasa, lo que ha pasado y lo que pasará, transformando hechos en informaciones, y luego informaciones en conocimientos. La ciencia no explica, sino que interpreta, y no es lo mismo. Los filósofos no se ponen de acuerdo sobre si la verdad existe o no, pero Karl Popper zanjó el problema diciendo que, aunque exista, no podremos nunca saber si la hemos alcanzado. Y esto es, a nivel práctico, lo que al fin y al cabo nos interesa a nosotros investigadores. Formulamos explicaciones, que nunca podremos saber si y en qué medida están en lo cierto. Por esto el verdadero objetivo de la ciencia es proponer, a la luz de las informaciones que tenemos, hipótesis sensatas que interpreten los hechos, y luego buscar más hechos que apoyen (o, al revés, contrasten) aquellas hipótesis. Y así adelante y atrás, descartando las hipótesis que no pasan la criba, y dejando (por el momento) las que no se consiguen derribar. La ciencia de la que habla Popper se funda, muy razonablemente, en una selección de ideas. Así que desarrollamos modelos, representaciones, interpretaciones de esta verdad, de esta realidad, esperando que acierten lo suficiente, y que por lo menos nos vengan bien para desarrollar un conocimiento decente de este universo, o de algunos de sus aspectos.

Claro está que todo ello sufre las limitaciones de nuestros sentidos: analizamos solo lo que podemos percibir o entender, con lo cual nuestra lupa está muy pero que muy sesgada. Al querer ser dialéctico, el mundo que percibimos es, por si mismo, ya una representación, una versión postiza de lo real, pintada según criterios y códigos preestablecidos de nuestro cerebro, códigos que dan una forma convencional a algo que está ahí fuera, y que nos abarca. No existen de verdad los colores o los sonidos, e incluso espacio y tiempo son algo que entendemos sólo en el marco de nuestras capacidades sensoriales y cognitivas. Pero es lo que hay, con lo cual, aunque no está mal hacerse preguntas que vayan más allá de nuestra percepción, luego, en el momento de investigar, hay necesariamente que intentar ser concretos.

Y lo más concreto que hay, en ciencia, son las medidas: los hechos se transforman en números, y los números apoyan o no apoyan la hipótesis que estoy intentando validar. De vez en cuando estos números responden con un o con un no, pero en general responden con un quizás, un tal vez, un en parte. Es decir, los números a menudo piden más números, para poder acercarse a una respuesta suficientemente estable. El hecho de trabajar con interpretaciones de la realidad puede parecer una debilidad, pero sin embargo es la gran fuerza de la ciencia, precisamente porque no elimina posibilidades, sino valora cada interpretación a la luz de su probabilidad. El concepto de probabilidad es la clave del pensamiento científico, en contraposición con aquellas situaciones (como la religión o, desafortunadamente, la política), donde prima el concepto de posibilidad. Claro, porque el concepto de posibilidad no cierra puertas, las deja casi todas abierta, porque todo es, al fin y al cabo, posible. Incluso la filosofía, siguiendo el criterio de la lógica, se limita a considerar las combinaciones de pensamiento que son posibles, independientemente de si este camino luego llega o no llega a conclusiones. Tampoco hay que pensar que uno de estos dos principios sea mejor o peor que los otros, y ciencia, filosofía o religión usan diferentes criterios solo porque tienen diferente objetivos. Pero en el caso de la ciencia, el concepto de probabilidad es el pilar: se recogen datos, que aumentan o disminuyen la probabilidad de que una cierta interpretación sea correcta o no.

Entre las muchas herramientas estadísticas de la ciencia está la correlación: se consideran dos variables, y se analiza si están relacionadas entre sí. Pongamos el ejemplo sencillo de estatura y peso: si la estatura aumenta, suponemos que aumentará el peso de una persona, y por ende un individuo más alto será, en promedio, más pesado que alguien con su misma constitución física pero más bajo. En este caso, la estadística nos dice tres cosas. La primera información nos dice si la correlación existe (o, mejor dicho, si es probable que exista). En nuestro ejemplo, nos diría si hay una correlación entre estatura y peso, o al revés si estos dos factores varían sin relación entre sí. Si no hay correlación quiere decir que las dos variables son independientes. Si en cambio hay correlación, quiere decir que cuando cambia una, tengo que esperarme cambios en la otra. En nuestro caso, sería descubrir que realmente cuando cambia la estatura hay también un cambio de peso. La probabilidad de que exista una relación entre dos aspectos se mide con el tradicional valor p, es decir un valor de probabilidad. En este caso, la probabilidad, menor o mayor, de que pueda existir la correlación a la luz de los datos de que dispongo. Ahora bien, descubrir que existe una correlación no nos dice nada del mecanismo que genera está asociación. Una de las dos variables (peso o estatura) puede ser causa de los cambios de la otra, o ambas pueden estar sujetas a cambios inducidos por un tercer factor común que no conocemos. Este principio, tan sencillo, no sé por qué luego en la cotidianidad científica no siempre se toma suficientemente en consideración, y muchos piensan que si descubro una correlación entonces concluyo que una variable depende directamente de la otra, es decir que el cambio de una variable causa el cambio de la otra. Pues no es así y, si bien la existencia de una correlación es un hecho fundamental, no implica una relación de causalidad directa entre los factores.

La segunda información de un estudio de correlación (si y solo si existe la correlación) nos dice «cuánto» esta correlación es firme. Es decir, aunque exista la correlación entre dos variables, puede ser fuerte o débil. Y claro, esto hace la diferencia. Fuerte o débil, una vez más no es cuestión de todo o nada, sino una cuestión de grado. La fuerza de una correlación se mide con un parámetro R, el coeficiente de correlación, que mide cuánto la relación es firme. Si es muy fuerte, conociendo uno de los dos valores (por ejemplo la estatura) puedo llegar a prever con cierto margen el otro (por ejemplo el peso). En cambio, si la correlación es muy débil, aunque exista una relación puede que no sea suficiente para predecir un aspecto en función del otro.

La tercera información es accesible con un estudio de regresión, y nos dice la regla que asocia las dos variables. En este caso hablamos de utilizar un modelo matemático para estimar la regla numérica que une las dos variables, es decir cómo varía la una cuando cambia la otra. Si son dos variables biológicas, se supone que esta regla numérica puede que esconda información biológica. Cabe decir que todo esto funciona mejor si la supuesta relación es lineal, y entonces una recta me vale para conocer la regla que une las dos variables (y, en este caso, los números útiles son los coeficientes matemáticos que describen esta recta). Si esta relación no sigue una línea recta, los estadísticos se saben muchos «trucos» para... enderezarla sin forzar demasiado el juego.

Como podéis imaginar, todo este paquete estadísticos (probabilidad, correlación, regresión) vale para cualquier cosa: biología, medicina, economía, ingeniería, sociología, psicología ... Si sospecho que dos variables van juntas (por ejemplo ciertas inversiones financieras y sus ganancias, o cierto recurso educativo y su entorno cultural) primero, paso por la p para saber si hay una relación, luego paso por la R para conocer la fuerza de la relación, finalmente llego a una ecuación que me desvela la regla escondida detrás de esta asociación. Y esto me permite evaluar, estimar, predecir y, sobre todo, lo más importante en ciencia: comparar. Por ejemplo, comparar lo que pasa en grupos distintos, para ver si hay diferencias. O comparar si un valor (digamos el peso de una persona) es el que uno se espera conociendo el otro (digamos la estatura), si se pasa por exceso (la persona es demasiado pesada para su estatura, según lo esperado por la regla común) o por defecto (la persona es demasiado delgada para su estatura, según lo esperado por la regla común). Cuando se aplican estos estudios numéricos a las formas anatómicas hablamos de morfometría, y cuando los aplicamos a la variabilidad de nuestra misma especie hablamos de antropometría, la medición del ser humano, de sus grupos y de sus cuerpos, de sus similitudes y de sus diferencias.

En todo esto se sujetan por ejemplo los famosos índices de encefalización: se calcula cómo varía el tamaño cerebral al variar el peso del cuerpo, y luego se estima si una especie tiene un cerebro más grande o más pequeño de lo que se supone debería de tener al tener un cuerpo de aquella talla. Por ejemplo se calculó que un ser humano tiene un cerebro tres veces más grande que un chimpancé o un gorila de su mismo tamaño corporal. Ahora claro, hay que decir que un cálculo como este depende de cuál es la muestra de comparación, de qué variables se han decidido utilizar, y de qué modelo matemático se ha decidido aplicar. Lo cual lleva a muchas alternativas y a infinitos debates, donde los bioestadísticos combaten a golpes de Ps y de Rs, arrojándose rectas y curvas sigmoides, y defendiéndose detrás de parámetros numéricos y coeficientes exponenciales.

Un caso particular son los estudios sobre las relaciones entre características anatómicas del cerebro y funciones cognitivas. El tamaño del cerebro (o de sus partes) siempre se ha intentado correlacionar con capacidades psicométricas, culturales o económicas, buscando diferencias individuales, sexuales, raciales o sociales. El hecho de que se siga peleando sobre estos temas desde hace tanto tiempo sin llegar a un acuerdo sugiere que las cosas no son fáciles ni claras, y con toda probabilidad las respuestas tienen fronteras borrosas. Si hay diferencias entre grupos humanos, tienen que ser sutiles. En algunos casos, entre rasgos de la anatomía cerebral y del comportamiento puede haber una una correlación (la probabilidad de que exista una relación es elevada) pero es una correlación muy floja (el famoso coeficiente de correlación es muy bajo). Es algo frecuente en biología, porque los caracteres biológicos están casi siempre bajo la influencia de muchos factores, muchísimos. Y cada uno de estos factores entonces aportará una contribución distinta y parcial al resultado final. Pongamos que una cierta capacidad cognitiva está influenciada por la genética, la anatomía, una ráfaga de transmisores bioquímicos, la dieta, el sexo, la raza, el clima, el entorno cultural, el nivel educativo, un par de contaminantes industriales, un tipo de trauma infantil, y una buena dosis de azar. Además quizás aquella misma capacidad mental dependa también de otras capacidades, a la vez influenciadas por otras cascadas de factores ajenos. Total, cada anillo de esta larga red de factores explicará solo una pequeña parte del resultado final, y la estadística nos dirá que sí, hay una relación con cada uno de ellos, pero es muy débil. Y los que quieren hurgar en las diferencias se fijarán solo en la primera parte del resultado (hay una relación), mientras que los que las quieren negar se agarrarán a la segunda (la relación no es determinante). Como siempre, entre excesos, en el medio está la virtud, y no habría que obviar ninguna de las dos conclusiones. Que exista una cierta relación puede ser una información muy relevante a nivel biológico (por ejemplo si queremos indagar los mecanismos o la evolución de aquellos rasgos), pero que sea débil nos dice que no podemos contar con ella para establecer o predecir seriamente las capacidades de cada individuo. Es esta la situación en la que probablemente nos encontramos en la mayoría de los casos en que intentamos buscar correlaciones entre rasgos biológicos y cognitivos y, aunque pueden existir diferencias entre grupos, luego la variabilidad individual es tan compleja que se escapa a cualquier previsión. El valor del individuo no se puede estimar a partir del valor del grupo. Bueno, en efecto por hacerse sí que se puede hacer pero, estadísticamente, el ejercicio tendrá más probabilidad de fracaso que de acierto. Ya sean personas o caballos, las apuestas siempre es mejor hacerlas a la luz de muchos datos distintos, y suelen valer más para los grandes números que para los casos sueltos. Cuando se trata de considerar cada individuo, sorpresas te da la vida, y en lugar de la estadística es casi mejor utilizar el sentido común: puede que fracase igual, pero te ahorrará tiempo y muchos, muchos cálculos.

***

Quiero dedicar este artículo a Luigi Luca Cavalli-Sforza, a su vida, a su memoria, y a todo lo que nos ha enseñado sobre la diversidad humana. Nos ha contado, literalmente, quiénes somos.