Los sesgos de los algoritmos

Cuáles son sus causas y qué podemos hacer para mitigarlos.

GETTY IMAGES/OLEKSANDR HURTOVYI y 12963734/ISTOCK, MODIFICADO POR IyC

Con la creciente automatización de la sociedad, buena parte de nuestras acciones y decisiones cotidianas están dirigidas e influenciadas por los algoritmos, un conjunto de operaciones informáticas diseñadas para ahorrarnos tiempo y facilitarnos la vida. Sin embargo, los algoritmos presentan sesgos, un problema cada día más preocupante, más aún si se tiene en cuenta que a menudo toman decisiones de forma automatizada.

Pero antes de hablar sobre los algoritmos, reflexionemos sobre los sesgos en sí mismos, que pueden ser de tres tipos. Uno es el sesgo de medición, una desviación sistemática de una medida con respecto a un valor de referencia. Un ejemplo sería una balanza que, a causa de algún fallo de funcionamiento, siempre midiera un kilo de más (o de menos). Otro tipo de sesgo es el cultural o social, como el de género o raza. Y, por último, están los sesgos cognitivos de cada persona, que muchas veces se deben a prejuicios subjetivos. Un ejemplo es el sesgo de confirmación: leemos algo que está alineado con nuestras creencias y lo aceptamos como cierto.

Los algoritmos incorporan estos sesgos y generan otros totalmente nuevos. La causa más importante de sesgos en ellos radica en los datos que se han empleado para crearlos. La mayoría de los datos incluyen sesgos culturales o de medición. Si no somos conscientes de estos sesgos, los resultados que nos ofrezcan los algoritmos los reflejarán. Por este motivo es importante eliminarlos o mitigarlos. Por ejemplo, si en los datos hay más hombres que mujeres, podemos eliminar aleatoriamente algunos casos masculinos para que la representación de cada género sea equilibrada.

La segunda causa de los sesgos nace de la interacción de los seres humanos con el algoritmo. Esta depende de cómo se comunican los resultados en una pantalla o como se usa la interfaz. Los clics, por ejemplo, muchas veces forman un ciclo de realimentación continua, y se utilizan para personalizar la experiencia del usuario, lo que genera sesgos de exposición, popularidad o posición, por mencionar algunos.

La tercera causa es la más compleja de todas. Se trata de sesgos que proceden del propio algoritmo. Dependiendo del objetivo de este, es posible que amplifique los sesgos de los datos o que incluso agregue otros sesgos. Incluso hay pruebas recientes de que los diseñadores y programadores del algoritmo pueden transferir a este sus propios sesgos cognitivos.

Puedes obtener el artículo en...

¿Tienes acceso a la revista?

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.