Análisis topológico de datos

Aplicar la topología al análisis de grandes conjuntos de datos ayuda a estudiar la estructura del cerebro o a diseñar nuevos fármacos.

[EVANGELINE GALLAGHER]

En síntesis

La topología, una rama de las matemáticas que estudia las propiedades de los objetos geométricos que permanecen inalteradas al deformarlos, se usa cada vez más para hallar patrones en grandes conjuntos de datos.

El método consiste en construir complejas redes multidimensionales a partir de los datos y analizarlas desde un punto de vista topológico, en busca de formas inusuales que revelen propiedades robustas del sistema.

Dicho enfoque se ha empleado en diversas aplicaciones, desde el diseño de nuevos fármacos hasta el descubrimiento de procesos biológicos periódicos o del modo en que las neuronas representan el espacio.

Benjamin Adric Dunn, científico de datos en la Universidad Noruega de Ciencia y Tecnología, me muestra una imagen formada por puntos espaciados de manera irregular, cuya disposición recuerda vagamente a las piedras de Stonehenge. La pauta general es clara, al menos para un ser humano. «Al mirarlo, resulta obvio que se trata de un círculo», señala. Pero es probable que un algoritmo tuviera dificultades para reconocer esa forma simple. «Muy a menudo, les falta la visión de conjunto.»

Muchos procesos científicos incluyen bucles, o repeticiones. La incapacidad de un ordenador a la hora de captar tales relaciones supone un problema para los científicos que quieren identificar patrones circulares en grandes volúmenes de datos. Los datos se suelen visualizar mediante puntos que flotan en el espacio, igual que estrellas en el cielo nocturno. Un punto podría denotar una posición física, como los dos números que marcan la longitud y la latitud de un barco en al­ta mar. De modo parecido, los genes se pueden representar en un espacio matemático de mu­chas dimensiones (a veces centenares), de modo que dos genes con secuencias de ADN similares estarán simbolizados por puntos próximos entre sí [véase «Redes de genotipos: los senderos de la evolución», por Susanna Manrubia y José Cuesta; investigación y ciencia, abril de 2020]. El significado de una pauta circular en los datos depende del contexto: si hablamos de la ubicación de un barco, los círculos podrían indicar que se ha perdido, mientras que en el caso de datos genéticos quizá reflejen una relación evolutiva.

Con frecuencia, los datos forman cielos estrellados tan complejos y multidimensionales que no es posible estudiarlos a simple vista: si uno quiere detectar círculos, necesita un conjunto de instrucciones lo bastante precisas para que las entienda un ordenador. Pero las técnicas de análisis de datos suelen basarse en el álgebra lineal, un área de las matemáticas que estudia rectas y planos. Para buscar bucles, en cambio, los investigadores recurren al análisis topológico de datos (ATD), un método que ofrece una perspectiva del todo distinta.

En contraste con las estructuras relativamente simples y rígidas que caracterizan el álgebra lineal, el ATD se apoya en la topología, una rama de las matemáticas que estudia formas plegables y extensibles. Como sus practicantes suponen que todas las formas poseen una flexibilidad ar­bitraria, la topología a menudo recibe el nombre de «geometría de la goma elástica».

El ATD ayuda a los matemáticos a construir figuras reveladoras a partir de puntos dispersos, como si trazaran constelaciones sobre las estrellas. Para ello, empiezan usando los datos como nodos o articulaciones de un andamiaje virtual, construyendo estructuras complejas que pueden extenderse a través de cientos de dimensiones. La imagen resultante contiene la esencia de los datos originales, pero de una forma más tangible. Esas estructuras se estudian desde un punto de vista topológico, buscando propiedades que se mantengan incluso si se dobla o estira el andamiaje.

Puedes obtener el artículo en...

¿Tienes acceso a la revista?

También te puede interesar

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.

Responsable: Prensa Científica, S.A. Finalidad: enviarle por correo electrónico los boletines que haya solicitado recibir. Derechos: tiene derecho a acceder, rectificar y suprimir sus datos, así como a otros derechos, como se explica en la información adicional y detallada que puede consultar en nuestra Política de Privacidad.