red neuronal

Las proteínas desempeñan tareas fundamentales para la vida: catalizan reacciones metabólicas, actúan en la contracción de los músculos, constituyen el andamiaje de las células (el citoesqueleto) y median en la replicación del ADN, entre otras muchas funciones. Las proteínas son biopolímeros, es decir, moléculas largas formadas por una cadena de bloques elementales, que son los aminoácidos. Hay unos 20 aminoácidos, y las proteínas pueden tener un millar de ellos —por dar un número, ya que es muy variable: la hemoglobina, que transporta el oxígeno en la sangre, tiene 146 aminoácidos; la miosina, que interviene en la contracción de los músculos, unos 2000—. Evidentemente, se pueden crear innumerables ristras diferentes concatenando aminoácidos; en el cuerpo humano se estima que tendremos unas 100.000 proteínas distintas, quizá incluso un millón. En la naturaleza se sabe que existen muchísimas más.

Uno podría pensar que conociendo la fórmula química de una proteína ya está todo dicho. De hecho, la fórmula (es decir, la cadena específica de aminoácidos que constituye una proteína) se puede conocer con relativa facilidad. Sin embargo, con eso no basta. La cadena se retuerce y se dobla formando un ovillo. Este plegamiento se produce debido a minúsculas fuerzas electromagnéticas que tienen lugar entre diferentes partes de la molécula, causadas por pequeños desequilibrios en la distribución de la carga eléctrica. Y hete aquí que la forma de las proteínas es determinante para su función. Por tanto, para saber qué hace una proteína no basta conocer su composición, sino que también es necesario conocer su forma. Sabiendo la composición deberíamos ser capaces de calcular la forma; y, de hecho, para algunas moléculas sencillas se puede hallar. Pero determinar la distribución de carga eléctrica y las fuerzas resultantes en una molécula de unos 10.000 átomos y sus correspondientes enlaces, como tienen las proteínas, no está a nuestro alcance. Ni de lejos.

Representación de la hemoglobina. [De Jeremy Simpson y Rainer Pepperkok - http://gfp-cdna.embl.de, CC BY-SA 2.5, https://commons.wikimedia.org/w/index.php?curid=551029]

Así que determinar cómo se pliegan las proteínas y qué forma adoptan es todo un reto. Hay técnicas experimentales que permiten obtenerla. Por ejemplo, las proteínas se pueden cristalizar y entonces la difracción de rayos X proporciona la estructura molecular. Pero el procedimiento es lento y trabajoso. Además, muchas veces sería interesante conocer la actividad de los compuestos antes de sintetizarlos. Pero, si una proteína ni siquiera existe, ¿cómo saber qué forma tendrá (y, por tanto, qué hará)? Diseñar proteínas y conocer su función antes de sintetizarlas sí que sería un gran avance.

En esas estábamos cuando he aquí que hace unas semanas, un grupo de investigación de Deep Mind (perteneciente a Alphabet, la empresa propietaria de Google) anunció que su programa AlphaFold es capaz de predecir el plegamiento de las proteínas utilizando la inteligencia artificial. No es que antes no hubiera nada; pero el salto que han dado, dicen, es de grandes porporciones. El hallazgo fue publicado en la revista Nature.

Para valorar qué es lo que han conseguido, y cómo, es conveniente conocer al menos someramente cuáles son esos métodos que se conocen genéricamente como inteligencia artificial. Tengo que decir que a mí me pasó como al personaje de Molière que hablaba en prosa sin saberlo: alguna vez utilicé algoritmos que después he visto en los libros de esta disciplina. Uno de ellos, por ejemplo, es el de los k-promedios (k-means en inglés). Consideremos un caso que nos servirá para ilustrarlo. Supongamos que deseamos identificar en esta imagen los objetos su color:

Objetos de colores.

El primer paso es representar cada píxel en un espacio de color, donde los ejes pueden ser «rojo», «azul» y «verde» (o, en este que presento, cuyos ejes son «claro-oscuro», «rojo-verde» y «amarillo-azul»):

Representación de los píxeles en un espacio de color.

Como se ve, los píxeles de la imagen están agrupados en cuatro «nubes de puntos» que corresponden a los cuatro objetos. Si queremos clasificar los píxeles según su pertenencia a uno de estos conjuntos, el algoritmo es algo así: lanzamos cuatro puntos, y los vamos moviendo de manera que la distancia de los píxeles a uno de esos puntos se minimice. El resultado final es que esos cuatro puntos acabarán aproximadamente en los centros de cada una de las nubes de píxeles. A continuación, cada píxel se asocia con el punto más cercano; y con eso, tendremos separados los objetos; por ejemplo, este es uno de ellos:

Segmentación de un objeto.

En casos sencillos como éste, existe un algoritmo riguroso que garantiza una solución. Pero no siempre es así; y entonces se recurre a la optimización, es decir: mover un poquito esos cuatro puntos a un lado y a otro e irlos desplazando de manera que la distancia de los píxeles a uno de los puntos disminuya; en cuanto ya no se puedan mover sin que esa cantidad mengüe, tenemos una solución. Sin embargo, nada garantiza que ese mínimo local sea el mínimo global. Y menos aún si no sabemos cuántos colores hay que separar (a eso se refiere el k de k-promedios): si se desconoce k, la única táctica posible es probar varios números a ver cómo funciona. Eso hice yo para encontrar la posición de los gorros rojos en unas películas de simulacros de evacuación.

Otro método usado en el ámbito de la inteligencia artificial es el de las llamadas redes neuronales. Supongamos de nuevo que tenemos que clasificar unos objetos según su color. Se pueden emplear elementos discretos («neuronas»), cada uno de los cuales es sensible a un aspecto particular, y que actúan todos a la vez. Su acción conjunta determina el resultado. Se disponen en varias capas, de modo que el resultado de las neuronas de una capa es la entrada de la siguiente, y a estos enlaces («sinapsis») se les adjudica unos coeficientes que determinan cuánto debe incluirse de cada ingrediente en cada elemento la capa siguiente. Quizá parezca complicado; seguramente se entienda mejor si se ve cómo funciona una red neuronal sencilla. En la página web de TensorFlow se puede encontrar una red «de juguete»; basta apretar al botón para que empiece a funcionar, y ese ejemplo visual será más ilustrativo que una larga explicación. (TensorFlow es una biblioteca de código abierto, desarrollada por Google, para implementar redes neuronales).

Captura de pantalla de <a href="https://playground.tensorflow.org" target="_blank">TensorFlow</a>. Las líneas que unen las neuronas representan las sinapsis, su grosor, la intensidad de la relación; y el color, si el coeficiente es positivo o negativo.

El asunto es ir ajustando las sinapsis para lograr el efecto deseado. La intensidad de las líneas que unen las neuronas (las «sinapsis») va cambiando a cada iteración. Esto se hace con casos de solución conocida: se presentan los casos y se deja que la red vaya ajustándose hasta dar con las soluciones. Es lo que se denomina aprendizaje. Una vez ha «aprendido», los coeficientes de las sinapsis (que pueden ser positivos o negativos) determinan lo que la red puede identificar. Estas redes se emplean profusamente para reconocimiento de la voz, por ejemplo. El entrenamiento, con todo, puede ser muy costoso. Téngase en cuenta que una red neuronal puede constar de miles de neuronas en varias capas.

Puede que esto no sea inteligencia o no sea artificial, como dice Alfredo Marcos en la sección «Cartas de los lectores» en Investigación y Ciencia, enero de 2021. Ciertamente hay en el nombre algo épatant. Pero es disculpable; si nos hubiéramos quedado en «dinámica no lineal con sensibilidad a las condiciones iniciales e impredecibilidad a largo plazo» en vez de «caos», probablemente menos se hubieran sentido atraídos por ese nuevo concepto. En vez de inteligencia artificial podríamos decir «reconocimiento de patrones en conjuntos de datos multidimensionales por medio de algoritmos con ajustes automáticos», pero no llamaría la atención.

Con estos dos ejemplos creo que se puede entender fácilmente cuál es el punto flaco de la inteligencia artificial. La solución no se encuentra mediante un razonamiento analítico, sino heurístico. De hecho, en la mayoría de los casos se desconoce si esa es LA solución o simplemente una aproximación, razonable o no, y cómo se ha llegado hasta ella. Nada garantiza que un algoritmo diseñado para identificar señales de tráfico las vaya a identificar todas correctamente, por bien enseñado que esté. Hace poco, una cámara de televisión entrenada para seguir automáticamente el balón en un partido de fútbol se centraba con sorprendente fijeza en la cabeza calva del árbitro. Pequeñas variaciones que las personas detectan sin dificultad (una señal de tráfico torcida por un golpe) suponen un reto de dimensiones colosales para la inteligencia artificial: rotar un objeto provoca el fallo del algoritmo con desesperante frecuencia. El reconocimiento de voz, incluso en condiciones óptimas, falla a veces. Y eso por no hablar del coste computacional. Todo ello hace que en muchos casos la inteligencia artificial se utilice simplemente como una ayuda y que el sistema esté supervisado por una persona.

Dicho esto, y con todas las reservas, el programa AlphaFold ha resuelto con gran fiabilidad cómo se pliegan muchas proteínas, mediante técnicas de inteligencia artificial. Dado que de muchas proteínas se conoce su estructura, se puede entrenar al algoritmo. Posteriormente, se le pueden proporcionar casos desconocidos y comparar la predicción con el resultado real. La tasa de acierto es altísima. Otra cosa es que haya resuelto el problema, en el sentido de que el algoritmo no proporciona un argumento lógico que podamos aplicar de manera general (una ecuación, por decirlo de alguna manera, que relacione la composición de la proteína con su forma).

Predicciones de AlphaFlow: plegamiento de dos proteínas (imagen de la Web de Deep Mind). En azul: predicción; en verde: resultado experimental.

Recientemente, algunos artículos de opinión en medios respetables llamaban a la cautela en cuanto a las expectativas que despierta la inteligencia artificial («Artificial intellingence and its limits», Technology Quarterly de The Economist, junio de 2020; «It's called artificial intelligence—but what is intelligence?», Wired, mayo de 2020). El éxito de AlphaFold, y otros quizá no tan llamativos, empiezan a generar la sensación de que probablemente la inteligencia artificial no acabe en el cesto de las promesas incumplidas. Eso sí, por el momento lo más probable es que solo se emplee en situaciones donde los fallos no sean críticos, por ejemplo como asistencia o ayuda, y las riendas estén en manos de una persona.

Ángel Garcimartín Montero
Ángel Garcimartín Montero

Catedrático de física (especialidad: materia condensada) en la Universidad de Navarra.

Ha llevado a cabo investigaciones (de carácter marcadamente experimental) sobre dinámica no lineal, inestabilidades, caos y sistemas físicos fuera del equilibrio; la fractura de los materiales frágiles; la transición vítrea, y los medios granulares. Actualmente se interesa en los atascos de materia activa (por ejemplo, los seres vivos).

Página web personal

Sobre este blog

La materia blanda es la que se deforma fácilmente cuando se somete a esfuerzos o fluctuaciones térmicas: líquidos, coloides, materiales granulares, polímeros, espumas, algunos materiales biológicos. Pero en sentido figurado ¿no es también materia blanda la ciencia, la universidad, o incluso la sociedad?

Ver todos los artículos