Cuando, a día de hoy, pensamos en la bioinformática nos vienen a la cabeza supercomputadores capaces de lograr avances revolucionarios para la ciencia. Pero hace 50 años, cuando este campo aún no se llamaba bioinformática, el procesamiento de información biológica con el ordenador se consideraba una tarea secundaria, ajena a la ciencia e ideal para delegar en personal de apoyo a la investigación. Por ello, entre las primeras bioinformáticas hubo una gran proporción de mujeres, que eran vistas como secretarias a cargo de las labores rutinarias del laboratorio. Margaret Dayhoff es ejemplo de ello: su Atlas of Protein Sequence and Structure fue modelo para otras bases de datos de referencia —entre ellas las que almacenan la secuencia del genoma humano— pero el reconocimiento no le llegó hasta después de muerta.

Licenciada en matemáticas, Dayhoff realizó su doctorado en química cuántica y en 1960 comenzó a colaborar con la National Biomedical Research Foundation, una institución privada situada cerca de Washington. El director de esta institución, Robert Ledley, había sido de los primeros en proponer el uso de ordenadores en investigación médica, una propuesta polémica puesto que estos aparatos apenas se utilizaban en laboratorios biológicos y entre los usos por los que abogaba estaba la automatización del diagnóstico de enfermedades. Dayhoff decidió trabajar en un campo más cercano a la biología básica: el diseño de software que ayudara a comparar y almacenar secuencias de proteínas.

Estas secuencias son la sucesión lineal de unidades químicas que conforman las cadenas proteicas. La primera en publicarse fue la de la insulina, una proteína de dos cadenas cuya secuencia le valió a Frederick Sanger su primer premio Nobel, en 1958. A partir de esa fecha, las secuencias de proteínas se convirtieron en un recurso cada vez más utilizado por los investigadores biomédicos. En 1965, Dayhoff publicó el primer volumen de su Atlas of Protein Sequence and Structure, un catálogo con todas las secuencias de proteínas disponibles que se actualizaba cada uno o dos años.

 

Arriba, secuencia de las dos cadenas de la insulina; abajo, primera edicion del Atlas de Margaret Dayhoff. Fuentes: http://doctorjytsai.blogspot.co.uk y http://blog.openhelix.eu/?p=1078

Para elaborar el catálogo, Dayhoff utilizaba los ordenadores de la época, que eran muy diferentes de los actuales. Denominados mainframes, sus dimensiones eran enormes y estaban localizados en centros de cálculo ajenos a los laboratorios biológicos. Esto obligaba a los usuarios a manejarlos a distancia a través de tarjetas de cartón perforadas que contenían los datos a procesar e instrucciones de procesamiento, y que se enviaban a los operarios del mainframe en el centro de cálculo. Dayhoff fue una de las pocas biólogas que consiguió manejarlos directamente, alquilando por horas un IBM en la Universidad de Georgetown, situada a poca distancia de la National Biomedical Research Foundation.

Los ordenadores también permitían comparar automáticamente los miles de unidades químicas (aminoácidos) de secuencias diferentes. Esta tarea, fuera del alcance humano en secuencias largas, ofrecía valiosa información desde el punto de vista evolutivo. Dayhoff incorporó a sus Atlas árboles filogenéticos que, mediante la comparación de secuencias, indicaban cómo distintas especies se diversificaban a lo largo del tiempo. Si, por ejemplo, las secuencias de una proteína de pez y otra de anfibio presentaban pocas diferencias su distancia evolutiva sería corta y tendrían un ancestro común. Cuanto menos se asemejaban las secuencias, el número de eslabones evolutivos y tiempo de diversificación aumentaban. 

Arriba, el equipo de Margaret Dayhoff (última a la derecha) con el ordenador; abajo, un arbol filogenetico. Fuentes: http://www.nlm.nih.gov/ y http://openi.nlm.nih.gov/

Pese a la novedad y utilidad de sus Atlas, Dayhoff nunca fue unánimemente reconocida por la comunidad biomédica. Mi colega Bruno Strasser ha analizado las razones y llegado a la conclusión de que la biocomputación (el procesamiento de proteínas y otras moléculas con el ordenador) no gozaba de gran favor entre los biólogos de la época. Almacenar secuencias era considerado como coleccionar sellos, una actividad más cercana a la historia natural que a la biología experimental. Por ello, Dayhoff nunca obtuvo la financiación adecuada para sus Atlas y se vio obligada a cobrar por su distribución, algo que iba totalmente en contra de las reglas del juego de la biología académica del momento.

Cabe preguntarse si la marginación de Dayhoff se debía a su condición de mujer en una época en la que los comités de decisión biomédica estaban aún más dominados por hombres de lo que lo están ahora. Máxime cuando, a principios de los 80, los Institutos Nacionales de Salud estadounidenses sacaron a concurso público un contrato para desarrollar una base de datos que almacenara secuencias de ADN, la molécula que constituye nuestro material genético. Dayhoff, con sus 15 años de experiencia con proteínas, era la favorita para ganar, pero la adjudicación fue finalmente para Walter Goad, investigador del Laboratorio de Los Alamos, donde en la Segunda Guerra Mundial se había desarrollado el Proyecto Manhattan para construir la bomba atómica. El grupo de Goad tenía una fuerte trayectoria en medir los efectos genéticos de la radiación con ayuda del ordenador.

Esta resolución desfavorable tuvo un efecto devastador en Dayhoff y poco después murió prematuramente víctima de un cáncer. Tras su muerte, el software de comparación de secuencias y las bases de datos que inventó tuvieron una importancia clave en el Proyecto Genoma Humano. A medida que aumentaba la relevancia de la bioinformática, los jefes de grupo y directores de departamento pasaron a ser hombres. Por ello, aunque Dayhoff es reconocida hoy como la madre de este campo, su condición de madre le impidió disfrutar de la criatura como debía.

Artículos relacionados

Lee también en SciLogs

Miguel García-Sancho
Miguel García-Sancho

Investigador del Departamento de Estudios de Ciencia, Tecnología e Innovación de la Universidad de Edimburgo.

Sobre este blog

Un foro en el que se demuestra cómo la historia puede iluminar debates sobre el futuro de las nuevas biociencias.

Ver todos los artículos (6)