La información contenida en la molécula portadora del mensaje genético (el DNA) es de gran importancia para el estudio presente de los seres vivos (en lo que respecta a su apariencia externa, su capacidad reproductiva, su longevidad, salud, etc.). Sin embargo, dado que la evolución de dichos organismos ha venido determinada por la acumulación progresiva de modificaciones en sus genomas (es decir, en el conjunto de sus genes), la información presente en su material genético es también una "huella" que nos dará información sobre su pasado. El estudio del DNA nos dará una información mucho más valiosa que la simple comparación entre rasgos externos de diferentes tipos de animales debido a dos razones fundamentales: por una parte, el estudio molecular del DNA proporciona una cantidad de información extraordinariamente mayor; por otra, la información que contiene ilustra el proceso de evolución de las especies en el pasado. Gracias a este incremento en la "resolución" somos capaces de hacer hipótesis acerca de qué organismos están mas evolutivamente emparentados entre sí y cómo ha transcurrido su historia evolutiva desde el pasado hasta presente.

El estudio de la evolución del material hereditario a su nivel más fundamental, su evolución molecular, ha venido desarrollándose desde mediados del pasado siglo cuando comenzaron a resolverse las primeras secuencias de proteínas y DNA. Desde entonces, el gran desarrollo tecnológico y computacional ha permitido llevar a cabo estudios muy detallados sobre la evolución de genes, genomas y especies, a partir del estudio comparativo de su material genético. Este trabajo ha permitido abordar el estudio global de la evolución de los seres vivos (y las relaciones evolutivas entre los mismos) mediante la reconstrucción del árbol de la vida. Junto a los estudios fenotípicos y paleontológicos, esta iniciativa ha permitido detallar la evolución reciente de muchos grupos de organismos, estimado incluso el tiempo (en millones de años) que separa especies actuales de su ancestro común (extinto) en el pasado.

treeoflife
Representación gráfica del árbol de la vida en el que se detallan las relaciones evolutivas entre diferentes grupos de organismos mediante un diagrama de ramas desde el pasado (raíz) hasta el presente (ramas).
 

Sin embargo la ventana de tiempo hacia el pasado sobre la que nos informa el DNA es limitada. Podríamos imaginar que los nucleótidos que constituyen el DNA son las sillas en un aula de cualquier Universidad. A medida que el tiempo pasa, los alumnos que ocupan esas sillas van cambiando y, pasado un tiempo lo suficientemente grande, ninguno de los alumnos originales seguirán ocupando esas sillas (serán reemplazados por nuevos alumnos). En otras palabras, el mensaje genético irá cambiando de forma gradual a lo largo del tiempo, debido a la acumulación de mutaciones y el efecto de la selección. Tras un periodo de tiempo lo suficientemente largo (cientos o miles de millones de años), su secuencia habrá sufrido tantas mutaciones que ya no seremos capaces de saber ni estimar cuál era la secuencia "original" que había en el pasado. Consecuentemente, el estudio de la evolución molecular de las especies a lo largo del tiempo puede ser únicamente abordado mediante la formulación de una hipótesis, a la cuál denominamos filogenia. La filogenia de un grupo de especies es una hipótesis acerca de su modo de evolución desde el pasado hasta el presente, ilustrada mediante un diagrama en forma de árbol (árbol filogenético).

 mutation

Evolución paulatina de las secuencias de DNA originadas a partir de una secuencia ancestral. La acumulación progresiva de mutaciones (indicadas mediante asteriscos) propiciará que, tras un período de tiempo suficiente, las secuencias actuales de las especies 1 y 2 sean completamente diferentes a la secuencia ancestral de la que derivaron. Consecuentemente, la única forma de estudiar la secuencia ancestral será mediante la formulación de hipótesis evolutivas.
 

La validez de la filogenia como hipótesis evolutiva está directamente determinada por la cantidad y calidad de información que utilizamos en su reconstrucción, así como por los métodos empleados. En decir, nuestra hipótesis se ajustará más a la realidad si utilizamos métodos optimizados y empleamos una gran cantidad de información. Hoy en día, las bases de datos de DNA y proteínas contienen cantidades extremadamente grandes de información que podemos utilizar en nuestros estudios, ya no sólo de genes independientes, sino incluso de genomas completos. Sin embargo, los resultados de nuestros estudios dependerán también de que llevemos a cabo los análisis de un modo adecuado. Igualmente que en el caso de los rasgos morfológicos, nunca debemos confundir homologia (origen evolutivo común) con homoplasia (origen evolutivo independiente). En la inferencia filogenética será así imprescindible que comparemos posiciones (nucleótidos) homólogas de secuencias moleculares homólogas. La identificación de las posiciones homólogas en secuencias moleculares constituye quizá la tarea más delicada en los estudios filogenéticos, ya que cualquier error en dicho planteamiento afectará de modo negativo a los análisis posteriores. La identificación de dichas homologías se obtiene mediante el alineamiento de las secuencias (comparación de las secuencias nucleótido a nucleótido) minimizando el número de nucleótidos diferentes entre las mismas. En otras palabras, se asume que el proceso evolutivo más probable es el que requiere un menor número de cambios para generar las secuencias analizadas a partir de una secuencia ancestral común.

alignments
 
El alineamiento de secuencias homólogas busca identificar aquellos nucleótidos que poseen un origen común en un mismo nucleótido ancestral. Para ello se busca minimizar el número de diferencias entre las secuencias.
 

Una vez precisadas las posiciones homólogas es posible comparar las diferentes secuencias con el objetivo de determinar cuáles son más parecidas (evolutivamente cercanas). Dicha estimación constituye nuevamente un problema. Por ejemplo, podemos inferir las relaciones evolutivas entre las secuencias a partir del número de diferencias que presentan entre ellas. Sin embargo, el número de diferencias entre las secuencias puede no ser una medida fiable del número de sustituciones reales que transcurrieron durante el proceso de evolución. Para corregir este error es necesario utilizar modelos de evolución que contemplen peculiaridades propias de las secuencias de DNA, tales como la frecuencia de cada nucleótido, sus tasas de cambio, etc. La utilización estos modelos nos permite "corregir" la estimación de las distancias entre dos secuencias o la probabilidad de un alineamiento de secuencias dada una hipótesis filogenética determinada. Consecuentemente, la elección de un modelo de evolución adecuado constituye (tras el correcto alineamiento de secuencias) la segunda constricción importante en la inferencia de filogenias.

 graph

El DNA sufre contínuas mutaciones que cambian los nucleótidos en cada una de las posiciones de la secuencia. Las diferencias entre dos secuencias actuales no suelen ser representativas del número de sustituciones que existieron realmente entre ellas. Por ejemplo, imaginemos que dos secuencias coinciden en el nucleótido "A", de este modo diremos que en esa posición no existen diferencias y que ambas provienen de nucleótido ancestral "A". Sin embargo, no podemos asegurar que en el pasado no hubiese habido cambios intermedios (por ejemplo A - T - A). En este caso hubo 2 sustituciones que no podemos observar en la actualidad y por tanto subestimamos al cuantificar únicamente diferencias entre las secuencias.
 

La representación gráfica de las relaciones evolutivas entre las secuencias objeto de estudio constituye, habitualmente, el paso final en la inferencia filogenética. Con tal fin existen diferentes métodos de reconstrucción de árboles filogenéticos, entre los que se incluyen aquellos basados las distancias estimadas entre las secuencias, basados en el modelo evolutivo de máxima parsimonia o bien en modelos probabilísticos de evolución de máxima verosimilitud o bayesianos. Como resultado obtenemos un diagrama que representa las relaciones evolutivas entre las secuencias estudiadas a través de una estructura de ramas que generalmente se bifurcan a partir de nodos y cuya longitud puede ser proporcional a la distancia evolutiva entre secuencias o incluso al tiempo que las separa. Adicionalmente, el árbol puede tener una raíz, dando de esta forma dirección al proceso evolutivo representado (desde el ancestro común de todas las secuencias en el pasado hasta las secuencias actuales en el presente). Finalmente, y dado que existen diversos métodos de inferencia filogenética, es muy común analizar la significación con la que cada uno de ellos relaciona las diferentes secuencias entre sí, ofreciendo una estimación de la "confianza" con la que cada grupo de secuencias es definido en la topología.

Fig6_5_Tree.jpg

El árbol filogenético constituye una hipótesis evolutiva acerca de cómo evolucionaron las secuencias objeto de estudio. En este caso se representa la evolución del gen doublesex en insectos, involucrado en la determinación del sexo. Las secuencias actuales están representadas por ramas que convergen en nodos internos (que representan las secuencias ancestrales). La presencia de una raíz en el árbol permite darle sentido al proceso evolutivo desde el pasado (izquierda) al presente (derecha). Los números en los nodos son estimadores de la confianza con la que la topología del árbol agrupa las secuencias en dicho nodos internos.
 

La disciplina que estudia las filogenias moleculares es muy joven y, en la actualidad, los métodos empleados en la reconstrucción de árboles filogenéticos están rodeados de un halo de controversia. Ello se debe a que los modelos utilizados son generalmente crudas estimaciones de la realidad (el poder de predicción de los modelos es generalmente limitado en biología, dada la gran complejidad de los sistemas biológicos). De este modo, la filogenia real es casi siempre desconocida y debe ser estimada por un árbol filogenético que es, en sí mismo, una hipótesis evolutiva.


José María Eirín-López
José María Eirín-López

Investigador y profesor en la Florida International University (Miami, Estados Unidos) y en la Universidad de La Coruña, director del grupo de investigación CHROMEVOL, centrado en el estudio de la estructura, función y evolución de la cromatina.

Sobre este blog

Las alteraciones en el material hereditario son, en última instancia, responsables de la abrumadora diversidad natural que nos rodea.

Ver todos los artículos (13)