5 de Septiembre de 2012
Lingüística computacional

Evolución vírica y evolución lingüística

Un modelo de genética computacional sitúa en la actual Turquía el origen histórico de las lenguas indoeuropeas.

Hoy, la familia indoeuropea incluye unas 400 lenguas habladas a lo largo y ancho del planeta: castellano, inglés, alemán, griego, ruso... pero también otras mucho más lejanas, como el persa, al afgano o el hindi. Su origen, no obstante, ha sido desde hace años objeto de un intenso debate entre los expertos. Unos creen llegaron a Europa hace unos 6000 años de la mano de los pueblos nómadas de las estepas eurasiáticas, al norte de los mares Negro y Caspio. Otros, sin embargo, las consideran oriundas de la Anatolia de hace 8000 o 9000 años: sus habitantes, los primeros agricultores, habrían sido también los hablantes del protoindoeuropeo original; una lengua que, de acuerdo con esta hipótesis, se habría expandido y evolucionado a la par que la agricultura.

A fin de cotejar ambas teorías, un equipo multidisciplinar ha decidido afrontar el problema con los mismos métodos que emplean los biólogos computacionales para reconstruir la filogenia (las relaciones de parentesco) y el origen geográfico de las epidemias a partir de las secuencias genéticas de las diferentes cepas de virus. Los resultados, que fueron publicados hace unos días en la revista Science, apoyan de manera contundente la hipótesis que sitúa el origen de las lenguas indoeuropeas en la actual Turquía.

  • Filogenia y reconstrucción espacial (mapa) y temporal (árbol) más probable de la evolución de la familia europea según el modelo computacional de los autores (UNIVERSIDAD DE AUCKLAND).

Por lo general, se acepta que la evolución de las lenguas sigue pautas muy similares a las que rigen la evolución de los seres vivos; una semejanza que en su momento ya hiciera notar el propio Darwin. En su estudio, los investigadores (un grupo integrado por psicolingüistas, informáticos y biólogos) partieron de una muestra léxica correspondiente a 207 significados en 103 lenguas indoeuropeas tanto actuales como extintas. De esta manera, la evolución lingüística quedaba modelizada por la ganancia y pérdida de cognados (palabras con una etimología común, como padre en español, father en inglés, Vater en alemán, pater en latín o pita en persa antiguo). De esta manera, los datos lingüísticos vendrían a ser análogos a la secuencia genética de una cepa vírica, y la tasa de variación de cognados, al reemplazo de nucleótidos en el código genético.

Esta no es la primera vez que se emplean modelos computacionales de biología molecular para estudiar la evolución de las lenguas. En 2003, Quentin D. Atkinson, de la Universidad de Auckland y autor principal del nuevo estudio, ya había utilizado un método similar para reconstruir el árbol filogenético de las lenguas indoeuropeas y datar la antigüedad de las ramificaciones. Sin embargo, dichos estudios ignoraban la información espacial; es decir, no consideraban ninguna proyección concreta del árbol filogenético inferido (o mejor dicho, de su topología) sobre el mapa de Europa.

Con el objetivo de inferir las trayectorias espaciales más probables, los autores emplearon un código que incorporaba un modelo de difusión (en concreto, un camino aleatorio modificado) a lo largo de las ramas del árbol filogenético. Después, usaron métodos de estadística bayesiana para cuantificar cuán plausible resultaría reconciliar los datos de partida con una hipótesis u otra (acerca de, por ejemplo, la localización geográfica de la raíz). Por último, se asignaron probabilidades a priori que reflejaban la geografía del continente: por ejemplo, la probabilidad de que un idioma se escindiese en dos en medio del mar se tomó igual a cero y, en algunos casos, la probabilidad de propagación marítima de una lengua se rebajó un factor 100 con respecto a la de difusión terrestre.

En su artículo los autores muestran un decidido empeño por tener en cuenta todas las incertidumbres históricas y geográficas inherentes a los datos, así como por reducir los posibles sesgos en favor de una u otra hipótesis (como cabría pensar al incluir las variantes anatolias extintas del indoeuropeo). En todos los casos considerados, los resultados favorecen de manera abrumadora la hipótesis que hace de los primeros agricultores nuestros antepasados lingüísticos.

Más información en Science.

- IyC

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.

Responsable: Prensa Científica, S.A. Finalidad: enviarle por correo electrónico los boletines que haya solicitado recibir. Derechos: tiene derecho a acceder, rectificar y suprimir sus datos, así como a otros derechos, como se explica en la información adicional y detallada que puede consultar en nuestra Política de Privacidad.