Utilizamos cookies propias y de terceros para mejorar nuestros servicios y facilitarte el uso de la web mediante el análisis de tus preferencias de navegación. También compartimos la información sobre el tráfico por nuestra web a los medios sociales y de publicidad con los que colaboramos. Si continúas navegando, consideramos que aceptas nuestra Política de cookies .

22 de Abril de 2013
LINGÜÍSTICA

Estadística del estilo literario

Un estudio cuantifica el uso de palabras de contenido emocional en la literatura inglesa del siglo XX.

Matemáticas y literatura: La ingente cantidad de textos digitalizados durante los últimos años ha propiciado el desarrollo de modelos estadísticos para analizar la evolución de las tendencias culturales.

¿Puede hacerse estadística fiable de algo en apariencia tan subjetivo como el estilo literario? Algunos expertos así lo creen. Desde hace unos años, iniciativas como el Proyecto Gutenberg o Google Books permiten acceder a millones de textos digitalizados. Gracias a ello, hoy pueden emplearse métodos informáticos para analizar a gran escala la manera en que ha evolucionado el empleo de la palabra escrita a lo largo de los últimos decenios o incluso siglos. Esta oportunidad ha propiciado el nacimiento de un nuevo y sugerente campo de investigación que, para muchos, constituye una potente herramienta para explorar el legado cultural de la humanidad.

En ese espíritu, un estudio reciente ha estimado la frecuencia de uso de algunas palabras de contenido emocional en la literatura inglesa del siglo XX. A tal fin, Alberto Acerbi, antropólogo de la Universidad de Bristol, y sus colaboradores emplearon la base de datos Ngram Viewer de Google, una herramienta que permite hallar la frecuencia anual de uso de una palabra o grupo de palabras entre los más de 5 millones de libros digitalizados hasta ahora por Google Books. La misma base de datos ya había sido utilizada en el pasado para analizar la evolucción de ciertas tendencias culturales. En esta ocasión, los investigadores efectuaron un recuento del empleo de términos cuya raíz léxica correspondía a palabras asociadas a seis estados de ánimo: enfado, repugnancia, miedo, alegría, tristeza y sorpresa.

La investigación de Acerbi y colaboradores ha arrojado tres conclusiones principales. En primer lugar, los datos ponen de manifiesto la existencia de períodos históricos en los que priman las palabras que expresan alegría sobre aquellas que denotan tristeza, y otros en los que ocurre lo contrario. Algunas de esas épocas guardan una sugerente correlación con ciertos episodios históricos, como los «felices veinte» o la Segunda Guerra Mundial.

Por otro lado, la proporción total de palabras de contenido emocional en la literatura inglesa parece haber disminuido de manera constante a lo largo de todo siglo XX. Para comprobar que ello no se debía a una proliferación reciente de libros de carácter científico o técnico, los autores restringieron su análisis a obras de ficción. También en este caso, los resultados mostraban un declive constante y estadísticamente significativo en el empleo de términos de contenido emocional.

Por último, los investigadores compararon el uso de palabras asociadas a estados de ánimo en la literatura británica y en la estadounidense. El estudio concluye que, desde 1980, los escritores estadounidenses habrían desarrollado una narrativa mucho más emocional que los británicos.
 

Vectores de estilo

¿Refleja la abundancia de términos emotivos un cambio en el estilo literario? Según los autores, sí. En mayo del año pasado, James M. Hughes, informático del Colegio Universitario de Dartmouth, y otros colaboradores propusieron un novedoso enfoque estadístico para analizar el estilo literario de un autor. Para ello, confeccionaron una lista de 307 palabras con muy poco o ningún contenido semántico (artículos, preposiciones, pronombres, verbos muy polisémicos, etcétera) y determinaron la frecuencia relativa con la que un escritor dado empleaba cada una de ellas. Dicho método permitía asociar a cada autor un «vector de estilo»; es decir, una lista ordenada de la probabilidad con la que dicho escritor había empleado en sus obras cada una de las 307 palabras seleccionadas.

Una vez calculados los vectores de estilo correspondientes a cada uno de los autores incluidos en su muestra, Hughes y sus colaboradores emplearon técnicas de teoría de la información para cuantificar la distancia entre cada par de vectores. Una vez obtenida, los investigadores interpretaron dicha cantidad como un indicador matemático de la divergencia estilística entre cada par de escritores. Dicha hipótesis se mostró fundamentada por cuanto los resultados mostraban una clara agrupación temporal entre los escritores pertenecientes a una misma época. Es decir, mientras que dos autores coetáneos solían guardar poca distancia en el «espacio vectiorial de estilos», esta aumentaba de manera considerable a medida que los escritores se alejaban en el tiempo.

En el estudio publicado ahora, Acerbi y sus colaboradores calcularon con qué frecuencia se emplearon esas mismas 307 palabras en las obras escritas en inglés británico y en aquellas redactadas en inglés americano. Sus resultados indican una fuerte correlación con el uso de vocablos asociados a estados de ánimo: al igual que desde 1980 los escritores estadounidenses vienen empleando más términos emocionales que los británicos, lo mismo ocurre con el uso de las palabras que Hughes y sus colaboradores habían asociado al el estilo literario. En declaraciones a la revista Nature, David Krakauer, quien participó en aquella investigación, ha argumentado que dicha correlación no resultaría tan sorprendente, pues cabe imaginar que la expresión de emociones requiera utilizar a menudo oraciones más complejas y, por tanto, un mayor número de partículas funcionales.

Más información en PLoS ONE (acceso libre; A. Acerbi et al. sobre la frecuencia de uso de términos emocionales), PNAS (acceso libre; J. M. Hughes et al. sobre el análisis cuantitativo del estilo literario), Nature y Ngram Viewer de Google. Esta base de datos es pública y comprende una gran cantidad de textos en siete idiomas, el español entre ellos.

—IyC

Los boletines de Investigación y Ciencia

Elige qué contenidos quieres recibir.