La enfermedad de Alzheimer (EA) es el tipo más común de demencia entre las personas mayores. Se caracteriza por un deterioro cognitivo progresivo e irreversible con pérdida de memoria y alteraciones en el juicio y el lenguaje, junto con otros déficits cognitivos y síntomas conductuales. Los déficits cognitivos y los síntomas conductuales son lo suficientemente graves como para limitar la capacidad de un individuo para llevar a cabo actividades sociales, familiares o profesionales cotidianas. A medida que la enfermedad progresa, los pacientes desarrollan una discapacidad severa y una dependencia completa. Un diagnóstico precoz y preciso de la EA ayuda a los pacientes y a sus familias a planificar el futuro, y ofrece la mejor oportunidad para tratar los síntomas de la enfermedad. Según los criterios actuales, el diagnóstico se expresa con diferentes grados de certeza posible o probable de EA cuando la demencia está presente y otras posibles causas han sido descartadas. El diagnóstico definitivo de la EA se realiza mediante un estudio anatomopatológico post-mortem.

La característica clínica y manifestación más temprana de la EA es el deterioro de la memoria episódica. En el momento de la presentación de estas características, otros déficits cognitivos están presentes en las zonas como el lenguaje, funciones ejecutivas, la orientación, la percepción, habilidades y destreza. Comportamientos asociados y síntomas psicológicos incluyen apatía, irritabilidad, depresión, ansiedad, delirios, alucinaciones, desinhibición, agresión, comportamiento motor aberrante, así como cambios en el comer o los cambios de comportamiento del sueño. Todos estos síntomas llevan problemas en su funcionamiento en el día a día de la familia, en la actividad social y en actividades profesionales, a medida que la enfermedad progresa desde demencia leve a la demencia moderada y a demencia severa.

El diagnóstico de esta enfermedad se realiza sobre bases clínicas y requiere la confirmación de un síndrome de demencia progresiva así como la exclusión de otras posibles causas, basadas en la historia y el examen clínico, análisis de sangre completo y una prueba de imágenes cerebrales, como la tomografía computarizada (TC) o la resonancia magnética (MRI). El diagnóstico de las primeras etapas (no sólo de deterioro cognitivo leve sino también de demencias leves) sigue siendo problemático. Por un lado, los pacientes y familiares tienden a ignorar las primeras manifestaciones clínicas o adscribirlas a los esperables cambios cognitivos relacionados con la edad. Los pacientes suelen buscar consejo médico sólo 2-3 años después de la aparición de los síntomas. Por otra parte, los médicos pueden sentirse inseguros e incómodos con el establecimiento de un diagnóstico hasta que la demencia está plenamente presente, ya que podrían necesitar aplicar largas baterías neuropsicológicas, costosas pruebas de neuroimagen, o pruebas invasivas como la punción lumbar, para llegar a un diagnóstico. Por lo tanto no es extraño que la mayoría de los pacientes sean diagnosticados cuando ya han alcanzado la fase moderada de la enfermedad y se han convertido en dependientes de una forma u otra.

En estos recientes años, diferentes enfoques para el diagnóstico precoz de la EA han hecho avances significativos en el desarrollo de biomarcadores clínicos fiables. Sin embargo, los requisitos de coste y tecnología hacen imposible la aplicación de este tipo de biomarcadores para todos los pacientes con problemas de memoria; más bien, los pacientes deben ser clínicamente seleccionados, de modo que una punción lumbar o una Tomografía por Emisión de Positrones (PET) se realiza sólo en aquellos pacientes en los que hay una fuerte sospecha de una patología de EA subyacente.

Dados estos problemas, las técnicas no invasivas inteligentes de diagnóstico puede llegar a ser una herramienta valiosa para la detección temprana de la demencia. El personal no técnico en los entornos habituales del paciente podría utilizar estas metodologías que incluyen, por ejemplo, el Análisis Automático del Habla Continua (ASSA) o la Temperatura Emocional (ET), sin alterar o bloquear las habilidades de los pacientes, ya que el habla espontánea que precisan estas técnicas no se percibe como una prueba de estrés por el paciente. Por otra parte, estas técnicas son de muy bajo coste y no requieren de una amplia infraestructura o de la disponibilidad de médicos en el equipo. Por lo tanto, son capaces de proporcionar información fácil, rápida y económica.

f1

Figura 1: Porcentaje de segmentos de diferente duración para diferentes individuos (AD: Alzheimer, CR: controles). Izquierda, para segmentos que contienen señal de voz. Derecha, para segmentos que no contienen señal de voz.

En recientes estudios (véase por ejemplo "On Automatic Diagnosis of Alzheimer's Disease Based on Spontaneous Speech Analysis and Emotional Temperature", Cognitive Computation, DOI: 10.1007/s12559-013-9229-9) se utiliza la señal de voz y sus características para intentar desarrollar herramientas de ayuda a la detección precoz de la EA. Vamos a comentar los resultados más interesantes de este estudio:

En la figura 1 se muestra cómo es la distribución de segmentos de voz según diferentes longitudes de los segmentos y según si éstos contienen voz o no-voz (silencio, esperas, dudas, etc.). En la parte izquierda de la figura observamos que el porcentaje de segmentos largos de voz (entre 10 y 20 segundos, o mayores de 20 segundos) es prácticamente nulo en pacientes con EA, mientras que sí están presentes en los controles sanos. Por otra parte, vemos que los pacientes con EA tienen un porcentaje elevado de segmentos de voz de corta o muy corta duración (de 2 a 4 segundos, o menores de 2 segundos) mientras que éstos casi no están presentes en los controles. En referencia a los segmentos de no-voz (parte derecha de la figura 1), el efecto es contrario: los pacientes con EA tienen porcentaje significativamente menor de segmentos de no-voz de corta duración (de 1 a 2 segundos) comparados con los controles, mientras que tienen segmentos de no-voz de mayor duración (entre 4 y 10 segundos o superio a 10 segundos) que prácticamente no se aprecian en los controles.

Respecto a la Temperatura Emocional, parámetro extraído a partir de la señal de voz y que mide de alguna forma el grado de emoción de la voz (sin discriminar entre emoción positiva o negativa), su información es importante a la hora de diseñar sistemas de clasificación automática para la ayuda al el diagnóstico precoz de la EA. Un ejemplo del cálculo de la ET se muestra en la siguiente figura (Figura 2): 

f21

f22

Figura 2: Ejemplo de cálculo de la Temperatura Emocional (ET). Arriba, señal de voz y ET para un sujeto control. Abajo, señal de voz y ET para un paciente con Alzheimer.

En la parte superior tenemos un fragmento de señal de voz de un sujeto control y la evolución de la ET a lo largo de ésta. En la parte inferior tenemos un fragmento de señal de voz de un paciente con EA y la correspondiente evolución de la ET. Numéricamente se observa que la ET del sujeto sano es de 100 mientras que la del paciente con EA es de 46 aproximadamente.

La utilidad de esta variable se demuestra en la figura 3, donce se presentan los resultados de diferentes tipos de sistemas de clasificación automática desarrollados utilizando diferentes tipos de parámetros como información de entrada. El primer grupo de barras (conjunto SSF) utiliza parámetros obtenidos directamente de la señal de voz (histograma y su evolución a lo largo del tiempo, porcentaje de segmentos voz/no-voz, energía, centroide espectral, etc.). El segundo grupo (conjunto EF) utiliza características emocionales de la voz (pitch, desviación estándar del pitch, máximo y mínimo del pitch, intensidad, máximo y mínimo de la intensidad, parámetros que caracterizan/describen la cualidad de la señal de voz, etc.). El tercer grupo incorpora el parámetro ET (temperatura emocional) a los parámetros EF (grupo 2). El cuarto grupo explora los parámetros SSF (grupo 1) más los EF (grupo 2), y finalmente el quinto grupo contiene los parámetros del grupo 1, los del grupo 2 y el parámetro ET. En todos los casos, los diferentes colores de las barras se relacionan con el sistema de clasificación utilizado. Observamos cómo la inclusión del parámetro ET (grupo 3 y grupo 5) mejora sensiblemente el sistema (comparar con grupo 2 y grupo 4, respectivamente), disminuyendo el porcentaje de error de clasificación para los diferentes sistemas.

f3 

Figura 3: Porcentaje error de clasificación en el diagnóstico de la EA, para diferentes tipos de sistemas: perceptrón multicapa (MLP), máquina de vector soporte (SVM), vecino más cercano (KNN) y Naive Bayes. Cada grupo de barras utiliza un conjunto diferente de características como información para llevar a cabo la clasificación.

Queda todavía mucho camino por recorrer en este campo, pero este estudio muestra que sería posible utilizar la señal de voz como una herramienta más a la hora de poder detectar la EA de forma precoz, que proporcionaría otro tipo de información valiosa a los médicos con la cual complementar su visión sobre el paciente y tomar la decisión más adecuada. En futuros posts volveremos al tema con más avances en el uso de la voz para EA y otras patologías.

Enlaces de interés:

1) Fundació Pasqual Maragall

2) CEAFA

3) Fundación Alzheimer España

 

 

 

 

Jordi Solé i Casals
Jordi Solé i Casals
Sobre este blog
En la sociedad actual todo va muy deprisa. Comunicaciones, industria, avances técnicos y científicos... mucha información y poco tiempo para asimilarla nos produce vértigo y nos deja vacíos de saber. Intentaremos dar a conocer diferentes avances en el campo de la ciencia y la técnica en un lenguaje accesible, y devolver a la sociedad los resultados de las investigaciones hoy en curso.
Ver todos los artículos (19)