Análisis computacional de la voz para la detección de demencia leve
67
0
0
Texto completo
(2) Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica Departamento de Biomédica. TRABAJO DE DIPLOMA Análisis Computacional de la Voz para la Detección de Demencia Leve Autor: Keishauna Carina Baptiste [email protected]. Tutor: Dr.C. Eduardo Gonzalez Moreira [email protected]. Santa Clara 2014 "Año 56 del triunfo de la Revolución".
(3) Hago constar que el presente trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería en Informática, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Tutor. Firma del Jefe de Departamento donde se defiende el trabajo. Firma del Responsable de Información Científico-Técnica.
(4) i. PENSAMIENTO. “Puesto que a vivir viene el hombre, la educación ha de prepararlo para la vida. En la escuela se ha de aprender el manejo de las fuerzas con que la vida se ha de luchar…” Jose Marti.
(5) ii. DEDICATORIA. Dedico este trabajo a mis padres, por ser ejemplo y guía en mi vida y por inspirarme..
(6) iii. AGRADECIMIENTOS. A mis padres y el gobierno por haberme dado la oportunidad de venir a Cuba a estudiar esta carrera. A mi tutor el Dr.C. Eduardo Gonzalez Moreira por su profesionalidad y sabiduría. . A Dhana Lazarus y Natalia Godfrey por su amistad. A mi novio Kenon Prescott por estar a mi lado cuando le necesito. A mis excelentes profesores de la carrera. A la psicóloga Marlene y los pacientes del Hogar de Ancianos local #2 de Santa Clara que aportaron muchísimo. A los compañeros de España por su apoyo y contribución de los equipos necesarios para que este trabajo pudiera llevarse a cabo con calidad..
(7) iv. TAREA TÉCNICA Revisión bibliográfica acerca de estudios realizados sobre mediciones de demencia leve mediante el análisis prosódico habla. Determinación de los ejercicios para las mediciones de demencia leve en el Hogar del Adulto Mayor #2 de Santa Clara. Realización de mediciones del habla en las grabaciones de voz para determinar demencia leve. Análisis de las mediciones realizadas para identificar demencia leve. Redacción del informe.. Firma del Autor. Firma del Tutor.
(8) v. RESUMEN. Estudios realizados en los últimos años indican la relevancia de las características del habla para la discriminación entre personas sanas y enfermas con demencia leve o demencia. El presente trabajo se ha centrado en el estudio de técnicas que permitan la detección temprana de la demencia leve por medio de la extracción y el análisis de parámetros asociados a la prosodia de la voz. Para ello, se ha dispuesto de una base de datos consistente de dos grupos diferenciados: uno con sujetos diagnosticados con demencia y otro con sujetos sanos. El objetivo, pues, de este documento es describir los pasos, estudios y análisis realizados sobre esta base de datos mediante el empleo de parámetros prosódicos, así como las conclusiones extraídas a partir de los resultados. En primer lugar, se realiza una revisión del estado del arte relacionada con la detección de demencia leve mediante el procesamiento digital de la voz. Dicha revisión permitió conocer las pruebas con mejores resultados tanto para el pesquisaje como para la extracción de rasgos objetivos del habla. Posteriormente se procedió a la creación de la base de datos para luego realizar la extracción de los parámetros de cada grupo y una comparativa de la media resultante en cada uno de los mismos, con el objetivo de observar las posibles diferencias existentes. Por último, se estudió mediante métodos estadísticos la importancia de los parámetros prosódicos extraídos con anterioridad a la hora de emplearse como discriminativos entre sujetos sanos y enfermos, y se implementaron varios clasificadores para comprobar la eficiencia discriminativa de los rasgos..
(9) vi. TABLA DE CONTENIDOS. PENSAMIENTO .....................................................................................................................i DEDICATORIA .................................................................................................................... ii AGRADECIMIENTOS ........................................................................................................ iii RESUMEN ............................................................................................................................. v INTRODUCCIÓN .................................................................................................................. 1 Organización del informe ................................................................................................... 4 CAPÍTULO 1.. Fundamentos teóricos sobre la demencia y su relación con el habla. ....... 6. 1.1. Definición de demencia............................................................................................ 6. 1.2. Diagnóstico de la demencia leve .............................................................................. 9. 1.3. Prevalencia e incidencia en las demencias ............................................................. 10. 1.4. Análisis perceptivo del habla ................................................................................. 10. 1.5. Análisis instrumental del habla .............................................................................. 12. 1.6. Estudios relacionados con la detección instrumental de la demencia leve ............ 13. 1.7. Conclusiones parciales. .......................................................................................... 16. CAPÍTULO 2. 2.1. Análisis del sistema para la medición de la demencia ............................ 18. Creación de la base de datos de demencia ............................................................. 19. 2.1.1. Protocolo seguido en el proceso de grabación ................................................... 19. 2.1.2. Descripción de la base de datos .......................................................................... 25.
(10) vii 2.1.3. Corpus de voz ..................................................................................................... 26. 2.1.4. Software DCGrab v3.0 ....................................................................................... 28. 2.2. Extracción de rasgos de la base de datos de demencia .......................................... 31. 2.2.1. Análisis prosódico de la voz ............................................................................... 31. 2.2.2. Herramientas Praat, Prosogram y Matlab ......................................................... 32. 2.2.3. Tipos de Segmentación....................................................................................... 34. 2.3. Rasgos Prosódicos para la Caracterización de la Demencia .................................. 35. CAPÍTULO 3.. RESULTADOS Y DISCUSIÓN ............................................................. 37. 3.1. Descripción estadística de los rasgos extraídos. .................................................... 37. 3.2. Obtención de rasgos significativos......................................................................... 40. 3.2.1. Prueba de Kolmogorov-Smirnov. ................................................................... 40. 3.2.2. Obtención mediante trazado de curvas ROC .................................................. 42. 3.3. Comparativa de resultados ..................................................................................... 45. 3.4. Clasificación de los pacientes ................................................................................ 46. 3.4.1 3.5. Clasificador LDA ............................................................................................ 47. Conclusiones del capítulo ...................................................................................... 50. CONCLUSIONES Y RECOMENDACIONES ................................................................... 52 Conclusiones ..................................................................................................................... 52 Recomendaciones ............................................................................................................. 52 REFERENCIAS BIBLIOGRÁFICAS ................................................................................. 53.
(11) 1 INTRODUCCIÓN. INTRODUCCIÓN. El incremento de la esperanza de vida es debido al envejecimiento progresivo de la población en muchos de los países desarrollados, y por lo tanto se ha determinado un cambio en los tipos de patologías desarrolladas en la población [1]. Estudios han mostrado que aproximadamente 1% de la población mundial exhibe demencia, con enfermedad de Alzhéimer (EA) siendo el tipo más común [3]. Hasta el día de hoy no se ha logrado identificar su causa ni una cura, sin embargo tras el diagnóstico, los pacientes viven aproximadamente unos 8-10 años, o en algunas ocasiones pueden sobrevivir hasta 20 años. La enfermedad de Alzheimer es la enfermedad neurodegenerativa más importante por su presencia y su naturaleza destructiva. Está definida científicamente como la más común de las demencias, que es la pérdida del funcionamiento cognitivo, y es una enfermedad irreversible y progresiva del cerebro que destruye de forma lenta la memoria y las aptitudes del pensamiento. Esta destrucción progresiva incapacita con el tiempo a la persona que la padece impidiéndole llevar a cabo las tareas más simples. Las personas con Alzheimer no olvidan solamente detalles, sino que olvidan el contexto completo. Tomó su nombre del médico alemán Alois Alzheimer, quién la describió por primera vez en 1907 tras detectar masas anormales y bultos retorcidos de fibras al analizar el cerebro de una mujer fallecida a causa de una rara enfermedad mental. La fisiología de la enfermedad de Alzheimer se encuentra relacionada con un proceso destructivo enfocado en áreas corticales específicas y el hipocampo. Estas regiones cerebrales se encuentran asociadas directamente con la función cognoscitiva y su estado de degeneración correlaciona con el grado clínico de la demencia. A nivel neuropatológico.
(12) 2 INTRODUCCIÓN. está caracterizada por dos tipos de estructuras patológicas llamadas marañas neurofibrilares (nudos neurofibrilares) y placas neuríticas (placas amiloideas). Las marañas neurofibrilares representan densas acumulaciones de filamentos anormales formados por la proteína tau, y las placas están formadas por fibrillas insolubles del péptido amiloide β. Los nudos o marañas neurofibrilares comienzan a formarse en la parte profunda del cerebro, en una zona llamada corteza entorrinal, y las placas neuríticas se van formando en otras zonas del cerebro. A medida que aumenta el número de estas dos estructuras patológicas, las neuronas sanas comienzan a funcionar con menos eficacia. Esto ocurre inicialmente, y a esto le sucede la pérdida de su habilidad de funcionar y comunicarse entre sí, produciéndose finalmente la muerte de dichas neuronas. La sintomatología incluye pérdida progresiva de la memoria, inicialmente a corto plazo, disminución de las habilidades cotidianas, desorientación temporal y espacial, dificultad en el aprendizaje y progresiva pérdida de la comunicación verbal. Uno de los cambios que se producen en los estados iniciales. de la enfermedad es que la persona presenta un. comportamiento diferente al habitual, de tal forma que parece una persona diferente. La persona es menos capaz, muestra menos interés en sus aficiones, cambios de humor, es incapaz de tomar decisiones y rechaza cualquier tipo de responsabilidad. Además los daños cerebrales producidos por el Alzheimer aparecen entre 10 y 20 años antes de que estos síntomas sean evidentes. En la mayoría de los estudios antiguos se han utilizados técnicas hechos por psicólogos profesionales donde se hacen cuestionarios, para hacer apuntaciones específicos para poder diagnosticar si una persona exhibe síntomas de la enfermedad. Sin embargo estos métodos no son muy precisos ni eficientes, dado que ellos son sometidos también a observaciones visuales de un observador (psicólogo), por lo tanto puede resultar como un diagnostico prejuiciado e incorrecto. Por esa razón avances hoy en día han tratado de mejorar el diagnóstico para que este no se limite los resultados de solo las observaciones de un observador. Así que nuestro trabajo es implementar una técnica más fiel y concreto para analizar dicha enfermedad, al fin de poder detectar los síntomas tempranos. Estudios han mostrado que una de las áreas cognitivas más afectadas por el deterioro cognitivo es el lenguaje [4]. La demencia afecta el lenguaje a dos niveles: nivel lingüístico.
(13) 3 INTRODUCCIÓN. (contenido verbal) y el nivel paralingüístico (como una persona habla). Al nivel lingüístico, en la mayoría de los casos, existe una disminución en la fluidez semántica y fonológica, y dificultades de la denominación de objetos. Además, se han observado que los casos de demencia de tipo Alzheimer son acompañados por afasia (una pérdida de la capacidad oral y escrita para comunicarse) [5], [6]. Errores en el procesamiento semántico, un vocabulario poco profundo y dificultades a la hora de encontrar palabras son algunos síntomas de la afasia, que a su vez llevan a un deterioro del habla espontánea [7]. La naturaleza progresiva, y en la mayoría de casos, la evolución continua del deterioro cognitivo hace difícil una diferenciación entre la normalidad, con la pérdida irremediable de facultades debidas a la edad, el deterioro cognitivo leve y la demencia. Por ello se fijan dos objetivos, primero detectar si hay deterioro cognitivo o no, y segundo discriminar la gravedad entre normalidad, deterioro cognitivo leve o demencia. La ocurrencia de esta enfermedad ha conducido a efectos desfavorables en la sociedad, aun más, se afecta más a los afectados tanto a nivel social como familiar. Además, el número de casos segué aumentando acorde incrementamos también la esperanza de vida. Por ello, cada día se aumentan las investigaciones destinadas a hallar curas a sus síntomas, pese a que todavía no se ha logrado identificar su causa. Debido a la naturaleza degenerativa de la enfermedad de Alzhéimer, cobra una importancia primordial su detección precoz. En etapas tempranas se puede optar a terapias más eficaces, logrando controlar los síntomas de la enfermedad y ralentizar su avance. Sin embargo, aproximadamente el 50% de los afectados se diagnostican en una fase moderada o avanzada, donde los síntomas son muy evidentes debido a que el daño neuronal se encuentra muy avanzado, por lo que el tratamiento resulta poco efectivo. Es importante hablar del debate que existe en el diagnóstico precoz del Alzhéimer. Es un hecho consensuado que el diagnóstico temprano de la enfermedad hace que pueda ser llevada mejor, viéndose disminuidos sus síntomas cuanto antes sean tratados. Pero puesto que no existe un tratamiento que permita curar al enfermo, y el conocimiento de la enfermedad provoca gran angustia tanto al paciente como a la familia, existen partidarios.
(14) 4 INTRODUCCIÓN. de evitar esta detección precoz; afirmando que puesto que ésta no llegará a curar al paciente, es mejor evitar el sufrimiento que conlleva su conocimiento temprano. Pese a estas afirmaciones, si se realiza una evaluación objetiva de los pros y contras del diagnóstico temprano, se puede concluir que resulta más beneficioso que perjudicial. Con el fin de lograr dar solución al problema existente se plantean los siguientes objetivos de investigación: Objetivo General: Desarrollar un análisis computacional de la voz para identificar demencia leve. Objetivos Específicos: Identificar los rasgos característicos presentes en la voz de los pacientes con demencia leve descritos en la literatura. Realizar grabaciones con el sistema de medición a pacientes que presenten afectación de demencia leve. Extraer rasgos prosódicos del habla que permitan la identificación de demencia leve, haciendo un análisis cualitativo y cuantitativo de los mismos. Organización del informe El informe del trabajo está estructurado de la siguiente manera: introducción, capitulario, conclusiones, recomendaciones, referencias bibliográficas. En la introducción se dejará definida la importancia, actualidad y necesidad del tema que se aborda y se dejarán explícitos los elementos del diseño teórico, además se plantea la necesidad de la investigación, antecedentes y las características de las mediciones realizadas. En el Capítulo I se realiza la fundamentación teórica sobre el deterioro cognitivo. Se analizan diferentes estudios realizados en el mundo con respecto al tema. En el Capítulo II se analizan las características del sistema utilizado para las mediciones y se caracteriza el proceso de obtención de las muestras para la realización del estudio. El Capítulo III se dedicará a analizar los resultados obtenidos a partir de los rasgos prosódicos y sus análisis estadísticos, teniendo como objetivo final identificar demencia leve mediante el habla para.
(15) 5 INTRODUCCIÓN. su posterior uso en las consultas de neurología. A modo de conclusiones se exponen los principales resultados que deben dar respuesta a los objetivos planteados a inicio del trabajo. Las recomendaciones indicarán las mejoras palpables para futuros trabajos en el tema. Por último la bibliografía muestra todo el material consultado para la elaboración del trabajo..
(16) 6 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. CAPÍTULO 1. Fundamentos teóricos sobre la demencia y su relación con el habla.. En el presente capítulo se realiza la fundamentación teórica sobre la demencia y su relación con la voz. Igualmente, se ofrece una pequeña introducción al análisis prosódico de la voz. Y por último, se analizan diferentes estudios realizados en el mundo, relacionados con la medición del deterioro cognitivo, en los cuales se destaca su utilidad en el análisis de los resultados obtenidos y las diferencias entre ellos. 1.1. Definición de demencia. Las funciones intelectuales o cognitivas del anciano sufren una disminución mantenida desde la normalidad cognitiva a la demencia grave, constituyendo un "continuum" (Figura 1.1), lo cual implica que incluso ancianos con buena salud presenten un declive leve [2]. La evolución del envejecimiento cognitivo conduce a lesiones en diferentes áreas del cerebro, afectando a las funciones ejecutivas, lingüísticas, velocidad de procesamiento y memoria tanto a corto como a largo plazo. La naturaleza degenerativa de este envejecimiento cognitivo, puede incrementar impidiendo con la capacidad de los ancianos enfermos para realizar actividades de la vida cotidiana..
(17) 7 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. Figura 1.1 Continuum del rendimiento cognitivo. La palabra demencia es derivada del latín demens (de: fuera, mens: espíritu, mente). Demencia se puede definir como un debilitamiento progresivo global, de las capacidades intelectuales e emocionales, graves e irreversibles, en el caso de demencia tipo Alzheimer o demencia vascular. Los otros tipos de demencia, usualmente son tratables o incluso totalmente o parcialmente reversibles, como por ejemplo las enfermedades tiroideos, déficit de B12, mala indicación o abuso de psicótropos, depresión mental, etc. Aún más, algunos de los signos exhibidos por las personas que sufren con demencia son: una perdía parcial del conocimiento de los acontecimientos actuales y recientes, cierta incapacidad de recordar su historia personal, incapacidad de concentrar como resultado de sustracciones de serie [8]. También, se experimentan desorientación temporal y espacial, tienen deterioro de reconocimiento de personas y caras familiares, son incapaces de viajar a lugares conocidos y realizar tareas complejas. Muestran además un déficit de responder adecuadamente a una.
(18) 8 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. estimulación exterior. Negación de cualquier problema relacionado con la memoria y evitación de situaciones difíciles [8]. Es importante notar que la definición de demencia como pérdida intelectual, no es lo mismo como la de retardo mental, en el cual el intelecto nunca alcanzó un desarrollo normal [9]. Dicha definición, en el significado presente de enfermedad crónica que afecta fundamentalmente a las funciones cognitivas y es resultado de deterioro en el cerebro, aparece con las primeras concepciones de Esquirol [10], empleándose dentro del contexto médico. "Demencia es una afección ordinariamente sin fiebre y crónica, caracterizada por un debilitamiento de la sensibilidad, la inteligencia y la voluntad, con incoherencia de ideas, defecto de la espontaneidad intelectual y moral y tales son los signos de esta afección. El hombre que está en la demencia ha perdido la facultad de percibir espontáneamente los objetos, captar sus relaciones, comparar, preservar el recuerdo por completo, de lo que resulta la imposibilidad de razonar con éxito" [10]. Al resumir, Esquirol no solamente hace referencia al deterioro cognitivo, que con el tiempo fue recibiendo máxima importancia, sino que se explica también el significado de los enfermedades emocionales y conductuales, en día presente en primer plano. Al inicio del siglo XX, el término de demencia ya había sido definido como una fase donde hay degeneración intelectual crónica debido a daños específicos al cerebro. En el año 1903 Kraepelin [11] ya había definido la diferencia entre la demencia senil pura y la demencia arterioesclerótica. Luego en el año 1984 McKlan [12] y sus colaboradores explicaron bien el diagnóstico de demencia: la demencia es el declive de las funciones cognitivas en comparación con el nivel previo del funcionamiento del paciente, determinado por la historia de declive y por las alteraciones apreciadas en el examen clínico y mediante pruebas neuropsicológicas. A pesar del hecho que la dicha definición de demencia ha sufrido variaciones significativas, las definiciones actuales sobre el término que son más concretas y precisas, aportadas por.
(19) 9 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. organismos internacionales como la Asociación Americana de Psiquiatría (APA por las siglas en ingles de American Psychiatric Association). Dicho organismo desarrolló el Manual de Diagnóstico y Estadística de Enfermedades Mentales (DSM por las siglas en ingles de Diagnostic and Statistical Manual of Mental Disorders) en 1952, con el fin de diseñar criterios fundamentales para el diagnóstico de enfermedades psiquiátricas, realizando la tercera edición del DSM (DSM-III) en 1980 y la revisión siguiente en 1987 (DSM-III-R). El DSM consiguiendo una gran difusión mundial, abordando las demencias con más amplitud, siendo éstas definidas y clasificadas. La última revisión del DSM en 1994 (DSM-IV) mejoró los criterios diagnósticos de las demencias [13]. 1.2. Diagnóstico de la demencia leve. El diagnóstico de demencia leve involucra establecer que un paciente ha avanzado los requisitos de déficit cognitivo a través de los exámenes de memoria rápidos tales como el test MMSE (por las siglas en ingles de Mini-mental State Examination). El test MMSE, también conocido como test Mini-mental, es un método muy utilizado para detectar el deterioro intelectual así como vigilar su evolución [9], [14]. Esta prueba incluye 11 preguntas y requiere sólo de 5 a 10 minutos para administrarlo. Se le llama "mini" porque se concentra sólo en los aspectos cognitivos de funciones mentales, y excluye preguntas sobre el estado de ánimo, las experiencias mentales anormales y la forma de pensar. El test Mini-mental está dividido en dos secciones, la primera de las cuales requieren respuestas sonoras y cubre orientación, memoria y atención; la máxima puntuación es 21. La segunda parte prueba la habilidad para nombrar, seguir órdenes verbales y escritas, escribir una frase espontáneamente, y copiar un polígono complejo parecido a una figura de Bender Gestalt; la máxima puntuación es 9. Debido a que la lectura y escritura están involucradas en la segunda parte del test, los pacientes con deterioro visual puede tener alguna dificultad adicional que usualmente se alivia empleando textos con letras grandes. La máxima puntuación total es de 30 [14]. Por otro lado, otra prueba que se aplica es el análisis del nivel de lectura como medida de reserva cognitiva y como predictor fiable del rendimiento en pruebas de valoración de.
(20) 10 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. distintos dominios cognitivos [15]. También existe el análisis del habla espontánea y conversacional en pacientes con demencia. Adicionalmente existen técnicas que se basan fundamentalmente en el análisis diferencial de disartria. Los problemas de la articulación como resultado de disartria son tratados por patólogos de lenguaje del habla, usando una colección variada de técnicas. Los tratamientos tradicionales le apuntan a la corrección de déficits en la tasa (de articulación), la prosodia (por ejemplo afectaciones de apraxia verbal, afasia motriz), intensidad, la resonancia (la habilidad para alterar el tracto vocal y resonar espacios para sonidos fonéticos correctos) y la fonación [16]. 1.3. Prevalencia e incidencia en las demencias. Datos de la Organización Mundial de la Salud (OMS) han mostrados que la prevalencia de demencia en la población mayor de 65 años es entre el 3% y el 8%. Además se reflejó que entre la población de 80 o más años de edad, dicha prevalencia es del 15 al 20%. Aún más, la edad avanzada y el pertenecer al sexo femenino más un nivel educativo bajo, son factores de riesgos independientes y altamente significativos en el caso de demencia [17]. Es posible que la falta de educación a edad temprana lleve a una disminución de la "reserva cerebral" (número de neuronas y conexiones sinápticas), lo que permitirá que los síntomas de demencia aparecieran en una fase más temprana de la progresión de la enfermedad. Además según Blesa y Santacruz en el 1998 factores nutricionales y otros factores socioeconómicos también podrían intervenir [18]. La enfermedad de Alzheimer es una de la más predominante de los diferentes tipos de demencia que existen. Casi más de la mitad de la prevalencia de todas las demencias (entre el 50% y el 70%) representa Alzheimer, seguida de la demencia vascular o infarto múltiple (DMI) que provoca alrededor del 40% de las demencias. 1.4. Análisis perceptivo del habla. Una herramienta clínica muy útil para la detección de la demencia leve son las pruebas relacionadas con el Análisis Perceptivo del Habla [18] (PAS, por las siglas en ingles de.
(21) 11 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. Perceptual Análisis of Speech). Se fundamenta en las percepciones de los médicos sobre lo que oyen en las voces de las personas con deterioro cognitivo de acuerdo a sus capacidades de escucha, formación, experiencia y conocimiento sobre la enfermedad evaluada. En la literatura, la fiabilidad de los jueces o los médicos es evaluada usando intra e inter juicios. Intra juicio depende de las pruebas repetidas sobre una muestra de un juez e inter juicio depende de las comparaciones entre los jueces de una misma muestra. Según el estudio de (Kent R.) el definió el análisis de la percepción como la primera opción del clínico en el tratamiento de trastornos del habla [19]. Además, los métodos de dicha percepción llevan ventajas fuertes de conveniencia, economía, y robustez. Hay que usar regularmente en la práctica clínica, el diagnóstico provisional, sin los beneficios de datos adicionales. A pesar de esas ventajas, el método de PAS es susceptible a una variedad de errores y prejuicios. La conciencia de estas amenazas a la validez y la fiabilidad es un paso principal en el uso efectivo y afinado de los métodos de dicha percepción. Existen preocupaciones sobre los juicios de percepción del habla en la práctica clínica, dado que las suposiciones basadas sobre el uso de dichos juicios no siempre caractericen la realidad. Por lo tanto los problemas enfrentados por el análisis son: Los jueces no parecen tener definiciones equivalentes de las dimensiones a ser evaluadas. Este fenómeno es como consecuencia de que en las evaluaciones del habla, los especialistas no están de acuerdo sobre cuáles de los aspectos de voz son más importantes en la valoración normal y trastornos del habla. Por lo tanto no logran alcanzar un consenso fijo para el análisis de percepción de habla. Luego las valoraciones perceptivas de varios aspectos de voz no están correlacionadas. Entonces como resultado de lo indicado anteriormente, varios aspectos perceptivos no son evaluadas con fiabilidad uniforme. En fin las diferencias entre jueces expertos son mayores de las diferencias necesarias para la clasificación diagnóstica o los efectos de intervención [20]..
(22) 12 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. 1.5. Análisis instrumental del habla. Se puede definir el análisis instrumental del habla como la realización de un análisis fisiológico o acústico con la ayuda de herramientas y algoritmos para medir algunos fenómenos en el proceso de producción del habla. Generalmente, cada instrumento o algoritmo es creado para ofrecer información sobre un aspecto particular de la producción del habla, como por ejemplo; movimientos estructurales, corriente y presión de aire generado en diversas partes del mecanismo del habla y actividades musculares. Con respecto al mecanismo del habla, dicho análisis instrumental ha sido muy efectivo y ha mostrado muchas diversidades de herramientas y operaciones que están diseñados para ofrecer información acera de aspectos concretos de la producción del habla como por ejemplo las funciones de articulación, laringe, las vías respiratorias y el puerto velofaríngeo. Además, el análisis instrumental plantea un análisis acústico que se usa para relacionar medidas acústicas con relación a varios aspectos del motor control del habla. Dependiendo de la muestra de discurso recogida y de la naturaleza del análisis, pueden ser calculadas un número de diversas medidas acústicas. Por lo tanto, no hay un sistema estándar de medidas para una observación específica. La mayoría de los análisis acústicos reportados en la literatura centran su estudio sobre la frecuencia fundamental, energía, prosodia y articulación. Estudios de análisis instrumental enseñan que dicho análisis prevalece algunas de las limitaciones del análisis perceptivo. Hay que provee medidas objetivas en un amplio rango de diferentes parámetros del habla para evaluación a corto plazo, así como el seguimiento a largo plazo del aparato del habla. Además puede ampliar la precisión del diagnóstico a través de una descripción más detallada de los rasgos anormales [16]. A pesar de las ventajas indicadas anteriormente, existen limitaciones en la aplicación del análisis en la práctica clínica..
(23) 13 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. Hay la falta de disponibilidad de equipos instrumentales en la práctica cotidiana. También existe una falta de coincidencia entre las mediciones directas del análisis instrumental y el análisis perceptivo hecho por el clínico. Esto se debe porque la técnica instrumental requiere más de dos observaciones para describir los rasgos perceptivos. Además la interacción de los diferentes subsistemas afectados pueden afectar las mediciones instrumentales [21]. 1.6. Estudios relacionados con la detección instrumental de la demencia leve. Hoy en día estudios del procesamiento de voces patológicas han usado sistemas donde se combinen valoraciones objetivas y subjetivas para valorar la gravedad de los rasgos de la voz, en dependencia de su precisión. Uno de estos trabajos reportados es “La Valoración Automatizada De Estado Cognitivo Del Habla” [22]. En este artículo se aborda la temática de estudiar la usabilidad de métodos automatizados para evaluar la valoración de prueba del estado cognitivo verbal para los ancianos. También se enfoca sobre en dos tipos de pruebas: una prueba de retentiva de historia, destinada para la valoración de funcionamiento de memoria, lenguaje y una prueba de descripción de la visualización, usada para evaluar la contenida de información del habla. Una colección de datos fue diseñada por las grabaciones de aproximadamente 100 ancianos con edades de 70 años y mayores. Las pruebas del habla son manualmente transcritas y anotadas con unidades semánticas para obtener puntuaciones manuales de evaluación. Se proponen el uso de reconocimiento automático del lenguaje del habla y procesamiento del lenguaje para encontrar una métrica objetiva, automáticamente extraída de estado cognitivo que es correlacionado con el manual de puntuaciones. Se usan retentiva y precisión métrica básica establecida en las unidades semánticas asociadas con las pruebas. En el artículo “Marcadores automáticos derivados del lenguaje hablado para la detección de DCL” [23], se utilizaron grabaciones de audio de 44 exámenes neuropsicológicos de un test de recuento narrativo. Los sujetos se dividieron en dos grupos por su estado cognitivo.
(24) 14 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. previamente diagnosticado, aquellos con un CDR (razón de demencia) de 0, saludables, y aquellos con 0,5, con Deterioro Cognitivo Leve (DCL). Con el audio y la transcripción de los test de recuento, se producen una serie de marcadores automáticos que incluyen (entre otros) frecuencia de pausa y complejidad gramatical. A partir de estos marcadores, el estudio concluye que la utilización de ciertos marcadores derivados del lenguaje hablado (y que no son los que marcan la fidelidad de la narración del paciente a la narración inicial) muestran significativas diferencias entre los dos tipos de grupo, saludables y con DCL. A pesar del hecho que el trabajo fue diseñado para la detección de Deterioro Cognitivo Leve, el mismo procedimiento puede ser utilizado también para detectar demencia leve. Otro artículo reportado en 2012 por Prud'hommeaux & Roark [24]. En el mismo se aborda el análisis computarizado del habla y lenguaje para identificar correlaciones psicolingüísticas de degeneración del lobar de fronto-temporal. Esta técnica se basa en el procesamiento de lenguaje natural (NLP por las siglas en inglés de Natural Language Processing) y el reconocimiento automático del Lenguaje del habla (ASR por las siglas en inglés de Automatic Speech Recognition) que consiste de un grupo de técnicas computacionales usados para el análisis computarizado del habla y lenguaje (Figura 1.2) Estos procedimientos tienen como objetivo la evaluación del uso de un sistema computarizado semiautomatizado para medición de las características del habla y de lenguaje en pacientes con degeneración frontotemporal lobar (FTLD por las siglas en ingles de Frontotemporal Lobar Degeneration). FTLD es un desorden heterogéneo que consiste de al menos 3 variantes. La valoración computarizada de descripciones verbales espontáneas por pacientes con FTLD ofrece una vista detallada y reproducible de los déficits cognitivos..
(25) 15 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. Fig.1.2 Esquema de funcionamiento del método de apoyo al diagnóstico. En un estudio más reciente, “Índices semánticos automáticos para la detección temprana de los cambios cognitivos” [25], ha desarrollado un nuevo método que utiliza tecnologías del habla para realizar una detección temprana de los cambios cognitivos, analizando información sobre la duración de las palabras y el contenido semántico de éstas. Su motivación recae en que pese a que los test de fluidez verbal son muy utilizados para el diagnóstico de la enfermedad de Alzhéimer, y son fáciles de administrar, los métodos de puntuación estándar de estos test no detectan cambios en las fases muy tempranas de estados cognitivos previos a la demencia. El trabajo tiene como objetivo de desarrollar un sistema especial de reconocimiento de voz que realizará transcripciones de la voz de una persona que padezca la demencia leve. Con esas transcripciones ellos pueden hacer mediciones de la duración de las palabras con gran precisión de tal manera que se pueden analizar la vacilación, entonación y el tono de voz, con el fin de obtener información acerca del el estado cognitivo y emocional del paciente. Su comportamiento se basará en la correlación de las medidas semánticas con marcadores neurodegenerativos obtenidos mediante fMRI. El instrumento podría ser implementado en.
(26) 16 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. plataformas móviles y telefónicas, permitiendo una colección de voz remota, útil para realizar pruebas clínicas con una observación a largo plazo y desde el hogar, además de a gran escala. Podría ser un método adecuado para caracterizar los cambios cognitivos asociados con el riesgo de progreso a Alzheimer. Adicionalmente en el estudio de “Patente de un dispositivo activador del estado cognitivo de Alzheimer”, [26] un patente de un dispositivo computacional es utilizado para la interacción de usuario cuando el usuario esta en un estado mentalmente debilitado, incluyendo una memoria que almacena señales de EEG. Formas de patrones de ondas de EEG ya generadas y asociadas a ciertos datos cuando el usuario es estimulado con dichas ondas, se almacenan en memoria. Un componente de entrada detectará la forma de onda del EEG de un usuario, y un procesador la comparará con las ondas de los EEG patrones, buscando coincidencia, de modo que un procesador de salida generará la respuesta asociada al patrón que sea determinado por el procesador. Los datos asociados para la generación de patrones son imágenes y sonido, de forma que permite la creación de una base de datos que asocia estímulos sonoros y visuales con la forma de onda del EEG producidos por un mismo usuario. Los datos de forma de onda de EEG recogidos del paciente pueden ser analizados utilizando protocolos establecidos para la predicción de la Alzheimer., ya que se pueden analizar usando protocolos actualmente establecidos para la predicción de o indicio de la enfermedad de Alzheimer. A través de estos dos métodos, existe un grado razonable de probabilidad estadística que permite entender el grado de incapacidad del paciente en un momento dado, y si es su propia decisión la respuesta a llamadas telefónicas, comunicaciones por el ordenador, o bien el llamado de los cuidadores o familiares. 1.7. Conclusiones parciales.. La demencia leve tiene su nivel de complejidad de acuerdo a las características fundamentales que lo se forman. En la literatura se ha reportado varios métodos para el análisis de las voces relacionado con el diagnóstico de deterioro cognitivo, uno de estos métodos es el análisis instrumental y el análisis perceptual del habla..
(27) 17 CAPÍTULO 1. FUNDAMENTOS TEÓRICOS SOBRE LA DEMENCIA Y SU RELACIÓN CON EL HABLA. Hoy día se trabaja con métodos donde se combina el análisis perceptual y objetivo como consecuencia de las restricciones que presentan los sistemas reportados. Esta nueva combinación debe ser más eficiente mediante el uso de métodos de computación. Adicionalmente hay estudios que sugieren que los métodos de inteligencia artificial podrían ofrecer buenos resultados relacionados con una predicción de diagnóstico mucho más precisa..
(28) 18 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. CAPÍTULO 2. Análisis del sistema para la medición de la demencia. El estudio expuesto a lo largo de este documento se centrará en el análisis prosódico de la voz de un grupo de personas diagnosticadas de Alzheimer y de otro grupo que no padece dicha enfermedad, con el objeto de encontrar disparidades en determinadas características entre ambos que permitan diferenciar entre una persona sana y otra enferma sin más pruebas que el estudio de una señal de voz (Figura 2.1). Estos resultados están destinados a un posible diagnóstico temprano de la demencia leve, una fase clínica previa a la demencia severa, la cual puede derivar en la enfermedad del Alzheimer (EdA). El sistema desarrollado para el análisis semiautomático del habla y del discurso se describe en la figura que aparece a continuación, donde la entrada del audio representado como señales digitalizadas fue manualmente transcrita a texto y luego automáticamente se alineó el audio grabado.. Figura 2.1 Diagrama de flujo que ilustra el funcionamiento del sistema de automatización para la evaluación del habla y el lenguaje.
(29) 19 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 2.1. Creación de la base de datos de demencia. El análisis del habla de grabaciones de voces de personas, para su adecuada utilización en los estudios de detección de patologías, debe tener en cuenta la voz de pacientes que sufren de la enfermedad y la voz de pacientes sanas como grupo de control. A continuación proponemos los criterios generales para el diseño y especificación de la base de datos de pacientes con demencia y el grupo de control que fue grabada con el objeto de posibilitar el trabajo desarrollado en esta Tesis, relacionado con la búsqueda de rasgos para la detección automática mediante el análisis del habla de casos de demencia. 2.1.1 Protocolo seguido en el proceso de grabación Para esta investigación se desarrolló un protocolo de grabación que siguió los siguientes pasos lingüísticos: Análisis del diálogo durante el MMSE Análisis del proceso de lectura, párrafo ‘‘Pasaje del Abuelo’’ Análisis de la descripción del dibujo Ladrón de Galletas El MMSE como ya ha mencionado en capítulo uno, es un test psicométrico del diálogo entre clínico y paciente que puntúa sobre un máximo de 30 puntos, agrupando los ítems en 5 apartados, el punto de corte que establece la probable demencia se establece habitualmente en 24 puntos, pero depende de factores como el grado de estudios del paciente. Además el clínico obtendrá información como el grado orientación, memoria inmediata, denominación, el tiempo de respuesta del paciente, capacidad de comprensión de la pregunta, veces de repetición de la pregunta, ritmo de respuesta, etc., es decir, un análisis prosódico y lingüístico aplicado al campo de la conversación. [14] Al comprobar el grado de orientación se hacen al paciente preguntas como: ¿Cuál es la fecha de hoy? o ¿Dónde vive?, entre otras. Para la comprobación de la “Memoria inmediata” se intenta que el sujeto aprenda tres palabras, donde el clínico se las repite 3.
(30) 20 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. veces para que el paciente se aprenda las palabras si le es posible, porque se le volverán a preguntar en el apartado de memoria diferida. A continuación se presenta en la tabla 2.1 las diferentes preguntas y apuntaciones del MMSE. Tabla 2.1 Prueba de MMSET. ORIENTACIÓN TEMPORAL 1. ¿En qué día estamos?. 0-1. 2. ¿De qué mes?. 0-1. 3. ¿Y de qué año?. 0-1. x/3. ORIENTACIÓN ESPACIAL 4. ¿En qué hospital (o edificio) estamos?. 0-1. 5. ¿En qué planta?. 0-1. 6. ¿Ciudad (o municipio)?. 0-1. 7. ¿Provincia?. 0-1. 8. ¿Y en qué país (o nación)?. 0-1. x/5. FIJACIÓN – RECUERDO INMEDIATO Nombre tres palabras siguientes y pida al paciente que las repita. Esta primera repetición otorga la puntuación, 1 punto por cada palabra correcta, pero continúe diciéndolas hasta que el sujeto repita las 3, hasta 6 veces. 9. Mesa. 0-1. x/3.
(31) 21 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 10. Lápiz. 0-1. 11. Árbol. 0-1 ATENCIÓN – CÁLCULO. Si tiene 30 y va quitando 3, ¿cuánto le va quedando? Detenga la prueba tras 5 substracciones. (Si el sujeto no puede realizar esta prueba, pídale que deletree la palabra MUNDO al revés). 12. 27 (O). 0-1. 13. 24 (D). 0-1. 14. 21 (N). 0-1. 15. 18 (U). 0-1. 16. 15 (M). 0-1. x/5. RECUERDO DIFERIDO Preguntar por las palabras mencionadas anteriormente. 17. Mesa. 0-1. 18. Lápiz. 0-1. 19. Árbol. 0-1. x/3. DENOMINACIÓN Mostrar los siguientes objetos y preguntar qué son. 20. Lápiz. 0-1. 21. Reloj. 0-1. x/3.
(32) 22 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 22. Sortija. 0-1 REPETICIÓN. Pedirle que repita la siguiente frase, o si lo prefiere, la frase que está entre paréntesis. Puntúa si la repite correctamente 23. “Ni sí, ni no, ni pero” (o “En un trigal. 0-1. x/1. x/3. había 5 perros”) ASOCIACIÓN 24. ¿Qué son la manzana y la pera?. 0-1. 25. ¿Y el perro y el gato?. 0-1. 26. ¿Y el rojo y el verde?. 0-1 ÓRDENES. Pedirle que siga la orden: "coja un papel con la mano derecha, dóblelo por la mitad, y póngalo en el suelo". 27. Coge el papel. 0-1. 28. dobla por la mitad. 0-1. 29. pone en el suelo. 0-1. x/3. LECTURA Escriba legiblemente en un papel “Cierre los ojos”. Pídale que lo lea y haga lo que dice la frase. 30. Lee y ejecuta la frase correctamente. 0-1. x/1.
(33) 23 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. PUNTUACIÓN TOTAL Puntuaciones de referencia. x/30. 27 o más: Normalidad 24 a menos: Sospecha patológica de 24 a 12 deterioro cognitivo de 11 a 9 demencia. Después la evaluación con el MMSE el paciente es dado una imagen llamada Ladrón de Galletas para describir. Esta imagen muestra varias acciones como por ejemplo; un niño alcanzando por un pote de galleticas desde un taburete que está a punto de caerse y una niña se las está pidiendo. Mientras tanto una mujer lavando platos no ve que está sucediendo detrás su espalda y, mientras pasa esto, el agua se está desbordando del fregadero. Luego el paciente debe contar qué es lo que observa en dicha imagen, y esa muestra de habla es la que posteriormente será analizada. La descripción normal de la imagen por los pacientes sanos, es fijarse las acciones sobre las que se puede actuar, como el agua cayendo al piso u el niño sobre el taburete inestable [27]. Por otra parte los pacientes que exhiben síntomas de deterioro cognitivo, usualmente no dan cuenta de estos puntos principales de la imagen. Aún más ellos experimentan dificultades a la hora de organizar los conceptos o a veces no se pueden encontrar las palabras apropiadas para expresarse..
(34) 24 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Fig. 2.2 Ladrón de galletas.. Por último se realiza la lectura del pasaje del Abuelo. La utilización de dicha lectura para la valoración de habla y de lenguaje fue originalmente diseñado para obtener una muestra de lectura oral, y desde su principio que ha provisto un métrico para analizar muchos aspectos de lectura oral y de funcionamiento motora de habla. Además de sus aplicaciones de investigación y clínicas, “El Pasaje de Abuelo” es también empleado oficialmente por la Oficina de Medicina Aeroespacial de las Fuerzas Armadas de Estados Unidos como una herramienta cribadora para la inteligibilidad entre astronautas, pilotos, y los controladores de tráfico aéreo (U.S. Department of Transportation, 2008) [28] [29]. ‘‘El Pasaje del Abuelo’’ ¿Tú quieres saber todo acerca del abuelo? Pues bien, él tiene casi 83 años de edad y aún conserva su mente tan brillante como siempre. Él usa un viejo saco negro al que generalmente le faltan algunos botones. Su barba larga y colgante produce en quienes lo observan un profundo sentimiento de máximo respeto. Cuando el habla, su voz es un poco.
(35) 25 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. rajada y tiembla ligeramente. Dos veces al día toca un pequeño órgano con excelencia y virtuosismo. Cada día él hace unas caminatas cortas al aire fresco, excepto en el invierno cuando la nieve o el hielo lo impide. Nosotros siempre lo exhortamos a que camine más y que fume menos, pero él siempre responde “Aceite de plátano”. El abuelo le gusta ser moderno en su lenguaje. 2.1.2 Descripción de la base de datos Con la cooperación del Hogar del Adulto Mayor #2 de la ciudad de Santa Clara fue posible hacer una captura de la base de datos. La base de datos como muestra en la tabla 2.2, consiste de 13 hombres; 3 de ellos con DCM o Demencia (Índice de MMSE, IMMSE>30), y por 2 mujeres, 1 de las cuales presentan un diagnóstico de Demencia (IMMSE>30). Todos los pacientes fueron sometidos a una prueba psicológica‘‘gold-standard’’ para determinar la presencia o no de DCM, y sus datos clínicos fueron registrados con el objetivo de disponer de información adicional sobre los pacientes. Las pacientes de ambos grupos fueron seleccionados para tratar de garantizar, en la medida de lo posible, que tuvieran requisitos fisiológicos similares en relación a su edad y nivel de escolaridad. Sea necesaria tener características similares entre las poblaciones de control y de demencia para que no haya influencia de factores exteriores que predisponen la Demencia. Tabla 2.2 Base de datos de demencia.. GRUPOS DCM. Control. 8. 11. Número de Pacientes. 5. 10. Hombres. 3. 1. Mujeres. 87. 79.75. Edad media del grupo (años).
(36) 26 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 2.1.3 Corpus de voz Las muestras de voz de cada paciente fueron grabadas en una sala del Hogar del Adulto Mayor #2, intentando buscar un nivel aceptable de aislamiento acústico. La frecuencia de muestreo empleada fue de 44kHz. El equipo de grabación utilizado estaba formado por un portátil ASUS A55V, dos micrófonos de alta calidad, de tipo diadema, modelo profesional AKG C520L, y un convertidor A/D M-Audio M-Track 2-Channel Portable USB Audio.. Fig. 2.3 Portátil ASUS A55V. Todo el equipamiento ha sido suministrado por la colaboración con el proyecto internacional CMC-V2: Caracterización, Modelado y Compensación de Variabilidad en la Señal de Voz, aprobado bajo el código TEC2012-37585-C02-02 y dirigido por el profesor Dr.C. Luis A. Hernández Gómez, Jefe del Grupo de Aplicaciones de Procesado de Señales (GAPS) de la Universidad Politécnica de Madrid [30]..
(37) 27 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Fig. 2.4 Micrófono AKG C520L. AKG Micrófono C520L Headworn Condenser: El micrófono Headworn Condenser tiene máximo rango dinámico para sonido vocal perfecto. Su cardioid patrón polar eficazmente rechaza ruido ambiental no deseado. El brazo del micrófono se monta en ambos lados, izquierda o derecha de la banda cabezal según se lo desee. Un choque de transductor reduce el ruido a un mínimo. El protector de humedad impide traspiración de penetrar el elemento del transductor, para asegurar un grado alto de protección de humedad para el micrófono.. Fig. 2.5 Convertidor A/D M-Audio M-Track.
(38) 28 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. La interfaz de M-Track de audio a M-audio® transforma la computadora en un estudio de grabación digital. Un solo cable USB provee el poder y una conexión de datos hacia y desde la computadora portátil o el computador de escritorio. El formato de bajo perfil da control profesional en un paquete portátil. M-Track es equipada con un arreglo de entradas versátiles para proveer los mejores resultados de cualquier tipo de fuente audio. Cada canal ofrece a una entrada XLR y un 1/4 una entrada balanceada. La entrada XLR es diseñado para trabajar con micrófonos u otras fuentes del Lo Z. El interruptor de poder da 48V a las entradas XLR para el uso con micrófonos profesionales del condensador. La entrada 1/4 " puede estar dispuesto a recibir señal del nivel de la línea. M-Track ofrece monitoreo ultra-bajo de latencia de la señal entrada a través de los audífonos. El botón de la mezcla del monitor ajusta el balance entre las entradas directas y el sonido pregrabado del software de la computadora. Medición de LED multicolor provee información visual instantánea de los niveles principales de salida. El proceso de grabación fue controlado en todo momento por un experto, que cuidó que las señales de audio tuviesen un nivel de intensidad adecuado sin llegar a estar saturadas y que no tuviesen, en la medida de lo posible, ruidos externos. Además, para disminuir la variabilidad en las grabaciones de distintos locutores, se solicitó a los sujetos leer las frases con un mismo patrón rítmico. 2.1.4 Software DCGrab v3.0 Para el proceso de grabación se empleó el software DCGrab v3.0 desarrollado en el Centro de Estudio de Electrónica y Tecnologías de la Información (CEETI) para la presente investigación [31]. El DCGrab v3.0 es una herramienta que permite la grabación o la importación de los archivos de audio para el apoyo al diagnóstico de la Demencia a través de la voz..
(39) 29 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Fig. 2.6 Ventana principal del software DCGrab v3.0. Este sistema fue programado de modo tal que se utiliza el Microsoft Access para crear una Base de Datos, el cual consiste de ciertas informaciones personales y valoraciones clínicas de los pacientes encuestados. Adicionalmente las señales de audio correspondientes a cada paciente por cada encuesta realizada son guardadas dentro archivos con el mismo sistema. Donde en su ventana principal, hay dos canales; uno para el especialista y el otro para el paciente. Además, cuando se lo añade pacientes, el nombre de cada paciente va a salir en la parte izquierda de la ventana principal, como mostrado en la Figura 2.6. El “archivo” es estructurado de tal manera para realizar las funciones siguientes: Agregar Paciente: Mediante esta opción se agregan nuevos pacientes al sistema de base de datos. Es posible insertar varios pacientes o insertar solamente uno y comenzar a aplicar la encuesta (Figura 2.7). Buscar Pacientes: Mediante esta opción es posible buscar un sujeto en el sistema de base de datos ya sea mediante su número identificador o su nombre y activarlo en el sistema..
(40) 30 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Listar Paciente: Mediante esta opción es posible listar todos los sujetos que están incluidos en el sistema en un documento para imprimir o salvar la información en algún documento con formato conocido (.doc, .pdf, etc) Salir: Cerrar DCGrab v3.0. Fig. 2.7 Ventana de control de pacientes.. El “audio” contiene los controles para la manipulación de las señales de audio. Herramientas permite manipular la información de la Base de Datos y la configuración de los parámetros de audio. La “ayuda” provee acceso a la ayuda del sistema. En la parte inferior de dicha ventana principal, hay una barra de estado que contiene información acerca del sujeto activo en el sistema en el momento actual y la F0 con que se lo graba. Finalmente para comenzar las grabaciones, selecciona una prueba del “MINIMENTAL TEST” de la misma ventana principal (Figura 2.6)..
(41) 31 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 2.2. Extracción de rasgos de la base de datos de demencia. En la sección presente, se tratará de automáticamente las evidencias en el habla de los locutores con DL, y describir los métodos utilizados para extraer los datos prosódicos de la base de datos de DL. 2.2.1 Análisis prosódico de la voz Una de las áreas que se encentra en la lingüística es el estudio de la prosodia que da información sobre los rasgos fónicos dado que influye la expresión oral, tales como la acentuación, la tonalidad o la cadencia. Dichos rasgos no son iguales en cada persona, por lo tanto se puede distinguir los rasgos de una persona a otra. Además existen factores tales como, la edad, nivel cultural, el estado físico e emocional de cada individuo que influyen en las características prosódicas. Estudios modernos han presentado que personas que sufren ciertas enfermedades, como el síndrome de la apnea-hipopnea durante el sueño (o SAHS) o el Alzheimer, exhiben diferencias significativas en determinados rasgos fónicos y melódicos del habla con respecto a los de personas sanas [24][32]. Para este trabajo se destacará el análisis prosódico de la voz de dos grupos de pacientes; pacientes que muestran signos de la enfermedad de deterioro cognitivo y otro grupo no diagnosticados de dicha enfermedad, de modo que se puede compararlos para tratar encontrar diferencias en características específicas entre ambos casos. Luego si hay diferencias entre ellos, nos permitan distinguir entre una persona sana y otra enferma sin la utilización de más pruebas sino que con el procesamiento de una señal de voz. Estos resultados posiblemente van a ser útiles para la detección temprano de la Demencia, una fase clínica previa a la demencia, de modo que si el síntoma predominante es la pérdida gradual de memoria, puede deducir en la enfermedad del Alzheimer (EdA). Una detección temprana de la demencia antes de que evolucione en demencia, y su consiguiente tratamiento precoz, puede evitar su progresión y ofrecer a la paciente mejor calidad de vida, además de reducir costes sanitarios [33]..
(42) 32 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. 2.2.2 Herramientas Praat, Prosogram y Matlab A continuación se demostrará que para analizar la prosodia de las voces gradadas, se utilizará una herramienta formada particularmente para este propósito: el programa Praat, diseñado y desarrollado para el análisis fonético del habla por Paul Boersma y David Weenink, del Instituto de Ciencias Fonéticas de la Universidad de Ámsterdam [34]. Para el análisis fonético del habla se utilizará la herramienta Praat. Esta herramienta tiene un lenguaje de programación propio, por lo tanto sea posible escribir código según las especificaciones que nos sean necesarias y ejecutarlo por medio de esta herramienta. Para nuestro estudio, se empleará el código Prosogram v29f , desarrollado por Piet Mertens, profesor de lingüística francesa y computacional [35]. A continuación se describe brevemente el funcionamiento de estas herramientas complementarias para el seguimiento del análisis prosódico que se logra durante este trabajo. El funcionamiento del Prosogram v29f es la implementación de transcripciones prosódicas de señales de audio a partir de unos parámetros específicos de entrada que puede ser definido por el usuario. El primer paso de la implementación por el programa es calcular parámetros acústicos tales como la frecuencia fundamental (F0), la intensidad, o los tramos en los que hay voz. Luego, se adquiere la segmentación de estos parámetros en unidades silábicas o vocálicas, seleccionando sólo las silábicas que son mayores de un cierto umbral de intensidad sonoro, y final se estabiliza su F0 (Figura 2.8). El resultado está representada en una ventana (figura 2.9) con un eje horizontal en el tiempo de estas unidades (a las que se denomina núcleos) contra las progresiones de F0 e intensidad. Además, es posible generar un archivo de texto en el que se incluyen múltiples datos prosódicos referentes a cada uno de los núcleos detectados..
(43) 33 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Figura 2.8 Ventana de selección de parámetros de Prosogram v29f. Los núcleos (sílabas) se representan mediante líneas gruesas en color negro, con una longitud equivalente a su duración temporal y orientación según la variación de F0 dentro del mismo. Las trazas en color verde y azul representan las progresiones de intensidad y F0, respectivamente..
(44) 34 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. Con el uso de la herramienta Matlab vs2010 se puede analizar los datos recogidos a partir de la herramienta Prosogram v29f . Matlab es muy útil para el tratamiento de señales y el manejo de datos en forma matricial. Por lo tanto a lo largo de este trabajo se utilizará la herramienta Matlab v2010 para extraer otros datos de interés a partir de los calculados por Prosogram v29f y llevaremos a cabo diferentes modelos estadísticos para tratar de obtener diferencias significativas entre las señales de voz de los grupos de DL y Control. Adicionalmente, se ha implementado mediante este entorno un pequeño programa para extraer los datos prosódicos de la hoja de cálculo generada por la herramienta Prosogram v29f y representarlos de una forma visualmente más cómoda con sus respectivas etiquetas, y otro para representar en una gráfica de Matlab los núcleos detectados. 2.2.3 Tipos de Segmentación También, la herramienta Prosogram v29f. permite seleccionar diferentes tipos de. segmentación: automática, externa y semiautomática. La segmentación automática permite utilizar el valor de intensidad de las unidades silábicas para detectar los núcleos silábicos del archivo de voz de entrada. La segmentación externa da en su salida un archivo de texto que consiste de etiquetas de los fonemas presentes en el audio a analizar, que indican los intervalos de tiempo en donde se sitúan. Evidentemente, este método implica un análisis previo del archivo de voz por parte del programador, que deberá situar manualmente los fonemas mediante alguna otra herramienta de programación, como el HTK. Finalmente, una combinación de las dos segmentaciones anteriores forma la segmentación semiautomática que también necesita un archivo externo de etiquetas. Antes de comenzar el estudio sobre la base de datos, se realizará una prueba sobre un archivo de audio empleando estos tres métodos de segmentación, para evaluar la idoneidad de cada uno para nuestro trabajo. Al resumir esta sección, hemos visto que la utilización del método de segmentación externa tiene una limitación en cuanto a la ubicación los núcleos. El método no se localiza los núcleos de manera automática, sino que hay que usar otra herramienta para asignar los.
(45) 35 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. núcleos, uno a cada vocal indicada por las etiquetas. Por lo tanto esta segmentación resulta un trabajo laborioso y por ello demora tiempo. Dado que el modo de segmentación automático permite evitar este trabajo adicional y da una segmentación fiable en comparación con la externa, por eso se seleccionamos la segmentación automática para el análisis de la base de datos de nuestro estudio 2.3. Rasgos Prosódicos para la Caracterización de la Demencia. Como ya hemos explicado que obtendremos los parámetros prosódicos que fueron definidos en la Sección 2.2 por la herramienta Prosogram v29f, y a partir de estos parámetros, obtendremos las mismas características que se utilizaron en el estudio de Murcia en lo referente a la fluidez y velocidad de lectura, que son definidos a continuación: Duración de lectura: Tiempo total de lectura, desde el inicio del primer núcleo detectado por el programa hasta el final del último (omitimos los silencios inicial y final de la grabación). Número de pausas: Número de silencios (tiempos entre núcleos o Gap) mayores de un cierto umbral definido para considerarlos como interrupciones en la lectura. Proporción de pausas: Tiempo de pausas dividido entre la duración de lectura. Tiempo de fonación: Tiempo de pronunciación de los núcleos (suma de las duraciones de todos los núcleos detectados) más los silencios no considerados como pausas. Proporción de fonación: Tiempo de fonación dividido entre la duración de lectura. Velocidad de locución: Número de sílabas (núcleos) dividido entre la duración de lectura. Velocidad de articulación: Número de sílabas (núcleos) dividido entre el tiempo de fonación. Es importante notar que en la extracción de los parámetros de tiempos de fonación y pausas para que haya un cálculo correcto de dichas medidas, hay que tener en cuenta el valor de gap suministrado a la salida de la herramienta Prosogram v29f para el primer núcleo como.
(46) 36 CAPÍTULO 2. ANÁLISIS DEL SISTEMA PARA LA MEDICIÓN DE LA DEMENCIA. cero (dado que es la primera sílaba, el tiempo entre el núcleo precedente y el actual no existe, evidentemente, pero el programa lo toma en cuenta como el intervalo de tiempo transcurrido desde el principio de la grabación hasta el comienzo del núcleo). También, debemos determinar un umbral adecuado para la diferenciación entre silencios como pausas y no pausas. En otros estudios consultados [36], se hace referencia a diferentes umbrales estáticos empleados para la detección de pausas. Primeramente pensamos usar el valor más utilizado en varios estudios (250 milisegundos), que fue también, el valor seleccionado en el estudio del profesor Martínez-Sánchez. Sin embargo, al escuchar los audios de nuestra base de datos se observó que hubo grabaciones silencias por lo tanto este umbral era demasiado bajo, y teniendo en cuenta que los sujetos son de edades mayores y algunos apenas escolarización, por lo que resulta apropiado elevar este valor mínimo. Al final seleccionamos una duración mínima de pausa de 370 milisegundos. Teniendo en cuenta lo referido anteriormente, se extraen los parámetros señalados para cada uno de los sujetos y se realiza una media de los mismos para cada uno de los dos grupos: DL y Ctrl..
(47) CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. 37. CAPÍTULO 3. RESULTADOS Y DISCUSIÓN. En el capítulo anterior se ha descrito el análisis prosódico mediante las herramientas disponibles, la base de datos de voz capturada en el Hogar del Adulto Mayor #2 y los rasgos prosódicos empleados para el diagnóstico de la demencia leve. Además fue necesaria tener dos grupos de sujetos (de demencia y de control) para obtener una base de datos, de modo que ambos tienen características similares, que garantizan una comparación adecuada entre sí. Así que, en este capítulo se muestran los resultados obtenidos a partir de pruebas estadísticas y de clasificación realizados, con el objetivo de establecer rasgos discriminantes para separar los dos grupos de pacientes analizados. 3.1. Descripción estadística de los rasgos extraídos.. La representación visual de la distribución temporal de sílabas y pausas supone un nuevo enfoque en el estudio de los datos prosódicos, de un modo más directo y experimental al no limitarse únicamente al tratamiento matemático de los datos prosódicos. Los resultados observados apoyan pues los obtenidos en apartados anteriores de una manera distinta, lo que enfatiza aún más la importancia de los mismos a la hora de encontrar ciertas características que permitan una detección precoz de la demencia. De estos dos tipos de mapas realizados, el de sílabas resulta demasiado confuso al tener un número muy elevado de núcleos en cada frase, por lo que los resultados obtenidos mediante observación visual son imprecisos y prácticamente inexistentes. Es empleando los datos prosódicos extraídos mediante la herramienta Prosogram donde obtenemos resultados de interés. A continuación mostramos en una tabla los resultados obtenidos a partir de los análisis estadísticos de los rasgos prosódicos extraídos..
Figure
+7
Documento similar