• No se han encontrado resultados

Clasificación de disartrias basado en modelo biónico del sistema olfatorio

N/A
N/A
Protected

Academic year: 2020

Share "Clasificación de disartrias basado en modelo biónico del sistema olfatorio"

Copied!
82
0
0

Texto completo

(1)Facultad de Ingeniería Eléctrica Centro de Estudios de Electrónica y Tecnologías de la Información (CEETI). TRABAJO DE DIPLOMA Clasificación de disartrias basado en modelo biónico del sistema olfatorio.. Autor: Miguel Angel Roura Vázquez Tutor: Dr.C, Eduardo González Moreira Santa Clara 2012 "Año 54 de la Revolución".

(2) Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica Centro de Estudios de Electrónica y Tecnologías de la Información (CEETI). TRABAJO DE DIPLOMA Clasificación de disartrias basado en modelo biónico del sistema olfatorio.. Autor: Miguel Angel Roura Vázquez mroura@uclv.edu.cu. Tutor: Dr.C, Eduardo González Moreira. Santa Clara 2012 "Año 54 de la Revolución".

(3) Hago constar que el presente trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería Biomédica, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Autor. Firma del Jefe de Departamento donde se defiende el trabajo. Firma del Responsable de Información Científico-Técnica.

(4) i. PENSAMIENTO. “La imaginación es más importante que el conocimiento”. Albert Einstein.

(5) ii. DEDICATORIA A la memoria de mi padre que aunque ya no está siempre iluminó mi camino en ese sendero que todos transitamos que es la vida. A mi mamá A mi tía Magaly A mi novia A mis hermanos A mis demás familiares A todos mis amigos.

(6) iii. AGRADECIMIENTOS.  A mi tutor Eduardo González Moreira, por su ayuda en todos los momentos que he necesitado, por enseñarme y por su infinita paciencia, muchas gracias.  A mi madre por su amor, dedicación, apoyo, motivación y comprensión durante toda la vida. Tú has sido mi inspiración y me has llenado de fuerza para continuar adelante. Sin ti no hay carrera.  A mi tía Magali por su incondicional ayuda a lo largo de mi carrera y ser mi segunda madre.  A mi novia por estar siempre a mi lado y ayudarme en todos los momentos con su amor y cariño. Te amo.  A mi padrastro por ser como un padre y ayudarme durante estos 5 años de carrera.  A la profesora Diana y en general a todos los profesores del departamento de procesamiento de voz.  Al profesor Roberto por ser un excelente guía y ayudarme durante estos 5 años.  A todos los maestros y profesores estudiante.. que he tenido durante mi carrera como.  A mis compañeros de estudios que han compartido conmigo a lo largo de 5 años en todo momento, por soportarme y brindarme su ayuda..  A todas las personas que han dedicado parte de su tiempo para ofrecer su ayuda y sugerencias y brindarme todo su apoyo en este trabajo. A todos muchas gracias..

(7) iv. TAREA TÉCNICA. . Revisión Bibliográfica y definición del Marco Teórico.. . Selección de las Herramientas de Inteligencia Artificial a utilizar (modelo biónico y selección de clasificadores).. . Diseño de los experimentos.. . Evaluación del método de procesamiento y clasificación.. . Evaluación de los Resultados.. Firma del Autor. Firma del Tutor.

(8) v. RESUMEN. El presente trabajo aborda el tema del empleo de la señal de voz en la clasificación de disartrias usando rasgos subjetivos y objetivos extraídos de voces patológicas procedentes de dos bases de datos. El objetivo fundamental es mejorar la clasificación de disartrias mediante el empleo de un modelo biónico el cual emula las principales características del sistema olfatorio. En este trabajo se propone la clasificación de disartrias a partir de cuatro conjuntos de rasgos procesados a través del modelo biónico y comparar su efectividad con relación a la clasificación de los cuatro conjuntos de rasgos reportados en la literatura. Con este propósito se utilizan el modelo biónico basado en el sistema olfatorio el cual está implementado sobre MATLAB, así como varios clasificadores contenidos en el software libre para aprendizaje. automático y minería de datos WEKA. Esta investigación posee una aplicación práctica y teórica de gran trascendencia para todos los especialistas del área de enfermedades relacionadas con perturbaciones de la voz e investigadores en inteligencia artificial..

(9) vi. TABLA DE CONTENIDOS PENSAMIENTO .....................................................................................................................i DEDICATORIA .................................................................................................................... ii AGRADECIMIENTOS ........................................................................................................ iii TAREA TÉCNICA ................................................................................................................iv RESUMEN ............................................................................................................................. v TABLA DE CONTENIDOS .................................................................................................vi INTRODUCCIÓN .................................................................................................................. 1 Organización del informe ................................................................................................... 4 CAPÍTULO 1.. Evaluación de las Disartrias ...................................................................... 5. 1.1. Descripción de las disartrias..................................................................................... 5. 1.2. Diagnóstico diferencial de la disartria...................................................................... 6. 1.2.1. Ventajas del diagnóstico diferencial ................................................................. 9. 1.2.2. Desventajas del diagnóstico diferencial ............................................................ 9. 1.3. Análisis perceptivo del habla ................................................................................... 9. 1.3.1. Escalas utilizadas ............................................................................................ 10. 1.3.2. Selección de dimensiones ............................................................................... 10. 1.3.3. Confiabilidad de los jueces ............................................................................. 11. 1.3.4. Protocolos de diagnóstico ............................................................................... 11. 1.3.5. Ventajas del análisis perceptivo del habla ...................................................... 12. 1.3.6. Desventajas del análisis perceptivo del habla ................................................. 12. 1.4. Análisis instrumental del habla .............................................................................. 13. 1.4.1. Ventajas de análisis instrumental .................................................................... 13. 1.4.2. Desventajas del análisis instrumental ............................................................. 14.

(10) vii 1.5. Estudios relacionados con la clasificación de disartrias. ....................................... 14. Conclusiones Parciales ......................................................................................................... 15 CAPÍTULO 2. 2.1. Materiales y Métodos .............................................................................. 16. Datos utilizados ...................................................................................................... 16. 2.1.1. Grabaciones .................................................................................................... 16. 2.1.2. Bases de datos ................................................................................................. 17. 2.2. Modelo Biónico ...................................................................................................... 20. 2.2.1. Modelo Bulbar ................................................................................................ 21. 2.2.2. Modelo Cortical .............................................................................................. 22. 2.2.3. Dinámica y aprendizaje del modelo biónico................................................... 25. 2.3. Clasificación mediante el software (WEKA) ......................................................... 30. 2.3.1. Clasificadores.................................................................................................. 31. 2.3.2. Validación cruzada ......................................................................................... 36. 2.4. Diseño del experimento.......................................................................................... 38. Conclusiones Parciales ......................................................................................................... 38 CAPÍTULO 3.. RESULTADOS ....................................................................................... 39. 3.1. Procesamiento a través del modelo biónico ........................................................... 39. 3.2. Clasificación de Disartrias ..................................................................................... 42. Conclusiones del capitulo ..................................................................................................... 48 CONCLUSIONES Y RECOMENDACIONES ................................................................... 49 Conclusiones ..................................................................................................................... 49 Recomendaciones ............................................................................................................. 49 REFERENCIAS BIBLIOGRÁFICA .................................................................................... 50 ANEXOS .............................................................................................................................. 55.

(11) viii.

(12) INTRODUCCIÓN. 1. INTRODUCCIÓN. Introducción a las Disartrias Las disartrias constituyen una causa de padecimiento de una gran parte de la población mundial, principalmente en países subdesarrollados donde la población es más numerosa y existe un número limitado de especialistas entrenados para diagnosticar eficientemente este tipo de enfermedad. Proviene del griego dis, que significa dificultad y arthron, que significa articulación, se define como los desórdenes en el habla, resultante del daño o lesión de los mecanismos neurológicos encargados de regular sus movimientos. El estudio de la entidad se realizó por primera vez en 1853, cuando el médico inglés Willian J. Little, describió el cuadro sintomático de las parálisis cerebrales, además consideró la existencia de trastornos del lenguaje sobre la base de afección en la motricidad articulatoria [1]. Ya en el 1885, H Gutzman, aborda la disartria ya como un trastorno de pronunciación, dejando establecida la disartria central y periférica, además de las deficiencias vocales que no se habían tenido en cuenta hasta ese momento [2]. En el año 1926, M. S. Margulis describió algunos tipos de disartria, en su artículo “Sobre la diferenciación de la disartria” [3]. En la actualidad el estudio de esta patología de su compensación y corrección, siguen siendo el objetivo principal de muchos científicos. Continúan estudios e investigaciones sobre la entidad, relacionándola con lesiones específicas del sistema nervioso central o periférico (SNCP). La ubicación dentro del SNCP que se ve afectado por la enfermedad determina los signos y síntomas de deterioro neurológico y sus características de voz. Sin embargo, las diferencias entre estas enfermedades pueden ser muy sutiles, produciendo frecuentemente errores en la clasificación, fundamentalmente en etapas tempranas..

(13) INTRODUCCIÓN. 2. La voz es uno de los mecanismos más susceptibles a lesiones en el SNCP y por consiguiente es un medio muy deseado para el diagnóstico y estudio de este tipo de enfermedad. En los últimos cinco decenios ha aumentado considerablemente la investigación sobre el análisis de percepción del habla disártrica [4]. Existen ocho tipos de disartrias entre las que se encuentran disartria flácida (FD), espástica (SD), atáxica (AD), hipocinética [Parkinson (PD)], hipercinética [corea (HC)], distonía (HD), temblor orgánico de la voz (OVT) y Esclerosis Lateral Amyotrópica (ALS). El trabajo realizado por Darley, Aronson y Brown (DAB) marcó un punto de inflexión en la evaluación y la investigación sobre la disartria al proponer el diagnóstico diferencial [5]. En dicho estudio, DAB define treinta y ocho rasgos o características para evaluar los trastornos del habla causados por las lesiones en el SNCP. Esta herramienta provee al clínico las pautas para el desarrollo de la evaluación y del tratamiento del paciente, así como la información que revela sobre el mecanismo subyacente que causa las desviaciones del discurso. El principal inconveniente de diagnóstico diferencial DAB es que fue diseñado como una herramienta descriptiva para trastornos del habla y no como un método de diagnóstico. Un instrumento clínico muy útil ha sido el Análisis Perceptivo del Habla (PAS) [5]. Este se basa en las percepciones de los médicos acerca de lo que escuchan en las voces patológicas de acuerdo a su formación, capacidades de escucha, conocimiento y experiencia sobre el trastorno evaluado. Aunque el PAS es muy valioso para evaluar los trastornos del habla, se han planteado dudas sobre su fiabilidad y validez, especialmente cuando es realizada por jueces, que no tienen una formación común. El PAS es muy subjetivo y, a menudo incompatible entre diferentes jueces. A pesar de la desventaja del PAS, se utiliza regularmente en la práctica clínica, especialmente cuando es necesario el diagnóstico provisional, sin los beneficios de los datos adicionales. Otro instrumento útil es el análisis instrumental del habla, este consiste en un análisis acústico o fisiológico realizado con la ayuda de instrumentos y de algoritmos para medir ciertos fenómenos en el proceso de producción de discurso. El análisis instrumental se ha recomendado a menudo como complemento valioso a los métodos perceptivos en la creencia que superará algunas de sus limitaciones. Cada instrumento o algoritmo se diseña.

(14) INTRODUCCIÓN. 3. generalmente para proporcionar la información en un aspecto específico de la producción de discurso, incluyendo actividad muscular, movimientos estructurales, circulación y presión de aire generadas en varias partes del mecanismo del habla. Estos algoritmos proporcionan mediciones objetivas de la voz, y pueden proporcionar nuevos conocimientos sobre la naturaleza fisiológica de estos trastornos. Sin embargo, la aplicación de estos algoritmos para la clasificación de la disartria es limitada y la investigación sigue siendo necesaria. Las técnicas computacionales también han sido muy utilizadas para la clasificación de voces patológicas disártricas, a partir de parámetros acústicos del habla, como por ejemplo las redes neuronales artificiales denominadas como RNA [4]. Las redes de neuronas artificiales son un paradigma de aprendizaje y procesamiento automático inspirado en la forma en que funciona el sistema nervioso. Se trata de un sistema de interconexión de neuronas en una red que colabora para producir un estímulo de salida. Por lo antes expuesto se propusieron los siguientes objetivos: Objetivo General: Mejorar la clasificación de Disartrias a partir del empleo del modelo biónico basado en el sistema olfatorio. Objetivos Específicos: •. Evaluar métodos conocidos de clasificación reportados en la literatura para la clasificación de Disartrias.. •. Evaluar el desempeño de un modelo biónico basado en el sistema olfatorio en el mejoramiento de procesos de clasificación de disartrias.. Hipótesis La inclusión de modelos biónicos para la clasificación de valoraciones subjetivas y objetivas debe aportar mejores resultados en la clasificación de disartrias que los anteriormente reportados..

(15) INTRODUCCIÓN. 4. Organización del informe Este trabajo está estructurado de la siguiente forma: introducción, tres capítulos, conclusiones, recomendaciones, referencias bibliográficas y anexos. En el primer capítulo se describen las principales características de las disartrias. También se describen las principales formas de diagnóstico de las disartrias conteniendo las principales ventajas y desventajas de las mismas. Al final de este capítulo se realiza una descripción de los principales resultados propuestos en la literatura acerca de la clasificación automática de las disartrias. En el segundo capítulo primeramente se detallan los datos utilizados. Luego se describe el modelo biónico seleccionado. Y finalmente se exponen los métodos de clasificación utilizados. El tercer capítulo se basa en la visualización y análisis de los resultados obtenidos con los métodos de clasificación propuestos..

(16) CAPÍTULO 1. Evaluación de las Disartrias. 5. CAPÍTULO 1. Evaluación de las Disartrias. 1.1. Descripción de las disartrias. Disartria es un término relacionado con un grupo de enfermedades neuronales que se diferencian entre sí por la localización de la lesión en el SNCP. Estas pueden manifestar síntomas muy similares entre sí, siendo originadas por lesiones en diferentes lugares del sistema nervioso central o periférico. Estudios clínicos realizados sobre disartrias han revelado que existe una relación causa-efecto entre la localización de la lesión en el SNCP y el tipo resultante de la disartria. Disartrias, según la definición de DAB, son las alteraciones en el control voluntario sobre la musculatura del habla como consecuencia de daños a los componentes del SNCP. El paciente es simplemente incapaz de hablar con la velocidad muscular normal, la fuerza, precisión o la sincronización. Los efectos de estas aberraciones musculares se escuchan como problemas de: . La fonación es afectada debido a la interferencia con los músculos de la laringe y la respiración [1][5][6][7][8].. . La resonancia es afectada debido a la interferencia con los músculos del paladar blando y la faringe [1][5][6][7][8].. . La articulación es afectada debido a la interferencia con los músculos de los labios, la lengua y la mandíbula [1][5][6][7][8].. . La prosodia, la melodía, el estrés y los patrones rítmicos del habla contextual son afectados debido a los problemas acumulados de los motores del habla [1][5][6][7][8].. diferentes subsistemas.

(17) CAPÍTULO 1. Evaluación de las Disartrias. 6. Es importante destacar que el tipo de disartria está directamente relacionada con la ubicación de la lesión en el SNCP y no por la enfermedad que la produce. Las diferencias entre estas enfermedades pueden ser muy sutiles, produciendo frecuentemente errores en la clasificación, fundamentalmente en etapas tempranas. La voz es uno de los mecanismos más susceptibles a lesiones en el SNCP y por consiguiente es un medio muy deseado para el diagnóstico y estudio de este tipo de enfermedad. La evaluación de la disartria es un paso importante para determinar la ubicación de la lesión en el SNCP sin la utilización de métodos invasivos y proporcionar un tratamiento efectivo. El diagnóstico diferencial de la disartria es uno de los procedimientos de evaluación más comúnmente utilizados en América del Norte, aunque se pueden encontrar otros procedimientos. 1.2. Diagnóstico diferencial de la disartria. El diagnóstico diferencial de la disartria fue inicialmente propuesto por DAB (Darley, Aronson y Brown) en un estudio realizado en siete diferentes enfermedades neurológicas como la ataxia cerebral, parálisis pseudobulbar, parálisis bulbar, la esclerosis lateral amiotrófica, la enfermedad de Parkinson, distonía y corea [5].Esta basado en 38 rasgos apreciados subjetivamente por los especialistas en lenguaje patológico. Estos rasgos son agrupados en clusters y la combinación de estos cluster determina el tipo de enfermedad.. Categoría Relacionado con la frecuencia fundamental del habla. Relacionado con la intensidad de la señal. Relacionado con la laringe o resonador de disfunción vocal. Rasgos 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15.. período pitch (PL) rupturas del período (PB) monotonía en el período de la señal (M) temblor de voz (T) monotonía en la intensidad de la señal (ML) variaciones excesivas de la intensidad de la señal (ELV) descomposición de la intensidad de la señal (LD) intensidad de la señal en todo el nivel alternancia en la intensidad de la señal(AL) voz áspera (HV) voz ronca voz jadeante (continua) (BV) voz jadeante (transiente) factor de estrangulación de la voz (SS) interrupciones de voz (VS).

(18) CAPÍTULO 1. Evaluación de las Disartrias. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38.. Relativo a la respiración. Relativo a la prosodia. Relativo a la articulación. Relativo a la impresión general. 7. hipernasalidad (HN) hiponasalidad emisión nasal (NE) inspiración -expiración forzada (FI) inspiraciones audibles (AI) gruñido al final de la expiración(GE) ritmo (R) frases cortas (SP) aumento del ritmo en segmentos (IRS) aumento del ritmo total (IR) acentuación reducida (RS) ritmo variable (VR) intervalos prolongados (PI) silencios inapropiados (IS) ráfagas cortas del habla (SRS) exceso de acentuación (EES) consonantes imprecisas (IC) fonemas prolongados (PP) fonemas repetidos (PR) ruptura irregular del articulación (IAB) vocales distorsionadas (DV) inteligibilidad en general (I) rareza en general. Tabla 1.1. Rasgos de voz propuesto por DAB.. En este estudio, DAB define treinta y ocho rasgos o características para evaluar los trastornos del habla causada por las lesiones en el SNCP como se muestra en la tabla 1.1.. Nº I. Clusters Articulación imprecisa. Rasgos 32,35,36 22, 28,29,31,33 3,5,23,26 16,32,36. V VI. Prosodia excesiva Prosodia insuficiente Incompetencia ArticulatoriaResonatoria Estenosis fonatoria Fonación incompetente. Causa Trastorno en la actividad de coordinación Defectos neuromusculares Restricción de movimientos musculares Previo y reducido poder de contracción. 1,2,6,10,14,15,22,23 12,13,20,23. Laringe fisiológicamente limitada Reducidas contracciones musculares. VII. Resonancia incompetente. 16,18, 23,32. Previo fallo en el puerto velofaríngeo. II III IV. VIII. Insuficiencia prosodia3,5,10 Hipotonía fonatoria Tabla 1.2. Relación clusters-rasgos en el estudio hecho por DAB.. Los tipos de rasgos fueron agrupados en clusters como se muestra en la Tabla 1.2 para cada enfermedad neurológica estudiada a fin de proporcionar una relación entre el efecto sobre el mecanismo de producción del habla y la ubicación de los daños en el sistema nervioso..

(19) CAPÍTULO 1. Evaluación de las Disartrias. 8. El análisis del agrupamiento reveló un conjunto único de los grupos para cada trastorno neurológico.. Grupo Disartria flácida Disartria Espástica Disartria atáxica Disartria hipocinética Disartria Hipercinética. Enfermedad Parálisis bulbar Parálisis pseudobulbar Ataxia cerebral Parkinson Distonía Corea. Disartria mixta Esclerosis lateral amiotrófica Tabla 1.3. Relación Clusters-enfermedad descrita por DAB.. Clusters VI,VII,VIII II,III,IV,V I,II,VIII III I,II,III,V I,II,III,IV,V,VII II,III,IV,V,VI,VII. La Tabla 1.3 muestra el conjunto de los grupos obtenidos para cada trastorno neurológico analizado. Es importante notar que hay una gran coincidencia entre los grupos, por lo que es la combinación de varios clusters y no la ocurrencia de un solo cluster, es lo que determina el tipo de disartria. La Figura 1.1 muestra gráficamente el proceso de diagnóstico.. Figura 1.1. Representación gráfica del diagnóstico diferencial de la disartria.. Otros estudios del habla disártrica realizados por DAB [6][9][10] demostraron que la localización de la lesión, y no la enfermedad que lo produce, determina el tipo de disartria. Por lo tanto, las lesiones originadas en el sistema nervioso de naturaleza traumática, degenerativa, infecciosa o vascular pueden ser resultado del mismo tipo de disartria. Esta.

(20) CAPÍTULO 1. Evaluación de las Disartrias. 9. idea permite generalizar los resultados obtenidos en el diagnóstico diferencial de la disartria a diferentes enfermedades que producen el mismo tipo de trastorno del habla. 1.2.1 Ventajas del diagnóstico diferencial El diagnóstico diferencial permite que el evaluador sea detallado, rápido, preciso y coherente en la descripción de las características del habla del individuo [9]. La herramienta también proporciona al clínico las directrices para la evaluación y su posterior tratamiento. También revela información sobre el mecanismos subyacente que causa la desviación del habla. El diagnóstico diferencial se ha convertido en una herramienta estándar de la clasificación de disartrias y ha abierto muchos campos de investigación basado en la descripción multidimensional de la voz. 1.2.2 Desventajas del diagnóstico diferencial Entre las dificultades mostradas por el diagnóstico diferencial propuesto por DAB es que fue diseñado como una herramienta descriptiva para trastornos del habla y no como un método de diagnóstico, debido a esto, la superposición entre los clusters puede afectar el proceso de diagnóstico [11]. Además, los 38 rasgos propuestos por DAB no están totalmente aceptados entre los médicos e investigadores, por lo que la normalización sobre el mejor número y tipo de funciones es algo que todavía no se ha logrado [12]. El diagnóstico diferencial también fue diseñado para utilizar valoraciones perceptuales para evaluar la gravedad de las características del habla, que son a veces inconsistentes e imprecisas entre valoraciones repetidas. 1.3. Análisis perceptivo del habla. El Análisis Perceptivo del Habla ha sido abundantemente utilizado como una herramienta clínica útil. Se basa en las percepciones de los médicos acerca de lo que escuchan en las voces patológicas de acuerdo a su formación, capacidades de escucha, conocimiento y experiencia sobre el trastorno evaluado. Análisis de la disartria generalmente se realiza teniendo en cuenta una escala predefinida para describir el grado de deterioro, un conjunto de características para representar las disfunciones en el mecanismo del habla, y un protocolo de diagnóstico para representar los diferentes tipos de disartria incluidos para la evaluación..

(21) CAPÍTULO 1. Evaluación de las Disartrias. 10. 1.3.1 Escalas utilizadas Las escalas proporcionan una descripción sobre la gravedad mostrada en los rasgos de la voz analizados. Las escalas varían a lo largo de diferentes estudios de percepción de las disartrias con respecto a la resolución y la distribución de los niveles. La resolución se caracteriza por el número de niveles que se utilizan para expresar la magnitud de la disfunción, mientras que la distribución se refiere a la probabilidad de ocurrencia de valores dentro de la escala. Varios estudios proporcionan escalas con estimación de magnitud fijada [13][14]. En estos casos, los oyentes cuentan con una muestra de voz de referencia asignada a una determinada magnitud de calidad clasificada. Las muestras sin fijar, también son comunes, donde los oyentes hacen sus juicios en relación con sus propios criterios. Estudios acústicos reportados en la literatura muestran una gran variabilidad en las escalas de juicios que van desde 4, 5, 6, 7, 8, 9 a 13 escalas de intervalos de igualdad – aparición conocidas como EAI [13][15][16]. Estudios posteriores tienden a utilizar diferentes escalas para las características que podrían ser calificadas como demasiado altas o demasiado bajas y por las características que describen las medidas sobre la frecuencia con que se presenta la disfunción [17]. Las escalas de EAI fueron las más frecuentes, ya que aparecen en el 82,5% de los estudios realizados. En concreto, una escala de 7 puntos fue la más común [1][17][18][19]. Muchos estudios utilizan escalas de distribución lineal de modo que representen la gravedad de las disfunciones, las cuáles discrepan con la característica intrínseca del oído humano usado para percibir los desórdenes. Esto se debe, presumiblemente, para evitar métodos más complicados de percepción descriptiva de análisis acústico del habla. Seijo y Castillo [20] hallaron que las escalas no lineales ayudan a diferenciar con mayor precisión entre los grupos disártricos cuando las RNA son usadas para la diferenciación. 1.3.2 Selección de dimensiones Los estudios sobre el PAS revelan una gran cifra de desviaciones del lenguaje y definiciones diferentes en un esfuerzo por describir los trastornos del habla inteligible. ¿Qué serie de características son mejores para un examen general del habla disártrica? Esta pregunta aún sigue sin resolverse debido a su dependencia del trastorno analizado y del tipo de análisis realizado. Generalmente, las dimensiones clasificadas en gran parte de las.

(22) CAPÍTULO 1. Evaluación de las Disartrias. 11. investigaciones pueden agruparse en cinco clases fundamentales descritas por Netsell y Daniel. Estos incluyen la respiración, fonación, resonancia, articulación y prosodia [21]. Las dimensiones que se encuentran relacionadas con la respiración describen generalmente la ayuda de la respiración para el habla, la intensidad y el patrón la respiración. Las relacionadas con la fonación describen el funcionamiento de la válvula de la laringe. Las dimensiones relacionadas con la resonancia describen la condición del mecanismo velofaríngeo, mientras que los relacionados con la articulación muestra la compleja interacción entre diferentes subsistemas del mecanismo del habla como los labios, la lengua, la mandíbula y el paladar blando. Por último, las dimensiones relacionadas con la prosodia constituyen una interacción más compleja de los diferentes procesos como la respiración, fonación, articulación, así como la acentuación y el ritmo. Diversos estudios sobre las disartrias han definido diferentes conjuntos de características. De los más completos está el conjunto definido por DAB, ya que cubre en detalle la mayoría de las características definidas de manera diferente en otros estudios. Sin embargo, algunos aspectos planteados en este estudio son solamente descriptivos y no proporcionan información para la clasificación [6]. El número de dimensiones difiere entre los estudios, así como la definición de ciertos rasgos de la voz. 1.3.3 Confiabilidad de los jueces La confiabilidad de los jueces siempre ha sido tema de desacuerdo en el PAS. La confiabilidad de los jueces se mide en la literatura utilizando intra e inter juicios. Intra juicio se relaciona con las pruebas repetidas sobre una muestra de un juez e inter juicio se relaciona con las comparaciones entre los jueces de una misma muestra. Una gran variabilidad de métodos estadísticos se encuentra en la literatura para proporcionar medidas de fiabilidad. Las técnicas más frecuentes son de correlación r de Pearson, correlación intraclase (ICC), porcentaje de las calificaciones dentro de +/- un valor de escala, y r de Pearson para pares de oyentes [19]. 1.3.4. Protocolos de diagnóstico. Existen abundantes referencias en la literatura de acuerdo con la evaluación de los diferentes tipos de disartria utilizando juicios de percepción del habla. Donde se muestra ejemplos de los protocolos de los que se hace referencia cuando un grupo de dimensiones.

(23) CAPÍTULO 1. Evaluación de las Disartrias. 12. clasificadas se combinan para proporcionar a los médicos la información sobre la ocurrencia de diferentes tipos de disartrias [1][17][18][19]. Al igual que los estudios de DAB, que se explican en detalle en la sección 1.3.1, Joanette y Dudley realizaron un estudio para investigar la disartria, asociado a ataxia de Friedreich [22]. Los científicos aislaron 16 dimensiones de las 38 propuestas inicialmente por DAB, que se consideraron más pertinentes para el análisis de dicha enfermedad. Se efectuó el análisis de componentes principales sobre los datos resultantes de los juicios de percepción del habla y hallaron dos factores como grupos de evaluación de disartrias en este tipo de enfermedades: estenosis fonatoria y el factor disártrico general. Estos factores se relacionan con la frecuencia fundamental, los resonadores y la impresión general. Se arribó a la conclusión de que un análisis detallado de los datos permite diferenciar entre tres grupos de sujetos con diferente severidad de la enfermedad. La evaluación de la disartria de Frenchay [18] es otro protocolo que define 28 dimensiones clasificadas en grupos llamados reflejo, respiración, labios, mandíbula, paladar, laringe, la lengua y la inteligibilidad. Condiciones físicas más detalladas figuran en el este protocolo que los que figuran en los estudios de DAB. Las dimensiones clasificadas resultantes fueron sometidas a un análisis discriminante. El autor encontró que este protocolo podría predecir pacientes disártricos con un 90% de exactitud. 1.3.5. Ventajas del análisis perceptivo del habla. Dentro de las principales ventajas del PAS tenemos que se utiliza regularmente en la práctica clínica, especialmente cuando es necesario el diagnóstico provisional, sin los beneficios de datos adicionales. A pesar de sus limitaciones el análisis de la percepción probablemente se mantendrá como la primera opción del clínico en el tratamiento de trastornos del habla [23]. 1.3.6 Desventajas del análisis perceptivo del habla Los métodos tradicionales para clasificar las disartrias basadas en los problemas del habla se apoyan fundamentalmente en las valoraciones subjetivas realizadas por especialistas en lenguaje patológicos como descriptores fundamentales. Las valoraciones subjetivas suelen ser imprecisase inconsistentes en algunos de los rasgos de la voz, cuando son realizadas por.

(24) CAPÍTULO 1. Evaluación de las Disartrias. 13. diferentes especialistas que frecuentemente tienen puntos de referencia diferentes debido a que vienen de diferentes escuelas o su nivel de apreciación no es el mismo. Esto hace que la confiabilidad y repetitividad del proceso de descripción de las perturbaciones sea baja, lográndose en ocasiones niveles bajos de clasificación y difíciles de estandarizar [24]. 1.4. Análisis instrumental del habla. El análisis instrumental del habla es un análisis fisiológico o acústico realizado con la ayuda de instrumentos y algoritmos para medir ciertos fenómenos en el proceso de producción del habla. Cada instrumento o algoritmo es generalmente diseñado para brindar información sobre un aspecto específico de la producción del habla, incluyendo la actividad muscular, movimientos estructurales, corriente y presión de aire generado en diversas partes del mecanismo del habla. El análisis instrumental sobre el mecanismo del habla ha sido muy productivo y ha mostrado gran variedad de instrumentos y procedimientos que están diseñados para brindar información sobre aspectos concretos de la producción del habla como por ejemplo las vías respiratorias, laringe, el puerto velo-faríngeo, y las funciones de articulación. Abordando además sobre el análisis acústico que se utiliza para relacionar medidas acústicas con relación a diversos aspectos del motor control del habla. Dependiendo de la muestra de discurso recogida y de la naturaleza del análisis, pueden ser calculadas un número de diversas medidas acústicas. Por lo tanto, no hay un sistema estándar de medidas para una observación específica. La mayoría de los análisis acústicos reportados en la literatura centran su estudio sobre la frecuencia fundamental, energía, prosodia y articulación. 1.4.1. Ventajas de análisis instrumental. El análisis instrumental del habla supera algunas de las limitaciones del análisis perceptivo. Dentro de las ventajas tenemos que proporciona medidas objetivas en un amplio rango de diferentes parámetros del habla para evaluación a corto plazo, así como el seguimiento a largo plazo del aparato del habla. También puede aumentar la precisión del diagnóstico a través de una especificación más detallada de las funciones anormales. Se aumenta la consistencia de la evaluación, que a su vez aumenta la compatibilidad entre los diferentes métodos de investigación en la disartria [24][25]..

(25) CAPÍTULO 1. Evaluación de las Disartrias. 14. 1.4.2 Desventajas del análisis instrumental Independientemente de las ventajas que se mencionaron anteriormente, existen limitaciones en la aplicación del análisis instrumental en la práctica clínica. Dentro de las que tenemos la falta de disponibilidad de equipos instrumentales en la práctica diaria. Con frecuencia, hay una falta de coincidencia entre las mediciones directas del análisis instrumental y el análisis perceptivo hecho por el clínico. Esto se debe porque la técnica instrumental requiere más de dos observaciones para describir los rasgos perceptivos. Además la interacción de los diferentes subsistemas afectados pueden afectar las mediciones instrumentales [24]. 1.5. Estudios relacionados con la clasificación de disartrias.. En la actualidad la tendencia en el procesamiento de voces patológicas es el de utilizar sistemas donde se combinen valoraciones objetivas y subjetivas para apreciar la severidad de los rasgos de la voz, en dependencia de su precisión. Existen varios trabajos reportados en la literatura para mejorar la clasificación de las disartrias. Uno de estos trabajos reportados es el de Castillo [4][24] donde se realiza una extracción de rasgos en voces patológicas mediante valoraciones objetivas y subjetivas utilizando técnicas de procesamiento digital de señales (PDS) e inteligencia artificial. El sistema se basa en una combinación de análisis preceptúales y mediante computadoras de grabaciones de voz de pacientes disártricos y de personas sanas para diagnosticar diferentes tipos de disartrias y permitir un análisis más objetivo de los síntomas que se manifiestan en la voz. Se desarrolla un. sistema experto para la clasificación de disartrias basado en mapas auto-organizados de Kohonen, que proporciona una mayor efectividad en la clasificación que otros clasificadores reportados. Apoyándose en el estudio descrito anteriormente se realizó otro trabajo [26] en el cual se efectuaron nuevas selección de rasgos incluyendo los obviados por Castillo [4][24] con el objetivo de mejorar la clasificación de disartrias y encontrar el mejor conjunto de rasgos que caractericen estas enfermedades. En el mismo se usaron varios clasificadores tales como: Máquinas de Soporte Vectorial (SVM), Árboles de Decisión (J48), Redes Bayesianas (NetBayes), entre otros..

(26) CAPÍTULO 1. Evaluación de las Disartrias. 15. Uno de los tarbajos más reciente es el de Abdul Haleen Butt [27] que tiene como objetivo fundamental mejorar la clasificación de la disartria hipocinética en lo específico. Para logar subjetivo utilizo el clasificador Naive Bayes obteniendo buenos resultados en la clasificación.. Conclusiones Parciales El problema de la disartria es bastante complejo por las características intrínsecas a la enfermedad. Como se ha mostrado existen distintas formas de analizar las voces patológicas, una de estas formas es el análisis perceptual y el análisis instrumental del habla. Basado en las limitaciones de los sistemas anteriores en la actualidad se trabaja con sistemas donde se combina el análisis perceptual y objetivo que supuestamente debe ser más eficiente mediante el uso de técnicas de computación. Además existen otras técnicas de inteligencia artificial reportadas en la literatura con buenos resultados que se pudieran aplicar obteniendo iguales o mejores resultados que los reportados..

(27) CAPÍTULO 2. MATERIALES Y METODOS. 16. CAPÍTULO 2. Materiales y Métodos. En el desarrollo de este capítulo se definen los materiales y métodos utilizados para la realización del presente trabajo. Se explican los pasos para la obtención de las diferentes medidas tanto subjetivas como objetivas que caractericen de manera más eficaz los diferentes tipos de disartrias. Finalmente se describe el modelo biónico seleccionado y los clasificadores usados en esta investigación los cuales serán necesarios para llegar a los resultados esperados. 2.1. Datos utilizados. En nuestro trabajo se utilizaron grabaciones de dos bases de datos, en las cuales están presentes varios tipos de disartrias y pacientes sanos como referencia. Los rasgos se obtuvieron a partir de la realización de varios ejercicios que muestran los problemas de la voz de los pacientes disártricos. 2.1.1. Grabaciones. Las grabaciones son pertenecientes a pacientes que presentan ocho tipos de disartrias más grupo de control. Los pacientes cubanos incluidos en la base de datos en español fueron examinados por dos especialistas en lenguaje patológico del departamento de Neurología y Logopedia del Hospital "Arnaldo Millian", de Santa Clara. Las grabaciones se realizaron bajo condiciones especiales con el objetivo de que ningún ruido interfiriera en la grabación. Se utilizó iluminación natural para evitar la interferencia de 60 Hz, debido a su proximidad con el primer armónico de la frecuencia fundamental del habla [24]. Estas grabaciones fueron tomadas con una grabadora portátil de audio digital (DAT) modelo Sony TCD-D100 con una frecuencia de muestreo de 44.1KHz y 16 bits de.

(28) CAPÍTULO 2. MATERIALES Y METODOS. 17. cuantificación. El micrófono utilizado fue un (MF) modelo EN-4F-2 situado en un dispositivo montado en la cabeza para mantener una distancia constante a la boca. La sensibilidad del micrófono es de -64 dB a ± 3 dB, con más de 40 dB de SNR, cumpliendo con todas las recomendaciones de un taller para análisis acústico de voz [28]. La distancia del micrófono a la boca se mantuvo entre 8-10 cm y un ángulo de 45 grados para evitar la perturbación del artefacto aerodinámico. Las grabaciones se reproducen a continuación a una computadora utilizando una tarjeta de sonido Sound Blaster AWE32 con una configuración similar a la utilizada en la DAT. Una vez que la información fue transferida a la computadora, se realiza un protocolo de pre-procesamiento para todos los datos, tanto las pronunciaciones normales y patológicas, con el propósito de eliminar parte del espectro de la señal que no proporciona información útil en la caracterización de voces patológicas. 2.1.2. Bases de datos. Se analizaron un total de 127 muestras provenientes de dos bases de datos y pacientes sanos como control, teniendo en cuenta un subconjunto de 36 rasgos de la voz, los rasgos propuestos por DAB [1][5][6] que son un total de 38 con algunas modificaciones, reportados entre los más importantes para describir los tipos de disartria utilizados [24]. Ambas bases de datos se obtuvieron mediante las alocuciones de tres ejercicios que muestran más eficientemente las perturbaciones en la voz: 1. La alocución de la vocal \a\ sostenida (AVS). Este ejercicio se utiliza para medir las alteraciones de la calidad vocal. Al paciente se le pidió mantener la fonación, por lo menos 5 s, con niveles de período fundamental y magnitud que corresponde a su voz natural en una conversación. 2. La repetición de las sílabas \pa\ta\ka tan rápido y distribuido tan uniformemente como sea posible. Este ejercicio se conoce también como diadocokinesis, se realiza para mediciones acústicas de articulación..

(29) CAPÍTULO 2. MATERIALES Y METODOS. 18. 3. La lectura del párrafo "El Abuelo". Este ejercicio se utiliza para mediciones acústicas de prosodia. En la Tabla 2.1 y Tabla 2.2 se muestra el párrafo en sus dos versiones español e inglés. El Abuelo ¿Tú quieres saber todo acerca del abuelo? Pues bien, él tiene casi 83 años de edad y aún conserva su mente tan brillante como siempre. Él usa un viejo saco negro al que generalmente le faltan algunos botones. Su barba larga y colgante produce en quienes lo observan un profundo sentimiento de máximo respeto. Cuando el habla, su voz es un poco rajada y tiembla ligeramente. Dos veces al día toca un pequeño órgano con excelencia y virtuosismo. Cada día él hace unas caminatas cortas al aire fresco, excepto en el invierno cuando la nieve o el hielo lo impide. Nosotros siempre lo exhortamos a que camine más y que fume menos, pero él siempre responde “Aceite de plátano”. El abuelo le gusta ser moderno en su lenguaje. Tabla 2.1. Párrafo “El Abuelo”. Versión en español. El abuelo ( versión en inglés) You wish to know all about my grandfather. Well, he is 93 years old and he still thinks as swiftly as ever. He dresses himself in an old black frog coat, usually several buttons missing. A long beard clings to his chin, giving those who observe him a pronounced feeling of the outermost respect. When he speaks, his voice is just a bit cracked and quivers a bit. Twice each day he plays skillfully and zest upon small organ. Except in the winter when the snow or ice prevents, he slowly takes a short walk in the open air each day. We have often urged him to walk more and Smoke less, but he always answers, “Banana oil!” Grandfather likes to be modern in his language. Tabla 2.2. Párrafo “El Abuelo”. Versión en inglés.. 2.1.2.1. Base de datos en inglés. La base de datos en inglés se trata de una selección de expresiones de los pacientes disártricos exhibiendo diferentes tipos de disartrias, fue recopilada por Aronson [9]. Los sujetos incluidos en esta base de datos, fueron seleccionados de una mayor base de datos utilizada en estudios iniciales [1][5][6], que representan diferentes niveles de severidad de la disartria. La selección se hizo en correspondencia con el tipo de disartrias incluidas en la base de datos en español y el número de temas disponibles en las grabaciones que incluyen las expresiones de interés. En la Tabla 2.3 se muestran el número de pacientes y enfermedades seleccionados en la investigación de Aronson [24]..

(30) CAPÍTULO 2. MATERIALES Y METODOS. Patología. 19 Número de sujetos. Disartria Flácida. 5. Disartria Espástica. 6. Disartria Atáxica. 8. Disartria Hipocinética. 8. Disartria Hipercinética. 8. Distonía. 9. Temblor orgánico de la voz. 8. Esclerosis Lateral Amyotrópica. 8. Total. 60. Tabla 2.3. Pacientes seleccionados de la base de datos de Aronson.. Esta base de datos inicial [1][5][6] no incluyen a pacientes sanos como referencia ya que estaba previsto inicialmente para fines de instrucción, contiene una muestra representativa del habla disártrica que constituye una excelente base de datos para la investigación en este ámbito. Estas grabaciones fueron hechas en una habitación, con las mismas condiciones que la base de datos en español, con un DAT con la frecuencia de muestreo de 44,1 kHz, similar a la grabación realizada en la base de datos en español. 2.1.2.2. Base de datos en español. Esta base de datos fue grabada en colaboración con el hospital "Arnaldo Millian", situado en Santa Clara, el hospital "Hermanos Almeijeiras", situado en La Habana, el Centro de Estudios de Electrónica y Tecnologías de la Información (CEETI) y el Instituto de Ingeniería Biomédica en la Universidad de New Brunswick, Canadá [24]. La base de datos contiene 48 pacientes con diferentes tipos de disartrias, tales como los que se observan en la Tabla 2.4.. Patología. Número de sujetos. Disartria Flácida. 8. Disartria Espástica. 7. Disartria Atáxica. 5. Disartria Hipocinética. 8.

(31) CAPÍTULO 2. MATERIALES Y METODOS. 20. Disartria Hipercinética. 5. Distonía. 5. Temblor orgánico de la voz. 5. Esclerosis Lateral Amyotrópica. 5. Total. 48. Tabla 2.4. Tabla de voces patológicas incluidas en la base de datos en español.. 2.2. Modelo Biónico. El modelo biónico empleado en esta investigación se beneficia de la incorporación de los hallazgos fisiológicos y de fenómenos psicofísicos que juegan un importante rol en el proceso del olfato. Está basado en el sistema olfatorio y la simulación de los principales rasgos estructurales del sistema con el propósito de crear un clasificador de patrones. En la siguiente figura se observan las dos estructuras principales del modelo biónico y como estas se enlazan entre sí. Con el fin de ofrecer una detallada descripción del modelo, sus dos principales estructuras son referidas como: modelo bulbar y modelo cortical, pero esto no significa que el modelo sea una representación exacta del sistema olfatorio. En el modelo bulbar su salida es transmitida al modelo cortical mediante canales feedforward vía el tracto olfatorio lateral (TOL) y transmisiones de feedback desde el modelo cortical a los conjuntos de glomérulos en el modelo bulbar son enviadas a través del tracto olfatorio medio (TOM)..

(32) CAPÍTULO 2. MATERIALES Y METODOS. 21. Figura 2.1. Estructura del modelo biónico. Para el modelo bulbar, durante la etapa activa, la entrada sensorial (A) es modulada por células excitatorias mitrales (M) y células granulares inhibitorias (G). La información olfatoria (B) pasa a través del bulbo olfatorio directamente hacia la capa superior (Layer I) y media (Layer II) del modelo cortical vía el tracto olfatorio lateral (TOL). Información de realimentación (C) es enviada desde la capa media cortical hacia los nodos bulbares granulares vía tracto olfatorio medio (TOM). La salida del modelo biónico (D) es tomada desde la capa cortical media [29][30][31].. En el modelo biónico el número de canales del TOL y del TOM son iguales y se basa en la característica bidireccional del sistema neuronal mamífero aunque el valor es ajustado para la aplicación específica. En el modelo bulbar su salida es transmitida al modelo cortical a través de conexiones vía TOL y desde el modelo cortical hacia el modelo bulbar vía TOM. 2.2.1. Modelo Bulbar. Basado en anteriores trabajos [32][33], en el modelo bulbar hemos incluido N células mitrales excitatorias y M células granulares inhibitorias, con entradas de los receptores directamente conectadas a las células mitrales. En este modelo no hemos tomado en cuenta la estructura de la capa glomerular. Los conjuntos de células mitrales que se encuentran conectados a el mismo glomérulos es simplificado a una célula, asumiendo que los cambios en el nivel de actividad son locales. También la razón M:N es tomada por ser mucho menor.

(33) CAPÍTULO 2. MATERIALES Y METODOS. 22. que 200:1 como en el bulbo real. La excitación y la inhibición son mantenidas en balance por el correspondiente aumento de la fuerza de las sinapsis en las células granulares [34]. La estructura esférica del bulbo es simplificada situando las células en un anillo unidimensional con 400 células de cada tipo (N = M = 400). Cada célula es especificada por un índice: ith célula mitral y jth célula granular para toda i, j que representa la localización espacial de las células. La célula mitral ith es vecina de (i ± 1)th y de la (i × M/N)th célula granular. Debido a la estructura circular del modelo bulbar, la 1st y la Mth célula en la capa mitral (Nth para la capa granular) están situadas una a continuación de la otra. Las conexiones sinápticas que van desde la capa granular a la mitral se encuentra representada por una matriz Ho de N × M elementos, y las conexiones sinápticas desde las células mitrales a las granulares está representada por una matriz Wo de M × N elementos. Por ejemplo, Ho,ij es el peso de la conexión desde el jth célula granular a la ith célula mitral. Debido a que solo asumimos conexiones sinápticas locales, Ho,ij ≠ 0 solo si jth célula granular y la ith célula mitral están cercanas, implicando una matriz Ho con la mayoría de elementos cercanos a la diagonal diferentes de cero, y similarmente ocurre para Wo. Las dos matrices, Ho y Wo, tienen las mismas dimensiones (400 × 400), así como la misma distribución, en nuestras simulaciones. Una matriz Zo de N × N es usada para describir las conexiones capas dentro de la capa mitral. En el comienzo de la simulación, todas las células mitrales tienen igual peso de interconexión, aunque durante el proceso de aprendizaje este son aumentadas o reducidas según la aplicación bajo análisis. 2.2.2. Modelo Cortical. La corteza piriforme posee una estructura laminar que puede ser subdividida en tres capas, constituida de somas celulares y conexiones fibrosas de varios tipos. En este modelo, tres poblaciones de unidades de red se organizan dentro de tres capas, unidades excitatorias que corresponden a células piramidales y dos tipos de unidades inhibitorias correspondientes a interneuronas. La capa más superficial de la corteza (Layer I en Figura 2.1) contiene interneuronas inhibitorias y fibras aferentes desde el bulbo olfatorio haciendo conexiones excitatorias con estas unidades..

(34) CAPÍTULO 2. MATERIALES Y METODOS. 23. Las interneuronas en la capa superior usualmente son referidas como células inhibitorias feedforward [35][36], además la mayoría de estas reciben también conexiones de feedback desde las células piramidales más cercanas [37] en la capa intermedia (Layer II en figura 2.1). Los somas celulares de las células piramidales excitatorias son el principal componente de la capa intermedia. La capa más profunda de la corteza olfatoria contiene tanto células piramidales e interneuronas, pero con el objetivo de reducir el modelo solo las unidades inhibitorias de feedback son incluidas en la capa inferior. Las células piramidales de la capa cortical media forman conexiones excitatorias con las interneuronas en la capa cortical superior e inferior. Estas neuronas o conjuntos de neuronas, crean conexiones inhibitorias feedforward y feedback con las células piramidales de la capa media (Figura 2.2 a). El modelo cortical se compone por NI unidades inhibitorias de feedforward en la capa superior, NII unidades excitatorias. en la capa media, y NIII unidades inhibitorias de. feedback en la capa inferior. En nuestras simulaciones NI = NII = NIII = 400 unidades, debido a las dimensiones cuadradas de las capas de 20 × 20.. Figura 2.2. Arquitectura del modelo cortical. a) Principio general para las conexiones entre las unidades excitatorias (círculos blancos) y las unidades inhibitorias (círculos negros). Las líneas discontinuas.

(35) CAPÍTULO 2. MATERIALES Y METODOS. 24. representan que la fortaleza de la conexión decrece con la distancia. Tomado de Liljenström [38]. b) Estructura general del modelo cortical con intraconexiones e interconexiones. Las flechas representan la entrada desde el modelo bulbar. Tomado de Liljenström [38]. c) Número de unidades excitatorias en la capa media que hacen sinapsis con una unidad inhibitoria en la capa superior o inferior. d) Rango máximo de 3 mm entre unidades para lograr sinapsis [39].. Las intraconexiones en nuestro modelo solo existen en la capa cortical media, donde un sistema de fibras conecta a las unidades excitatorias, tanto hacia la parte posterior de la red, caudalmente, como hacia la parte frontal, rostralmente (Figura 2.2 b). Las conexiones inhibitorias-inhibitorias podrían suceder en la corteza real pero en este trabajo han sido excluidas. Las unidades inhibitorias en la capa superior solo tienen conexión con unidades excitatorias de la capa media en un rango de 3 mm, perteneciendo a 25 unidades adyacentes (Figura 2.2 c). Además la probabilidad de conexión es incluida en la expresión del modelo de los pesos, wij : (. [. (. ). ]). (2.1). donde pij es la probabilidad de conexión que ocurra entre las unidades i y j, y cs es una constante que determina la fortaleza sináptica en las conexiones del tipo s (entre unidades en la Capa II o entre unidades en la Capa II y Capa I o Capa III). La variable dij es la distancia radial, medida en milímetros, entre las unidades i y j (Figura 2.2 d) y tiene que ser menor o igual al máximo rango de conexión, en nuestra simulación de 3 mm . λs es una constante espacial y. es un valor, el cual determina la fuerza mínima de conexión que es. alcanzada asintomáticamente. Los pesos de las conexiones y los parámetros utilizados en el modelo son solamente un reflejo aproximado de datos fisiológicos, y son escogidos libremente con el objetivo de obtener el mejor rendimiento en la clasificación de patrones..

(36) CAPÍTULO 2. MATERIALES Y METODOS. 2.2.3. 25. Dinámica y aprendizaje del modelo biónico. El sistema nervioso de los mamíferos es comúnmente referido como un típico ejemplo de un sistema complejo con un gran grado de libertad. Se han observado respuestas caóticas en diferentes niveles de la red neuronal, como a nivel de neurona o de red neuronal biológica, incluso a nivel de EEG [40]. Las redes neuronales caóticas han sido propuestas para simular el comportamiento caótico, el mismo ha sido reportado en una variedad de modelos neuronales específicos, tales como una red neuronal autónoma de tres neuronas [41] y una red neuronal retardada de dos neuronas [42]. 2.2.3.1. Modelo bulbar. En la simulaciones el bulbo fue ajustado usando una simple aproximación de células excitatorias mitrales e inhibitorias granulares. La actividad de las células mitrales fue espacialmente distribuida tal que los olores fueran representados como un patrón distribuido de actividad en las células mitrales. La dinámica de cada conjunto neuronal es descrita usando ecuaciones diferenciales de primer orden, basados en experimentos fisiológicos del sistema olfatorio [43]. Para la capa mitral: ( ). ( ). ∑. ( ). [ (. (2.2). )]. ∑. [. (. )]. (2.3). Para la capa granular: ( ). *. (. )+. (2.4). Donde a, b y c son constantes. La entrada externa a la capa mitral es representada por Ie e Ic representa la entrada de feedback cortical a la capa granular. Las variables mi(t) y gj(t) simbolizan el estado dinámico del conjunto neuronal imo o jmo en la capa mitral o granular, respectivamente. El valor positivo, negativo o cero de la conexión M0ij, H0ij y W0ij.

(37) CAPÍTULO 2. MATERIALES Y METODOS. 26. representa el peso de la conexión dentro de la capa mitral y entre la capa mitral y granular desde el conjunto neuronal j al i, por tanto estas matrices definen la topología del sistema. Q(x) es la función de transferencia de entrada salida sigmoidal usada para las unidades mitrales y granulares. Sx representa la máxima asíntota de la función sigmoidal, δ corresponde al retardo de transmisión axonal y r representa el ruido o actividad neuronal espontanea. En esta simulación la relación entrada-salida usada fue escogida por conveniencia y no es esencial para el comportamiento siempre y cuando la forma sea cualitativamente preservada. Las células granulares fueron modeladas con un gran rango lineal, reflejando el hecho de que las células granulares no tienen axones y por tanto poseen un efecto no lineal menos fuerte. 2.2.3.2. Modelo cortical. La arquitectura del modelo cortical fue basada en la estructura de tres capas de la corteza piriforme, utilizando similar conectividad pero con unidades relativamente simples para la representación de los conjuntos de neuronas. La dinámica de una unidad de red está denotada por el potencial medio de la membrana, u, y el mismo está dado por un conjunto de ecuaciones diferenciales de primer orden: ∑. [ (. )]. ( ). (2.5). donde τ representa la decadencia espontanea del sistema, wij es el peso de la conexión y δ corresponde a la demora en la transmisión axonal específica. La entrada externa a la capa superior y media del modelo cortical es representada por I y r es el ruido o actividad neuronal espontanea. La relación entrada salida de las poblaciones neuronales en la corteza, gj(uj(t)), es una función sigmoidal continua determinada por: (. [. (. ). ]). (2.6). donde el parámetro de ganancia Qi es asumido por corresponder con el nivel de cualquier neuromodulador, como acetilenocolino. C es la constante de normalización..

(38) CAPÍTULO 2. MATERIALES Y METODOS. 27. El modelo produce señales de salidas muy similares a las obtenidas en gatos (figura 2.3). Las propiedades básicas del modelo son independientes del número de canales entre el modelo bulbar y cortical, mientras que las conexiones dentro de los modelos tanto bulbar como cortical afectan la dinámica del sistema. Una dinámica caótica se levantan en el modelo principalmente debido a las diferencias en el tiempo de retardo intercapa y frecuencias disonantes características en las interacciones de realimentación entre el modelo bulbar y cortical. La dinámica del modelo es sensible a la variación de parámetros internos en el sistema.. 100. 0. -100. 200. 400. 600. 800. 1000. 1200. 1400. 1600. 1800. 2000. 1800. 2000. 100. 0. -100. 200. 400. 600. 800. 1000. 1200. 1400. 1600. Figura 2.3. EEG simulado (superior) y real (inferior). La señal de EEG real fue tomada del bulbo olfatorio de un gato por el profesor Walter J. Freeman, mientras que la señal de EEG simulada fue obtenida por el modelo biónico. El eje-x está dado en milisegundos y el eje-y en microvolts.. Las grabaciones de EEG son conocidas por mostrar la característica 1/f en sus espectros de potencia FFT [44][45], tal que una de los criterios más usados para la evaluación de la dinámica de los modelos biónicos es la característica 1/f. El espectro de la salida del modelo posee un marcado decrecimiento linear de la energía con el aumento de la frecuencia, característico de los EEG en el rango de frecuencia entre 0.5 a 100 Hz, con un pequeño aumento de la energía en la banda gamma la cual es una característica reportada de los EEG del sistema neuronal olfatorio (figura 2.4)..

(39) CAPÍTULO 2. MATERIALES Y METODOS. 0. 0. 10. 10. -1. -1. 10. 10. -2. -2. 10. 10. -3. -3. 10. 10. -4. -4. 10. 10. -5. -5. 10. 10. -6. 10. 28. -6. 1. 10. 2. 10. 10. 1. 10. 2. 10. Figura 2.4. Densidad espectral de potencia promedio.. En la figura anterior se muestra la densidad espectral de potencia promedio, calculada para la señal de EEG simulada (izquierda) y para la señal de EEG real (derecha). El eje-x representa la frecuencia en base logarítmica y el eje-y representa la potencia en base logarítmica. 2.2.3.3. Aprendizaje en el modelo biónico. Una red neuronal tiene que estar configurada tal que la aplicación de un conjunto de entradas genere, tanto directa o indirectamente, el conjunto de salidas deseadas. En el modelo biónico dos procesos de aprendizaje son empleados: aprendizaje asociativo hebbiano y adaptación. Estos procesos de aprendizajes existen en un delicado balance, creando cambios en el proceso de memorización. El aprendizaje hebbiano es un algoritmo de entrenamiento no supervisado en el cual un peso de conexión es reforzado si las dos unidades implicadas están coactivadas. Algunas modificaciones en la regla original hebbiana fueron realizadas de acuerdo a nuestros requerimientos específicos. Cuando una entrada es presentada al modelo por un periodo de tiempo (200 ms), la desviación estándar media de la salida es usada para representar la actividad de cada.

(40) CAPÍTULO 2. MATERIALES Y METODOS. 29. unidad, tal que φi es el promedio de la desviación estándar de la actividad de la unidad i en el periodo de respuesta de salida (T) el cual es dividido en S segmentos iguales. ∑. (2.7). donde φk es la desviación estándar del segmento kmo y φi es el valor medio de todos los segmentos S, tal que φ es un vector de [1 x N] que representa la actividad neuronal de todas las unidades del modelo. Las unidades con actividad mayor a cierto umbral son considerados coactivados y por tanto su conexión (wij) reforzada por el coeficiente hebbiano Hheb. Por el contrario si la actividad de uno de los dos es menor que la media no son considerados activados y la conexión es atenuada por el coeficiente Hhab y el periodo de simulación. El coeficiente de polarización K, es definido por la regla de aprendizaje hebbiana para evitar la saturación de los pesos, por lo que el umbral de decisión estará dado por el coeficiente K y el valor medio del vector φ representado por φm. if (φi>(1+K)φm) and (φj>(1+K)φm) and (i ≠ j) then wij = Hhebwij elseif i = j then wij = 0 else wij = Hhab^(wijT) end Para cada clase, varias muestras son empleadas en el entrenamiento. Al final del proceso de aprendizaje los pesos de las conexiones son fijados para el proceso de clasificación. La actividad de salida del modelo es tomada desde la capa cortical media y esta define el vector de rasgos de cada muestra. La actividad media del conjunto de muestras corresponde a cada clase. El vector de rasgos define un punto en un espacio N-dimensional. Un clúster de puntos en el espacio N-dimensional está formado por el conjunto de entrenamiento formado por.

(41) CAPÍTULO 2. MATERIALES Y METODOS. 30. muestras de la misma clase. El centro de gravedad del clúster define la clase. La distancia euclidiana desde el vector de rasgos correspondiente al centro del clúster del patrón previamente entrenado es calculada cada vez que un patrón es presentado al modelo. La clase de dicho patrón estará determinada por la mínima distancia euclidiana. 2.3. Clasificación mediante el software (WEKA). En este trabajo la clasificación de las bases de datos se realizó mediante el software WEKA [46] es una plataforma de software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es un software libre distribuido bajo licencia GNU-GPL. El paquete WEKA contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. Dentro de las ventajas de WEKA tenemos que está disponible libremente. Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. Y es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.. Figura 2.5. Ventana inicial del WEKA.. Para dicha clasificación se seleccionaron cuatro clasificadores reportados en la literatura y una validación cruzada dejando uno a fuera..

(42) CAPÍTULO 2. MATERIALES Y METODOS. 2.3.1. 31. Clasificadores. El panel de clasificación de este software le permite al usuario aplicar algoritmos de clasificación estadística a los conjuntos de datos resultantes, para estimar la exactitud del modelo predictivo resultante, y para visualizar predicciones erróneas. Se usaron varios clasificadores reportados en la literatura con buenos resultados, todos incluidos en el Weka. 2.3.1.1. Máquinas de Soporte Vectorial. Las máquinas de soporte vectorial son un conjunto de algoritmos de aprendizaje supervisado. Estos métodos están propiamente relacionados con problemas de clasificación y regresión. Dado un conjunto de ejemplos de muestras podemos etiquetar las clases y entrenar una SVM para construir un modelo que prediga la clase de una nueva muestra. Más formalmente, una SVM construye un hiperplano o conjunto de hiperplanos en un espacio de dimensionalidad muy alta (o incluso infinita) que puede ser utilizado en problemas de clasificación o regresión. Una buena separación entre las clases permitirá una clasificación correcta [47][48][49]. Intuitivamente, una SVM es un modelo que representa a los puntos de muestra en el espacio, separando las clases por un espacio lo más amplio posible. Cuando las nuevas muestras se ponen en correspondencia con dicho modelo, en función de su proximidad pueden ser clasificadas a una u otra clase [47][48][49]. Debido a las limitaciones computacionales de las máquinas de aprendizaje lineal, éstas no pueden ser utilizadas en la mayoría de las aplicaciones del mundo real. La representación por medio de funciones Kernel brinda una solución a este problema, proyectando la información a un espacio de características de mayor dimensión el cual amplía la capacidad computacional de las máquinas de aprendizaje lineal. En este problema específico el kernel utilizado para separación de las clases será un kernel polinomial dado por la ecuación, donde p representa el orden del polinomio. El valor seleccionado en este trabajo es p=1. 2.3.1.2. Árboles de Decisión (J48 y LADTrees). Un árbol de decisión es un modelo de predicción cuyo objetivo es el aprendizaje inductivo a partir de observaciones y construcciones lógicas. Son muy similares a los sistemas de.

Figure

Tabla 1.2. Relación clusters-rasgos en el estudio hecho por DAB.
Figura 1.1. Representación gráfica del diagnóstico diferencial de la disartria.
Figura  2.1.  Estructura  del  modelo  biónico.  Para  el  modelo  bulbar,  durante  la  etapa  activa,  la  entrada  sensorial  (A)  es  modulada  por  células  excitatorias  mitrales  (M)  y  células granulares inhibitorias (G)
Figura  2.2.  Arquitectura  del  modelo  cortical.  a)  Principio  general  para  las  conexiones  entre  las  unidades  excitatorias  (círculos  blancos)  y  las  unidades  inhibitorias  (círculos  negros)
+7

Referencias

Documento similar

(c) Consejo Superior de Investigaciones Científicas Licencia Creative Commons 3.0 España

En estos últimos años, he tenido el privilegio, durante varias prolongadas visitas al extranjero, de hacer investigaciones sobre el teatro, y muchas veces he tenido la ocasión

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

Sanz (Universidad Carlos III-IUNE): "El papel de las fuentes de datos en los ranking nacionales de universidades".. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,

Missing estimates for total domestic participant spend were estimated using a similar approach of that used to calculate missing international estimates, with average shares applied

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de