• No se han encontrado resultados

Implementación de implante coclear en MATLAB

N/A
N/A
Protected

Academic year: 2020

Share "Implementación de implante coclear en MATLAB"

Copied!
72
0
0

Texto completo

(1)Facultad de Ingeniería Eléctrica. Departamento de Telecomunicaciones y Electrónica. Trabajo de Diploma. Implementación de implante coclear en MATLAB Autor:. Senghoung Yongpao. Tutores: MSc. Carlos Bazán Prieto Dr. Julián Cárdenas Barrera. Santa Clara 2008 “Año 50 de la Revolución”.

(2) Universidad Central “Marta Abreu” de Las Villas Facultad de Ingeniería Eléctrica. Departamento de Telecomunicaciones y Electrónica. Trabajo de Diploma. Implementación de implante coclear en MATLAB. Autor:. Senghoung Yongpao. Tutores: MSc. Carlos Bazán Prieto Dr. Julián Cárdenas Barrera. Santa Clara 2008 “Año 50 de la Revolución” “Año del 50 Aniversario de la Revolución ".

(3) Hago constar que el presente trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería en Telecomunicaciones y Electrónica, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Autor. Firma. del. Departamento. Jefe. de. donde. se. defiende el trabajo. Firma del Responsable de Información Científico-Técnica.

(4) i.

(5) ii. PENSAMIENTO. Hasta la victoria siempre.. Che.

(6) iii.

(7) iv. DEDICATORIA. A padres A mis hermanos.

(8) v.

(9) vi. AGRADECIMIENTOS. A la revolución Cubana que me da esta oportunidad para formarme como profesional. A mis tutores Bazán y Julián por utilizar su tiempo propio para darme apoyo. A todos los profesores que me transmiten a sus conocimientos para formarme en esta carera. Especialmente a mi familia que siempre me ha apoyado, aminado, soportado y ayudado económicamente durante esta carera. A mi novia Yiliset y su familia por hacerme sentir como en mi propia familia. Y todos los amigos Laosianos y cubanos por sus amistades..

(10) vii.

(11) viii. TAREA TÉCNICA. * Búsqueda bibliográfica del tema, Implantes Cocleares (IC). * Análisis de los componentes fundamentales del IC y efecto del ruido. * Simulación de IC en MATLAB, programación de la interfaz gráfica. * Análisis de los resultados. * Confección y presentación del informe.. Firma del Autor. Firma del Tutor.

(12) ix.

(13) x. RESUMEN. En la actualidad los implantes cocleares (IC) permiten una percepción auditiva con calidad suficiente para la comprensión del habla cuando es pronunciada en ausencia de ruido. En general en condiciones de ruido la comprensión de la voz se dificulta más que en el caso de la audición normal. En este trabajo se analizan críticamente las estrategias y técnicas de reducción de ruido existentes. Se propone un sistema de IC, con el objetivo de simular variantes de realizar el procesamiento, para mejorar la calidad de la señal para los usuarios del implante. La propuesta está diseñada a través de un interfaz gráfica (MATLAB GUI) que permite seleccionar el número de canales, el tipo de filtro a utilizar y visualizar distintas señales del proceso. Se presentan además la evaluación de los resultados..

(14) xi.

(15) xii. ÍNDICE PENSAMIENTO ....................................................................................................................i DEDICATORIA ................................................................................................................... iii AGRADECIMIENTOS ............................................................................................................v TAREA TÉCNICA ............................................................................................................. vii RESUMEN ...........................................................................................................................ix ÍNDEX. xi. INTRODUCCIÓN .................................................................................................................1 Capítulo I: Implante Coclear y las técnicas de reducción de ruido.......................................5 1.1 Introducción al Implante Coclear (IC)..........................................................................6 1.1.1 Definición del IC....................................................................................................6 1.1.2 Funcionamiento de un IC.......................................................................................6 ¾. Parte externa del IC...........................................................................................7. ¾. Parte interna del IC ...........................................................................................7. 1.1.3 La clasificación del IC ...........................................................................................8 1.1.3.1 Electrodos y la configuración .........................................................................8 ¾. Los electrodos ...............................................................................................8. ¾. La configuración ...........................................................................................9. 1.1.3.2 Tipo de estimulación.......................................................................................9 ¾. Estimulación analógica .................................................................................9. ¾. Estimulación por pulsos ..............................................................................10. 1.1.3.3 Enlace de transmisión ...................................................................................10 ¾. La conexión transcutánea............................................................................11. ¾. La conexión percutánea...............................................................................11. 1.1.3.4 Procesamiento de señal.................................................................................12 ¾. Implante de mono-canal..............................................................................12. ¾. Implante de multi-canales ...........................................................................13.

(16) xiii 1.2 Técnicas de reducción de ruido ............................................................................19 1.2.1 Técnicas de multi-micrófonos..............................................................................20 1.2.1.1 Algoritmo BEAM (Adaptive Beamformer BEAM™ o ABF) ........................21 1.2.1.2 Algoritmo LMS de Filtro Adaptivo (Least-Mean-square) ........................22 1.2.2 Técnicas de un solo micrófono ............................................................................22 1.2.2.1 Algoritmos con pre-procesamiento..............................................................23 1.2.2.2 Algoritmos que integran la reducción de ruido en las estrategias ................23 Capítulo II: Propuesta de implante coclear .........................................................................26 2.1 Un sistema de implante coclear ..................................................................................27 2.1.1 Número de canales...............................................................................................28 2.1.2 La tasa de estimulación........................................................................................28 2.1.3 El banco de filtro..................................................................................................30 2.1.4 Detección de envolvente ......................................................................................30 2.1.5 La compresión de amplitud de la envolvente ......................................................32 2.1.6 Estrategias de codificación ..................................................................................33 2.2 Herramienta de software utilizado. MATLAB 7.0.3 (R2006b)....................................34 2.2.1 MATLAB. .............................................................................................................34 2.2.2 Interfaz gráfica de MATAB. .................................................................................35 2.3 Diseño e implantación del IC en MATLAB.................................................................37 2.3.1 Diseño del Banco de Filtros.................................................................................38 2.3.2 Filtros Implementados. ........................................................................................38 2.3.3 Detección de envolvente ......................................................................................40 2.3.4 Estrategia..............................................................................................................40 Capítulo III: Simulación de Implante en MATLAB ..............................................................42 3.1 Uso de la interfaz gráfica en MATLAB. ......................................................................43 3.2 Ejemplo de Simulación...............................................................................................45 3.3 Evaluación de los resultados.................................................................................48 3.3.1 Evaluacion objetiva.............................................................................................49 3.3.2 Evaluacion Subjetiva ..........................................................................................50 3.4 Comparación del simulador programado, con el modelo de IC de la librería de MATLAB. ..........................................................................................................................52 3.5 Elementos Adicionales ..............................................................................................52 Conclusiones.........................................................................................................................53 Recomendaciones .................................................................................................................53 Referencias Bibliográficas....................................................................................................54.

(17) INTRODUCCIÓN. 1.

(18) INTRODUCCIÓN. 2. INTRODUCCIÓN La audición normal se realiza mediante un proceso de análisis del sonido, en la cóclea, que permite extraer información relativa a la intensidad, distribución espectral y distribución temporal de la energía acústica. Esta información es transmitida al cerebro, a través del nervio auditivo, donde se procesa e interpreta. Cuando este mecanismo no funciona correctamente, el implante coclear trata de imitar el mecanismo de conversión del sonido en potenciales de acción, proporcionando al paciente implantado una representación del sonido lo más parecida posible a la que tendría con una cóclea sana. Cuando se coloca un implante coclear, se aloja en la cóclea un conjunto de electrodos. Se utiliza el principio tono tópico de la percepción auditiva para asignar una banda de frecuencia a cada uno de los electrodos, de modo que el paciente implantado percibe los estímulos de las distintas frecuencias en distintos puntos de la cóclea, equivalente a la percepción en una cóclea sana.. Los electrodos permiten a los pacientes implantados recibir una estimulación que les proporciona información espectral, relativa a los niveles de intensidad, y su evolución temporal.. Estos electrodos producen un campo de corriente en una región no confinada, provocando una pérdida importante de resolución espectral tono tópica. Adicionalmente si se estimulan simultáneamente dos electrodos, se produce una interferencia entre ambas estimulaciones provocando un efecto de suma de campos. También se debe dejar un margen de tiempo entre dos estimulaciones consecutivas para permitir la repolarización de las terminaciones nerviosas estimuladas. (ASHA, 2004). En la actualidad todos los sistemas para implantes cocleares que se fabrican proporcionan un grado de calidad aceptable, de modo que llevando un procesador.

(19) INTRODUCCIÓN. 3. de petaca o retroauricular, el sistema proporciona una representación de la señal de voz con calidad suficiente como para mantener una conversación fluida sin apoyo visual. Aunque existen diferencias en la cuanto a la calidad que proporcionan los distintos modelos, dependiendo de la solución adoptada frente a los distintos compromisos, la estrategia de codificación utilizada y la tecnología electrónica aplicada, debe tenerse en cuenta que el objetivo principal de los implantes cocleares es permitir la comunicación oral y el desarrollo de habilidades comunicativas en los pacientes implantados. Los constantes avances tecnológicos que se realizan en la actualidad hacen que continuamente se puedan incorporar mejoras en distintos aspectos de los sistemas de implantes cocleares.. Actualmente el ruido, presente en el ambiente donde se desempeña el implantado, provoca una degradación considerable de la percepción de la voz, por ello en los últimos años se desarrollan muchos estudios para resolver este problema. El problema afrontado en este trabajo es desarrollar en un simulador de implante coclear (IC) en MATLAB, variando los parámetros del sistema, para poder evaluar futuros diseños.. Por tanto, el objetivo principal de este trabajo es desarrollar un simulador de implante coclear en MATLAB y la verificación de su efecto sobre la calidad de la salida del implante simulado. Por lo que es necesario desarrollar los bloques de filtrados, ofreciendo la posibilidad de elegir el número de canales, tipo y configuración de filtro a emplear. Además. desarrollar un interfaz gráfico en. MATLAB que permita validar la operación del implante y que permita incluir nuevas. técnicas de procesamiento.. Para dar cumplimiento a estos objetivos, este informe tiene la siguiente estructura:. CAPITULO I: Implante coclear y técnicas de reducción de ruido, donde se presenta un análisis de los distintos elementos relacionados con la estructura y.

(20) INTRODUCCIÓN. 4. funcionamiento de un implante, así como los efectos sobre la calidad de algunos parámetros como: números de canales, estrategias de procesamiento, tipos de filtrado, etc. Se presentan además estrategias dirigidas a la reducción de ruido.. CAPITULO II: Propuesta de implante coclear, donde se analizan críticamente los componentes principales del implante coclear: el número de canales, tasa de estimulación, banco de filtros, tipo de procesamiento de la señal, detección de envolvente y estrategia de codificación. Finalmente se presenta el implante coclear desarrollado.. CAPITULO III: Simulación de implante en MATLAB, donde se presenta la interfaz gráfica de la simulación del implante coclear, realizado con la ayuda del software MATLAB GUIDE y se discuten los diferentes resultados que se obtuvieron..

(21) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 5.

(22) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 6. Capítulo I: Implante Coclear y las técnicas de reducción de ruido En este capítulo se presenta el Implante Coclear (IC) y las técnicas de reducción de ruido existentes para mejorar la calidad de la escucha. Se presenta un análisis de los distintos elementos relacionados con la estructura y funcionamiento de un implante, así como los efectos sobre la calidad de algunos elementos como: números efectivos de canales, estrategias de procesamiento, tipos de filtrado, etc. Se presentan además estrategias dirigidas a la reducción de ruido.. 1.1 Introducción al Implante Coclear (IC) 1.1.1 Definición del IC Un implante coclear (IC) puede ser definido como un aparato que transforma los sonidos y ruidos del medio ambiente en energía eléctrica capaz de actuar sobre las aferencias del nervio coclear, desencadenando una sensación auditiva en el individuo. La tecnología con fines terapéuticos de implantación coclear consiste en la realización de una operación quirúrgica para situar en el oído interno el dispositivo ya definido, desencadenando una sensación auditiva. Incluye también un largo período de rehabilitación. (AETS, 2003) Un IC es un sistema electrónico que se utiliza para permitir la audición en sujetos que sufren hipoacusias severas o profundas. El sistema consta de dos elementos, un procesador externo y un elemento interno que es implantado en el paciente mediante una intervención quirúrgica. El elemento implantado tiene una guía de electrodos que es alojada en el interior de la cóclea, haciendo posible la estimulación del nervio auditivo mediante estímulos eléctricos. (Torre Vega, 2004). 1.1.2 Funcionamiento de un IC El funcionamiento básico de un IC es el siguiente: El procesador dispone un micrófono que recoge la señal de voz, otros sonidos y el procesador analiza la.

(23) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 7 señal determinando el nivel de estimulación que debe presentarse en cada electrodo para cada instante de tiempo. El patrón de estimulación es transmitido a la parte interna del sistema mediante una transmisión por radio, a través de la piel y la parte interna genera los estímulos eléctricos que son presentados en cada uno de los electrodos del implante. Los pulsos en cada electrodo producen la activación de las fibras nerviosas del nervio auditivo, y dicha actividad es transmitida hasta la corteza cerebral, proporcionando al sujeto implantado una sensación de audición. El funcionamiento de un IC se divide en dos partes: interna y externa.. ¾ Parte externa del IC Consta de micrófonos que recogen los sonidos que pasan al procesador que selecciona los sonidos más útiles para la comprensión del lenguaje y un transmisor que envía los sonidos codificados al receptor, (Dr. Montes y Camejo). ¾ Parte interna del IC Consta de un receptor estimulador que se implanta en el hueso mastoides, detrás del pabellón auricular. Envía las señales eléctricas a los electrodos, estos se introducen en el interior de la cóclea (oído interno) y estimulan las células nerviosas que aún funcionan, (Dr. Montes y Camejo) En la figura 1.1. se presenta un resumen de la estructura de un IC. (Loizou, 1998). Figura 1.1 Estructura del IC..

(24) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 8. 1.1.3 La clasificación del IC Un IC se puede clasificar según: Número de electrodos y la configuración (diseño), tipo de estimulación, enlace de transmisión (transcutáneo o percutáneo) y procesamiento de señal. (Loizou, 1998). 1.1.3.1 Electrodos y la configuración ¾ Los electrodos Cuanto mayor sea el número de electrodos más grande será la resolución, (Loizou, 2006) Pero se ha demostrado que el número de electrodos mayor que 12 no producen mejoras significativas. (Dorman, 1998) Espaciamiento: Está relacionado con el tipo de electrodo, ya que la señal eléctrica se distribuirá entre el electrodo de masa y el electrodo de señal. Vea la figura 2.1.. Figura 2.1 El diagrama demuestra las configuraciones de dos electrodos: mono-polar y bipolar.. En el electrodo mono-polar, la señal se expandirá más y un solo electrodo estimulará una zona más amplia del nervio, (Loizou, 1998; Cordoba, 2003). En el electrodo bipolar, la señal se distribuye entre los dos polos, en una zona más pequeña del nervio.. Dentro de la configuración bipolar existen diferentes variantes: Bipolar simple: la que hemos comentado..

(25) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 9 Bipolar + 1: los dos electrodos del mismo par tienen otro electrodo de otro par entre ellos (los pares de electrodos se encuentran entrelazados entre sí).. Bipolar + 2: existen dos electrodos entre los dos electrodos de un mismo par de estimulación. El entrelazado es mayor por tanto. (Cordoba, 2003) Actualmente, ninguna investigación ha demostrado la prevalencia de un tipo de electro sobre otro. Alguno dispositivo del implante se emplea electrodo monopolares como los desarrollados por Ineraid, Med-El, y otros dispositivos emplean electrodos bipolares como los diseñados por Nucleus, y Existen algunos dispositivos que proporcionan ambos tipos de electrodos mono-polar y bipolar. (Loizou, 1998). ¾ La configuración En relación con la configuración de los electrodos tenemos que considerar posicionamiento y número de electrodos. Posicionamiento: Extra-cocleares: Cerca de la ventana oval Intra-cocleares: en la escala timpánica o en el núcleo coclear.. La mayor parte de los electrodos se sitúa en la escala timpánica, próxima a las neuronas auditivas.. De esta manera puede reservarse el ordenamiento espacial de los electrodos para incidir en las distintas partes del nervio auditivo. Los electrodos pueden insertarse a una profundidad de 22 a 30 mm en la escala timpánica dentro de la cóclea. (Cordoba, 2003). 1.1.3.2 Tipo de estimulación Generalmente hay dos tipos de estimulación: estimulación analógica y estimulación por pulsos (pulsátil).. ¾ Estimulación analógica Las señales que se presentan a cada electrodo son el resultado de un filtrado pasa-banda y la salida es proporcional a la salida del filtrado. Todos los electrodos.

(26) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 10 son estimulados simultáneamente. Esta simultaneidad puede producir interacción entre los canales, y además no está relacionada con la forma real de excitación de las neuronas auditivas. (Loizou, 1998; Cordoba, 2003). ¾ Estimulación por pulsos La información se presenta en forma de pulsos eléctricos de corta duración. Los pulsos destinados a estimular a diferentes canales se pueden presentar en distintos instantes de tiempo, reduciendo el efecto de interacción entre canales, que se producía con la estimulación analógica. Se ha comprobado que el rendimiento mejora si el período de los pulsos es pequeño. Se ha demostrado además mejoras en la audición al emplear estimulación no simultánea en todos los canales. Sin embargo, parece que el tiempo de adaptación del paciente a la prótesis para percibir voz es menor en el caso de estimulación analógica comparada con estimulación por pulsos. (Loizou, 1998; Cordoba, 2003). 1.1.3.3 Enlace de transmisión Una vez que los electrodos se encuentran en el lugar, ¿cómo hacer llegar las señales transmitidas desde el exterior al procesador electrodos implantados? En la actualidad hay dos formas de transmisión de las señales: (1) a través de una conexión transcutánea y (2) a través de una conexión percutánea (véase la figura 1.3).. Figura 1.3. Se demuestra distinto manera de transmitir la señal eléctrica para estimular el electrodo (o conjunto de electrodos)..

(27) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 11. ¾ La conexión transcutánea La conexión transcutánea es el sistema que transmite los estímulos a través de una frecuencia de radio enlace. En este sistema, un transmisor externo se utiliza para codificar la información para el estímulo de radio-frecuencia de transmisión de una bobina externa a un implante de bobina. El receptor interior decodifica la señal y entrega los estímulos a los electrodos (Figura 1.3). Se necesita modulación y demodulación. El transmisor y el receptor están implantados en su lugar en el cuero cabelludo por un imán.. La ventaja de este sistema: es que la piel en el cuero cabelludo se cerra después de la operación y así es posible evitar infecciones. La desventaja de este sistema: es que el implante de la electrónica (es decir, el receptor de circuitos) puede fallar, y necesita una cirugía para sustituirlos. Otra desventaja de este sistema es que el conector transcutánea contiene materiales magnéticos, que son incompatibles con los escáneres de resonancia magnética. La mayoría de dispositivos de implante coclear (por ejemplo, Nucleus, Clarion, Med-El) es más usada la conexión transcutánea. (Loizou, 1998). ¾ La conexión percutánea El sistema transmite los estímulos a los electrodos directamente a través de conexiones de enchufe (cable) (Figura 1.3). En este sistema, no se necesita receptor, si no los distintos electrodos.. La principal ventaja del sistema: es la flexibilidad percutánea y la transparencia de la señal. La señal de transmisión no es de ninguna manera limitada por el receptor implantado de circuitos. Por lo tanto, es ideal para fines de investigación, para la investigación de nuevas técnicas de procesamiento de señales. El dispositivo Ineraid es el único dispositivo que utiliza conexión percutánea. (Loizou, 1998).

(28) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 12. 1.1.3.4 Procesamiento de señal ¾ Implante de mono-canal Los implantes mono-canal fueron implantados en sujetos humanos por primera vez a principios de los años 70. Estos proporcionan estimulación en sólo un punto, utilizando sólo un electrodo. Al excitar una sola zona del nervio, no puede transmitirse información en frecuencia, sobre todo por encima de 1 kHz (ya que los nervios no responden a más frecuencia). Sólo se pueden percibir algunos detalles del habla, como la frecuencia fundamental, (Tono de las frases) la separación sonoro/sordo y la separación entre algunos conjunto de consonantes (fricativas / oclusivas / sonoras). La experiencia de reconocimiento de habla con este tipo de implantes fue bastante limitada. (Seminario de ingeniería biomédica, 2005) Dispositivo de mono-canal, véase figura 1.4.. Figura 1.4. Diagrama de IC mono-canal,. La señal del micrófono pasa al pre-amplificador y luego a través del AGC (Automatic Gain Control), que deja la señal a niveles acordes al rango dinámico del paciente (rango de audición agradable). Luego la señal pasa por un ecualizador, que atenúa las componentes de frecuencia de la señal que están fuera del rango 100Hz-4kHz. Entonces se modula en AM (Modular de Amplitud) y.

(29) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 13 transmite por radio al receptor implantado, que demodula la señal y estimula al electrodo del IC. AGC previene que niveles altos de sonido puedan molestar al paciente implantado superando lo que se conoce como el Nivel de Confortabilidad. A su vez el bloque de ecualización asegura que todas las frecuencias en el rango, sean audibles, ya que sin el ecualizador, únicamente las frecuencias altas serían perceptibles. La respuesta de frecuencia del ecualizador, es ajustada para cada paciente en particular.. ¾ Implante de multi-canales Los implantes cocleares multi-canales proporcionan estímulos en varios nervios aferentes, vea en la figura 1.5.. Figura 1.5. Operación del IC multi-canal.. Es importante señalar que la membrana basilar estimula un arreglo de nervios que dependiendo de la posición, corresponden a estimulaciones de bajas o altas frecuencias. Por lo tanto, los electrodos que llevan la información de las altas frecuencias deben estar más cerca de la base de la cóclea mientras que los que llevan la información de las bajas frecuencias deben situarse cerca del ápex. La primera interrogante que surge es saber cuántos electrodos son necesarios para mejorar sensiblemente el desempeño de los mono-canales, así como saber con qué cantidad mínima se puede decir que nos aproximamos bastante bien a la escucha natural..

(30) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 14. En este tipo de sistema surge un conflicto surge, la interacción entre los electrodos. Debido al tamaño de la cóclea y la separación entre electrodos existen interferencias de campos eléctricos entre los electrodos al ser estimulados al mismo tiempo, generando distorsiones en las señales. En consecuencia, las posibles vías de sortear este problema incluyen: minimizar el número de electrodos para así poder maximizar su separación, o bien, estimular los electrodos secuencialmente. (Loizou, 1998; Seminario de ingeniería biomédica, 2005) Por ello se definen distintas estrategias que buscan soluciones a partir de la forma de estimular a través de los electrodos:. a. Compressed Analog (CA). El comprimido-analógico (CA) fue originalmente utilizado en el implante Ineraid. El diagrama de bloques de la CA enfoque se muestra en la figura 1.6.. Figura 1.6. El diagrama de CA.. Primeramente la señal es comprimida utilizando un control automático de ganancia (AGC), y a continuación se filtra en cuatro bandas de frecuencias, con centro en las frecuencias de 0.5, 1, 2 y 3,4 kHz. Las formas de onda filtradas pasan a través de controles de ganancia ajustable y luego se envían, a través de.

(31) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 15 una conexión percutánea, a cuatro electrodos intra-cocleares en forma analógica. Los electrodos operan en configuración mono-polar.. Las primeras estrategias de codificación que se aplicaron, son las denominadas analógicas. Bajo estas estrategias, cada electrodo es estimulado con una intensidad proporcional a la señal de voz, filtrada con el filtro paso-banda que caracteriza al canal asociado a dicho electrodo. Las estrategias analógicas tienen la ventaja de requerir muy poco cálculo en el procesamiento de la señal. Sin embargo, por el hecho de realizar la estimulación simultáneamente en todos los canales, las estrategias analógicas presentan el problema de la suma de campos, dando lugar a una fuerte interacción entre canales. En un principio se diseñó esta estrategia pensando que en el proceso de transducción auditiva, el potencial en cada neurona era proporcional al desplazamiento de la membrana basilar en la región coclear que inerva. Más adelante se descubrió que las células ciliadas producen pulsos mediante procesos de despolarización y repolarización, y se desarrollaron las estrategias de estimulación pulsátiles, que tienden a imponerse en la actualidad. (Loizou, 1997; Loizou, 1998). b. Estrategia F0/F2 y F0/F1/F2. ¾ La estrategia F0/F1 es la primera estrategia que se desarrolló por el dispositivo Nucleus en 1980, la frecuencia fundamental (F0) y el segundo armónico (F2) es extraída de la señal utilizando detectores de cruce por cero. F0 se estima a partir de la salida de un filtro paso bajo ( LPF ) a 270 Hz y F2 se estima a partir de la salida de un filtro paso banda ( BPF ) a 1000-4000 Hz. La amplitud de F2 es estimada con un detector de envolvente rectificado + LPF (35 Hz). El procesador F0/F2 lleva la información de F2 estimulando el electrodo apropiado del arreglo de 22 electrodos. A una razón de F0 pulsos por segundo. Durante segmentos de ausencia de voz, el electrodo seleccionado es estimulado a intervalos casi aleatorios con una razón promedia de 100 pulsos por segundo..

(32) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 16 ¾ Vea en la figura 1.7. La amplitud de los pulsos está en proporción a la amplitud de F2 en 1985 se incluye F1 (F0/F1/F2), se incluye un detector de cruce por cero para estimar F1 de la salida de un BPF 280-1000 Hz (Loizou, 1997; Loizou, 1998). Figura 1.7 Diagrama de bloques de F0/F1/F2.. c. Estrategia MPEAK.. 9 Adiciona a la anterior información de alta frecuencia, 3. BPF (2000-2800 Hz,. 2800-4000 Hz y 4000-6000 Hz) para mejor la representación de F2 y para una mejor percepción de las consonantes, en figura 1.8..

(33) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 17. Figura 1.8 El diagrama de bloques de la estrategia MPEAK. 9 La amplitud obtenida se entrega a electrodos fijos (7, 4 y 1) MPEAK estimula 4 electrodos a una razón de F0 pulsos por segundo para sonido de voz.. 9 Para sonido de voz hay estimulación en los electrodos F1 y F2 y en los de alta frecuencia 4(2200-2800 Hz) y 7(2800-4000 Hz) el electrodo 1 casi no se estimula por el poco contenido de energía a 4 KHz en voz de humano.. 9 Para sonido que no son de voz, se estimulan los electrodos 1, 4 y 7 así como F2. F1 casi no se estimula por la poca energía por debajo de 1000 Hz (Loizou, 1997). d. Estrategia N de M. En esta estrategia la señal es filtrada en M bandas de frecuencias y el procesador selecciona de las M envolvente resultantes las N envolventes de mayor energía (N<M). Solo los N electrodos correspondientes son estimulados en cada ciclo. Esta estrategia se puede considerar como una híbrida en las dos anterior (Feature representation and waveform representation). (Loizou, 1997).

(34) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 18. e. Estrategia SMSP/SPEAK. La estrategia del procesador de sonido de Máxima de espectral (SMSP Spectral Maxima Sound Processor), desarrollado en los 90 por Nucleus multielectrode cochlear implant, usa la estrategia 6 de 16. Véase en la figura 1.9. 9 Este no extrae ningún rasgo (feature) de la forma de onda del habla. 9 Analiza la señal usando un banco de 16 BPF y detector de máxima espectral (spectral maxima detector). ™ La señal original es pre-amplificada y enviada a un banco de 16 BPF con frecuencia centrales en el rango de 250 a 5400 Hz. Figura 1.9. El diagrama de bloques de la Segunda Reunión del procesador.. ™ La salida de cada filtro es rectificada y filtrada con LPF con frecuencia corte de 200 Hz ™ Luego el procesador SMPS selecciona a intervalos de 4 ms, las 6 salidas mayor energía..

(35) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 19 ™ Estas 6 salidas son comprimidas logarítmicamente y transmitidas a los electrodos correspondientes. ™ Los 6 pulsos bifásicos son entregados a los electrodos seleccionados de forma intercalada (interleaved) a una razón de 250 pulsos por segundo. (Loizou, 1997). 1.2 Técnicas de reducción de ruido Existen dos maneras para reducir los ruidos ambientes y mejorar la inteligibilidad de voz en los IC: durante el procesamiento de la señal o con la minimización de las interferencias. Para el caso del procesamiento de la señal, existen varios filtros digitales como los filtros de Wiener que intentan minimizar el error cuadrático medio entre la señal limpia y la estimada. Estos algoritmos se basan en la hipótesis de que el ruido ambiente que se quiere eliminar es estadísticamente independiente de la señal de interés. La hipótesis asumida es válida en la vida real.. Para el caso de minimización de las interferencias, se asume que la señal de interés, siempre viene frontal a la persona que esta escuchado, se busca diseñar modelos con micrófonos direccionales que impidan la interferencia de sonidos provenientes de otras direcciones.. Se refieren métodos que combinan ambas técnicas, utilizando filtros adaptativos y una innovadora forma de colocar los micrófonos direccionales. A su vez, nuevas investigaciones, suponen la utilización de métodos basados en SPIKE PHASELOCKED. (Kompis, 1998). Estos métodos, intentan similar la naturaleza de la. audición, sabiendo que tenemos dos oídos y que esta redundancia de información puede utilizarse para poder eliminar ruido ambiente así como poder mejorar la inteligibilidad de la voz.. Cuando una fuente en un punto emite una señal audible, el sonido llega a cada uno de los oídos en tiempos distintos, debido a la distancias. El desfasaje en.

(36) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 20 ambos oídos permitirá entonces, al ser humano identificar la localización del objeto. Utilizando la misma idea, el sistema basado en SPIKE, intentará utilizar el desfasaje para identificar la señal que se quiere escuchar y luego mediante distintos procesamientos digitales de señal, eliminar la interferencia de otros ruidos. (Chia, 2004; Gerstner, 2002). También hay varios algoritmos de reducción de ruido que han sido propuestos para usuarios. IC. Una cierta cantidad de esos algoritmos se basaron en la. suposición que dos o más micrófonos estaban disponibles, mientras otros algoritmos dieron por supuesto que la señal acústica fue recogida por un solo micrófono, (Loizou, 2006). La investigación realizada por Fishman K, Shannon R, Slattery W, (1997) demostró que se necesita aumentar la cantidad de electrodos. Friesen L, Shannon R, Baskent D, Wang X, (2001) también dicen que se debe incrementar el número de canales. Dorman M, Philipos C. Loizou Ph.D., (1998) en su investigación demostró que si selecciona más de 12 canales no existe un incremento significativo en la escucha del paciente implantado. Por esta razón, los investigadores intentan buscar la solución de reducir ruido ambiente en IC utilizando algoritmos de reducción de ruido que proponen el pre-proceso de la señal ruidosa y alimentar la señal “Enhanced (realzada)” para entregarla a la entrada del procesador. (Loizou, 2006). 1.2.1 Técnicas de multi-micrófonos Son los dispositivos que tienen más de dos micrófonos, algunos implantes usan un micrófono que capta la señal de la parte delantera y los otros se encuentra en la parte trasera. Con estas técnicas se pueden reducir los ruidos ambientes en el implante, (Loizou, 2006). Existen varios algoritmos para estas técnicas como el algoritmo Griffiths-Jim, (1982) algoritmo de LMS (Douglas, 2004) y el algoritmo BEAM (Adaptive Beamformer o ABF). (Spriet, 2007).

(37) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 21. 1.2.1.1 Algoritmo BEAM (Adaptive Beamformer BEAM™ o ABF). Figura 1.10: Dos micrófonos adaptivos Beamformer BEAM,. En la figura 1.10. se presenta la estructura en bloques del algoritmo BEAM, el diagrama contiene un pre-procesador y una etapa de cancelación de Ruido (ANC Adaptive noise cancellation). El pre-procesador espacial crea una señal del discurso y una señal de ruido.. R. J. M. Van Hoesel and G. M. Clark (1994), probó una técnica de reducción de ruido de dos micrófonos, similar en la figura 1.10. que se conoce como Adaptivo Beamforming (BEAM o ABF), se usó señales de sólo dos micrófonos, uno cada parte trasera de oreja para no atenuar sonidos llegando de la dirección directamente delante del paciente. El algoritmo fue implementado en un procesador digital portátil de la señal, y fue comparado con una estrategia en la cual las dos señales del micrófono fueron simplemente sumadas. El resultado de esta investigación ha obtenido el nivel de la relación señal y ruido ( S / N ) es 0 dB, se demostró que mejora la inteligibilidad de habla para todos los pacientes.. El ANC atenúa el ruido residual en la referencia del discurso y minimiza la potencia de salida. Para limitar la distorsión de discurso, el ANC se adapta durante los períodos de sólo ruido..

(38) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 22. 1.2.1.2 Algoritmo LMS de Filtro Adaptivo (Least-Mean-square). Figura 1.11 Diagrama de algoritmo LMS. La figura 1.11. presenta el diagrama de identificación del sistema, usando filtro adaptivo, el objetivo es cambiar (adaptar) los coeficientes de el filtro FIR (W ) , para hacerlos coincidir lo mejor posible a la señal del sistema desconocido (H ) . El filtro adaptivo ajusta sus coeficientes para minimizar el error medio cuadrático entre su salida y la de un sistema desconocido. (Loizou, 2006; Douglas L. 2004). En resumen, las técnicas de multi-micrófonos pueden traer beneficios sustanciales para la inteligibilidad de discurso, particularmente en situaciones donde se presente interferencia de ruido.. 1.2.2 Técnicas de un solo micrófono Como expuso anteriormente las técnicas multi-micrófonos utilizan dos o más micrófonos, por esta razón estas técnicas no son cómodas para los usuarios del implantes. Por esto muchos centros de investigaciones desarrollan las técnicas de un solo micrófono. Estos algoritmos están divididos en 2 categorías principales: ¾ Algoritmos que pre-procesan la señal de voz ruidosa con algoritmos tradicionales de reducción de ruido y alimentan con la salida mejorada “Realzada (Enhanced)” a la entrada del procesador del IC..

(39) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 23. ¾ Algoritmos que integran la reducción de ruido en las estrategias de procesamiento del IC. (Loizou, 2006). 1.2.2.1 Algoritmos con pre-procesamiento Existen distintos algoritmos utilizados como pre-procesadores: El algoritmo de supresión de ruido digital (INTEL) de Hochberg et al., (1992) que logra un 50 % de reconocimiento de fonemas. El algoritmo de sustracción espectral, (Li-Ping Yang, 2004) utiliza detección de pausa del habla y sustracción espectral no lineal, con buenos resultados. El algoritmo de sub-espacio que evaluó, (Loizou, 2005) proyecta al vector de voz ruidosa como un subespacio señal y subespacio ruido y extrae de ahí solo el subespacio señal. La ejecución del algoritmo de la reducción sub-espacio se evalúa usando 14 sujetos que llevan el dispositivo de Clarion. El resultado indica que algoritmo sub-espacio mejora significante en el reconocimiento de oraciones, ante ruido estacionario. Estos algoritmos tienen 3 desventaja principales (Loizou, 2006) ¾ A veces los algoritmos de pre-procesamiento introducen distorsión en la señal, a pesar del hecho que estos algoritmos mejorar la relación entre señal y ruido. (ejemplo ruido en la música) ¾ Los algoritmos de pre-procesamiento pueden ser muy complicados o necesitan mucha energía y no trabajan con las estrategias del IC. ¾ No hay un método simple para optimizar el algoritmo para usuarios individuales, y muchas veces algunos usuarios benefician y mientras otros no.. 1.2.2.2 Algoritmos que integran la reducción de ruido en las estrategias Los algoritmos de reducción de ruido deben ser fáciles de implementar y deben ser integrados a las estrategias de codificaciones existentes. (Loizou, 2006) El estudio de Toledo et al. (2003) propuso un estrategia de substracción de evolvente simple, basado en el principio de la envolvente limpia (libre de ruido) que puede ser estimado simplemente restando la envolvente ruidosa de la envolvente de ruido. Este enfoque requiere la estimación de la envolvente de ruido, la cual puede ser obtenida utilizando un algoritmo de estimación de ruido. Los resultados con 4.

(40) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 24. usuarios de Implante Clarion indicaron que algunos se beneficiaron con la estrategia de substracción inexactas de la envolvente de ruido, la cual podría haber producido una distorsión del habla.. Y Loizou et al. (2007) propuso el uso de funciones de compresión S-Shaped en lugar de las convencionales funciones logarítmicas de compresión para la supresión de ruido. La motivación detrás de la utilización de las funciones Sshaped es para suprimir la caída de la señal por debajo del nivel de ruido (y dominado por ruido), manteniendo al mismo tiempo la señal por encima del nivel de ruido (y dominada por la voz). Esto puede ser logrado mediante el uso de una función expansiva de los niveles de señal por debajo del nivel de ruido y una función de comprensión para los niveles de señal por encima del nivel de ruido (véase la figura 1.12).. Figura 1.12 La función de entrada y salida de propuso s-shaped. En cierto modo, el amplio segmento de la función sirve como un atenuador de la señal, mientras que compresión del segmento sirve como un amplificador de señal. La clave para la aplicación exitosa de la función S-shaped es la elección del punto de cambio (knee), el cual en (Kalyan Kasturi, 2007) fue fijado para el nivel de ruido estimado usando un algoritmo. Este punto de cambio no es fijo, sino la.

(41) CAPÍTULO I. Implante Coclear y Técnicas de reducción de ruido. 25. que se adapta a partir de a la estimación actual de nivel de ruido. En (Kalyan Kasturi, 2007) se utilizó el algoritmo de estimación de ruido (Rangachari, 2006) para rastrear continuamente el nivel de ruido y la adaptación de punto de cambio en consecuencia. La función S-shaped fue evaluada con 7 usuarios del implante Clarion CII, mostrando mejoras significativas con compresión S-shaped en comparación con el registro de compresión utilizado en las estrategias tradicionales.. En resumen, a pesar de existir distintas técnicas para la supresión de ruido en los IC, no se logra eliminar totalmente la degradación que sufre la percepción de la voz en un ambiente ruidoso..

(42) Capítulo II. Propuesta de Implante Coclear. 26.

(43) Capítulo II. Propuesta de Implante Coclear. 27. Capítulo II: Propuesta de implante coclear En este capitulo se estudian los componentes principales que se incluyen en el implante coclear como son: el número de canales, la tasa de estimulación, el banco de filtros, tipo de procesamiento de la señal, detección de envolvente y la estrategia. de. codificación.. Finalmente. se. presenta. el. implante. coclear. desarrollado.. 2.1 Un sistema de implante coclear Un sistema de implante coclear es un dispositivo electrónico que contiene un receptor de uno o múltiples micrófonos para captar la señal de voz y transformarla en señales eléctricas (tratado en el capítulo anterior), un procesador que codifica las señales eléctricas y un sistema de transmisión. En este capitulo, se describe como se realiza el procesamiento de las señales eléctricas después de ser captadas por el micrófono. La figura 2.1. Presenta el diagrama en bloques de un implante coclear. La señal pasa del micrófono al procesador y a continuación a un banco de filtros. El banco de filtros separa las señales eléctricas de audio en diferentes bandas de frecuencia. Cada banda de frecuencia es asignada a un canal, es decir, a un electrodo (o pareja de electrodos) activo intra-coclear. Esta asignación es tonotópica, es decir, de forma que cada frecuencia va a producir la estimulación sobre una determinada región de la cóclea, de forma similar a como ocurre en una audición normal. Los electrodos que tienen asignadas las frecuencias graves son los situados en la región más apical de la cóclea, mientras que los asociados a las frecuencias agudas corresponden con los de localización más basal. Después se toma la banda de frecuencia en la salida de cada filtro y pasa a un filtro paso bajo ( LPF ) para rectificar la envolvente de cada banda con una frecuencia de corte de 400 Hz y pasa la banda de frecuencia de rectificación a través de un detector de envolvente. Para cada canal se estima la energía que presenta la señal en cada banda de frecuencia, en cada instante de tiempo y se escogen las 6 máximas.

(44) Capítulo II. Propuesta de Implante Coclear. 28. amplitudes de energías (Martinez Rams, 2006), el próximo paso es comprimir dichas amplitudes y codificar las señales, finalmente se suman esta amplitudes. Una vez establecido el patrón de estimulación en el procesador, este es transmitido al implante coclear y las tasas de corriente son generadas a través de los electrodos del implante.. Figura 2.1: Diagrama de bloques del sistema de IC.. 2.1.1 Número de canales Un aspecto importante es seleccionar la cantidad de canales, o lo que es lo mismo, la cantidad de electrodos que se necesitan en el implante coclear. Un canal no es suficiente para una adecuada percepción del habla. Las simulaciones acústicas presentadas en. (Loizou, 1998), y Conjuntamente con el tamaño del paso de cuantificación, (Loizou, 1999) demostraron que solamente entre 2 y 8 canales son suficientes para lograr mejoras en la percepción del habla.. 2.1.2 La tasa de estimulación Hay dos tipos de estimulación para presentar la información a los electrodos, si la información se presenta en la forma analógica, se conoce como estimulación.

(45) Capítulo II. Propuesta de Implante Coclear. 29. analógica, y si la información se presenta en forma alternada, entonces la tasa de estimulación se conoce como estimulación de pulso. (Loizou, 1998) En este trabajo solamente abordamos la tasa por pulsos porque es más fácil de codificar la información.. La tasa de estimulación de pulso puede ser menor que 250 pulsos por segundo o mayor que 5000 pulsos por segundo. (Loizou, 2006) La tasa de estimulación siempre presenta las informaciones en pulso por segundo en cada uno de los electrodos del IC. La tasa de estimulación limita la resolución temporal del IC, o sea, la capacidad de apreciar cambios rápidos en las características de la señal de audio. Es decir que cuando la tasa de estimulación es menor, la calidad es peor. La resolución temporal del usuario implantado se ve limitada por la tasa de estimulación y por el periodo refractario de las neuronas del nervio auditivo. El tiempo que las neuronas necesitan para re-polarizarse tras una descarga se sitúa en torno a 4 ms. Por ello, es conveniente que la tasa de estimulación se sitúe por 5000 pulsos por segundo. (Torre Vega, 2004) Aquí, la tasa de estimulación se ha representado sub-muestreando las envolventes a una frecuencia igual a la tasa de estimulación. Se nota que existen varias estrategias de estimulación en las que se utiliza una tasa de actualización de la envolvente inferior a la tasa de estimulación. En tal caso, el valor dado a la tasa debería ser la tasa de actualización y no la tasa de estimulación, puesto que esta representa una pérdida de resolución temporal. Se demuestra que para las tasas de estimulación excesivamente bajas (por debajo de 800 o 700 pulsos por segundo), la pérdida de resolución temporal va a provocar un efecto de sincronización de la actividad neural con los pulsos de estimulación, que va a reducir aun más la calidad de la percepción con el implante coclear. Por simplicidad este efecto no fue modelado en este trabajo. En la bibliografía se refiere que en el caso de tasas de estimulación excesivamente bajas, la calidad de la señal percibida sería peor que la apreciada en la simulación. (Torre Vega, 2004).

(46) Capítulo II. Propuesta de Implante Coclear. 30. 2.1.3 El banco de filtro El banco de filtros utilizado para el análisis, está formado por filtros equiespaciados en una escala logarítmica de frecuencia en el rango definido por Wn ( Wmin y Wmax ). Se conoce como la escala de MEL. Wn es el límite inferior y. superior del rango espectral de procesado por el sistema del implante coclear, se utiliza Wn para construir el banco de filtros. Los anchos de banda de los filtros son iguales en la escala logarítmica de frecuencia. De modo que los correspondientes a frecuencias más bajas son más estrechos y los correspondientes a frecuencias más altas son más anchos. Cada canal del implante coclear tiene asignado un filtro paso-banda. El banco de filtros se puede diseñar en 2 modos diferentes como: el modo de Hilbert + FIR y el modo de Re ctif .( LPF + IIR) , eso dependen de los diseñadores. En el caso del banco de filtros “ Hilbert + FIR ” los filtros están diseñado como filtros de respuesta impulsiva finita ( FIR ) de 100 coeficientes. En el caso de seleccionar el banco de filtros “ Re ctif .( LPF + IIR) ” se utilizan filtros de respuesta impulsiva infinita de tipo. Cheby1 , Cheby 2 o Butterwort h de orden 6. Los filtros FIR presentan el inconveniente de requerir mayor cantidad de cálculo y los de tipo IIR presentan el inconveniente de ocasionar una distorsión de fase y de poder dar una respuesta inestable, particularmente en el caso de anchos de banda reducidos. (Torre Vega 2004). 2.1.4 Detección de envolvente Generalmente, existen dos métodos diferentes que se pueden utilizar para extraer las envolventes filtradas de las formas de onda. El primer método incluye la rectificación (de onda completa o media onda), seguida de filtro de paso bajo a 200-400 Hz. El segundo método que en la actualidad es utilizado por el dispositivo de Med − El , utiliza la transformada de Hilbert . Ninguna ventaja se ha.

(47) Capítulo II. Propuesta de Implante Coclear. 31. demostrado por el uso de un método sobre el otro para la extracción de envolvente. Aquí, se va a utilizar el primer método. Este método es fácil de aplicar ya que implica la rectificación de onda completa o de media onda y filtro paso bajo ( LPF ). El filtro paso bajo ( LPF ) es un filtro de suavizado y también sirve como un filtro antialiasing, que se requiere antes de adquirir las formas de onda filtrada. (Figura 2.1) La tasa de estimulación debe ser por lo menos dos veces superior (razón de. Nyquist ) que la frecuencia de corte (cut-off frequency) del filtro de paso bajo. Varias investigaciones sobre psicofísica sugieren que debe ser por lo menos cuatro veces sobre la frecuencia de corte. Por ejemplo: El bloque de detección de envolvente incluye una detección de envolvente DE1 que corresponde a la primera banda de frecuencia A1 , la DE 2 correspondiente a la segunda banda de frecuencia A2 , y la DEn correspondiente a n banda de frecuencia An . La señal de entrada del bloque de detección de envolvente recibe la señal de salida del filtro que responde como la banda de frecuencia del filtro en bloque de banco de filtros. En la figura 2.1, la detección de envolvente DE1 correspondiente la primera banda de frecuencia que recibe como la entra de señal filtrada BPF1 es asociada con la primera banda de frecuencia. El bloque de detección de envolvente está configurado para determinar la envolvente asociada que recibió las señales de los filtros y la salida se representa como la señal de envolvente. En la figura 2.1, la señal filtrada B1 , asociada con la primera banda de frecuencia es la entrada de la detección de envolvente DE1 , correspondiente a la primera banda de frecuencia, que determina el envolvente de la señal filtrada B1 y la señal de salida A1 de envolvente asociada con la primera banda de frecuencia. Similarmente, la señal filtrada B 2 asociada con la segunda banda de frecuencia es la entrada de la detección de envolvente DE 2 correspondiente a la segunda banda de frecuencia, que determina el envolvente de la señal filtrada y la señal de salida del envolvente A2 asociada con la segunda banda de frecuencia, y la señal filtrada Bn asociada con la banda de la frecuencia n es la entrada de la detección de envolvente DEn que corresponde a banda de.

(48) Capítulo II. Propuesta de Implante Coclear. 32. frecuencia n , que determina el envolvente de la señal filtrada y la señal de salida de envolvente An asociada con la banda de frecuencia n . En este bloque, la señal de salida de la detección de envolvente es convertida a la señal eléctrica acústica a eléctrica MAPPING. Cada resultado de la señal eléctrica se aplica a los electrodos de implante coclear para proporcionar la señal de estimulación. Por ejemplo: La señal de envolvente A1 salió de la detección de envolvente DE1 , correspondiente a la primera banda de frecuencia, se convierte de la señal eléctrica acústica a señal eléctrica MAPPING asociada con la primera banda de frecuencia. Similarmente, las señales envolventes A2 y An se convierten la señal eléctrica acústica a señal eléctrica MAPPING y asociado con la segunda banda de frecuencia y la banda de frecuencia n , respectivamente.. 2.1.5 La compresión de amplitud de la envolvente Las amplitudes de los envolventes se calcularon de una manera similar al procesador CIS (Continuous Interleaved Sampling). El rango de entrada de la amplitud de envolvente ( X min − X max en la figura 2.2) determina la medida de las amplitudes de los envolventes de cada canal. La máxima amplitud de la envolvente (es decir X max el punto de saturación de la función MAPPING) se determina por los cálculos de histogramas de las amplitudes de envolventes usadas como la entrada de la detección de envolvente, y se escogió X max que incluye 99% de toda la amplitud de cada canal. La mínima amplitud de envolvente MAPPING, se pone a cero. (Loizou, Dorman, 2000).

(49) Capítulo II. Propuesta de Implante Coclear. 33. Figura 2.2 Función de compresión de entrada-salida, (más detalle en Loizou, Dorman, 2000). 2.1.6 Estrategias de codificación Una estrategia de codificación de procesamiento del habla es el código usado para convertir el sonido en impulsos eléctricos que representan la señal del habla. La cóclea es “tonotópica”, por lo que su base es responsable del procesamiento de los sonidos de alta frecuencia y su ápice es responsable del procesamiento de los sonidos de tono bajo. La función del procesador del sonido es transformar los sonidos en parámetros eléctricos para transmitirlos al cerebro a través de la estimulación de distintas partes de la cóclea. Se denomina estrategia de codificación al conjunto de operaciones que se realizan con la señal de audio desde su adquisición por el micrófono hasta la determinación de los estímulos a generar en cada uno de los electrodos en cada instante de tiempo. Existen muchas estrategias para codificar las señales en Implante Coclear como F0/F2, F0/F1/F2, MPEAK, SMSP, y N de M (ACE), entre otras. (Loizou, 1997) En este trabajo se va a codificar la información de la señal de audio con la estrategia N de M. (Torre Vega, 2004) Esta estrategia “N de M” permite seleccionar estrategias CIS (cuando N es igual a M, es decir, el número de canales insertados) o estrategias N de M (cuando N es.

(50) Capítulo II. Propuesta de Implante Coclear. 34. menor que M). La estrategia N de M funciona activando en cada ciclo de estimulación únicamente los N canales que presentan más energía de los M disponibles. La finalidad de las estrategias N de M es permitir un incremento en la tasa de estimulación gracias a que al reducir el número de canales activados en cada ciclo, la duración total del ciclo de estimulación se reduce. Este incremento de la tasa de estimulación se hace a costa de una reducción de la calidad, ya que la información correspondiente a los canales no seleccionados se pierde. La mayoría de dispositivos que se encuentra en mercado se utilizan esta estrategia.. 2.2 Herramienta de software utilizado. MATLAB 7.0.3 (R2006b). 2.2.1 MATLAB. MATLAB significa Matrix Laboratory y es un lenguaje de alto nivel que permite desarrollar el cálculo, la visualización y la programación. Es un sistema interactivo que se basa en arreglos que no necesitan dimensionamiento e incluye varias técnicas de procesamiento de vectores y matrices. Desarrollado por LINPACK y EISPACK, actualmente incorpora librerías BLAS y se ha convertido en puntero en el trabajo con matrices. El uso de MATLAB se ha generalizado en universidades e industrias. Las universidades lo incluyen en cursos de matemática avanzada, de ingeniería y de ciencias, mientras que en la industria se utiliza para el diseño y análisis. Su utilización tan difundida se debe a su facilidad y a sus potencialidades, ya que se ha enriquecido con familias de funciones llamadas toolboxes que permiten su utilización en la solución de problemas de ramas específicas. Entre los toolboxes más sobresalientes se encuentran los de procesamientos de señales, control de sistemas, redes neuronales, lógica difusa, trabajo en el dominio wavelet y simulación. (Amador, 2007) Entre las principales potencialidades de MATLAB se encuentra: • Cálculos matemáticos. • Desarrollo de algoritmos..

(51) Capítulo II. Propuesta de Implante Coclear. 35. • Análisis, exploración y visualización de datos. • Adquisición de datos. • Visualización de gráficos. • Permite además el desarrollo de interfaces gráficas. Aunque MATLAB no permite el desarrollo de ejecutables, en este trabajo se ha seleccionado por las facilidades que brinda en el procesamiento de señales y su amplia utilización en el desarrollo de versiones experimentales de sistemas que posteriormente se llevan a otros lenguajes.. 2.2.2 Interfaz gráfica de MATAB. MATLAB está dotado de una herramienta para realizar interfaz gráfica de usuario, MATLAB GUIDE (interfaz gráfica de MATLAB). Este trabajo está realizado sobre la versión R2006b. MATLAB GUIDE es un entorno de programación visual que ofrece MATLAB para poder realizar y ejecutar programas de Simulación a la medida de forma simple, tiene las características básicas de todos los programas visuales como Visual Basic o Visual C++. La figura 2.3 presenta la pantalla del MATLAB.. Figura 2.3 La pantalla del Software MATLAB.

(52) Capítulo II. Propuesta de Implante Coclear. 36. La forma de comenzar a realizar la interfaz grafica es, o bien accediendo directamente al icono GUIDE (ver figura 2.3), o escribiendo “GUIDE” en la ventana de comandos, con lo que se abre una nueva ventana o consola de comandos.. Figura 2.4 la ventana GUIDE Quick Start. En la consola de comandos se realiza la interfaz deseada, donde se sitúan las componentes a utilizar y se editan sus propiedades., un ejemplo se muestra en las figuras 2.5 y 2.6. Una de las opciones de mayor interés para nosotros es View_Callback. Que crea el archivo “.m” asociado (ejecutable MATLAB) y nos posiciona en la sección del programa que corresponde a la subrutina que se ejecutara cuando se realice una determinada acción sobre el elemento que estamos editando.

(53) Capítulo II. Propuesta de Implante Coclear. 37. Figura 2.5 el diagrama de edición. Figura 2.6 el botón. 2.3 Diseño e implantación del IC en MATLAB. Se ha dicho que solamente 2 a 8 canales son suficientes para lograr una buena percepción de la señal de audio, sin embargo, en esta aplicación el numero de.

(54) Capítulo II. Propuesta de Implante Coclear. 38. canales se brinda como una opción configurable, que permite realizar un estudio comparativo de su efecto en la percepción. La frecuencia de muestreo se ha escogido de 8 kHz por tratarse de una aplicación específica para el tratamiento de voz.. 2.3.1 Diseño del Banco de Filtros. Como dicho en el epígrafe 2.1 que utiliza Wn para construir el banco de filtros y los filtros son equi-espaciados en una escala logarítmica de frecuencia, por esta razón se puede calcular el rango de la banda de frecuencia como según:. W fin (n) = Win (n) + 400 Win (n + 1) = Win (n) + 200. W fin (n + 1) = W fin (n) + 200 = (Win + 400) + 200 = Win (n) + 600 A través de MATLAB, se puede programar su código de la siguiente manera: f in (1) = 100;. f fin (1) = 500; for i = 1 : canal , f in (i + 1) = ( f in (i ) + 200);. f fin (m + 1) = ( f fin (m) + 200); end. 2.3.2 Filtros Implementados. En esta aplicación el banco de filtros esta integrado por filtros IIR de Chevychev Butterwort h y Eliptico de orden 6. A continuación se relacionan las características. de los filtros mencionados, que los hacen deseables para la aplicación en cuestión: • Butterworth posee la característica de magnitud máximamente plana pero un corte poco abrupto para un orden razonable..

(55) Capítulo II. Propuesta de Implante Coclear. 39. • Cheby1 produce más atenuación a una misma frecuencia de la banda de. rechazo que Butterworth , pero su comportamiento frente a transitorios deja bastante que desear. • Cheby2 posee frecuencias de atenuación infinita. Su comportamiento frente a. transitorios deja bastante que desear. • Eliptico ofrece un corte extremadamente abrupto y frecuencias de. atenuación infinita. Su comportamiento frente a transitorios es pésimo, teniendo además un carácter muy dispersivo. MATLAB ofrece unos códigos muy sencillos para diseñar esos filtros como las siguientes: Para caso del filtro Butterwort h. [b, a] = butter ( N ,Wn) Para caso de Cheby1 y Cheby2 , respectivamente. [b, a ] = cheby1( N , Rp, Wn). [b, a] = cheby2( N , Rp,Wn) Donde N es el orden del filtro, Wn es un vector con las frecuencias esquinas de la banda de paso del filtro Wn = Wmax − Wmin , y Rp es el rizado máximo en la banda de paso (passband). Wn debe estar normalizada respecto a la mitad de la frecuencia de muestreo, de modo que 0< Wn <1, de tal suerte que 1 sea la mitad de la frecuencia de muestreo. Estas funciones devuelven directamente los N + 1 coeficientes del filtro, donde el vector b es numerador y a es denominador. Para caso de Eliptico. [b, a ] = Ellip (Ord , Rp, Rs, Wn) Donde Ord es el orden de filtro, usando Rp = 0.5 y Rs = 20 A partir de los filtros diseñados se puede obtener la señal de salida de los filtros mediante (MathWorks, Inc., 2006):.

(56) Capítulo II. Propuesta de Implante Coclear. 40. out = filter (b, a, X ) ; Donde out es la salida de la señal de cada filtro, X es la señal de entrada y a y b son los coeficientes que describen el filtro.. 2.3.3 Detección de envolvente Como se explica anteriormente, esta aplicación utiliza una rectificación (de onda completa o media onda), seguida de un filtro paso bajo a 200-400 Hz,. En. MATLAB esto fue implementado de la manera siguiente:. rout = abs(out ) low = filter (blow, alow, rout ) Donde rout es el valor absoluto de la señal de salida del banco de filtros y low es la señal rectificada la envolvente en cada filtro con vector de las frecuencias blow y alow . (MathWorks, Inc., 2006). 2.3.4 Estrategia Para simular el efecto de las estrategias N de M, en cada ciclo de estimulación se comparan las envolventes correspondientes a los distintos canales, seleccionando la N de mayor energía (en este caso N = 6) En la estrategia “N de M” se determina la amplitud de la señal en cada una de las M banda de frecuencias y se seleccionan las N señales que tienen más amplitudes para proporcionar la señal de estimulación) y anulando las envolventes para el resto de los canales. De este modo la información correspondiente a los canales no seleccionados es eliminada de la señal sintetizada. (Torre Vega, 2004) En MATLAB, se usa la función de sumatoria para seleccionar el máximo pico de la amplitud de envolvente, como sigue: E = sum(low).

(57) Capítulo II. Propuesta de Implante Coclear. 41. E es la amplitud máxima de la energía , de la señal de la envolvente en cada. filtro. Con esta potencia de la señal, se seleccionan las N señales que contienen las amplitudes máximas. El segmento de programa en MATLAB donde se calculan y seleccionan las 6 bandas de frecuencias de mayor energía y se ponen a cero las restantes es como sigue (Martinez, 1998):. for j = 1 : 6 find = max( E ); for i = 1 : canal if find == E (i) E (i ) = 0; end end if E (i) == 0; fout (i) = out (i); end end. Finalmente, la señal de salida es la suma de los pulsos de las salidas de los N filtros correspondientes a las bandas de frecuencias de mayor energía.. fout = fout (1) + fout (2) + ... + fout (6); Donde fout es la señal sintetizada..

(58) Capítulo III. Simulacion del Implante en MATLAB. 42.

(59) Capítulo III. Simulacion del Implante en MATLAB. 43. Capítulo III: Simulación de Implante en MATLAB En este capitulo se presenta la interfaz gráfica de la simulación del implante coclear, realizado con la ayuda del software MATLAB versión R2006b y MATLAB GUIDE y se discuten los diferentes resultados que se obtuvieron.. 3.1 Uso de la interfaz gráfica en MATLAB. La interfaz grafica esta compuesta por 9 cuadros de figuras para visualizar los resultados, 4 botones, un edit text y un pop-up para facilitar el trabajo de diseño del implante. La implementación en GUIDE es mediante 9 Axes, 4 botones, un Edit Text y un Pop-up Menu como se muestra en la figura 3.1.. Figura 3.1 Estructura de la aplicación del IC. Para poder ejecutar el programa realizado es necesario tener instalado el software Matlab, y copiar en el directorio de trabajo las funciones “coclear.m” y “coclear.fig”. La ejecución es sencilla, basta con invocar desde la ventana de comandos la.

(60) Capítulo III. Simulacion del Implante en MATLAB. 44. función coclear, o ejecutar directamente el fichero coclear.fig. El resultado de ejecutar el programa es una nueva ventana como la mostrada en la figura 3.2.. Figura 3.2 Ventana de la Simulación interfaz gráfica de la aplicación del IC. A continuación se describen los botones en la simulación interfaz gráfica del IC. Observe en la figura 3.2: • Botón (A): botón para seleccionar la señal de voz, esta señal tiene que estar. en formato “.wav” y se presenta la forma de onda de la señal original en la ventana (a). • Botón (B): este botón es para escuchar la señal de voz original. • Editor de Texto. (C): Se escribe la cantidad de canales necesarios para. procesar la señal de voz que se cargó en el botón (A). Recordar que según el criterio expresado en capítulos anteriores, el número de canales mayor que 12 no mejora apreciablemente la calidad de la señal.

Figure

Figura 1.1 Estructura del IC.
Figura 2.1 El diagrama demuestra las configuraciones de dos electrodos: mono-polar y bipolar
Figura 1.3. Se demuestra distinto manera de transmitir la señal eléctrica para estimular el electrodo  (o conjunto de electrodos)
Figura 1.4. Diagrama de IC mono-canal,
+7

Referencias

Documento similar

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

Cabe mencionar que los SAC y las ayudas técnicas de la comunicación replantean la práctica educativa del profesora- do tanto en México como en Cuba, sobre todo en aspectos de

La siguiente y última ampliación en la Sala de Millones fue a finales de los años sesenta cuando Carlos III habilitó la sexta plaza para las ciudades con voto en Cortes de

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

información que el individuo puede procesar por su sistema nervioso, y los factores relacionados van a influir en las habilidades y destrezas sociales, que pondrá al uso al

Por otro lado estos niños logran realizar algunas pruebas de manera adecuada, sin embargo no existe un puntaje centil alto pues esto no supone un mayor