Algoritmo: Selecci ´on de las Mejores Bases seg ´un Coifman-Wickerhauser

El algoritmo de la mejor base propuesto por Coifman y Wickerhauser (1992) se basa en un proceso de podado de las ramas del árbol binario, que empieza con el árbol de la descomposici ón WPT completa, partiendo del nivel m ás bajo se comienza a eliminar ciertas ramas que conduzcan a encontrar la soluci ón óptima para la aplicaci ón espec´ıfica. La funci ón de costo que se asocia al algoritmo de podado se basa en un medida de entrop´ıa, de tal manera que para compresi ón de se ñales, se busca maximizar la cantidad de informaci ón a partir del conjunto de bases seleccionadas. La medida m ás natural de entrop´ıa es la Shannon:

H(p)=. X

pilog2pi, (A.44)

donde, p=_{pi}es una secuencia no negativa tal quePipi = 1. Aunque existen

otras formas de medida de entrop´ıa con efectos variantes en la salida del algoritmo (Wickerhauser, 1994).

El algoritmo de podado se puede describir de la siguiente manera: supongamos un subespacio Ωj,k en el ´arbol binario de paquetes wavelets WPT. Sea Bj,k el con-

junto de vectores base generador del subespacioΩj,k, de la forma:

Bj,k =

Wj,k,0,Wj,k,1, ...,Wj,k,2n₀−j₋₁

(A.45)

Supongamos queAj,k representa la mejor base para la se ˜nal restringida a la ex-

pansi ón deBj,k yℵla funci ón de costo seleccionada para la medida de informaci ón.

El siguiente algoritmo “poda” las ramas del árbol binario mediante comparaci ón de la funci ón de costo de cada nodo padre con la de sus dos nodos hijos.

Dada una se ˜nalx:

i) Se selecciona un m étodo de descomposici ón tiempo-frecuencia (en este caso WPT), especificando el nivel de descomposici ónJ y la funci ón de costo de la informaci ón_ℵ.

ii) Se descompone la se ˜nalxen su ´arbol de paquetes wavelet binario y se obtiene los coeficientes_{Bj,kx}para0≤j ≤J y0≤k ≤2j −1.

iii) Empezando en el nivelJ: fijarAj,k =Bj,k parak= 0, ...,2j−1

iv) Se determina el mejor subespacioAj,k para j = J−1, ...,0, k = 0, ...,2j −1

mediante Aj,k = ( Bj,k Si ℵ(Bj,kx)≤ ℵ(Aj+1,2kx∪Aj+1,2k+1x) Aj+1,2k ⊕Aj+1,2k+1 en otro caso. (A.46)

Al completarse el algoritmo, se termina en A0,0, obteniendo la mejor base para la se ˜nal x restringida a la expansi ´on de B0,0 ≡ RN. La mejor base seleccionada consiste en un conjunto de subespacios disjuntos, donde cada subespacioΩj,k con-

tiene2n0−j _{vectores base. El n úmero total de funciones base es siempre}_N_{, donde} N = 2n0 _{es la longitud de la se ñal}_x_{. EL algoritmo puede ser m ás r ápido si la funci ón}

de costo se considera aditiva, esto es_ℵ(_{xi}) =P_iℵ(xi)de tal manera que

ℵ(Aj+1,2kx∪Aj+1,2k+1x) =ℵ(Aj+1,2kx) +ℵ(Aj+1,2k+1x), (A.47) lo que implica que una simple adici ón es suficiente en lugar de evaluar el costo de la uni ón de los nodos. El costo computacional de este algoritmo es O(N). Obteni éndose finalmente un reducido n úmero de coeficientes correspondientes a los subespacios seleccionados, en lugar de tener la cantidad de coeficientes resul- tado de la descomposici ón completa en el árbol binario.

Ahora interesa interpretar esta selecci ón de las mejores bases con respecto al an álisis y localizaci ón en tiempo-frecuencia. Para ello se presenta nuevamente el caso de la se ñal chirp lineal.

En la figura A.17 se muestra la se ñal chirp lineal con sus respectivas sub-bandas de la descomposici ón WPT de cuatro niveles de profundidad y el árbol resultante despu és someter el árbol binario completo al algoritmo de selecci ón de mejores bases, el cual se encarga de determinar las subbandas con mayor concentraci ón de energ´ıa o informaci ón de la se ñal. Las mejores bases forman un conjunto dis- junto mutuamente ortogonal. Para esto, se us ó el algoritmo de podado de Coifman y Wickerhauser, teniendo en cuenta la funci ón de costo basada en la m étrica de informaci ón llamada entrop´ıa de Shannon. Las ramas del árbol muestran como se segmenta el espectro de frecuencias de la se ñal seg ún las subbandas del árbol, y la altura de cada rama en el árbol es proporcional al incremento en la funci ón de costo obtenido de la ramificaci ón de un nodo padre en sus nodos hijos (Englehart, 1998).

0 0.5 1 −400 −300 −200 −100 0

Arbol de: Mejores Bases

0 0.5 1 −5 −4 −3 −2 −1 0 1

Decomposition WPT: señal chirp

Nivel de Descomposición

Frecuencia[Tiempo]

Figura A.17. Selecci ´on de las mejores bases del ´arbol binario WPT

0 0.5 1 0 0.2 0.4 0.6 0.8 1 Resolución de Análisis: WPT Tiempo Frecuencia Respuesta tiempo−frecuencia Tiempo Frecuencia 0 0.5 1 0 0.2 0.4 0.6 0.8 1

Figura A.18. Respuesta tiempo-frecuencia de la se ˜nal chirp lineal

En la figura A.18, se puede apreciar que la detecci ón del incremento lineal de la frecuencia con el tiempo de la se ñal chirp lineal es m ás precisa, gracias a la forma m ás detallada de la descomposici ón WPT, lo que permite una mejor resoluci ón de an álisis y mejor localizaci ón tiempo-frecuencia. Se puede ver tambi én como se ubican los coeficientes de mayor magnitud en las celdas de la diagonal sobre la partici ón del plano bidimensional tiempo-frecuencia.

Aplicaci ón de la WPT en Compresi ón de Se ñales

En aplicaciones de compresi ón, despu és de obtener los coeficientes wavelets que resultan de la selecci ón de las mejores bases, estos son sometidos a un proceso de filtraje por umbralamiento. Este proceso consiste en retener solamente los

coeficientes necesarios para lograr una reconstrucci ón de la se ñal con cierta me- dida de calidad a partir de estos. En un esquema de umbralamiento r´ıgido o “hard thresholding”, únicamente los coeficientes que exceden un umbral especificado se conservan. Una forma de medir la calidad de la compresi ón es mediante la medida del error de aproximaci ón

ǫ=

(x₋x˜)2 P

x2 , (A.48)

donde xes la se ñal original y x˜es la se ñal s´ıntesis, reconstruida a partir de los coeficientes umbralizados. En la figura A.19 se puede observar la curva de error de aproximaci ón contra el n úmero de coeficientes wavelets WPT no nulos (superiores al umbral seleccionado), al descomponer un registro de se ñal EMGS en un segmento de 256 muestras. As´ı, para un punto sobre la curva de error por ejemplo para 32 coeficientes (de 256) usados para la reconstrucci ón de la se ñal se registra un error de aproximadamente 0.33, lo que significa un factor de compresi ón 8:1 con un error de aproximaci ón de 0.33. 20 40 60 80 100 120 140 160 180 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Número de coeficientes

Error por compresión

Figura A.19. Error de aproximaci ón en compresi ón de se ñales EMGS

Se puede comprobar que el factor de compresi ón incide directamente en la calidad de la se ñal reconstruida como se observa en la figura A.20. Cuanto m ás se comprime la se ñal, menor ser á la calidad de la se ñal a sintetizar y la forma de onda se consigue replicar con buen grado de aceptaci ón, salvo por aquellos de- talles m´ınimos similares a “ruido” en la se ñal que parecen perderse en el proceso

0 50 100 150 200 250 −1 −0.5 0 0.5 1

Señal EMGS Original

0 50 100 150 200 250 −1 −0.5 0 0.5 1

Señal EMGS Recontruida

Tiempo [ms]

Figura A.20. Comparaci ón entre la se ñal EMG original y su reconstrucci ón

an álisis-s´ıntesis, lo que demuestra que la representaci ón de se ñales EMGS basada en wavelets es apropiada para su modelado.

Como se puede observar, la eficiencia la transformada WPT en aplicaciones de compresi ón se puede comprobar por su capacidad de identificaci ón de las subbandas con la informaci ón relevante en la se ñal. Esta capacidad ser á aprovechada en este trabajo para extraer caracter´ısticas descriptoras a partir de dicha informaci ón para prop ósitos de clasificaci ón de patrones EMGS.

B.1 Algoritmo: ´Indice de Separabilidad de Clases

In document Aplicación de wavelets en el análisis y la extracción de características para la clasificación de señales EMGS (página 160-165)