El algoritmo de la mejor base propuesto por Coifman y Wickerhauser (1992) se basa en un proceso de podado de las ramas del ´arbol binario, que empieza con el ´arbol de la descomposici ´on WPT completa, partiendo del nivel m ´as bajo se comienza a eliminar ciertas ramas que conduzcan a encontrar la soluci ´on ´optima para la apli- caci ´on espec´ıfica. La funci ´on de costo que se asocia al algoritmo de podado se basa en un medida de entrop´ıa, de tal manera que para compresi ´on de se ˜nales, se busca maximizar la cantidad de informaci ´on a partir del conjunto de bases seleccionadas. La medida m ´as natural de entrop´ıa es la Shannon:
H(p)=. X
i
pilog2pi, (A.44)
donde, p={pi}es una secuencia no negativa tal quePipi = 1. Aunque existen
otras formas de medida de entrop´ıa con efectos variantes en la salida del algoritmo (Wickerhauser, 1994).
El algoritmo de podado se puede describir de la siguiente manera: supongamos un subespacio Ωj,k en el ´arbol binario de paquetes wavelets WPT. Sea Bj,k el con-
junto de vectores base generador del subespacioΩj,k, de la forma:
Bj,k =
Wj,k,0,Wj,k,1, ...,Wj,k,2n0−j−1
T
(A.45)
Supongamos queAj,k representa la mejor base para la se ˜nal restringida a la ex-
pansi ´on deBj,k yℵla funci ´on de costo seleccionada para la medida de informaci ´on.
El siguiente algoritmo “poda” las ramas del ´arbol binario mediante comparaci ´on de la funci ´on de costo de cada nodo padre con la de sus dos nodos hijos.
Dada una se ˜nalx:
i) Se selecciona un m ´etodo de descomposici ´on tiempo-frecuencia (en este caso WPT), especificando el nivel de descomposici ´onJ y la funci ´on de costo de la informaci ´onℵ.
ii) Se descompone la se ˜nalxen su ´arbol de paquetes wavelet binario y se obtiene los coeficientes{Bj,kx}para0≤j ≤J y0≤k ≤2j −1.
iii) Empezando en el nivelJ: fijarAj,k =Bj,k parak= 0, ...,2j−1
iv) Se determina el mejor subespacioAj,k para j = J−1, ...,0, k = 0, ...,2j −1
mediante Aj,k = ( Bj,k Si ℵ(Bj,kx)≤ ℵ(Aj+1,2kx∪Aj+1,2k+1x) Aj+1,2k ⊕Aj+1,2k+1 en otro caso. (A.46)
Al completarse el algoritmo, se termina en A0,0, obteniendo la mejor base para la se ˜nal x restringida a la expansi ´on de B0,0 ≡ RN. La mejor base seleccionada consiste en un conjunto de subespacios disjuntos, donde cada subespacioΩj,k con-
tiene2n0−j vectores base. El n ´umero total de funciones base es siempreN, donde N = 2n0 es la longitud de la se ˜nalx. EL algoritmo puede ser m ´as r ´apido si la funci ´on
de costo se considera aditiva, esto esℵ({xi}) =Piℵ(xi)de tal manera que
ℵ(Aj+1,2kx∪Aj+1,2k+1x) =ℵ(Aj+1,2kx) +ℵ(Aj+1,2k+1x), (A.47) lo que implica que una simple adici ´on es suficiente en lugar de evaluar el costo de la uni ´on de los nodos. El costo computacional de este algoritmo es O(N). Obteni ´endose finalmente un reducido n ´umero de coeficientes correspondientes a los subespacios seleccionados, en lugar de tener la cantidad de coeficientes resul- tado de la descomposici ´on completa en el ´arbol binario.
Ahora interesa interpretar esta selecci ´on de las mejores bases con respecto al an ´alisis y localizaci ´on en tiempo-frecuencia. Para ello se presenta nuevamente el caso de la se ˜nal chirp lineal.
En la figura A.17 se muestra la se ˜nal chirp lineal con sus respectivas sub-bandas de la descomposici ´on WPT de cuatro niveles de profundidad y el ´arbol resultante despu ´es someter el ´arbol binario completo al algoritmo de selecci ´on de mejores bases, el cual se encarga de determinar las subbandas con mayor concentraci ´on de energ´ıa o informaci ´on de la se ˜nal. Las mejores bases forman un conjunto dis- junto mutuamente ortogonal. Para esto, se us ´o el algoritmo de podado de Coifman y Wickerhauser, teniendo en cuenta la funci ´on de costo basada en la m ´etrica de informaci ´on llamada entrop´ıa de Shannon. Las ramas del ´arbol muestran como se segmenta el espectro de frecuencias de la se ˜nal seg ´un las subbandas del ´arbol, y la altura de cada rama en el ´arbol es proporcional al incremento en la funci ´on de costo obtenido de la ramificaci ´on de un nodo padre en sus nodos hijos (Englehart, 1998).
0 0.5 1 −400 −300 −200 −100 0
Arbol de: Mejores Bases
0 0.5 1 −5 −4 −3 −2 −1 0 1
Decomposition WPT: señal chirp
Nivel de Descomposición
Frecuencia[Tiempo]
Figura A.17. Selecci ´on de las mejores bases del ´arbol binario WPT
0 0.5 1 0 0.2 0.4 0.6 0.8 1 Resolución de Análisis: WPT Tiempo Frecuencia Respuesta tiempo−frecuencia Tiempo Frecuencia 0 0.5 1 0 0.2 0.4 0.6 0.8 1
Figura A.18. Respuesta tiempo-frecuencia de la se ˜nal chirp lineal
En la figura A.18, se puede apreciar que la detecci ´on del incremento lineal de la frecuencia con el tiempo de la se ˜nal chirp lineal es m ´as precisa, gracias a la forma m ´as detallada de la descomposici ´on WPT, lo que permite una mejor resoluci ´on de an ´alisis y mejor localizaci ´on tiempo-frecuencia. Se puede ver tambi ´en como se ubican los coeficientes de mayor magnitud en las celdas de la diagonal sobre la partici ´on del plano bidimensional tiempo-frecuencia.
Aplicaci ´on de la WPT en Compresi ´on de Se ˜nales
En aplicaciones de compresi ´on, despu ´es de obtener los coeficientes wavelets que resultan de la selecci ´on de las mejores bases, estos son sometidos a un pro- ceso de filtraje por umbralamiento. Este proceso consiste en retener solamente los
coeficientes necesarios para lograr una reconstrucci ´on de la se ˜nal con cierta me- dida de calidad a partir de estos. En un esquema de umbralamiento r´ıgido o “hard thresholding”, ´unicamente los coeficientes que exceden un umbral especificado se conservan. Una forma de medir la calidad de la compresi ´on es mediante la medida del error de aproximaci ´on
ǫ=
P
(x−x˜)2 P
x2 , (A.48)
donde xes la se ˜nal original y x˜es la se ˜nal s´ıntesis, reconstruida a partir de los coeficientes umbralizados. En la figura A.19 se puede observar la curva de error de aproximaci ´on contra el n ´umero de coeficientes wavelets WPT no nulos (superiores al umbral seleccionado), al descomponer un registro de se ˜nal EMGS en un segmento de 256 muestras. As´ı, para un punto sobre la curva de error por ejemplo para 32 coeficientes (de 256) usados para la reconstrucci ´on de la se ˜nal se registra un error de aproximadamente 0.33, lo que significa un factor de compresi ´on 8:1 con un error de aproximaci ´on de 0.33. 20 40 60 80 100 120 140 160 180 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 Número de coeficientes
Error por compresión
Figura A.19. Error de aproximaci ´on en compresi ´on de se ˜nales EMGS
Se puede comprobar que el factor de compresi ´on incide directamente en la ca- lidad de la se ˜nal reconstruida como se observa en la figura A.20. Cuanto m ´as se comprime la se ˜nal, menor ser ´a la calidad de la se ˜nal a sintetizar y la forma de onda se consigue replicar con buen grado de aceptaci ´on, salvo por aquellos de- talles m´ınimos similares a “ruido” en la se ˜nal que parecen perderse en el proceso
0 50 100 150 200 250 −1 −0.5 0 0.5 1
Señal EMGS Original
0 50 100 150 200 250 −1 −0.5 0 0.5 1
Señal EMGS Recontruida
Tiempo [ms]
Figura A.20. Comparaci ´on entre la se ˜nal EMG original y su reconstrucci ´on
an ´alisis-s´ıntesis, lo que demuestra que la representaci ´on de se ˜nales EMGS basada en wavelets es apropiada para su modelado.
Como se puede observar, la eficiencia la transformada WPT en aplicaciones de compresi ´on se puede comprobar por su capacidad de identificaci ´on de las subban- das con la informaci ´on relevante en la se ˜nal. Esta capacidad ser ´a aprovechada en este trabajo para extraer caracter´ısticas descriptoras a partir de dicha informaci ´on para prop ´ositos de clasificaci ´on de patrones EMGS.