Características - Maquinas de Vectores de Soporte (SVM)

2. Maquinas de Vectores de Soporte (SVM)

5.5. Características

Por otro lado, si d = dk, cuando el índice de la sumatoria es i 6= k,

bi=0, ya que algún jtomará el valor ky comodk−dj =0, por ende:

b_i = 4

∏

j=1,j6=i d_k₋d_j di−dj =0, i 6=k

Entonces, al evaluar p(d_k), el términob_k =1, y el resto de los términos

bi son 0, por ende de la sumatoria solamente sobrevive el término k y

entonces p(dk) = yk.

La interpolación sólo es buena para las longitudes de control cercanas a las utilizadas para estimar los coeficientes del polinomio. Por ese motivo

es que se calcula un polinomio distinto para cada longitud de control kj

para el cual se quiere estimar la posición correspondiente, utilizando las posiciones de las longitudes más cercanas conocidas.

x y Original x y n=10 x y n=30

Figura 5.11: Proyección en el plano xyde un ejemplar del gesto 1, antes y

después del re-muestreo conn =10, 30. La mayor densidad de posiciones

muestreadas, representadas con puntos, en la parte superior en relación con la parte inferior del original fue causada por una diferencia en la velocidad utilizada para realizar el gesto. Dicha diferencia fue compensada,

con distintos grados de detalle de acuerdo al valor den.

Este proceso da como resultado, para cada ejemplarsi, un vector ri de

longitudndonde se mantienen las posiciones de principio y fin del gesto,

y hay un muestreo uniforme a través de la longitud de arco del gesto real que realizó el usuario.

5.5. Características

A partir de la secuencia de puntos rotada, suavizada y re-muestreada

118 5. BASES DE DATOS Y CARACTERÍSTICAS

misma es el denominadovector de primeras diferencias; este vector con-

tiene las direcciones entre cada par de posiciones consecutivas del gesto. Por ejemplo, el elemento 1 del vector de primeras diferencias contiene la dirección para llegar desde la posición 1 a la posición 2 del gesto.

Las direcciones de este vector a su vez se escalan a norma 1 para remo- ver toda la información de velocidad y escala contenida en la secuencia de posiciones originales.

Figura 5.12: Cálculo de características a partir de un ejemplar de gesto normalizado.

Elvector de primeras diferencias normalizado del ejemplari, x_i, está

dado entonces por:

x_i[j] = ri[j+1]−ri[j]

||ri[j+1]−ri[j]||, j =1 . . .n−1, xi[j] ∈

Este vector será la característica para el gesto, y cada uno de sus ele- mentos representa la dirección relativa entre las posiciones consecutivas

del mismo. A la función característica que lo calcula se la denominaráφ_d.

El vector de primeras diferencias, sin normalizar, da una representación equivalente invariante a la traslación. Al normalizar, se remueve toda la información de velocidad y escala contenida en la norma de cada vector de dirección, tornando la característica invariante a la velocidad y escala. Es importante notar que sin el re-muestreo esta normalización dejaría todavía una cantidad considerable de información de velocidad en la señal, debido a que la cantidad de puntos de muestreo en los segmentos (interpretando la palabra en el sentido de la longitud de arco) donde el usuario realizar el gesto a altas velocidades es más bajo que en aquellos

5.5. CARACTERÍSTICAS 119 segmentos en donde la mano se mueve más lentamente. Es decir, a mayor velocidad, menor densidad de puntos de muestreo y viceversa.

Por último, la característica es en cierto modo equivalente a la función

ángulo-tangente[83] para describir formas de objetos, y por eso desde esa equivalencia también se puede argumentar que cumple las propiedades de invariancia a la escala, traslación y velocidad.

5.5.1. Versiones discretas de las propiedades de los gestos

Previamente se definió un modelo de gestos donde un gesto es una trayectoria continua y hay una relación de equivalencia entre gestos con propiedades deseables. Como los ejemplares son una secuencia de posiciones discretas, se necesita una versión discreta de dichas propiedades, aplicables a la representación que se utiliza en los algoritmos de clasifica- ción. La principal diferencia entre ambas es la función de correspondencia

entre gestos, ya que de todas maneras se busca una matriz de rotaciónR_i,

y constantes de traslación y escala a yc. Recordando la definición para el

caso continuo:

c ≡m c′ ⇐⇒ ∃Ri ∈

R3×3,_∃b _∈R3,_∃a _∈R

c(l) =ǫ a(Ric′(l)) +b (5.1)

Se busca aproximar dicha definición en el caso concreto. Para ello, el

re-muestreo de un gesto da una representación de sus posiciones r que

es uniforme en la longitud total de arco del gesto, y que dado un n lo

suficientemente grande, aproxima con error arbitrario a la representación continua. Entonces, se define la equivalencia en el caso discreto simple- mente como:

s≡m s′ ⇐⇒ ∃Ri ∈

R3×3,_∃b _∈ R3,_∃a_∈ R s[j] =ǫ a(Ris′[j]) +b, j=1, . . . ,n

(5.2) Como el espacio de búsqueda de dicha transformación es muy grande,

se debe encontrar una equivalencia entre características dadas por φ ::

P 7→ F, donde_F es el espacio de características, de manera que siφ(s) =ǫ

φ(s′) _→x _≡m x′. Es decir, equivalencia en el espacio de las características

implica equivalencia_≡m.

En esta tesina, se llamará φ_d a la función característica que dado un

120 5. BASES DE DATOS Y CARACTERÍSTICAS

y re-muestreo, y el cálculo de la primera diferencia con norma 1; es decir,

xi=φd(si).

Debido a la corrección de la rotación, en donde siempre se ubica el

cuerpo en cierto sentido,φ_d es invariante a la rotación. No es invariante a

otras rotaciones, ya sean en otras direcciones o de las manos en sí.

Gracias al re-muestreo y la parametrización por longitud de arco, φ_d

es invariante a la velocidad con la cual fue realizado el gesto, y permite

que cada x[j] represente siempre la misma parte del gesto, aunque sea de

forma aproximada.

El cálculo de la primera diferencia provee invariancia a la traslación, ya que no importan las posiciones absolutas sino las direcciones entre ellas. Llevar dichas diferencias a norma 1 otorga invariancia a la escala, ya que así no influye la distancia absoluta entre posiciones contiguas, sino su dirección solamente.

El vector característico xes invariante, como se deseaba, a la rotación,

traslación, velocidad y escala.

Por último, se define la propiedad de invariancia al punto de comienzo para gestos cerrados discretos, para algún clasificador que pueda imple- mentarla.

En el caso discreto, los gestos cerrados son aquellos para los cuales

s[1] = s[n]. Entonces, una característica φ es invariante a la posición de

comienzo si:

φ(s) = φ(shi f t(s,k)), k =1..n₋1 donde

shi f t(x,k) = (x_(k)_%_(n+₁),x(k+1)%(n+1), . . . ,x(n+k)%(n+1))

y % es el operadormodulo

La característica φ_d que se desarrolló en la sección anterior no es in-

variante al punto de comienzo, debido a que claramente un shift de los

puntos del gesto causa un shift en la característica calculada. El clasifica-

dor CNC que se describe en el capítulo 7si provee invariancia al punto

de comienzo realizando una transformación posterior a las características

obtenidas conφ_d, a costa de perder información sobre la secuenciade las

direcciones.

En conclusión, se ha definido una característica φpara una secuencia

de puntos 3D s, y establecido que es invariante a la rotación, traslación,

velocidad y escala (o sea x =ǫ x →s≡m s′) propiedades de utilidad para

In document Reconocimiento de gestos dinámicos (página 131-135)