2. Maquinas de Vectores de Soporte (SVM)
5.5. Características
Por otro lado, si d = dk, cuando el índice de la sumatoria es i 6= k,
bi=0, ya que algún jtomará el valor ky comodk−dj =0, por ende:
bi = 4
∏
j=1,j6=i dk−dj di−dj =0, i 6=kEntonces, al evaluar p(dk), el términobk =1, y el resto de los términos
bi son 0, por ende de la sumatoria solamente sobrevive el término k y
entonces p(dk) = yk.
La interpolación sólo es buena para las longitudes de control cercanas a las utilizadas para estimar los coeficientes del polinomio. Por ese motivo
es que se calcula un polinomio distinto para cada longitud de control kj
para el cual se quiere estimar la posición correspondiente, utilizando las posiciones de las longitudes más cercanas conocidas.
x y Original x y n=10 x y n=30
Figura 5.11: Proyección en el plano xyde un ejemplar del gesto 1, antes y
después del re-muestreo conn =10, 30. La mayor densidad de posiciones
muestreadas, representadas con puntos, en la parte superior en relación con la parte inferior del original fue causada por una diferencia en la ve- locidad utilizada para realizar el gesto. Dicha diferencia fue compensada,
con distintos grados de detalle de acuerdo al valor den.
Este proceso da como resultado, para cada ejemplarsi, un vector ri de
longitudndonde se mantienen las posiciones de principio y fin del gesto,
y hay un muestreo uniforme a través de la longitud de arco del gesto real que realizó el usuario.
5.5. Características
A partir de la secuencia de puntos rotada, suavizada y re-muestreada
118 5. BASES DE DATOS Y CARACTERÍSTICAS
misma es el denominadovector de primeras diferencias; este vector con-
tiene las direcciones entre cada par de posiciones consecutivas del gesto. Por ejemplo, el elemento 1 del vector de primeras diferencias contiene la dirección para llegar desde la posición 1 a la posición 2 del gesto.
Las direcciones de este vector a su vez se escalan a norma 1 para remo- ver toda la información de velocidad y escala contenida en la secuencia de posiciones originales.
Figura 5.12: Cálculo de características a partir de un ejemplar de gesto normalizado.
Elvector de primeras diferencias normalizado del ejemplari, xi, está
dado entonces por:
xi[j] = ri[j+1]−ri[j]
||ri[j+1]−ri[j]||, j =1 . . .n−1, xi[j] ∈
R3
Este vector será la característica para el gesto, y cada uno de sus ele- mentos representa la dirección relativa entre las posiciones consecutivas
del mismo. A la función característica que lo calcula se la denominaráφd.
El vector de primeras diferencias, sin normalizar, da una representación equivalente invariante a la traslación. Al normalizar, se remueve toda la información de velocidad y escala contenida en la norma de cada vector de dirección, tornando la característica invariante a la velocidad y escala. Es importante notar que sin el re-muestreo esta normalización dejaría todavía una cantidad considerable de información de velocidad en la señal, debido a que la cantidad de puntos de muestreo en los segmentos (interpretando la palabra en el sentido de la longitud de arco) donde el usuario realizar el gesto a altas velocidades es más bajo que en aquellos
5.5. CARACTERÍSTICAS 119 segmentos en donde la mano se mueve más lentamente. Es decir, a mayor velocidad, menor densidad de puntos de muestreo y viceversa.
Por último, la característica es en cierto modo equivalente a la función
ángulo-tangente[83] para describir formas de objetos, y por eso desde esa equivalencia también se puede argumentar que cumple las propiedades de invariancia a la escala, traslación y velocidad.
5.5.1. Versiones discretas de las propiedades de los gestos
Previamente se definió un modelo de gestos donde un gesto es una trayectoria continua y hay una relación de equivalencia entre gestos con propiedades deseables. Como los ejemplares son una secuencia de posi- ciones discretas, se necesita una versión discreta de dichas propiedades, aplicables a la representación que se utiliza en los algoritmos de clasifica- ción. La principal diferencia entre ambas es la función de correspondencia
entre gestos, ya que de todas maneras se busca una matriz de rotaciónRi,
y constantes de traslación y escala a yc. Recordando la definición para el
caso continuo:
c ≡m c′ ⇐⇒ ∃Ri ∈
R3×3,∃b ∈R3,∃a ∈R
c(l) =ǫ a(Ric′(l)) +b (5.1)
Se busca aproximar dicha definición en el caso concreto. Para ello, el
re-muestreo de un gesto da una representación de sus posiciones r que
es uniforme en la longitud total de arco del gesto, y que dado un n lo
suficientemente grande, aproxima con error arbitrario a la representación continua. Entonces, se define la equivalencia en el caso discreto simple- mente como:
s≡m s′ ⇐⇒ ∃Ri ∈
R3×3,∃b ∈ R3,∃a∈ R s[j] =ǫ a(Ris′[j]) +b, j=1, . . . ,n
(5.2) Como el espacio de búsqueda de dicha transformación es muy grande,
se debe encontrar una equivalencia entre características dadas por φ ::
P 7→ F, dondeF es el espacio de características, de manera que siφ(s) =ǫ
φ(s′) →x ≡m x′. Es decir, equivalencia en el espacio de las características
implica equivalencia≡m.
En esta tesina, se llamará φd a la función característica que dado un
120 5. BASES DE DATOS Y CARACTERÍSTICAS
y re-muestreo, y el cálculo de la primera diferencia con norma 1; es decir,
xi=φd(si).
Debido a la corrección de la rotación, en donde siempre se ubica el
cuerpo en cierto sentido,φd es invariante a la rotación. No es invariante a
otras rotaciones, ya sean en otras direcciones o de las manos en sí.
Gracias al re-muestreo y la parametrización por longitud de arco, φd
es invariante a la velocidad con la cual fue realizado el gesto, y permite
que cada x[j] represente siempre la misma parte del gesto, aunque sea de
forma aproximada.
El cálculo de la primera diferencia provee invariancia a la traslación, ya que no importan las posiciones absolutas sino las direcciones entre ellas. Llevar dichas diferencias a norma 1 otorga invariancia a la escala, ya que así no influye la distancia absoluta entre posiciones contiguas, sino su dirección solamente.
El vector característico xes invariante, como se deseaba, a la rotación,
traslación, velocidad y escala.
Por último, se define la propiedad de invariancia al punto de comienzo para gestos cerrados discretos, para algún clasificador que pueda imple- mentarla.
En el caso discreto, los gestos cerrados son aquellos para los cuales
s[1] = s[n]. Entonces, una característica φ es invariante a la posición de
comienzo si:
φ(s) = φ(shi f t(s,k)), k =1..n−1 donde
shi f t(x,k) = (x(k)%(n+1),x(k+1)%(n+1), . . . ,x(n+k)%(n+1))
y % es el operadormodulo
La característica φd que se desarrolló en la sección anterior no es in-
variante al punto de comienzo, debido a que claramente un shift de los
puntos del gesto causa un shift en la característica calculada. El clasifica-
dor CNC que se describe en el capítulo 7si provee invariancia al punto
de comienzo realizando una transformación posterior a las características
obtenidas conφd, a costa de perder información sobre la secuenciade las
direcciones.
En conclusión, se ha definido una característica φpara una secuencia
de puntos 3D s, y establecido que es invariante a la rotación, traslación,
velocidad y escala (o sea x =ǫ x →s≡m s′) propiedades de utilidad para