Proyecto Fin de Carrera

(1)

Proyecto Fin de Carrera

Ingeniería de Telecomunicación

Formato de Publicación de la Escuela Técnica

Superior de Ingeniería

Autor: F. Javier Payán Somet

Tutor: Juan José Murillo Fuentes

Dep. Teoría de la Señal y Comunicaciones

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

Sevilla, 2013

Proyecto Fin de Carrera

Grado en Ingeniería de Tecnologías Industriales

Estudio cinemático de la práctica del

ciclis-mo usando Análisis de Datos Funcionales

Autor: Fernando Juvencio Fernández Maeztu

Tutores: Joaquín Ojeda Granja

Fernando Fernández Palacín

Ingeniería Mecánica y Fabricación

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

(2)

(3)

Proyecto Fin de Carrera

Grado en Ingeniería de Tecnologías Industriales

Estudio cinemático de la práctica del ciclismo

usando Análisis de Datos Funcionales

Autor:

Fernando Juvencio Fernández Maeztu

Tutores:

Joaquín Ojeda Granja

Profesor Contratado Doctor

Fernando Fernández Palacín

Profesor Titular de Universidad

Ingeniería Mecánica y Fabricación

Escuela Técnica Superior de Ingeniería

Universidad de Sevilla

(4)

(5)

Proyecto Fin de Carrera: Estudio cinemático de la práctica del ciclismo usando Análisis de Datos Funcionales

Autor: Fernando Juvencio Fernández Maeztu Tutores: Joaquín Ojeda Granja

Fernando Fernández Palacín

El tribunal nombrado para juzgar el trabajo arriba indicado, compuesto por los siguientes profesores:

Presidente:

Vocal/es:

Secretario:

acuerdan otorgarle la calificación de:

El Secretario del Tribunal

(6)

(7)

Agradecimientos

E

l paso de los años me ha hecho darme cuenta de que somos lo que vivimos. Las experiencias, que compartimos con las personas que nos acompañan en cada etapa vital, van moldeando nuestro carácter y condicionan los siguientes pasos que daremos en la vida. Hay una parte importante de lo que somos que se lo debemos a nuestros compañeros de viaje. Yo he tenido la suerte de tener a mi alrededor a muchas personas que han sacado lo mejor de mí: unos padres que me apoyaban cuando creían que hacía lo correcto y me aconsejaban cuando pensaban que me equivocaba, una hermana que ha sido una referencia para mí y de la cual he aprendido mucho, una familia que siempre se preocupó por mí y unos amigos con los que he podido, y sé que puedo, contar en cualquier momento y situación.

E

n relación con este trabajo de fin de carrera me gustaría agradecer el apoyo y los valiosos consejos de mis tutores Juana y Joaquín; a Ezequiel le agradezco también su apoyo y que compartiera conmigo parte de los datos de su investigación. El que este trabajo se haya realizado y defendido en modalidad no presencial, no ha hecho que me encontrara menos arropado que si los acontecimientos hubieran seguido su curso natural.

S

in abandonar el plano académico quiero hacer especial mención a mi padre, Fernando, que me ha enseñado todo lo que sé sobre el análisis de datos funcional, imprescindible para que este trabajo pudiera salir adelante, y a mi madre, Inmaculada, que siempre estaba ahí cuando necesitaba ayuda. Sin vosotros no habría llegado donde estoy ahora mismo, ni sería la persona que hoy soy.

H

a sido un viaje intenso, con altibajos y con un final diferente al que esperaba, pero que he disfrutado mucho. Estoy convencido de que a partir de ahora deberé afrontar nuevos retos y estoy deseoso de saber cuál será la siguiente etapa de mi vida.

Fernando Juvencio Fernández Maeztu Estudiante de Ingeniería Industrial Sevilla, 2020

(8)

(9)

Resumen

A

l estudio de las variaciones de ángulos de las articulaciones durante la práctica del ciclismo, se le conoce como Análisis Cinemático, que podemos englobar dentro del campo de la Biomecánica. Los estudios cinemáticos han despertado un gran interés en distintos campos de investigación durante los últimos años, en particular en el ámbito de la medicina terapéutica y rehabilitadora y en el de la propia práctica deportiva al objeto de mejorar el rendimiento y evitar lesiones, tanto en el deporte aficionado como en el deporte de alto nivel. Todo ello justifica nuestro interés en estudiar este fenómeno desde la óptica de la Biomecánica.

E

l objetivo general de este trabajo, es el análisis de las variables que se obtienen al monitorizar diferentes movimientos angulares de las principales articulaciones que entran en juego en la práctica ciclista: caderas, rodillas y tobillos. Cuando se realiza el experimento de campo, se observa que la información que se registra, obtenida a través de las mediciones de un conjunto de sensores, es una monitorización de las variables reales continuas del fenómeno que se estudia. Por la tanto, se trabajará dentro del campo de estudio de procesos o variables aleatorias funcionales. A lo largo de esta memoria hablaremos indistintamente de variable aleatoria funcional o proceso aleatorio funcional.

N

uestra propuesta de análisis pasa por reconstruir las variables continuas originales y aplicar técnicas de análisis de datos funcionales. Las replicaciones del experimento para un conjunto de individuos, pueden interpretarse como realizaciones, o muestra en sentido amplio, de un proceso aleatorio funcional. Nuestro primer objetivo concreto consistirá en el estudio de la variabilidad de los distintos procesos aleatorios, a partir de la muestra de individuos, al objeto de caracterizarlos, contando con el Componentes Principales Funcionales como herramienta central del análisis. Por otra parte, aplicaremos técnicas multivariables fun-cionales, como el Análisis Funcional de Componentes Principales bivariable y el Análisis Funcional de Correlaciones Canónicas, para analizar la variabilidad conjunta y las relaciones existentes, respectivamente, entre dos procesos aleatorios.

(10)

(11)

Índice Abreviado

Resumen III

Índice Abreviado V

1 Introducción

1

1.1 Análisis cinemático del ciclismo 2

2 Metodología

5

2.1 Fuentes de información 5

2.2 Obtención de las curvas 5

3 Análisis exploratorio funcional

9

3.1 Estadísticos univariables y bivariables. 9

4 Componentes Principales Funcionales (FPCA)

17

4.1 Componentes Principales: del caso vectorial al funcional 17

5 Análisis de las relaciones entre variables

33

5.1 FPCA bivariante 33

5.2 Análisis de correlaciones canónicas. 38

6 Comparación de los Métodos de calibración

45

6.1 ANOVA funcional 45

7 Conclusiones

55 Apéndice A Código R

57

Índice de Figuras 65

(12)

(13)

Índice

Resumen III

Índice Abreviado V

1 Introducción

1

1.1 Análisis cinemático del ciclismo 2

2 Metodología

5

2.1 Fuentes de información 5

2.2 Obtención de las curvas 5

Base de Fourier. 6

Parámetro de suavizado. 7

3 Análisis exploratorio funcional

9

3.1 Estadísticos univariables y bivariables. 9

Interpretación de la autocorrelación. 10

Covarianza y Correlación cruzadas. 12

4 Componentes Principales Funcionales (FPCA)

17

4.1 Componentes Principales: del caso vectorial al funcional 17

PCA en términos de producto escalar. 17

4.1.1 Del caso vectorial al matricial a través del esquema de dualidad 18

Caso matricial. 18

Caso funcional. 19

4.1.2 FPCA de los Ángulos de Flexión de las tres articulaciones 21

FPCA Flexión Cadera Izquierda Método A 21

FPCA Flexión Rodilla Izquierda Método A. 24

FPCA Flexión Tobillo Izquierdo Método A 26

5 Análisis de las relaciones entre variables

33

5.1 FPCA bivariante 33

5.1.1 FPCA bivariables de las flexiones de las tres articulaciones. 33 Flexión Cadera-Rodilla pierna izquierda. Método A. 33 Flexión Cadera-Tobillo de la pierna izquierda. Método A. 36 Flexión Rodilla-Tobillo pierna izquierda. Método A. 36

5.2 Análisis de correlaciones canónicas. 38

FCCA de la Flexión de la Cadera y Flexión de la Rodilla izquierda.

Método A 42

6 Comparación de los Métodos de calibración

45

6.1 ANOVA funcional 45

Comparación de medias de la Flexión de la Cadera Izquierda. 46 Comparación de medias de la Abducción de la Cadera Izquierda. 47

(14)

VIII Índice

Comparación de medias de la Rotación de la Cadera Izquierda. 48 Comparación de medias de la Flexión de la Rodilla Izquierda. 49 Comparación de medias de la Abducción de la Rodilla Izquierda. 50 Comparación de medias de la Rotación de la Rodilla Izquierda. 51 Comparación de medias de la Flexión del Tobillo Izquierdo. 52 Comparación de medias de la Inversión del Tobillo Izquierdo. 53 Comparación de medias de la Rotación del Tobillo Izquierdo. 54

7 Conclusiones

55 Apéndice A Código R

57

(15)

1 Introducción

El análisis de datos funcionales es una rama de la Estadística cuyas observaciones son curvas o funciones, que toman valores en un soporte continuo, generalmente un intervalo de tiempo, [0,T ].

En muchas situaciones la naturaleza de la magnitud que se desea estudiar es intrínsecamente funcional, los individuos vienen dados por funciones de un espacio funcional; mientras que, en otras situaciones, la magnitud tiene naturaleza discreta y los individuos vienen dados por vectores dentro de un espacio vectorial, que podríamos convertir, en según qué casos, en funciones de un “espacio funcional proyectado”. Por ejemplo, el volumen de agua embalsada en un pantano es una observación de naturaleza funcional y, si tuviéramos los recursos necesarios, podríamos disponer de una medición cada minuto, cada segundo, cada décima de segundo, . . . en cambio, la cotización de un valor bursátil, es de carácter discreto y, aunque se publica una actualización del valor cada pocos segundos, entre dos actualizaciones consecutivas no se dispone de información sobre su cotización.

Si estuviéramos interesados en estudiar, en un periodo de tiempo, el comportamiento de los pantanos de una cuenca fluvial o la evolución de los valores de un mercado de valores, nos encontraríamos ante un proceso aleatorio o variable aleatoria funcional, que podríamos caracterizar como:

{X(t),t ∈ [0,T ]}

Para estudiar este proceso, al igual que en la Estadística vectorial, obtendríamos información del mismo a través de una muestra de individuos. Cada dato muestral, o realización del proceso aleatorio X (t) es una curva, x(t),t ∈ [0,T ]. En realidad, en los dos ejemplos planteados, lo que se obtendría sería una secuencia de mediciones de la magnitud en un vector de instantes de tiempo, t₁,t₂, . . . ,t_m, más o menos densa. A partir de dicha secuencia, y mediante procedimientos de ajuste o de suavizado, le devolveríamos a las observaciones el carácter funcional.

Una vez que se dispone de una colección o muestra de individuos representados por funciones, el objetivo es tratarlos estadísticamente. Podríamos concluir que el análisis de datos funcionales, FDA1por sus siglas en inglés, nace de la adaptación de los conceptos y técnicas del análisis estadístico vectorial a un espacio funcional. A lo largo de los últimos 30 años muchos autores han establecido las bases teóricas del análisis estadístico funcional, explorando las posibilidades que ofrece trabajar en un espacio de funciones. Sin lugar a dudas, las referencias fundamentales en este campo pertenecen a Ramsay y Silverman[13] y a Ferrety y Vieu[6]. Otros muchos autores han propuesto metodologías, adaptado técnicas multivariantes vectoriales e implementado algoritmos y procedimientos informáticos.

La obtención de las curvas a partir de las secuencias de mediciones de cada individuo, es un problema que deberá ser resuelto en función de cada situación. La naturaleza de los datos, su posible carácter periódico y los objetivos del análisis son cuestiones a tener en cuenta a la hora de elegir el procedimiento más eficiente para obtener las curvas. Existe un amplio catálogo de soluciones, siendo las más utilizadas las que usan procedimientos de suavizado a través de una base de funciones ortonormales. Las bases más comunes son la de Fourier y la de Splines. En todo caso, siempre deberá exigirse que las curvas reúnan unas mínimas condiciones de regularidad, siendo muy interesante que dispongan de primera y segunda derivada. Obsérvese que, si los datos son intrínsecamente funcionales, el procedimiento de suavizado no es sino una reconstrucción de las curvas originales del proceso.

1

Functional Data Analysis

(16)

2 Capítulo 1. Introducción

1.1 Análisis cinemático del ciclismo

El análisis biomecánico de la práctica del ciclismo es una tendencia cada vez más extendida. Esto conlleva que exista un gran interés en estudiar determinados aspectos relacionados con esta práctica. Una de las cuestiones más estudiadas, tiene que ver con la relación existente entre la altura del sillín y los ángulos de la flexión de la cadera y la rodilla que se producen al pedalear. A este tipo de estudio sobre la variación de ángulos de las articulaciones se le conoce como análisis cinemático. Otras cuestiones que también generan interés son las relacionadas con las fuerzas de interacción entre ciclista y bicicleta, como puede ser el estudio de los momentos conductores de la rodilla en función del factor Q. Estos estudios son denominados análisis cinéticos.

Nuestro trabajo se centra en el análisis cinemático del ciclismo. Para realizar este tipo de estudios se necesita monitorizar la medición de ángulos en las tres principales articulaciones que intervienen en la práctica del ciclismo: cadera, rodilla y tobillo. Existen diferentes tecnologías para capturar dicha información. Entre las más comunes se encuentran los marcadores LEDs[1], marcadores reflectantes y cámaras de infrarrojo[17], combinadas con videogrametría. Hay que tener en cuenta que cualquier error a la hora de colocar los marcadores puede afectar de manera significativa a las mediciones.

Examinando diversos estudios que analizan la cinemática 3D o fuera del plano sagital del tren inferior y que emplean videogrametría, se concluye que la mayoría de ellos no desarrolla una metodología específica para el ciclismo, sino que, más bien, tienden a usar protocolos de marcadores y procedimientos importados directamente del análisis de la marcha[12, 18]. La excepción a esta tendencia es el estudio realizado por Shen et al[15], que realizan la calibración estática con el sujeto subido en la bicicleta en posición anatómica y con los pies colgando.

El hecho de aplicar procesos diseñados para el análisis de la marcha a una práctica con posturas y movimientos tan específicos como el ciclismo lleva asociado distintos problemas. En primer lugar, la ocultación o pérdida de la trayectoria de algunos marcadores debido al posicionamiento del sujeto en la bicicleta, como pueden ser los marcadores colocados en las espinas iliacas antero-superiores. Otro problema derivado es la posible inexactitud de algunos marcadores en las medidas de las trayectorias de las zonas deseadas, debido a que estos se colocaron en una postura del cuerpo (posición de pie), distinta a la postura en la que el cuerpo trabaja durante la toma de medidas (posición de pedaleo). Este problema se origina por tres motivos principalmente. El primero, el reacondicionamiento de los tejidos blandos y musculares que provoca que el marcador se desplace de la zona deseada (punto de referencia). El segundo, está relacionado con el cambio en la orientación y posición relativa de algunos huesos, como es el caso de la pelvis, al subirse el sujeto a la bicicleta. La sedestación del sujeto en el sillín, produce una abducción de las caderas que implica un movimiento relativo de todas las articulaciones que componen la cintura pélvica; cosa que no ocurre con la bipedestación. Este hecho provoca que el marcador que estaba colocado en esa zona no mida la trayectoria de dicho hueso de manera óptima. El tercer motivo tiene relación directa con el estudio de personas con alto tono muscular, como son los ciclistas, pues los marcadores se colocan en zonas que presentan una elevada cantidad de tejido muscular. Este hecho provoca la alteración de la trayectoria de estos marcadores debido a las contracciones musculares.

El último de los problemas detectados está relacionado con el análisis 3D de la cinemática del ciclismo. Al no ser un análisis muy extendido, muchos estudios adoptan metodologías importadas del análisis de marcha, como el uso de marcadores colocados en la zona medial de rodillas y tobillos, con el fin de determinar los ejes anatómicos[16, 19]. El uso de este tipo de marcadores en la práctica del ciclismo no es óptimo, ya que la posición de las piernas durante el pedaleo puede ocultarlos o incluso golpearlos y provocar que se despeguen de la piel.

Los objetivos generales que nos planteamos en este trabajo son tres. En primer lugar, la descripción de algunos de las variables angulares usando técnicas descriptivas funcionales. El segundo objetivo es relacionar algunos ángulos de las articulaciones que actúan en la práctica ciclista. Por último, nos plantemos si existen diferencias en función de la postura del sujeto durante la colocación de los marcadores y la calibración estática.

Desde una perspectiva metodológica, usaremos técnicas de análisis de datos funcionales. La justificación es que cada una de las medidas angulares es un proceso aleatorio funcional y la secuencia de mediciones, obtenidas para cada variable en el ciclo de pedaleo, nos permite obtener, mediante técnicas de suavizado, curvas que son realizaciones de dicho proceso. Entre las técnicas funcionales que aplicaremos, aparte de las puramente descriptivas unifuncionales, están las componentes principales funcionales, tanto uni como bivariables, y el análisis de correlaciones canónicas para comparar dos medidas angulares.

(17)

1.1 Análisis cinemático del ciclismo 3

El resto del trabajo está organizado de la siguiente forma. En el Capítulo 2, se detalla la obtención de las curvas usando un suavizado a partir de una base de funciones de Fourier; además, se dan los Errores cuadráticos medios de ajuste para las 36 variables funcionales.

En el Capítulo 3, se detallan las expresiones funcionales de los principales estadísticos descriptivos, tanto univariantes como bivariantes: Medias, Desviaciones típicas, Covarianzas y Correlaciones. Se detalla la interpretación que tiene la covarianza, o la correlación funcional, como medida de relación entre variables. La correlación funcional entre dos variables o la autocorrelación de una variable consigo misma, hace un papel similar a la matriz correlaciones en el caso multivariante vectorial. La superficie continua de correlaciones, o mejor aún, las curvas de contorno equicorrelacionadas, contiene toda la información relevante del proceso funcional, o de la relación entre dos procesos funcionales, según el caso.

En el Capítulo 4 se detalla el paso del Análisis de componentes principales del caso vectorial al funcional, se ha usado para ello el esquema de dualidad, poniéndose de manifiesto la quivalencia entre la matriz de covarianzas, dada por 1_nX0X, y el núcleo funcional, K(s,t). Las componentes principales son una magnífica herramienta de diagnóstico del proceso aleatorio funcional; puesto que las variables están normalizadas, las componentes actúan como vibraciones de la media que indican el tipo de variabilidad a lo largo del intervalo temporal considerado.

El Capítulo 5 se dedica al análisis de dos variables; en primer lugar se introduce el Análisis de componentes principal bivariable, aunque en realidad no analiza la relación entre las mismas, sino que establece un espacio donde las dos variables pueden ser representadas, compartiendo el mismo autovalor cada pareja de componentes. El Análisis de correlaciones canónicas, que se detalla a continuación y que generaliza la técnica vectorial, sí permite entrar a valorar las relaciones de causa-efecto entre las dos variables implicadas. En el Capítulo 6 se realizan comparaciones, usando ANOVA funcional, de las curvas medias de los métodos de calibración A y B, para cada una de las combinaciones de ángulos y articulaciones.

(18)

(19)

2 Metodología

2.1 Fuentes de información

Los datos para realizar este estudio proceden de la monitorización de los ángulos de flexión, abducción/in-versión y rotación interna, en las tres articulaciones fundamentales en la práctica ciclista, cadera, rodilla y tobillo y en ambas piernas. La calibración estática se ha realizado mediante dos métodos. Método A: posición anatómica y colocación de marcadores en esa posición, Método B: posición estática de pie en la bicicleta y los marcadores colocados en posición de pedaleo. El experimento se ha repetido con 11 individuos. En resumen, nuestro diseño de datos involucra 4 factores: tipo de movimiento (3), articulación (3), pierna (2) y método (2), medido en un conjunto de 11 individuos. En total, se tienen 11 replicaciones de 36 variables angulares (3 × 3 × 2 × 2). Cada variable angular es un proceso aleatorio o variable aleatoria funcional, la cual toma valores distintos en cada instante de tiempo.

La captura de movimiento se ha realizado mediante el software desarrollado por VICON® que posee la Universidad de Sevilla en el Departamento de Ingeniería Mecánica de la Escuela Técnica Superior de Ingeniería. Básicamente se trata de un sistema óptico que registra la posición de una serie de marcadores situados en puntos estratégicos del sujeto.

La frecuencia de captura de las mediciones angulares ha sido de 100 hercios, que se corresponde apro-ximadamente con un ciclo de pedaleo. Dichas mediciones proporcionan, para cada variable angular, una información discreta del proceso aleatorio funcional subyacente. Las 11 replicaciones, obtenidas con el grupo de individuos, son realizaciones discretas del proceso, y nos permitirán analizar la variabilidad del mismo.

Resumiendo, nuestro diseño experimental se concreta en 36 procesos aleatorios, de los que se dispone de 11 replicaciones para cada uno de ellos. La información de la que se dispone de cada variable aleatoria funcional, se recoge en una matriz de dimensión 100x11. Para almacenar toda la información se ha dispuesto de un ”Array” de dimensiones 100x11x18x2, correspondiéndose la última dimensión con el Método de calibración. Con todo ello, se ha creado un objeto de clase ”Lista” en el software R, herramienta con la se realizará el análisis de los datos.

2.2 Obtención de las curvas

Para la obtención de las funciones muestrales a partir de las secuencias de 100 observaciones, nos hemos decidido por un procedimiento de suavizado a partir de una base de funciones ortonormales, que nos dará mejores resultados que un ajuste o una interpolación. La idea de suavizado tiene que ver con que los cambios que se produzcan entre dos instantes de tiempo próximos sean suficientemente pequeños, de forma que las funciones admitan, al menos, las dos primeras derivadas. Por otra parte, si los datos observados vienen afectados por un error aleatorio de medición, el suavizado actuará como filtro de dicho ruido.

En la práctica, los datos funcionales se observan y registran de forma discreta como m pares (t_j, x(t_j)), siendo x(t_j) una instantánea de la función en el tiempo t_j, posiblemente afectada por un error de medición. Una base de funciones, {φk(t), k ≥ 0}, definida en un soporte [0,T ] es un conjunto de funciones ortogonales,

(20)

6 Capítulo 2. Metodología

de modo que cualquier función del Proceso funcional puede representarse como una combinación lineal de las funciones base[11]. Dada una curva x(t), se trata de encontrar coeficientes c₀,c₁, . . . ,c_k, . . ., de forma que: x(t) = c₀φ₀(t) + . . . + c_kφ_k(t) + . . . (2.1) Si consideramos el producto escalar de x(t) por un elemento genérico de la base, se tendría, puestos que estos son ortogonales:

hx,φ_ki = Z T 0 x(t)φ_k(t)dt = Z T 0 (c₀φ₀(t) + . . . + c_kφ_k(t) + . . .)φ_k(t)dt = Z T 0 c_kφ_k(t)2dt= c_k Z T 0 φ_k(t)2dt (2.2) de donde: c_k= hx,φki RT 0 φk(t)2dx =hx,φki ||φ_k||2 (2.3) y sustituyendo: x(t) = ∞

∑

k=0 c_kφ_k(t) = ∞

∑

k=0 hx,φ_ki ||φ_k||2φk(t) (2.4)

Si la base es ortonormal, se tendría que:

x(t) = ∞

∑

k=0 c_kφ_k(t) = ∞

∑

k=0 hx,φkiφk(t) (2.5)

Dado que el espacio funcional es de dimensión infinita, la propuesta dada en (2.1) no deja de ser teórica, de forma que para poder abordar un problema real necesitamos truncar dicha expresión para quedarnos con un número finito de términos. La determinación del número K de funciones base, para proyectar o expandir la función de suavizado, va a depender del criterio que se elija. En la literatura se ofrece una gran cantidad de opciones, siendo una de las más exitosas el Criterio de Validación Cruzada Generalizado (GCVC), que detallaremos más adelante. Así, la expansión empírica de la muestra de funciones vendrá dada por la expresión: x_K(t) = K

∑

k=1 c_kφ_k(t) = Φ(t)c (2.6)

El grado de aproximación deseado para la función x(t), dado por (2.6), a su vector observado, x, condiciona el número de elementos de la base de funciones. Suponiendo que la matriz Φ = {φk(tj), j = 1,...,m, k = 1,...,K}, de orden m × K, que evalúa las funciones base en la rejilla soporte, es de rango completo, se puede obtener una representación exacta, o interpolación, con una base de tamaño K = m, de forma que se pueden obtener los coeficientes c_kde manera que x(t_j) = x_K(t_j)[13]. No obstante lo anterior, no buscamos un ajuste de las observaciones, sino un suavizado de las mismas que posea buenas propiedades, por lo que el número de funciones base será generalmente una pequeña fracción de m.

Una vez determinado K, el criterio habitual para la obtención de los coeficientes de expansión, c_k, es el de mínimos cuadrados, lo que nos lleva a resolver el problema de optimización:

m´ın {c_k} m

∑

j=1 [x(t_j) − x_K(t_j)]2= m´ın {c_k} m

∑

j=1 [x(t_j) − K

∑

k=1 c_kφk(tj)]2= m´ın_c (x − cΦ)0(x − cΦ) (2.7) La solución al problema anterior es:

c = (Φ0Φ)−1Φ0x (2.8)

Base de Fourier. Debido al comportamiento periódico de nuestros datos hemos decidido usar para el suavizado una base de Fourier. La base ortonormal de Fourier en [0,T ] viene dada por:

{√1 T, cos(2πt_T ) p T/2 , cos(4πt_T ) p T/2 , . . . , sen(2πt_T ) p T/2 , sen(4πt_T ) p T/2 , . . .} (2.9)

(21)

2.2 Obtención de las curvas 7

A partir de la base obtendremos el desarrollo de Fourier de la función, truncado para un cierto K, como:

x(t) =c0 T + 2 T K

∑

k=1 [c_kcos(2kπt T ) + c 0 ksen( 2kπt T )] (2.10)

Parámetro de suavizado. La solución del problema de optimización 2.7, dada por 2.8, es óptima desde el punto de vista del sesgo, aunque no desde la óptica de la varianza. El sesgo está relacionado con la calidad del ajuste, mientras que la varianza lo está con las propiedades funcionales de la expansión. La reducción del sesgo y la varianza son fundamentales en cualquier problema de estimación, aunque en la situación que nos ocupa tienen carácter contrapuesto, y la reducción de uno de ellos conlleva el aumento del otro. Así, un suavizado con alto nivel de ajuste será muy rugoso, mientras que, por el contrario, la disminución de la varianza irá en detrimento de la calidad del ajuste.

Para solucionar este problema, O’Sullivan [10] introduce una corrección en el problema de optimización 2.7 que penaliza la segunda derivada de la expansión, formulando el problema como:

m´ın c (x − cΦ) 0 (x − cΦ) + λ Z T 0 (Φ 00_c)2_dt _(2.11)

siendo λ el parámetro de penalización o suavizado. La expansión del suavizado vendrá dada por una función x_K,λ(t).

Para la obtención de λ se usa normalmente el criterio de validación cruzada generalizada (GCV) [2]. El criterio GCV obtiene el valor de λ optimizando:

m´ın λ GCV= m−1 m

∑

j=1 _x(t j) − xK,λ(tj) 1 − Traza((S)/m 2 (2.12) Tanto para la obtención de las curvas, como para la aplicación de los procedimientos de análisis funcional, usaremos las librerías fda y fda.usc del software R. La aplicación del criterio GCV para obtener tanto el número de elementos de la base, K, como el parámetro de suavizado, λ , se hace con la funciónmin.basis de la librería fda.usc. Una vez obtenidos K y λ , las representaciones funcionales de las curvas se consiguen con las funcionessmooth.basis y smooth.basisPar de la librería fda. Como ilustración del procedimiento, la Figura 2.1, muestra las curvas suavizadas de la Flexión de la Cadera para las cuatro combinaciones posibles.

Figura 2.1 Curvas suavizadas de la Flexión de la Cadera. La unidad de soporte es 0.01 segundos. Pierna izquierda a la izquierda y Método A arriba..

Para analizar la calidad de los ajustes se obtendrá el error cuadrático medio (ECM). Los valores obtenidos son ECM_MetAIzq= 0.005, ECM_MetADer= 0.05, ECM_MatBIzq= 0.01 y ECM_MetBDer= 0.03. El tamaño de estos errores se reparte entre las curvas de los individuos de la manera que indican los diagramas de barras

(22)

8 Capítulo 2. Metodología

Tabla 2.1 Errores cuadráticos medios de suavizado.

Pierna derecha Pierna izquierda Movimiento Articulación Método A Método B Método A Método B

Flexión Cadera 0.005 0.05 0.01 0.03 Abducción Cadera 0.02 0.04 0.018 0.012 Rotación Cadera 0.018 0.011 0.014 0.011 Flexión Rodilla 0.05 0.048 0.016 0.03 Abducción Rodilla 0.052 0.049 0.043 0.057 Rotación Rodilla 0.0008 0.001 0.0006 0.0003 Flexión Tobillo 0.034 0.091 0.061 0.062 Inversión Tobillo 0.049 0.027 0.065 0.047 Rotación Tobillo 0.018 0.015 0.03 0.023

(Figura 2.2). Se observa como el individuo S10 destaca en ambos gráficos del Método A, mientras que los individuos peor ajustados del Método B son el S3 y el S8.

Figura 2.2 Diagramas de barras de los ECM.

En la Tabla 2.1 se detallan todos los errores de suavizado expresados en grados. El rango de errores va desde 3 diezmilésimas a 65 milésimas de grado. Podemos concluir que el nivel de ajuste conseguido con la base de Fourier es bastante bueno.

La Figura 2.1, muestra las curvas suavizadas de la Flexión de la Cadera. Puede observarse el comporta-miento diferencial de las curvas para para cada variable funcional. En general, el patrón de comportacomporta-miento de los 11 individuos en las cuatro gráficas es bastante parecido, aunque hay diferencias evidentes entre ellos. El estudio de esas diferencias es lo que nos va a permitir explicar el comportamiento del proceso aleatorio. El objetivo que nos proponemos es describir el proceso a partir de las 11 realizaciones que tenemos de él.

(23)

3 Análisis exploratorio funcional

3.1 Estadísticos univariables y bivariables.

Detallaremos en primer lugar como se definen las características principales de los estadísticos funcionales básicos de una muestra de una variable aleatoria funcional. Supongamos que se dispone de una muestra de n realizaciones, x₁(t), x₂(t),...,x_n(t), de una variable aleatoria funcional, X (t),t ∈ [0,T ].

Lafunción media muestral se define como:

x(t) = n−1 n

∑

i=1

x_i(t), ∀t ∈ [0,T ] (3.1)

Es decir, la función media muestral es la media, punto a punto, dentro del intervalo [0,T ] de las n funciones muestrales. La media muestral x(t) es continua y el estimador ideal de la media poblacional, ˜µX= x(t).

Por otra parte, definimos lafunción cuasi-varianza muestral de X, o simplemente varianza muestral, como: S2_x(t) = 1 n− 1 n

∑

i=1 (x_i(t) − x(t))2, ∀t ∈ [0,T ] (3.2) Para cada t, la función varianza muestral evalúa las desviaciones al cuadrado entre las x_i(t) y su función media x(t). S2_x(t) es continua y el estimador ideal de la varianza poblacional, ˜σ_X2= S2_x(t).

La Figura 3.1 muestra el comportamiento muestral de la flexión de la cadera para cada uno de las cuatro variables funcionales. En naranja, Pierna izquierda-Método A, en azul, Pierna derecha-Método A, en magenta, Pierna izquierda-Método B, y en verde, Pierna derecha-Método B. Se puede ver como las medias de cada método son prácticamente iguales y que entre los métodos hay una diferencia de 9 grados, aproximadamente. La forma en todos los casos es similar a una campana de Gauss y estiman de forma eficiente a las respectivas medias de la variable funcional. En cuanto a las desviaciones típicas, las distribuciones del Método A son más homogéneas, como se puede apreciar a simple vista en la 2.1, tomando valores en torno a 3-4 grados más pequeños a lo largo del intervalo; sin embargo, la forma de las curvas de desviación se emparejan más en función de la pierna que del método.

Lafunción covarianza intra-puntos muestral de la variable funcional X en dos puntos genéri-cos t y s del intervalo [0,T ] es:

Cov_x(t,s) = 1 n− 1 n

∑

i=1 (x_i(t) − x(t))(x_i(s) − x(s)), (t,s) ∈ [0,T ] × [0,T ], (3.3)

obviamente se tiene que Cov_x(t,t) = S2_x(t).

La función covarianza intra-puntos nos permitirá medir el promedio de las covarianzas para cada par de puntos, dentro del intervalo soporte, de la muestra considerada. Por otra parte,

S= {Cov_x(t,s), (t,s) ∈ [0,T ] × [0,T ]} (3.4) nos da la superficie de covarianzas de las funciones suavizadas muestrales.

(24)

10 Capítulo 3. Análisis exploratorio funcional

Figura 3.1 Medias y desviaciones típicas funcionales.

Para poder interpretar el tamaño de la relación entre pares de puntos definimos lafunción de correlación lineal intra-puntos muestral:

Cor_x(t,s) =_pCovx(t,s) S2

x(t)S2x(s)

(3.5) La correlación-intrapuntos muestral es el estimador ideal de la correlación intra-puntos poblacional, ˜

ρ_x(t_r,t_s) = Cor_x(t_r,t_s). La correlación intra-puntos nos permitirá medir el promedio de correlaciones, para la muestra considerada, para cada par de puntos dentro del intervalo soporte. Es evidente que Cor_x(t,t) = 1.

Por otra parte, R = {Cor_x(t,s), ∀(t,s) ∈ [0,T ] × [0,T ]} nos da la superficie de las auto-correlaciones de las funciones suavizadas muestrales. Las superficies de auto-covarianzas y de auto-correlaciones juegan el mismo papel que la matriz de varianzas-covarianzas y la matriz de correlaciones en análisis de datos multivariantes vectorial. Es decir, las autocovarianzas o las autocorrelaciones recogen toda la de información o, lo que es lo mismo, la variabilidad que contienen nuestros datos sobre el proceso aleatorio funcional.

Interpretación de la autocorrelación. La última frase hace especialmente importante interpretar las ecuaciones 3.3 y 3.5. En nuestro caso, olvidándonos del denominador que solo actúa como normalizador, se trata de la suma de 11 productos, uno para cada curva. Para que un producto de dos términos como:

(x_i(t) − x(t))(x_i(s) − x(s)) (3.6)

dé positivo, o los dos términos son positivos o los dos términos son negativos. Es decir, o x_iestá por encima de su media en t y por encima de su media en s, o en ambos puntos está por debajo de la media; en definitiva, conserva la posición respecto a la media. Por otra parte, para que el producto sea negativo, x_idebe encontrarse por encima de la media en uno de los puntos y por debajo en el otro. Cada producto aporta un término que puede ser positivo o negativo, si se imponen los términos positivos la covarianza (correlación) será positiva y, si no, negativa. La correlación será grande cuando la mayoría de las curvas conservan la posición respecto a la media (no se cruzan al pasar de t a s), y llegará a valer 1 si además conservan la distancia relativa a la media. La correlación será grande, pero negativa cuando la mayoría de las curvas cambien de posición respecto a la media (se cruzan al pasar de t a s), y llegará a valer menos −1 si conserva la distancia relativa a la media pero cambiada de signo.

En la Figura 3.2 se representa la superficie de autocorrelaciones de la variable Flexión de la Cadera Izquierda-Método A. Una manera más cómoda de interpretar la información que nos proporciona la superficie R es mediante las curvas de contorno de la función de autocorrelación, cuyos valores están normalizados.

La Figura 3.3 muestra la gráfica de contornos. Ramsay en [13] indica que la interpretación de las superficies en perspectiva y de los contornos no son fáciles. La referencia que hay que tener es la diagonal que se extiende desde la esquina inferior izquierda a la superior derecha en el contorno o de adelante hacia atrás en la gráfica de perspectiva de la superficie, con forma de cresta, donde las correlaciones valen la unidad. Las direcciones perpendiculares a la cresta de correlación unitaria indican la rapidez con que la correlación se cae cuando dos valores del argumento tiempo se separan. Por ejemplo, uno podría ubicar una posición a lo largo

(25)

3.1 Estadísticos univariables y bivariables. 11

Figura 3.2 Superficie de autocorrelaciones de la Flexión de la Cadera Izquierda-Método A. de la cresta de la unidad asociada con el valor de argumento t = t₁= t₂, y luego moverse perpendicularmente desde este punto. De esta forma se muestra lo que sucede con la correlación entre los valores en el par de tiempo (t − δ ,t + δ ) y cómo la distancia perpendicular δ aumenta.

Figura 3.3 Gráfico de contornos de la Flexión de la Cadera Izquierda-Método A.

Hay que tener en cuenta en nuestro caso que en el instante inicial, t = 0, el ángulo de la cadera izquierda es mínimo y que el máximo se alcanza aproximadamente en el centro del intervalo, t ' 50. Una gran parte de la superficie de correlación se encuentra por encima del nivel 0.9, lo cual indica que las posiciones relativas de las curvas a lo largo de todo el ciclo son muy estables. Por otro lado, los ángulos de la cadera muestran una correlación que a medida que avanza el ciclo se hace de rango más larga, los contornos cada vez están más cerca. No obstante, las curvas son bastante paralelas, lo que indica que el movimiento es bastante estacionario. La correlación depende básicamente de la distancia a la diagonal principal, es decir, de la diferencia |t₁− t₂|, independientemente del momento del ciclo en que nos encontremos. Podemos concluir que el movimiento de la cadera es bastante estable. Veremos las diferencias que se producen con la Flexión de la rodilla. La Figura 3.4 muestra la superficie de autocorrelaciones de la Flexión de la Rodilla Izquierda-Método A y la Figura 3.5 muestra las líneas de contorno de la Flexión de la Rodilla Izquierda-Método A.

Al igual que con la cadera, en la rodilla el instante inicial coincide con el ángulo mínimo de flexión de la rodilla izquierda y el máximo se alcanza en el centro del intervalo. Aunque las curvas siguen preservando la

(26)

Figura 3.4 Superficie de autocorrelaciones de la Flexión de la Rodilla Izquierda-Método A. posición relativa, los niveles de correlación caen un poco, hasta niveles de 0.75 en el centro de los cuatro laterales del cuadrado soporte. En comparación con la cadera, los ángulos de la rodilla presentan una menor estabilidad. Al principio y al final del ciclo la correlación cae muy rápido, lo contrario que en el centro donde los cambios de correlación son mucho más lentos. Los ángulos de la rodilla presentan menor estacionariedad que los de la cadera, posiblemente porque es una articulación que depende más de factores externos, como el talón, mientras que la cadera actúa bajo un control muscular mucho más uniforme durante todo el ciclo.

Figura 3.5 Gráfico de contornos de la Flexión de la Rodilla Izquierda-Método A.

Covarianza y Correlación cruzadas. Supongamos ahora que nos interesa analizar la relación entre dos variables funcionales, X e Y , de una población, para lo que se dispone de una muestra de tamaño n de la variable aleatoria funcional bidimensional (X ,Y ), dada por [(x₁(t),y₁(t)), (x₂(t),y₂(t)),

..., (x_n(t),y_n(t))], se define lafunción covarianza muestral cruzada en los puntos t,s ∈ [0,T] como:

Cov_x,y(t,s) = 1 n− 1 n

∑

i=1 (x_i(t) − x(t))(y_i(s) − y(s)) (3.7) La función covarianza cruzada relaciona dos variables aleatorias en base a un diferimiento temporal, y lo hace como un promedio para el conjunto de individuos del producto de las desviaciones entre las funciones y

(27)

sus medias, en cada variable.

Normalizando la covarianza anterior se obtiene lafunción de correlación muestral cruzada en los puntos t,s ∈ [0,T ] como:

r_x,y(t,s) = _qCovx,y(t,s) S2

x(t)Sy2(s)

(3.8)

Analizaremos las tres correlaciones cruzadas de los ángulos de flexión.

Cadera-Rodilla. La Figura 3.6 nos ofrece las curvas suavizadas, se observa un comportamiento más estable en las curvas de la cadera, mientras que las curvas de la rodilla aumentan claramente la variabilidad en la mitad y al final del ciclo. Da la sensación de que los movimientos de la rodilla anteceden a los de la cadera.

Figura 3.6 Curvas suavizadas de la Flexión de la Cadera (FCIA) y de la Flexión de la Rodilla (FRIA). Pierna Izquierda-Método A.

La interpretación de la correlación cruzada se basa en la misma idea que hemos desarrollado antes para explicar la autocorrelación. Básicamente nos indica como varían de manera conjunta dos variables aleatorias funcionales. La Figura 3.7 muestra que el mayor acoplamiento entre la variación de los ángulos de cadera y rodilla se da cuando 20 < t₁< 70 y 30 < t₂< 50, con correlaciones por encima de 0.7; hay un máximo próximo al punto (60,40) con r ' 0.8. Mientras que los mínimos, alrededor de r = 0.4, se alcanzan cuando 10 < t₁< 40 y 60 < t₂< 80. En todo caso, se mantiene una relación positiva fuerte entre cadera y rodilla en toda el cuadrado soporte.

Cadera-Tobillo. La Figura 3.8 nos ofrece las curvas suavizadas, se observa un comportamiento más estable en las curvas de la cadera, mientras que las curvas del Tobillo aumentan claramente la variabilidad en la mitad y al final del ciclo. Da la sensación de que los movimientos del Tobillo anteceden a los de la cadera. La Figura 3.9 nos indica una incorrelación muy clara en todo el cuadrado soporte, los valores más altos de correlación apenas llega a 0.2 en valor absoluto. Aunque seguiremos analizando en detalle está relación, en el ciclo de pedaleo la Cadera y el Tobillo se comportan de manera independiente.

(28)

Figura 3.7 Gráfico de contornos de la Flexión de la Cadera y de la Flexión de la Rodilla Izquierda-Método A.

Figura 3.8 Curvas suavizadas de la Flexión de la Cadera (FCIA) y de la Flexión del Tobillo (FTIA). Pierna Izquierda-Método A.

Rodilla-Tobillo. La Figura 3.10 nos ofrece las curvas suavizadas, se observa un comportamiento más estable y regular en las curvas de la Rodilla, mientras que las curvas del Tobillo aumentan claramente la variabilidad a partir de la mitad del ciclo.

La Figura 3.9 nos indica un nivel medio-bajo de correlación en todo el cuadrado soporte. Aparte de eso, lo más destacable es que cuando t₁se desplaza entre 20 y 80, la correlación aumenta de manera constante e inversa, pasando de r = −0.2 a r = −0.6.

En el próximo epígrafe profundizaremos un poco más en el análisis de los modos de variabilidad a través del Análisis de Componentes Principales Funcional bidimensional.

(29)

Figura 3.9 Gráfico de contornos de la Flexión de la Cadera y de la Flexión del Tobillo Izquierda-Método A.

Figura 3.10 Curvas suavizadas de la Flexión de la Rodilla (FRIA) y de la Flexión del Tobillo (FTIA). Pierna Izquierda-Método A.

(30)

(31)

4 Componentes Principales Funcionales

(FPCA)

4.1 Componentes Principales: del caso vectorial al funcional

En Rp, si X = (v₁|v₂|...|v_p) son los vectores de las mediciones de las variables originales centradas en el origen, mediante el Análisis de componentes principales (PCA) se obtendrá una nueva base ortonormal del espacio formada por las componentes principales, c₁, c₂,...,c_p, de forma que se verifica que c0_jc_k= 0( j6=k) y c0_jc_j= 1. Además, las componentes están jerarquizadas en función de su varianza –cantidad de información que contienen de los individuos– Var(c₁) ≥ Var(c₂) ≥ ,...,Var(c_p−1) ≥ Var(c_p). Para la componente c_kse trata de encontrar un vector de pesos, ξk= (ξk1, . . . ,ξk p), de forma que:

c_k= ξk1v1+ ξk2v2+ ... + ξk pvp (4.1)

PCA en términos de producto escalar. Las coordenadas principales del individuo x_i, o lo que es lo mismo la proyección del individuo en las nuevas componentes, pueden expresarse a través del producto escalar como: c_ik= p

∑

j=1 ξ_{k j}x_{i j}= hξk,xii, k= 1, . . . ,K; i= 1, . . . ,n (4.2)

• Si imponemos que la primera componente debe tener varianza máxima y norma uno, se tendría en formato de producto escalar:

m´ax ξ1

∑

i

hξ1,xii2 s.a. hξ1,ξ1i = ||ξ1||2= 1

(4.3)

• Para la componente k-ésima, añadiendo la condición de ortogonalidad: m´ax ξk

∑

i hξk,xii2 s.a. hξk,ξki = 1 hξk,ξk0i = 0, ∀k0< k (4.4)

En formato de producto escalar los individuos pueden expresarse en el espacio proyectado como:

x_i= p

∑

k=1 hξk,xiiξk (4.5) 17

(32)

18 Capítulo 4. Componentes Principales Funcionales (FPCA)

La expresión (4.3) podemos expresarla matricialmente como: máx ξ0ξ =1 ξ0XtXξ = máx ξ0ξ =1 hξ X, ξ Xi = máx ξ0ξ =1 hξ , Xt_{Xξ i = máx} ξ0ξ =1 hξ , Vξ i (4.6)

Al ser V semidefinida positiva, este problema de optimización puede resolverse encontrando las soluciones del problema de diagonalización:

Vξ = λ ξ (4.7)

Además, la secuencia de soluciones de este problema (λj,ξj){ j=1,··· ,p}satisface la ecuación (4.6) con la restricción adicional de que el autovector ξjes ortogonal a los ξ1, . . . ,ξj−1, encontrados con anterioridad. Por tanto, el problema de encontrar las componentes principales en el caso multivariante es equivalente a resolver el problema de diagonalización (4.7).

4.1.1 Del caso vectorial al matricial a través del esquema de dualidad

Para extender el problema de obtener las componentes principales al caso funcional(ACPF) es conveniente ver la matriz de datos X desde la perspectiva de una aplicación, antes que como un conjunto de puntos medidos en un espacio de variables. Desde esta óptica, se facilita la transición del caso multivariable al funcional, puesto que solo debemos cambiar sumatorios por integrales. Lo que sigue es una adaptación, bastante fidedigna, del trabajo de Ramsay titulado When the data are functions, del año 1982 [20].

Caso matricial. Supongamos que X representa una matriz de datos observados, x_{i j}, i = 1, · · · ,n, j = 1, · · · ,p. X puede verse como un operador entre dos espacios vectoriales, E y F, de dimensiones respectivas py n, de forma que cada uno de ellos tiene definido un producto interno, he_j, e_ki y h f_j, f_ki, y están dotados de una base ortonormal. El espacio E es el espacio de los individuos, mientras que F es el espacio de las variables.

Las aplicaciones que representa X son:

• X : E → F, que transforma un vector e ∈ E de la forma f = Xe. Si consideramos que E está generado por n vectores x_i, entonces se verifica que:

f_i= he,x_ii y f = he,Xi (4.8)

es decir, al aplicar el operador X sobre un elemento de su espacio, e, se obtiene un vector del espacio F cuya componente i-ésima mide el ángulo que forma e con xi. El operador X aplicado sobre los vectores canónicos del espacio E genera trivialmente las coordenadas de las magnitudes originales, v_i. • Xt: F → E, que transforma un vector f ∈ F de la forma e = Xtf. Si consideramos que F está

conformado por p vectores v_i, entonces se verifica que:

e_i= hf,v_ii y e = hf,Xti (4.9)

es decir, al aplicar el operador Xtsobre un elemento de su espacio, f, se obtiene un vector del espacio E que viene dado como una combinación lineal de las xi ponderadas por las componentes de f. El operador Xtaplicado sobre los vectores canónicos del espacio F genera trivialmente los puntos originales, x_i. Por otra parte, la aplicación X y su traspuesta verifican que:

hf,Xei = hXt_f,ei _(4.10)

Desde esta óptica, elPCA se convierte en el problema de obtener una secuencia de vectores, ξ₁,ξ2, · · · con norma la unidad del espacio E, cuya transformación por el operador X tenga módulo máximo y sean ortogonales entre sí: m´ax ξj hXξ_j,Xξ_ji s.a. ||ξj||2= 1 hξj,ξki = 0 ∀k < j (4.11)

(33)

4.1 Componentes Principales: del caso vectorial al funcional 19

Además de las dos anteriores aplicaciones obtenidas a partir de X, esta también determina otras dos aplicaciones que transforman un espacio en sí mismo, resultantes de las composiciones de las anteriores. Veremos la que nos interesa.

• V = Xt◦ X : E → E. Cuando las columnas de X están centradas en cero, (n − 1)−1V es la matriz de varianzas covarianzas de X. A partir de 4.11, elPCA puede expresarse como:

m´ax ξ hξ ,Xt_{Xξ i = m´ax} ξ hξ ,Vξ i s.a. ||ξ ||2_{= 1} hξ_j,ξ_ki = 0 ∀k < j (4.12)

Cuya solución son los autovectores de V.

Caso funcional. En el caso funcional la aplicación X tiene dimensión n × ∞, el espacio E es el espacio de los individuos, de dimensión infinita, representado por n funciones x_i(t) definidas en un intervalo finito [0,T ], mientras que el espacio F es, generalmente, un espacio tiempo de dimensión n. Los dos espacios quedan caracterizados por:

• Supongamos que E es un espacio de dimensión infinita, que representa un proceso aleatorio {X (t) : t∈ [0,T ]}, del cual se dispone de una muestra aleatoria de n funciones x_i(t). El producto escalar entre dos funciones del espacio E viene dado por:

he_j,e_ki =

Z T

0

e_j(t)e_k(t)dt (4.13)

El producto escalar es una medida de la relación entre dos elementos del espacio.

• F es el espacio tiempo, de dimensión n. Cualquier punto t ∈ [0,T ] está representado en este espacio por un vector (x₁(t),x₂(t), · · · ,x_n(t))0

Las aplicaciones definidas ahora por la “matriz” de datos X son:

• X : E → F, que transforma una función e(t) ∈ E en un vector f de F. Por equivalencia con (4.8), la coordenada i-ésima de f es igual a:

f_i= he,x_ii =

Z T

0

x_i(t)e(t)dt (4.14)

es decir, al aplicar el operador X sobre un elemento, e(t), de su espacio se obtiene un vector del espacio F cuya componente i-ésima mide el ángulo que forma e(t) con x_i(t). Si e(t) es ortogonal a algunas de las x_i(t) las componentes correspondientes serán nulas.

• Xt: F → E, que transforma un vector f ∈ F en una función de E:

e(t) = Xtf = n

∑

i=1

f_ix_i(t) (4.15)

es decir, al aplicar el operador Xtsobre un elemento, f, de su espacio se obtiene una curva del espacio E que viene dada como una combinación lineal de las xi(t) ponderados por las componentes de f. El operador Xtaplicado sobre los vectores canónicos del espacio F genera trivialmente las curvas originales, x_i(t). Es fácil ver que hXe,fi = he,Xtfi.

(34)

Desde esta óptica, el Análisis funcional de componentes principales (FPCA) se convierte en el problema de obtener una secuencia de curvas, ξ1(t),ξ2(t), · · · de norma unitaria del espacio E, cuya transformación por el operador X tenga módulo máximo y sean ortogonales entre sí:

m´ax ξj hXξ_j,Xξ_ji s.a. ||ξ_j||2_{= 1} hξj,ξki = 0 ∀k < j (4.16)

Al igual que en el caso matricial, obtendremos la aplicación endomórfica de interés que determina la aplicación X. • V = Xt◦ X : E → E. Componiendo, se tendrá: V(e(t)) = n

∑

i=1 x_i(t)[ Z T 0 x_i(u)e(u)du] = Z T 0 [ n

∑

i=1 x_i(t)x_i(u)]e(u)du (4.17)

V posee una estructura del tipo R

K(t,u)e(u)du, siendo K(t,u) el núcleo de la transformación V. Obsérvese que K(t,u)/(n − 1) es la covarianza intrapuntos del conjunto de funciones que determinan E.

A partir de 4.16, elFPCA puede expresarse como: m´ax ξj hξ_j,XtXξ_ji = m´ax ξj hξ_j,Vξ_ji s.a. ||ξj||2= 1 hξ_j,ξ_ki = 0 ∀k < j (4.18)

Cuyas soluciones son las autofunciones de V, que se obtienen resolviendo la ecuación integral de Fredholm: (V ξ )(t) =

Z T 0

K(u,t)ξ (u)du = hK(t,·), ξ i = λ ξ (t) (4.19) Cada autofunción viene acompañada de su autovalor asociado, que están ordenados de mayor a menor, indicando la inercia de su autofunción. Según el Teorema de Mercer, el núcleo K(t,u) admite el desarrollo:

K(t,u) = ∞

∑

i=1

λ_iξ_i(t)ξ_i(u) (4.20)

Por otra parte, cualquier función e(t) puede expresarse, siguiendo el desarrollo de Karhunen-Loève, como: e(t) =

∞

∑

i=1

b_iξ_i(t) (4.21)

La serie anterior converge en media cuadrática en [0,T ] y los b_ise definen como: b_i= hξ_i,e_ii =

Z T 0

ξ_i(t)e(t)dt donde los b_irepresenta la proyección de e(t) en la i-ésima autofunción.

ElFPCA permite expresar el conjunto de funciones muestrales, definidas en un espacio vectorial L2, como una combinación lineal de un número finito defunciones propias, haciendo una extrapolación del caso puntual. La contrapartida de los individuos, x_i= (x_i1, . . . ,x_ip)_i=1,...,n, del caso puntual son ahora funciones x_i(t)_i=1,...,n, en el que el subíndice j, que identificaba la medición del individuo i-ésimo en la variable j-ésima (x_{i j}), ha sido reemplazado por el índice continuo t, que nos da información de la evolución de una magnitud a largo de un intervalo [0,T ].

Teniendo en cuenta (4.21), las funciones originales x_i(t) pueden estimarse en función de la base constituida por las K primeras funciones principales como:

e x_i(t) = K

∑

k=1 b_ikξ_k(t) = K

∑

k=1 ( Z T 0 ξ_k(t)x_i(t)dt)ξk(t), i= ,1, . . . ,n (4.22)

(35)

siendo b_ikla proyección de la curva observada x_i(t) en la i-ésima función principal. Dicho de otra manera,x_e_i(t) es la proyección ortonormal de la curva x_i(t) en el subespacio conformado por las K primeras componentes principales.

El número máximo de componentes funcionales que pueden obtenerse es el mínimo entre n − 1, número de curvas menos uno, y el número de funciones base que hallamos usado para realizar el suavizado de las curvas.

Con elFPCA queremos ver qué modos subyacentes de variación hay en los datos y cuáles de ellos son im-portantes. Un análisis de componentes principales proporciona una forma de ver la estructura de covarianzas que aporta más información que un examen directo de la superficie de varianzas-covarianzas; la primera componente principal suele ser una componente de tamaño que, básicamente, recoge el comportamiento de la media funcional para el conjunto de los individuos, pero la segunda y posteriores componentes, que podríamos denominar de forma, ofrecen aspectos muy interesantes y sutiles del comportamiento diferencial de los individuos a lo largo del ciclo.

Queremos saber cuántos de estos modos de variación son necesarios para lograr una aproximación satisfactoria a los datos originales. Se puede suponer que mantener solo los modos dominantes mejorará la relación señal/ruido de la información restante; en este sentido el FPCA se comporta como un filtro. Por lo general, queremos saber qué representan estos modos en términos que podamos explicar en lenguaje coloquial. Precisamente, para mejorar la interpretación de las componentes se suele relajar la condición de ortogonalidad mediante una rotación de los componentes principales, lo que provoca una redistribución de la carga explicativa de las componentes.

4.1.2 FPCA de los Ángulos de Flexión de las tres articulaciones

En este bloque obtendremos las componentes principales funcionales de los ángulos de flexión de Cadera, Rodilla y Tobillo. Se representarán las tres primeras componentes como perturbaciones o vibraciones de la media. La primera componente se corresponderá en los tres casos con una componente de tamaño y permitirá una ordenación de los individuos, las otras dos componentes, denominadas en el caso vectorial como componentes de forma, las identificaremos en al campo funcional como “modos de variación” del proceso aleatorio.

FPCA Flexión Cadera Izquierda Método A La Figura 4.1 representa las tres primeras componentes de la Flexión de la Cadera izquierda Método A. Es muy claro el comportamiento lineal de PC1, cuadrático de PC2 y cúbico de PC3.

Figura 4.1 Armónicos de la Flexión de la cadera izquierda. Método A.

Representando componentes como perturbaciones de la media. Un método que resulta útil para interpretar las componentes es examinar el efecto que produce sumar y restar un múltiplo adecuado de las mismas, ξ_i, a la media funcional, ¯x± 0.2Cξ_i1_{. El efecto que produce en el gráfico es como el de una} vibración de la media. En la Figura 4.2 se puede observar el gráfico de las curvas suavizadas y los tres

1_{Donde C =}p

T−1|| ˆµ − ¯µ || y ¯µ =RTT12

ˆ

µ (t)dt. La constante C se justifica porque antes de construir las componentes principales se normalizan las curvas

(36)

gráficos de perturbaciones para la variable. PC1 recoge un 94.8 %, PC2 un 3.1 % y PC3 un 1.7 % del total. Entre las tres retienen un 99.6 % de la variabilidad total.

Figura 4.2 Vibraciones de la media con las componentes principales de la Flexión de la Cadera. Puede verse como la primera componente tiene el efecto de sumar/restar una constante a la media. Es una componente de tamaño que diferencia a los individuos en función de su mayor o menor apertura angular. La componente dos diferencia entre individuos con comportamiento más suave (curvas más planas) y los que tienden a concentrar el cambio angular en el centro del ciclo (mayor apuntamiento en las curvas), además, las curvas más planas presentan una mayor simetría. Por último, la componente tres diferencia entre las curvas con comportamiento simétrico, centradas en t = 50 y las que están ligeramente tumbadas a la derecha, que alcanzan el máximo en t = 60.

Figura 4.3 Proyección de las curvas sobre el plano principal.

La Figura 4.3 ofrece la proyección de los individuos sobre el plano principal (PC1-PC2), dicho plano recoge el 97.9 % de la variabilidad total del proceso, por lo que refleja un comportamiento muy exacto de las curvas. La posición de un individuo nos permite caracterizarlo. Por ejemplo, el Sujeto2 es el de menor apertura angular y un nivel medio de apuntamiento y el Sujeto8 el de mayor apertura pero con forma más plana. Por otra parte, el Sujeto11 se relaciona con la segunda curva en apertura y la de mayor apuntamiento. Podemos confirmar lo anterior identificando las curvas destacadas, como se hace en la Figura 4.4.

Rotación de las componentes. La rotación de las componentes en un análisis multivariante tiene por objeto vincular cada componente a unas pocas variables originales, al objeto de facilitar la interpretación

(37)

Figura 4.4 Identificación de individuos singulares. Sujeto8=Naranja, Sujeto11=Azul, Sujeto2=Verde. de las mismas, lo que produce una redistribución de la variabilidad, perdiendo peso la primera componente. En el caso funcional se tendría una interpretación parecida, aunque los cambios, en lugar de establecerse en términos de vinculación a las variables originales, se miden en relación al tamaño de las vibraciones en las distintas zonas del intervalo soporte. Así, la primera componente, que suele recoger un porcentaje muy alto de variabilidad y se interpreta como una componente de tamaño, cede en la rotación una gran parte de su inercia y se convierte en una componente que recoge un modo local de variación. Es decir, después de la rotación la primera componente deja de diferenciar entre curvas en función de su “tamaño”. La rotación más usual es la denominadavarimax, que es una rotación ortogonal, por lo que las componentes siguen sin compartir información. Puede observarse que, una vez rotadas, la primera componente deja de tener un comportamiento lineal, corta a la media, lo que antes no ocurría, y la vibración de dicha componente cambia de sentido en el intervalo soporte.

Figura 4.5 Armónicos de la Flexión de la Cadera Izquierda-Método A, con rotación Varimax. En la Figura 4.5 se representan los armónicos varimax de la flexión de la cadera izquierda, Método A. Vemos como la primera componente ha perdido su carácter lineal, de hecho tiene un comportamiento simétrico a la componente 3; ambas tienen forma de polinomio cúbico, mientras que la segunda componente, en rojo, sigue conservando su carácter cuadrático.

El análisis de los tres gráficos de perturbaciones de la Figura 4.6 confirma una de las consecuencias de la rotación comentada un par de párrafos antes. La componente PC1 pierde la hegemonía y pasa a recoger un 27.8 % de variabilidad, la PC2 pasa de un 3.1 a un 36.8 % y la PC3 de un 1.7 a un 34.9 %. Entre las tres siguen reteniendo un 99.5 % de la variabilidad total. La componente PC1 nos muestra un modo de variación que diferencia a las curvas por su diferente comportamiento en la segunda mitad del ciclo, en simetría casi perfecta con la PC3, que hace lo mismo pero en la primera mitad del ciclo. La componente PC2 diferencia

(38)

Figura 4.6 Vibraciones de la media con las componentes rotadas de la Flexión de la Cadera. entre las curvas en función de sus comportamientos en los extremos del ciclo.

Figura 4.7 Proyección de las curvas sobre el plano rotado PC1-PC2.

El hecho de que se haya producido la redistribución de inercias tan extrema, hace que ahora la proyección de individuos en el plano PC1-PC2 (Figura 4.7), que suma el 64.6 % de información, sea menos relevante que la proyección en el plano PC2-PC3 (Figura 4.8), que recoge un 71.7 % de variabilidad. El Plano PC1-PC3 (Figura 4.9) explica un 62.7 % de variabilidad.

La rotación de las componentes solo tiene la función de ayudarnos a interpretar mejor los modos de variación. No hay obligación de quedarse con la solución rotada si ésta no ayuda a comprender mejor el comportamiento de nuestro proceso aleatorio funcional.

FPCA Flexión Rodilla Izquierda Método A. La Figura 4.10 representa las tres primeras componentes de la Flexión de la rodilla izquierda Método A. Es muy claro el comportamiento lineal de PC1, cuadrático de PC2 y cúbico de PC3.

En la Figura 4.11 se puede observar el gráfico de las curvas suavizadas y los tres gráficos de perturbaciones para la variable. PC1 recoge un 90.9 %, PC2 un 7.1 % y PC3 un 1.6 % del total. Entre las tres retienen un 99.6 % de la variabilidad total.

Puede verse como la primera componente tiene el efecto de sumar/restar una constante a la media. Es una componente de tamaño, diferencia los individuos en función de su mayor o menor apertura angular. La componente dos diferencia entre individuos con comportamiento más suave (curvas más planas) y los que

(39)

Figura 4.10 Armónicos de la Flexión de la Rodilla Izquierda-Método A.

tienden a concentrar el cambio angular en el centro del ciclo (mayor apuntamiento en las curvas). Por último. la componente tres diferencia entre las curvas que están ligeramente tumbadas a la derecha y las que lo están a la izquierda.

La Figura 4.12 ofrece la proyección de los individuos sobre el plano principal (PC1-PC2), dicho plano recoge el 98 % de la variabilidad total del proceso, por lo que refleja un comportamiento muy exacto de las

(40)

Figura 4.11 Vibraciones de la media con las componentes principales de la Flexión de la Rodilla.

Figura 4.12 Proyección de las curvas sobre el plano principal. curvas.

Rotación de las componentes. En la Figura 4.13 se representan los armónicos varimax de la flexión de la rodilla izquierda, Método A. Vemos como la primera componente ha perdido su carácter lineal, mientras que la segunda componente sigue conservando la forma parabólica.

El análisis de los tres gráficos de perturbaciones de la Figura 4.14 confirma una de las consecuencias de la rotación comentada un par de párrafos antes. La componente PC1 pierde la hegemonía y pasa a recoger un 32.3 % de variabilidad, la PC2 pasa de un 7.1 a un 36.7 % y la PC3 de un 1.6 a un 30.5 %. Entre las tres siguen reteniendo un 99.6 % de la variabilidad total.

El hecho de que se haya producido la redistribución de inercias tan extrema, hace que ahora la proyección de individuos en el plano PC1-PC2 (Figura 4.15), contenga el 69 % de información, el plano PC2-PC3 (Figura 4.16) recoge un 62.8 % de variabilidad, mientras que el Plano PC1-PC3 (Figura 4.17), se convierte en el segundo en importancia al explicar un 67.2 % de variabilidad.

FPCA Flexión Tobillo Izquierdo Método A La Figura 4.18 representa las tres primeras componentes de la Flexión de la tobillo izquierda Método A. PC1 tiene comportamiento lineal, PC2 cuadrático y PC3 cuártico.

(41)

Figura 4.13 Armónicos de la Flexión de la Rodilla Izquierda-Método A, con rotación Varimax.

Figura 4.14 Vibraciones de la media con las componentes rotadas de la Flexión de la Rodilla.

En la Figura 4.19 se puede observar el gráfico de las curvas suavizadas y los tres gráficos de perturbaciones para la variable. PC1 recoge un 86.6 %, PC2 un 8.2 % y PC3 un 2.9 % del total. Entre las tres retienen un

(42)

Figura 4.18 Armónicos de la Flexión de la tobillo izquierda. Método A. 97.7 % de la variabilidad total.

La primera componente tiene el efecto de sumar/restar una constante a la media. De nuevo es una componente de tamaño, diferenciando los individuos en función de su mayor o menor apertura angular. La componente dos diferencia entre individuos con comportamiento más plano y los más apuntados. Por último, la componente tres establece una diferencia de unos 20 grados en los dos grupos de individuos que identifica.

(43)

Figura 4.19 Vibraciones de la media con las componentes principales de la Flexión del Tobillo.

Figura 4.20 Proyección de las curvas sobre el plano principal.

La Figura 4.20 ofrece la proyección de los individuos sobre el plano principal (PC1-PC2), dicho plano recoge el 94.8 % de la variabilidad total del proceso.

Rotación de las componentes. En la Figura 4.21 se representan los armónicos varimax de la flexión de la tobillo izquierda, Método A.

El análisis de los tres gráficos de perturbaciones de la Figura 4.22 muestra como la componente PC1 pierde la hegemonía y pasa a recoger un 35 % de variabilidad, la PC2 pasa de un 8.2 a un 38 % y la PC3 de un 2.9 a un 24.7 %, redistribuyéndose de nuevo la inercia. Entre las tres siguen reteniendo un 97.7 % de la variabilidad total.

El hecho de que se haya producido la redistribución de inercias, hace que ahora la proyección de individuos en el plano PC1-PC2 (Figura 4.23) sume el 73 % de información, el 62.7 % en el plano PC2-PC3 (Figura 4.24) y el 59.7 % el Plano PC1-PC3 (Figura 4.25).

En resumen, el nivel de inercia recogido por las primeras componentes va desde el 94.8 % en la cadera hasta el 86.6 % del tobillo, pasando por el 90.4 % de la rodilla. La conclusión que podemos sacar de aquí es que a medida que la articulación tenga más “grados de libertad” tendrá más modos de variación y por lo tanto el porcentaje de explicación de la componente tamaño disminuirá. Sumando los porcentajes explicados por las tres primeras componentes se obtiene un 99.6 % para cadera y rodilla y un 97.7 % para el tobillo, pudiendo ser interesante en este último caso investigar un cuarto modo de variación. La rotación de las componentes ha provocado en los tres casos una redistribución bastante equitativa de cargas, perdiendo la