Subsistema de predicci´ on biomec´ anica - Control inteligente assisted-as-needed

5. Control inteligente assisted-as-needed

5.3.1. Subsistema de predicci´ on biomec´ anica

Con el fin de emular los anteriormente descritos forward models, que permiten llevar a cabo la asistencia anticipatoria perseguida, el algoritmo de control assisted-as-needed

ha sido diseñado con un subsistema de predicción biomecánica que, considerando tanto el perfil disfuncional del paciente como la AVD que este se encuentra ejecutando, realiza una estimación de la evolución biomecánica del sujeto en cuestión. Esta predicción es posteriormente evaluada para determinar si el paciente necesita o no de la aplicación de un comando motor.

La Figura 5.5 muestra el diagrama de bloques del susbsistema de predicción biomecáni- ca propuesto, el cual consta de los siguientes módulos:

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Generador de la trayectoria del EE: estimaci´on de la trayectoria de la mano

Solución al PCI:obtención de la evolución biomecánica partiendo de la trayectoria tridimensional sintética

Adaptación al perfil disfuncional: aplicación de una función de modificación a la evolución angular anteriormente calculada en función de las caracter´ısticas disfuncionales del paciente

Figura 5.5:Diagrama de bloques del subsistema de predicci´on biomec´anica

5.3.1.1. Generaci´on de la trayectoria del EE

La primera etapa para la estimación de la evolución de la configuración biomecánica que llevará a cabo el paciente dado su estado actual y la AVD que se encuentra ejecutando consiste en el cálculo de la trayectoria tridimensional que seguirá el EE de la ES (la mano) para alcanzar el objetivo. Para realizar este cálculo se parte de las coordenadas tridimensionales actuales en las que se encuentra el EE (resolviendo el PCD tal y como se expuso en el Cap´ıtulo 4) y de aquellas en las cuales se supone que éste ha de permanecer cuando finalice la acción.

Esta estimaci´on se realiza aplicando un algoritmominimum-jerk [169], el cual se basa en que los movimientos punto a punto no restringidos siguen, aproximadamente, per- files de velocidades tangenciales con forma de campana. Este modelo te´orico se basa ´

unicamente en la cinemática del movimiento, obviando la vertiente dinámica del sistema musculoesquelético, por lo que sólo es correcto cuando la formulación se realiza en términos del movimiento de la mano en el espacio extracorporal.

Para la descripción de este comportamiento motor, se emplea teor´ıa de optimización dinámica, de tal forma que se define una función expresada como la integral en el tiempo de un ´ındice de desempeño. El principal desaf´ıo es, por lo tanto, la selección de dicha función objetivo, para lo cual diversos resultados experimentales llevados a cabo han sido utilizados, llegando a la conclusión de que la maximización de la suavidad del movimiento

5.3. Material y metodolog´ıa

el cual se define como la variación de la aceleración (Ecuación 5.1).

J = 1 2 Z t 0 ((d 3_x dt3) + ( d3_y dt3))dt (5.1)

La metodológ´ıa descrita para el cálculo de la trayectoria del EE ha sido aplicada previamente en el campo de la robótica aplicada a la rehabilitación en trabajos como [145, 146, 148, 152, 170].

5.3.1.2. Resoluci´on del Problema Cinem´atico Inverso

Con el fin de obtener la evolución biomecánica asociada a la trayectoria del EE obte- nida tras la aplicación de un algoritmo de minimum-jerk, se necesita de un sistema de resolución del PCI (explicado en el Cap´ıtulo 4) con requisitos de tiempo real, debido a su entorno de aplicación.

El PCI es, por lo general, una operación algebraica no lineal sobre la que se ha demos- trado que para el caso general de un sistema de 6 GdLs se requiere encontrar la solución a una ecuación polinómica de orden 16 [171]. En otras palabras, el PCI consiste en una transformación desde el espacio de coordenadas general al del propio manipulador.

De forma diferente al caso de las transformaciones lineales, no existen algoritmos genéricos que den solución al PCI. La solución puede ser abordada utilizando diferentes metodolog´ıas: cerradas, numéricas y aproximaciones iterativas. Los métodos cerrados son, en la mayor´ıa de las ocasiones, complejos de manejar desde un punto de vista al- gebraico e implican una alta carga computacional; además, estas aproximaciones no son factibles para todas las clases de manipuladores, ya que en ocasiones el PCI no cuenta con una solución única [172]. Para manipuladores cuyas estructuras cinemáticas no pueden ser resueltas por métodos cerrados, existen aproximaciones numéricas que tratan de dar solución al problema, sin embargo, estas técnicas presentan el problema tanto de la convergencia como de la alta carga computacional que conllevan, por lo que su utilización en sistemas con requisitos de tiempo real no es posible [173]. Por su parte, las aproximaciones iterativas s´ı son adecuadas para su incorporación en sistemas que trabajan en tiempo real ya que implican una carga computacional baja; estos métodos se fundamen- tan principalmente en sistemas de Redes Neuronales Artificiales (RNAs) [174] y Artificial Neuro-Fuzzy Inference Systems (ANFIS) [175].

Se pueden encontrar muchas aproximaciones basadas en RNAs en la literatura cient´ıfi- ca que intentan dar solución al PCI, sin embargo, ninguna de ellas se centra en la ES humana. Kuroe et al. [173] propusieron un método de aprendizaje para una RNA multicapa de tal forma que la red representara las relaciones existentes entre velocidades y posiciones entre los sistemas de coordenadas de la tarea y articular en un manipulador con 2 GdLs de manera simultanea. Daunicht [176] introdujo el concepto DEFAnet, consistente en una red de 4 capas con realimentación hacia adelante validada en un espacio de trabajo restringido y reducido. Tejomurtula y Kak [177] propusieron una RNA para resol- ver el PCI de un manipulador con 2 segmentos y 3 GdLs sin necesidad de entrenamiento. Por otro lado, Karlik y Aydin [171] presentaron una RNA multicapa con realimentación hacia adelante capaz de obtener la configuración biomecánica de un manipulador de 6 GdLs partiendo tanto de las coordenadas cartesianas como de la orientación de su EE

Cap´ıtulo 5. Control inteligenteassisted-as-needed

tras un entrenamiento con un conjunto de datos de gran tamaño. Mart´ın et al. [178] propusieron un método de aprendizaje para un manipulador multisegmento consistente en neurocontroladores evolutivos que fue validado sobre un robot SCARA de 3 GdLs. Finalmente, Hasan et al. [179] presentaron una solución al jacobiano cinemático de un manipulador de 6 GdLs empleando una RNA completamente interconectada con una úni- ca capa oculta, la cual, partiendo de la posición cartesiana, la orientación y la velocidad del EE calcula tanto la configuración angular de cada articulación como las velocidades angulares asociadas.

También existen trabajos en los que aparecen aproximaciones basadas en lógica difusa para dar solución al PCI. Howard y Zilouchian [180] y Wei et al. [181] proporcionaron una solución basada en ANFIS para manipuladores de 3 y 2 GdLs. Shen et al. [182] propusieron un sistema difuso autoconfigurable capaz de encontrar solución al PCI de un manipulador planar de 2 GdLs. Para finalizar, en un estudio reciente, Alavandar y Nigam [183, 184] presentaron una solución basada en ANFIS para manipuladores de 2 y 3 GdLs obteniendo errores aceptables.

Tras el estudio del estado de la técnica al respecto y teniendo en cuenta los requisitos asociados a la aplicación sobre la cual se pretende integrar esta solución al PCI, se han evaluado exhaustivamente 2 alternativas: una solución basada en un Perceptrón Multicapa (PMC) y otra basada en la tecnolog´ıa ANFIS.

Debido a que los pacientes que han sufrido en episodio de DCA suelen sufrir de es- pasticidad (rigidez debida a hipertonia muscular) en la ES [185], la información sobre la orientación en el espacio del EE para una posición ha sido omitida ya que, en muchas ocasiones, no es consistente con el conjunto de datos de entrenamiento del que se dispone (basado en movimientos sanos). De esta forma, para la resolución del PCI únicamente se requerirá, a diferencia de algunos trabajos de entre los revisados, información relativa a la configuración biomecánica del sujeto.

Soluci´on basada en PMCs

Una RNA es una herramienta computacional muy utilizada para la resolución de mul- titud de problemas complejos del mundo real. Su atractivo reside en su gran capacidad en el manejo de la información, su no linealidad, su alto paralelismo, su tolerancia tanto a errores como a ruido y su capacidad para la generalización y el aprendizaje. Estas estructuras pueden ser definidas como una interconexión densa de unidades de procesamiento simples denominadas neuronas, las cuales actúan conjuntamente como un procesador paralelo y distribuido masivo que, debido a su similitud estructural con el cerebro hu- mano, presenta una propensión natural para almacenar conocimiento experimental, el cual queda disponible para su utilización.

Una neurona artificial recibe como entradas los est´ımulos de su entorno y las combina de tal forma que consigue una entrada neta, la cual es pasada a través de una puerta de umbral cuya salida es reenviada bien hacia otra neurona, bien hacia el exterior a través de una determinada función de transferencia. Únicamente cuando la entrada neta supera el umbral, la neurona se activa.

5.3. Material y metodolog´ıa

tegrables. Un particularización de estas redes son los PMCs, cuyas caracter´ısticas más relevantes son su habilidad para aprender partiendo de un conjunto de entrenamiento reducido, su alta velocidad de cálculo y su facilidad de implementación. Por tanto, el PMC es la arquitectura de red neuronal más utilizada [186, 187].

El aprendizaje por retropropagación es uno de los más populares para el entrenamiento de los PMCs [188,189]. El término retropropagación hace referencia a la manera en la que el error computado a la salida de la red vuelve hacia atrás pasando por las capas ocultas hacia la capa de entrada. El algoritmo de entrenamiento [190] consiste en la búsqueda de una superficie de error (como función de los pesos de la red) utilizando el descenso del gradiente para los puntos cuyo error es m´ınimo. Cada iteración consta de 2 etapas: activación hacia adelante para producir una solución y propagación hacia atrás del error calculado para la modificación de los pesos.

Una red de retropropagación es, por tanto, un PMC formado por una capa de entrada cuyos nodos representan la variables de entrada al problema, una capa de salida donde los nodos son las variables dependientes y una o más capas ocultas que contienen los nodos que soportan la captura de la no linealidad de los datos. Mediante la utilización de aprendizaje supervisado, estas redes pueden aprender equivalencias entre dos espacios diferentes, lo cual es el objetivo perseguido.

Abordar el PCI mediante la utilización de un PMC presenta 2 problemas principales: la selección de la arquitectura más adecuada (número de nodos y de capas ocultas) y la generación de un conjunto de datos de entrenamiento óptimo [190]. En cualquier caso, se puede encontrar una descripción más en profundidad tanto de RNAs en general como de PMCs en particular en [174].

La arquitectura propuesta para una solución al PCI mediante un PMC se muestra en la Figura 5.6. La red está formada por 3 neuronas en la capa de entrada (ya que se necesita una neurona por cada coordenada cartesiana del EE) y un número de neuronas en la capa de salida equivalente al número de GdLs que considere el modelo biomecánico. Por otro lado, tanto el número de capas ocultas como las neuronas presentes en ellas han de ser determinadas de manera experimental. Se propone la utilización de aprendizaje por retropropagación ya que proporciona a este tipo de redes de neuronas una mejor habilidad para establecer correspondencias entre los patrones de entrada y las salidas correspondientes [171]. Como función de activación se ha seleccionado una tangente hi- perbólica sigmoidal para las neuronas de las capas ocultas y una función lineal para las de la capa de salida.

Soluci´on basada en ANFIS

Una red adaptativa ANFIS consiste en nodos conectados a través enlaces direccionales. Parte de los nodos que las conforman son adaptativos, es decir, su salida depende de sus propios parámetros, los cuales son modificados en función de una determinada regla de aprendizaje para minimizar una función de error espec´ıfica. Las fórmulas que describen las funciones de los nodos pueden variar de nodo a nodo, dependiendo su selección de la función entrada-salida global que se quiere que represente la red. Es importante destacar que los enlaces entre nodos únicamente indican el flujo de las señales entre nodos, no tienen pesos asociados.

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Figura 5.6:Arquitectura propuesta para la soluci´on al PCI basada en un PMC

Estos sistemas pueden ser catalogados como sistemas de inferencia difusos utilizados para componer un modelo Sugeno [191] basado en una red neuronal adaptativa que adopta la regla si x1 es Ai1 y x2 es Ai2, entonces y =fi(x1, x2). La parte correspondiente a la

condición de la regla es difusa, pero la conclusión es, generalmente, una función lineal cuantificable (por ejemplo y=fi(x1, x2) = aix1+bix2+ci). De esta forma, utilizando un

m´etodo de media ponderada, se calcula la salida del sistema.

La Figura 5.7 muestra un ejemplo de estructura de una red ANFIS que cuenta con 2 entradas y una única salida. Los nodos con forma cuadrangular son adaptativos mientras que los circulares son fijos. El significado de cada nodo en función de su localización es el siguiente:

Capa 1: nodos adaptativos con una funci´on de pertenencia

Capa 2: nodos fijos que multiplican las se˜nales de entrada y las env´ıan el producto hacia el exterior

Capa 3: nodos fijos que calculan la relación de la fuerza de activación de la regla i-ésima y la suma de las fuerzas de activación de todas las reglas

Capa 4: nodos adaptativos que denotan funciones ponderadas

Capa 5: el nodo fijo de esta capa computa la salida como la suma de todas sus se˜nales de entrada

La regla de aprendizaje básica de estos sistemas se basa en el descenso del gradiente y la regla de la cadena, algoritmo lento por lo general y propenso a estancarse en m´ınimos locales. Por esta razón, el mecanismo de aprendizaje más extendido para este tipo de sistemas es una técnica h´ıbrida neuro-difusa que combina el método del gradiente con una estimación de m´ınimos cuadrados para la identificación de parámetros. Este método h´ıbrido hace que los sistemas de inferencia difusos puedan contar con el aprendizaje propio de las redes neuronales utilizando conjuntos de entrenamiento.

5.3. Material y metodolog´ıa

Figura 5.7:Ejemplo de estructura de un sistema ANFIS

Figura 5.8:Arquitectura propuesta para la soluci´on al PCI basada en un sistema ANFIS

el modelo biomecánico, donde cada capa recibe a su entrada las coordenadas cartesianas que describen la posición del EE. A su salida, cada red proporciona el dato biomecáni- co correspondiente de tal forma que en global se cuente con la solución completa. El número de funciones de pertenencia de cada red ANFIS se ha determinado de manera experimental.

5.3.1.3. Adaptaci´on al perfil disfuncional

El uso de estrategias compensatorias por parte de los pacientes puede estar relacionado con el grado de afectación motora; los pacientes cuyos déficits se consideran de severos a moderados realizan compensaciones, mientras que los que cuentan con una afectación leve emplean patrones de movimiento que pueden ser considerados como sanos [192]. Cuando un paciente intenta realizar un movimiento, la reacción natural consiste en compensar con las estrategias motoras que aún tiene disponibles, explotando la redundancia de la ES y creando, por tanto, sinergias motoras patológicas [192–194].

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Debido a la ausencia de modelos de movimiento disfuncionales en la literatura cient´ıfica para describir de manera precisa como un paciente o un grupo de pacientes realizan los movimientos, en este trabajo se propone la utilizaci´on de modelos individualizados para cada paciente, los cuales son creados con la siguiente metodolog´ıa:

1. An´alisis de los GdLs afectados cuando el paciente ejecuta un movimiento sin asistencia

2. Evaluaci´on exhaustiva de las compensaciones biomec´anicas principales

La primera fase de la metodolog´ıa de modelado de AVDs descrita en el Cap´ıtulo 3 (generación de diagramas de estados) ha sido aplicada en este punto con el objetivo de realizar un análisis lo más exhaustivo posible del movimiento de los pacientes. De esta forma, para cada AVD que el paciente realiza, se obtiene un diagrama que representa los estados y las transiciones por las que este ha de pasar. Como modelos de movimiento sanos de referencia también se han utilizado los obtenidos en el Cap´ıtulo 3 de la presente tesis doctoral, donde se han empleado un número m´ınimo de 40 sujetos por motivos de significatividad estad´ıstica [45]. De esta forma, cada GdL del modelo cuenta con 3 componentes: el patrón biomecánico asociado y los l´ımites inferior y superior debidos a la variabilidad intersujeto.

La adaptación de la evolución biomecánica al perfil disfuncional del paciente se lleva a cabo de manera independiente para cada GdL calculando una función de transferencia entre el movimiento patrón y el realizado por el paciente en una sesión previa del mismo ejercicio. Existen 3 posibles alternativas para dicha función: el GdL afectado se modela mediante una función polinómica, mediante una operación de offset, o directamente no se aplica modelado debido a que no existe afectación.

La Figura 5.9 muestra la plantilla de la estructura que representa el modelo disfuncional del paciente: las posiciones 3 y 4 son utilizadas para identificar las compensaciones (si el GdL bajo estudio compensa a cualquier otro, la posición 3 contendrá un flag a 1, si por el contrario, es compensado, la posición 3 contendrá un flag a 0 y la posición 4 apuntará al GdL que le compensa); la posición 5 indica mediante un flag si el paciente no es capaz de realizar el movimiento a velocidad normal; la posición 6 muestra cómo se ha de realizar la adaptación (un 0 indica que no se ha de realizar adaptación, un 1 indica una adaptación por offset y un 2 una polinómica); finalmente, las posiciones finales (de la 7 a la 10) contienen los parámetros propios de la adaptación.

Figura 5.9:Plantilla de estructura del perfil disfuncional

El algoritmo de adaptaci´on es el siguiente:

Seleccionar un GdL

5.3. Material y metodolog´ıa

if El paciente necesita realimentaci´on de fuerzas then

Buscar GdLs compensados

No realizar adaptaci´on, ya que la compensaci´on no va a ser permitida

else

Buscar GdLs compensados

Adaptar la evoluci´on en funci´on del perfil disfuncional

In document Metodologías de modelado, monitorización y asistencia robótica en neurorrehabilitación funcional de extremidad superior (página 137-145)