• No se han encontrado resultados

5. Control inteligente assisted-as-needed

5.3.1. Subsistema de predicci´ on biomec´ anica

Con el fin de emular los anteriormente descritos forward models, que permiten llevar a cabo la asistencia anticipatoria perseguida, el algoritmo de control assisted-as-needed

ha sido dise˜nado con un subsistema de predicci´on biomec´anica que, considerando tanto el perfil disfuncional del paciente como la AVD que este se encuentra ejecutando, realiza una estimaci´on de la evoluci´on biomec´anica del sujeto en cuesti´on. Esta predicci´on es posteriormente evaluada para determinar si el paciente necesita o no de la aplicaci´on de un comando motor.

La Figura 5.5 muestra el diagrama de bloques del susbsistema de predicci´on biomec´ani- ca propuesto, el cual consta de los siguientes m´odulos:

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Generador de la trayectoria del EE: estimaci´on de la trayectoria de la mano

Soluci´on al PCI:obtenci´on de la evoluci´on biomec´anica partiendo de la trayectoria tridimensional sint´etica

Adaptaci´on al perfil disfuncional: aplicaci´on de una funci´on de modificaci´on a la evoluci´on angular anteriormente calculada en funci´on de las caracter´ısticas dis- funcionales del paciente

Figura 5.5:Diagrama de bloques del subsistema de predicci´on biomec´anica

5.3.1.1. Generaci´on de la trayectoria del EE

La primera etapa para la estimaci´on de la evoluci´on de la configuraci´on biomec´anica que llevar´a a cabo el paciente dado su estado actual y la AVD que se encuentra ejecutando consiste en el c´alculo de la trayectoria tridimensional que seguir´a el EE de la ES (la mano) para alcanzar el objetivo. Para realizar este c´alculo se parte de las coordenadas tridimensionales actuales en las que se encuentra el EE (resolviendo el PCD tal y como se expuso en el Cap´ıtulo 4) y de aquellas en las cuales se supone que ´este ha de permanecer cuando finalice la acci´on.

Esta estimaci´on se realiza aplicando un algoritmominimum-jerk [169], el cual se basa en que los movimientos punto a punto no restringidos siguen, aproximadamente, per- files de velocidades tangenciales con forma de campana. Este modelo te´orico se basa ´

unicamente en la cinem´atica del movimiento, obviando la vertiente din´amica del siste- ma musculoesquel´etico, por lo que s´olo es correcto cuando la formulaci´on se realiza en t´erminos del movimiento de la mano en el espacio extracorporal.

Para la descripci´on de este comportamiento motor, se emplea teor´ıa de optimizaci´on din´amica, de tal forma que se define una funci´on expresada como la integral en el tiempo de un ´ındice de desempe˜no. El principal desaf´ıo es, por lo tanto, la selecci´on de dicha funci´on objetivo, para lo cual diversos resultados experimentales llevados a cabo han sido utilizados, llegando a la conclusi´on de que la maximizaci´on de la suavidad del movimiento

5.3. Material y metodolog´ıa

el cual se define como la variaci´on de la aceleraci´on (Ecuaci´on 5.1).

J = 1 2 Z t 0 ((d 3x dt3) + ( d3y dt3))dt (5.1)

La metodol´og´ıa descrita para el c´alculo de la trayectoria del EE ha sido aplicada previamente en el campo de la rob´otica aplicada a la rehabilitaci´on en trabajos como [145, 146, 148, 152, 170].

5.3.1.2. Resoluci´on del Problema Cinem´atico Inverso

Con el fin de obtener la evoluci´on biomec´anica asociada a la trayectoria del EE obte- nida tras la aplicaci´on de un algoritmo de minimum-jerk, se necesita de un sistema de resoluci´on del PCI (explicado en el Cap´ıtulo 4) con requisitos de tiempo real, debido a su entorno de aplicaci´on.

El PCI es, por lo general, una operaci´on algebraica no lineal sobre la que se ha demos- trado que para el caso general de un sistema de 6 GdLs se requiere encontrar la soluci´on a una ecuaci´on polin´omica de orden 16 [171]. En otras palabras, el PCI consiste en una transformaci´on desde el espacio de coordenadas general al del propio manipulador.

De forma diferente al caso de las transformaciones lineales, no existen algoritmos gen´ericos que den soluci´on al PCI. La soluci´on puede ser abordada utilizando diferen- tes metodolog´ıas: cerradas, num´ericas y aproximaciones iterativas. Los m´etodos cerrados son, en la mayor´ıa de las ocasiones, complejos de manejar desde un punto de vista al- gebraico e implican una alta carga computacional; adem´as, estas aproximaciones no son factibles para todas las clases de manipuladores, ya que en ocasiones el PCI no cuenta con una soluci´on ´unica [172]. Para manipuladores cuyas estructuras cinem´aticas no pue- den ser resueltas por m´etodos cerrados, existen aproximaciones num´ericas que tratan de dar soluci´on al problema, sin embargo, estas t´ecnicas presentan el problema tanto de la convergencia como de la alta carga computacional que conllevan, por lo que su utilizaci´on en sistemas con requisitos de tiempo real no es posible [173]. Por su parte, las aproxi- maciones iterativas s´ı son adecuadas para su incorporaci´on en sistemas que trabajan en tiempo real ya que implican una carga computacional baja; estos m´etodos se fundamen- tan principalmente en sistemas de Redes Neuronales Artificiales (RNAs) [174] y Artificial Neuro-Fuzzy Inference Systems (ANFIS) [175].

Se pueden encontrar muchas aproximaciones basadas en RNAs en la literatura cient´ıfi- ca que intentan dar soluci´on al PCI, sin embargo, ninguna de ellas se centra en la ES humana. Kuroe et al. [173] propusieron un m´etodo de aprendizaje para una RNA mul- ticapa de tal forma que la red representara las relaciones existentes entre velocidades y posiciones entre los sistemas de coordenadas de la tarea y articular en un manipulador con 2 GdLs de manera simultanea. Daunicht [176] introdujo el concepto DEFAnet, consis- tente en una red de 4 capas con realimentaci´on hacia adelante validada en un espacio de trabajo restringido y reducido. Tejomurtula y Kak [177] propusieron una RNA para resol- ver el PCI de un manipulador con 2 segmentos y 3 GdLs sin necesidad de entrenamiento. Por otro lado, Karlik y Aydin [171] presentaron una RNA multicapa con realimentaci´on hacia adelante capaz de obtener la configuraci´on biomec´anica de un manipulador de 6 GdLs partiendo tanto de las coordenadas cartesianas como de la orientaci´on de su EE

Cap´ıtulo 5. Control inteligenteassisted-as-needed

tras un entrenamiento con un conjunto de datos de gran tama˜no. Mart´ın et al. [178] propusieron un m´etodo de aprendizaje para un manipulador multisegmento consistente en neurocontroladores evolutivos que fue validado sobre un robot SCARA de 3 GdLs. Finalmente, Hasan et al. [179] presentaron una soluci´on al jacobiano cinem´atico de un manipulador de 6 GdLs empleando una RNA completamente interconectada con una ´uni- ca capa oculta, la cual, partiendo de la posici´on cartesiana, la orientaci´on y la velocidad del EE calcula tanto la configuraci´on angular de cada articulaci´on como las velocidades angulares asociadas.

Tambi´en existen trabajos en los que aparecen aproximaciones basadas en l´ogica difusa para dar soluci´on al PCI. Howard y Zilouchian [180] y Wei et al. [181] proporcionaron una soluci´on basada en ANFIS para manipuladores de 3 y 2 GdLs. Shen et al. [182] propusieron un sistema difuso autoconfigurable capaz de encontrar soluci´on al PCI de un manipulador planar de 2 GdLs. Para finalizar, en un estudio reciente, Alavandar y Nigam [183, 184] presentaron una soluci´on basada en ANFIS para manipuladores de 2 y 3 GdLs obteniendo errores aceptables.

Tras el estudio del estado de la t´ecnica al respecto y teniendo en cuenta los requi- sitos asociados a la aplicaci´on sobre la cual se pretende integrar esta soluci´on al PCI, se han evaluado exhaustivamente 2 alternativas: una soluci´on basada en un Perceptr´on Multicapa (PMC) y otra basada en la tecnolog´ıa ANFIS.

Debido a que los pacientes que han sufrido en episodio de DCA suelen sufrir de es- pasticidad (rigidez debida a hipertonia muscular) en la ES [185], la informaci´on sobre la orientaci´on en el espacio del EE para una posici´on ha sido omitida ya que, en muchas ocasiones, no es consistente con el conjunto de datos de entrenamiento del que se dispone (basado en movimientos sanos). De esta forma, para la resoluci´on del PCI ´unicamente se requerir´a, a diferencia de algunos trabajos de entre los revisados, informaci´on relativa a la configuraci´on biomec´anica del sujeto.

Soluci´on basada en PMCs

Una RNA es una herramienta computacional muy utilizada para la resoluci´on de mul- titud de problemas complejos del mundo real. Su atractivo reside en su gran capacidad en el manejo de la informaci´on, su no linealidad, su alto paralelismo, su tolerancia tanto a errores como a ruido y su capacidad para la generalizaci´on y el aprendizaje. Estas estruc- turas pueden ser definidas como una interconexi´on densa de unidades de procesamiento simples denominadas neuronas, las cuales act´uan conjuntamente como un procesador paralelo y distribuido masivo que, debido a su similitud estructural con el cerebro hu- mano, presenta una propensi´on natural para almacenar conocimiento experimental, el cual queda disponible para su utilizaci´on.

Una neurona artificial recibe como entradas los est´ımulos de su entorno y las combina de tal forma que consigue una entrada neta, la cual es pasada a trav´es de una puerta de umbral cuya salida es reenviada bien hacia otra neurona, bien hacia el exterior a trav´es de una determinada funci´on de transferencia. ´Unicamente cuando la entrada neta supera el umbral, la neurona se activa.

5.3. Material y metodolog´ıa

tegrables. Un particularizaci´on de estas redes son los PMCs, cuyas caracter´ısticas m´as relevantes son su habilidad para aprender partiendo de un conjunto de entrenamiento reducido, su alta velocidad de c´alculo y su facilidad de implementaci´on. Por tanto, el PMC es la arquitectura de red neuronal m´as utilizada [186, 187].

El aprendizaje por retropropagaci´on es uno de los m´as populares para el entrenamiento de los PMCs [188,189]. El t´ermino retropropagaci´on hace referencia a la manera en la que el error computado a la salida de la red vuelve hacia atr´as pasando por las capas ocultas hacia la capa de entrada. El algoritmo de entrenamiento [190] consiste en la b´usqueda de una superficie de error (como funci´on de los pesos de la red) utilizando el descenso del gradiente para los puntos cuyo error es m´ınimo. Cada iteraci´on consta de 2 etapas: activaci´on hacia adelante para producir una soluci´on y propagaci´on hacia atr´as del error calculado para la modificaci´on de los pesos.

Una red de retropropagaci´on es, por tanto, un PMC formado por una capa de entrada cuyos nodos representan la variables de entrada al problema, una capa de salida donde los nodos son las variables dependientes y una o m´as capas ocultas que contienen los nodos que soportan la captura de la no linealidad de los datos. Mediante la utilizaci´on de aprendizaje supervisado, estas redes pueden aprender equivalencias entre dos espacios diferentes, lo cual es el objetivo perseguido.

Abordar el PCI mediante la utilizaci´on de un PMC presenta 2 problemas principales: la selecci´on de la arquitectura m´as adecuada (n´umero de nodos y de capas ocultas) y la generaci´on de un conjunto de datos de entrenamiento ´optimo [190]. En cualquier caso, se puede encontrar una descripci´on m´as en profundidad tanto de RNAs en general como de PMCs en particular en [174].

La arquitectura propuesta para una soluci´on al PCI mediante un PMC se muestra en la Figura 5.6. La red est´a formada por 3 neuronas en la capa de entrada (ya que se necesita una neurona por cada coordenada cartesiana del EE) y un n´umero de neuronas en la capa de salida equivalente al n´umero de GdLs que considere el modelo biomec´anico. Por otro lado, tanto el n´umero de capas ocultas como las neuronas presentes en ellas han de ser determinadas de manera experimental. Se propone la utilizaci´on de aprendizaje por retropropagaci´on ya que proporciona a este tipo de redes de neuronas una mejor habilidad para establecer correspondencias entre los patrones de entrada y las salidas correspondientes [171]. Como funci´on de activaci´on se ha seleccionado una tangente hi- perb´olica sigmoidal para las neuronas de las capas ocultas y una funci´on lineal para las de la capa de salida.

Soluci´on basada en ANFIS

Una red adaptativa ANFIS consiste en nodos conectados a trav´es enlaces direccionales. Parte de los nodos que las conforman son adaptativos, es decir, su salida depende de sus propios par´ametros, los cuales son modificados en funci´on de una determinada regla de aprendizaje para minimizar una funci´on de error espec´ıfica. Las f´ormulas que describen las funciones de los nodos pueden variar de nodo a nodo, dependiendo su selecci´on de la funci´on entrada-salida global que se quiere que represente la red. Es importante destacar que los enlaces entre nodos ´unicamente indican el flujo de las se˜nales entre nodos, no tienen pesos asociados.

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Figura 5.6:Arquitectura propuesta para la soluci´on al PCI basada en un PMC

Estos sistemas pueden ser catalogados como sistemas de inferencia difusos utilizados para componer un modelo Sugeno [191] basado en una red neuronal adaptativa que adopta la regla si x1 es Ai1 y x2 es Ai2, entonces y =fi(x1, x2). La parte correspondiente a la

condici´on de la regla es difusa, pero la conclusi´on es, generalmente, una funci´on lineal cuantificable (por ejemplo y=fi(x1, x2) = aix1+bix2+ci). De esta forma, utilizando un

m´etodo de media ponderada, se calcula la salida del sistema.

La Figura 5.7 muestra un ejemplo de estructura de una red ANFIS que cuenta con 2 entradas y una ´unica salida. Los nodos con forma cuadrangular son adaptativos mientras que los circulares son fijos. El significado de cada nodo en funci´on de su localizaci´on es el siguiente:

Capa 1: nodos adaptativos con una funci´on de pertenencia

Capa 2: nodos fijos que multiplican las se˜nales de entrada y las env´ıan el producto hacia el exterior

Capa 3: nodos fijos que calculan la relaci´on de la fuerza de activaci´on de la regla i-´esima y la suma de las fuerzas de activaci´on de todas las reglas

Capa 4: nodos adaptativos que denotan funciones ponderadas

Capa 5: el nodo fijo de esta capa computa la salida como la suma de todas sus se˜nales de entrada

La regla de aprendizaje b´asica de estos sistemas se basa en el descenso del gradiente y la regla de la cadena, algoritmo lento por lo general y propenso a estancarse en m´ınimos locales. Por esta raz´on, el mecanismo de aprendizaje m´as extendido para este tipo de sistemas es una t´ecnica h´ıbrida neuro-difusa que combina el m´etodo del gradiente con una estimaci´on de m´ınimos cuadrados para la identificaci´on de par´ametros. Este m´etodo h´ıbrido hace que los sistemas de inferencia difusos puedan contar con el aprendizaje propio de las redes neuronales utilizando conjuntos de entrenamiento.

5.3. Material y metodolog´ıa

Figura 5.7:Ejemplo de estructura de un sistema ANFIS

Figura 5.8:Arquitectura propuesta para la soluci´on al PCI basada en un sistema ANFIS

el modelo biomec´anico, donde cada capa recibe a su entrada las coordenadas cartesianas que describen la posici´on del EE. A su salida, cada red proporciona el dato biomec´ani- co correspondiente de tal forma que en global se cuente con la soluci´on completa. El n´umero de funciones de pertenencia de cada red ANFIS se ha determinado de manera experimental.

5.3.1.3. Adaptaci´on al perfil disfuncional

El uso de estrategias compensatorias por parte de los pacientes puede estar relacionado con el grado de afectaci´on motora; los pacientes cuyos d´eficits se consideran de severos a moderados realizan compensaciones, mientras que los que cuentan con una afectaci´on leve emplean patrones de movimiento que pueden ser considerados como sanos [192]. Cuando un paciente intenta realizar un movimiento, la reacci´on natural consiste en compensar con las estrategias motoras que a´un tiene disponibles, explotando la redundancia de la ES y creando, por tanto, sinergias motoras patol´ogicas [192–194].

Cap´ıtulo 5. Control inteligenteassisted-as-needed

Debido a la ausencia de modelos de movimiento disfuncionales en la literatura cient´ıfica para describir de manera precisa como un paciente o un grupo de pacientes realizan los movimientos, en este trabajo se propone la utilizaci´on de modelos individualizados para cada paciente, los cuales son creados con la siguiente metodolog´ıa:

1. An´alisis de los GdLs afectados cuando el paciente ejecuta un movimiento sin asis- tencia

2. Evaluaci´on exhaustiva de las compensaciones biomec´anicas principales

La primera fase de la metodolog´ıa de modelado de AVDs descrita en el Cap´ıtulo 3 (generaci´on de diagramas de estados) ha sido aplicada en este punto con el objetivo de realizar un an´alisis lo m´as exhaustivo posible del movimiento de los pacientes. De esta forma, para cada AVD que el paciente realiza, se obtiene un diagrama que representa los estados y las transiciones por las que este ha de pasar. Como modelos de movimiento sanos de referencia tambi´en se han utilizado los obtenidos en el Cap´ıtulo 3 de la presente tesis doctoral, donde se han empleado un n´umero m´ınimo de 40 sujetos por motivos de significatividad estad´ıstica [45]. De esta forma, cada GdL del modelo cuenta con 3 componentes: el patr´on biomec´anico asociado y los l´ımites inferior y superior debidos a la variabilidad intersujeto.

La adaptaci´on de la evoluci´on biomec´anica al perfil disfuncional del paciente se lleva a cabo de manera independiente para cada GdL calculando una funci´on de transferencia entre el movimiento patr´on y el realizado por el paciente en una sesi´on previa del mismo ejercicio. Existen 3 posibles alternativas para dicha funci´on: el GdL afectado se modela mediante una funci´on polin´omica, mediante una operaci´on de offset, o directamente no se aplica modelado debido a que no existe afectaci´on.

La Figura 5.9 muestra la plantilla de la estructura que representa el modelo disfuncio- nal del paciente: las posiciones 3 y 4 son utilizadas para identificar las compensaciones (si el GdL bajo estudio compensa a cualquier otro, la posici´on 3 contendr´a un flag a 1, si por el contrario, es compensado, la posici´on 3 contendr´a un flag a 0 y la posici´on 4 apuntar´a al GdL que le compensa); la posici´on 5 indica mediante un flag si el paciente no es capaz de realizar el movimiento a velocidad normal; la posici´on 6 muestra c´omo se ha de realizar la adaptaci´on (un 0 indica que no se ha de realizar adaptaci´on, un 1 indica una adaptaci´on por offset y un 2 una polin´omica); finalmente, las posiciones finales (de la 7 a la 10) contienen los par´ametros propios de la adaptaci´on.

Figura 5.9:Plantilla de estructura del perfil disfuncional

El algoritmo de adaptaci´on es el siguiente:

Seleccionar un GdL

5.3. Material y metodolog´ıa

if El paciente necesita realimentaci´on de fuerzas then

Buscar GdLs compensados

No realizar adaptaci´on, ya que la compensaci´on no va a ser permitida

else

Buscar GdLs compensados

Adaptar la evoluci´on en funci´on del perfil disfuncional