• No se han encontrado resultados

II. 2 ¿Cómputo consciente de la actividad?

IV.3. Cadenas de Markov para estimar actividades

IV.3.1. Información contextual relevante para la inferencia

Se identificó que algunas de las variablse utilizas como entradas para entrenar la red no eran relevantes para la estimación de la actividad –por lo contrario en algunos casos el utilizarlas reducía la precisión. Es por ello, que se realizó un análisis más detallado para establecer que información era relevante para estimar la actividad utilizando modelos ocultos de Markov –hidden Markov model (HMM) por sus siglas en ingles. Este análisis requirió conducir varios experimentos con diferentes configuraciones de la información contextual utilizada para la estimación de actividad.

Análisis de sensibilidad para identificar la información contextual necesaria como entrada al algoritmo de reconocimiento de actividad

El análisis de sensibilidad involucró estudiar el impacto que tienen cada una de las variablse utilizas en el vector de entrada en la precisión del reconocimiento de actividad.

Capítulo IV – Estimación de actividades ejecutadas por el personal médico

_________________________________________________________________________________________________________ 85

La primera variable en ser analizada fue la hora del día. Una cadena de Markov se basa en eventos discretos, por lo que no es apropiado utilizar la hora del día para la estimación. Al realizar diferentes experimentos utilizando únicamente la hora del día como entrada para el reconocimiento de actividad, se obtuvo una reducción del 15% en la precisión. Esto puede ser parcialmente explicado ya que el trabajo hospitalario es altamente dinámico y las actividades no se ejecutan a una hora predefinida del día. Basados en estos resultados se decidió eliminar esta variable contextual del vector de entrada.

Otros experimentos se ejecutaron tomando en cuenta la información contextual restante de manera separada –incluyendo la localización, artefactos utilizados y personas involucradas. La Figura 19 muestra el error promedio resultante.

Figura 19. Porcentaje de error en el reconocimiento de actividad utilizando solamente información una variable contextual en la HMM

Como se ilustra en la figura, la variable de localización tiene el porcentaje de error más alto, 38% (en promedio), seguido del obtenido utilizando solo artefactos (23%) y finalmente, solo personas (13%). Esto puede ser parcialmente explicado ya que las actividades ejecutadas por el personal médico son en alta medida independientes de la localización del individuo que las ejecuta. Por ejemplo, las actividades relacionadas con un paciente (i.e., coordinación, cuidados al paciente, valoración y diagnóstico y preparación) se ejecutan normalmente en frente del paciente independientemente de la naturaleza de la actividad. Es por ello, que incluir esta información para entrenar el modelo puede

Capítulo IV – Estimación de actividades ejecutadas por el personal médico

_________________________________________________________________________________________________________ 86

incrementar confusión y por consiguiente reducir la precisión en el reconocimiento de la actividad.

En base a estos resultados, se decidió eliminar la hora del día y la localización del vector de entrada utilizado para entrenar la HMM. Adicionalmente, este análisis nos dejo ver que utilizar la información de manera separada para entrenar el modelo incrementa la precisión en la estimación. Por lo que, se decidió crear un modelo HMM en capas para aislar esta información.

Análisis de ocurrencia sobre los valores de las variables contextuales

Otro problema que encontramos al momento de crear el vector de entrada para el HMM fue su longitud. Si bien se tienen cuatro variables contextuales de entrada, el utilizar una codificación binaria para las variables de artefactos y personas incrementa este campo por el número de valores que pueda tomar, resultando en 36 unidades de entrada en total. Debido a que el modelo HMM utiliza matrices no es posible en la práctica manejar tantas unidades.

Con el fin de identificar las variables más relevantes para cada una de las actividades y reducir estos valores de entrada se realizó un análisis de frecuencia. Este análisis consistió en medir la moda de aparición para cada uno de los artefactos y agentes en cada una de las actividades. Si una variable aparecía menos de 20 veces por actividad, está era eliminada del HMM de ese rol. Por ejemplo, la variable de equipo de cómputo sólo aparece 5 veces para las enfermeras por lo tanto dicha variable se eliminó del vector de entrada. Además de este criterio otras variables se agruparon en una clasificación mayor. Por ejemplo, los médicos internos y los médicos de base se agruparon en la variable médicos.

Después de realizar la reducción, se realizaron diferentes pruebas para verificar que esta reducción no afecta la precisión en la estimación de actividad –estas pruebas se realizaron con las redes neuronales. La Figura 20 muestra el promedio de la aparición de todas las variables por actividad. El vector MAX contiene el promedio de ocurrencia de todas las variables capturadas durante la estudio. El vector INICIAL contiene el promedio de ocurrencia de las variablse utilizas como entradas para las redes neuronales. El vector CROP contiene el promedio de ocurrencia de las variables reducidas. Lo que buscábamos

Capítulo IV – Estimación de actividades ejecutadas por el personal médico

_________________________________________________________________________________________________________ 87

aquí era encontrar una configuración que permitiera al nuevo vector mantenerse entre el vector INICIAL y el vector MAX y a la vez manteniendo el mismo comportamiento. Como se muestra en la figura, el nuevo vector cumple con estas características e inclusive mejora el promedio de ocurrencia para la actividad de clases y capacitación. Después de este análisis logramos reducir el vector de entrada en un 57% (en promedio) –59% para enfermeras, 63% para médicos internos y 48% para médicos de base.

Figura 20. Promedio de ocurrencia de las variables contextuales en el vector de entrada

La relevancia de cada variable contextual se corraboró al realizar diferentes estimaciones con las NN utilizando el vector de entrada reducido y comparando los resultados con aquéllos realizados originalmente. Los resultados de la nueva estimación indicaron que la actividad del usuario se pudo estimar correctamente 71% de la veces. Dado que no hubo una gran diferencia entre la precisión en la estimación de actividad para ambos vectores se concluye que esta reducción tendría un efecto menor o no afectaría los experimentos realizados con HMM.

IV.3.2. Representación de los datos

Una vez que se tenía un claro entendimiento de la información contextual y las variables relevantes para modelar las actividades ejecutadas por el personal médico, se prepararon las muestras obtenidas del caso de estudio para realizar diferentes simulaciones con HMM.

Capítulo IV – Estimación de actividades ejecutadas por el personal médico

_________________________________________________________________________________________________________ 88

Similarmente a la transformación realizada con NN, se utilizó el esquema del estudio para codificar el reporte de observación y el esquema de la red para transformar estos códigos a valores vectoriales. La Figura 18 muestra ambos esquemas e ilustra cómo se realiza esta transformación de información cualitativa a etiquetas y de etiquetas a datos de un vector. La figura también muestra que el modelo de Markov utiliza como entrada únicamente la información de artefactos y personas, un vector de prioridad y una matriz de transición de estados –a diferencia de las redes neuronales.

Figura 21. Transformación del reporte de observación a entradas y salidas al modelo oculto de Markov (a) Reporte de observación (b) Vector de entrada al HMM

El vector de prioridad (i.e., el estado inicial de la distribución) representa la prioridad de ejecutar una actividad sobre el resto de las demás. Este vector puede verse como el porcentaje del tiempo que el personal médico invierte ejecutando diferentes tipos de actividades. Para calcular este vector se mide el tiempo total (por día por sujeto) que el personal médico invierte en las actividades a ser estimadas. La Figura 21c muestra el vector de prioridad de un médico de base. Como se muestra la actividad predominante ejecutada por los médicos es valoración y diagnóstico, mientras para internos es manejo de información y para enfermeras preparación.

Capítulo IV – Estimación de actividades ejecutadas por el personal médico

_________________________________________________________________________________________________________ 89

Similarmente, la matriz de transición se calculó a partir de la información obtenida del estudio. La matriz de transición de estados contiene las probabilidades de estar realizando una actividad o estar en un estado qi y pasar a otro estado qj. La Figura 21b muestra un

grafo de las transiciones de la ejecución de una actividad a otra por un médico de base.