2. Estado del arte
2.8. Conclusiones
A lo largo de las secciones anteriores, se han mostrado distintas variantes para cada aspecto que esta tesis abordará durante su desarrollo. Algunos de los enfoques existentes para capturar datos se mencionan en la sección 2.1. Para cada enfoque de captura se describen luego distintos dispositivos que los implementan en las secciones 2.2, 2.3, 2.4 y 2.5. Luego, en la sección 2.6, se mencionan herramientas de distinta envergadura que brindan soporte al desarrollo de software con reconocimiento de gestos. Por último, en la sección 2.77, se mencionan las técnicas de IA más conocidas, cuya función es entrenar una base de conocimiento a partir de la información capturada de los gestos y luego reconocer gestos con ella.
La variedad disponible de enfoques de captura que se mostró, indica que una herramienta para reconocer gestos debe ser capaz de soportar esa variedad. En ese sentido, el enfoque de reconocimiento de gestos que se presenta en esta tesis, provee soporte para múltiples fuentes de datos. Incluso, permite su extensión mediante la incorporación de nuevos enfoques de captura. Particularmente, de los enfoques de captura mostrados en la sección 2.1, esta tesis hará foco en el enfoque de visión y de medición inercial. La decisión está basada en el análisis realizado en la sección 2.1.5,
34 principalmente por la aplicabilidad que tienen ambos enfoques y la variedad de gestos que permiten. Además, el enfoque basado en señales eléctricas corporales posee también características muy prometedoras, sin embargo, su utilización en el reconocimiento de gestos no está aún tan difundido.
Luego, para cada enfoque de captura, se analizaron diversos dispositivos actuales que implementan esos enfoques, mostrando que los dispositivos móviles son los más prometedores. Por un lado, la mayoría de los enfoques de captura están contenidos nativamente por dispositivo móviles. Esto significa, que los propios dispositivos móviles ya proveen varios de los mecanismos encargados de capturar datos. En los casos que esto no sucede, por ejemplo, para las señales eléctricas corporales, existen adaptadores que permiten conectar el dispositivo de captura a dispositivos móviles. Esta posibilidad de conexión a dispositivos móviles, en general se repite para todos los dispositivos de captura. Además, es fundamental valorar la popularidad y aceptación que los dispositivos móviles tienen en la actualidad por las personas. Esto permite pensar, que su uso seguirá extendiéndose, produciendo un mercado interesante para el reconocimiento de gestos. Estas circunstancias, son las principales motivaciones para orientar esta tesis al contexto de los dispositivos móviles
Más adelante, se evaluaron herramientas que dan algún soporte al reconocimiento de gestos, en las cuales se notaron algunas falencias. En primer lugar, como puede verse en la sección 2.6.4, ninguna de las herramientas evaluadas soporta múltiples enfoques de captura. Esta característica, como se explicó, es bastante importante en el contexto actual. En segundo lugar, el soporte que brinda la mayoría de las herramientas simplifica el uso de la información provista por algún enfoque de captura, de manera que pueda utilizarse en el reconocimiento de gestos. Por ejemplo, brindando la inclinación que toma el cuerpo de una persona delante de una cámara o las posiciones de ciertas partes del cuerpo en un momento dado. Sin embargo, esa información de alto nivel respecto al movimiento de las personas, no es un enfoque de reconocimiento de gestos. Por lo tanto, estas herramientas requieren que los desarrolladores tengan conocimientos suficientes para implementar dicho enfoque en sus aplicaciones. Por otro lado, Android Gesture Recognition Tool provee un enfoque de reconocimiento de gestos. Aunque, es un enfoque que no puede personalizarse, por ejemplo, para optar por distintos algoritmos de reconocimiento. Además, posee el inconveniente de estar orientada a un solo enfoque de captura de datos.
A partir de las falencias en las herramientas actuales y del análisis del contexto, surgen las principales motivaciones que incentivaron el trabajo desarrollado en esta tesis. En
35 primer lugar, brindar soporte para reconocer gestos a partir de múltiples enfoques de captura. Esto significa, que el reconocimiento de gestos pueda alimentarse por diversos enfoques de captura de una manera uniforme. Por lo tanto, se puede amoldar a las necesidades particulares que tenga cada desarrollador en sus aplicaciones. Complementariamente, se debe poder incorporar al reconocimiento de gestos nuevos enfoques de captura, para posibilitar que el enfoque de reconocimiento mantenga vigencia a medida que surgen nuevas tecnologías para capturar datos. Además, se deben proveer facilidades a los desarrolladores que no tienen conocimientos en el campo del reconocimiento de gesto. Es decir, que no tengan necesidad de implementar algoritmos complejos ni tampoco de entender cómo manejar la información provista por los enfoques de captura. Estas características, del mismo modo que los enfoques de captura, deben tener la suficiente flexibilidad para que los desarrolladores las acomoden según sus necesidades y así poder aplicar el reconocimiento de gestos en distintas circunstancias.
Para desarrollar las motivaciones planteadas, fue fundamental resolver la cuestión central del problema, que es el propio reconocimiento de gestos. Con dicho fin, se investigaron diversas técnicas de reconocimiento de gestos y se optó por utilizar Dynamic Time Warping, Procrustes, String Matching y modelos ocultos de Márkov. La decisión se basó en la experiencia que se tenía previamente con cada una de las técnicas analizadas. Además, como se mostró en la sección 2.7, cada técnica provee características beneficiosas para distintas circunstancias, por lo tanto, es valioso contar con esa variedad. Incluso, se tuvieron en cuenta casos de éxito donde estas técnicas se aplicaron para contextos muy similares al planteado por esta tesis. De todas formas, dado que la flexibilidad es un punto importante, se debe permitir la posibilidad de incorporar nuevas técnicas de reconocimiento. De este modo, un desarrollador con conocimientos en el campo del reconocimiento de gestos, podría personalizar al máximo el reconocimiento al contexto en que tuviera que aplicarlo. Pero sin necesidad de implementar por completo la solución.
37