Propuesta de sistema de reconocimiento de color piel evaluado en imágenes aéreas capturadas dentro de ambientes urbanos por medio de vehículo aéreo no tripulado (VANT)

Texto completo

(1)PROPUESTA DE SISTEMA DE RECONOCIMIENTO DE COLOR PIEL EVALUADO EN IMÁGENES AÉREAS CAPTURADAS DENTRO DE AMBIENTES URBANOS POR MEDIO DE VEHÍCULO AÉREO NO TRIPULADO (VANT). Brayan Steven Garzón Villabón Daniel Felipe González Becerra. Universidad Distrital Francisco José de Caldas Facultad de Ingenierı́a Bogotá D.C - Colombia 2018.

(2) Trabajo de Grado Requisito para optar por el tı́tulo de Ingeniero Electrónico. Brayan Steven Garzón Villabón 20102005062 [email protected] Daniel Felipe González Becerra 20102005004 [email protected]. Director: MSc. Julián Rolando Camargo López Profesor Asociado Laboratorio de Automatización, Sistemas Embebidos y Robótica (LASER) Facultad de Ingenierı́a. Universidad Distrital Francisco José de Caldas Facultad de Ingenierı́a Proyecto Curricular de Ingenierı́a Electrónica Bogotá D.C - Colombia 2018.

(3) Evocando a la memoria de mi padre Luis Jaime González... Con tu esencia a donde vaya, por este logro y los que vienen.... Daniel Felipe González Becerra. II.

(4) A mis padres, Don Jaime y Doña Luz que incondcionalmente me apoyaron a lo largo de estos años. A mis hermanos. Ejemplo de dedicación, responsabilidad y superación. A los muchachos y en memoria de Leonardo... Agradecido con la vida de conocerlos y compartir la carrera a su lado. Daniel F. González B.. A mi madre por su amor fidedigno, a mi padre por su silente apoyo, a mi hermano por enseñarme el amor sempiterno y a mis hermanas a las que amo. Brayan S. Garzón V.. III.

(5) Resumen Este libro muestra los resultados y el desarrollo de un trabajo de grado que inició en el año 2017 y culmina iniciando el año 2018, bajo la disciplina del Laboratorio de Automatización, Sistemas Embebidos y Robótica (LASER). LASER tiene como misión buscar el desarrollo del conocimiento en Automatización, Sistemas Embebidos, Robótica y Sistemas Inteligentes, para brindar soluciones integrales que permitan mejorar los procesos en el sector industrial, entre otros aspectos. Siendo la robótica y en mayor medida el desarrollo de sistemas inteligentes el punto de partida de este proyecto. Una de las temáticas que ha cobrado interés dentro del grupo de investigación es la aplicación de herramientas tecnológicas como lo son los Vehı́culos Aéreos No Tripulados (VANT), también conocidos por sus siglas en inglés UAV. Implementándolos en diversas tareas, por ejemplo, en la búsqueda de la tecnificación de los sectores agrı́colas que se encuentran rezagados con respecto a las industrias internacionales. Este trabajo tuvo como fin desarrollar una herramienta tecnológica basada en la clasificación de los valores tı́picos en las componentes RGB que correspondı́an al color piel, para posteriormente evaluar su respuesta frente a imágenes aéreas que se encontraban en un entorno urbano y que además contaron con presencia de personas. Dichas tomas, se realizaron por medio de la implementación de una cámara deportiva WiFi, la cual se adaptadó a un VANT de ala rotatoria. En primera instancia se realizó una revisión del contexto teórico del proyecto; desde una introducción a la Face Recognition Technology, pasando por el reconocimiento de piel y sus caracterı́sticas. Además se realizó un estudio a cerca de la teorı́a de conjuntos difusos, sistemas de inferencia difusa (FIS), sistemas de inferencia nuero difusa adaptativa (ANFIS), clasificadores basados en ANFIS, criterios de evaluación estadı́sticos para clasificadores, hasta conceptos más técnicos; mecánica de vuelo, tipos de VANT y su implementación en tareas de monitoreo. Además, como aspecto importante, la búsqueda de antecedentes en el área del reconocimiento de patrones humanos y su aplicación conjunta con los VANT. Luego, se encontró una base de datos que se acopló a las necesidades del trabajo. Para esto, se realizó la búsqueda en el UCI Machine Learning Repository, donde se encontró la “Skin Segmentation Data Set”; ésta se obtuvo IV.

(6) del muestreo aleatorio de los valores R, G, B de las imágenes faciales de diferentes grupos de edad (jóvenes, adultos y adultos mayores), grupos raciales (blanco, negro y asiático) y géneros obtenidos de la base de datos FERET, por sus siglas en inglés (Face Recognition Technology) y del PAL ( Productive Aging Laboratory). Posteriormente, se desarrolló el sistema de clasificación de pı́xeles correspondientes al color piel teniendo en cuenta los atributos de la base de datos. Donde el tamaño de ésta fue de 245057; de los cuales 50859 correspondı́an a las muestras de piel y 194198 a muestras no cutáneas. Básandose en la teorı́a de los ANFIS, se configuraron los parámetros de inicialización (constante de aprendizaje α, número de épocas, conjuntos de pertenencia para la entrada y la salida, número de reglas, entre otros.); con el fin de establecer la mejor respuesta. Para determinar la mejor respuesta del clasificador se aplicaron, como criterios de evaluación estadı́sticos, el cálculo de la Especificidad y la Sensibilidad, que a la postre sirvieron para trazar la curva ROC (por sus siglas en inglés Receiver Operating Characteristic). Una vez hechas estas consideraciones, se realizó la captura de imágenes. En esta etapa se manipuló y se estableció la ruta de sobrevuelo del VANT. El vehı́culo implementado fue el 3DR Iris- autonomous multicopter, al cual se adaptó la cámara deportiva WiFi GoPro Hero3. Las imágenes capturadas respondı́an a un entorno urbano que contó con la presencia de personas, además de cumplir unas caracterı́sticas de altura y hora del dı́a. Una vez cumplida esta etapa, la adquisición de datos se realizó mediante el establecimiento de una red WiFi que contaba con el mini servidor web de la cámara y la computadora principal, siendo esta última en la que se llevó a cabo el proceso de evaluación del clasificador. Por último, se presentaron los resultados arrojados por la experimentación y se realizó el respectivo análisis de estos; a partir de la variación de parámetros de inicialización en el ANFIS en la búsqueda de la mejor respuesta y el resultado del reconocimiento del color piel en cada una de las imágenes capturadas desde el VANT con base en ésta.. V.

(7) Agradecimientos En medio del alivio, la nostalgia y la alegrı́a que significa alcanzar el primero de muchos logros, es importante destacar que este tı́tulo no sólo representa el final de esta etapa académica. También representa el aprendizaje de muchas lecciones de vida, quizás en palabras quede corto, pero las vivencias a lo largo de estos años complementan la satisfacción de este momento. De ningún modo fue algo fácil, como todo en la vida, hay momentos buenos y otros no tanto, por eso escribir estas lı́neas de agradecimiento, quedan cortas para expresar la gratitud hacia esas personas que me acompañaron y fueron sustento durante toda la carrera. A los muchachos: Alex, Cristian, Danilo, Diego, Felipe, los Migueles, Sergio, Leonardo (Q.E.P.D) y Mery; estaré eternamente agradecido por su incondicionalidad, por su amistad, por esa solidaridad que los caracteriza, porque a pesar de las dificultades siempre nos mantuvimos juntos como grupo. Alguna vez se los dije: valió la pena la forma en la que decidimos afrontar esta carrera, porque eso nos acercó aun más como personas y eso es lo que queda para siempre. No puedo, dejar de lado un espacio especial para mi compañero de tesis, a Brayan le agradezco ese sentimiento tan parecido al amor de hermano, sé que tanto para él como para mı́, fue un año muy duro, pero juntos salimos adelante, cuando alguno iba tirar la toalla ahı́ estaba el otro para levantarlo. Alguna vez veı́amos tan lejano todo esto y hoy por fin, llenos de orgullo, terminamos este duro trabajo, que al igual que a los muchachos, le agradeceré por siempre haberme acompañado en los momentos duros, por su solidaridad, por su incondiconalidad y su paciencia. Como no, al pilar sobre el que se edifica mi vida, a mi familia... Sin ellos, nada de esto hubiera sido posible, gracias a ellos soy la persona que soy, gracias a ellos tuve la oportunidad de comenzar este desafı́o. A mis padres, a mis hermanos, a mis tı́os, a mis primos y sobrinos, que de alguna u otra forma sirvieron de impulso para alcanzar esta meta. Por esa unión que nos caracteriza y el legado de los que ya no nos acompañan, espero que esto sea el inicio del repunte, después de varios meses duros en el que vimos partir a algunos de nuestros seres queridos.. Daniel González Agradecimientos a mi familia en general, por su apoyo emocional y económico, es evidente que sin ellos no lo hubiese logrado. A las dos únicas personas VI.

(8) que he amado a las cuales les agradezco su cariño durante esta etapa y a las que amo con una predilección inconmensurable. A mis amigos y compañeros de universidad, no tuve la fortuna de tener un hermano contemporáneo pero con ustedes pude sentir una docena de ellos, gracias. A mis educadores, en especial al profesor Julián Camargo no solo por recibir y dirigir nuestra propuesta sino también por sus enseñanzas en clase. A todos ellos y a cada uno de los que me permitieron estar en su vida. Esto es de ustedes, pues es hecho por mi amigo Dani y por mı́, y yo tan solo soy el producto de ustedes, la suma de las emociones que me permiten sentir, el resultado de los momentos que hemos vivido. “Solo un bobo cambiarı́a esto por algo tan común. . . ” le dice el abuelo George a Charlie cuando piensa vender su boleto único para la fábrica, ustedes son mi boleto y yo jamás seré un bobo. Brayan Garzón Agradecemos al grupo LASER y en especial a nuestro director, el ingeniero Julián Camargo , por su disposición, por su acompañamiento, sus consejos, su paciencia y por confiar en nosotros para llevar a cabo el desarrollo de este proyecto. Al ingeniero Miguel Melgarejo, por sus apreciaciones y reflexiones. Además, a cada uno de los profesores que nos formaron en este proceso. Queremos destacar la labor de los ingenieros César Perdomo, Julián Moreno y en general a la Red de Investigaciones de Tecnologı́a Avanzada (RITA), ya que desde el inicio del proyecto, mostraron toda la disposición para prestarnos asesorı́a y acompañamiento durante la captura de las imágenes y en general todo lo concerniente a los dispositivos implementados. Además, agradecemos la colaboración de los voluntarios para la captura de las fotografı́as. Fueron muy importantes los aportes de cada uno.. VII.

(9) Índice general Lista de figuras. XI. Lista de tablas. XIX. 1 Introducción 1.1 Planteamiento del Problema 1.2 Objetivos . . . . . . . . . . 1.2.1 Objetivo General . . 1.2.2 Objetivos Especı́ficos 1.3 Solución Propuesta . . . . . 1.4 Contenido del Libro . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. 2 Marco de Referencia 2.1 Reconocimiento de Patrones Humanos . . . . . . . . . . . . . 2.1.1 Tecnologı́a de Reconocimiento Facial . . . . . . . . . . 2.1.2 Color de la Piel en Tareas de Reconocimiento . . . . . 2.1.2.1 Constancia de Color . . . . . . . . . . . . . . 2.1.2.2 Espacio de Color RGB . . . . . . . . . . . . . 2.1.2.3 Comportamiento de la Piel en el Espacio RGB a Cambios de Iluminación . . . . . . . . . . . 2.1.2.4 Algoritmo White Patch . . . . . . . . . . . . 2.2 Teorı́a de Conjuntos Difusos . . . . . . . . . . . . . . . . . . . 2.2.1 Lógica Difusa . . . . . . . . . . . . . . . . . . . . . . . 2.2.1.1 Variable Lingüı́stica . . . . . . . . . . . . . . 2.2.2 Funciones de Pertenencia . . . . . . . . . . . . . . . . . 2.2.2.1 Apoyo . . . . . . . . . . . . . . . . . . . . . . 2.2.2.2 Centro . . . . . . . . . . . . . . . . . . . . . . 2.2.2.3 Puntos de Cruce . . . . . . . . . . . . . . . . 2.2.3 Operaciones entre Conjuntos Difusos . . . . . . . . . . 2.2.3.1 Unión . . . . . . . . . . . . . . . . . . . . . . 2.2.3.2 Intersección . . . . . . . . . . . . . . . . . . . VIII. 1 2 2 2 3 3 4 5 5 6 9 9 10 11 12 14 14 15 15 16 16 16 16 17 17.

(10) 2.3. 2.4. 2.5. 2.2.3.3 Complemento . . . . . . . . . . . . . . . . . . Sistemas Difusos . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Sistemas Difusos Adaptativos . . . . . . . . . . . . . . 2.3.1.1 Aprendizaje Supervisado . . . . . . . . . . . . 2.3.1.2 Aprendizaje No Supervisado . . . . . . . . . . 2.3.2 Sistemas Difusos en Clasificación . . . . . . . . . . . . 2.3.3 Métodos de Evaluación en Clasificadores . . . . . . . . 2.3.3.1 Curva ROC . . . . . . . . . . . . . . . . . . . 2.3.3.2 Cross Validation . . . . . . . . . . . . . . . . Adaptive Neuro Fuzzy Inference System (ANFIS) . . . . . . . 2.4.1 Estructura ANFIS . . . . . . . . . . . . . . . . . . . . 2.4.1.1 Modelo Difuso Tipo Sugeno . . . . . . . . . . 2.4.1.2 Capas de ANFIS . . . . . . . . . . . . . . . . 2.4.2 ANFIS en Tareas de Reconocimiento . . . . . . . . . . Vehı́culo Aéreo No Tripulado (VANT) . . . . . . . . . . . . . 2.5.1 Clasificación de los VANT . . . . . . . . . . . . . . . . 2.5.1.1 Clasificación por el Peso . . . . . . . . . . . . 2.5.1.2 Clasificación por Autonomı́a de Vuelo y Alcance 2.5.1.3 Clasificación por Altitud Máxima de Operación . . . . . . . . . . . . . . . . . . . . . . . 2.5.1.4 Espectro de los Drones . . . . . . . . . . . . 2.5.2 Drones en Tareas de Rescate y Reconocimiento . . . . 2.5.2.1 Antecedentes de Drones en Colombia . . . . .. 3 Diseño de Sistema de Reconocimiento de Color Piel Evaluado en Imágenes Aéreas dentro de Ambientes Urbanos por medio de VANT 3.1 Solución a Desarrollar . . . . . . . . . . . . . . . . . . . . . 3.2 Conjunto de Datos . . . . . . . . . . . . . . . . . . . . . . . 3.3 Inicialización del ANFIS . . . . . . . . . . . . . . . . . . . . 3.3.1 Determinación de la Mejor Respuesta . . . . . . . . . 3.4 Captura de Imágenes por Medio de VANT . . . . . . . . . . 3.4.1 Drone 3D Iris . . . . . . . . . . . . . . . . . . . . . . 3.4.2 T-2D Tarot Gimbal . . . . . . . . . . . . . . . . . . . 3.4.2.1 Conexión Gimbal - 3D Iris . . . . . . . . . . 3.4.3 Cámara GoPro HERO 3+ . . . . . . . . . . . . . . . 3.4.4 Plan de Vuelo . . . . . . . . . . . . . . . . . . . . . . 3.5 Procesamiento de Imágenes . . . . . . . . . . . . . . . . . . 3.6 Validación del FIS a través de las Imágenes Procesadas . . . 4 Resultados. . . . . . . . . . . . .. 18 19 21 22 22 23 23 23 25 27 27 27 29 31 33 34 34 35 36 36 39 41. 43 43 44 45 46 46 46 47 48 50 51 54 55 57. IX.

(11) 4.1. 4.2. 4.3. 4.4 4.5. ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Conjunto de Datos de Entrada . . . . . . . . . . . . . 4.1.2 Evaluación Clasificador Piel - No Piel . . . . . . . . . 4.1.2.1 Especificidad, Sensibilidad, Exactitud y Precisión . . . . . . . . . . . . . . . . . . . . . 4.1.2.2 Curva ROC . . . . . . . . . . . . . . . . . . Imágenes Aéreas . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Adquisición de Datos . . . . . . . . . . . . . . . . . . 4.2.2 Fotografı́as GoPro . . . . . . . . . . . . . . . . . . . Procesamiento de Imágenes Aéreas . . . . . . . . . . . . . . 4.3.1 Algoritmo Gray World . . . . . . . . . . . . . . . . . 4.3.2 Algoritmo Coordenadas Cromáticas . . . . . . . . . . Segmentación por medio de FIS . . . . . . . . . . . . . . . . 4.4.1 Rendimiento . . . . . . . . . . . . . . . . . . . . . . . Análisis General . . . . . . . . . . . . . . . . . . . . . . . . .. . 57 . 59 . 60 . . . . . . . . . . .. 60 61 62 62 64 66 66 67 68 71 72. 5 Conclusiones y Trabajos Futuros 75 5.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.2 Aportes Originales . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . 77 A Anexo. 79. B Anexo. 89. C Anexo. 99. Referencias. 124. X.

(12) Índice de figuras 2.1. Ejemplo: cálculo de descriptor LBP. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Ponderación de bloques en escala de grises usando descriptores LBP. Fuente: Ahonen [11], Nikisins y Greitans [12] . . . . . . . 2.3 Representación del modelo de color RGB. Fuente: Molinero [14] 2.4 Caracterı́sticas de una Función de Pertenencia. Fuente: Carreño [22] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Esquema General de Sistema Difuso. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Esquema General de Sistema Difuso Adaptativo. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Esquema General Método K-fold Cross Validation. Fuente: Andreini, De Falco, Sassu [39] . . . . . . . . . . . . . . . . . . 2.8 Esquema General ANFIS para dos Entradas. Fuente: Roger Jang J [41]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 Espectro de los Drones desde UAV hasta SD. Fuente: Hassanalian & Abdelkefi [48]. . . . . . . . . . . . . . . . . . . . . . . 2.10 MAV Ala Fija LA100. Fuente: Smashing Robotics [56] . . . . 2.11 MAV Ala Rotatoria. Fuente: Flying AG [58] . . . . . . . . . . 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9. Esquema General de Desarrollo. Fuente: Autores del Proyecto Conjunto de Datos. Fuente: Bhatt & Dhall [2] . . . . . . . . . 3D Robotics IRIS. Fuente: Autores del Proyecto. . . . . . . . Dispositivo T-2D Tarot Gimbal. Fuente: Google images - HobbyKing.com [67]. . . . . . . . . . . . . . . . . . . . . . . . . . . . Vista superior del gimbal, placa de conexiones. Fuente: Gimbal User Guide [68]. . . . . . . . . . . . . . . . . . . . . . . . . . . Conexión gimbal - Iris. Fuente: Autores del Proyecto. . . . . . Cámara GoPro HERO 3+ Silver Edition. Fuente: Google Images - Snapsort.com [69]. . . . . . . . . . . . . . . . . . . . . . WiFi Remote. Fuente: WiFi Remote User Manual [70]. . . . . Punto donde se llevará a cabo el vuelo. Fuente: Google Maps. XI. 7 8 10 16 20 21 26 31 37 37 38 44 45 47 48 49 49 50 51 52.

(13) 3.10 Configuración del punto de la estación terrena y carga sostenida por el gimbal. Fuente: Autores del Proyecto. . . . . . . . 53 4.1 4.2 4.3 4.4 4.5 4.6. 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15. Estructura ANFIS MATLAB toolbox. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aproximación de la función no lineal que describe el sistema de clasificación. Fuente: Autores del Proyecto . . . . . . . . . Conjunto de 40.000 datos de entrada al ANFIS. Fuente: Bhatt & Dhall [2]. . . . . . . . . . . . . . . . . . . . . . . . . . . . Curva ROC que describe el rendimiento del clasificador Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . Puesta a punto del drone con la estación terrena. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . Pasos 1 y 2: Opciones avanzadas en las configuraciones de red para verificar la dirección IP del servidor. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Paso N◦ 3: Dirección IP del “servidor” GoPro y acceso este. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . Paso N◦ 4: Servidor web de la cámara GoPro y localización de las fotografı́as capturadas. Fuente: Autores del Proyecto . . . 3D Iris drone durante el vuelo. Fuente: Autores del Proyecto Fotografı́a aérea tomada aproximadamente a 5 metros de altura. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . Fotografı́a aérea tomada aproximadamente a 3 metros de altura. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . Resultado de la implementación del algoritmo Gray World. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . Resultado de la implementación del algoritmo de conversión a coordenadas cromáticas. Fuente: Autores del Proyecto. . . . Segmentación sin etapa previa de procesamiento. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . Segmentación con cada uno de los algoritmos implementados. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . .. . 58 . 58 . 59 . 61 . 62. . 63 . 64 . 64 . 65 . 65 . 66 . 67 . 68 . 69 . 70. A.1 Implementación del algoritmo gray world para imagen aérea del entorno a baja altura. Fuente: Autores del proyecto. . . . . 79 A.2 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. 79 A.3 Implementación del algoritmo gray world para imagen aérea del entorno desde otro ángulo. Fuente: Autores del proyecto. . 80 XII.

(14) A.4 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.5 Implementación del algoritmo gray world para imagen aérea con un voluntario a altura media. Fuente: Autores del proyecto. A.6 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.7 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. A.8 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. A.9 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.10 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.11 Implementación del algoritmo gray world para imagen aérea con un voluntario a gran altura. Fuente: Autores del proyecto. A.12 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. A.13 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. A.14 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.15 Implementación del algoritmo gray world para imagen aérea con un voluntario a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.16 Implementación del algoritmo gray world para imagen aérea del entorno a gran altura. Fuente: Autores del proyecto. . . . . A.17 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.18 Implementación del algoritmo gray world para imagen aérea del entorno a mediana altura. Fuente: Autores del proyecto. . A.19 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. A.20 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. XIII. 80 80. 81 81 81. 82. 82 82 83 83. 83. 84 84. 84 85 85 85.

(15) A.21 Implementación del algoritmo gray world para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. A.22 Implementación del algoritmo gray world para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. A.23 Implementación del algoritmo gray world para imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . A.24 Implementación del algoritmo gray world para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . A.25 Implementación del algoritmo gray world para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.26 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . A.27 Implementación del algoritmo gray world para imagen aérea con un voluntario posición fetal a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 Implementación del algoritmo de coordenadas cromáticas para imagen aérea del entorno. Fuente: Autores del proyecto. . . . B.2 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.3 Implementación del algoritmo coordenadas cromáticas para imagen aérea del entorno desde otro ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.4 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.5 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . B.6 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.7 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . XIV. 86 86. 86. 87. 87. 87. 88. . 89. . 89. . 90. . 90. . 90. . 91. . 91.

(16) B.8 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.9 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.10 Implementación algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.11 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.12 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.13 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.14 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.15 Implementación algoritmo coordenadas cromáticas para imagen aérea con un voluntario a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.16 Implementación del algoritmo coordenadas cromáticas para imagen aérea del entorno a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.17 Implementación algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.18 Implementación algoritmo coordenadas cromáticas para imagen aérea del entorno a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.19 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.20 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . XV. . 91. . 92. . 92. . 92. . 93. . 93. . 93. . 94. . 94. . 94. . 95. . 95. . 95.

(17) B.21 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.22 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.23 Conversión a coordenadas cromáticas en imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.24 Conversión a coordenadas cromáticas para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.25 Conversión a coordenadas cromáticas para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.26 Conversión a coordenadas cromáticas para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.27 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario posición fetal a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . C.1 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno. Fuente: autores del proyecto. . . . C.2 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.3 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno desde otro ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.4 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . C.5 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.6 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . XVI. . 96. . 96. . 96. . 97. . 97. . 97. . 98. . 99. . 100. . 101. . 102. . 103. . 104.

(18) C.7 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 C.8 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 C.9 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 107 C.10 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 108 C.11 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 C.12 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 C.13 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 C.14 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 112 C.15 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 C.16 Segmentación con cada uno de los métodos aplicados para imagen del entorno a gran altura. Fuente: autores del proyecto. 114 C.17 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a diferente ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 115 C.18 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 C.19 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 C.20 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios posición fetal. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 XVII.

(19) C.21 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios posición fetal. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.22 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.23 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.24 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . C.25 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.26 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario posición fetal a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . .. XVIII. . 119. . 120. . 121. . 122. . 123. . 124.

(20) Índice de tablas 2.1 2.2 2.3 2.4 2.5 2.6 2.7. 2.8. 4.1. Operaciones entre Conjuntos Difusos. . . . . . . . . . . . . . Resultado de una Prueba Binaria General . . . . . . . . . . Categorı́as de Drones Basado en su Peso. Fuente: L. BrookeHolland [53] . . . . . . . . . . . . . . . . . . . . . . . . . . . Categorı́as de Drones Basado en su Peso - Australia (no oficial). Fuente: Arjomandi [54] . . . . . . . . . . . . . . . . . Categorı́as de Drones Basado en su Autonomı́a de Vuelo y Radio de Alcance. Fuente: Arjomandi [54] . . . . . . . . . . Categorı́as de Drones Basado en su Altitud Máxima de Operación Fuente: Arjomandi [54] . . . . . . . . . . . . . . . . . Resultados de los cálculos de Precisión y Exhaustividad para Imágenes de Superficies Homogéneas Fuente: Sven Gotovac, Vladan Papić y Željko Marušić [62]. . . . . . . . . . . . . . Resultados de los cálculos de Precisión y Exhaustividad para Imágenes de Superficies Hetereogéneas Fuente: Sven Gotovac, Vladan Papić y Željko Marušić [62]. . . . . . . . . . . . . .. . 19 . 25 . 34 . 35 . 36 . 36. . 40. . 40. Tiempo de ejecución promedio de los algoritmos empleados en la etapa de procesamiento. . . . . . . . . . . . . . . . . . . . . 71.

(21) XX.

(22) Capı́tulo 1 Introducción “La ciencia no es sino una perversión de sı́ misma, a menos que tenga como objetivo final el mejoramiento de la humanidad” Nikola Tesla Albert Einstein dijo: “Temo el dı́a en que la tecnologı́a sobrepase nuestra humanidad”. Si bien, cuando dijo esto se referı́a a la visión que tenı́a respecto a la clase de personas que habitarı́an la tierra, lo que se vive hoy en dı́a no dista mucho, en cuanto a que la humanidad llegó al punto en el que sus avances podrı́an ser tan nocivos como positivos, dependiendo del enfoque que se les de. A criterio de los autores, este momento puede marcar el cambio de una sociedad absorbida por un constante ambiente de conflicto y desesperanza. Muestra de ello, es el enfoque que se le ha dado a la tecnologı́a VANT, ya que inicialmente se vio como un complemento para la industria armamentı́stica, pero hoy se puede ver en diferentes aplicaciones en las que adopta el rol de una herramienta tecnológica en la resolución de problemas que aquejan a la sociedad actual. Una aplicación que podrı́a generar controversia entre la opinión pública, es el reconocimiento facial combinado con los VANT, ya que podrı́a verse como una invasión a la privacidad, como también en una herramienta útil en el reconocimiento de vı́ctimas en desastres naturales. Este proyecto tiene como finalidad, entregar una propuesta de desarrollo que complemente, en parte, esta temática dentro del territorio nacional, ya que debido a su geografı́a es propenso a eventos de esa ı́ndole..

(23) 1.1.. Planteamiento del Problema. La incursión en el mundo actual de los VANT, conocidos por las siglas UAS (Unmanned Aerial System) o RPAS (Remotely Piloted Aircraft System) o UAV, han posibilitado la creación de nuevas técnicas de apoyo en actividades remotas de monitoreo para diferentes áreas de estudio. Los VANT, se han implementado en los últimos años como una plataforma multipropósito. Por ejemplo, en la adquisición de imágenes remotas con un gran número de aplicaciones en movilidad, cartografı́a, termografı́a, entre otros. Que en conjunto con el desarrollo de nuevos métodos de reconocimiento y detección de patrones en el marco de la visión artificial, hacen de estos, herramientas completamente versátiles y con una mayor funcionalidad. Según un análisis realizado por la Association for Unmanned Vehicle Systems International (AUVSI) en el año 2013, titulado El impacto económico de la integración del sistema aeroespacial no tripulado en la economı́a de los EE.UU, los mercados civiles más prometedores son la agricultura de precisión y la seguridad pública, representando entre los dos el 90 % de los mercados potenciales conocidos para los VANT [1] . Para el caso de la seguridad pública, es importante la búsqueda de nuevas herramientas tecnológicas que faciliten las tareas de ubicación y detección de personas, ya sea para impulsar el desarrollo de sistemas de seguridad o el de sistemas de monitoreo de peatones, como también el de los sistemas de control poblacional o los sistemas de rescate. Conociendo el desarrollo y los alcances de esta área, se pretende resolver la pregunta que da inicio a este proyecto: ¿Es posible el desarrollo de una herramienta tecnológica, basada en el reconocimiento de los valores de las componentes RGB que corresponden al color piel y evaluarla en imágenes aéreas con presencia de personas. Esto con el fin de analizar su respuesta y ası́, apoyar al estudio en la detección de las mismas?. 1.2. 1.2.1.. Objetivos Objetivo General. Desarrollar un sistema de reconocimiento de color piel y analizar su respuesta en imágenes aéreas, las cuales serán capturadas por medio de un VANT. 2.

(24) 1.2.2.. Objetivos Especı́ficos. − Encontrar una base de datos adecuada para llevar a cabo las etapas de entrenamiento y validación del sistema de clasificación de pı́xeles color piel y no piel. − Considerar un sistema de reconocimiento a partir de aprendizaje supervisado, con base en la teorı́a ANFIS. − Determinar la mejor respuesta del ANFIS evaluando su resultado a diferentes parámetros de inicialización dentro de un determinado número de pruebas. − Realizar una captura de imágenes aéreas, las cuales cuenten con la presencia de personas. Además de cumplir ciertas caracterı́sticas de altura y hora del dı́a dentro de un ambiente urbano, por medio de una cámara deportiva WiFi adaptada a un VANT. − Analizar la respuesta del sistema de reconocimiento de color piel en las imágenes aéreas luego de ser descargadas desde el servidor web de la cámara a la computadora.. 1.3.. Solución Propuesta. Este documento tiene como fin mostrar el desarrollo de una propuesta, mediante el seguimiento de una metodologı́a fundamentada en el contexto teórico que lo compone; espacios de color, FIS, ANFIS y VANT. Esta propuesta es elaborada a partir del uso de la herramienta matemática de software MATLAB R . Inicialmente, se debı́a encontrar una base de datos acorde al problema de clasificación “epidérmica”. En este caso, se encontró una compuesta de determinados atributos, ésta es de dimensión 245057 * 4, dónde las primeras tres columnas son valores R, G, B (x1, x2 y x3) y la cuarta columna es la del tipo de clase a la que pertenece la combinación de las tres primeras columnas (variable de decisión y) [2],[3]. Una vez examinada la distribución de las dos clases, se desarrolla el sistema de clasificación a partir de la teorı́a ANFIS. Donde un 70 % de la base de datos es implementada para la etapa de entrenamiento, mientras que el 30 % restante se emplea en la etapa de validación.. 3.

(25) Acto seguido, se determina la mejor respuesta a diferentes parámetros de inicialización, por medio del cálculo de diferentes parámetros estadı́sticos (especificidad, sensibilidad, Exactitud) y el trazo de la curva ROC. Una vez terminado el desarrollo del clasificador, se realiza la captura de imágenes aéreas cumpliendo con ciertas caracterı́sticas; altura, horario y entorno (urbano). Con las imágenes capturadas se realiza una etapa de procesamiento digital, en la que se pretende corregir el efecto de las variaciones de iluminación dentro de éstas. Finalmente se valida el sistema en general, implementando el clasificador en el reconocimiento de las personas que aparezcan en estas imágenes corregidas.. 1.4.. Contenido del Libro. El documento muestra el planteamiento del problema y la pregunta de investigación como punto de partida para el desarrollo del proyecto de grado. En el segundo capı́tulo se aborda el marco de referencia, en el cual se da un breve repaso de los temas que encierran al proyecto, es decir, en este capı́tulo el lector se acerca a temas relacionados con el desarrollo de sistemas difusos, la implementación de ANFIS, criterios de evaluación para clasificadores, sistemas de reconocimiento dérmico, VANT, tipos de VANT y sus aplicaciones, entre otros. El siguiente capı́tulo tiene como fin explicar el desarrollo de la propuesta a partir del marco de referencia expuesto en el capı́tulo anterior. En él, se sigue la metodologı́a de la sección 1.3. El capı́tulo cuatro expone el mejor de los resultados obtenidos a partir de la variación de parámetros del ANFIS, la implementación de éste a través de fuzzy toolbox, el cálculo de la especificidad, sensibilidad y área bajo la curva ROC del clasificador, algunas de las fotografı́as aéreas capturadas a través del VANT y la aplicación del sistema en general sobre éstas. Finalmente, las conclusiones a las que se llegaron luego de desarrollar el trabajo, de la misma manera que los aportes y las propuestas para trabajos futuros son mostradas en el quinto capı́tulo. Para ası́, culminar con las referencias bibliográficas que sustentaron el contenido teórico-práctico del libro.. 4.

(26) Capı́tulo 2 Marco de Referencia “Según vamos adquiriendo conocimiento, las cosas no se hacen más comprensibles, sino más misteriosas.” Albert Schweitzer En este capı́tulo se dan a conocer los conceptos relacionados con el contexto del proyecto, para ası́, comenzar a dilucidar una eventual respuesta al problema planteado en secciones anteriores.. 2.1.. Reconocimiento de Patrones Humanos. Ciertamente los mejores sistemas de reconocimientos de patrones los poseen los seres humanos, en la mayorı́a de escenarios somos capaces de identificar patrones en nuestro entorno como lo son caracteres, rostros, voces, entre otros. Sin embargo, el deseo de solucionar problemas que aquejan a la sociedad, sin que eso llegue a ponerlas en riesgo, va de la mano con la aparición de nuevas herramientas basadas en la inteligencia artificial. Las aplicaciones tienen diversos enfoques, aunque para lo que concierne a este proyecto, se destacan aquellas en las que el reconocimiento de personas tiene fines de rescate, vigilancia, seguridad, entre otros [4], [5], [6]. Para el diseño de sistemas artificiales de reconocimiento de patrones se tienen en cuenta los siguientes aspectos [7]: − Adquisición y pre-procesamiento de los datos. − Representación de los datos..

(27) − Preparación. − Toma de decisiones. En la actualidad este proceso es usado en cualquier área de la ciencia e ingenierı́a que estudie la estructura de las observaciones. Es frecuentemente usado en la industria manufacturera, cuidado de la salud y en el contexto militar.. 2.1.1.. Tecnologı́a de Reconocimiento Facial. También conocida en la academia por sus siglas en inglés Face Recognition Technology (FERET). Una de las primeras formas de reconocimiento y por ende, una de las más utilizadas, es la del reconocimiento facial. Ésta generalmente se basa en la biometrı́a del rostro, es decir, que esta hace referencia al análisis de las caracterı́sticas y las medidas tı́picas de los patrones faciales (ojos, nariz, cejas, boca, etc) [8]. Por ejemplo, Marek Loderer, Jamila Pavlovičová ,Miloš Oravec & Ján Mazanec en [9], realizan un estudio sobre la importancia de resaltar determinadas regiones del rostro en la disciplina del reconocimiento facial para imágenes en escala de grises. En la que introducen caracterı́sticas del descriptor LBP (Local Binary Patterns por sus siglas en inglés) y la distancia medida entre los pı́xeles que resalta éste. Antes de mostrar las conclusiones a las que llegaron en [9] es necesario dar un breve acercamiento al concepto del descriptor LBP. Lo que se busca con este método es distinguir los objetos de interés por sobre el resto. Para el caso del reconocimiento facial, se pretende distinguir principalmente la boca, los ojos y la nariz. En el cálculo de los LBP se define una vecindad del pı́xel de interés y luego se comparan los niveles de gris de éste con respecto a los de sus vecinos. En la Figura 2.1 como vecindad se define a todos aquellos pı́xeles que tocan el pixel central. Allı́ estos números; siete, dos, ocho, nueve, seis, uno, tres, son los niveles de gris en este ejemplo. Una vez identificado los vecinos se aplica la regla que se muestra en ésta. Además se escoge también un orden al momento de evaluar los vecinos, este es arbitrario pero de ahı́ en adelante se respeta para todos los pı́xeles centrales. En este caso se inicia con el pı́xel de valor “dos”, luego se continúa con el “tres”, y ası́ sucesivamente en sentido antihorario. Como hay ocho vecinos, en realidad esto es un byte donde 6.

(28) evidentemente cada bit tendrá un valor de cero o uno según el resultado de aplicar esta regla a cada uno de los vecinos. Y como esto es código binario, se puede simplificar expresándolo en su forma decimal. La suma de los valores en decimal de los pı́xeles en los que la regla dio uno da un total de 168. Por lo tanto, el código LBP de ese pı́xel central es 168 [9],[10].. Figura 2.1: Ejemplo: cálculo de descriptor LBP. Fuente: Autores del Proyecto. Una vez aterrizado este concepto, se puede traer a colación la respuesta de los diferentes algoritmos de ponderación que fueron objeto de estudio en [9] que posteriormente se convirtieron en punto de partida para realizar una propuesta que integrara las caracterı́sticas LBP y la distancia medida entre los pı́xeles que éstas resaltaran.. Un primer acercamiento a los antecedentes de los descriptores LBP en reconocimiento facial, se muestran en toda una sección del artı́culo mencionado, siendo los mostrados a continuación los más destacados. En la Figura 2.2 se muestran dos imágenes en escala de grises en las que se implementan diferentes algoritmos de ponderación con el fin de destacar las zonas de interés del rostro [9], [11], [12]. 7.

(29) (a) Imagen Origi- (b) Pı́xeles destanal caso 1 cados caso 1. (c) Tomada base (d) Método de resalto de datos FERET caso 2. Figura 2.2: Ponderación de bloques en escala de grises usando descriptores LBP. Fuente: Ahonen [11], Nikisins y Greitans [12] En la Figura 2.2b. Ahonen optimizó el descriptor LBP, además, definió el tamaño de las celdas y su respectivo valor de intensidad. Adicional a esto, agregó, que la forma de las celdas no necesita ser rectangular, ya que éstas no tienen que abarcar todas las partes de la imagen, sino unicamente las que comprenden el rostro. Una vez calculado el descriptor LBP, se concluyó que los patrones faciales respondieron a cierta simetrı́a, aunque por la muestra de las regiones resaltadas probablemente el cálculo biométrico no sea el ideal y por ende el reconocimiento pueda fallar [11]. En el caso de la Figura 2.2d Nikisins y Greitans [12] clacularon el descriptor LBP básandose en dos criterios; el primero, para el valor caracterı́stico de cada celda (cuadrı́cula roja), mientras que el segundo fue para el valor de una región determinada (grupo de celdas). Finalmente, el segundo criterio obtuvo mejores resultados en el cálculo biométrico y a la postre en el reconocimiento como tal.. 8.

(30) Una de las mayores contribuciones del trabajo fue la determinación de un método que unificara lo mejor de cada una de las técnicas expuestas. El cual conciste en encontrar el peso óptimo de cada una de las caracterı́sticas de los descriptores LBP, ya que es uno de los métodos utilizados con más frecuencia en el reconocimiento facial [9], [10].. 2.1.2.. Color de la Piel en Tareas de Reconocimiento. Si bien el reconocimiento basado en la biometrı́a del rostro es uno de los métodos más utilizados, éste tiene ciertas limitaciones cuando se requiere implementar en planos más amplios. Es por eso, que nuevas alternativas asoman con el fin de ampliar el campo de acción y profundizar el estudio de la identificación humana dentro del marco de la inteligencia artificial. Una de esas alternativas es realizar un reconocimiento basado en el color de la piel. Este consiste en determinar el valor de las componenetes cromáticas del espacio de color a los cuales corresponda la piel dentro de determinadas imágenes. Existen varios espacios de color, estos se definen como una representación matemática de los colores, es decir, esta representación no es más que una asociación de un vector con un elemento en un espacio. Entre estos se destacan; el RGB, CMYK, HSL y HSV, aunque algunos de estos presentan limitaciones a variaciones en la iluminación a la hora de la captura de imágenes.. 2.1.2.1.. Constancia de Color. La constancia del color es una caracterı́stica que tiene el ser humano con respecto a la percepción del color. Esta consiste en que la mayorı́a de las superficies parecen mantener la composición cromática ante cualquier cambio en la iluminación. En otras palabras, los colores se siguen percibiendo de la misma manera, como si éstos fueran un atributo constante e invariable de los objetos. Este fenómeno es muy particular, dado que la manera en la que incide la luz a través del ojo desde una superficie, puede cambiar significativamente según cuál sea la fuente de luz. No obstante, esto no se da siempre, ya que algunos objetos no mantienen su aspecto al estar bajo otro tipo de iluminación, tal como lo son las luces ultravioletas o en algunos casos bajo la influencia de radicaciones monocromáticas.. 9.

(31) En el caso de la visión por computadora, las imágenes capturadas por las cámaras no mantienen esta constancia. Como se verá en las secciones 2.1.2.2 y 2.1.2.3, hay diferentes espacios de color en el que el factor iluminación influye de manera significativa en la composición de las componentes cromáticas y es ahı́ donde se debe intentar mitigar el efecto de las variaciones de luz en las imágenes. 2.1.2.2.. Espacio de Color RGB. El espacio RGB, llamado ası́ por sus siglas en inglés Red, Green, Blue, está basado en el concepto de la sı́ntesis aditiva. El cual se refiere a la composición de los colores a través de la suma de distintos haces de luz, emitidos directamente por una fuente de algún tipo a diferentes longitudes de onda. Dentro de la sı́ntesis aditiva el blanco es considerado como la suma de las componentes espectrales primarias; rojo, verde y azul en proporción máxima respecto al espectro visible [13]. En el espacio RGB cualquier color F se puede representar mediante la combinación lineal de las tres componentes primarias independientes, tal cual como se muestra en la Figura 2.3a .. (a) Componentes primarias RGB. (b) Modelo RGB coordenadas cartesianas. Figura 2.3: Representación del modelo de color RGB. Fuente: Molinero [14] Donde F está dada por:. F = rR + gG + bB 10. (2.1).

(32) En el caso de las variables r, g, b, estos son escalares que indican la proporción de cada una de las componentes primarias contenidas en F , el cual puede normalizarse como se muestra a continuación [13].. F = R0 R + G0 G + B 0 B. (2.2). Donde: g b r ; G0 = ; B0 = (2.3) r+b+g r+b+g r+b+g Para el caso de la Figura 2.3b se evidencia lo descrito anteriormente. Aunque en este caso, se muestra el modelo RGB representado en coordenadas cartesianas. En esta Figura, el espacio está descrito por el hexaedro que se forma a partir de las tres dimensiones correspondientes a cada una de las componentes primarias, las cuales se encuentran en tres vértices, por otro lado; cian, magenta y amarillo se observan en otros tres vértices, cada uno con sus respectivas coordenadas, las cuales estarı́an determinadas por el valor de los escalares r, g, b que se expresaron en la ecuación 2.1. En cuanto al negro, éste corresponde al origen y el blanco se sitúa en el vértice más alejado del mismo. Dada esta particularidad, la escala de grises ese extiende lo largo de la diagonal que une esos dos puntos. Finalmente la composición de los demás colores estarı́a dada por la existencia de diversos puntos contenidos en el hexaedro y definidos por los vectores que se trazan desde el origen hasta cada uno de ellos [14]. R0 =. 2.1.2.3.. Comportamiento de la Piel en el Espacio RGB a Cambios de Iluminación. Como se ya se ha mencionado anteriormente, las tareas de reconocimiento a partir del color de la piel aun siguen teniendo vigencia y por lo tanto, cualquier detalle pasa a tener gran relevancia a la hora de encontrar aplicaciones más precisas y completas. Uno de esos detalles que puede determinar el rendimiento de un sistema de reconocimiento basado en el color de la piel, es la iluminación y aún más cuando el espacio de color en el que se trabaja es el RGB. Basándose en lo descrito en [15] , J.B. Martinkauppi coincide con que el espacio de color en el que se procesan los datos de la piel, tienen cierta incidencia en la detección de la misma. Puesto que estos difieren el uno del otro en la 11.

(33) forma en la que se pueden asignar los valores de cada una de sus componentes principales y por consiguiente la separación de ciertos colores. Aunque este autor no descarta la mezcla de varios espacios de color para mitigar el impacto de en este caso, la iluminación por fuentes externas. Dado lo anterior, se trae a colación la propuesta presentada en [16]. Allı́ Tomaschitz y Facon muestran los resultados del desarrollo de una técnica de reconocimiento de piel de diferentes grupos étnicos (asiático, caucásico, negro, etc ...), mediante la combinación de algunos espacios de color (rgb, HSV, TSL). Estos autores demuestran que es posible localizar regiones de piel sin la necesidad de realizar una etapa de clasificación previa y todo gracias a extraer las caracterı́siticas más relevantes de cada uno de los espacios de color que abordaron dentro de la metodologı́a. A pesar de que esta propuesta presenta muy buenos resultados, la parte que más se ajusta al enfoque que se le dio a este proyecto tiene que ver con la forma en la que los autores trataron de mitigar el impacto de la iluminación en el espacio RGB. Ya que como dice J.B. Martinkauppi en [15], una conversión de espacio de color no elimina ni los cambios de cromaticidad debido a la iluminación ni tampoco los efectos causados por el ruido. Es por esto, que si bien la combinación de espacios tomaba la mejor caracterı́stica de cada uno a la hora de separar colores, esta no hacia frente a posibles pérdidas. La forma en la que Tomaschitz y Facon [16] disminuyeron los efectos de la iluminación variable en el espacio RGB, fue normalizando éste, aunque a diferencia del método mostrado en la sección 2.1.2.2, allı́ se multiplica por un escalar c tal como se muestra a continuación: r=. cG cB cR ;g = ;b = R+G+B R+G+B R+G+B. (2.4). Donde r + g + b = 1 y la constante c = 100. La notación para este espacio RGB normalizado será rgb. 2.1.2.4.. Algoritmo White Patch. En algunas oportunidades el sistema visual del ser humano normaliza los valores de la intensidad lumı́nica percibida por sus canales oculares. Este proceso es una caracterı́stica intrı́nseca que se explicó en la sección 2.1.2.1, la cual realiza con respecto a una referencia; esta es un blanco hipotético. 12.

(34) A este proceso se lo llama mecanismo de Parche Blanco “White Patch”. La normalización permite maximizar los valores con respecto al valor del blanco hipotético, donde este, es el valor máximo de luminosidad en la imagen percibida. Teniendo en cuenta la premisa del White Patch, se podrı́a afirmar que al menos existe un pixel o un “parche de pı́xeles” blancos en la imagen [17]. Cuando se realiza la captura de una imagen, el valor de cada pı́xel dependerá de la respuesta de los tres filtros del sensor que compone parte de la cámara, en los cuales tiene determinada incidencia la iluminación. El valor obtenido en cada pı́xel también está relacionado con la temperatura del color de la fuente de luz. Ası́, cuando un objeto blanco es iluminado por un color de temperatura baja, tiende a aparecer rojizo dentro de la imagen capturada. Por el contrario, si el objeto es iluminado bajo un color de temperatura alta aparecerá con un tono azulado, es decir, el color de la escena en la imagen varı́a según la fuente de iluminación bajo la cual fue tomada. Para solucionar este problema Montero [18] emplea una técnica llamada balance de blancos. El balance de blancos utiliza algoritmos computacionales que emulan la constancia de color, con el fin de que los colores de la imagen capturada permanezcan iguales sin importar la temperatura de color bajo la que se encuentren. Es decir, el balance minimiza el efecto de la iluminación I(λ), y asegura que la respuestas del sensor R, G y B se correlacionen con la reflectancia del objeto R(λ) [18], [19]. Uno de estos algoritmos computacionales es el White Patch (WP), el cual tiene en cuenta el valor más grande en cada componente de color como una representación del blanco de la imagen. Computacionalmente, white patch es encontrado al buscar la máxima intensidad en cada canal, y está dado por:. Iimax = maxfi (x, y). (2.5). Donde, la f i(x, y) es la intensidad del pı́xel en la posición (x, y) de una imagen o un cuadro de vı́deo e, Ii es el iluminante en la escena. El ı́ndice i corresponde al canal de color en la imagen [20].. 13.

(35) 2.2.. Teorı́a de Conjuntos Difusos. Zadhe y M. L. Carreño definen los conjuntos difusos en [21] y [22] respectivamente como, un conjunto sin un lı́mite definido. Donde la pertenencia o no, de un elemento dentro de un conjunto no responde a la premisa fundamental del contexto binario, en la cual se admiten únicamente dos estados; verdadero o falso. Por el contrario, en el contexto de la lógica difusa la pertenencia es gradual y se caracteriza por una función. Estos conjuntos que son definidos de forma imprecisa desempeñan un rol trascendental en la concepción humana, peculiarmente en tareas de reconocimiento de patrones, de la comunicación de la información y de la abstracción. Un conjunto difuso A en X se puede definir como:. A = {(x, µA (x))|x ∈ X}. (2.6). Donde µA (x) es la función de pertenencia al conjunto difuso. A continuación, se verán explicados brevemente algunos de los concepctos más relevantes en el contexto de la teorı́a difusa.. 2.2.1.. Lógica Difusa. Planteada en 1965 por quien es considerado el padre de la teorı́a de la posibilidad, Lofti Zadhe, en su libro “fuzzy sets” [21]. Este concepto de lógica toma dos valores aleatorios, pero con un grado de relación entre sı́. De esta manera, por ejemplo, para el caso del reconocimiento de color piel, un sujeto que tenga un ı́ndice de pigmentación ◦ ITA entre 10 y 27 (el Ángulo Tipológico Individual ◦ ITA, es considerado como una medida de la pigmentación de la piel) es muy probable que se le considere una persona de tez negra, si previamente se ha tomado la referencia de una persona de tez blanca y se haya establecido un ◦ ITA mayor a 55. Ambos valores se desenvuelven en el contexto de la pigmentación y su referencia data de una medida metrica lineal. Este concepto de lógica difusa toma relevancia ya que se acerca más a las expresiones usadas cotidianamente. Dado que con esta se puede definir un valor cuantificable para expresiones que pueden definir caracterı́sticas de personas u objetos tales como “es una persona muy blanca”, hasta aquellas que definen situaciones en particular como “la temperatura del horno es muy alta”. 14.

(36) 2.2.1.1.. Variable Lingüı́stica. Concepto introducido por Zadhe [23] y tratado por Rutkowska en [24], con el fin de establecer una base para el razonamiento aproximado, dice Rutkowska: “por una variable lingüı́stica se quiere decir que se trata de una variable cuyos valores son palabras u oraciones en un lenguaje natural o artificial. La motivación para el uso de palabras o de oraciones en lugar de números es que las caracterizaciones lingüı́sticas son, en general, menos precisas que los valores numéricos”.. 2.2.2.. Funciones de Pertenencia. Se dice que un elemento x pertenece a un conjunto difuso A de manera parcial, por tal motivo, existe un indicador que mide dicho grado de pertenencia al conjunto. De acuerdo a la ecuación 2.6 existe asociada una función de pertenencia µA (x) para sus elementos, que indica en que medida el elemento forma parte de ese conjunto difuso. Este grado de pertenencia que indica la función, está dado por el intervalo entre 0 y 1, siendo 1 el valor para máxima pertenencia. De manera formal, el valor de cada elemento x está definido por la función µA (x) : X → [0, 1], donde X representa el universo del que el conjunto A toma sus elementos. Si el valor de esta función es 0 x no pertenece a A, mientras que si el valor de la función es 1 entonces x ∈ A completamente y por último si 0 < µA (x) < 1 se dice que x ∈ A de manera parcial [22], [25]. Aunque en principio cualquier función serı́a válida para definir conjuntos difusos, en realidad existen ciertas funciones tı́picas que se suelen usar, ya que definirlas, computacionalmente hablndo, no son las hace un tarea robusta y esto conlleva a que la determinación de su valor lingüı́stico asociado sea más sencillo. Las funciones utilizadas más frecuentemente son las de tipo trapezoidal, singleton, triangular (T), tipo S, exponencial, tipo Π (forma de campana). En la Figura 2.4 se muestra una función de pertenencia de tipo gaussiana, en ella Carreño resalta las partes más importantes y realiza una breve descripción de estas, tal como se muestra en las subsubsecciones siguientes. 15.

(37) Figura 2.4: Caracterı́sticas de una Función de Pertenencia. Fuente: Carreño [22] 2.2.2.1.. Apoyo. Para el conjunto difuso A el apoyo es el compendio de todos los puntos x para los cuales la función de pertenencia µA (x) > 0. 2.2.2.2.. Centro. En un conjunto difuso A es el conjunto de todos los puntos para los cuales la función de pertenencia µA (x) = 1. 2.2.2.3.. Puntos de Cruce. Son los puntos del conjunto difuso para los cuales µA (x) = 0,5.. 2.2.3.. Operaciones entre Conjuntos Difusos. Al igual que en la teorı́a de conjuntos clásica, en la teorı́a difusa existen las operaciones básicas entre conjuntos; unión, intersección y complemento. Esto abre paso para un concepto muy utilizado en los sistemas difusos y es el del razonamiento difuso, el cual está fundamentado en las proposiciones difusas, 16.

(38) que no son más que la asignación de un valor a una variable lingüı́stica, por ejemplo: “la altura de Brayan es mediana”. Una proposición difusa tiene por tanto asociado un conjunto difuso A (el valor lingüı́stico asignado, mediana en este caso) y su correspondiente función de pertenencia µA (x) definida sobre los elementos del universo x ∈ X[26]. 2.2.3.1.. Unión. Al igual que en el caso clásico se puede declarar una axiomática intuitiva para la unión de dos conjuntos difusos. Sea: µA∪B (x) = u(µA (x), µB (x)). (2.7). Donde: u : [0, 1]x[0, 1] → [0, 1] Al cumplir con las propiedades de nulidad, asociatividad, conmutatividad, identidad y homogeneidad se les denomina normas - T [26]. 2.2.3.2.. Intersección. En la teorı́a clásica, se considera que un elemento x pertenece al conjunto intersección si pertenece a cado uno de los conjuntos involucrados. En el caso de la teorı́a difusa, esta consiste en determinar el grado de pertenencia al conjunto intersección. Sea: µA∩B (x) = i(µA (x), µB (x)). (2.8). Donde: i : [0, 1]x[0, 1] → [0, 1] Al igual que el caso de la unión, se debe cumplir con las propiedades de conmutatividad, asociatividad, identidad, homogeneidad y además con la concordancia con el caso nı́tido [26]. Al comprobar cada uno de esos axiomas, se dice que el conjunto tiene estructura de semigrupo abeliano con elemento neutro. Por ende, las funciones i que verifican esta propiedad se denominan dentro de la teorı́a de conjuntos difusos normas triangulares (normas - T ). 17.

(39) 2.2.3.3.. Complemento. Dado un conjunto A, se considera como el conjunto complementario de A a los elementos del universo que no pertenecen a este. En el caso difuso, este conjunto se define por una función de pertenencia que se calcula para cada elemento a partir de su pertenencia al conjunto A. Es decir:. µĀ (x) = c(µA (x)). (2.9). Siendo c una función definida como:. c : [0, 1] → [0, 1]. La cual dado el grado de pertenencia al conjunto A, podrı́a dar lugar a obtener el grado de pertenencia al conjunto complementario (Ā). Esta función c debe cumplir con las propiedades de involución y decrecimiento estricto como también con el caso de concordancia con el caso nı́tido [26].. Por último, en la Tabla 2.1 se muestra de manera resumida las principales operaciones entre conjuntos difusos y su notación matemática formal [22]. 18.

(40) Operación Contención o Subconjunto Unión. Intersección. Complemento. Producto Cartesiano. Co-Producto Cartesiano Norma Concentración. Dilatación. Definición A es un subconjunto de B sı́ y sólo sı́ µA (x) ≤ µB (x), para todo x. A ⊆ B ⇔ µA (x) ≤ µB (x) La unión de los conjuntos difusos A y B es el conjunto C, y se escribe como C = A ∪ B o C = A OR B, su función de pertenecia está dada por: µC (x) = max(µA (x), µB (x)) = µA (x) ∨ µB (x). La intersección de los conjuntos difusos A y B es el conjunto difuso C, y se escribe como C = A ∩ B o C = A AND B, su función de pertenencia está dada por: µC (x) = min(µA (x), µB (x)) = µA (x) ∧ µB (x). El complemento del conjunto difuso A, está denotado por Ā (¬A, NOT A ), se define como: µĀ (x) = 1 − µA (x). Si A y B son conjuntos difusos en X y Y , el producto cartesiano de los conjuntos A y B, A x B en el espacio X x Y tiene la función de pertenencia: µA×B (x, y) = min(µA (x), µB (y)). A + B en el espacio X x Y tiene la función de pertenencia: µA×B (x, y) = max(µA (x), µB (y)). Para un conjunto difuso A µN orma(A) (x) = µA (x) , para x ∈ U . max(µA (x)) Modificador del conjunto difuso A, hace más estrecha la función de pertenencia: µConc(A)(x) = (µA (x))2 , para x ∈ U Modificador del conjunto difuso A, hace más ancha la función de pertenencia: µDilat(A)(x) = (µA (x))0,5 , para x ∈ U. Tabla 2.1: Operaciones entre Conjuntos Difusos.. 2.3.. Sistemas Difusos. Antes de abordar el concepto de Sistema Difuso, es importante recordar el de la inferencia difusa. Esta consiste en la combinación de proposiciones para crear proposiciones más completas. Por ejemplo, al combinar la proposición “X es A”, con la proposición “IF X es A THEN Y es B”, se puede inferir la 19.

(41) proposición Y es B. Sin embargo, en la lógica difusa estas dos proposiciones no necesariamente deben ser idénticas, debido a que los lı́mites de los conjuntos no son precisos, ya que un elemento pertenece parcialmente a este. Las sentencias de inferencia mencionadas anteriormente permiten obtener conjuntos difusos a partir de la combinación de proposiciones con reglas de la forma IF ...THEN ... Un sistema de lógica difusa aprovecha esos mecanismos como el motor de cálculo de un sistema cuyas entradas y salidas son números concretos [27]. En la Figura 2.5 se muestra la estructura básica de un sistema difuso, el cual se compone de unos conjuntos difusos de entrada y salida compuestos por funciones de pertenencia, un bloque de bases difusas de dimensión M y un bloque de inferencia (proposiciones IF - THEN).. Figura 2.5: Esquema General de Sistema Difuso. Fuente: Autores del Proyecto. Cada una de las variables de entrada y de salida tiene una representación dentro del sistema de lógica lifusa en forma de variables lingüı́sticas. Una variable lingüı́stica tiene, entre otras cosas, una colección de atributos que puede adquirir tanto la variable, como cada atributo, donde estos están representados por determinados conjuntos difusos. 20.

(42) 2.3.1.. Sistemas Difusos Adaptativos. Para Kwong y Passino en [28], un sistema difuso que cuente con una etapa de entrenamiento, se considera un sistena difuso adaptativo (adaptive fuzzy system). Los mecanismos de entrenamiento se caracterizan por ser una serie de algoritmos que le permiten al sistema cambiar su diseño para ajustarse a algunas exigencias especı́ficas (clasificación, regresión, identificación). Los algoritmos de entrenamiento usualmente sólo se encargan de ajustar el diseño de una parte del sistema difuso, por lo general se habla de la base de reglas, o la definición de las variables lingüı́sticas. Sin embargo, en ocasiones se encargan de ambas cosas, mientras que para otros parámetros los ajustes debe seleccionarlos el usuario. En la Figura 2.6 se muestra el esquema general de un sistema difuso adaptativo. En esta se observa, el bloque de realimentación “Learning Module” que a diferencia de la Figura 2.5 este no se encuentra.. Figura 2.6: Esquema General de Sistema Difuso Adaptativo. Fuente: Autores del Proyecto Dado lo mencionado por Kwong y Passino en [28], se puede profundizar esta idea trayendo a colación una parte del estudio realizado por Salam I. y Al-Jebory K. En [29]. Estos autores mencionan que al igual que en el esquema general de los sistemas difusos, en los sistemas adaptativos el resultado 21.

(43) de dar diferentes interpretaciones a las reglas de inferencia difusa IF-THEN, también generan diferentes conjuntos que componen el motor de inferencia difusa. Además, que existen diferentes tipos de fuzzifiers y defuzzifiers y que al variar diferentes parámetros dentro de cada uno de estos bloques, se constituye un sistema de lógica difusa muy versátil, ya que, esa variación o ajuste de parámetros se realiza a través de una red en lazo cerrado, que no es más, que el concepto inicial del algoritmo “backpropagation”, el cual se puede implementar para desarrollar la etapa de entrenamiento. La definición de entrenamiento dentro de los sistemas difusos da lugar a dos conceptos muy relevantes en la teorı́a de la inteligencia artificial, puntualmente del Machine Learning, estos son; el aprendizaje supervisado y no supervisado. 2.3.1.1.. Aprendizaje Supervisado. Esta es una técnica con la cual se encuentra una función no lineal que se adpata a las necesidades de determinado problema, a partir de datos de entrenamiento. En el caso de los problemas de regresión, la salida de la función es un valor numérico, mientras que para el caso de los clasificadores se estima a la salida una etiqueta de clase. Según Cunningham P, Cord M. y Delany S. En [30], el concepto de un aprendizaje supervisado evoca, como su nombre lo indica, la participación de un “interventor”que instruye al sistema de aprendizaje por medio de la formación de etiquetas, las cuales se asocian a los ejemplos de entrenamiento. Dentro de los algoritmos que se emplean para este tipo de aprendizaje se destacan; backpropagation, árboles de decisión, clasificador bayesiano sencillo y el método de regresión logı́stica. 2.3.1.2.. Aprendizaje No Supervisado. El término aprendizaje no supervisado o como es recurrente en la literatura “aprendizaje sin maestro”, es una técnica en la que el alumno, en este caso el sistema, recibe exclusivamente datos de entrenamiento no etiquetados, generalmenente, trata los datos de entrada como un conjunto de variables aleatorias, luego hace predicciones para todos los datos de validación, que son aquellos que jamás ha visto. El clustering y la reducción de la dimensionalidad son problemas que se resuelven a partir de aprendizaje sin supervisión [31].. 22.