• No se han encontrado resultados

Propuesta de sistema de reconocimiento de color piel evaluado en imágenes aéreas capturadas dentro de ambientes urbanos por medio de vehículo aéreo no tripulado (VANT)

N/A
N/A
Protected

Academic year: 2020

Share "Propuesta de sistema de reconocimiento de color piel evaluado en imágenes aéreas capturadas dentro de ambientes urbanos por medio de vehículo aéreo no tripulado (VANT)"

Copied!
152
0
0

Texto completo

(1)PROPUESTA DE SISTEMA DE RECONOCIMIENTO DE COLOR PIEL EVALUADO EN IMÁGENES AÉREAS CAPTURADAS DENTRO DE AMBIENTES URBANOS POR MEDIO DE VEHÍCULO AÉREO NO TRIPULADO (VANT). Brayan Steven Garzón Villabón Daniel Felipe González Becerra. Universidad Distrital Francisco José de Caldas Facultad de Ingenierı́a Bogotá D.C - Colombia 2018.

(2) Trabajo de Grado Requisito para optar por el tı́tulo de Ingeniero Electrónico. Brayan Steven Garzón Villabón 20102005062 [email protected] Daniel Felipe González Becerra 20102005004 [email protected]. Director: MSc. Julián Rolando Camargo López Profesor Asociado Laboratorio de Automatización, Sistemas Embebidos y Robótica (LASER) Facultad de Ingenierı́a. Universidad Distrital Francisco José de Caldas Facultad de Ingenierı́a Proyecto Curricular de Ingenierı́a Electrónica Bogotá D.C - Colombia 2018.

(3) Evocando a la memoria de mi padre Luis Jaime González... Con tu esencia a donde vaya, por este logro y los que vienen.... Daniel Felipe González Becerra. II.

(4) A mis padres, Don Jaime y Doña Luz que incondcionalmente me apoyaron a lo largo de estos años. A mis hermanos. Ejemplo de dedicación, responsabilidad y superación. A los muchachos y en memoria de Leonardo... Agradecido con la vida de conocerlos y compartir la carrera a su lado. Daniel F. González B.. A mi madre por su amor fidedigno, a mi padre por su silente apoyo, a mi hermano por enseñarme el amor sempiterno y a mis hermanas a las que amo. Brayan S. Garzón V.. III.

(5) Resumen Este libro muestra los resultados y el desarrollo de un trabajo de grado que inició en el año 2017 y culmina iniciando el año 2018, bajo la disciplina del Laboratorio de Automatización, Sistemas Embebidos y Robótica (LASER). LASER tiene como misión buscar el desarrollo del conocimiento en Automatización, Sistemas Embebidos, Robótica y Sistemas Inteligentes, para brindar soluciones integrales que permitan mejorar los procesos en el sector industrial, entre otros aspectos. Siendo la robótica y en mayor medida el desarrollo de sistemas inteligentes el punto de partida de este proyecto. Una de las temáticas que ha cobrado interés dentro del grupo de investigación es la aplicación de herramientas tecnológicas como lo son los Vehı́culos Aéreos No Tripulados (VANT), también conocidos por sus siglas en inglés UAV. Implementándolos en diversas tareas, por ejemplo, en la búsqueda de la tecnificación de los sectores agrı́colas que se encuentran rezagados con respecto a las industrias internacionales. Este trabajo tuvo como fin desarrollar una herramienta tecnológica basada en la clasificación de los valores tı́picos en las componentes RGB que correspondı́an al color piel, para posteriormente evaluar su respuesta frente a imágenes aéreas que se encontraban en un entorno urbano y que además contaron con presencia de personas. Dichas tomas, se realizaron por medio de la implementación de una cámara deportiva WiFi, la cual se adaptadó a un VANT de ala rotatoria. En primera instancia se realizó una revisión del contexto teórico del proyecto; desde una introducción a la Face Recognition Technology, pasando por el reconocimiento de piel y sus caracterı́sticas. Además se realizó un estudio a cerca de la teorı́a de conjuntos difusos, sistemas de inferencia difusa (FIS), sistemas de inferencia nuero difusa adaptativa (ANFIS), clasificadores basados en ANFIS, criterios de evaluación estadı́sticos para clasificadores, hasta conceptos más técnicos; mecánica de vuelo, tipos de VANT y su implementación en tareas de monitoreo. Además, como aspecto importante, la búsqueda de antecedentes en el área del reconocimiento de patrones humanos y su aplicación conjunta con los VANT. Luego, se encontró una base de datos que se acopló a las necesidades del trabajo. Para esto, se realizó la búsqueda en el UCI Machine Learning Repository, donde se encontró la “Skin Segmentation Data Set”; ésta se obtuvo IV.

(6) del muestreo aleatorio de los valores R, G, B de las imágenes faciales de diferentes grupos de edad (jóvenes, adultos y adultos mayores), grupos raciales (blanco, negro y asiático) y géneros obtenidos de la base de datos FERET, por sus siglas en inglés (Face Recognition Technology) y del PAL ( Productive Aging Laboratory). Posteriormente, se desarrolló el sistema de clasificación de pı́xeles correspondientes al color piel teniendo en cuenta los atributos de la base de datos. Donde el tamaño de ésta fue de 245057; de los cuales 50859 correspondı́an a las muestras de piel y 194198 a muestras no cutáneas. Básandose en la teorı́a de los ANFIS, se configuraron los parámetros de inicialización (constante de aprendizaje α, número de épocas, conjuntos de pertenencia para la entrada y la salida, número de reglas, entre otros.); con el fin de establecer la mejor respuesta. Para determinar la mejor respuesta del clasificador se aplicaron, como criterios de evaluación estadı́sticos, el cálculo de la Especificidad y la Sensibilidad, que a la postre sirvieron para trazar la curva ROC (por sus siglas en inglés Receiver Operating Characteristic). Una vez hechas estas consideraciones, se realizó la captura de imágenes. En esta etapa se manipuló y se estableció la ruta de sobrevuelo del VANT. El vehı́culo implementado fue el 3DR Iris- autonomous multicopter, al cual se adaptó la cámara deportiva WiFi GoPro Hero3. Las imágenes capturadas respondı́an a un entorno urbano que contó con la presencia de personas, además de cumplir unas caracterı́sticas de altura y hora del dı́a. Una vez cumplida esta etapa, la adquisición de datos se realizó mediante el establecimiento de una red WiFi que contaba con el mini servidor web de la cámara y la computadora principal, siendo esta última en la que se llevó a cabo el proceso de evaluación del clasificador. Por último, se presentaron los resultados arrojados por la experimentación y se realizó el respectivo análisis de estos; a partir de la variación de parámetros de inicialización en el ANFIS en la búsqueda de la mejor respuesta y el resultado del reconocimiento del color piel en cada una de las imágenes capturadas desde el VANT con base en ésta.. V.

(7) Agradecimientos En medio del alivio, la nostalgia y la alegrı́a que significa alcanzar el primero de muchos logros, es importante destacar que este tı́tulo no sólo representa el final de esta etapa académica. También representa el aprendizaje de muchas lecciones de vida, quizás en palabras quede corto, pero las vivencias a lo largo de estos años complementan la satisfacción de este momento. De ningún modo fue algo fácil, como todo en la vida, hay momentos buenos y otros no tanto, por eso escribir estas lı́neas de agradecimiento, quedan cortas para expresar la gratitud hacia esas personas que me acompañaron y fueron sustento durante toda la carrera. A los muchachos: Alex, Cristian, Danilo, Diego, Felipe, los Migueles, Sergio, Leonardo (Q.E.P.D) y Mery; estaré eternamente agradecido por su incondicionalidad, por su amistad, por esa solidaridad que los caracteriza, porque a pesar de las dificultades siempre nos mantuvimos juntos como grupo. Alguna vez se los dije: valió la pena la forma en la que decidimos afrontar esta carrera, porque eso nos acercó aun más como personas y eso es lo que queda para siempre. No puedo, dejar de lado un espacio especial para mi compañero de tesis, a Brayan le agradezco ese sentimiento tan parecido al amor de hermano, sé que tanto para él como para mı́, fue un año muy duro, pero juntos salimos adelante, cuando alguno iba tirar la toalla ahı́ estaba el otro para levantarlo. Alguna vez veı́amos tan lejano todo esto y hoy por fin, llenos de orgullo, terminamos este duro trabajo, que al igual que a los muchachos, le agradeceré por siempre haberme acompañado en los momentos duros, por su solidaridad, por su incondiconalidad y su paciencia. Como no, al pilar sobre el que se edifica mi vida, a mi familia... Sin ellos, nada de esto hubiera sido posible, gracias a ellos soy la persona que soy, gracias a ellos tuve la oportunidad de comenzar este desafı́o. A mis padres, a mis hermanos, a mis tı́os, a mis primos y sobrinos, que de alguna u otra forma sirvieron de impulso para alcanzar esta meta. Por esa unión que nos caracteriza y el legado de los que ya no nos acompañan, espero que esto sea el inicio del repunte, después de varios meses duros en el que vimos partir a algunos de nuestros seres queridos.. Daniel González Agradecimientos a mi familia en general, por su apoyo emocional y económico, es evidente que sin ellos no lo hubiese logrado. A las dos únicas personas VI.

(8) que he amado a las cuales les agradezco su cariño durante esta etapa y a las que amo con una predilección inconmensurable. A mis amigos y compañeros de universidad, no tuve la fortuna de tener un hermano contemporáneo pero con ustedes pude sentir una docena de ellos, gracias. A mis educadores, en especial al profesor Julián Camargo no solo por recibir y dirigir nuestra propuesta sino también por sus enseñanzas en clase. A todos ellos y a cada uno de los que me permitieron estar en su vida. Esto es de ustedes, pues es hecho por mi amigo Dani y por mı́, y yo tan solo soy el producto de ustedes, la suma de las emociones que me permiten sentir, el resultado de los momentos que hemos vivido. “Solo un bobo cambiarı́a esto por algo tan común. . . ” le dice el abuelo George a Charlie cuando piensa vender su boleto único para la fábrica, ustedes son mi boleto y yo jamás seré un bobo. Brayan Garzón Agradecemos al grupo LASER y en especial a nuestro director, el ingeniero Julián Camargo , por su disposición, por su acompañamiento, sus consejos, su paciencia y por confiar en nosotros para llevar a cabo el desarrollo de este proyecto. Al ingeniero Miguel Melgarejo, por sus apreciaciones y reflexiones. Además, a cada uno de los profesores que nos formaron en este proceso. Queremos destacar la labor de los ingenieros César Perdomo, Julián Moreno y en general a la Red de Investigaciones de Tecnologı́a Avanzada (RITA), ya que desde el inicio del proyecto, mostraron toda la disposición para prestarnos asesorı́a y acompañamiento durante la captura de las imágenes y en general todo lo concerniente a los dispositivos implementados. Además, agradecemos la colaboración de los voluntarios para la captura de las fotografı́as. Fueron muy importantes los aportes de cada uno.. VII.

(9) Índice general Lista de figuras. XI. Lista de tablas. XIX. 1 Introducción 1.1 Planteamiento del Problema 1.2 Objetivos . . . . . . . . . . 1.2.1 Objetivo General . . 1.2.2 Objetivos Especı́ficos 1.3 Solución Propuesta . . . . . 1.4 Contenido del Libro . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. . . . . . .. 2 Marco de Referencia 2.1 Reconocimiento de Patrones Humanos . . . . . . . . . . . . . 2.1.1 Tecnologı́a de Reconocimiento Facial . . . . . . . . . . 2.1.2 Color de la Piel en Tareas de Reconocimiento . . . . . 2.1.2.1 Constancia de Color . . . . . . . . . . . . . . 2.1.2.2 Espacio de Color RGB . . . . . . . . . . . . . 2.1.2.3 Comportamiento de la Piel en el Espacio RGB a Cambios de Iluminación . . . . . . . . . . . 2.1.2.4 Algoritmo White Patch . . . . . . . . . . . . 2.2 Teorı́a de Conjuntos Difusos . . . . . . . . . . . . . . . . . . . 2.2.1 Lógica Difusa . . . . . . . . . . . . . . . . . . . . . . . 2.2.1.1 Variable Lingüı́stica . . . . . . . . . . . . . . 2.2.2 Funciones de Pertenencia . . . . . . . . . . . . . . . . . 2.2.2.1 Apoyo . . . . . . . . . . . . . . . . . . . . . . 2.2.2.2 Centro . . . . . . . . . . . . . . . . . . . . . . 2.2.2.3 Puntos de Cruce . . . . . . . . . . . . . . . . 2.2.3 Operaciones entre Conjuntos Difusos . . . . . . . . . . 2.2.3.1 Unión . . . . . . . . . . . . . . . . . . . . . . 2.2.3.2 Intersección . . . . . . . . . . . . . . . . . . . VIII. 1 2 2 2 3 3 4 5 5 6 9 9 10 11 12 14 14 15 15 16 16 16 16 17 17.

(10) 2.3. 2.4. 2.5. 2.2.3.3 Complemento . . . . . . . . . . . . . . . . . . Sistemas Difusos . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Sistemas Difusos Adaptativos . . . . . . . . . . . . . . 2.3.1.1 Aprendizaje Supervisado . . . . . . . . . . . . 2.3.1.2 Aprendizaje No Supervisado . . . . . . . . . . 2.3.2 Sistemas Difusos en Clasificación . . . . . . . . . . . . 2.3.3 Métodos de Evaluación en Clasificadores . . . . . . . . 2.3.3.1 Curva ROC . . . . . . . . . . . . . . . . . . . 2.3.3.2 Cross Validation . . . . . . . . . . . . . . . . Adaptive Neuro Fuzzy Inference System (ANFIS) . . . . . . . 2.4.1 Estructura ANFIS . . . . . . . . . . . . . . . . . . . . 2.4.1.1 Modelo Difuso Tipo Sugeno . . . . . . . . . . 2.4.1.2 Capas de ANFIS . . . . . . . . . . . . . . . . 2.4.2 ANFIS en Tareas de Reconocimiento . . . . . . . . . . Vehı́culo Aéreo No Tripulado (VANT) . . . . . . . . . . . . . 2.5.1 Clasificación de los VANT . . . . . . . . . . . . . . . . 2.5.1.1 Clasificación por el Peso . . . . . . . . . . . . 2.5.1.2 Clasificación por Autonomı́a de Vuelo y Alcance 2.5.1.3 Clasificación por Altitud Máxima de Operación . . . . . . . . . . . . . . . . . . . . . . . 2.5.1.4 Espectro de los Drones . . . . . . . . . . . . 2.5.2 Drones en Tareas de Rescate y Reconocimiento . . . . 2.5.2.1 Antecedentes de Drones en Colombia . . . . .. 3 Diseño de Sistema de Reconocimiento de Color Piel Evaluado en Imágenes Aéreas dentro de Ambientes Urbanos por medio de VANT 3.1 Solución a Desarrollar . . . . . . . . . . . . . . . . . . . . . 3.2 Conjunto de Datos . . . . . . . . . . . . . . . . . . . . . . . 3.3 Inicialización del ANFIS . . . . . . . . . . . . . . . . . . . . 3.3.1 Determinación de la Mejor Respuesta . . . . . . . . . 3.4 Captura de Imágenes por Medio de VANT . . . . . . . . . . 3.4.1 Drone 3D Iris . . . . . . . . . . . . . . . . . . . . . . 3.4.2 T-2D Tarot Gimbal . . . . . . . . . . . . . . . . . . . 3.4.2.1 Conexión Gimbal - 3D Iris . . . . . . . . . . 3.4.3 Cámara GoPro HERO 3+ . . . . . . . . . . . . . . . 3.4.4 Plan de Vuelo . . . . . . . . . . . . . . . . . . . . . . 3.5 Procesamiento de Imágenes . . . . . . . . . . . . . . . . . . 3.6 Validación del FIS a través de las Imágenes Procesadas . . . 4 Resultados. . . . . . . . . . . . .. 18 19 21 22 22 23 23 23 25 27 27 27 29 31 33 34 34 35 36 36 39 41. 43 43 44 45 46 46 46 47 48 50 51 54 55 57. IX.

(11) 4.1. 4.2. 4.3. 4.4 4.5. ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Conjunto de Datos de Entrada . . . . . . . . . . . . . 4.1.2 Evaluación Clasificador Piel - No Piel . . . . . . . . . 4.1.2.1 Especificidad, Sensibilidad, Exactitud y Precisión . . . . . . . . . . . . . . . . . . . . . 4.1.2.2 Curva ROC . . . . . . . . . . . . . . . . . . Imágenes Aéreas . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Adquisición de Datos . . . . . . . . . . . . . . . . . . 4.2.2 Fotografı́as GoPro . . . . . . . . . . . . . . . . . . . Procesamiento de Imágenes Aéreas . . . . . . . . . . . . . . 4.3.1 Algoritmo Gray World . . . . . . . . . . . . . . . . . 4.3.2 Algoritmo Coordenadas Cromáticas . . . . . . . . . . Segmentación por medio de FIS . . . . . . . . . . . . . . . . 4.4.1 Rendimiento . . . . . . . . . . . . . . . . . . . . . . . Análisis General . . . . . . . . . . . . . . . . . . . . . . . . .. . 57 . 59 . 60 . . . . . . . . . . .. 60 61 62 62 64 66 66 67 68 71 72. 5 Conclusiones y Trabajos Futuros 75 5.1 Resumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.2 Aportes Originales . . . . . . . . . . . . . . . . . . . . . . . . 77 5.3 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . 77 A Anexo. 79. B Anexo. 89. C Anexo. 99. Referencias. 124. X.

(12) Índice de figuras 2.1. Ejemplo: cálculo de descriptor LBP. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Ponderación de bloques en escala de grises usando descriptores LBP. Fuente: Ahonen [11], Nikisins y Greitans [12] . . . . . . . 2.3 Representación del modelo de color RGB. Fuente: Molinero [14] 2.4 Caracterı́sticas de una Función de Pertenencia. Fuente: Carreño [22] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5 Esquema General de Sistema Difuso. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.6 Esquema General de Sistema Difuso Adaptativo. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . 2.7 Esquema General Método K-fold Cross Validation. Fuente: Andreini, De Falco, Sassu [39] . . . . . . . . . . . . . . . . . . 2.8 Esquema General ANFIS para dos Entradas. Fuente: Roger Jang J [41]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.9 Espectro de los Drones desde UAV hasta SD. Fuente: Hassanalian & Abdelkefi [48]. . . . . . . . . . . . . . . . . . . . . . . 2.10 MAV Ala Fija LA100. Fuente: Smashing Robotics [56] . . . . 2.11 MAV Ala Rotatoria. Fuente: Flying AG [58] . . . . . . . . . . 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9. Esquema General de Desarrollo. Fuente: Autores del Proyecto Conjunto de Datos. Fuente: Bhatt & Dhall [2] . . . . . . . . . 3D Robotics IRIS. Fuente: Autores del Proyecto. . . . . . . . Dispositivo T-2D Tarot Gimbal. Fuente: Google images - HobbyKing.com [67]. . . . . . . . . . . . . . . . . . . . . . . . . . . . Vista superior del gimbal, placa de conexiones. Fuente: Gimbal User Guide [68]. . . . . . . . . . . . . . . . . . . . . . . . . . . Conexión gimbal - Iris. Fuente: Autores del Proyecto. . . . . . Cámara GoPro HERO 3+ Silver Edition. Fuente: Google Images - Snapsort.com [69]. . . . . . . . . . . . . . . . . . . . . . WiFi Remote. Fuente: WiFi Remote User Manual [70]. . . . . Punto donde se llevará a cabo el vuelo. Fuente: Google Maps. XI. 7 8 10 16 20 21 26 31 37 37 38 44 45 47 48 49 49 50 51 52.

(13) 3.10 Configuración del punto de la estación terrena y carga sostenida por el gimbal. Fuente: Autores del Proyecto. . . . . . . . 53 4.1 4.2 4.3 4.4 4.5 4.6. 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15. Estructura ANFIS MATLAB toolbox. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aproximación de la función no lineal que describe el sistema de clasificación. Fuente: Autores del Proyecto . . . . . . . . . Conjunto de 40.000 datos de entrada al ANFIS. Fuente: Bhatt & Dhall [2]. . . . . . . . . . . . . . . . . . . . . . . . . . . . Curva ROC que describe el rendimiento del clasificador Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . Puesta a punto del drone con la estación terrena. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . Pasos 1 y 2: Opciones avanzadas en las configuraciones de red para verificar la dirección IP del servidor. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Paso N◦ 3: Dirección IP del “servidor” GoPro y acceso este. Fuente: Autores del Proyecto . . . . . . . . . . . . . . . . . . Paso N◦ 4: Servidor web de la cámara GoPro y localización de las fotografı́as capturadas. Fuente: Autores del Proyecto . . . 3D Iris drone durante el vuelo. Fuente: Autores del Proyecto Fotografı́a aérea tomada aproximadamente a 5 metros de altura. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . Fotografı́a aérea tomada aproximadamente a 3 metros de altura. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . Resultado de la implementación del algoritmo Gray World. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . Resultado de la implementación del algoritmo de conversión a coordenadas cromáticas. Fuente: Autores del Proyecto. . . . Segmentación sin etapa previa de procesamiento. Fuente: Autores del Proyecto. . . . . . . . . . . . . . . . . . . . . . . . Segmentación con cada uno de los algoritmos implementados. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . .. . 58 . 58 . 59 . 61 . 62. . 63 . 64 . 64 . 65 . 65 . 66 . 67 . 68 . 69 . 70. A.1 Implementación del algoritmo gray world para imagen aérea del entorno a baja altura. Fuente: Autores del proyecto. . . . . 79 A.2 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. 79 A.3 Implementación del algoritmo gray world para imagen aérea del entorno desde otro ángulo. Fuente: Autores del proyecto. . 80 XII.

(14) A.4 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.5 Implementación del algoritmo gray world para imagen aérea con un voluntario a altura media. Fuente: Autores del proyecto. A.6 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.7 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. A.8 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. A.9 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.10 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios a altura media. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.11 Implementación del algoritmo gray world para imagen aérea con un voluntario a gran altura. Fuente: Autores del proyecto. A.12 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. A.13 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. A.14 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.15 Implementación del algoritmo gray world para imagen aérea con un voluntario a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.16 Implementación del algoritmo gray world para imagen aérea del entorno a gran altura. Fuente: Autores del proyecto. . . . . A.17 Implementación del algoritmo gray world para imagen aérea con dos voluntarios a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.18 Implementación del algoritmo gray world para imagen aérea del entorno a mediana altura. Fuente: Autores del proyecto. . A.19 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. A.20 Implementación del algoritmo gray world para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. XIII. 80 80. 81 81 81. 82. 82 82 83 83. 83. 84 84. 84 85 85 85.

(15) A.21 Implementación del algoritmo gray world para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. A.22 Implementación del algoritmo gray world para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. A.23 Implementación del algoritmo gray world para imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . A.24 Implementación del algoritmo gray world para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . A.25 Implementación del algoritmo gray world para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.26 Implementación del algoritmo gray world para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . A.27 Implementación del algoritmo gray world para imagen aérea con un voluntario posición fetal a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.1 Implementación del algoritmo de coordenadas cromáticas para imagen aérea del entorno. Fuente: Autores del proyecto. . . . B.2 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.3 Implementación del algoritmo coordenadas cromáticas para imagen aérea del entorno desde otro ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.4 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.5 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . B.6 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.7 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . XIV. 86 86. 86. 87. 87. 87. 88. . 89. . 89. . 90. . 90. . 90. . 91. . 91.

(16) B.8 Implementación del algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.9 Implementación del algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . B.10 Implementación algoritmo coordenadas cromáticas para imagen aérea con cuatro voluntarios a media altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.11 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.12 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.13 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.14 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.15 Implementación algoritmo coordenadas cromáticas para imagen aérea con un voluntario a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.16 Implementación del algoritmo coordenadas cromáticas para imagen aérea del entorno a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.17 Implementación algoritmo coordenadas cromáticas para imagen aérea con dos voluntarios a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . B.18 Implementación algoritmo coordenadas cromáticas para imagen aérea del entorno a mediana altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.19 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.20 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios a gran altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . XV. . 91. . 92. . 92. . 92. . 93. . 93. . 93. . 94. . 94. . 94. . 95. . 95. . 95.

(17) B.21 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.22 Implementación algoritmo coordenadas cromáticas para imagen aérea con tres voluntarios posición fetal. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.23 Conversión a coordenadas cromáticas en imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.24 Conversión a coordenadas cromáticas para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.25 Conversión a coordenadas cromáticas para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B.26 Conversión a coordenadas cromáticas para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . B.27 Implementación del algoritmo coordenadas cromáticas para imagen aérea con un voluntario posición fetal a baja altura. Fuente: Autores del proyecto. . . . . . . . . . . . . . . . . . C.1 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno. Fuente: autores del proyecto. . . . C.2 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.3 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno desde otro ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.4 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . C.5 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.6 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . XVI. . 96. . 96. . 96. . 97. . 97. . 97. . 98. . 99. . 100. . 101. . 102. . 103. . 104.

(18) C.7 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 C.8 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 C.9 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 107 C.10 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios a media altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 108 C.11 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 C.12 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 C.13 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 C.14 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 112 C.15 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 C.16 Segmentación con cada uno de los métodos aplicados para imagen del entorno a gran altura. Fuente: autores del proyecto. 114 C.17 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios a diferente ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . 115 C.18 Segmentación con cada uno de los métodos aplicados para imagen aérea del entorno a mediana altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 C.19 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios a gran altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 C.20 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios posición fetal. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 XVII.

(19) C.21 Segmentación con cada uno de los métodos aplicados para imagen aérea con tres voluntarios posición fetal. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . . . . . . C.22 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario posición fetal a diferente ángulo. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.23 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios posición fetal, uno erguido. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.24 Segmentación con cada uno de los métodos aplicados para imagen aérea con dos voluntarios en posiciones diferentes. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . . . . . C.25 Segmentación con cada uno de los métodos aplicados para imagen aérea con cuatro voluntarios en posiciones diferentes. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . . C.26 Segmentación con cada uno de los métodos aplicados para imagen aérea con un voluntario posición fetal a baja altura. Fuente: autores del proyecto. . . . . . . . . . . . . . . . . . .. XVIII. . 119. . 120. . 121. . 122. . 123. . 124.

(20) Índice de tablas 2.1 2.2 2.3 2.4 2.5 2.6 2.7. 2.8. 4.1. Operaciones entre Conjuntos Difusos. . . . . . . . . . . . . . Resultado de una Prueba Binaria General . . . . . . . . . . Categorı́as de Drones Basado en su Peso. Fuente: L. BrookeHolland [53] . . . . . . . . . . . . . . . . . . . . . . . . . . . Categorı́as de Drones Basado en su Peso - Australia (no oficial). Fuente: Arjomandi [54] . . . . . . . . . . . . . . . . . Categorı́as de Drones Basado en su Autonomı́a de Vuelo y Radio de Alcance. Fuente: Arjomandi [54] . . . . . . . . . . Categorı́as de Drones Basado en su Altitud Máxima de Operación Fuente: Arjomandi [54] . . . . . . . . . . . . . . . . . Resultados de los cálculos de Precisión y Exhaustividad para Imágenes de Superficies Homogéneas Fuente: Sven Gotovac, Vladan Papić y Željko Marušić [62]. . . . . . . . . . . . . . Resultados de los cálculos de Precisión y Exhaustividad para Imágenes de Superficies Hetereogéneas Fuente: Sven Gotovac, Vladan Papić y Željko Marušić [62]. . . . . . . . . . . . . .. . 19 . 25 . 34 . 35 . 36 . 36. . 40. . 40. Tiempo de ejecución promedio de los algoritmos empleados en la etapa de procesamiento. . . . . . . . . . . . . . . . . . . . . 71.

(21) XX.

(22) Capı́tulo 1 Introducción “La ciencia no es sino una perversión de sı́ misma, a menos que tenga como objetivo final el mejoramiento de la humanidad” Nikola Tesla Albert Einstein dijo: “Temo el dı́a en que la tecnologı́a sobrepase nuestra humanidad”. Si bien, cuando dijo esto se referı́a a la visión que tenı́a respecto a la clase de personas que habitarı́an la tierra, lo que se vive hoy en dı́a no dista mucho, en cuanto a que la humanidad llegó al punto en el que sus avances podrı́an ser tan nocivos como positivos, dependiendo del enfoque que se les de. A criterio de los autores, este momento puede marcar el cambio de una sociedad absorbida por un constante ambiente de conflicto y desesperanza. Muestra de ello, es el enfoque que se le ha dado a la tecnologı́a VANT, ya que inicialmente se vio como un complemento para la industria armamentı́stica, pero hoy se puede ver en diferentes aplicaciones en las que adopta el rol de una herramienta tecnológica en la resolución de problemas que aquejan a la sociedad actual. Una aplicación que podrı́a generar controversia entre la opinión pública, es el reconocimiento facial combinado con los VANT, ya que podrı́a verse como una invasión a la privacidad, como también en una herramienta útil en el reconocimiento de vı́ctimas en desastres naturales. Este proyecto tiene como finalidad, entregar una propuesta de desarrollo que complemente, en parte, esta temática dentro del territorio nacional, ya que debido a su geografı́a es propenso a eventos de esa ı́ndole..

(23) 1.1.. Planteamiento del Problema. La incursión en el mundo actual de los VANT, conocidos por las siglas UAS (Unmanned Aerial System) o RPAS (Remotely Piloted Aircraft System) o UAV, han posibilitado la creación de nuevas técnicas de apoyo en actividades remotas de monitoreo para diferentes áreas de estudio. Los VANT, se han implementado en los últimos años como una plataforma multipropósito. Por ejemplo, en la adquisición de imágenes remotas con un gran número de aplicaciones en movilidad, cartografı́a, termografı́a, entre otros. Que en conjunto con el desarrollo de nuevos métodos de reconocimiento y detección de patrones en el marco de la visión artificial, hacen de estos, herramientas completamente versátiles y con una mayor funcionalidad. Según un análisis realizado por la Association for Unmanned Vehicle Systems International (AUVSI) en el año 2013, titulado El impacto económico de la integración del sistema aeroespacial no tripulado en la economı́a de los EE.UU, los mercados civiles más prometedores son la agricultura de precisión y la seguridad pública, representando entre los dos el 90 % de los mercados potenciales conocidos para los VANT [1] . Para el caso de la seguridad pública, es importante la búsqueda de nuevas herramientas tecnológicas que faciliten las tareas de ubicación y detección de personas, ya sea para impulsar el desarrollo de sistemas de seguridad o el de sistemas de monitoreo de peatones, como también el de los sistemas de control poblacional o los sistemas de rescate. Conociendo el desarrollo y los alcances de esta área, se pretende resolver la pregunta que da inicio a este proyecto: ¿Es posible el desarrollo de una herramienta tecnológica, basada en el reconocimiento de los valores de las componentes RGB que corresponden al color piel y evaluarla en imágenes aéreas con presencia de personas. Esto con el fin de analizar su respuesta y ası́, apoyar al estudio en la detección de las mismas?. 1.2. 1.2.1.. Objetivos Objetivo General. Desarrollar un sistema de reconocimiento de color piel y analizar su respuesta en imágenes aéreas, las cuales serán capturadas por medio de un VANT. 2.

(24) 1.2.2.. Objetivos Especı́ficos. − Encontrar una base de datos adecuada para llevar a cabo las etapas de entrenamiento y validación del sistema de clasificación de pı́xeles color piel y no piel. − Considerar un sistema de reconocimiento a partir de aprendizaje supervisado, con base en la teorı́a ANFIS. − Determinar la mejor respuesta del ANFIS evaluando su resultado a diferentes parámetros de inicialización dentro de un determinado número de pruebas. − Realizar una captura de imágenes aéreas, las cuales cuenten con la presencia de personas. Además de cumplir ciertas caracterı́sticas de altura y hora del dı́a dentro de un ambiente urbano, por medio de una cámara deportiva WiFi adaptada a un VANT. − Analizar la respuesta del sistema de reconocimiento de color piel en las imágenes aéreas luego de ser descargadas desde el servidor web de la cámara a la computadora.. 1.3.. Solución Propuesta. Este documento tiene como fin mostrar el desarrollo de una propuesta, mediante el seguimiento de una metodologı́a fundamentada en el contexto teórico que lo compone; espacios de color, FIS, ANFIS y VANT. Esta propuesta es elaborada a partir del uso de la herramienta matemática de software MATLAB R . Inicialmente, se debı́a encontrar una base de datos acorde al problema de clasificación “epidérmica”. En este caso, se encontró una compuesta de determinados atributos, ésta es de dimensión 245057 * 4, dónde las primeras tres columnas son valores R, G, B (x1, x2 y x3) y la cuarta columna es la del tipo de clase a la que pertenece la combinación de las tres primeras columnas (variable de decisión y) [2],[3]. Una vez examinada la distribución de las dos clases, se desarrolla el sistema de clasificación a partir de la teorı́a ANFIS. Donde un 70 % de la base de datos es implementada para la etapa de entrenamiento, mientras que el 30 % restante se emplea en la etapa de validación.. 3.

(25) Acto seguido, se determina la mejor respuesta a diferentes parámetros de inicialización, por medio del cálculo de diferentes parámetros estadı́sticos (especificidad, sensibilidad, Exactitud) y el trazo de la curva ROC. Una vez terminado el desarrollo del clasificador, se realiza la captura de imágenes aéreas cumpliendo con ciertas caracterı́sticas; altura, horario y entorno (urbano). Con las imágenes capturadas se realiza una etapa de procesamiento digital, en la que se pretende corregir el efecto de las variaciones de iluminación dentro de éstas. Finalmente se valida el sistema en general, implementando el clasificador en el reconocimiento de las personas que aparezcan en estas imágenes corregidas.. 1.4.. Contenido del Libro. El documento muestra el planteamiento del problema y la pregunta de investigación como punto de partida para el desarrollo del proyecto de grado. En el segundo capı́tulo se aborda el marco de referencia, en el cual se da un breve repaso de los temas que encierran al proyecto, es decir, en este capı́tulo el lector se acerca a temas relacionados con el desarrollo de sistemas difusos, la implementación de ANFIS, criterios de evaluación para clasificadores, sistemas de reconocimiento dérmico, VANT, tipos de VANT y sus aplicaciones, entre otros. El siguiente capı́tulo tiene como fin explicar el desarrollo de la propuesta a partir del marco de referencia expuesto en el capı́tulo anterior. En él, se sigue la metodologı́a de la sección 1.3. El capı́tulo cuatro expone el mejor de los resultados obtenidos a partir de la variación de parámetros del ANFIS, la implementación de éste a través de fuzzy toolbox, el cálculo de la especificidad, sensibilidad y área bajo la curva ROC del clasificador, algunas de las fotografı́as aéreas capturadas a través del VANT y la aplicación del sistema en general sobre éstas. Finalmente, las conclusiones a las que se llegaron luego de desarrollar el trabajo, de la misma manera que los aportes y las propuestas para trabajos futuros son mostradas en el quinto capı́tulo. Para ası́, culminar con las referencias bibliográficas que sustentaron el contenido teórico-práctico del libro.. 4.

(26) Capı́tulo 2 Marco de Referencia “Según vamos adquiriendo conocimiento, las cosas no se hacen más comprensibles, sino más misteriosas.” Albert Schweitzer En este capı́tulo se dan a conocer los conceptos relacionados con el contexto del proyecto, para ası́, comenzar a dilucidar una eventual respuesta al problema planteado en secciones anteriores.. 2.1.. Reconocimiento de Patrones Humanos. Ciertamente los mejores sistemas de reconocimientos de patrones los poseen los seres humanos, en la mayorı́a de escenarios somos capaces de identificar patrones en nuestro entorno como lo son caracteres, rostros, voces, entre otros. Sin embargo, el deseo de solucionar problemas que aquejan a la sociedad, sin que eso llegue a ponerlas en riesgo, va de la mano con la aparición de nuevas herramientas basadas en la inteligencia artificial. Las aplicaciones tienen diversos enfoques, aunque para lo que concierne a este proyecto, se destacan aquellas en las que el reconocimiento de personas tiene fines de rescate, vigilancia, seguridad, entre otros [4], [5], [6]. Para el diseño de sistemas artificiales de reconocimiento de patrones se tienen en cuenta los siguientes aspectos [7]: − Adquisición y pre-procesamiento de los datos. − Representación de los datos..

(27) − Preparación. − Toma de decisiones. En la actualidad este proceso es usado en cualquier área de la ciencia e ingenierı́a que estudie la estructura de las observaciones. Es frecuentemente usado en la industria manufacturera, cuidado de la salud y en el contexto militar.. 2.1.1.. Tecnologı́a de Reconocimiento Facial. También conocida en la academia por sus siglas en inglés Face Recognition Technology (FERET). Una de las primeras formas de reconocimiento y por ende, una de las más utilizadas, es la del reconocimiento facial. Ésta generalmente se basa en la biometrı́a del rostro, es decir, que esta hace referencia al análisis de las caracterı́sticas y las medidas tı́picas de los patrones faciales (ojos, nariz, cejas, boca, etc) [8]. Por ejemplo, Marek Loderer, Jamila Pavlovičová ,Miloš Oravec & Ján Mazanec en [9], realizan un estudio sobre la importancia de resaltar determinadas regiones del rostro en la disciplina del reconocimiento facial para imágenes en escala de grises. En la que introducen caracterı́sticas del descriptor LBP (Local Binary Patterns por sus siglas en inglés) y la distancia medida entre los pı́xeles que resalta éste. Antes de mostrar las conclusiones a las que llegaron en [9] es necesario dar un breve acercamiento al concepto del descriptor LBP. Lo que se busca con este método es distinguir los objetos de interés por sobre el resto. Para el caso del reconocimiento facial, se pretende distinguir principalmente la boca, los ojos y la nariz. En el cálculo de los LBP se define una vecindad del pı́xel de interés y luego se comparan los niveles de gris de éste con respecto a los de sus vecinos. En la Figura 2.1 como vecindad se define a todos aquellos pı́xeles que tocan el pixel central. Allı́ estos números; siete, dos, ocho, nueve, seis, uno, tres, son los niveles de gris en este ejemplo. Una vez identificado los vecinos se aplica la regla que se muestra en ésta. Además se escoge también un orden al momento de evaluar los vecinos, este es arbitrario pero de ahı́ en adelante se respeta para todos los pı́xeles centrales. En este caso se inicia con el pı́xel de valor “dos”, luego se continúa con el “tres”, y ası́ sucesivamente en sentido antihorario. Como hay ocho vecinos, en realidad esto es un byte donde 6.

(28) evidentemente cada bit tendrá un valor de cero o uno según el resultado de aplicar esta regla a cada uno de los vecinos. Y como esto es código binario, se puede simplificar expresándolo en su forma decimal. La suma de los valores en decimal de los pı́xeles en los que la regla dio uno da un total de 168. Por lo tanto, el código LBP de ese pı́xel central es 168 [9],[10].. Figura 2.1: Ejemplo: cálculo de descriptor LBP. Fuente: Autores del Proyecto. Una vez aterrizado este concepto, se puede traer a colación la respuesta de los diferentes algoritmos de ponderación que fueron objeto de estudio en [9] que posteriormente se convirtieron en punto de partida para realizar una propuesta que integrara las caracterı́sticas LBP y la distancia medida entre los pı́xeles que éstas resaltaran.. Un primer acercamiento a los antecedentes de los descriptores LBP en reconocimiento facial, se muestran en toda una sección del artı́culo mencionado, siendo los mostrados a continuación los más destacados. En la Figura 2.2 se muestran dos imágenes en escala de grises en las que se implementan diferentes algoritmos de ponderación con el fin de destacar las zonas de interés del rostro [9], [11], [12]. 7.

(29) (a) Imagen Origi- (b) Pı́xeles destanal caso 1 cados caso 1. (c) Tomada base (d) Método de resalto de datos FERET caso 2. Figura 2.2: Ponderación de bloques en escala de grises usando descriptores LBP. Fuente: Ahonen [11], Nikisins y Greitans [12] En la Figura 2.2b. Ahonen optimizó el descriptor LBP, además, definió el tamaño de las celdas y su respectivo valor de intensidad. Adicional a esto, agregó, que la forma de las celdas no necesita ser rectangular, ya que éstas no tienen que abarcar todas las partes de la imagen, sino unicamente las que comprenden el rostro. Una vez calculado el descriptor LBP, se concluyó que los patrones faciales respondieron a cierta simetrı́a, aunque por la muestra de las regiones resaltadas probablemente el cálculo biométrico no sea el ideal y por ende el reconocimiento pueda fallar [11]. En el caso de la Figura 2.2d Nikisins y Greitans [12] clacularon el descriptor LBP básandose en dos criterios; el primero, para el valor caracterı́stico de cada celda (cuadrı́cula roja), mientras que el segundo fue para el valor de una región determinada (grupo de celdas). Finalmente, el segundo criterio obtuvo mejores resultados en el cálculo biométrico y a la postre en el reconocimiento como tal.. 8.

(30) Una de las mayores contribuciones del trabajo fue la determinación de un método que unificara lo mejor de cada una de las técnicas expuestas. El cual conciste en encontrar el peso óptimo de cada una de las caracterı́sticas de los descriptores LBP, ya que es uno de los métodos utilizados con más frecuencia en el reconocimiento facial [9], [10].. 2.1.2.. Color de la Piel en Tareas de Reconocimiento. Si bien el reconocimiento basado en la biometrı́a del rostro es uno de los métodos más utilizados, éste tiene ciertas limitaciones cuando se requiere implementar en planos más amplios. Es por eso, que nuevas alternativas asoman con el fin de ampliar el campo de acción y profundizar el estudio de la identificación humana dentro del marco de la inteligencia artificial. Una de esas alternativas es realizar un reconocimiento basado en el color de la piel. Este consiste en determinar el valor de las componenetes cromáticas del espacio de color a los cuales corresponda la piel dentro de determinadas imágenes. Existen varios espacios de color, estos se definen como una representación matemática de los colores, es decir, esta representación no es más que una asociación de un vector con un elemento en un espacio. Entre estos se destacan; el RGB, CMYK, HSL y HSV, aunque algunos de estos presentan limitaciones a variaciones en la iluminación a la hora de la captura de imágenes.. 2.1.2.1.. Constancia de Color. La constancia del color es una caracterı́stica que tiene el ser humano con respecto a la percepción del color. Esta consiste en que la mayorı́a de las superficies parecen mantener la composición cromática ante cualquier cambio en la iluminación. En otras palabras, los colores se siguen percibiendo de la misma manera, como si éstos fueran un atributo constante e invariable de los objetos. Este fenómeno es muy particular, dado que la manera en la que incide la luz a través del ojo desde una superficie, puede cambiar significativamente según cuál sea la fuente de luz. No obstante, esto no se da siempre, ya que algunos objetos no mantienen su aspecto al estar bajo otro tipo de iluminación, tal como lo son las luces ultravioletas o en algunos casos bajo la influencia de radicaciones monocromáticas.. 9.

(31) En el caso de la visión por computadora, las imágenes capturadas por las cámaras no mantienen esta constancia. Como se verá en las secciones 2.1.2.2 y 2.1.2.3, hay diferentes espacios de color en el que el factor iluminación influye de manera significativa en la composición de las componentes cromáticas y es ahı́ donde se debe intentar mitigar el efecto de las variaciones de luz en las imágenes. 2.1.2.2.. Espacio de Color RGB. El espacio RGB, llamado ası́ por sus siglas en inglés Red, Green, Blue, está basado en el concepto de la sı́ntesis aditiva. El cual se refiere a la composición de los colores a través de la suma de distintos haces de luz, emitidos directamente por una fuente de algún tipo a diferentes longitudes de onda. Dentro de la sı́ntesis aditiva el blanco es considerado como la suma de las componentes espectrales primarias; rojo, verde y azul en proporción máxima respecto al espectro visible [13]. En el espacio RGB cualquier color F se puede representar mediante la combinación lineal de las tres componentes primarias independientes, tal cual como se muestra en la Figura 2.3a .. (a) Componentes primarias RGB. (b) Modelo RGB coordenadas cartesianas. Figura 2.3: Representación del modelo de color RGB. Fuente: Molinero [14] Donde F está dada por:. F = rR + gG + bB 10. (2.1).

(32) En el caso de las variables r, g, b, estos son escalares que indican la proporción de cada una de las componentes primarias contenidas en F , el cual puede normalizarse como se muestra a continuación [13].. F = R0 R + G0 G + B 0 B. (2.2). Donde: g b r ; G0 = ; B0 = (2.3) r+b+g r+b+g r+b+g Para el caso de la Figura 2.3b se evidencia lo descrito anteriormente. Aunque en este caso, se muestra el modelo RGB representado en coordenadas cartesianas. En esta Figura, el espacio está descrito por el hexaedro que se forma a partir de las tres dimensiones correspondientes a cada una de las componentes primarias, las cuales se encuentran en tres vértices, por otro lado; cian, magenta y amarillo se observan en otros tres vértices, cada uno con sus respectivas coordenadas, las cuales estarı́an determinadas por el valor de los escalares r, g, b que se expresaron en la ecuación 2.1. En cuanto al negro, éste corresponde al origen y el blanco se sitúa en el vértice más alejado del mismo. Dada esta particularidad, la escala de grises ese extiende lo largo de la diagonal que une esos dos puntos. Finalmente la composición de los demás colores estarı́a dada por la existencia de diversos puntos contenidos en el hexaedro y definidos por los vectores que se trazan desde el origen hasta cada uno de ellos [14]. R0 =. 2.1.2.3.. Comportamiento de la Piel en el Espacio RGB a Cambios de Iluminación. Como se ya se ha mencionado anteriormente, las tareas de reconocimiento a partir del color de la piel aun siguen teniendo vigencia y por lo tanto, cualquier detalle pasa a tener gran relevancia a la hora de encontrar aplicaciones más precisas y completas. Uno de esos detalles que puede determinar el rendimiento de un sistema de reconocimiento basado en el color de la piel, es la iluminación y aún más cuando el espacio de color en el que se trabaja es el RGB. Basándose en lo descrito en [15] , J.B. Martinkauppi coincide con que el espacio de color en el que se procesan los datos de la piel, tienen cierta incidencia en la detección de la misma. Puesto que estos difieren el uno del otro en la 11.

(33) forma en la que se pueden asignar los valores de cada una de sus componentes principales y por consiguiente la separación de ciertos colores. Aunque este autor no descarta la mezcla de varios espacios de color para mitigar el impacto de en este caso, la iluminación por fuentes externas. Dado lo anterior, se trae a colación la propuesta presentada en [16]. Allı́ Tomaschitz y Facon muestran los resultados del desarrollo de una técnica de reconocimiento de piel de diferentes grupos étnicos (asiático, caucásico, negro, etc ...), mediante la combinación de algunos espacios de color (rgb, HSV, TSL). Estos autores demuestran que es posible localizar regiones de piel sin la necesidad de realizar una etapa de clasificación previa y todo gracias a extraer las caracterı́siticas más relevantes de cada uno de los espacios de color que abordaron dentro de la metodologı́a. A pesar de que esta propuesta presenta muy buenos resultados, la parte que más se ajusta al enfoque que se le dio a este proyecto tiene que ver con la forma en la que los autores trataron de mitigar el impacto de la iluminación en el espacio RGB. Ya que como dice J.B. Martinkauppi en [15], una conversión de espacio de color no elimina ni los cambios de cromaticidad debido a la iluminación ni tampoco los efectos causados por el ruido. Es por esto, que si bien la combinación de espacios tomaba la mejor caracterı́stica de cada uno a la hora de separar colores, esta no hacia frente a posibles pérdidas. La forma en la que Tomaschitz y Facon [16] disminuyeron los efectos de la iluminación variable en el espacio RGB, fue normalizando éste, aunque a diferencia del método mostrado en la sección 2.1.2.2, allı́ se multiplica por un escalar c tal como se muestra a continuación: r=. cG cB cR ;g = ;b = R+G+B R+G+B R+G+B. (2.4). Donde r + g + b = 1 y la constante c = 100. La notación para este espacio RGB normalizado será rgb. 2.1.2.4.. Algoritmo White Patch. En algunas oportunidades el sistema visual del ser humano normaliza los valores de la intensidad lumı́nica percibida por sus canales oculares. Este proceso es una caracterı́stica intrı́nseca que se explicó en la sección 2.1.2.1, la cual realiza con respecto a una referencia; esta es un blanco hipotético. 12.

(34) A este proceso se lo llama mecanismo de Parche Blanco “White Patch”. La normalización permite maximizar los valores con respecto al valor del blanco hipotético, donde este, es el valor máximo de luminosidad en la imagen percibida. Teniendo en cuenta la premisa del White Patch, se podrı́a afirmar que al menos existe un pixel o un “parche de pı́xeles” blancos en la imagen [17]. Cuando se realiza la captura de una imagen, el valor de cada pı́xel dependerá de la respuesta de los tres filtros del sensor que compone parte de la cámara, en los cuales tiene determinada incidencia la iluminación. El valor obtenido en cada pı́xel también está relacionado con la temperatura del color de la fuente de luz. Ası́, cuando un objeto blanco es iluminado por un color de temperatura baja, tiende a aparecer rojizo dentro de la imagen capturada. Por el contrario, si el objeto es iluminado bajo un color de temperatura alta aparecerá con un tono azulado, es decir, el color de la escena en la imagen varı́a según la fuente de iluminación bajo la cual fue tomada. Para solucionar este problema Montero [18] emplea una técnica llamada balance de blancos. El balance de blancos utiliza algoritmos computacionales que emulan la constancia de color, con el fin de que los colores de la imagen capturada permanezcan iguales sin importar la temperatura de color bajo la que se encuentren. Es decir, el balance minimiza el efecto de la iluminación I(λ), y asegura que la respuestas del sensor R, G y B se correlacionen con la reflectancia del objeto R(λ) [18], [19]. Uno de estos algoritmos computacionales es el White Patch (WP), el cual tiene en cuenta el valor más grande en cada componente de color como una representación del blanco de la imagen. Computacionalmente, white patch es encontrado al buscar la máxima intensidad en cada canal, y está dado por:. Iimax = maxfi (x, y). (2.5). Donde, la f i(x, y) es la intensidad del pı́xel en la posición (x, y) de una imagen o un cuadro de vı́deo e, Ii es el iluminante en la escena. El ı́ndice i corresponde al canal de color en la imagen [20].. 13.

(35) 2.2.. Teorı́a de Conjuntos Difusos. Zadhe y M. L. Carreño definen los conjuntos difusos en [21] y [22] respectivamente como, un conjunto sin un lı́mite definido. Donde la pertenencia o no, de un elemento dentro de un conjunto no responde a la premisa fundamental del contexto binario, en la cual se admiten únicamente dos estados; verdadero o falso. Por el contrario, en el contexto de la lógica difusa la pertenencia es gradual y se caracteriza por una función. Estos conjuntos que son definidos de forma imprecisa desempeñan un rol trascendental en la concepción humana, peculiarmente en tareas de reconocimiento de patrones, de la comunicación de la información y de la abstracción. Un conjunto difuso A en X se puede definir como:. A = {(x, µA (x))|x ∈ X}. (2.6). Donde µA (x) es la función de pertenencia al conjunto difuso. A continuación, se verán explicados brevemente algunos de los concepctos más relevantes en el contexto de la teorı́a difusa.. 2.2.1.. Lógica Difusa. Planteada en 1965 por quien es considerado el padre de la teorı́a de la posibilidad, Lofti Zadhe, en su libro “fuzzy sets” [21]. Este concepto de lógica toma dos valores aleatorios, pero con un grado de relación entre sı́. De esta manera, por ejemplo, para el caso del reconocimiento de color piel, un sujeto que tenga un ı́ndice de pigmentación ◦ ITA entre 10 y 27 (el Ángulo Tipológico Individual ◦ ITA, es considerado como una medida de la pigmentación de la piel) es muy probable que se le considere una persona de tez negra, si previamente se ha tomado la referencia de una persona de tez blanca y se haya establecido un ◦ ITA mayor a 55. Ambos valores se desenvuelven en el contexto de la pigmentación y su referencia data de una medida metrica lineal. Este concepto de lógica difusa toma relevancia ya que se acerca más a las expresiones usadas cotidianamente. Dado que con esta se puede definir un valor cuantificable para expresiones que pueden definir caracterı́sticas de personas u objetos tales como “es una persona muy blanca”, hasta aquellas que definen situaciones en particular como “la temperatura del horno es muy alta”. 14.

(36) 2.2.1.1.. Variable Lingüı́stica. Concepto introducido por Zadhe [23] y tratado por Rutkowska en [24], con el fin de establecer una base para el razonamiento aproximado, dice Rutkowska: “por una variable lingüı́stica se quiere decir que se trata de una variable cuyos valores son palabras u oraciones en un lenguaje natural o artificial. La motivación para el uso de palabras o de oraciones en lugar de números es que las caracterizaciones lingüı́sticas son, en general, menos precisas que los valores numéricos”.. 2.2.2.. Funciones de Pertenencia. Se dice que un elemento x pertenece a un conjunto difuso A de manera parcial, por tal motivo, existe un indicador que mide dicho grado de pertenencia al conjunto. De acuerdo a la ecuación 2.6 existe asociada una función de pertenencia µA (x) para sus elementos, que indica en que medida el elemento forma parte de ese conjunto difuso. Este grado de pertenencia que indica la función, está dado por el intervalo entre 0 y 1, siendo 1 el valor para máxima pertenencia. De manera formal, el valor de cada elemento x está definido por la función µA (x) : X → [0, 1], donde X representa el universo del que el conjunto A toma sus elementos. Si el valor de esta función es 0 x no pertenece a A, mientras que si el valor de la función es 1 entonces x ∈ A completamente y por último si 0 < µA (x) < 1 se dice que x ∈ A de manera parcial [22], [25]. Aunque en principio cualquier función serı́a válida para definir conjuntos difusos, en realidad existen ciertas funciones tı́picas que se suelen usar, ya que definirlas, computacionalmente hablndo, no son las hace un tarea robusta y esto conlleva a que la determinación de su valor lingüı́stico asociado sea más sencillo. Las funciones utilizadas más frecuentemente son las de tipo trapezoidal, singleton, triangular (T), tipo S, exponencial, tipo Π (forma de campana). En la Figura 2.4 se muestra una función de pertenencia de tipo gaussiana, en ella Carreño resalta las partes más importantes y realiza una breve descripción de estas, tal como se muestra en las subsubsecciones siguientes. 15.

(37) Figura 2.4: Caracterı́sticas de una Función de Pertenencia. Fuente: Carreño [22] 2.2.2.1.. Apoyo. Para el conjunto difuso A el apoyo es el compendio de todos los puntos x para los cuales la función de pertenencia µA (x) > 0. 2.2.2.2.. Centro. En un conjunto difuso A es el conjunto de todos los puntos para los cuales la función de pertenencia µA (x) = 1. 2.2.2.3.. Puntos de Cruce. Son los puntos del conjunto difuso para los cuales µA (x) = 0,5.. 2.2.3.. Operaciones entre Conjuntos Difusos. Al igual que en la teorı́a de conjuntos clásica, en la teorı́a difusa existen las operaciones básicas entre conjuntos; unión, intersección y complemento. Esto abre paso para un concepto muy utilizado en los sistemas difusos y es el del razonamiento difuso, el cual está fundamentado en las proposiciones difusas, 16.

(38) que no son más que la asignación de un valor a una variable lingüı́stica, por ejemplo: “la altura de Brayan es mediana”. Una proposición difusa tiene por tanto asociado un conjunto difuso A (el valor lingüı́stico asignado, mediana en este caso) y su correspondiente función de pertenencia µA (x) definida sobre los elementos del universo x ∈ X[26]. 2.2.3.1.. Unión. Al igual que en el caso clásico se puede declarar una axiomática intuitiva para la unión de dos conjuntos difusos. Sea: µA∪B (x) = u(µA (x), µB (x)). (2.7). Donde: u : [0, 1]x[0, 1] → [0, 1] Al cumplir con las propiedades de nulidad, asociatividad, conmutatividad, identidad y homogeneidad se les denomina normas - T [26]. 2.2.3.2.. Intersección. En la teorı́a clásica, se considera que un elemento x pertenece al conjunto intersección si pertenece a cado uno de los conjuntos involucrados. En el caso de la teorı́a difusa, esta consiste en determinar el grado de pertenencia al conjunto intersección. Sea: µA∩B (x) = i(µA (x), µB (x)). (2.8). Donde: i : [0, 1]x[0, 1] → [0, 1] Al igual que el caso de la unión, se debe cumplir con las propiedades de conmutatividad, asociatividad, identidad, homogeneidad y además con la concordancia con el caso nı́tido [26]. Al comprobar cada uno de esos axiomas, se dice que el conjunto tiene estructura de semigrupo abeliano con elemento neutro. Por ende, las funciones i que verifican esta propiedad se denominan dentro de la teorı́a de conjuntos difusos normas triangulares (normas - T ). 17.

(39) 2.2.3.3.. Complemento. Dado un conjunto A, se considera como el conjunto complementario de A a los elementos del universo que no pertenecen a este. En el caso difuso, este conjunto se define por una función de pertenencia que se calcula para cada elemento a partir de su pertenencia al conjunto A. Es decir:. µĀ (x) = c(µA (x)). (2.9). Siendo c una función definida como:. c : [0, 1] → [0, 1]. La cual dado el grado de pertenencia al conjunto A, podrı́a dar lugar a obtener el grado de pertenencia al conjunto complementario (Ā). Esta función c debe cumplir con las propiedades de involución y decrecimiento estricto como también con el caso de concordancia con el caso nı́tido [26].. Por último, en la Tabla 2.1 se muestra de manera resumida las principales operaciones entre conjuntos difusos y su notación matemática formal [22]. 18.

(40) Operación Contención o Subconjunto Unión. Intersección. Complemento. Producto Cartesiano. Co-Producto Cartesiano Norma Concentración. Dilatación. Definición A es un subconjunto de B sı́ y sólo sı́ µA (x) ≤ µB (x), para todo x. A ⊆ B ⇔ µA (x) ≤ µB (x) La unión de los conjuntos difusos A y B es el conjunto C, y se escribe como C = A ∪ B o C = A OR B, su función de pertenecia está dada por: µC (x) = max(µA (x), µB (x)) = µA (x) ∨ µB (x). La intersección de los conjuntos difusos A y B es el conjunto difuso C, y se escribe como C = A ∩ B o C = A AND B, su función de pertenencia está dada por: µC (x) = min(µA (x), µB (x)) = µA (x) ∧ µB (x). El complemento del conjunto difuso A, está denotado por Ā (¬A, NOT A ), se define como: µĀ (x) = 1 − µA (x). Si A y B son conjuntos difusos en X y Y , el producto cartesiano de los conjuntos A y B, A x B en el espacio X x Y tiene la función de pertenencia: µA×B (x, y) = min(µA (x), µB (y)). A + B en el espacio X x Y tiene la función de pertenencia: µA×B (x, y) = max(µA (x), µB (y)). Para un conjunto difuso A µN orma(A) (x) = µA (x) , para x ∈ U . max(µA (x)) Modificador del conjunto difuso A, hace más estrecha la función de pertenencia: µConc(A)(x) = (µA (x))2 , para x ∈ U Modificador del conjunto difuso A, hace más ancha la función de pertenencia: µDilat(A)(x) = (µA (x))0,5 , para x ∈ U. Tabla 2.1: Operaciones entre Conjuntos Difusos.. 2.3.. Sistemas Difusos. Antes de abordar el concepto de Sistema Difuso, es importante recordar el de la inferencia difusa. Esta consiste en la combinación de proposiciones para crear proposiciones más completas. Por ejemplo, al combinar la proposición “X es A”, con la proposición “IF X es A THEN Y es B”, se puede inferir la 19.

(41) proposición Y es B. Sin embargo, en la lógica difusa estas dos proposiciones no necesariamente deben ser idénticas, debido a que los lı́mites de los conjuntos no son precisos, ya que un elemento pertenece parcialmente a este. Las sentencias de inferencia mencionadas anteriormente permiten obtener conjuntos difusos a partir de la combinación de proposiciones con reglas de la forma IF ...THEN ... Un sistema de lógica difusa aprovecha esos mecanismos como el motor de cálculo de un sistema cuyas entradas y salidas son números concretos [27]. En la Figura 2.5 se muestra la estructura básica de un sistema difuso, el cual se compone de unos conjuntos difusos de entrada y salida compuestos por funciones de pertenencia, un bloque de bases difusas de dimensión M y un bloque de inferencia (proposiciones IF - THEN).. Figura 2.5: Esquema General de Sistema Difuso. Fuente: Autores del Proyecto. Cada una de las variables de entrada y de salida tiene una representación dentro del sistema de lógica lifusa en forma de variables lingüı́sticas. Una variable lingüı́stica tiene, entre otras cosas, una colección de atributos que puede adquirir tanto la variable, como cada atributo, donde estos están representados por determinados conjuntos difusos. 20.

(42) 2.3.1.. Sistemas Difusos Adaptativos. Para Kwong y Passino en [28], un sistema difuso que cuente con una etapa de entrenamiento, se considera un sistena difuso adaptativo (adaptive fuzzy system). Los mecanismos de entrenamiento se caracterizan por ser una serie de algoritmos que le permiten al sistema cambiar su diseño para ajustarse a algunas exigencias especı́ficas (clasificación, regresión, identificación). Los algoritmos de entrenamiento usualmente sólo se encargan de ajustar el diseño de una parte del sistema difuso, por lo general se habla de la base de reglas, o la definición de las variables lingüı́sticas. Sin embargo, en ocasiones se encargan de ambas cosas, mientras que para otros parámetros los ajustes debe seleccionarlos el usuario. En la Figura 2.6 se muestra el esquema general de un sistema difuso adaptativo. En esta se observa, el bloque de realimentación “Learning Module” que a diferencia de la Figura 2.5 este no se encuentra.. Figura 2.6: Esquema General de Sistema Difuso Adaptativo. Fuente: Autores del Proyecto Dado lo mencionado por Kwong y Passino en [28], se puede profundizar esta idea trayendo a colación una parte del estudio realizado por Salam I. y Al-Jebory K. En [29]. Estos autores mencionan que al igual que en el esquema general de los sistemas difusos, en los sistemas adaptativos el resultado 21.

(43) de dar diferentes interpretaciones a las reglas de inferencia difusa IF-THEN, también generan diferentes conjuntos que componen el motor de inferencia difusa. Además, que existen diferentes tipos de fuzzifiers y defuzzifiers y que al variar diferentes parámetros dentro de cada uno de estos bloques, se constituye un sistema de lógica difusa muy versátil, ya que, esa variación o ajuste de parámetros se realiza a través de una red en lazo cerrado, que no es más, que el concepto inicial del algoritmo “backpropagation”, el cual se puede implementar para desarrollar la etapa de entrenamiento. La definición de entrenamiento dentro de los sistemas difusos da lugar a dos conceptos muy relevantes en la teorı́a de la inteligencia artificial, puntualmente del Machine Learning, estos son; el aprendizaje supervisado y no supervisado. 2.3.1.1.. Aprendizaje Supervisado. Esta es una técnica con la cual se encuentra una función no lineal que se adpata a las necesidades de determinado problema, a partir de datos de entrenamiento. En el caso de los problemas de regresión, la salida de la función es un valor numérico, mientras que para el caso de los clasificadores se estima a la salida una etiqueta de clase. Según Cunningham P, Cord M. y Delany S. En [30], el concepto de un aprendizaje supervisado evoca, como su nombre lo indica, la participación de un “interventor”que instruye al sistema de aprendizaje por medio de la formación de etiquetas, las cuales se asocian a los ejemplos de entrenamiento. Dentro de los algoritmos que se emplean para este tipo de aprendizaje se destacan; backpropagation, árboles de decisión, clasificador bayesiano sencillo y el método de regresión logı́stica. 2.3.1.2.. Aprendizaje No Supervisado. El término aprendizaje no supervisado o como es recurrente en la literatura “aprendizaje sin maestro”, es una técnica en la que el alumno, en este caso el sistema, recibe exclusivamente datos de entrenamiento no etiquetados, generalmenente, trata los datos de entrada como un conjunto de variables aleatorias, luego hace predicciones para todos los datos de validación, que son aquellos que jamás ha visto. El clustering y la reducción de la dimensionalidad son problemas que se resuelven a partir de aprendizaje sin supervisión [31].. 22.

Figure

Figura 2.3: Representaci´ on del modelo de color RGB. Fuente: Molinero [14] Donde F est´ a dada por:
Figura 2.4: Caracter´ısticas de una Funci´ on de Pertenencia. Fuente: Carre˜ no [22]
Figura 2.5: Esquema General de Sistema Difuso. Fuente: Autores del Proyecto
Figura 2.6: Esquema General de Sistema Difuso Adaptativo. Fuente: Autores del Proyecto
+7

Referencias

Documento similar

• Descripción de los riesgos importantes de enfermedad pulmonar intersticial/neumonitis asociados al uso de trastuzumab deruxtecán. • Descripción de los principales signos

Debido al riesgo de producir malformaciones congénitas graves, en la Unión Europea se han establecido una serie de requisitos para su prescripción y dispensación con un Plan

Como medida de precaución, puesto que talidomida se encuentra en el semen, todos los pacientes varones deben usar preservativos durante el tratamiento, durante la interrupción

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Social Media, Email Marketing, Workflows, Smart CTA’s, Video Marketing. Blog, Social Media, SEO, SEM, Mobile Marketing,

• For patients with severe asthma and who are on oral corticosteroids or for patients with severe asthma and co-morbid moderate-to-severe atopic dermatitis or adults with

Administration of darolutamide (600 mg twice daily for 5 days) prior to co-administration of a single dose of rosuvastatin (5 mg) together with food resulted in approximately

A treatment effect in favour of luspatercept over placebo was observed in most subgroups analysed using transfusion independence ≥12 weeks (during week 1 to week 24),