• No se han encontrado resultados

Reconocimiento de granos de café verde arábiga sin defectos físicos en muestras usando visión artificial

N/A
N/A
Protected

Academic year: 2020

Share "Reconocimiento de granos de café verde arábiga sin defectos físicos en muestras usando visión artificial"

Copied!
55
0
0

Texto completo

(1)UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA FACULTAD DE INGENIERÍA DE PRODUCCIÓN Y SERVICIOS ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS TITULO PROFESIONAL DE INGENIERO DE SISTEMAS. RECONOCIMIENTO DE GRANOS DE CAFÉ VERDE ARÁBIGA SIN DEFECTOS FÍSICOS EN MUESTRAS USANDO VISIÓN ARTIFICIAL Tesis presentada por el Magister: Juan Ramirez Ticona Asesor: Ing. Pedro Rodrı́guez Gonzalez AREQUIPA-PERÚ 2017.

(2) Agradecimientos. Agradezco a Dios, mi familia y a los profesores que me brindaron su apoyo..

(3) Resumen El reconocimiento de granos de café verde arábiga sin defectos fı́sicos es importante desde el punto de vista comercial, dado que el café de la especie arábiga es un producto de alta demanda en el mercado internacional. Dicho reconocimiento es propenso a errores, debido a que actualmente es realizado en su mayorı́a de forma manual y subjetiva. Los principales trabajos que tratan este problema basados en visión artificial requieren de prototipos de adquisición, que toman cada imagen desde un ángulo completamente vertical con respecto a la superficie que contiene a la muestra de granos de café. Cada uno de estos prototipos es un limitante para labores prácticas debido a la dificultad de su implementación y al ángulo restrictivo. Por lo que el objetivo general de este trabajo es proponer un modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos en imágenes de muestras capturadas manualmente con un ángulo de toma diagonal usando visión artificial y basándose para el reconocimiento en el estándar de la Specialty Coffee Association of America (SCAA) [1]. La metodologı́a utilizada en este trabajo se divide en: adquisición de imágenes, mejora de imágenes, segmentación, extracción de caracterı́sticas, clasificación y comparación con otros trabajos. Los resultados obtenidos en este trabajo muestran que el reconocedor puede ser utilizado en aplicaciones reales debido a que se alcanzó un overall accuracy del 99.60%.. 3.

(4) Abstract The recognition of arabica green coffee beans without physical defects is important from a commercial point of view, since arabica green coffee beans is a product of high demand in the international market. Such recognition is error prone because it is now mostly done manually and subjective. The main work addressing this problem based on computer vision require acquisition of prototypes, taking each image from a completely vertical angle to the surface containing the sample of coffee beans. Each of these prototypes is a limiting factor for practical work because of the difficulty of implementation and the restrictive angle. Therefore, the general objective of this research is to propose a model for the automatic recognition of arabica green coffee beans without physical defects in images of manually captured samples with a diagonal angle of view with artificial vision and based for the recognition in the standard Specialty Coffee Association of America (SCAA) [1]. The methodology used in this work is divided into: image acquisition, image improvement, segmentation, extraction of characteristics, classification and comparison with other works. The results obtained in this work show that the recognizer can be used in real applications due to a 99.60% overall accuracy.. 4.

(5) Tabla de Contenidos 1 Planteamiento del problema 1.1 Descripción de la realidad problemática . . . . . . . . 1.2 Delimitaciones y definición del problema . . . . . . . 1.2.1 Delimitaciones . . . . . . . . . . . . . . . . . . 1.2.2 Definición del problema . . . . . . . . . . . . 1.3 Formulación del problema . . . . . . . . . . . . . . . 1.4 Objetivo de la investigación . . . . . . . . . . . . . . 1.4.1 Objetivo general . . . . . . . . . . . . . . . . 1.4.2 Objetivos especı́ficos . . . . . . . . . . . . . . 1.5 Hipótesis de la investigación . . . . . . . . . . . . . . 1.6 Variables e indicadores . . . . . . . . . . . . . . . . . 1.6.1 Variable independiente . . . . . . . . . . . . . 1.6.2 Variable dependiente . . . . . . . . . . . . . . 1.7 Viabilidad de la investigación . . . . . . . . . . . . . 1.7.1 Viabilidad técnica . . . . . . . . . . . . . . . . 1.7.2 Viabilidad operativa . . . . . . . . . . . . . . 1.7.3 Viabilidad económica . . . . . . . . . . . . . . 1.8 Justificación e importancia de la investigación . . . . 1.8.1 Justificación . . . . . . . . . . . . . . . . . . . 1.8.2 Importancia . . . . . . . . . . . . . . . . . . . 1.9 Limitaciones de la investigación . . . . . . . . . . . . 1.10 Tipo y nivel de la investigación . . . . . . . . . . . . 1.10.1 Tipo de investigación . . . . . . . . . . . . . . 1.10.2 Nivel de investigación . . . . . . . . . . . . . . 1.11 Método y diseño de la investigación . . . . . . . . . . 1.11.1 Método de la investigación . . . . . . . . . . . 1.11.2 Diseño de la investigación . . . . . . . . . . . 1.12 Técnicas e instrumentos de recolección de información 1.12.1 Técnicas . . . . . . . . . . . . . . . . . . . . . 1.12.2 Instrumentos . . . . . . . . . . . . . . . . . . 1.13 Cobertura de estudio . . . . . . . . . . . . . . . . . . 1.13.1 Universo . . . . . . . . . . . . . . . . . . . . . 1.13.2 Muestra . . . . . . . . . . . . . . . . . . . . . 1.14 Cronograma y presupuesto . . . . . . . . . . . . . . . 1.14.1 Cronograma . . . . . . . . . . . . . . . . . . . 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 10 10 11 11 11 11 12 12 12 12 13 13 13 14 14 14 14 14 14 15 15 15 15 15 16 16 16 16 16 16 17 17 17 17 17.

(6) 1.14.2 Presupuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.15 Estructura del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2 Estado del arte 2.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Fundamento teórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Granos de café verde arábiga . . . . . . . . . . . . . . . . . . . . . 2.2.2 Espacio de color RGB . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Constancia del color . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Visión artificial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.5 Descripción general de los trabajos que usan visión artificial para conocimiento de granos de café verde arábiga sin defectos fı́sicos . 2.2.6 White patch . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.7 Método de Otsu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.8 Máquinas de vectores de soporte . . . . . . . . . . . . . . . . . . . 2.3 Clasificación de trabajos . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Breve Descripción de los Trabajos y sus Logros . . . . . . . . . . 2.3.2 Métodos de segmentación . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Métodos de Extracción de Caracterı́sticas . . . . . . . . . . . . . . 2.3.4 Métodos de clasificación . . . . . . . . . . . . . . . . . . . . . . . 2.4 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . el re. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 19 19 19 19 19 20 21 21 23 23 25 28 28 29 29 30 31. 3 Modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos 3.1 Consideraciones iniciales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Muestras de café verde arábiga . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Adquisición de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Mejora de imágenes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 Segmentación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Extracción de caracterı́sticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Clasificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.1 Selección de los parámetros y validación del clasificador . . . . . . . . . . 3.8 Consideraciones finales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 32 32 34 36 39 39 41 41 42 43. 4 Resultados y discusión 4.1 Consideraciones iniciales . . . . . . . 4.2 Segmentación . . . . . . . . . . . . . 4.3 Selección de parámetros y validación 4.4 Comparación con otros trabajos . . . 4.5 Consideraciones finales . . . . . . . .. 45 45 45 46 46 49. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. . . . . .. 5 Conclusiones y trabajos futuros 50 5.1 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.2 Trabajos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 6 Trabajos publicados. 52. 6.

(7) Bibliografı́a. 52. 7.

(8) Índice de Tablas 1.1. Cantidad de granos de café verde arábiga por clase . . . . . . . . . . . . . . . . 17. 4.1 4.2 4.3 4.4. Cantidad de Imágenes de Granos de Café Verde Arábiga por Clase . . . . . . . . Overall accuracy para cada tamaño de datos por clase y proporción de prueba . Matriz de confusión de la propuesta . . . . . . . . . . . . . . . . . . . . . . . . . Comparación de algoritmos de constancia de color y extractores de caracterı́sticas. 8. 46 47 47 48.

(9) Índice de Figuras 1.1. Prototipo de adquisición tı́pico de los trabajos que tratan el reconocimiento de granos de café verde arábiga sin defectos fı́sicos [2]. . . . . . . . . . . . . . . . . 12. 2.1 2.2 2.3. Granos de café verde arábiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Espacio de color RGB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 Las etapas tı́picas de los trabajos que usan visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. . . . . . . . . . . . . . . . . 22. 3.1. Esquema del modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Los doce defectos fı́sicos de granos de café verde arábiga . . . . . . . . . . . . . Imágenes de granos de café verde arábiga sin defectos fı́sicos. . . . . . . . . . . . Prototipo de adquisición de imágenes utilizado en este trabajo para capturar las muestras de granos de café verde arábiga. . . . . . . . . . . . . . . . . . . . . . . Ejemplo del ángulo de toma diagonal para capturar muestras de granos de café verde arábiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Imagen de muestra de granos de café verde arábiga antes y después de aplicar el algoritmo de constancia del color WP. . . . . . . . . . . . . . . . . . . . . . . . . Pasos en el proceso de segmentación. . . . . . . . . . . . . . . . . . . . . . . . . Histogramas de intensidad por cada canal de color de un grano de café verde arábiga. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.2 3.3 3.4 3.5 3.6 3.7 3.8 4.1 4.2. 33 35 36 37 38 38 40 41. Los tres casos de error en la segmentación de granos de café. . . . . . . . . . . . 46 Overall accuracy para cada tamaño de datos por clase y proporción de prueba que varia del 10%-50%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48. 9.

(10) Capı́tulo 1 Planteamiento del problema 1.1. Descripción de la realidad problemática. Debido al actual gran incremento de la producción del café en el Perú [3] y al reducido pago por productos con defectos fı́sicos por parte de las cooperativas cafetaleras hacia los agricultores, existe la necesidad de crear soluciones computacionales que apoyen a los agricultores en el reconocimiento de granos de café verde arábiga sin defectos fı́sicos, ya que esto en su mayorı́a es realizado manualmente por ellos, quienes presentan las siguientes desventajas mostradas a continuación: • Sus capacidades de percepción varı́an dı́a a dı́a, lo que quiere decir que no van a tener sus sentidos la misma capacidad todo el tiempo, como por ejemplo la vista con el pasar del tiempo va a sentir cansancio visual debido a las largas horas que dura el reconocimiento. • Sus juicios pueden variar bajo la influencia de factores externos, uno de esos factores por ejemplo puede ser la iluminación ambiente, la que puede variar el color de los granos de café y hacer confundir al agricultor al tratar de reconocer el defecto. • No están libres de prejuicios, dado que los agricultores se dejan llevar por su experiencia y solo al ver una parte del grano de café ya dan por hecho que posee un defecto en particular, lo cual a veces da un error. • No tienen la misma habilidad que un experto, dado que al ser agricultores de granos de café tienen mayor experiencia en el cultivo, dado que la mayor parte de su tiempo la dedican a esa actividad, por lo que presentan una mayor inexperiencia que un experto lo que causa errores en el reconocimiento de defectos en el café. Además dicho reconocimiento es repetitivo lo que causa fatiga dado que el tiempo requerido para esto va desde los segundos a minutos.. 10.

(11) 1.2 1.2.1. Delimitaciones y definición del problema Delimitaciones. Debido a los problemas que trae el reconocimiento manual de granos de café verde arábiga sin defectos fı́sicos, se generó la necesidad de desarrollar soluciones computacionales basadas en visión artificial. La visión artificial es utilizada para el reconocimiento de objetos a través de la extracción de información cuantitativa de imágenes digitales con el objetivo de proporcionar información objetiva y de forma rápida [4]. Debido a esto, en los últimos años en la literatura han aparecido trabajos que recomiendan su uso en reemplazo de humanos expertos, para las tareas de reconocimiento de granos de arroz [5], semillas de soja [6], granos de trigo [7–9], granos de café [2, 10–15], granos de maı́z [16, 17], semillas de colza [18] y semillas de ricino [19]. Por tanto la delimitación del trabajo es el campo de la visión artificial aplicada al reconocimiento de granos de café verde arábiga sin defectos fı́sicos.. 1.2.2. Definición del problema. Los trabajos que tratan el reconocimiento de granos de café verde arábiga sin defectos fı́sicos usando visión artificial en la literatura presentan algunos problemas que son mencionados a continuación: • No están basados en un estándar de clasificación [10]. • Presentan errores en el reconocimiento [2, 10, 11, 13, 14] • Presentan problemas al segmentar los granos de café del fondo [13, 14] Además cada prototipo de estos trabajos requiere del uso de una cámara con soporte que toma cada imagen desde un ángulo completamente vertical con respecto a la superficie que contiene a la muestra de granos de café verde arábiga como se muestra en la Figura 1.1. Esta caracterı́stica de los prototipos realmente es una problema dado que si el ángulo de toma por alguna situación externa se modificará no se sabrı́a si funcionarı́a de la misma forma por falta de pruebas.. 1.3. Formulación del problema. El problema en este trabajo es realizar el reconocimiento de granos de café verde arábiga sin defectos fı́sicos usando visión artificial con las siguientes consideraciones: • El reconocimiento deberá estar basada en un estándar internacional. • Reconocer sin error. • Segmentar sin error los granos de café en la muestra. 11.

(12) Figura 1.1: Prototipo de adquisición tı́pico de los trabajos que tratan el reconocimiento de granos de café verde arábiga sin defectos fı́sicos [2]. • Permitir la captura de imágenes con ángulo diagonal. • El prototipo de adquisición de imágenes debe ser de fácil implementación.. 1.4. Objetivo de la investigación. 1.4.1. Objetivo general. El objetivo general es proponer un modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos en imágenes de muestras capturadas manualmente con un ángulo de toma diagonal usando visión artificial y basándose para el reconocimiento en el estándar de la SCAA.. 1.4.2 • • • • • •. 1.5. Objetivos especı́ficos. Construir un prototipo de adquisición de imágenes de fácil implementación. Adquirir imágenes digitales de muestras de granos de café verde arábiga. Uniformizar la iluminación de una imagen digital. Reconocer granos individuales en una imagen digital de muestra. Extraer caracterı́sticas de color de cada grano de café verde arábiga. Validar el modelo de clasificación.. Hipótesis de la investigación. El modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos en imágenes de muestras capturadas manualmente con un ángulo de toma diagonal usando visión artificial y basándose para el reconocimiento en el estándar de la SCAA, permitirá 12.

(13) reconocer granos de café verde arábiga sin defectos fı́sicos en imágenes tomadas con un ángulo de toma diagonal.. 1.6 1.6.1. Variables e indicadores Variable independiente. La variable independiente en este trabajo es el grano de café verde arábiga, dado que esta variable independiente una vez ingresada al modelo cambiará a la variable dependiente que es la salida del modelo, dependiendo si este grano presenta defecto fı́sico o no.. Indicadores El indicador es la intensidad de cada pı́xel del grano de café verde arábiga en cada uno de los canales del espacio de color RGB.. Índices El ı́ndice es las intensidades de cada canal de color del espacio RGB de cada pı́xel del grano de café verde arábiga que varı́a entre los valores enteros de 0 a 255.. 1.6.2. Variable dependiente. La variable dependiente en este trabajo es el resultado del reconocimiento, dado que la variable independiente aplicada al modelo permite obtener el resultado en el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos.. Indicadores El indicador es el overall accuracy la cual es una medida ampliamente utilizada en clasificadores para validar el modelo, es decir medir la confianza en los resultados.. 13.

(14) Índices El ı́ndice es el overall accuracy dado que solo se usa un indicador, además el overall accuracy se mide en una escala del 0% al 100%.. 1.7 1.7.1. Viabilidad de la investigación Viabilidad técnica. Para la realización de esta investigación se cuenta con el software y hardware necesario, además de las muestras de granos de café verde arábiga. Además se cuenta con los conocimientos necesarios en visión artificial y programación en C++ para desarrollar este proyecto.. 1.7.2. Viabilidad operativa. Debido a que esta investigación usará elementos de fácil acceso para la implementación del prototipo de adquisición de imágenes y el modelo será muy intuitivo debido a que reconocerá si el grano de café verde arábiga no presenta defectos fı́sicos, esto hará que sea de fácil uso y que no haya problemas al usarlo.. 1.7.3. Viabilidad económica. Debido a que esta investigación será realizada por una persona que cuenta con los conocimientos, software y hardware necesarios, esta investigación tendrá un costo bajo el cual es detallado en la Subsección 1.14.2 por lo que el beneficio será muy alto de venderse esta investigación.. 1.8 1.8.1. Justificación e importancia de la investigación Justificación. • Esta investigación proporcionará un modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos de fácil acceso y uso para los agricultores debido a la facilidad de su implementación y de no requerir de un ángulo de toma restrictivo. • Proporcionará una manera rápida y precisa de reconocer los granos de café verde arábiga sin defectos fı́sicos y ası́ hacer que los agricultores aumenten sus ingresos ya que obtendrán. 14.

(15) un producto de mayor calidad al no haber casi defectos fı́sicos en sus costales de café que venden a las cooperativas.. 1.8.2. Importancia. • Se aportará un prototipo de fácil implementación para la adquisición de imágenes al estado del arte actual. • Debido a que no usará un ángulo restrictivo como todos los prototipos en la literatura, será práctico para las labores de reconocimiento al brindar una mayor libertad al tomar las fotos. • Debido a que las imágenes luego de un procesamiento simularán haber sido adquiridas con iluminación uniforme, no se necesitará de un sistema de iluminación especializado.. 1.9. Limitaciones de la investigación. La limitación en este proyecto serán las muestras de granos de café verde arábiga que presentan defectos fı́sicos debido a que al existir una cantidad de defectos fı́sicos diferentes considerados por distintos estándares, se limitará a 12 de los 16 defectos fı́sicos considerados por la SCAA, debido a que la SCAA es reconocida a nivel mundial. Los 12 defectos fı́sicos considerados son los siguientes: brocado leve, brocado severo, cereza seca, concha, daño por hongos, flotador, inmaduro, agrio parcial, negro, negro parcial, pergamino y partido/mordido/cortado. Además otra limitación será que que solo se podrá adquirir información de una de las caras del grano de café verde arábiga debido a que serán colocadas en una plataforma.. 1.10. Tipo y nivel de la investigación. 1.10.1. Tipo de investigación. Es del tipo de investigación aplicada debido a que se pretende resolver un problema práctico el cual es reconocer automáticamente granos de café verde arábiga sin defectos fı́sicos para apoyar a los agricultores en esta labor debido a que lo realizan de forma manual.. 1.10.2. Nivel de investigación. Esta investigación es del nivel de estudio aplicativo porque se busca aplicar los conocimientos adquiridos en visión artificial para resolver problemas de reconocimiento de granos de café verde arábiga sin defectos fı́sicos. 15.

(16) 1.11. Método y diseño de la investigación. 1.11.1. Método de la investigación. El método en esta investigación es el método inductivo dado que se analizan casos particulares de muestras de granos de café verde arábiga, cuyos resultados al utilizar el modelo son tomados para extraer conclusiones de carácter general. A partir de las observaciones sistemáticas del reconocimiento automático de granos de café verde arábiga se descubre la generalización de ese resultado.. 1.11.2. Diseño de la investigación. El diseño de la investigación es experimental o de laboratorio debido a que se presentaron las siguientes etapas: • • • • • • •. Presencia de un problema para el cual sea realizada una revisión bibliográfica. Identificación y definición del problema. Definición de hipótesis, variables, indicadores e ı́ndices. Diseño del plan experimental. Prueba de confiabilidad de los datos. Realización del experimento. Tratamiento de datos.. 1.12. Técnicas e instrumentos de recolección de información. 1.12.1. Técnicas. La técnica de recolección de información en este trabajo es: • Histogramas de intensidad.. 1.12.2. Instrumentos. El instrumento de recolección de información en esta investigación es: • Una cámara de celular. 16.

(17) Tabla 1.1: Cantidad de granos de café verde arábiga por clase Clase. Cantidad. Defecto fı́sico. 420. Sin defecto fı́sico. 420. 1.13. Cobertura de estudio. 1.13.1. Universo. Todos los granos de café verde arábiga del mundo serı́a el universo o población en este trabajo dado que se trata de reconocer que granos de café verde arábiga no presentan defectos fı́sicos.. 1.13.2. Muestra. Debido a que no se puede contar con toda la población de granos de café verde arábiga del mundo se optó por contar con una cantidad de granos de café verde arábiga distribuida como se muestra en la Tabla 1.1, la cual fue proporcionada por la Central de Cooperativas Agrarias Cafetaleras de los Valles de Sandia (CECOVASA), Perú.. 1.14. Cronograma y presupuesto. 1.14.1. Cronograma. Actividades / Mes (1:Diciembre,12:Noviembre) (X = actividad por realizar, O = actividad realizada) Actividad/Mes 1 2 3 4 5 6 7 8 9 10 11 12 Revisión bibliográfica O O O O O O O O O O O O Adquirir imágenes de café O O O O O O O O O Uniformizar iluminación O O O Reconocer café O O O Extraer caracterı́sticas O O O O O O O O Validar el modelo O O O O O O O O Redactar articulo O O Redactar tesis O O O O Correcciones y conclusiones O O O. 17.

(18) 1.14.2. Presupuesto Concepto Pago investigador Laptop Cámara de celular Mesa Soportes cartulina Foco fluorescente Cartulina color turquesa Total. 1.15. Valor S/. 9600 S/. 2500 S/. 900 S/. 100 S/. 20 S/. 15 S/. 5 S/. 13140. Estructura del documento. En el Capı́tulo 2 se presenta el estado del arte, en el Capı́tulo 3 se presenta el modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos, en el Capı́tulo 4 se muestran los resultados obtenidos y una breve descripción de cada uno, en el Capı́tulo 5 se muestran las conclusiones y trabajos futuros, y finalmente en el Capı́tulo 6 se ven los trabajos publicados frutos de este trabajo.. 18.

(19) Capı́tulo 2 Estado del arte 2.1. Consideraciones iniciales. En esta sección se muestra el fundamento teórico y los trabajos que realizan el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. El fundamento teórico para entender este trabajo se muestra, explicando sobre lo siguiente: los granos de café verde arábiga, el espacio de color RGB, constancia del color, visión artificial y la descripción general de los trabajos que usan visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. Los trabajos que tratan dicho reconocimiento usando visión artificial en la literatura son clasificados según los métodos de segmentación, extracción de caracterı́sticas y clasificación.. 2.2 2.2.1. Fundamento teórico Granos de café verde arábiga. Los granos de café verde son las semillas de los frutos de la planta del café antes de ser tostadas. La principal especie comercial de granos de café verde es el arábiga [20]. En la Figura 2.1 es mostrado los granos de café verde arábiga.. 2.2.2. Espacio de color RGB. El espacio de color RGB trata los colores de la misma forma como el ojo humano los capta [2]. Los colores están representados por los canales R, G y B, que definen respectivamente las intensidades con que los colores primarios rojo, amarillo y azul están presentes. Por lo tanto, es un modelo aditivo, ya que el color está representado por la suma de los valores de sus canales. 19.

(20) Figura 2.1: Granos de café verde arábiga. Este espacio de color puede ser representado por un cubo donde cada uno de los canales que van de 0 a 255 (de 0-1 en algunas representaciones). El espacio de color RGB es importante porque es uno de los principales espacios de color utilizados en el proceso de captura de imágenes de las cámaras digitales, y por lo tanto la gran mayorı́a de las imágenes se almacenan utilizándolo [2]. En la Figura 2.2 se ve la representación gráfica del espacio de color RGB.. Figura 2.2: Espacio de color RGB.. 2.2.3. Constancia del color. La constancia del color es el fenómeno por el cual la percepción del color del objeto tiende a permanecer constante bajo cambios en la iluminación [21]. La constancia del color no es una propiedad de los objetos, es en realidad un fenómeno de percepción, el cual es el resultado de mecanismos en el ojo y el cerebro [22]. El procedimiento de cálculo de la constancia de color 20.

(21) incluye dos etapas: la estimación de parámetros de iluminación y el uso de estos parámetros para obtener el color de los objetos bajo una fuente de luz blanca [23]. El primer paso, la estimación de la iluminación, es importante en el cálculo de la constancia de color [23]. Hasta ahora, se han propuesto una serie de algoritmos de constancia de color principales que se centran en la estimación de la iluminación [23]. Estos algoritmos intentan simular la habilidad de constancia de color, mediante la transformación de una imagen de entrada capturada bajo condiciones de iluminación no controladas en otra imagen aparentemente obtenida bajo condiciones de iluminación controladas [24].. 2.2.4. Visión artificial. La visión artificial es una nueva tecnologı́a basada en procesamiento y análisis de imágenes, es utilizada para el reconocimiento de objetos a través de la extracción de información cuantitativa de imágenes digitales, con el objetivo de proporcionar información objetiva y de forma rápida. La visión artificial realiza esta tarea sin contacto con los objetos por lo que es no destructiva, sin embargo con los actuales avances en el procesamiento de imágenes y el aumento de las capacidades computacionales, la aplicación de la visión artificial se ha extendido a la evaluación de la calidad de los alimentos [2, 5–19].. 2.2.5. Descripción general de los trabajos que usan visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. Los trabajos que usan visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos utilizan las siguientes etapas tı́picas como se ven en la Figura 2.3, las cuales son: adquisición de imágenes, segmentación, extracción de caracterı́sticas y clasificación. Algunas de las principales cuestiones relacionadas con cada etapa se analizan a continuación.. Adquisición de imágenes La primera etapa en cualquier modelo de visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos, es un método de obtención de imágenes digitales. Los principales factores que intervienen en esta etapa incluyen: el dispositivo de adquisición de imágenes, la fuente de iluminación y el fondo.. Segmentación La segmentación es un método que permite dividir una imagen en regiones que faciliten reconocer los objetos de interés en la misma que son los granos de café verde arábiga, lo cual es 21.

(22) Figura 2.3: Las etapas tı́picas de los trabajos que usan visión artificial para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. una tarea difı́cil debido a la riqueza de la información visual en la imagen.. Extracción de caracterı́sticas En visión artificial las caracterı́sticas son abstracciones de la información en la imagen. Caracterı́sticas extraı́das de una imagen digital pueden incluir información relacionada con el color, la textura y la forma, de granos de café verde arábiga.. Clasificación En aprendizaje automático, el proceso de clasificación se refiere a un proceso algorı́tmico para asignar un punto de datos a uno, de un conjunto de clases. El punto de datos, también denominado una instancia o un ejemplo, consiste en un vector de caracterı́sticas que en conjunto presenta toda la información, que el clasificador tiene sobre los granos de café verde arábiga. La clasificación en aprendizaje automático suele ser un proceso supervisado, dado que el clasificador es primero entrenado con una selección de puntos de datos que un ser humano le ha proporcionado con los resultados correctos. El clasificador puede entonces deducir relaciones entre los resultados previstos y las caracterı́sticas de los puntos de datos, entonces será capaz de proporcionar una decisión de clasificación ante un nuevo punto de datos.. 22.

(23) 2.2.6. White patch. La relación de la intensidad del color bajo una fuente de luz en una imagen viene dada por:. fi (x, y) = G(x, y)Ri (x, y)Ii. (2.1). Donde fi (x, y) es la intensidad de un pı́xel en la posición (x, y), G(x, y) es un factor de geometrı́a, Ri (x, y) es la reflectancia del objeto, Ii es el iluminante, e i corresponde al canal de color. Una vez que se aplica White Patch (WP) [25] sobre una imagen f se obtiene la imagen de salida s la cual es definida en: si (x, y) = G(x, y)Ri (x, y)Ii0. (2.2). En donde el iluminante de salida I 0 = {1, 1, 1}, dado que WP considera que el iluminante de salida es una fuente de luz blanca [26]. Por lo tanto, la relación entre la salida y la entrada es:. si (x, y) = G(x, y)Ri (x, y) =. fi (x, y) Ii. (2.3). WP tiene en cuenta el valor más alto en cada canal de color como la representación del blanco para la imagen. Computacionalmente, dichos valores se encuentran a partir de la intensidad máxima en cada canal como se ve en:. Ii = max{fi (x, y)}. (2.4). Luego, todas las intensidades de los pı́xeles son escaladas de acuerdo con el iluminante calculado utilizando (2.3).. 2.2.7. Método de Otsu. El método de binarización mundial más conocido fue propuesto por [27]. El método de Otsu funciona mejor cuando: existe una clara separación entre el primer plano (los granos de café) y el fondo, y la iluminación es uniforme. Desafortunadamente, las imágenes de la vida real no son todas uniformes, por lo que para ayudar al método de Otsu se usó constancia del color. El método de Otsu se basa en tomar dos clases de conjuntos de pı́xeles en niveles de gris los cuales son C0 (t) (granos de café) y C1 (t) (fondo), que son definidos por un umbral t el cual es la variable a buscar, y las dos clases son el resultado deseado de la segmentación. C0 (t) denota pı́xeles con nivel de gris entre [0, ..., t] y C1 (t) denota pı́xeles con nivel de gris entre [t + 1, ..., G], 23.

(24) donde G es el nivel de gris máximo. Por lo tanto la probabilidad de ocurrencia de las dos clases se representa a continuación:. CO (t) : P0 (t) =. t X. p(g). (2.5). p(g). (2.6). g=0. C1 (t) : P1 (t) =. G X g=t+1. Donde p(g) es la probabilidad de ocurrencia del valor de gris g comprendido entre 0 ≤ g ≤ G. Luego se halla la varianza en cada una de las dos clases como se ve en:. σ02 (t) =. t X (g − g¯0 )2 p(g). (2.7). g=0. σ12 (t) =. G X. (g − g¯1 )2 p(g). (2.8). g=t+1. Donde ḡ es la media aritmética de los valores de gris de todos los pı́xeles de la imagen, y g¯0 , g¯1 los valores medios de cada clase. El objetivo del método de Otsu es mantener la varianza entre las clases lo mas grande posible mediante (2.9) y que la varianza dentro de cada clase sea lo mas pequeña posible mediante (2.10).. 2 σvec (t) = P0 (t).(g¯0 − ḡ)2 + P1 (t).(g¯1 − ḡ)2. 2 σvdc (t) = P0 (t).σ02 (t) + P1 (t).σ12 (t). (2.9). (2.10). Obteniéndose (2.11) con (2.9) y (2.10), en la cual el valor t se escoge de manera que el cociente Q(t) sea máximo. De esta manera se elige un valor umbral que optimice las dos clases en términos de varianza.. Q(t) =. 2 σvec (t) 2 σvdc (t). 24. (2.11).

(25) 2.2.8. Máquinas de vectores de soporte. Las máquinas de vectores de soporte (Support Vector Machines, SVMs) fueron introducidas por [28]. SVMs tienen fuertes fundamentos teóricos y han demostrado excelentes éxitos empı́ricos en tareas de clasificación, como la clasificación de café verde arábiga [13,14]. SVMs separan los datos en diferentes clases por un hiperplano o hiperplanos ya que tiene la capacidad de manejar datos multidimensionales. SVMs minimizan el error de clasificación empı́rica y maximizan el margen. Son también conocidas como clasificadores de margen máximo. Suponemos que tenemos m puntos de datos de entrenamiento {(x1 , y1 ) , ..., (xm , ym )}, donde xi ∈ Rn y yi ∈ {−1, +1}. La ecuación del hiperplano solución en n dimensiones se convierte en:. w T · xi + b = 0. (2.12). donde w ∈ Rn es el vector de pesos, b ∈ R es un coeficiente de intersección, y xi es un vector de entrada. Este hiperplano solución se obtiene como el hiperplano medio entre otros dos hiperplanos h+ y h− que son los que contienen los vectores de soporte de ambas clases respectivamente, estos dos hiperplanos se definen por:. h+ → wT xi + b = +1. (2.13). h− → wT xi + b = −1. (2.14). Siendo +1 para los puntos de datos positivos y −1 para los puntos de datos negativos. De esta forma la condición de clasificación expresada en (2.15) va implicar que cuando se aplica los parámetros w, b del hiperplano a los puntos de datos positivos va a resultar en un valor mayor o igual a +1 como es mostrado en (2.16), mientras que cuando se aplica a las muestras negativas va a dar como resultado un valor menor o igual a −1 como es mostrado en (2.17).. yi (wT xi + b) ≥ 1. (2.15). wT xi + b ≥ +1. (2.16). wT xi + b ≤ −1. (2.17). Ecuaciones (2.16) y (2.17) pueden expresarse conjuntamente introduciendo una variable yi que corresponde a la etiqueta de cada un de los puntos de datos, siendo +1 para las muestras 25.

(26) positivas y −1 para las muestras negativas, de esta forma la condición de clasificación implica que todas las muestras clasificadas correctamente tienen que estar situadas en la región del espacio de caracterı́sticas situada mas allá del margen. El margen por su lado corresponde a una región que se puede calcular a partir de la distancia de los dos hiperplanos h+ y h− al hiperplano solución h, como se muestra en:. margen = d+ + d− = 2. 1 ||w||. (2.18). Donde d+ y d− son las distancias de h+ y h− a h respectivamente, y ambas distancias son representadas por:. d+ = d− =. |wxi + b| 1 = ||w|| ||w||. (2.19). Se observa entonces que el margen depende únicamente de los parámetros de W del hiperplano h. Resulta útil comprobar que maximizar el margen puede ser equivalente a minimizar el problema inverso que se representa en (2.20) que va depender únicamente de (2.21) que no es mas que un producto escalar. 1 M inimizarΦ(w) = ||w||2 w,b 2. (2.20). ||w||2 = wT w. (2.21). En cuanto a la minimización, si esta sujeta a la condición de clasificación de (2.18), se comprueba que se transformo el problema de clasificación en un problema de optimización cuadrática estándar que por lo tanto puede ser resuelto de manera estándar. El objetivo del SVM es obtener los valores w y b que nos van a dar la solución de (2.12) para ello se plantea el problema como (2.20) sujeto a (2.15). La resolución de este problema se puede plantear añadiendo una función auxiliar que se denomina el lagrangiano que es representado por:. L(x, α) = f (x) +. X. αgi (x). ∀αi ≥ 0. (2.22). i. Donde f (x) es la función a optimizar que en este caso es la función Φ(w) mas gi (x) que es las restricciones a la que esta sujeto el problema que en este caso es la condición de clasificación y estas restricciones se multiplican por unos factores de α que se denominan los multiplicadores de Lagrange. De esta forma la solución al problema de optimización se obtiene como la minimización del lagrangiano respecto a las variables de la función a optimizar, en este caso w y b,. 26.

(27) posteriormente se maximiza con respecto a los multiplicadores de Lagrange, todo este proceso se muestra en:. max(min(L(w, b, α))) α. (2.23). w,b. En este caso, el lagrangiano combinando la función a optimizar y las restricciones multiplicadas por los multiplicadores de Lagrange dan: X 1 L(w, b, αi ) = wT w − αi [yi (wT xi + b) − 1] 2 i. (2.24). La minimización de esa expresión implica realizar las derivadas parciales respecto a w y respecto a b igualando ambas a cero como se muestra a continuación: X X dL =w− α i y i xi = 0 ⇒ W = α i y i xi dw i i X X dL =− αi y i = 0 ⇒ αi y i = 0 db i i. αi ≥ 0. (2.25). (2.26). Bajo condiciones de convexidad vamos a poder incluir la solución de (2.25) en la formula del lagrangiano y con un poco de desarrollo matemático se encontrara el nuevo lagrangiano siguiente:. L(w, b, αi ) = −. X 1 XX αi αj yi yj xTi xj + αi 2 i j i. (2.27). De esta forma se obtendrá una nueva función Θ cuya maximización se representa en (2.28) y que sujeta a la condición que se ha obtenido de (2.26) va a dar la solución final del SVM y además es un nuevo problema de optimización que es lo que se denomina SVM dual.. M aximizarΘ(α) = α. X 1 XX αi αj yi yj xTi xj + αi 2 i j i. (2.28). Entonces a partir de la formulación original a la que se le denomina SVM primal que es (2.23) obtenemos un nuevo problema de optimización cuya solución es la solución del SVM y que se denomina SVM dual.. 27.

(28) 2.3. Clasificación de trabajos. Los trabajos que tratan el reconocimiento automático de granos de café verde sin defectos fı́sicos son clasificados por sus métodos de segmentación, extracción de caracterı́sticas y clasificación para ver la diferencia con la propuesta de este trabajo. Pero antes se da una breve descripción de cada uno y lo que lograron en el reconocimiento de granos de café verde sin defectos fı́sicos.. 2.3.1. Breve Descripción de los Trabajos y sus Logros. En [10] proponen clasificar granos de café verde usando caracterı́sticas de color, forma y tamaño. Realizaron la adquisición de imágenes en condiciones de iluminación controladas. Este trabajo es uno de los primeros en tratar de clasificar defectos de granos de café verde. En [11] clasifican granos de café verde en cuatro clases nombradas A, B, C y RJ, donde las tres primeras clases representan a los granos de café verde sin defectos y la ultima clase representa a los granos de café verde defectuosos. Para la adquisición de imágenes utilizan un prototipo basado principalmente en la utilización de dos cámaras CMOS, para capturar la parte superior e inferior de la muestra. En [12] proponen la determinación de la calidad del grano de café basado en procesamiento de imágenes y redes neuronales artificiales. Clasifican muestras de café como un todo, en lugar de la clasificación de los granos componentes de forma individual. Para la adquisición de imágenes utilizaron una caja negra con iluminación uniforme en la cual se coloca la muestra de granos de café la cual es capturada por la cámara. Presentan problemas en la clasificación. En [2] propone un método para clasificación de granos de café en imágenes digitales a través del uso de atributos seleccionados de morfologı́a, color y textura basado en procesamiento de imágenes y redes neuronales artificiales. Aún presenta problemas en la clasificación dado que presenta errores. En [13] proponen la clasificación automática de defectos fı́sicos de granos de café verde arábiga usando procesamiento de imágenes y Support Vector Machines (SVM). Para la obtención de imágenes de granos de café elaboraron un prototipo de adquisición de imágenes con luz controlada que mantiene una distancia fija entre la cámara y la muestra de granos de café. Presentan problemas en la segmentación de granos de café verde arábiga y en la clasificación. En [14] proponen un enfoque para mejorar el reconocimiento de defectos de granos de café verde arábiga usando algoritmos retinex. Para la adquisición de imágenes utilizaron un entorno con iluminación controlada usando focos fluorescentes a una distancia fija de la escena tratando de capturar la mayor cantidad de granos dispuestos horizontalmente en una superficie plana sin brillo y adecuada para la recepción de cada grano de café. Las imágenes fueron obtenidas con una cámara digital de doce mega pı́xeles. Presentan problemas en la segmentación de granos de café y en la clasificación. 28.

(29) En [15] clasificaron las variaciones de color en granos de café verde arábiga en muestras en cuatro grupos. Para la adquisición de imágenes utilizan una caja metálica de color negro para reducir la luz del fondo y eliminar la interferencia de luz exterior. Recortaron todas las imágenes del mismo tamaño para obtener la parte que contenı́a solo la muestra utilizando un software de edición de imágenes.. 2.3.2. Métodos de segmentación. Basados en distancia de Mahanalobis En [10] separan los granos del fondo de color rojo utilizando un clasificador de Mahanalobis y operaciones de dilatación y erosión.. Basados en umbral En [13] y [14] utilizan el método de Otsu para separar los granos de café verde arábiga del fondo, presentando problemas debido a que el fondo que eligieron no era claramente separable de los granos en ambos trabajos.. Basados en función En [2] utilizan una función de segmentación en el espacio de color RGB para separar el fondo de color azul de los granos de café, dicha función considera fondo a todo pı́xel que posee su canal B mayor o igual a su canal R y G multiplicados por una constante X, y objeto a lo demás.. 2.3.3. Métodos de Extracción de Caracterı́sticas. Basados en color En [10] utilizan el promedio de todos los pı́xeles pertenecientes a un grano en el espacio de color RGB.. Basados en textura En [13] y [14] utilizan caracterı́sticas Haralick basadas en la matriz de co-ocurrencia para imágenes RGB (CGLCM).. 29.

(30) Basados en color y forma En [11] extrajeron seis caracterı́sticas las cuales son área, largo, perı́metro, área de defecto, ı́ndice rojo e ı́ndice verde, en donde las cuatro primeras son caracterı́sticas de forma y las dos ultimas de color.. Basados en forma, textura y color En [2] utilizan 211 caracterı́sticas de forma, 126 de textura y 84 de color. Las caracterı́sticas de forma son descriptores de Fourier, descriptores genéricos de Fourier, momentos de Zernike, elementos del modelo autorregresivo y un conjunto de atributos diversos. Las caracterı́sticas de color son estadı́sticas extraı́das de histogramas de intensidad de 100 frecuencias de los canales de los espacios de color HSV, CIELAB, I1 I2 I3 y RGB. De cada canal del espacio de color I1 I2 I3 obtienen tres GLCMs con dos pı́xeles de referencia, de cada GLCM obtienen 14 caracterı́sticas Haralick modificadas.. 2.3.4. Métodos de clasificación. Basados en la distancia de Mahalanobis En [10] utilizan el clasificador de Mahalanobis para clasificar los granos de café verde arábiga en siete clases no basadas en un estándar.. Basados en redes neuronales artificiales En [11] y [2] utilizan redes neuronales artificiales con propagación hacia atrás. En donde en el primero clasifican en cuatro clases los granos de café verde arábiga basados en el estándar de la SCAA, mientras que en el segundo los clasifican en veintiún clases basados en el estándar de la Cooperativa Regional de Cafeicultores de Guaxupé Ltda. (Cooxupé).. Basados en Máquinas de Vectores de Soporte En [13] clasifican en doce clases los granos de café verde arábiga utilizando una máquina de vectores de soporte con kernel RBF, mientras que en [14] clasifican en trece clases los granos de café verde arábiga utilizando también una máquina de vectores de soporte pero con la diferencia del uso de un kernel polinomial.. 30.

(31) 2.4. Consideraciones finales. En esta sección se ve que las etapas tı́picas en el reconocimiento de granos de café verde arábiga sin defectos fı́sicos usando visión artificial son las siguientes cuatro: adquisición de imágenes, segmentación, extracción de caracterı́sticas y clasificación. En los trabajos vistos, la mayor parte para la segmentación (separación del fondo de los granos) se basan en umbral, mientras que para la extracción de caracterı́sticas se basan más en el color, y finalmente para la clasificación hay un preferencia equitativa entre redes neuronales artificiales y máquinas de vectores de soporte. El fundamento teórico explicado permite tener un visión más clara del siguiente capı́tulo que será mostrado a continuación, el cual utiliza principalmente: la constancia del color, el método de Otsu y máquinas de vectores de soporte.. 31.

(32) Capı́tulo 3 Modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos 3.1. Consideraciones iniciales. En este capı́tulo a continuación se verán los materiales y métodos que fueron utilizados para obtener el modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos. El esquema del modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos que se propone en este trabajo es mostrado en la Figura 3.1 y como se puede ver este esquema muestra que el modelo tiene un conjunto de partes que son: • • • • •. Adquisición de imagen Mejora de imagen Segmentación Extracción de caracterı́sticas Clasificación. La primera parte de este modelo que es la adquisición de imagen fue obtenida al utilizar las muestras de café verde arábiga y el método de adquisición de imágenes, la segunda parte fue obtenida a partir del método de mejora de imágenes, la tercera parte fue obtenida al realizar el método de segmentación, la cuarta parte fue obtenida gracias al método de extracción de caracterı́sticas y la ultima parte fue obtenida utilizando el método de clasificación.. 32.

(33) Figura 3.1: Esquema del modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos.. 33.

(34) 3.2. Muestras de café verde arábiga. Las muestras de café verde arábiga fueron proporcionadas por la CECOVASA, la cual está ubicada en el Perú. Las muestras contenı́an granos de café verde arábiga sin defectos fı́sicos y con defectos fı́sicos, seleccionadas por especialistas de la misma CECOVASA, donde dichos especialistas se basaron en el estándar de la SCAA, el cual es un estándar internacional de gran prestigió para realizar esta tarea, en donde los defectos fı́sicos que proporcionaron son de doce tipos de los considerados por el estándar de la SCAA, siendo mostrados en la Figura 3.2 y fueron los siguientes defectos fı́sicos: • • • • • • • • • • • •. Brocado leve Brocado severo Cereza seca Concha Daño por hongos Flotador Inmaduro Agrio Negro Negro parcial Pergamino Partido/mordido/cortado. Debido al problema tratado en este trabajo el cual es en general reconocer granos de café verde arábiga sin defectos fı́sicos se consideró todos los defectos fı́sicos proporcionados por la CECOVASA como una sola clase conocida como defecto fı́sico, dado que el interés en este trabajo es reconocer los que no tienen defecto fı́sico y seria innecesario clasificar los defectos fı́sicos debido a esto. Sin embargo se consideran dos clases debido a la adición de la clase sin defecto fı́sico la cual es la que no presenta defectos fı́sicos y la clase de principal interés en este trabajo debido a que este trabajo su objetivo es reconocer automáticamente granos de café verde arábiga sin defectos fı́sicos mostrando unos ejemplos en la Figura 3.3 de como son estos granos de café verde arábiga sin defectos fı́sicos. La cantidad de granos de café verde arábiga para las dos clases fue de 420 debido a que fue la cantidad que poseı́a la clase con menos granos. Se utilizó la misma cantidad de granos de café verde arábiga para las dos clases debido a que en [13] reportan un problema de clases no balanceadas, el cual consiste en que si se tienen más granos de café verde arábiga en una clase, esto puede hacer que el clasificador tenga preferencia por dicha clase debido a la diferencia de granos de café verde arábiga por clase.. 34.

(35) (a). (b). (c). (d). (e). (f). (g). (h). (i). (j). (k). (l). Figura 3.2: Los doce defectos fı́sicos de granos de café verde arábiga considerados en este estudio: (a)brocado leve, (b)brocado severo, (c)cereza seca, (d)concha, (e)daño por hongos, (f)flotador, (g)inmaduro, (h)agrio, (i)negro, (j)negro parcial, (k)pergamino y (l) partido/mordido/cortado.. 35.

(36) Figura 3.3: Imágenes de granos de café verde arábiga sin defectos fı́sicos.. 3.3. Adquisición de imágenes. El prototipo de adquisición de imágenes de fácil implementación desarrollado en este estudio es mostrado en la Figura 3.4 y consistió en las siguientes partes mostradas a continuación: • Una mesa rectangular en donde en su tabla superior se colocó una cartulina de color turquesa que sirviera como fondo para las muestras de granos de café verde arábiga. • Una cámara digital de celular inteligente Moto G (Tercera Generación) que cuenta con una resolución máxima de 13 megapı́xeles, con la siguiente configuración: – Sin el uso de flash – Apertura de f/2.0 – Zoom de 2.76X – Ángulo de rotación de pantalla que tiende a los 0 grados • Iluminación controlada utilizando una lámpara fluorescente colocada a un distancia fija por encima y al centro de la muestra de granos de café verde arábiga en un ángulo completamente vertical al plano de la tabla superior de la mesa rectangular donde se coloca la muestra de granos de café verde arábiga. Las imágenes de las muestras de granos de café verde arábiga fueron tomadas a la máxima resolución de la cámara del celular inteligente, con un ángulo de toma diagonal en referencia al plano de la tabla superior de la mesa rectangular donde se colocaron los granos de café verde arábiga, un ejemplo de este ángulo de toma diagonal es mostrado en la Figura 3.5 en la cual se ve claramente como se realizó estas tomas de las muestras de granos de café verde arábiga con la cámara del celular inteligente, además cada toma se realizó a una distancia en la cual se distinguiera claramente los granos de café verde arábiga en la muestra sin la generación de sombra por parte del celular u otro cosa ya que esto causarı́a problemas en los siguientes métodos debido a que cambiarı́a el color de cada grano drásticamente, y finalmente se guardaron en el formato de imagen JPG en el espacio de color RGB.. 36.

(37) Figura 3.4: Prototipo de adquisición de imágenes utilizado en este trabajo para capturar las muestras de granos de café verde arábiga. Cada muestra de granos de café verde arábiga de la clase defecto fı́sico fue un conjunto de 35 granos de café verde arábiga separados entre si del mismo tipo de defecto fı́sico. Cada muestra de granos de café verde arábiga de la clase sin defecto fı́sico fue igualmente un conjunto de 35 granos de café verde arábiga que no se tocan entre sı́. Se utilizó la cantidad de 35 granos por muestra de granos de café verde arábiga tanto de la clase sin defecto fı́sico como de la clase con defecto fı́sico para que todas las imágenes sean uniformes en la cantidad de granos de café verde arábiga por imagen de muestra, dado que si se realizaba las tomas con otra cantidad de granos de café verde arábiga los resultados tendrı́an variación debido a que algunas imágenes de muestras de granos de café verde arábiga serian más lejanas y otras más cercanas debido a la cantidad de granos que deberı́an ser capturadas, ya que al ser una cantidad mayor la cámara deberı́a alejarse para poder capturar toda la muestra o caso contrario acercarse, por lo que los resultados variarı́an al no ser uniformes las imágenes debido a que algunos granos tendrı́an demasiados más pı́xeles que otros de la misma clase y podrı́an haber diferencias muy grandes entre granos de café verde arábiga de la misma clase. Por lo tanto se obtuvieron doce imágenes de muestras de granos de café verde arábiga para la clase defecto fı́sico debido a que se contaba con 420 granos dividido entre 35 lo que daba las doce imágenes, en donde cada imagen correspondı́a a cada defecto fı́sico de granos de café verde arábiga considerado en este trabajo, sin olvidarnos que esos defectos están basados en los utilizados por la SCAA, igualmente la clase sin defecto fı́sico consistió de doce imágenes dando un total de veinticuatro imágenes en total de muestras de granos de café verde arábiga. En la Figura 3.6a se ve una imagen de muestra de granos de café verde arábiga resultado de este proceso de adquisición de imágenes.. 37.

(38) Figura 3.5: Ejemplo del ángulo de toma diagonal para capturar muestras de granos de café verde arábiga.. (a) Antes. (b) Después. Figura 3.6: Imagen de muestra de granos de café verde arábiga antes y después de aplicar el algoritmo de constancia del color WP.. 38.

(39) 3.4. Mejora de imágenes. Las imágenes de muestras de granos de café verde arábiga fueron mejoradas utilizando el algoritmo de constancia del color WP el cual es explicado en detalle en la Subsección 2.2.6. Se utilizó el algoritmo de constancia del color WP para mejorar las imágenes de muestras de granos de café verde arábiga debido a que una parte del problema aquı́ tratado en este trabajo era que la iluminación no era uniforme al capturar las muestras de granos de café verde arábiga dado que se utilizó un foco fluorescente el cual no genera iluminación uniforme debido a su naturaleza. La iluminación uniforme al tomar las muestras de granos de café verde arábiga hubiera sido cierto si se hubiera contado con casi la misma iluminación en cada parte de la escena en donde se realizó la toma de muestras de granos de café verde arábiga, pero como esto no fue posible debido a que una condición del objetivo era implementar un prototipo de bajo presupuesto, se opto por usar este algoritmo de constancia del color WP. El algoritmo de constancia del color WP trató de uniformizar la iluminación de cada imagen de muestras de granos de café verde arábiga simulando que cada imagen fue capturada bajo iluminación uniforme a través de un proceso no tan complejo el cual se basa principalmente en tomar la máxima intensidad de pı́xel en la imagen de muestra de granos de café verde arábiga y tomarlo como el blanco de la imagen, con lo cual se hace un mapeo de los valores de cada pı́xel en cada imagen para obtener las nuevas imágenes de muestras de granos de café verde arábiga con iluminación uniformizada simulada. En la Figura 3.6 es mostrado un ejemplo del resultado de usar el algoritmo de constancia del color WP en una imagen de muestra de granos de café verde arábiga sin iluminación uniformizada, la cual como se puede ver es menos clara que la imagen de muestra de granos de café verde arábiga después de aplicar el algoritmo de constancia del color WP, viéndose una mejora en cuanto a la iluminación más clara en comparación con la primera imagen la cual no tiene iluminación uniforme.. 3.5. Segmentación. En el método de segmentación a todas las imágenes de muestras de granos de café verde arábiga mejoradas con el algoritmo de constancia del color WP se les extrajo su canal B (cada una de estas imágenes posee tres canales R, G y B, esto es explicado con mayor detalle en la Subsección 2.2.2), debido a que los granos de café verde arábiga tienen baja tonalidad azul en el espacio de color RGB lo que facilita diferenciar el fondo de los granos de café verde arábiga en cada imagen de muestra de granos de café verde arábiga dado que el fondo utilizado era de color predominantemente azul viéndose una notoria diferencia entre los granos de café verde arábiga y el fondo en cada imagen de muestra de granos de café verde arábiga en escala de grises. A cada canal B extraı́do de las imágenes de muestras de granos de café verde arábiga mejoradas se aplicó el método de Otsu [27] (Para ver en detalle como funciona el método de Otsu ver 39.

(40) Figura 3.7: Pasos en el proceso de segmentación. la Subsección 2.2.7), el cual es un método de segmentación que permite separar el fondo de los granos de café verde arábiga a través de una umbralización al canal B de cada imagen de muestra de granos de café verde arábiga con lo cual se obtuvo imágenes binarias, es decir cada imagen de muestra de granos de café verde arábiga con dos valores que son cero y uno que se conocen como blanco y negro que facilitaron la diferenciación entre el fondo y los objetos de interés que son los granos de café verde arábiga en cada canal B de las imágenes mejoradas de muestras de granos de café verde arábiga. Sin embargo el software utilizado en este trabajo debido a su configuración trato como fondo los granos de café verde arábiga y como objeto el fondo en cada imagen binaria de muestra de granos de café verde arábiga, por lo que después se realizó la operación de complemento sobre cada imagen binaria de muestra de granos de café verde arábiga para arreglar ese problema, a continuación se erosionó cada imagen binaria de muestra de granos de café verde arábiga con el fin de eliminar posible ruido presente en las imágenes de muestras de granos de café con una máscara cuadrada de 10x10 debido a que quedaban unos puntitos blancos en las imágenes que eran confundidos con granos de café verde arábiga. Con las imágenes de muestras de granos de café verde arábiga libres de ruido se procedió a obtener de cada una los contornos de cada grano de café verde arábiga aplicando un algoritmo de seguimiento de contornos [29] a cada imagen de muestra de granos de café verde arábiga libre de ruido para obtener la forma de cada grano de café verde arábiga y finalmente se aplicó minimum bounding box a cada imagen de muestra de granos de café verde arábiga utilizando los contornos obtenidos para obtener las regiones de interés las cuales son áreas rectangulares que contienen granos de café verde arábiga, donde cada región de interés fue almacenada en el formato de imagen PNG para no perder información dado que este formato de imagen almacena toda la información sin perderla. Todo el proceso descrito anteriormente es mostrado gráficamente en la Figura 3.7.. 40.

(41) Figura 3.8: Histogramas de intensidad por cada canal de color de un grano de café verde arábiga.. 3.6. Extracción de caracterı́sticas. Las dos clases de granos de café verde arábiga consideradas en este trabajo se diferencian mayormente a simple vista por el color, además que el estándar de la SCAA también se basa casi en su totalidad en el color, debido a esto se utilizó para la extracción de caracterı́sticas de cada grano de café verde arábiga histogramas de intensidad el cual permite obtener el color de cada pı́xel de las imágenes digitales de muestras de granos de café verde arábiga en cada canal del espacio de color RGB. De cada grano de café verde arábiga se obtuvo tres histogramas de 256 intensidades cada uno, donde cada uno de estos histogramas era obtenido de cada canal del espacio de color RGB perteneciente a cada imagen de muestra de granos de café verde arábiga. Para representar cada grano de café verde arábiga como un vector de caracterı́sticas se utilizó 256 caracterı́sticas del histograma del canal R, 256 caracterı́sticas del histograma del canal G y 256 caracterı́sticas del histograma del canal B, dado que con ello se obtendrı́a un mayor detalle de cada grano de café verde arábiga. De esta forma cada grano de café verde arábiga fue representado por 768 caracterı́sticas. La representación gráfica de las caracterı́sticas que fueron extraı́das de cada grano de café verde arábiga son mostradas en la Figura 3.8, donde se ve cada canal del espacio de color RGB respectivamente.. 3.7. Clasificación. Para reconocer las dos clases de granos de café verde arábiga de forma automática se utilizó el clasificador de margen máximo Support Vector Machine (SVM) [28], ya que se ha aplicado con 41.

(42) éxito en otros estudios [13,14]. SVM trata de separar las dos clases mediante la búsqueda directa de los lı́mites adecuados entre ellas. Para este propósito, construye hiperplanos para separar el espacio de caracterı́sticas entre las clases. SVM se desarrolló para problemas de clasificación binaria como el tratado aquı́ en donde las dos clases son: defecto fı́sico y sin defecto fı́sico.. 3.7.1. Selección de los parámetros y validación del clasificador. Con el objetivo de obtener un clasificador de granos de café verde arábiga SVM robusto y fiable, se realizó un conjunto de pasos basados en Overall Accuracy (OA). OA es un parámetro de rendimiento del clasificador y se calcula sobre la base de la matriz de confusión. La matriz de confusión como el mejor método para evaluar los modelos predictivos multiclase [18] es usada para evaluar el funcionamiento del clasificador de granos de café verde arábiga. Las principales ventajas de la matriz de confusión es que puede explicar las relaciones entre diferentes clases y muestra cómo los errores se distribuyen entre las clases. Cada columna de la matriz de confusión incluye las muestras en una clase predicha, mientras que cada fila incluye las muestras en una clase real. Todas las predicciones correctas están situadas en la diagonal de la matriz de confusión por lo que OA en simples palabras es la suma de los elementos de la diagonal, es decir el número de clasificaciones correctas dividido entre el total de elementos de la matriz, dicho total es el número total de datos de prueba, siendo mostrada su fórmula en:. OA =. # de clasif icaciones correctas # de datos de prueba. (3.1). De cada una de las dos clases se uso diferentes conjuntos de datos desde un valor inicial de 120 granos hasta los 348 con intervalos de 12 en 12 además cada dato fue elegido al azar. Cada conjunto se dividió al azar en dos grupos, los grupos de entrenamiento y prueba. Diferentes proporciones de estos grupos fueron probados, los cuales fueron 90:10, 80:20, 70:30, 60:40 y 50:50, de entrenamiento y prueba respectivamente. Para cada proporción de entrenamiento se aplicó varias iteraciones de validación cruzada k-fold con k = 10 para obtener el valor de C más óptimo, el cual es obtenido de la iteración con el OA con mayor valor. La secuencia de iteraciones es mostrada en (3.2) y esta basada en la técnica de grid-search.. (min, min × step1 , min × step2 , ..., min × stepn ). (3.2). En donde min es el valor inicial de C, step es una constante que debe ser mayor que 1 y n es el ı́ndice máximo que satisface a:. min × stepn < max. (3.3). Los parámetros iniciales del SVM fueron un kernel lineal, dado que luego de sucesivas pruebas se obtuvo que los datos eran en su mayorı́a linealmente separables dado que usando otros kernels 42.

(43) se obtuvo mayor confusión (resultados no mostrados), y parámetro de regularización C = 0.1, es decir min = 0.1, max = 500 y step = 5. Finalmente se uso su proporción de prueba para hallar el OA. Obtenidos los parámetros de clasificación, se procedió a validar el clasificador que los utilizó, mediante la generación de conjuntos de entrenamiento y prueba, de forma aleatoria en 100 repeticiones.. 3.8. Consideraciones finales. Las muestra de granos de café verde arábiga proporcionadas por la CECOVASA consisten de granos de café verde arábiga con defectos fı́sicos y sin defectos fı́sicos, en donde los que poseen defectos fı́sicos son de doce tipos considerados por el estándar de la SCAA, sin embargo se considera dos clases en este trabajo debido al problema tratado y son: defecto fı́sico y sin defecto fı́sico. El método de adquisición de imágenes utiliza un prototipo de adquisición de imágenes de fácil implementación que consiste en una mesa, una cartulina color turquesa, una cámara de celular y una lámpara fluorescente como se ve en la Figura 3.4, la ventaja de este prototipo es que permite tomar fotos de muestras de granos de café verde arábiga en un ángulo de toma diagonal lo que no ocurre con los trabajos actuales que tratan este problema de reconocimiento de granos de café verde arábiga sin defectos fı́sicos. El método de mejora de imágenes utiliza un algoritmo de constancia del color conocido como WP, el cual simula que la iluminación fue uniforme al tomar las fotos de las muestras de granos de café verde arábiga, dado que la iluminación realmente no fue uniforme debido a que fue producida por una lampara fluorescente, con lo cual facilita el reconocimiento de granos de café verde arábiga sin defectos fı́sicos debido a que no hay una variación muy grande en el color entre granos del mismo tipo al ser la iluminación uniforme. El método de segmentación permite separar los granos de café verde arábiga del fondo a través de un conjunto de pasos que de forma resumida consisten en aplicar a cada imagen de muestras de granos de café verde arábiga los siguientes pasos: extraer el canal B, aplicar el método de Otsu al canal B, aplicar el complemento a la imagen obtenida al aplicar Otsu, eliminar ruido en el complemento, aplicar un algoritmo de seguimiento de contornos al complemento sin ruido para obtener los bordes de cada grano de café verde arábiga y finalmente minimum bounding box usando los contornos para obtener las áreas rectangulares mı́nimas de interés. El método de extracción de caracterı́sticas se basa en histogramas de 256 intensidades que extraen caracterı́sticas de cada canal del espacio de color RGB de una imagen de muestras de granos de café verde arábiga, además se escogió histogramas de intensidad dado que la caracterı́stica más usada por el estándar de la SCAA es el color, extrayendo en total 768 caracterı́sticas de color de cada grano de café verde arábiga para el reconocimiento de granos de café verde arábiga sin defectos fı́sicos. El método de clasificación se baso principalmente en el uso de SVM, dado que este clasificador 43.

(44) se desarrollo para problemas de clasificación binaria el cual encaja perfectamente con el problema tratado aquı́ que cuenta con dos clases: sin defecto fı́sico y con defecto fı́sico. Además se realizó la selección de parámetros y validación del clasificador con el fin de obtener lo óptimo en esta parte basado principalmente en el OA y la matriz de confusión. Como se vio en este capı́tulo, las muestras de granos de café verde arábiga pasan por una serie de métodos para el reconocimiento de los granos sin defectos fı́sicos, siendo esta tarea no trivial al necesitar de técnicas de visión artificial, procesamiento de imágenes y de aprendizaje de máquina.. 44.

(45) Capı́tulo 4 Resultados y discusión 4.1. Consideraciones iniciales. En esta sección se muestran los resultados y discusión de los siguientes métodos: segmentación, selección de parámetros y validación. Finalmente se muestra en este capı́tulo la prueba, resultados y discusión para la comparación del modelo para el reconocimiento automático de granos de café verde arábiga sin defectos fı́sicos realizado en este trabajo con otros trabajos de la literatura muy parecidos a este.. 4.2. Segmentación. El proceso de segmentación tuvo algunos errores dado que de un total de 840 granos fueron segmentados correctamente 801 granos, los cuales representan el 95.36% del total. Las causas del error en la segmentación fueron tres casos. El primer caso es cuando los granos tienen una separación casi no visible. El segundo caso es la sombra, la cual hace creer al proceso de segmentación que es parte de un grano. Finalmente el tercer caso es la oclusión entre granos. Estos tres casos se pueden ver en la Figura 4.1. Luego del proceso de segmentación, se utilizaron solo los granos segmentados correctamente, pero debido a que la clase defecto fı́sico contenı́a una cantidad irregular por cada defecto se procedió a tener la misma cantidad de granos por defecto, siendo este cantidad la de 29 granos por defecto debido a que este número fue la misma cantidad que tiene el defecto con menor numero de granos segmentados correctamente, por lo que finalmente la clase defecto fı́sico cuenta con un total de 348 granos, lo cual hizo que la clase sin defecto fı́sico utilizara esa misma cantidad como se muestra en la Tabla 4.1 para los siguientes métodos.. 45.

(46) (a) Caso I. (b) Caso II. (c) Caso III. Figura 4.1: Los tres casos de error en la segmentación de granos de café. Tabla 4.1: Cantidad de Imágenes de Granos de Café Verde Arábiga por Clase. 4.3. Clase. Cantidad. Defecto fı́sico. 348. Sin defecto fı́sico. 348. Selección de parámetros y validación. Los resultados de este proceso son mostrados en la Figura 4.2 en donde se ve que a mayor cantidad de granos por clase los resultados no varı́an demasiado incluso llegando al 99.60% de OA, sin embargo con el fin de obtener el clasificador lo más robusto posible se escogió usar todos los datos (348) para cada clase y la partición 30:70 de prueba y entrenamiento respectivamente, dado que es un valor intermedio de las demás proporciones y el valor de C = 0.1 debido a ser el valor óptimo al realizar la validación cruzada. Para mayor detalle sobre los resultados obtenidos se puede ver la Tabla 4.2. Los resultados de la validación fueron obtenidos de la matriz de confusión de la Tabla 4.3. Se obtuvo un OA del 99.51%, además la clase que presentó mayor error al ser clasificada fue defecto fı́sico con 58 errores solamente. Lo cual demuestra que la propuesta presentada en este trabajo es robusta y fiable.. 4.4. Comparación con otros trabajos. Todas las comparaciones se realizaron con las principales técnicas de trabajos directamente relacionados con este y que utilizaron los mismos defectos fı́sicos aquı́ tratados. Dichos trabajos son [14] y [13], en donde la técnica principal del primero fue un algoritmo de constancia del color conocido como MSRCR y la técnica principal del segundo fue CGLCM. Las comparaciones se realizaron utilizando la propuesta con conjuntos al azar de entrenamiento y prueba en 100 repeticiones.. 46.

Figure

Figura 1.1: Prototipo de adquisici´ on t´ıpico de los trabajos que tratan el reconocimiento de granos de caf´ e verde ar´ abiga sin defectos f´ısicos [2].
Tabla 1.1: Cantidad de granos de caf´ e verde ar´ abiga por clase
Figura 2.2: Espacio de color RGB.
Figura 2.3: Las etapas t´ıpicas de los trabajos que usan visi´ on artificial para el reconocimiento de granos de caf´ e verde ar´ abiga sin defectos f´ısicos.
+7

Referencias

Documento similar

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Después de una descripción muy rápida de la optimización así como los problemas en los sistemas de fabricación, se presenta la integración de dos herramientas existentes

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

Por lo tanto, en base a su perfil de eficacia y seguridad, ofatumumab debe considerarse una alternativa de tratamiento para pacientes con EMRR o EMSP con enfermedad activa

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,