• No se han encontrado resultados

Plataforma hardware para la detección de la pudrición de cogollo en palma africana

N/A
N/A
Protected

Academic year: 2020

Share "Plataforma hardware para la detección de la pudrición de cogollo en palma africana"

Copied!
38
0
0

Texto completo

(1)

PROYECTO FIN DE CARRERA

Presentado a

LA UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIERÍA

DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA

Para obtener el título de

INGENIERO ELÉCTRICO (ELECTRÓNICO)

por

Nicolás Ortiz Fuentes

Plataforma Hardware para la detección de la Pudrición de

Cogollo en Palma Africana

Sustentado el día mes de año frente al jurado:

Composición del jurado

- Asesor: Fredy E. Segura, Profesor Asociado, Universidad de Los Andes

- Jurados : Juan C. Bohórquez, Profesor Asociado, Universidad de Los Andes

(2)

Contenido

1 INTRODUCCIÓN ... 3

2 OBJETIVOS ... 4

2.1 Objetivo General ... 4

2.2 Objetivos Específicos ... 4

2.3 Alcance y productos finales ... 5

3 PROBLEMÁTICA Y JUSTIFICACIÓN DEL TRABAJO ... 6

4 MARCO TEÓRICO, CONCEPTUAL E HISTÓRICO ... 7

4.1 Marco Teórico ... 7

4.2 Marco Conceptual ... 8

4.3 Marco Histórico ... 9

5 DEFINICIÓN Y ESPECIFICACIÓN DEL TRABAJO ... 10

5.1 Definición ... 10

5.2 Especificaciones ... 10

5.2.1 Funciones ...10

5.2.2 Restricciones ...11

5.2.3 Discusion ...12

6 METODOLOGÍA DEL TRABAJO ... 13

6.1 Plan de trabajo ... 13

6.2 Búsqueda de información ... 14

6.3 Alternativas de desarrollo ... 14

7 TRABAJO REALIZADO ... 16

7.1 Descripción del Resultado Final ... 16

7.1.1 Descripcion de la Estructura de la Solucion ...16

7.1.2 Etapas y Tareas del Proceso ...18

7.2.2 Modelos Matematicos ...19

8 VALIDACIÓN DEL TRABAJO ... 20

8.1 Metodología de prueba ... 20

8.1.1 Prueba Funcionamiento Tarjeta y sus Funciones Principales ...20

8.1.2 Generacion de Base de Datos de las Imágenes ...21

8.1.3 Comprobacion del correcto funcionamiento de los metos de comparacion ...21

8.1.4 Metodologia para la comprobacion de la hipotesis principal...22

8.1.5 Protocolo para la definicion de rango ...24

8.1.6 Protocolo de pruebas finales ...25

8.2 Validación de los resultados del trabajo ... 26

8.2.1 Consolidado de pruebas de rangos para las 4 pruebas en histogramas...26

8.2.2 Prueba Final...26

8.3 Evaluación del plan de trabajo ... 28

9 DISCUSIÓN ... 28

10 CONCLUSIONES ... 29

10.1 Conclusiones y aportes generales...29

10.2 Trabajos Futuros ...29

10.3 Implicaciones ...30

11 AGRADECIMIENTOS ... 30

12 REFERENCIAS ... 31

(3)

1

INTRODUCCIÓN

El presente proyecto de tesis tiene como objetivo proponer y explorar una solución a una problemática detectada por el estudiante en el sector agrícola, específicamente en el sector de la palmicultura. Para así por medio de las herramientas adquiridas durante el proceso de formación como ingeniero, poder aplicar una metodología definida generando una solución estructurada basada en las diferentes áreas de profundización de la electrónica.

Durante el siguiente documento se encontrará una aproximación histórica sobre la problemática fitosanitaria en los cultivos de palma africana en Colombia, así como una breve contextualización de las implicaciones económicas que se están generando.

A continuación se presenta una identificación clara del problema a resolver, delimitando el campo de acción, los recursos disponibles y el alcance del proyecto estableciendo así, unos objetivos y metas a cumplir que acoten el problema pero que también permitan desarrollar nuevas ideas y apropiar tecnologías ya existentes.

La investigación se va a centrar en el desarrollo de una plataforma hardware para la detección de una enfermedad, enfocándose en los principios de procesamiento de imagen, colorimetría y comparación de datos.

Por último, se realiza un análisis de los resultados obtenidos para hacer una evaluación de las metas alcanzadas y objetivos cumplidos, mientras que paralelamente se genera un análisis de las implicaciones de la inclusión de esta plataforma hardware en el sector de la palmicultura y cómo éste tipo de proyectos puede ser parte de una solución más completa a través de la integración de otros ya existentes o en desarrollo.

(4)

2

OBJETIVOS

2.1 Objetivo General

• Obtener la información y características necesarias de una palma africana (color de la flecha, del cogollo y de la hoja), por medio de un sistema embebido cuya función sea la captura de imágenes y procesamiento de datos en tiempo real, para realizar una detección y posteriormente un diagnóstico de la enfermedad de pudrición del cogollo.

2.2 Objetivos Específicos

• Caracterizar el rango de colores que presenta una población de palmas africanas enfermas, con el fin de generar un parámetro de comparación que sea una entrada al sistema total.

• Adquirir y almacenar las imágenes de una forma sistemática y con la calidad suficiente para ser tratadas.

• Realizar el procesamiento de la imagen con el fin de asegurar que efectivamente el sujeto de investigación es una palma africana y posteriormente una extracción de niveles y porcentajes de color de esta misma.

• Generar un diagnóstico, por medio de pruebas en histogramas, que refleje una correcta comparación entre los datos obtenidos por el sistema embebido y los valores y tolerancias establecidos como entrada al sistema total.

• Entregar la información (diagnóstico) de una forma ordenada y relacionada con cada palma africana sujeta a éste estudio.

• Realizar pruebas del prototipo simulando condiciones reales, movimiento y perturbaciones.

(5)

2.3 Alcance y productos finales

Como producto final se obtuvo una plataforma hardware funcional con la capacidad de diagnosticar el estado de la enfermedad en una planta de palma africana, por medio del análisis de una imagen de la misma y la comparación de una base de datos obtenida durante el desarrollo del proyecto. Esto a partir de un algoritmo de comparación desarrollado en base a librerías de OpenCV y lenguaje C++, todo trabajado sobre un ordenador de placa reducida (RaspBerry Pi B) y sus periféricos necesarios (en especial su cámara conectada por interfaz serial MIPI CSi).

En el marco general del proyecto, el producto final es el esperado y presenta campo para mejorar en la integración de todos los bloques asociados; específicamente la comunicación de OpenCV y la cámara de la RaspBerry para generar un proceso automático. A continuación se encuentra una tabla de satisfacción con los parámetros más importantes del proyecto y su nivel de satisfacción:

Parámetros Descripción Satisfacción Nivel

Adquisición de Imágenes

La resolución y la calidad de las imágenes obtenidas por la cámara usada, son lo suficientemente buenas como para poder ser procesadas y así poder extraer la información relevante para el proyecto.

Ideal

Almacenamiento y Asociación de Imágenes

Las imágenes obtenidas pueden ser etiquetadas y almacenadas para una posterior asociación con el diagnostico final de cada palma individual, para así poder brindar información completa de un grupo de palmas.

Aceptable

Procesamiento de Imágenes

El procesamiento de las imágenes permite extraer el espectro de los colores de interés y asegura que el objeto de estudio sí es una palma africana y no otro elemento.

Aceptable

Diagnóstico Final

El diagnóstico final es correcto, es decir: si se toma la foto de una palma africana enferma, el sistema podrá dar un diagnóstico real sobre el estado de salud de la palma.

Ideal

Automatización Proceso

El sistema es capaz de capturar una imagen, procesarla, generar

un diagnóstico y presentarlo de una forma adecuada. Aceptable

Prototipo y Pruebas En la salida final en campo, se cuenta con un prototipo capaz de funcionar y realizar el diagnóstico de un lote completo. Ideal

(6)

3

PROBLEMÁTICA Y JUSTIFICACIÓN DEL TRABAJO

En los últimos 10 años en Colombia se han sembrado más de 250.000 Hectáreas de Palma Africana, posicionándola como el primer productor a nivel Latinoamérica y en cuarto a nivel mundial. Adicionalmente, considerando que la agricultura comprende un 10 – 15% del PIB colombiano[11], es importante centrarse en herramientas de progreso y soluciones a problemas específicos en esta área, ya que es de este modo que se podrá aprovechar el potencial agrícola que un país de las características de Colombia posee. Precisamente uno de los mayores problemas que Colombia tiene (y a nivel mundial), es el control fitosanitario (manejo de plagas), ya que este es crucial para un correcto desarrollo de la producción de este cultivo, lo cual se ve reflejado directamente en los ingresos anuales de este gremio.

Debido a las múltiples plagas que enfrentan los palmicultores, es necesario enfocarse en las que generan mayor impacto y pérdidas; tal es el caso de la PC (Pudrición de Cogollo) que a la fecha, en los últimos 50 años ha dejado pérdidas por 1,5 billones de pesos y ha generado la erradicación de 100.000 hectáreas de las 450.000 sembradas en Colombia[12], muchas de las cuales, por las características de este hongo pueden ser tratadas y recuperadas si éste es detectado a tiempo.

Actualmente a nivel nacional, la Federación de Palma Africana (FEDEPALMA) y su línea de investigación CENIPALMA, están concentrando sus estudios en generar bases de datos bien consolidadas y completas antes del desarrollo o uso de prototipos que permitan identificar de forma automática dicha enfermedad. Por otra parte, el sector de las empresas privadas ha optado por utilizar tecnologías existentes y se ha encontrado con altos costos y una industria que aún no tiene el manejo total de las tecnologías adquiridas, ya que generalmente se adecúan tecnologías de otros campos y no se desarrollan aplicaciones específicas para palma africana o agricultura en general.

De estas situaciones se obtienen dos grandes motivaciones; la primera es que hay una necesidad inmediata en Colombia de herramientas específicas que permitan una detección automática de enfermedades en cultivos (como el de la palma africana), con ciertas características especificas (altura, nivel de follaje, terreno), y la segunda es que hay que seguir la tendencia mundial en cuanto al análisis y recolección de datos en cultivos de grandes extensiones. Ésta propone: vehículos no tripulados y para el análisis de datos, el procesamiento de imágenes y patrones de entrenamiento, fomentando una reducción de costos, traducida en aplicaciones y prototipos propios e ideas innovadoras las cuales permitan permear y generar confianza frente a la tecnología en un mercado que hasta ahora está comenzando a ver este tipo de tecnologías como un valor agregado a su empresa.

(7)

4

MARCO TEÓRICO, CONCEPTUAL E HISTÓRICO

4.1 Marco Teórico

4.1.1 Procesamiento de Imágenes

El procesamiento de imágenes tiene como fin mejorar, resaltar y hacer más evidentes ciertas características de una imagen para así poder realizar un mejor análisis de esta, ya sea de forma fotográfica o electrónica.

4.1.2 Histograma de Color

En el campo del procesamiento de imágenes se utiliza el histograma de color para tener una representación de la distribución del mismo y básicamente entrega el número de pixeles que tienen colores pertenecientes a una lista o arreglo de rangos de colores los cuales se extienden sobre el espacio de color de la imagen. Es decir; el conjunto de todos los colores posibles. En general, ésta es una herramienta para conocer la distribución de colores en una imagen más no la ubicación de ellos, por lo cual resulta útil para buscar rangos específicos de color en una imagen. La comparación entre dos histogramas puede proporcionar la distancia entre ellos, la cual es entendida como la similitud entre ambas imágenes, comparándolas pixel a pixel o en arreglos de celdas[3][16]

4.1.3 Comparación de Histogramas de Color

Para poder comparar dos imágenes es necesario extraer datos relevantes. Generalmente se utiliza la información sobre sus pixeles, la cual permite establecer unas reglas y parámetros de comparación. En el caso de querer comparar dos imágenes, existen múltiples formas de realizarlo. Una de estas, es la medición de distancia entre dos histogramas de color con técnicas como el test de Kolmogoroff-Smirnov, distancia Euclidea, distancia de intersección, método Chi-square, distancia cuadrática, distancia Bhattacharyya y método de correlación[3][10][16].

Los métodos anteriormente descritos siguen la siguiente lógica:

Correlación: Entre más cercano a 1 los histogramas presentan mayor similitud. • Intersección: A mayor valor de la intersección de dos imágenes mayor es su similitud • Bhattacharyya: Entre más cercano a 0, los histogramas presentan mayor similitud. • Chi – Square: A menor valor del resultado de esta prueba, es mayor la similitud entre

(8)

4.2 Marco Conceptual

Pudrición de Cogollo

Esta enfermedad en la palma africana es producida por el hongo Phytophthora Palmivora

Buti, y es conocida como PC, afecta tanto a palmas jóvenes como adultas y sus principales

síntomas externos son[9]:

• Necrosis foliar (mordiscos en la hoja; el termino foliar hace referencia a la hoja de la palma africana)

• Lesiones en la Flecha (decoloración y ausencia de tejido) • Síntoma de la hoja pequeña

• Folíolos cloróticos y pérdida de ápices de folíolos

Imagen

• Resolución total: expresa el número de pixeles que forman una imagen de mapa de bits. La calidad de una imagen también depende de la resolución que tenga el dispositivo que la capta.

• Tamaño y Peso: dependientes de la cantidad de pixeles contenidos en la imagen: ancho y alto de la imagen, tipo de formato y cantidad de color en la imagen entre otros.

• Formato: Existen varios formatos en los cuales una imagen puede ser almacenada y procesada, pero se hace énfasis en el mapa de bits (BMP) útil para realizar comparaciones entre arreglos de pixeles o pixel a pixel y jpeg por ser el formato de compresión más utilizado y de los más eficientes para almacenar imágenes que ocupen el menor espacio posible.

Espacio HSV[18]

Este modelo de color es una transformación no lineal del modelo RGB, y viene dado en coordenadas cilíndricas en donde se definen tres componentes principales: Matiz (Hue), Saturación (Saturation), Valor (Value).

Tinte o matiz: Ángulo definido entre 0o y 360o.

Saturación: Nivel de saturación del color dado entre 0 y 1, donde 0 representa sin saturación alguna (blanco), hasta 1 que sería el matiz en toda su intensidad. También se puede presentar en porcentaje.

Brillo: Nivel del brillo entre 0 y 1. En donde 0 es negro y 1 blanco. También puede presentarse en porcentaje, siendo el 50% el promedio del brillo de una imagen.

(9)

4.3 Marco Histórico

“Riveros, J.C. (2013). Reconocimiento y tratamiento de imágenes en sistemas embebidos para la detección de enfermedades en plantas. Bogotá, Colombia: Universidad de Los Andes” En esta tesis los aspectos relevantes son el tratamiento de la imagen y el manejo de librerías en sistemas operativos como LINUX o Android lo cual en el caso de la tesis a presentar, hay alta relevancia ya que se va a buscar el tratamiento de imágenes más óptimo para el fin requerido.

“Gómez, S.A. y Segura, F.E. (2012). An aerial monitoring system (AMS) for detecting bud-rot diseases on oil palms. Bogotá, Colombia: Universidad de Los Andes”

Este artículo, resultado de un trabajo de tesis de maestría, presenta afinidad con la tesis a realizar en la trasmisión de imágenes capturadas por una cámara y su posterior tratamiento y reconocimiento de colores por medio de la conversión lineal. Adicionalmente presenta protocolos de comunicación reproducibles para el futuro proyecto.

“Asraf Hairuddin, M., Md Tahir, N., Baki, S.R.S. (2011). Representation of Elaeis Guineensis Nutrition Deficiency Based On Image Processing Approach. Computer Applications and Industrial Electronics, 2011 IEEE International Conference on.”

Este documento centra la idea de poder no solo reconocer un color sino varios colores. Además. la capacidad de tener un algoritmo que reconozca la hoja de una palma africana independiente de su color.

- Sistemas aéreos no tripulados de Trimble para topografía y cartografía.

Actualmente en Colombia se está utilizando este avión no tripulado para la generación de mapas en diferentes tipos de cultivos y en las especificaciones técnicas se encuentra la tecnología que se está utilizando lo cual permite un acercamiento a la industria y una comparación directa con el protocolo de procesamiento de imágenes a utilizar. En este caso se utiliza fotogrametría de Tremble Business Center (TBC), con tecnología Inpho. Autonomía de 50 min, velocidad crucero 80km/h, alcance 60Km.

(10)

5

DEFINICIÓN Y ESPECIFICACIÓN DEL TRABAJO

5.1 Definición

Uno de los mayores indicadores sobre el estado fitosanitario (enfermedades y plagas) de una palma africana es el color de sus hojas, debido a que estas pueden brindar información sobre deficiencia de nutrientes, malos manejos agronómicos o enfermedades presentes en la palma africana (siendo ésta ultima de interés para este proyecto).

Sabiendo que en Colombia existe una gran documentación sobre síntomas, características y tratamientos para estas enfermedades, no existe una política clara de FEDEPALMA o la empresa privada para el desarrollo o apropiación de nuevas tecnologías que permitan agilizar el sondeo de las áreas que puedan presentar una posible afectación por esta enfermedad; pues teniendo en cuenta que la población de plantaciones a la cual va orientado este trabajo tienen en promedio una área sembrada mayor a las 500Ha con palmas en vida útil de altura hasta 30m , es necesario generar tecnologías de detección que puedan ser transportadas de forma eficiente y que tengan mejores alcances que los humanos, ya que generalmente se hace esta detección con personas entrenadas que deben cubrir grandes distancias a pie o en vehículos de carga. Aun cuando éstas presentan un alto porcentaje de eficiencia en el análisis, su rango de visión llega hasta cierta distancia y el factor distancia-tiempo es problemático económicamente hablando, al igual que el desgaste físico para el trabajador pues disminuye su vida útil de trabajo.

Por lo tanto el problema a resolver consiste en integrar un sistema embebido de bajo costo y portable, capaz de emitir un diagnostico confiable sobre el estado fitosanitario de una palma africana. Específicamente sobre el estado actual de la pudrición del cogollo en esta, buscando que dicho sistema tenga la capacidad de capturar las imágenes de la muestra a analizar, procesarlas buscando adquirir la información necesaria que permita asegurar que la imagen adquirida es de una palma africana y finalmente, realizar una correcta extracción de los colores de interés para una posterior comparación con una base de datos de colores que va a estar preestablecida como una entrada al sistema lo cual permitirá por comparación, determinar si una planta está sana, posiblemente enferma o enferma.

Por último y como consideración final se buscará la forma de entregar la información sobre una población de palmas (1ha = 143palmas) generando un formato que asocie cada palma de la población con un diagnóstico el cual sea fácil de leer y tenga las convenciones preestablecidas por el gremio de la palma africana.

5.2 Especificaciones

5.2.1 Funciones

Base de Datos: Esta etapa va a ser vista en el proyecto como una entrada al sistema y consiste en conocer los porcentajes de color (específicamente de la gama del color amarillo), que tiene una palma africana enferma por PC, por lo cual aunque no es una función del sistema, sí es una etapa que va a ser realizada durante el proyecto y que presenta un valor agregado puesto

(11)

que no se encontró una base de datos de este tipo y es de suma importancia para el proyecto. Esto con el fin de conocer más sobre la enfermedad a estudiar y mejorar la probabilidad de encontrar patrones relevantes en los histogramas de color. Es pertinente aclarar que la base de datos será obtenida de los histogramas de las imágenes en espacio de color HSV. Finalmente, se categorizan las imágenes como enfermas, posiblemente enfermas y saludables.

Captura de Imagen: El sistema cuenta con su propio sistema de captura, es decir una cámara capaz de capturar imágenes[14] (5MP, Max 2592 x 1944 píxeles) y almacenarlas en una tarjeta SD de 32Gb, por lo tanto la imagen a analizar debe provenir de la cámara del sistema y no de ninguna base de datos.

Procesamiento

Acondicionamiento Imagen: Las imágenes de entrada son acondicionadas para un correcto análisis por algoritmo de comparación es decir, se encuentran en un formato adecuado (JPG), espacio de color requerido(HSV) y parámetros inicializados (número de celdas y rangos).

Métodos de Comparación de Histogramas: Una vez han sido seleccionados los métodos más adecuados para comparar las imágenes por medio de histogramas, el sistema es capaz de calcular estos métodos a través de herramientas computacionales y funciones ya existentes, con el fin de dar resultados numéricos comparables.

Matriz Datos Diagnostico: Por último y a forma de interfaz para el usuario de la información recopilada, el sistema debe presentar los datos de una forma ordenada y relacionada, es decir que a cada palma se le asigne un diagnóstico y una numeración, para que así se pueda hacer comprobación manual y la persona a la cual se le va a dar el producto final tenga una guía en campo de las plantas enfermas.

Prototipo: Debido a que la integración de la cámara con la tarjeta RaspBerry ya viene generada por el fabricante, sólo se debe asegurar un correcto posicionamiento de la cámara para la captura de las imágenes. Aun cuando no es relativo al proyecto presentar un prototipo totalmente portable sí es de consideración sentar las bases para generar un dispositivo que pueda ser transportado por algún medio no tripulado (Dron, vehículo no tripulado, etc.)

5.2.2 Restricciones

Las restricciones tienen dos grandes categorías; las primera está relacionada con la imagen que se va a obtener ya que ésta depende de la cámara a utilizar y la segunda, son los factores relacionados con la tarjeta a utilizar ya que de ésta depende en gran medida de la capacidad de procesamiento. Adicionalmente se presentan las siguientes restricciones específicas:

(12)

• Tiempo de procesamiento: Relativo a la cantidad de tiempo en procesar una imagen. • Calidad y precisión de Imagen: Si la imagen capturada presenta la resolución y calidad

esperada, o de lo contrario es borrosa, mal enfocada o el cuadro de captura es deficiente (Ej. sólo sale la mitad de la palma)

• Criterio Decisión Algoritmo: Se busca que el criterio sea lo más exacto posible más no se asegura una confiabilidad total, puesto que hay patrones de la enfermedad que se pueden comportar de manera diferente a la esperada teóricamente.

• Bases de Datos / Modelos: Se requieren generar bases de datos de color y modelos de estas mismas puesto que a nivel nacional no existe una disponibilidad de estas.

• Pruebas Finales: Se harán en la plantación PALMERAS BARBASCAL, debido a la

facilidad de ingreso al investigador y la altura adecuada de las palmas para las pruebas, los tiempos de movimiento y frecuencia de visitas son problemáticas puesto que está ubicada en San Martín, Meta. En Cundinamarca este tipo de cultivo no existe por las condiciones geográficas y climatológicas.

• Datos (143 por Ha): Se espera cubrir una hectárea, la cual por reglas técnicas agrícolas tienen 143 palmas; existe un compromiso directo con el tiempo de procesamiento y la capacidad de almacenamiento de la memoria de la tarjeta.

5.3.3 Discusión

Es de extrema importancia hacer claridad en las especificaciones que se escogieron ya que establecen un rango de acción y unos compromisos adquiridos, puesto que en conjunto con las restricciones generan la totalidad del proyecto, en donde se busca no sobredimensionar el proyecto, sin cerrar la posibilidad de generar nuevas ideas o profundizar en conceptos ya establecidos.

Para esta plataforma hardware las restricciones radican en los elementos utilizados que generan un compromiso entre costos, tiempo de procesamiento y calidad de imagen. Sin embargo en el momento de decidir por un prototipo de bajo costo, no se está renunciado a una investigación que busque un mayor porcentaje de precisión frente al diagnóstico; el cual es el fin mayor de este proyecto.

Por último, para el correcto desarrollo del proyecto, las especificaciones se han definido en forma independiente buscando que cada una se pueda trabajar de forma paralela con las otras en etapas iniciales e intermedias, y solo en la etapa final de integración estas se correlacionen; esto con el fin de no frenar el proyecto por algún inconveniente en alguna etapa.

(13)

6

METODOLOGÍA DEL TRABAJO

6.1 Plan de trabajo

(14)

6.2 Búsqueda de información

En una etapa inicial la búsqueda de información se orientó a conocer e informarse sobre las características más importantes del cultivo de palma africana, su estado actual en Colombia, problemas, ventajas y el punto crítico de la investigación que es la morfología y estado fitosanitario de una palma afectada por la enfermedad P.C. Para esta etapa se utilizaron dos fuentes primarias, la Federación de Palma Africana (FEDEPALMA), en concreto su línea de investigación y desarrollo CENIPALMA, la cual ofrece información detallada (sobre todo el tema de fitosanidad) en cartillas, donde se exponen todos los síntomas de una palma africana enferma y se explica cómo reconocerlos de una forma detallada. Todo esto sumado a la información del estado del cultivo en Colombia brindada en la XI Reunión Técnica Nacional de Palma Africana y el XVII Congreso Internacional de Palma Africana las cuales permitieron conocer en primer plano la información requerida para este proyecto. Como fuente secundaria se buscó el apoyo de un Ingeniero Agrónomo con experiencia de 10 años en campo en cultivos de palma africana que ayudó a supervisar en campo la escogencia de una base de datos adecuada.

Para la segunda etapa la cual consta del desarrollo en ingeniería, la fuente de información primaria fueron las hojas de datos y tutoriales brindados por el fabricante de la tarjeta RaspBerry, para el desarrollo software se utilizaron los conocimientos adquiridos en programación durante los cursos de pregrado, especialmente arquitectura de sistemas digitales, en donde se sientan bases para abordar el lenguaje de programación C++. Por último el programa OpenCV, (en el cual se realizó la programación) ofrece librerías y tutoriales, así como ejemplos que permitieron una mejor comprensión de su estructura. En general para las dos etapas existió una continua investigación en base de datos académicas, proyectos de grado y maestrías afines con el tema, realizados por estudiantes de pregrado en Ingeniera Electrónica en los últimos dos años bajo la supervisión del mismo asesor de esta tesis de pregrado, debido a que tanto el asesor como su grupo de apoyo, actualmente trabajan en el campo de la microelectrónica, sistemas embebidos y desarrollos de plataformas hardware y ya existen trabajos relacionados con palma africana y tratamiento de imágenes trabajados por estudiantes bajo su asesoría.

6.3 Alternativas de desarrollo

En este proyecto se abordaron 3 posibles alternativas de solución, en primera instancia se consideró desarrollar una solución a partir del campo de la inteligencia artificial conocido como aprendizaje de máquinas (Machine Learning), el cual es un campo que en la actualidad ha presentado un desarrollo eficiente en la solución de problemas en donde las máquinas por medio de algoritmos pueden llegar a generalizar comportamientos. Para este proyecto es de gran utilidad pues con esta técnica la plataforma hardware puede generar criterios de decisión acertados. Sin embargo, no se trabajó en esta solución debido a dos factores decisivos: el primero consistía en que la tarjeta utilizada en este proyecto no tiene una alta capacidad de procesamiento de información (memoria Ram 512Mb) y por la característica de los algoritmos utilizados en el aprendizaje de máquinas, es de vital importancia contar con esta

(15)

capacidad. El segundo factor es la necesidad de bases de datos de imágenes de una alta calidad y de gran densidad (las cuales no se pudieron conseguir), aun cuando se consulto con CENIPALMA y la empresa privada; de haberlas conseguido, no hubiera sido posible almacenarlas por la capacidad de memoria de la tarjeta RaspBerry(32Gb) y hubiera sido necesario hacer un proceso exterior a la tarjeta y todo el proyecto perdería relevancia puesto que ya existen proyectos que realizan esto y no se quiere depender de computadores o elementos externos.

Una segunda solución propuesta fue generar una base de datos de los colores presentes en una palma africana enferma, es decir abordar el proyecto desde el área de la colorimetría. Esto con el fin de saber qué colores se esperaban encontrar en una palma enferma y en el momento de capturar una imagen de una palma africana a diagnosticar, un algoritmo de comparación extraería los colores y compararía el porcentaje de color y similitud entre el sujeto de diagnóstico y la base de datos de color. Se encontró que la solución no era eficaz ya que al trabajar en el espacio de color RGB, las imágenes serian muy dependientes del brillo y saturación del momento del día en que la imagen fuera capturada y aun solucionando esto, para generar esta base de datos se requerían mas de 100 imágenes con una alta calidad en resolución las cuales no se tenían para la investigación.

Una tercera solución (la definitiva), fue buscar un punto medio entre las dos soluciones anteriormente estudiadas. Esta consistió en trabajar con colorimetría, cambiando el espacio de color a HSV, el cual permitió separar el canal del color (Hue), el de la saturación (Saturation) y el del valor o brillo(Value); esto con el fin de omitir el canal del brillo para eliminar fuentes de error en el momento de la captura de la imagen. Todo este proceso generó una forma más eficiente de diferenciar entre imágenes de palmas africanas saludables y enfermas, enfocándose únicamente en la distribución del color calculada por medio de histogramas. Adicionalmente el algoritmo de comparación no se planteó con Machine Learning, pero sí se utilizo una base de datos de menor densidad y con la ventaja de ser generada con el módulo de captura de imágenes y video de la tarjeta, en donde al establecer unos criterios de decisión por medio de test en histogramas descritos por fórmulas matemáticas, se obtuvo un flujo de datos que tanto para el procesador como para la memoria son ideales y permiten llegar a datos concluyentes.

(16)

7

TRABAJO REALIZADO

Como resultado final del trabajo e investigación en este proyecto se obtuvo una plataforma hardware capaz de capturar y almacenar en forma de base de datos, imágenes de palma africana en tiempo real para posteriormente y como función principal, realizar un análisis y diagnóstico por medio de algoritmos de comparación de una nueva imagen de entrada al sistema.

7.1 Descripción del Resultado Final

7.1.1 Descripción de la Estructura de la Solución

Diagrama 2. Diagrama de bloques de la solución

Bloque de Entrada

Para esta etapa se utilizó la cámara de la tarjeta RaspBerry, aun cuando puede ser utilizada cualquier cámara que presente compatibilidad con la tarjeta. El módulo de la cámara fue utilizado para capturar las imágenes con las que se construyó la base de datos y adicionalmente, las imágenes de entrada al sistema. De esta etapa cabe resaltar que la resolución de la cámara es 2.592 × 1.944 píxeles y en promedio, cada imagen tiene un tamaño de 2.5Mb y tanto la base de datos como la imagen de entrada son almacenadas en una tarjeta Micro SD de 32Gb, de los cuales solo 2Gb son utilizados para el sistema operativo[14] y archivos necesarios. Por consiguiente, las demás etapas del proceso deben hacer únicamente el llamado de las imágenes requeridas desde la carpeta en que han sido almacenadas.

(17)

Bloque Acondicionamiento

En este bloque se realiza la selección de imágenes de la base de datos con las cuales se va a comparar la imagen nueva. No se hace la comparación con todas las imágenes de la base de datos sino que se escogen imágenes aleatorias. Esto con el fin de garantizar que se compara la imagen con los 3 grupos internos (palmas enfermas, posiblemente enfermas y saludables), y que no se pierda tiempo de procesamiento en comparaciones que no generen resultados concluyentes. Por último y como etapa clave, en el acondicionamiento se debe hacer la transformación no lineal del espacio de color de la imagen (en esta etapa se incluye el cambio de espacio RGB a BGR antes de hacer la transformación no lineal ya que las librerías de OpenCV por defecto trabajan con este espacio) a HSV, para poder separar los canales de saturación, matiz y valor, con el fin de tener el modelo de color en términos de sus componentes y aislar el componente de valor o brillo que como se explicó en etapas anteriores, puede ser una fuente de error.

Procesamiento de Imágenes

Una vez hecho el acondicionamiento de la señal por medio de herramientas software, específicamente con funciones propias de las librerías de OpenCV, se realiza el procesamiento de la imagen de entrada y las imágenes de la base de datos. En primera instancia se generan y almacenan en matrices los histogramas de cada una de las imágenes estableciendo los rangos en los que van a variar la saturación (0-256), el matiz (0-180), el número de celdas (Bins) en las cuales se van a agrupar los pixeles de la imagen, (a mayor cantidad de celdas existe un compromiso entre tiempo de procesamiento y precisión) y finalmente se normaliza el histograma para eliminar picos de color indeseads. Acto seguido, se calcularon los 4 métodos de comparación (Chi-Square, Intersección, Correlación y Bhattacharyya) en donde cada método por medio de una función matemática retorna un valor que representa el grado de similitud entre dos histogramas de imágenes, estos datos constituyen la salida del procesamiento de imágenes y son la base de la investigación, ya que con estos se generan los criterios de decisión para valorar el estado de una palma africana.

Procesamiento de Datos

Esta etapa recolecta y organiza los datos de una forma adecuada, esto debido a que el algoritmo retorna los datos de los 4 métodos de comparación juntos y es necesario separarlos para un análisis individual de cada método, lo cual permite establecer en qué rangos de cada prueba debe estar una palma enferma, saludable o posiblemente enferma. Una vez se generan las 4 tablas que relacionan todas las imágenes de la base de datos, individualmente se genera un análisis estadístico de tres indicativos: el promedio, el mínimo y el máximo de cada relación, esto con el fin de determinar los rangos anteriormente mencionados.

Salida

Por último se realiza la asociación del diagnóstico final con la imagen de entrada. Esta etapa se centra en presentar los datos de una forma organizada y entendible para el usuario final.

(18)

Adicionalmente, se propone presentar la imagen de entrada con un indicativo del diagnóstico final y la consolidación de una plantilla para que la base de datos cada vez sea de mayor densidad y los resultados sean cada vez más precisos y reales.

7.1.2 Etapas y Tareas del Proceso

El proyecto se estructuró teniendo en cuenta 3 etapas principales. Una primera etapa en donde se enfocó la atención a conocer de fondo las características principales de la enfermedad y la apropiación de la tecnología que fue utilizada, para así evitar problemas en etapas intermedias por problemas en los protocolos de inicialización o por falta de recursos tanto físicos como de programación.

La segunda etapa y más crítica en el proyecto, fue la definición de todos los parámetros necesarios para un correcto funcionamiento del algoritmo; es decir todo lo relacionado al acondicionamiento de las imágenes y la definición, programación y comprobación de los tests o métodos de comparación de histogramas. Paralelo a este proceso, en esta etapa se realizó la visita de campo en donde no solo se comprobó el correcto funcionamiento de la tarjeta y sus módulos sino también se generó la base de datos de imágenes con la cual se trabajó el tiempo restante de la investigación.

Finalmente, en esta última etapa se realizó un enfoque en el manejo y análisis de datos, buscando fuentes de error en el código del algoritmo para una posterior generación de un consolidado final de datos que permitió hacer un proceso estadístico y de tabulación con el fin de que antes de entregar un prototipo se hiciera una validación de datos por medio de protocolos de prueba.

(19)

7.2.2 Modelos Matemáticos

Los modelos matemáticos utilizados en las pruebas de histogramas para todos los casos, son formas de comparar las distancias entre dos histogramas, esto con el fin de generar una medida que determine un grado de similitud. Aun cuando existen varios métodos para medir estas distancias [6][7], se han escogido estos 4 métodos por no depender de la similitud en su función de probabilidad, por ser métodos dependientes de la percepción del color, del número de celdas y pixeles y por presentar una amplia aceptación tanto a nivel académico[- ] como a nivel de programación (Ampliamente usados en MatLab y OpenCV).

A continuación se presentan los modelos matemáticos de las pruebas realizadas. (Estas funciones ya se encuentran programadas en OpenCV (OpenCv Documentation 2.4.0.9) y no representan ningúna autoria del investigador)

Chi-Square[2][13]

𝑑 𝐻!,𝐻! =   (𝐻!𝑖 −𝐻!(𝑖))

!

𝐻!(𝑖)

!

Intersección[2][3][16],

𝑑 𝐻!,𝐻! =   min  (𝐻! 𝑖 ,𝐻!(𝑖)

!

)

Bhattacharyya[2][16],

𝑑 𝐻!,𝐻! =   1−   1

𝐻!  𝐻!  𝑁!

  𝐻!(𝑖)𝐻!(𝑖)

!

Correlación[2][19]

𝑑 𝐻!,𝐻! =    

(𝐻!(𝑖)−𝐻!

! )(𝐻!(𝑖)−𝐻!)

(𝐻!(𝑖)−𝐻!)!

(20)

8

VALIDACIÓN DEL TRABAJO

8.1 Metodología de prueba

8.1.1 Prueba de Funcionamiento de la Tarjeta y sus Funciones principales

Este protocolo de pruebas permite comprobar por medio de scripts en el terminal:

• Inicialización de la cámara, con sistema operativo funcional.

• Funcionamiento de la cámara por comandos y almacenamiento de las imágenes capturadas en los directorios adecuados.

• Funcionamiento de las librerías OpenCV, y del programa en sí. • Ejecución y visualización de una función simple de OpenCV.

Esto con el fin de cumplir los requerimientos de captura de imagen y asegurar la capacidad de una generación de base de datos de las imágenes, todo esto estipulado en la primera etapa del proyecto. A continuación se presenta el script utilizado para realizar la comprobación de funcionamiento de los ítems anteriormente listados:

(21)

En la imagen 1 se observa una imagen de prueba capturada (cuadro superior izquierdo), por medio de los comandos del terminal (cuadro inferior izquierdo), adicionalmente se asegura que la imagen quede guardada en el directorio de interés (cuadro superior derecho) y por último se genera la conversión de la imagen de prueba a un espacio HSV (cuadro inferior derecho) con lo cual se asegura que la tarjeta es funcional, que se puede programar con librerías OpenCV y que es capaz de capturar y almacenar datos.

8.1.2 Generación de Base de Datos de las Imágenes

Una vez se tiene la capacidad de capturar y almacenar imágenes, se genera la base de datos en la plantación de palma africana Palmeras Barbascal ubicada en San Martín, Meta, en donde con la asesoría de un agrónomo suministrado por la plantación, se escoge un lote con las características (altura de la planta y extensión de sus hojas) que permitan capturar las imágenes de una forma correcta.

El agrónomo indica 7 palmas africanas saludables, 8 enfermas y 4 posiblemente enfermas, para construir una base de datos de 19 palmas subdividida en 3 tipos de diagnósticos posibles (enfermas, posiblemente enfermas y saludables). Finalizado este proceso ya se tiene la base de datos organizada y almacenada.

Imagen 2. Ejemplos base de datos de imágenes

8.1.3 Comprobación del correcto funcionamiento de los métodos de comparación

Esta prueba se genera para asegurar que los métodos de comparación utilizados se comportan de la forma esperada y que sus valores están dentro del rango indicado. Donde las palmas enfermas se codifican: e1 – e5, las posiblemente enfermas: p1 – p2 y las saludables: s1 – s4. El protocolo de prueba consiste en calcular los 4 tests para diferentes imágenes aleatorias y observar si las siguientes relaciones se cumplen:

(22)

Tabla 2. Comportamiento esperado

Finalmente se comprueba que los métodos presentan un comportamiento adecuado y que los valores están dentro de los rangos establecidos, lo cual se puede observar en la Tabla 3, en donde se presentan los resultados para las comparaciones entre 3 imágenes aleatorias, este proceso es repetido para diferentes combinaciones de imágenes de la base de datos.

Imagen1-Imagen1 Imagen1-Imagen2 Imagen1-Imagen3 Resultado Rango

Prueba[0] 1.000000 0.273569 0.961270 Correcto Correcto

Prueba[1] 0.000000 1242.613779 24.296768 Correcto Correcto

Prueba[2] 105.665995 40.198967 88.930014 N/A Correcto

Prueba[3] 0.000000 0.562130 0.165046 Correcto Correcto

Tabla 3. Prueba Correcto Funcionamiento Métodos.

Los valores resultantes son generados con el siguiente script:

8.1.4 Metodología para la Comprobación de la Hipótesis Principal

La hipótesis principal de la solución sostiene que al comparar los histogramas de las diferentes imágenes de la base de datos, las imágenes van a presentar ciertos patrones característicos y definitivos . Por lo cual se establecen unos criterios y se analiza el comportamiento de estos patrones.

Correlación

• Las imágenes que presentan un valor cercano a 1 son aquellas que tienen una alta similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – saludable, enferma – enferma, posiblemente enferma – posiblemente enferma y posiblemente enferma – enferma.

• Las imágenes que presentan un valor cercano a 0 son aquellas que tienen una baja similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – enferma y posiblemente enferma – saludable

Prueba Imagen1-Imagen1 Imagen1 - Imagen 2 Rango

[0] Correlación 1 ≠1 [0 – 1]

[1] Chi-Square 0 ≠0 [0 – ∞)

[2] Intersección N/A N/A (0 – ∞)

[3] Bhattacharyya 0 ≠0 [0 – 1]

pi@raspberrypiNicolas ~/OpenCV-2.4.2/Nicolas $ ./algoritmoComparacion e2.jpg s3.jpg p2.jpg pi@raspberrypiNicolas ~/OpenCV-2.4.2/Nicolas $ ./algoritmoComparacion e3.jpg e4.jpg p1.jpg pi@raspberrypiNicolas ~/OpenCV-2.4.2/Nicolas $ ./algoritmoComparacion p1.jpg p2.jpg s2.jpg

(23)

Chi-Square

• Las imágenes que presentan un valor cercano a 0 son aquellas que tienen una alta similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – saludable, enferma – enferma, posiblemente enferma – posiblemente enferma y posiblemente enferma – enferma.

• Las imágenes que presentan un valores muy altos (del orden de cientos o miles) son aquellas que tienen una baja similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – enferma y posiblemente enferma – saludable.

Intersección

• Las imágenes que presentan valores cercanos a 100, son aquellas que tienen una alta similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – saludable, enferma – enferma, posiblemente enferma – posiblemente enferma y posiblemente enferma – enferma.

• Las imágenes que presentan valores cercanos a 0 (del orden de cientos o miles), son aquellas que tienen una baja similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – enferma y posiblemente enferma – saludable.

Bhattacharyya

• Las imágenes que presentan un valor cercano a 0, son aquellas que tienen una alta similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – saludable, enferma – enferma, posiblemente enferma – posiblemente enferma y posiblemente enferma – Enferma.

• Las imágenes que presentan un valor cercano a 1, son aquellas que tienen una baja similitud entre sus histogramas. Es decir, las comparaciones entre palmas: saludable – enferma y posiblemente enferma – saludable.

En la Tabla 4 se encuentra una matriz de comparación propuesta con la cual se van analizar los resultados obtenidos en la etapa de validación de los resultados del trabajo, donde se establecen hacia qué valores deben tender los números:

• →1, Tiende a 1. • →0, Tiende a 0.

• →+, Tiende a un número de mayor magnitud en comparación a los valores de las otras combinaciones de la prueba.

(24)

  𝑆!…𝑆!  

   

𝑃!…𝑃!  

   

𝐸!…𝐸!  

         

         

𝑆!…𝑆!  

Correlación   →1       Correlacion           Correlacion      

Chi-­‐Square   →0       Chi-­‐Square           Chi-­‐Square      

Intersección   →+       Interseccion           Interseccion      

Bhattach  ..   →0       Bhattach  ..           Bhattach  ..      

                                   

𝑃!…𝑃!  

Correlación   →0       Correlación   →1       Correlacion      

Chi-­‐Square   →+       Chi-­‐Square   →0       Chi-­‐Square      

Intersección   →0       Intersección   →+       Interseccion      

Bhattach  ..   →1       Bhattach  ..   →0       Bhattach  ..      

                   

 

           

𝐸!…𝐸!  

Correlación   →0       Correlación   →1       Correlación   →1  

Chi-­‐Square   →+       Chi-­‐Square   →0       Chi-­‐Square   →0  

Intersección   →0       Intersección   →+       Intersección   →+  

Bhattach  ..   →1       Bhattach  ..   →0       Bhattacha..   →0  

Tabla4. Matriz de Comparación

8.1.5 Protocolo para la definición de rangos

Una vez se han calculado las 4 pruebas de los histogramas se va a tener una matriz de datos con la estructura presentada en la Tabla 5 en donde cada celda corresponde a la distancia de los histogramas relacionados. Por último se extraen los valores máximos y mínimos de las áreas sombreadas (ver Tabla 6), para así finalmente construir los diferentes rangos en donde una imagen nueva va a poder ser ubicada.

  s1   s2   s3   s4   e1   e2   e3   e4   e5   p1   p2  

s1   𝐻!!,𝐻!!                      

s2   𝐻!!,𝐻!!   𝐻!!,𝐻!!                    

s3   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!                  

s4   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!                

e1   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!               e2   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!            

e3   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!          

e4   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!         e5   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!      

p1   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!     p2   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!   𝐻!!,𝐻!!  

(25)

Método   s1   s2   s3   s4   e1   e2   e3   e4   e5   p1   p2   s1  

Saludable  -­‐  Saludable       s2  

s3   s4   e1  

Enferma  -­‐  Saludable   Enferma  -­‐  Enferma     e2  

e3   e4   e5   p1  

Posiblemente  Enferma  -­‐  Saludable   Posiblemente  Enferma(P.E)  -­‐  Enferma     P.E  -­‐  P.E   p2  

Tabla 6. Casos Posibles de Comparación

8.1.6 Protocolo de Pruebas Finales

Una vez se han constituido los datos finales, el proceso para la utilización de estos datos se lista a continuación:

• Si el histograma de una imagen nueva se compara con los histogramas de las imágenes de palmas africanas saludables de la base de datos y el promedio de todas las distancias generadas en este proceso se encuentra en el rango de saludable, se debe realizar el mismo proceso pero ahora con las palmas enfermas y posiblemente enfermas de la base de datos. Si en ambos casos los promedios de las distancias están dentro del rango estipulado y adicionalmente se cumple esto para las 4 pruebas, la imagen de entrada será diagnosticada como saludable.

• De no cumplirse alguna condición, se deberá asumir la palma africana como posiblemente enferma y si persiste el incumplimiento se asume como enferma.

• Se da este orden debido a que en una plantación la probabilidad de encontrar una palma saludable es mucho mayor a encontrar una posiblemente enferma o enferma. Este proceso se presentará para una muestra de prueba de 8 palmas (3 saludables, 3 enfermas y 2 posiblemente enfermas. Ver numeral 8.2.2).

(26)

8.2 Validación de los resultados del trabajo

8.2.1 Consolidado de Rangos para las 4 pruebas en Histogramas

Correlación

Promedio Min Max Promedio Min Max

Saludable 0,864 0,786 0,958 Saludable-Enferma 0,353 0,219 0,565 Enferma 0,920 0,888 0,969 Saludable-Posible 0,350 0,233 0,448 Posible 0,927 0,927 0,927 Enferma-Posible 0,923 0,874 0,964

Intersección

Promedio Min Max Promedio Min Max

Saludable 82,35 72,56 92,86 Saludable-Enferma 45,94 36,51 68,42 Enferma 87,48 78,21 96,22 Saludable-Posible 37,57 32,98 46,79 Posible 63,79 63,79 63,79 Enferma-Posible 74,27 65,62 80,10

Bhattacharyya

Promedio Min Max Promedio Min Max

Saludables 0,228 0,137 0,316 Saludable-Enferma 0,537 0,442 0,636 Enferma 0,161 0,128 0,211 Saludable-Posible 0,540 0,463 0,633

Posible 0,200 0,200 0,200 Enferma-Posible 0,174 0,137 0,203

Chi - Square

Promedio Min Max Promedio Min Max

Saludables 155,271 32,463 353,147 Saludable-Enferma 1729,8 38,8 6963,5 Enferma 33,173 22,817 58,341 Saludable-Posible 1549,2 503,8 4211,3

Posible 34,631 34,631 34,631 Enferma-Posible 65,6 55,6 174,0

Tabla 7 Consolidado Rangos de Decisión

8.2.2 Prueba Final

En la comprobación final se hacen pruebas con una muestra de 8 palmas que no se incluyeron en la base de datos. Estas 8 palmas fueron diagnosticadas por un agrónomo. Como objetivo principal se busca que el diagnóstico generado por la plataforma hardware concuerde con el diagnóstico del agrónomo.

Al llevar a cabo la primera etapa, se genera la matriz de datos para cada prueba (se muestra solo la de correlación en este documento, para ver las otras 3 pruebas remitirse a los Anexos 13.4) y aleatoriamente se compara con 6 imágenes de la base de datos, Tabla 8.

(27)

Matriz de Datos de la Correlación

s1 s3 e1 e4 p1 p2

sNew1 0,961 0,778 0,332 0,243 0,342 0,378

sNew2 0,889 0,902 0,401 0,321 0,365 0,258

sNew3 0,862 0,792 0,481 0,307 0,286 0,246

eNew1 0,582 0,392 0,892 0,778 0,923 0,886

eNew2 0,576 0,453 0,921 0,902 0,951 0,945

eNew3 0,512 0,412 0,931 0,792 0,892 0,923

pNew1 0,245 0,302 0,889 0,856 0,883 0,953

pNew2 0,401 0,345 0,924 0,935 0,932 0,917

Tabla 8. Matriz de Datos Muestra Comprobación

A continuación se generan los promedios de las distancias calculadas para cada caso posible:

sNew1  

    eNew1       pNew1     Promedio  Saludables     0,8695  

  Promedio  Enfermas   0,835     Promedio  Posibles   0,918   Promedio  Saludables  -­‐  Enfermas   0,2875  

  Promedio  Saludable  -­‐  Enfermas   0,487     Promedio  Posible  -­‐  Saludable   0,2735   Promedio  Saludables  -­‐  Posibles   0,36  

 

Promedio  Enfermas  -­‐  Posible   0,9045    

Promedio  Posible  -­‐  Enferma   0,8725  

               

sNew2  

   

eNew2  

   

pNew2  

  Promedio  Saludables     0,8955  

 

Promedio  Enfermas   0,9115    

Promedio  Posibles   0,9245   Promedio  Saludables  -­‐  Enfermas   0,361  

  Promedio  Saludable  -­‐  Enfermas   0,5145     Promedio  Posible  -­‐  Saludable   0,373   Promedio  Saludables  -­‐  Posibles   0,3115  

 

Promedio  Enfermas  -­‐  Posible   0,948    

Promedio  Posible  -­‐  Enferma   0,9295  

               

sNew3  

   

eNew3  

       

Promedio  Saludables     0,827  

  Promedio  Enfermas   0,8615         Promedio  Saludables  -­‐  Enfermas   0,394  

  Promedio  Saludable  -­‐  Enfermas   0,462         Promedio  Saludables  -­‐  Posibles   0,266  

  Promedio  Enfermas  -­‐  Posible   0,9075        

Tabla 9. Promedio Distancias entre Histogramas

Por último se hace el algoritmo de revisión para cada caso, el cual consiste en revisar que los promedios estén en los rangos adecuados. Así por ejemplo para sNew1, (asumiendo que no se conociera que es una palma saludable) bastaría con observar que para la prueba de correlación si una palma esta saludable, su promedio de distancia con otras palmas saludables debe estar en el rango de 0,786 – 0,958 (Tabla 7) adicionalmente, su distancia con palmas enfermas debe estar en el rango de 0,219 – 0,565 y por último su distancia con posibles palmas enfermas, debe estar en el rango de 0,233-0,448. Así sucesivamente analizando cada imagen nueva de entrada en las 4 pruebas propuestas con el fin de encontrar errores y aciertos en el algoritmo y los supuestos.

Para finalizar esta etapa, se debe resaltar que analizando los resultados se comprobó un correcto funcionamiento para los métodos de correlación, intersección y Bhattacharyya, mientras que por otra parte, con el método Chi – Square se presentaron problemas, y se observa que el problema radica en la intersección de los rangos en las combinaciones saludable – enferma y enferma – posiblemente enferma. Exceptuando esto, las imágenes de prueba se ubicaron en los rangos correctos y presentaron un comportamiento adecuado. Se recomienda evaluar el cambio de la prueba Chi – Square por la prueba de Distancia Euclidiana.

(28)

8.3 Evaluación del plan de trabajo

Con base en las especificaciones y estructura del proyecto se cumplieron las metas más relevantes y se siguió el plan propuesto. Únicamente falto por cumplir una especificación relacionada con el prototipo final; en concreto presentar una interfaz con las imágenes nuevas de entrada y su diagnóstico final. Este plan de trabajo se sincronizó con el cronograma y la distribución de etapas, permitiendo llegar a esta última garantizando el cumplimiento de todas las tareas de la etapa 1 y 2.

9 DISCUSIÓN

Los resultados del trabajo constituyen una forma de aproximarse a la solución de una detección automática de características de interés en objetos estáticos, por medio del análisis de imágenes y sus componentes de color. Vale la pena aclarar, que esta no es la única solución posible. En el caso concreto de este proyecto se obtuvieron resultados satisfactorios ya que en su mayoría, los métodos de prueba escogidos y la integración hardware/software se comportaron de la forma esperada permitiendo desarrollar la investigación según lo planeado. Se identificaron 2 limitaciones a resaltar , la primera y más importante fue no contar con una base de datos de imágenes más robusta; esto debido a las dificultades de acceso a la plantación de estudio y los tiempos de movimiento. Como resultado de lo anteriormente mencionado, se logró cumplir con sólo una visita y no dos como fue planeado desde un comienzo.

La segunda limitación corresponde a la integración total de los bloques del sistema, ya que no se pudo consolidar un prototipo final totalmente automático, esto debido a que la cámara utilizada no presentó la compatibilidad esperada con las librerías OpenCV, y aunque esta podía capturar una imagen y almacenarla, no podía comunicarse con OpenCV para que directamente esta imagen fuera un parámetro de entada al algoritmo de comparación. Esto debido a que OpenCV trabaja con cámaras de puerto USB y no con el tipo de conexión serial que tiene el modulo de captura utilizado. La solución a dicha problemática (en la cual se pudo observar que varios investigadores están trabajando aún sin resultados concluyentes) es relacionar los comandos para cámara USB a la interfaz por conexión serial.

En cuanto a los resultados numéricos, se realizaron 8 pruebas y se calcularon un total de 96 relaciones (24 por cada prueba, ver Tabla9) en donde 6 de estos no se ajustaron a los rangos esperados; es decir el error total fue de 6,25% para las pruebas finales. Al aumentar la base de datos se espera que el error se mantenga o disminuya, proyectando un error de diagnóstico de 2 palmas en una muestra de 32 palmas. Finalmente y debido a que no hubo gran densidad de datos, la calidad de la información suministrada es buena pero presenta espacio para mejorar y generar una mayor precisión.

A largo plazo, se recomienda trabajar en la identificación de otras características que permitan identificar el estado de salud de una palma, con el fin generar un conjunto de indicadores que permitan asegurar un diagnóstico de alta precisión.

(29)

10

CONCLUSIONES

10.1 Conclusiones y Aportes Generales

• La inicialización, programación y apropiación de un ordenador de placa reducida como la Tarjeta RaspBerry que aun no tiene todos sus protocolos definidos (debido a su corto tiempo de lanzamiento) generan una documentación y punto de partida para procesos académicos a realizar con base en este ordenador.

• Se generó por medio de una plataforma hardware de bajo costo, una base de datos de palma africana para diferentes estudios en relación a estas mismas.

• Los criterios escogidos para el procesamiento de imagen tales como el espacio de color, rangos de saturación, matiz, formato de la imagen entre otros, permitieron un correcto desarrollo de las etapas principales del proyecto y pueden ser tomados como punto de referencia para investigaciones similares.

• Terminado el análisis de los datos generados y las pruebas realizadas, se concluye que los métodos de intersección, correlación y Bhattacharyya fueron una escogencia adecuada para la solución del problema.

• El método Chi-Square presentó una falta de concordancia y se sugiere analizar el método de la Distancia Euclidiana.

• Se presentó una plataforma hardware capaz de generar un diagnóstico del estado de la pudrición de cogollo en palmas africanas, con espacio para mejoramiento en la etapa de automatización del proceso.

En general se considera que el proyecto presentó un desarrollo exitoso , alcanzado la mayoría de los objetivos planteados, permitiendo comprobar los supuestos con los que se trabajó y generando un aporte al manejo de nuevas tecnologías e integración y análisis de teorías existentes.

10.2 Trabajos Futuros

Como trabajo futuro se propone generar una plataforma que no solo analice las características de color, si no también lograr generar otros criterios como por ejemplo la forma de las hojas de la palma africana las cuales son un indicativo del estado fitosanitario. Adicionalmente se recomienda para trabajos futuros la integración del prototipo hardware con sistemas aéreos no tripulados, para generar un dispositivo independiente y totalmente automático, esto siempre y cuando la plataforma hardware presentada sea totalmente validada y cumpla todas las funcionalidades necesarias.

(30)

10.3 Implicaciones

Las implicaciones del prototipo desarrollado son principalmente económicas ya que una de las directrices del proyecto fue la realización de la plataforma con una tarjeta/ ordenador de bajo costo, (120.000 COP incluyendo el módulo de captura de imágenes), que adicional al uso de plataformas libres de desarrollo genera una reducción de costos significativa. En esta etapa del proyecto no es comparable el costo con otras plataformas debido a que en general estas ya vienen integradas a sistemas aéreos no tripulados.[8]

11

AGRADECIMIENTOS

Al profesor Fredy E. Segura Quijano y a su grupo de trabajo por su asesoría y apoyo en la solución de problemas y generación de ideas. A la plantación Palmeras Barbascal, y su grupo de agrónomos por haber permitido trabajar y realizar pruebas en sus instalaciones.

                                                       

(31)

12

REFERENCIAS

[1]Asraf Hairuddin, M., Md Tahir, N., Baki, S.R.S.. “Representation of Elaeis Guineensis Nutrition Deficiency

Based On Image Processing Approach,” Computer Applications and Industrial Electronics, 2011 IEEE

International Conference on.(2011)

[2] Bradski. G. and Kaehler.A, “Computer Vision with the OpenCV Library,” in Learning Open CV, Massachusetts, September 2008.

[3] F.D Jou and K.C Fan, “Efficient matching of large-size histograms,” in Institute of Computer Science and Information Engineering, Taiwan, January 2003.

[4] Gómez, S.A. y Segura, F.E. “An aerial monitoring system (AMS) for detecting bud-rot diseases on oil

palms,” Bogotá, Colombia: Universidad de Los Andes. . (2012)

[5] Guest, M. “Ciclo de la enfermedad y Manejo Integrado de la Pudrición del cogollo causada por

Phytophthora (PC) en palma de aceite,” XI Reunion Tecnica Nacional de Palma Africana, (2013)

[6] J.R Smith and S.F Chang , “Tools and techniques for color image retrieval,” in IST/SPIE – Storage Retrieval for Image and Video Databases IV, San Jose, CA, February 1996, vol. 2670, pp. 426-437.

[7] Jeong. S, Won. C. H. and Gray. R, “Histogram Based Image Retrieval Using Gauss Mixture Vector

Quantization,” Stanford, CA, 2003.

[8] Manual de Usuario, Sistemas aéreos no tripulados de Trimble para topografía y cartografía.

[9] Martínez, G, “Identificación temprana y manejo integrado de la enfermedad Pudrición del cogollo,” XXXVII Congreso nacional de cultivadores de palma de aceite y demás eventos gremiales. (2009)

[10] Merkle. P, Singla.J.B, Müller.K and Wiegand.T, “Correlation Histogram Analysis of Depth-Enhanced 3d

Video Coding,” Berlin, 2010.

[11] Mesa J, Presidente Ejecutivo Fedepalma, Retos del Sector, Discurso de apertura, XVII Conferencia Internacional sobre palma de aceite y expopalma, Cartagena, Colombia (2012).

[12] Mosquera, M. “Impacto de diversas estrategias de manejo de la PC sobre la edad de erradicación del

cultivo,” XI Reunión Técnica Nacional de Palma Africana, (2013)

[13] Porter. F, “Testing Consistency of Two Histograms,” Pasadena, CA, March 2008.

[14] RaspBerry (2012). Documentation. Recuperado el 22 de Abril de 2014, del sitio Web:

http://www.raspberrypi.org/documentation/

[15] Riveros, J.C. “Reconocimiento y tratamiento de imágenes en sistemas embebidos para la detección de

enfermedades en plantas,” Bogotá, Colombia: Universidad de Los Andes.(2013)

[16] S.H Cha and S.N Srihari, “On Measuring the Distance Between Histograms,” NY, June 2001.

[17] Sundaram, G.S., Patibandala, B. “Bluetooth Communication using a TouchscreenInterface with the

Raspberry Pi,” Southeastcon, 2013 Proceedings of IEEE.

(32)

13

ANEXOS  

13.1 Algoritmo de la Solucion1

//Bibliotecas Necesarias//

#include "opencv2/highgui/highgui.hpp" #include "opencv2/imgproc/imgproc.hpp" #include <iostream>

#include <stdio.h>

using namespace std; using namespace cv;

//Main de la funcion

int main( int argc, char** argv ) {

Mat src_base, hsv_base; Mat src_test1, hsv_test1; Mat src_test2, hsv_test2; Mat src_test3, hsv_test2;

/// Cargar 4 imágenes que entran como argumento a la funcion

if( argc < 5 )

{

printf("** Error. Usage: ./compareHist_Demo

<image_settings0> < image_setting1> <image_settings2>\n"); return -1;

}

src_base = imread( argv[1], 1 ); src_test1 = imread( argv[2], 1 ); src_test2 = imread( argv[3], 1 ); src_test3 = imread( argv[3], 1 );

/// Convert to HSV

cvtColor( src_base, hsv_base, COLOR_BGR2HSV ); cvtColor( src_test1, hsv_test1, COLOR_BGR2HSV ); cvtColor( src_test2, hsv_test2, COLOR_BGR2HSV ); cvtColor( src_test2, hsv_test2, COLOR_BGR2HSV );

/// Establecer el numero de celdas para la matuz y la saturacion. ///OpenCv recomienda 50 y 60 respectivamente pero puede llegar a 256

int h_bins = 80; int s_bins = 80; int histSize[] = { h_bins, s_bins };

/// Establecer los Rangos de Saturacion(0-255) y Matiz (0-180)

float h_ranges[] = { 0, 180 }; float s_ranges[] = { 0, 256 };

const float* ranges[] = { h_ranges, s_ranges }; int channels[] = { 0, 1 };

/// Almacenamiento de los Histogramas en matrices de N dimensiones

MatND hist_base;

1  El  algoritmo  esta  basado  en  la  funcion  compareHist_Demo.cpp  disponible  en  OpenCV  2.4.0.9  documentation,  no  se  atribuye  la  autoria  de  

Referencias

Documento similar

 Para recibir todos los números de referencia en un solo correo electrónico, es necesario que las solicitudes estén cumplimentadas y sean todos los datos válidos, incluido el

La determinación molecular es esencial para continuar optimizando el abordaje del cáncer de pulmón, por lo que es necesaria su inclusión en la cartera de servicios del Sistema

Sólo que aquí, de una manera bien drástica, aunque a la vez coherente con lo más tuétano de sí mismo, la conversión de la poesía en objeto -reconocida ya sin telarañas

1) La Dedicatoria a la dama culta, doña Escolástica Polyanthea de Calepino, señora de Trilingüe y Babilonia. 2) El Prólogo al lector de lenguaje culto: apenado por el avan- ce de

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

6 Para la pervivencia de la tradición clásica y la mitología en la poesía machadiana, véase: Lasso de la Vega, José, “El mito clásico en la literatura española

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

La siguiente y última ampliación en la Sala de Millones fue a finales de los años sesenta cuando Carlos III habilitó la sexta plaza para las ciudades con voto en Cortes de