• No se han encontrado resultados

Normalización del color en imágenes y álgebra de cuaterniones

N/A
N/A
Protected

Academic year: 2020

Share "Normalización del color en imágenes y álgebra de cuaterniones"

Copied!
103
0
0

Texto completo

(1)Departamento de Telecomunicaciones y Electrónica. Título del Trabajo: “Normalización del color en imágenes y álgebra de cuaterniones” Autor: Carlos Javier Saroza Venegas Tutor: Dr. C. Juan Valentín Lorenzo Ginori. , junio de 2018.

(2) Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas, y se encuentra depositado en los fondos de la Biblioteca Universitaria “Chiqui Gómez Lubian” subordinada a la Dirección de Información Científico Técnica de la mencionada casa de altos estudios. Se autoriza su utilización bajo la licencia siguiente: Atribución- No Comercial- Compartir Igual. Para cualquier información contacte con: Dirección de Información Científico Técnica. Universidad Central “Marta Abreu” de Las Villas. Carretera a Camajuaní. Km 5½. Santa Clara. Villa Clara. Cuba. CP. 54 830 Teléfonos.: +53 01 42281503-1419.

(3) Hago constar que el prese te trabajo de diploma fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de estudios de la especialidad de Ingeniería en Automática, autorizando a que el mismo sea utilizado por la Institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos, ni publicados sin autorización de la Universidad.. Firma del Autor. Los abajo firmantes certificamos que el presente trabajo ha sido realizado según acuerdo de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. Firma del Tutor. Firma del Jefe de Departamento donde se defiende el trabajo. Firma del Responsable de Información Científico-Técnica.

(4) i. PENSAMIENTO. “You can’t always get what you want, but if you try sometimes You might find you get what you need.” Mick Jagger.

(5) ii. DEDICATORIA. A mi abuela, mi tía, mi hermana, mi sobrina, mi padre y especialmente a mi madre por su sacrificio y dedicación incansable como nadie durante toda mi vida..

(6) iii. AGRADECIMIENTOS. A mi abuela, mi tía, mi hermana y mis padres por su apoyo durante la carrera. A mi tutor Dr. Juan V. Lorenzo Ginori que con su constante ayuda y experiencia durante la investigación hizo posible la terminación del trabajo. A todas las personas que de una forma u otra me apoyaron y ayudaron a concluir este trabajo..

(7) iv. TAREA TÉCNICA. . Realizar una revisión bibliográfica sobre el tema, sistematizando la información obtenida y haciendo un análisis crítico dela misma.. . Realizar un estudio detallado de las principales operaciones algebraicas de los cuaterniones para la representación de píxeles en imágenes a color como dichos números hipercomplejos.. . Programar en Matlab los algoritmos propuestos en la investigación para la normalización del color en imágenes a color.. . Comparar los métodos implementados y evaluar experimentalmente la efectividad de estos a través de pruebas con imágenes a color.. Firma del Autor. Firma del Tutor.

(8) v. RESUMEN. En la actualidad, con el vertiginoso desarrollo de la tecnología en varias ramas de la ciencia y la ingeniería como la localización de objetos mediante satélites, los sensores de reconocimiento de huellas digitales, los sistemas de control de tráfico y las aplicaciones de carácter médico, entre otros, se generan un gran volumen de imágenes que se hace necesario procesar, y es la normalización del color en el proceso digital un importante problema debido a que el color forma parte de los atributos a considerar en dichas imágenes y puede afectar directamente los resultados sin su correcta corrección. En este trabajo se realiza la normalización del color mediante dos métodos: la especificación de histogramas y la corrección del color mediante la determinación de una matriz de conversión a partir de resolver un sistema de ecuaciones sobredeterminado. Inicialmente es desarrollado un algoritmo basado en la representación de los píxeles como cuaterniones, pero no resulta efectivo, aunque es tomado el cálculo de las distancias de color de dicho algoritmo para realizar una comparación entre los otros dos métodos. Los resultados obtenidos de los experimentos con bases de datos de imágenes demuestran la utilidad de ambos métodos, estableciendo la relación entre ambos..

(9) vi TABLA DE CONTENIDOS. PENSAMIENTO .....................................................................................................................i DEDICATORIA .................................................................................................................... ii AGRADECIMIENTOS ........................................................................................................ iii TAREA TÉCNICA ................................................................................................................iv RESUMEN ............................................................................................................................. v INTRODUCCIÓN .................................................................................................................. 1 Organización del informe ................................................................................................... 3 CAPÍTULO 1.. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN. DEL COLOR Y EL ÁLGEBRA DE CUATERNIONES ...................................................... 5 1.1. Aspectos generales sobre el color en imágenes digitales ......................................... 5. 1.2. Espacios de color en imágenes digitales .................................................................. 6. 1.2.1. Modelo de color RGB ....................................................................................... 7. 1.2.1.1. Representación de imágenes mediante el modelo RGB ................................... 8. 1.3. Histogramas en imágenes a color ........................................................................... 10. 1.4. Los números cuaterniones como extensión de los números reales ........................ 12. 1.4.1. Definición ....................................................................................................... 13. 1.4.2. Representación ................................................................................................ 13. 1.4.3. Aritmética de cuaterniones ............................................................................. 14. 1.4.3.1. Adición y multiplicación ................................................................................ 15. 1.4.3.2. Conjugado, norma, cuaternión unitario y cuaternión puro ............................. 16. 1.5. Representación de imágenes mediante cuaterniones ............................................. 17. 1.5.1. Aplicaciones de los cuaterniones en imágenes digitales ................................ 17.

(10) vii 1.6. Distancia de color entre píxeles empleando métrica de cuaterniones .................... 18. 1.6.1. Diferencia de cromaticidad ............................................................................. 19. 1.6.2. Dstancia de luminancia ................................................................................... 20. 1.6.3. Distancia de color ........................................................................................... 20. 1.7. Normalización del color en imágenes .................................................................... 21. CAPÍTULO 2.. MATERIALES Y MÉTODOS................................................................ 23. 2.1. Características de las imágenes utilizadas en el trabajo ......................................... 23. 2.2. Esquema de los algoritmos empleados para la normalización del color ................ 25. 2.3. Normalización del color empleando distancia métrica de cuaterniones ................ 27. 2.4. Especificación de histogramas ............................................................................... 30. 2.5. Obtención de una matriz de corrección (M) entre todos los píxeles de una imagen. a corregir y la imagen especificada mediante histogramas ............................................... 31 2.6. Media y desviación estándar de las distancias de color entre píxeles homólogos . 33. 2.7. Funciones de Matlab empleadas para la normalización del color en las imágenes34. CAPÍTULO 3.. RESULTADOS Y DISCUSIÓN ............................................................. 39. 3.1. Representación de los píxeles como cuaterniones ................................................. 39. 3.2. Normalización del color mediante distancia métrica de cuaterniones ................... 40. 3.3. Normalización del color mediante especificación de histogramas ........................ 44. 3.4. Obtención de la matriz de corrección M ................................................................ 46. 3.4.1. Cálculo de medias aritméticas y desviaciones estándar de distancias de color. entre píxeles .................................................................................................................. 48 3.5. Comparación entre el método de especificación de histogramas y la corrección del. color en las imágenes mediante la matriz M ..................................................................... 49 3.6. Tiempos de ejecución de los distintos pasos en los algoritmos implementados .... 51. CONCLUSIONES Y RECOMENDACIONES ................................................................... 53.

(11) viii Conclusiones ..................................................................................................................... 53 Recomendaciones ............................................................................................................. 53 REFERENCIAS BIBLIOGRÁFICAS ................................................................................. 55 ANEXOS .............................................................................................................................. 59 Anexo I. Códigos de los algoritmos implementados en Matlab .................................... 59. Anexo II. Imágenes utilizadas en la investigación ...................................................... 74. Anexo III. Histogramas de la imagen original del grupo Flores con respecto a las. demás imágenes de referencia .......................................................................................... 75 Anexo IV. Imagen original e imagen original corregida de los grupos mediante la. matriz de corrección asociada a las imágenes de referencia ............................................. 79 Anexo V. Imágenes de los grupos corregidas con las distintas matrices asociadas a las. imágenes de referencia...................................................................................................... 83 Anexo VI. Medias y desviaciones de las imágenes de los grupos usando las matrices. asociadas a las imágenes de referencia ............................................................................. 86 Anexo VII. Imágenes de los grupos especificadas con respecto a las demás imágenes de. referencia. 88. Anexo VIII. Medias aritméticas y desviaciones estándar entre las imágenes originales,. la especificada y la corregida, utilizando diferentes imágenes de referencia ................... 90 Anexo IX. Tiempos de ejecución de los algoritmos implementados para distintas. imágenes de referencia...................................................................................................... 91.

(12) INTRODUCCIÓN. 1. INTRODUCCIÓN. Al capturar una imagen se pueden producir diversos fenómenos adversos que afectan considerablemente la calidad del color, ya sea por los efectos de las lentes, por inexistencia de filtros apropiados para bloquear las radiaciones infrarrojas o ultravioletas, por un fallo en el proceso de guardado u otras adversidades. A veces una simple repetición de la imagen puede ser suficiente para solucionarlo; en otras ocasiones es suficiente con usar algún tipo de software de tratamiento de imágenes para corregirla. Una fase muy importante en este estudio es la normalización del color en dichas imágenes, pues cuando estas se toman pueden obtenerse muestras insatisfactorias debido al cambio de las condiciones de iluminación y otros factores externos que afectan la adquisición de las fotografías. Hoy en día existen varios algoritmos computacionales para la normalización del color en imágenes, que han sido descritos en la literatura científica [1], [2], [3], [4], [5]; así como diferentes centros de investigación que están inmersos en el estudio y el diagnóstico computacional, con el objetivo de desarrollar un dispositivo automatizado para el procesamiento de imágenes, el cual es de gran necesidad, ya que ahorraría tiempo y optimizaría el error humano en el análisis de estas, pues, generalmente en diferentes aplicaciones, en especial las de carácter médico, es de vital importancia reducir al mínimo las equivocaciones cometidas debido al cansancio y la subjetividad que pueden generar los grandes lotes de muestras. Esta situación está dada porque todavía no existe un método y/o un sistema general, que pueda dar solución al problema. Esta investigación se centra en los algoritmos que emplean la comparación de imágenes, corregir una imagen de forma que el resultado sea similar a una imagen de referencia dada.

(13) INTRODUCCIÓN. 2. en lo concerniente a la tonalidad de los colores. Estos métodos analizan regiones en las imágenes (una de referencia y otra a corregir) y las comparan para obtener una función de transformación. Existen técnicas conocidas como correspondencia de histogramas [6], cuyo objetivo consiste en hacer que el histograma de una imagen se asemeje al de otra. El procedimiento se basa en el análisis global del histograma, estableciendo las correspondencias en base a las probabilidades acumuladas, de forma que se asimilan valores de intensidad con similar acumulación en la distribución de las funciones de probabilidad. En este caso, la correspondencia entre histogramas se establece de forma global. Para implementar lo antes descrito se tomará una imagen de referencia con los requisitos de calidad considerados válidos. Con base en la imagen de calidad suficiente, se calculan las distancias de color entre los píxeles de la imagen a corregir y la de referencia, también se relacionan los histogramas de una y otra, permitiendo corregir las de baja calidad, y otras similares, con respecto a la de referencia. En resumen, cualquier imagen capturada bajo las mismas condiciones que la de baja calidad será corregida por similitud con la que ha servido de base para el establecimiento de correspondencia entre histogramas. Con la ejecución de este trabajo se solucionará el problema de la normalización del color, empleando el álgebra de cuaterniones como un novedoso método que posibilita medir las diferencias de color, para posteriormente basado en estos cálculos corregir dicho color en las imágenes y el método de especificación de histogramas. Estos métodos se implementarán a partir de la creación de un software capaz de sustituir posibles soluciones que aparecen reportadas en la literatura científica. Como problema de investigación tenemos la siguiente interrogante: ¿Cómo normalizar el color en imágenes empleando el álgebra de cuaterniones y la especificación de histogramas? Como interrogantes científicas se pueden plantear las siguientes: . ¿Cómo corregir el color en las imágenes usando álgebra de cuaterniones?. . ¿Cómo elaborar un algoritmo para normalizar el color en imágenes mediante especificación de histogramas?.

(14) INTRODUCCIÓN. . 3. ¿Cómo elaborar un algoritmo para corregir el color en imágenes a través de una matriz de corrección del color?. . ¿Cómo combinar el empleo del álgebra de cuaterniones con la especificación de histogramas?. Objetivo general: Normalizar el color en imágenes mediante especificación de histogramas y determinación de una matriz de conversión a partir de resolver un sistema de ecuaciones sobredeterminado. Objetivos específicos: . Emplear el álgebra de cuaterniones para representar imágenes y para calcular la distancia de color entre los píxeles.. . Programar en Matlab los métodos para normalizar el color en imágenes.. . Comparar ambos algoritmos de normalización de color en imágenes, y evaluar resultados.. Organización del informe El informe del trabajo contiene la siguiente estructura: Introducción, tres capítulos, conclusiones, recomendaciones, referencias bibliográficas y anexos. A continuación, se explican brevemente los temas y contenidos que se expondrán en cada capítulo. Capítulo 1: Se presentan los principales conceptos que se tratan en este trabajo. Se aborda el tema de la normalización del color en imágenes digitales, así como un acercamiento a los espacios de color, en específico al RGB, y el álgebra de cuaterniones. Capítulo 2: Se describe la obtención de las imágenes, así como sus características; también se aborda los algoritmos propuestos para la normalización del color en imágenes, además del cálculo de la media y la desviación estándar de las distancias de color. Capítulo 3: Se muestran los resultados obtenidos por los métodos empleados en los experimentos sobre la normalización del color en las imágenes, además se realiza una comparación analítica de estos. Por último, se presentan las conclusiones finales de la tesis y las recomendaciones para trabajos futuros..

(15) CAPÍTULO 1.

(16) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 5. CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y EL ÁLGEBRA DE CUATERNIONES. En este capítulo se presentan los fundamentos teóricos sobre la normalización del color que sustentan la base de este trabajo. Se describen brevemente los espacios de color, con especial interés en el modelo RGB. Se tratan temáticas vinculadas a los números hipercomplejos, en específico a los cuaterniones; se hace una descripción de estos números y de las operaciones algebraicas que son de interés para su representación en imágenes a color. Se explican brevemente algunos métodos de corrección de color, con especial interés en los histogramas y los cuaterniones. 1.1. Aspectos generales sobre el color en imágenes digitales. La clasificación en imágenes, en especial las de microscopía celular, donde se clasifican eritrocitos, membranas, núcleos u otras estructuras celulares son de vital importancia en diferentes aplicaciones de carácter médico; por lo que existen un variado número de sistemas computacionales para obtener y clasificar estos rasgos, entre estos los relacionados con las propiedades del color que tienen las imágenes que sirven de muestras para los análisis. La tinción o coloración [7] es una técnica auxiliar utilizada en microscopía para mejorar el contraste en la imagen vista al microscopio. Los colorantes y tinturas son sustancias que usualmente se utilizan en biología y medicina para resaltar estructuras en tejidos biológicos que van a ser observados con la ayuda de diferentes tipos de microscopios. Debido al uso de colorantes existe una variabilidad significante en los colores obtenidos, lo que puede afectar.

(17) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 6. considerablemente los resultados de los algoritmos o herramientas computacionales empleadas en la clasificación de objetos en los cuales es importante la información que puedan portan los colores. Las tinciones, sobre todo la tinción de Giemsa [8], que es muy empleada, afectan la coloración de las muestras, lo que conlleva a que estas, debido a la no uniformidad en la distribución de la tintura, el tiempo que está expuesta en la muestra y las diferentes concentraciones, entre otros, alcancen coloraciones no homogéneas. Por lo citado anteriormente se observa que, en las imágenes, y en específico, las de microscopía celular, el color juega un rol muy importante, así como los histogramas, que pueden corregir fallas en la distribución de los colores; por lo que se hace necesario mediante el proceso digital variar o cambiar las cualidades del color, como el tono, el matiz, valor o luminosidad, contraste simultáneo, la saturación, entre otros, según la finalidad. En los trabajos referentes a la malaria se utiliza una gran variedad de rasgos, tanto en imágenes en escala de grises, como para las componentes de color de los planos RGB y HSV, entre otros, que aprovecha de esta manera la información del color, de gran utilidad en las imágenes digitales de eritrocitos infestados con Plasmodium [9]. Por lo que el empleo de rasgos de color le confiere una gran importancia al problema de la corrección o normalización de los colores en este tipo de trabajos, y también en otros tipos de imágenes como, por ejemplo, de exteriores a diferentes horas del día. 1.2. Espacios de color en imágenes digitales. Los colores en las imágenes digitales son un atributo muy importante de estas, pues en una gran mayoría de aplicaciones simplifican considerablemente el procesamiento digital para la identificación y extracción de patrones u objetos que se necesiten analizar, además de que el ojo humano tiene dos tipos de células sensibles a la luz o foto-receptores: los bastones y los conos, estos últimos son los encargados de aportar la información de color, por lo que son capaces de distinguir mayor cantidad de tonalidades de colores que de grises [10]. Para saber cómo es percibido un color hay que tener en cuenta que existen tres tipos de conos con respuestas frecuenciales diferentes y que tienen máxima sensibilidad a los colores que forman la terna RGB. Aunque los conos, que reciben información del verde y el rojo, tienen.

(18) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 7. una curva de sensibilidad similar, la respuesta al color azul es una veinteava (1/20) parte de la respuesta a los otros dos colores. Esta propiedad la aprovechan algunos sistemas de codificación de imagen, como el JPEG, "perdiendo" de manera consciente más información del componente azul, ya que el ser humano no percibe esta pérdida. La sensación de color se puede definir como la respuesta de cada una de las curvas de sensibilidad al espectro radiado por el objeto observado. De esta manera, obtenemos tres respuestas diferentes, una por cada color. El hecho de que la sensación de color se obtenga de este modo hace que dos objetos observados, radiando un espectro diferente, puedan producir la misma sensación. Y en esta limitación de la visión humana se basa el modelo de síntesis del color, mediante el cual podemos obtener a partir de estímulos visuales estudiados y con una mezcla de los tres colores primarios, el color de un objeto con un espectro determinado. Un espacio de color es un sistema de interpretación del color, es decir, una organización específica de los colores en una imagen o video. Depende del modelo de color en combinación con los dispositivos físicos que permiten las representaciones reproducibles de color, por ejemplo, las que se aplican en señales analógicas como la televisión a color o representaciones digitales. Un espacio de color puede ser arbitrario, con colores particulares asignados según el sistema y estructurados matemáticamente. Un modelo de colores es un modelo matemático abstracto que permite representar los colores en forma numérica, utilizando típicamente tres o cuatro valores o componentes cromáticos. Es decir, un modelo de colores sirve en una aplicación que asocia a un vector numérico un elemento en un espacio de color. Existe una gran cantidad de modelos de colores en la literatura científica como el CMYK [11], HSL [12], HSV [13], HSI [14] y RGB [15], siendo el último objetivo de la presente investigación. 1.2.1 Modelo de color RGB RGB (Red-Green-Blue) por sus siglas en inglés, es un modelo de color basado en la síntesis aditiva, con la que es posible representar un color mediante la mezcla por adición de los tres.

(19) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 8. colores de luz primarios: rojo, verde y azul. Este modelo está basado en el sistema de coordenadas cartesianas [16]. En la Figura 1.1 se observan los valores R, G y B: las intensidades de. las componentes roja, verde y azul están en tres vértices; cian, magenta y amarillo se sitúan en otros tres vértices, el negro corresponde al origen y el blanco se sitúa en el vértice más alejado del origen. En este modelo, la escala de grises se extiende desde el negro al blanco a lo largo de la diagonal que une esos dos puntos, y los colores son puntos dentro del cubo definidos por los vectores desde el origen. Por conveniencia y para facilitar los cálculos, cuando se procesa una imagen representada en este modelo generalmente se normalizan los valores, de modo que todos los valores de R, G y B estén en el rango [0,1].. Figura 1.1. Modelo RGB (rojo, verde y azul) 1.2.1.1 Representación de imágenes mediante el modelo RGB Una imagen digital se puede definir como una función bidimensional 𝑓(𝑥, 𝑦) descrita en un espacio 2D discreto, donde x e y representan las coordenadas espaciales, y el valor de 𝑓 en.

(20) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 9. cualquier par de coordenadas (𝑥, 𝑦) representa la intensidad de la imagen en dicho punto, que es conocido como píxel. Los píxeles son los puntos de color (siendo la escala de grises una gama de color monocromática). Las imágenes se forman como una sucesión de píxeles. La sucesión marca la coherencia de la información presentada, siendo su conjunto una matriz coherente de información para el uso digital. El área donde se proyectan estas matrices suele ser rectangular. Cada píxel se codifica mediante un conjunto de bits de longitud determinada, llamado profundidad de color1; por ejemplo, puede codificarse un píxel con un byte (8 bits) en cada uno de los tres canales del espacio de color RGB, de manera que cada canal de color admite hasta 256 variaciones de color (28 posibilidades binarias), de 0 a 255. Las imágenes denominadas de color verdadero, son aquellas en las cuales cada píxel está representado generalmente por 3 o más bytes. Los bits están divididos en valores para el componente rojo, el verde y el azul, es decir, cada plano del modelo RGB. Cada uno de las componentes RGB disponen de 8 bits asociados, dando 28 o 256 valores de cada color. Esto permite 224 o 16.777.216 (16.7 millones) posibles colores para cada píxel. Para poder visualizar, almacenar y procesar la información numérica representada en cada píxel, se debe conocer, además de la profundidad y brillo del color, el modelo de color que se utiliza. Por ejemplo, el modelo RGB, como se describe en el epígrafe anterior, permite crear un color compuesto por los tres colores primarios. De esta forma, según la cantidad de cada uno de ellos que se use en cada píxel será el resultado del color final del mismo. Por ejemplo, el color magenta se logra mezclando el rojo y el azul, sin componente verde (este byte se pone en 0). Las distintas tonalidades del mismo color se logran variando la proporción en que intervienen ambas componentes (se altera el valor de esos dos bytes de color del píxel). En el modelo RGB lo más frecuente es usar 8 bits al representar la proporción de cada una de las tres componentes de color primarias. Así, cuando una de las componentes vale 0, significa que ella no interviene en la mezcla y cuando vale 255 significa que interviene dando. 1. La profundidad de color o bits por píxel (bpp) es un concepto que se refiere a la cantidad de bits de información necesarios para representar el color de un píxel en una imagen digital. Debido a la naturaleza del sistema binario de numeración, una profundidad de bits de n implica que cada píxel de la imagen puede tener 2n posibles valores de intensidad para cada componente de color de las tres (RGB) definidas..

(21) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 10. el máximo de ese tono, valores intermedios proveen la intensidad correspondiente, variando los colores en dependencia de las proporciones que se utilicen en cada plano. En la Figura 1.2 se observan los tres canales del modelo RGB, donde a cada píxel le corresponden tres valores de intensidad, que mezclados conforman el color de dicho píxel.. Figura 1.2. Planos del modelo RGB en una imagen. 1.3. Histogramas en imágenes a color. Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados, puede ser en forma diferencial o acumulada. Sirven para obtener una "primera vista" general, o panorama, de la distribución de la población, o de la muestra, respecto a una característica, cuantitativa y continua (como la longitud o el peso). De esta manera ofrece una visión de grupo permitiendo observar una preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una determinada región de valores dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir la característica. En los campos procesamiento de imagen y fotografía, un histograma de color representa la distribución que refleja el número de píxeles por los diferentes colores, en este caso para cada plano. En rigor el histograma de color sería de tres dimensiones debido a las componentes de color de las imágenes..

(22) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 11. El histograma de color puede ser construido para cualquier tipo de espacio de color, aun cuando el término es usado más frecuentemente en espacios tridimensionales como RGB o HSV. Para imágenes monocromáticas, el término histograma de intensidad puede ser usado en su lugar. Para imágenes multiespectrales, donde cada pixel es representado por un número arbitrario de medidas (además de las tres medidas en RGB), el histograma de color es Ndimensional, con N siendo el número de medidas tomadas. Cada medida tiene su propio rango de longitud de onda del espectro de luz, algunos de los cuales pueden estar fuera del espectro visible. Si el conjunto de posibles valores es suficientemente pequeño, cada uno de esos colores pueden ser puestos en un rango por si mismos; entonces el histograma no es más que el conteo de los pixeles que tiene cada posible color. Más a menudo, el espacio es dividido en un número apropiado de rangos, con frecuencia arreglados como una rejilla regular, cada una conteniendo muchos valores de colores similares. El histograma provee un resumen compacto de la distribución de los datos en una imagen. El histograma de color de una imagen es relativamente invariante con respecto la traslación y rotación sobre los ejes de vista [17], solamente varía lentamente con respecto al ángulo de vista. Para la comparación de los colores contenidos dentro de dos imágenes, los histogramas de color son particularmente adecuados para resolver el problema de reconocer un objeto en una posición y rotación desconocida dentro de una escena. La principal desventaja de los histogramas para clasificar es que la representación depende del color del objeto que está siendo estudiado, ignorando su forma y su textura. Los histogramas de color pueden potencialmente ser idénticos en dos imágenes con diferentes objetos que comparten información de color. Recíprocamente, sin información espacial o de forma, objetos similares de diferentes colores pueden ser indistinguibles basados solamente en las comparaciones de los histogramas de color. Otro problema es que los histogramas de color tienen alta sensibilidad a las interferencias de ruido como pueden ser cambios en la intensidad de la iluminación y errores de cuantización. Algunas de las soluciones propuestas han sido intersecciones entre histogramas de color, indización de constantes de colores, histogramas de color acumulativos, distancia cuadrática y correlogramas de color..

(23) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 12. Nuevas investigaciones sobre la relación entre los datos de histogramas de color y las propiedades físicas de los objetos en una imagen han mostrado que estos pueden representar no sólo la iluminación y el color del objeto, sino también la geometría de la imagen y su rugosidad, para proveer una mejor estimación de la iluminación y el color del objeto [18]. 1.4. Los números cuaterniones como extensión de los números reales. Los cuaterniones fueron descubiertos por William Rowan Hamilton2 en 1843 [19]. Hamilton buscaba formas de extender los números complejos a un número mayor de dimensiones. No pudo hacerlo para 3 dimensiones, pero para 4 dimensiones obtuvo los cuaterniones, por lo que estos números, también conocidos como números hipercomplejos, son una extensión de los números reales, similar a la de los números complejos. Mientras que los números complejos son una extensión de los reales por la adición de la unidad imaginaria i, los cuaterniones son una extensión generada de manera análoga añadiendo las unidades imaginarias i, j y k a los números reales [20]. Los cuaterniones no son únicamente una curiosidad algebraica. Tienen diversas aplicaciones que van desde la teoría de números, en donde pueden utilizarse para probar resultados como el teorema de los cuatro cuadrados, que dice que todo número natural 𝑛 puede expresarse como la suma de cuatro cuadrados perfectos, hasta aplicaciones físicas dentro del electromagnetismo, la teoría de la relatividad y mecánica cuántica, entre otras. Además, en física representan rotaciones en el espacio. Los cuaterniones se utilizan a menudo en gráficos por computadora (y en el análisis geométrico asociado) para representar la orientación de un objeto en un espacio tridimensional. Las ventajas son: conforman una representación no singular más compacta y más rápida que las matrices, en términos computacionales. Debido a lo expuesto, es común el uso de esta notación en el campo de la robótica, ya que permite en ciertas situaciones, mediante cuaterniones. 2. Matemático, físico y astrónomo irlandés, que hizo importantes contribuciones al desarrollo de la óptica, la dinámica y el álgebra. Su descubrimiento del cuaternión, junto con su trabajo en dinámica, son sus resultados más conocidos. Este último trabajo fue después decisivo en el desarrollo de la mecánica cuántica, donde un concepto fundamental llamado hamiltoniano lleva su nombre..

(24) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 13. unitarios, abstraer rotaciones y traslaciones con cierta simplicidad, permitiendo la obtención de la orientación relativa entre sistemas de coordenadas. 1.4.1 Definición Un cuaternión se puede definir de la siguiente forma: 𝑞 = 𝑞𝑟 + 𝑞𝑖 𝑖 + 𝑞𝑗 𝑗 + 𝑞𝑘 𝑘. (1.1). 𝑞 está definido sobre ℝ4 , 𝑞𝑟 , 𝑞𝑖 y 𝑞𝑘 son todos coeficientes reales, y los elementos 𝑖, 𝑗, 𝑘 son operadores complejos que satisfacen las siguientes reglas [20]: 𝑖 2 = 𝑗 2 = 𝑘 2 = 𝑖𝑗𝑘 = −1 𝑖𝑗 = 𝑘, 𝑗𝑘 = 𝑖, 𝑘𝑖 = 𝑗 𝑗𝑖 = −𝑘, 𝑘𝑗 = −𝑖, 𝑖𝑘 = −𝑗. (1.2). 𝑞𝑟 se denomina parte real o escalar de 𝑞 y 𝑞𝑖 𝑖 + 𝑞𝑗 𝑗 + 𝑞𝑘 𝑘 se denomina parte imaginaria o vectorial. 1.4.2 Representación Los cuaterniones se pueden representar de las siguientes formas: Vectorial Un cuaternión puede expresarse como el conjunto: ℍ = {𝑞 = 𝑞𝑟 + 𝑞𝑖 𝑖 + 𝑞𝑗 𝑗 + 𝑞𝑘 𝑘 ∶ 𝑞, 𝑞𝑖 , 𝑞𝑗 , 𝑞𝑘 ∈ ℝ} ⊂ ℂ2 ⊂ ℝ4. (1.3). O equivalentemente: ℍ = {(𝑞𝑟 + 𝑞𝑖 𝑖) + (𝑞𝑗 + 𝑞𝑘 𝑖)𝑗 ∶ 𝑞𝑟 + 𝑞𝑖 𝑖, 𝑞𝑗 + 𝑞𝑘 𝑖 ∈ ℂ} ⊂ ℂ2. (1.4). Análogamente, un cuaternión puede expresarse como el producto interno (componente a componente) de dos vectores, de los cuales uno es el de las componentes 𝑥⃗ = (𝑞𝑟 , 𝑞𝑖 , 𝑞𝑗 , 𝑞𝑘 ) y el otro el de las "bases": {1, 𝑖, 𝑗, 𝑘}. En este caso, el elemento 𝑞𝑟 que forma la componente real se anota aparte, y para el producto interno se consideran solamente las tres bases i, j, k: 𝑥⃗ = (𝑞𝑟 , ⃗⃗⃗⃗⃗ 𝑞𝑟 ) = (𝑞𝑟 , 𝑞𝑖 , 𝑞𝑗 , 𝑞𝑘 )..

(25) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 14. Esta representación tiene algunas ventajas que pueden ser vistas en algunas operaciones como el producto de cuaterniones. Matricial Además, hay al menos dos formas, isomorfismos, para representar cuaterniones con matrices. Así el cuaternión 𝑞 = 𝑞𝑟 + 𝑞𝑖 𝑖 + 𝑞𝑗 𝑗 + 𝑞𝑘 𝑘 definido en (1.1) se puede representar: . Usando matrices complejas de 2x2: 𝑞𝑗 + 𝑞𝑘 𝑖 ] 𝑞𝑟 − 𝑞𝑖 𝑖. (1.5). 𝑞𝑖 𝑞𝑟 𝑞𝑗 𝑞𝑘 −𝑞𝑖 𝑞𝑟 −𝑞𝑘 𝑞𝑗 𝑞 = [−𝑞 𝑞𝑘 𝑞𝑟 −𝑞𝑖 ] 𝑗 𝑞𝑘 −𝑞𝑗 𝑞𝑖 𝑞𝑟. (1.6). 𝑞=[ . 𝑞𝑟 + 𝑞𝑖 𝑖 −𝑞𝑗 + 𝑞𝑘 𝑖. Usando matrices reales de 4x4:. En este caso el determinante de la matriz resulta igual a: ‖𝑞 4 ‖ = (𝑞𝑟 2 + 𝑞𝑖 2 + 𝑞𝑗 2 + 𝑞𝑘 2 ). 2. (1.7). 1.4.3 Aritmética de cuaterniones En esta sección se hace una explicación, teniendo como base la definición antes realizada del cuaternión en (1.1), de algunas propiedades y operaciones algebraicas sencillas que tienen suma importancia debido a que ayudan a comprender otras más complejas que tienen gran utilidad en la normalización del color y en general en el procesamiento digital de imágenes a color usando los cuaterniones. Los cuaterniones son un ejemplo de cuerpo asimétrico, a veces llamado anillo de división, una estructura algebraica parecida a un cuerpo3, pero no conmutativo en la multiplicación;. 3. En álgebra abstracta, un cuerpo es una estructura algebraica en la cual las operaciones adición y multiplicación se pueden realizar y cumplen las propiedades asociativa, conmutativa y distributiva, además de la existencia de.

(26) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 15. es decir: satisfacen todas las propiedades de un cuerpo con excepción de que el producto no es conmutativo. La multiplicación es asociativa y todo cuaternión no nulo posee un único inverso. Forman una ℝ-álgebra asociativa 4-dimensional sobre los reales y los complejos forman un subconjunto de ella, los cuaterniones no forman un álgebra asociativa sobre los complejos [21]. 1.4.3.1 Adición y multiplicación Se define la adición y multiplicación entre cuaterniones mediante la aritmética usual de las matrices y de los números complejos. Puede comprobarse que el conjunto ℍ, junto con estas operaciones, satisface todas las propiedades de un campo con excepción de la multiplicación, que no es conmutativa. Adición La adición de cuaterniones es análoga a la de los complejos, de manera tal que si existen los números 𝑞1 , 𝑞2 ∈ ℍ, 𝑞1 = 𝑞𝑟1 + 𝑞𝑖1 𝑖 + 𝑞𝑗1 𝑗 + 𝑞𝑘1 𝑘 y 𝑞2 = 𝑞𝑟2 + 𝑞𝑖2 𝑖 + 𝑞𝑗2 𝑗 + 𝑞𝑘2 𝑘 la suma de ellos quedará de la siguiente forma: 𝑞1 + 𝑞2 = (𝑞𝑟1 + 𝑞𝑟2 ) + (𝑞𝑖1 + 𝑞𝑖2 )𝑖 + (𝑞𝑗1 + 𝑞𝑗2 )𝑗 + (𝑞𝑘1 + 𝑞𝑘2 )𝑘. (1.8). Propiedades . Ley interna: ∀ 𝑞1 , 𝑞2 ∈ ℍ : (𝑞1 + 𝑞2 ) ∈ ℍ. . Asociativa: 𝑞1 + (𝑞2 + 𝑞3 ) = (𝑞1 + 𝑞2 ) + 𝑞3. . Conmutativa: 𝑞1 + 𝑞2 = 𝑞2 + 𝑞1. Multiplicación La multiplicación se realiza componente a componente, de forma tal que, si se tienen dos cuaterniones 𝑞1 , 𝑞2 ∈ ℍ, 𝑞1 = 𝑞𝑟1 + 𝑞𝑖1 𝑖 + 𝑞𝑗1 𝑗 + 𝑞𝑘1 𝑘 y 𝑞2 = 𝑞𝑟2 + 𝑞𝑖2 𝑖 + 𝑞𝑗2 𝑗 + 𝑞𝑘2 𝑘, el resultado del producto es: 𝑞1 × 𝑞2 = (𝑞𝑟1 𝑞𝑟2 − 𝑞𝑖1 𝑞𝑖2 − 𝑞𝑗1 𝑞𝑗2 − 𝑞𝑘1 𝑞𝑘2 ) + (𝑞𝑟1 𝑞𝑖2 + 𝑞𝑖1 𝑞𝑟2 + 𝑞𝑗1 𝑞𝑘2 − 𝑞𝑘1 𝑞𝑗2 )𝑖. inverso aditivo, de inverso multiplicativo y de un elemento neutro para la adición y otro para la multiplicación, los cuales permiten efectuar las operaciones de sustracción y división (excepto la división por cero)..

(27) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. +(𝑞𝑟1 𝑞𝑗2 − 𝑞𝑖1 𝑞𝑘2 + 𝑞𝑗1 𝑞𝑟2 + 𝑞𝑘1 𝑞𝑖2 )𝑗 + (𝑞𝑟1 𝑞𝑘2 + 𝑞𝑖1 𝑞𝑗2 − 𝑞𝑗1 𝑞𝑖2 + 𝑞𝑘1 𝑞𝑟2 )𝑘. 16 (1.9). Propiedades . Ley interna: ∀ 𝑞1 , 𝑞2 ∈ ℍ : (𝑞1 ⋅ 𝑞2 ) ∈ ℍ. . Asociativa: 𝑞1 ⋅ (𝑞2 ⋅ 𝑞3 ) = (𝑞1 ⋅ 𝑞2 ) ⋅ 𝑞3. . Distributiva: 𝑞1 ⋅ (𝑞2 + 𝑞3 ) = 𝑞1 ⋅ 𝑞2 + 𝑞1 ⋅ 𝑞3. . Elemento inverso: ∀ 𝑞1 ≠ 0 ∶ 𝑞1 ⋅ 𝑞1 −1 = 𝑞1 −1 ⋅ 𝑞1 = 1. La multiplicación entre cuaterniones no cumple la propiedad conmutativa. 1.4.3.2 Conjugado, norma, cuaternión unitario y cuaternión puro Conjugado El conjugado de un cuaternión 𝑞 = 𝑞𝑟 + 𝑞𝑖 𝑖 + 𝑞𝑗 𝑗 + 𝑞𝑘 𝑘 está dado por: 𝑞̅ = 𝑞 ∗ = 𝑞𝑟 − 𝑞𝑖 𝑖 − 𝑞𝑗 𝑗 − 𝑞𝑘 𝑘. (1.10). En otras palabras, el conjugado invierte el signo de los componentes imaginarios del cuaternión, similar a como se calcula el conjugado en los números complejos. Matricialmente esto corresponderá a la operación de trasposición de cualquiera de sus representaciones matriciales. Norma La norma o valor absoluto de un cuaternión 𝑞 está dado por: ‖𝑞‖ = √𝑞𝑞 ∗ = √𝑞𝑟 2 + 𝑞𝑖 2 + 𝑞𝑗 2 + 𝑞𝑘 2. (1.11). Matricialmente, esta medida coincide con la raíz cuadrada del determinante de la matriz compleja 2x2 que representa al cuaternión. Esta medida cumple una propiedad similar al módulo de un número complejo: |𝑧𝑤| = |𝑤||𝑧| para cualesquiera cuaterniones 𝑧 y 𝑤. Cuaternión puro Cuando la componente real 𝑞𝑟 de un cuaternión es igual a cero, 𝑞 es llamado cuaternión puro. Los cuaterniones puros son de suma importancia para el procesamiento digital de imágenes, específicamente en imágenes a color..

(28) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 17. Cuaternión unitario Cuando el valor de la norma de un cuaternión 𝑞 es uno, se denomina cuaternión unitario, en caso que cuya norma no sea igual a uno se puede normalizar definiendo un nuevo cuaternión que será el unitario asociado a 𝑞, y se puede definir mediante la siguiente operación: 𝑞. 𝑞𝑢 = |𝑞| 1.5. (1.12). Representación de imágenes mediante cuaterniones. Para poder representar una imagen en forma de cuaternión, por las ventajas que representan estos sobre las matrices en cuestiones de rapidez desde el punto de vista computacional, y poderla manipular como tal es necesario resolver unas ligeras diferencias entre el modelo RGB, que es un espacio de tres dimensiones cuyos componentes son rojo, verde y azul, y el número cuaternión que a su vez es un sistema de cuatro dimensiones. Se hace relativamente sencillo resolver esta incompatibilidad, usando el modelo RGB como si fuera un cuaternión puro, en el cual sus tres componentes imaginarias 𝑖, 𝑗 y 𝑘 son las tres componentes de color rojo, verde y azul, como se muestra a continuación [22]: 𝐹(𝑥, 𝑦) = 𝑅(𝑥, 𝑦)𝒊 + 𝐺(𝑥, 𝑦)𝒋 + 𝐵(𝑥, 𝑦)𝒌. (1.13). Donde 𝐹(𝑥, 𝑦) es la representación cuaterniónica de un píxel, y 𝑅(𝑥, 𝑦), 𝐺(𝑥, 𝑦) y 𝐵(𝑥, 𝑦) son las componentes rojo, verde y azul respectivamente de dicho píxel. Este mecanismo es muy útil porque de este modo se pueden manipular las imágenes píxel a píxel como una sola entidad, sin dejar a un lado información como la tonalidad y saturación de la imagen, teniendo efecto en los tres planos o canales simultáneamente, y no de forma separada en las tres componentes o en escala de grises como se hacía anteriormente. Esta nueva forma de representar las imágenes trae consigo un impacto significante, pues al ser cada píxel un cuaternión a la vez, las propiedades y operaciones descritas en el epígrafe que le antecede pueden ser utilizadas, lo que conlleva directamente a una nueva manera de procesar las imágenes. 1.5.1 Aplicaciones de los cuaterniones en imágenes digitales Debido a las ventajas que trae representar las imágenes en forma cuaterniónica por tener mayor rapidez desde el punto de vista computacional que las matrices y otras formas para la.

(29) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 18. representación existentes, en los últimos años se han hecho una gran cantidad de estudios, trabajos e investigaciones en el ámbito de los cuaterniones para tratar diversas temáticas concernientes al proceso digital de imágenes, como la segmentación, la corrección del color, la clasificación a través de descriptores, entre otros, así como para probar y comparar su efectividad con la de otros métodos. Muchas de estas investigaciones como la segmentación de texturas a color mediante cuaterniones (Quaternion color texture segmentation) en Lilong Shi y Brian Funt [23] para el análisis de la segmentación del color con áreas con textura similar, descriptores como los momentos del cuaternión y sus invariante para los objetos de color (Quaternion moment and its invariants for color object) en Liqiang Guo y Ming Dai [24] y descriptores locales como el framework Quaternion-Michelson en Rushi Lan y Yicong Zhou [25] para la clasificación de las imágenes a partir de la textura, sistemas detectores de bordes en imágenes a color [26], entre otras aplicaciones como vectores basados en cuaterniones para remover ruido impulsivo de secuencias de videos a color (Quaternion-Based Impulse Noise Removal from Color Video Sequences) en Lianghai Jin y Hong Liu [27] para la normalización del color, que ha servido como basamento para este trabajo, han tenido un impacto significante en la literatura científica por sus resultados. 1.6. Distancia de color entre píxeles empleando métrica de cuaterniones. La medida de distancias de color es crucial para el procesamiento de imágenes en el ámbito de la corrección del color. Los métodos más comunes normalmente usan la distancia euclidiana para expresar dichas diferencias de color entre los píxeles. Pero estudios más recientes [28] indican que los métodos basados en cuaterniones podrían ser más eficaces. De acuerdo con lo planteado en [27], haciendo uso de la representación cuaterniónica, en una imagen representada en el modelo RGB, es escogido un píxel y representado como un cuaternión de la siguiente forma: 𝑞 = 𝑟𝑖 + 𝑔𝑗 + 𝑏𝑘. (1.14). Si un cuaternión puro unitario es denotado como: 𝑢 = (𝑖 + 𝑗 + 𝑘)/√3. (1.15).

(30) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 19. Entonces 𝑢𝑞𝑢∗ , donde 𝑢∗ es el conjugado de 𝑢, representa una rotación del vector 𝑞 en un ángulo de 180° sobre la línea gris, definida de la siguiente forma [29], [30]: 𝜇 =𝑖+𝑗+𝑘. (1.16). Es decir, los píxeles 𝑞 y 𝑢𝑞𝑢∗ están posicionados opuestamente uno con respecto al otro a distancias iguales de la línea gris 𝜇. Por consiguiente, el píxel 𝑞 + 𝑢𝑞𝑢∗ debe quedar en la línea gris. Para la obtención de la distancia de color entre dos píxeles es necesario analizar la diferencia de cromaticidad y la distancia de luminancia entre ellos, cuestiones que se describirán en los siguientes sub-epígrafes. 1.6.1 Diferencia de cromaticidad Es denotado un píxel como 𝑞1 = 𝑟1 𝑖 + 𝑔1 𝑗 + 𝑏1 𝑘 y otro como 𝑞2 = 𝑟2 𝑖 + 𝑔2 𝑗 + 𝑏2 𝑘, y es denotada la suma de 𝑞2 + 𝑢𝑞1 𝑢∗ como sigue: 𝑞3 = 𝑞2 + 𝑢𝑞1 𝑢∗ = 𝑟3 𝑖 + 𝑔3 𝑗 + 𝑏3 𝑘. (1.17). Entonces, cuando 𝑞1 y 𝑞2 tienen el mismo o aproximadamente el mismo valor de cromaticidad, 𝑞3 debe estar sobre o cerca de la línea gris 𝜇. En contraste, si la diferencia de cromaticidad es grande, 𝑞3 debe estar lejos de 𝜇. Por ende, se puede usar la distancia euclidiana de 𝑞3 y 𝜇 para medir la diferencia de cromaticidad entre 𝑞1 y 𝑞2 , la cual es igual a la magnitud del vector ⃗⃗⃗⃗⃗⃗ 𝐶𝐴, mostrado en la Figura 1.3 [27]. ⃗⃗⃗⃗⃗⃗ ⃗⃗⃗⃗⃗⃗ = (𝑟3 − 𝑟3 +𝑔3 +𝑏3 ) 𝑖 + (𝑔3 − 𝑟3 +𝑔3+𝑏3 ) 𝑗 + (𝑏3 − 𝑟3 +𝑔3 +𝑏3 ) 𝑘 𝐶𝐴 = ⃗⃗⃗⃗⃗⃗ 𝑂𝐴 − 𝑂𝐶 3 3 3. (1.18). Figura 1.3. Distancia del vector a la línea gris en el modelo RGB; ⃗⃗⃗⃗⃗⃗ 𝑪𝑨 es la distancia de 𝑨(𝒓𝟑 , 𝒈𝟑 , 𝒃𝟑 ) a 𝝁..

(31) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 20. De esta forma, se puede definir el siguiente cuaternión para expresar la diferencia de cromaticidad entre 𝑞1 y 𝑞2 como: 𝒬(𝑞1 , 𝑞2 ) = (𝑟3 −. 𝑟3 +𝑔3 +𝑏3 3. ) 𝑖 + (𝑔3 −. 𝑟3 +𝑔3 +𝑏3 3. ) 𝑗 + (𝑏3 −. 𝑟3 +𝑔3 +𝑏3 3. )𝑘. (1.19). 1.6.2 Dstancia de luminancia Para la obtención de una correcta distancia de color entre dos píxeles es muy importante conocer, al igual que la diferencia de cromaticidad, la distancia de luminancia entre ellos, porque pudiera existir el caso en el cual la 𝒬 fuera igual a cero o relativamente cercana, y sin embargo, los píxeles tener colores diferentes, debido a una diferencia en la luminancia. Por tal motivo, se denota la siguiente ecuación para medir la diferencia de luminancia entre ambos píxeles: 𝐼(𝑞1 , 𝑞2 ) = 𝑘1 (𝑟2 − 𝑟1 ) + 𝑘2 (𝑔2 − 𝑔1 ) + 𝑘3 (𝑏2 − 𝑏1 ). (1.20). Donde 𝑘𝑖 (𝑖 = 1, 2, 3) representa las contribuciones de los canales rojo, verde y azul a la luminancia. Típicamente, se puede denominar 𝑘1 = 𝑘2 = 𝑘3 = 1/3, lo cual representa que la luminancia es el promedio de los tres canales [31]. De este modo, queda definida la luminancia como: 𝐼(𝑞1 , 𝑞2 ) =. [(𝑟2 −𝑟1 )+(𝑔2 −𝑔1 )+(𝑏2 −𝑏1 )] 3. (1.21). 1.6.3 Distancia de color Según los sub-epígrafes anteriores, donde han sido explicadas tanto la importancia de la cromaticidad como la de luminancia para la diferenciación de los píxeles con respecto al color, se puede llegar a una ecuación que agrupa estos dos términos y calcula correctamente la distancia de color entre los píxeles 𝑞1 y 𝑞2 , la cual se muestra a continuación: 𝐶𝐷(𝑞1 , 𝑞2 ) = 𝑤|𝒬(𝑞1 , 𝑞2 )| + (1 − 𝑤)|𝐼(𝑞1 , 𝑞2 )|. (1.22). Donde |𝒬(𝑞1 , 𝑞2 )| y |𝐼(𝑞1 , 𝑞2 )| es el módulo de la diferencia de cromaticidad y la distancia de luminancia respectivamente, 𝑤 ∈ [0, 1] es un número que representa el “peso” que tienen la 𝒬(𝑞1 , 𝑞2 ) y la 𝐼(𝑞1 , 𝑞2 ) y su función es establecer un balance en la ecuación. Si w es cercano a la unidad, la influencia de 𝒬(𝑞1 , 𝑞2 ) para la ecuación es reforzada y la de 𝐼(𝑞1 , 𝑞2 ) es suprimida, ocurre lo contrario si w tiende a cero..

(32) CAPÍTULO 1. FUNDAMENTACIÓN TEÓRICA SOBRE LA NORMALIZACIÓN DEL COLOR Y ÁLGEBRA DE CUATERNIONES. 1.7. 21. Normalización del color en imágenes. Si se utilizan para el procesamiento digital las propiedades basadas en el color de las imágenes, las variaciones de color que pueden sufrir las mismas deben ser analizadas, ya que pueden afectar los resultados de los procesos que se realicen. La diferencia de color en las imágenes a procesar puede provocar variabilidad en los rasgos extraídos y por tanto errores en la clasificación, por esto es importante utilizar métodos para la normalización del color; un ejemplo de esto puede observarse en las muestras de sangre donde se realiza la detección de los parásitos de Plasmodium. La corrección del color depende en gran medida de la naturaleza de la luz con que se ilumina la imagen y la geometría del sistema que emite dicha luz para crear la imagen [32], [33]. Por ende, se hace necesario emplear un algoritmo para lograr la homogeneidad en el color. De acuerdo con [34], la corrección del color todavía es un tema abierto a la investigación debido al hecho de que ninguna técnica puede usarse para corregir todas las imágenes de manera absoluta en la mayoría de los casos generales. Existen varios métodos propuestos en la literatura, donde la mayoría de ellos requiere información previa sobre el dispositivo digital usado y las propiedades estadísticas de la imagen para estimar la luminancia de la imagen. Dichos métodos pueden ser clasificados en dos categorías aproximadamente, es decir, los que calibran el color en la imagen solo con información autónoma y los que lo hacen con información auxiliar. El algoritmo de igualación del histograma [6] es una manera simple y directa para corregir imágenes modificando la distribución del color. Sin embargo, los resultados corregidos dependen fuertemente de la distribución del color en las imágenes originales. Funciona bien para imágenes con baja diferencia de color global, pero no es conveniente para imágenes con baja diferencia de color local. Todos estos procedimientos suponen que hay solo una fuente de luz y es espacialmente uniforme en toda la escena. Muchos de estos modos de corrección de color en la literatura son basados en el modelo diagonal de cambio de iluminación de la hipótesis de Von Kries [35], como Modelo Diagonal o Mundo Gris (Gray World) [1], [36]; también existen los métodos Mapeo del Gamut basado en intersecciones (Intersectionbased Gamut Mapping) (IBGM) [2], Mapeo del Gamut basado en color blanco (White Patch Gamut Mapping) [1], [37], Sombras de Gray (Shades of Gray) (SoG) [38], entre otros..

(33) CAPÍTULO 2.

(34) CAPÍTULO 2. MATERIALES Y MÉTODOS. 23. CAPÍTULO 2. MATERIALES Y MÉTODOS. En este capítulo se describen las características de las imágenes empleadas para la realización de pruebas en el presente trabajo, además se exponen los algoritmos y métodos usados para el procesamiento digital de las muestras, así como un esquema representativo de estos; también se muestra como obtener una matriz para corregir varias imágenes diferentes, pero con las mismas condiciones de iluminación. Por otra parte, se detallan aspectos sobre la obtención de la media y la desviación estándar de las distancias de color entre las imágenes corregidas y las imágenes a corregir. Por último, se describen las funciones de Matlab empleadas en el capítulo. 2.1. Características de las imágenes utilizadas en el trabajo. El proceso de adquisición de las imágenes fue llevado a cabo haciendo una búsqueda en la base de datos de la Universidad McGill, ubicada en Canadá, relacionadas con el tema de la normalización del color [40]. Todas las imágenes fueron guardadas en formato JPEG, recopilando una gran cantidad de muestras con diferentes resoluciones, que van desde algunas muy pequeñas con (125x85) píxeles hasta otras muy grandes con (1920x714), todas con una profundidad de 24 bits. Las imágenes recopiladas fueron agrupadas según sus contenidos, obteniendo de esa forma 6 grupos de fotografías diferentes, cada uno de estos está compuesto por varias imágenes, una imagen denominada imagen_original y otras imágenes que muestran escenas parecidas, pero no iguales, con las mismas condiciones de iluminación. Además de estos grupos, fueron seleccionadas cinco imágenes de referencia, mostradas en la Figura 2.1, que serán usadas para adaptar el color de estas a las muestras de los grupos..

(35) CAPÍTULO 2. MATERIALES Y MÉTODOS. 24. Las características de los grupos y de las imágenes de referencia son mostrados en la Tabla 2.1 y la Tabla 2.2 respectivamente.. Imagen 1: Amanecer. Imagen 2: Anochecer. Imagen 3: Noche. Imagen 4: Soleado. Imagen 5: Tarde Figura 2.1. Imágenes de referencia utilizadas para corregir el color mediante el método de especificación de histogramas.

(36) CAPÍTULO 2. MATERIALES Y MÉTODOS. 25. Tabla 2.1. Características de las imágenes a procesar. Nombre de los grupos. Cantidad de imágenes. Resolución de las imágenes. Formato de las imágenes. Animales. 5. 768x576. JPEG. Ciudad. 5. 768x576. JPEG. Castillo. 2. 125x85. JPEG. Flores. 4. 768x576. JPEG. Hojas. 3. 768x576. JPEG. Vasija. 2. 135x100. JPEG. Todas las imágenes de los grupos son mostradas en el Anexo II. Tabla 2.2. Características de las imágenes de referencia. Nombre de la imagen Resolución de la imagen Formato de la imagen. 2.2. Amanecer. 1920x714. JPEG. Anochecer. 768x517. JPEG. Soleado. 724x475. JPEG. Noche. 618x738. JPEG. Tarde. 683x1023. JPEG. Esquema de los algoritmos empleados para la normalización del color. Para el implemento de los métodos de normalización del color en las imágenes usando distancia métrica de cuaterniones y especificación de histogramas es desarrollado un esquema en el cual se observan los pasos a seguir, mostrados en la Figura 2.2. Inicialmente se cargan en Matlab la imagen a normalizarle el color y la imagen de referencia mediante la función imread, después se procede a procesar las imágenes con las funciones creadas en Matlab, referidas en el Anexo I..

(37) CAPÍTULO 2. MATERIALES Y MÉTODOS. 26. Para corregir el color mediante distancia métrica de cuaterniones inicialmente son representadas como cuaterniones la imagen a corregir y una imagen de referencia. Seguidamente son calculadas las distancias de color, para después compararlas con un valor umbral y escoger las que sean menores o iguales que este; con estos valores es resuelto un sistema sobredeterminado de ecuaciones para la obtención de una matriz que se multiplicará con todos los píxeles de la imagen que se quiere corregir, y de esta forma es obtenida la imagen con el color normalizado. En el método de especificación de histogramas primeramente son obtenidos dichos histogramas para cada canal de color del modelo RGB, espacio de color en el cual se representan ambas imágenes. Posteriormente son especificados cada uno por separado a partir de sus homólogos en la imagen de referencia. Después es reconstruida la imagen y de esta forma es obtenida la imagen especificada o con el color normalizado. Debido a la alta sensibilidad que tienen los histogramas a cambios en la intensidad y la iluminación y a que son analizados en los tres canales de color independientemente, en algunos casos pueden traer como consecuencias ruido y afectaciones en los colores de la imagen específica o resultante. Por tal motivo, en aras de obtener una solución a este problema, una vez obtenida la imagen especificada, entre esta y la imagen original se calcula una matriz similar a la matriz calculada usando distancia métrica de cuaterniones, pero en este caso es obtenida a partir de todos los píxeles de ambas imágenes. Luego, haciendo uso de dicha matriz, es corregida la imagen que originalmente se le quería modificar el color para obtener una imagen muy similar a la especificada, pero sin el ruido o las imperfecciones en los colores producto de la especificación. A continuación, a la imagen especificada y a la imagen corregida con la matriz se les calcula la distancia de color, haciendo uso de (1.22), para después obtener la media y la desviación estándar de dichas distancias y de esa forma evaluar las diferencias. Posteriormente son corregidas con la matriz una serie de imágenes diferentes a la original, pero con iguales condiciones de iluminación, luego se les calcula la media y la desviación estándar con respecto a dichas imágenes para compararlas con la media obtenida entre la imagen original y la corregida y evaluar la similitud existente a pesar de que son imágenes diferentes, lo que por ende tienen píxeles diferentes..

(38) CAPÍTULO 2. MATERIALES Y MÉTODOS. 27. Figura 2.2. Diagrama de los algoritmos utilizados en la normalización del color 2.3. Normalización del color empleando distancia métrica de cuaterniones. La normalización del color usando la distancia métrica de cuaterniones es un método reciente propuesto en [28] el cual propone la corrección del color en una imagen basado en lo descrito previamente en el epígrafe anterior sobre el cálculo de la distancia de color entre píxeles mediante cuaterniones. Para normalizar la imagen se procede de la siguiente forma haciendo uso del algoritmo desarrollado en [28]: 1. Codificar la imagen a corregir 𝐼𝑇 y la imagen de referencia 𝐼𝑅 en el dominio de los cuaterniones. 2. Determinar un valor umbral T y un valor de w de la ecuación (1.22). 3. Para el primer píxel 𝑞𝑇 de 𝐼𝑇 y todos los píxeles de 𝐼𝑅 , calcular sus distancias de color 𝐶𝐷 mediante (1.22) y encontrar el píxel de 𝐼𝑅 con menor 𝐶𝐷(𝑞𝑇 ,𝑞𝑅) . Si.

(39) CAPÍTULO 2. MATERIALES Y MÉTODOS. 28. 𝐶𝐷(𝑞𝑇 ,𝑞𝑅) ≤ 𝑇, entonces se dice que son píxeles con colores similares y son guardados. Si 𝐶𝐷(𝑞𝑇 ,𝑞𝑅) ≤ 𝑇 no se satisface entonces se desechan. 4. Repetir el paso 3 para todos los píxeles en 𝐼𝑇 . Suponiendo que son encontrados n parejas de píxeles con color similar: {(𝑞1𝑇 , 𝑞1𝑅 ), (𝑞2𝑇 , 𝑞2𝑅 ), … , (𝑞𝑛𝑇 , 𝑞𝑛𝑅 )}. 5. Usar las n parejas encontradas en el paso 4 y resolver el siguiente sistema sobredeterminado: 𝑟𝑞1𝑅 [𝑔𝑞1𝑅 𝑏𝑞1𝑅 𝑚11 donde 𝑀 = [𝑚21 𝑚31. 𝑚12 𝑚22 𝑚32. 𝑟𝑞2𝑅 𝑟𝑞𝑛𝑅 𝑟𝑞1𝑇 𝑔𝑞2𝑅 … 𝑔𝑞𝑛𝑅 ] = 𝑀 [𝑔𝑞1𝑇 𝑏𝑞2𝑅 𝑏𝑞𝑛𝑅 𝑏𝑞1𝑇. 𝑟𝑞2𝑇 𝑟𝑞𝑛𝑇 𝑔𝑞2𝑇 … 𝑔𝑞𝑛𝑇 ] 𝑏𝑞2𝑇 𝑏𝑞𝑛𝑇. (2.1). 𝑚13 𝑚23 ] es una matriz de corrección del color. 𝑚33. 6. Después de obtener la matriz M, los tres valores {𝑟1 , 𝑔1 , 𝑏1 } del primer píxel en 𝐼𝑇 puede ser corregido por la siguiente ecuación: 𝑟1𝑐 𝑟1 [𝑔1𝑐 ] = 𝑀 [𝑔1 ] 𝑏1𝑐 𝑏1. (2.2). 7. Repetir el paso 6 para todos los píxeles en 𝐼𝑇 , para obtener la imagen 𝐼𝐶 con el color corregido. Para normalizar el color usando el método de distancia métrica de cuaterniones es indispensable la representación de la imagen a corregir y la de referencia como cuaterniones, pues los píxeles de las imágenes son procesados como esos números hipercomplejos. Debido a que los tres planos de colores por separado son vistos en escala de grises los valores de estos aparecen en un rango de [0 255], por lo que es necesario normalizar este rango con respecto a uno porque las operaciones algebraicas implementadas en las funciones de Matlab devuelven resultados erróneos con números demasiado grandes. Seguidamente se calculan las distancias de color entre un píxel de la imagen a corregir y todos los píxeles de la imagen de referencia y posteriormente se escogida la mínima distancia de todas las calculadas mediante la función min, estos cálculos se realizan para todos los píxeles de la imagen a corregir; de acuerdo con (1.22) para la realización de estas operaciones son realizadas varias pruebas donde se escogen diferentes valores de w para balancear la.

(40) CAPÍTULO 2. MATERIALES Y MÉTODOS. 29. cromaticidad y la luminancia de los píxeles y observar cómo son afectados los resultados. Como los valores de los píxeles están normalizados con respecto a uno todas las distancias de color están en un rango de [0 1], siendo iguales aquellos píxeles que tengan una distancia de color cero y totalmente diferentes los que tengan una distancia igual uno. Posteriormente es escogido un valor umbral entre todas las distancias de color que determina los píxeles que tienen colores similares en las dos imágenes; para garantizar que los pares de píxeles que son elegidos sean lo más parecidos posible en cuanto al color, después de ser calculadas todas las distancias de color y escogidas aquellas que son mínimas son guardadas en un arreglo y ordenadas de forma ascendente mediante la función sort, luego son tomados en cuenta los primeros de esos resultados, que son las distancias de color más pequeñas de todas las distancias mínimas, hasta llegar al 4% aproximadamente del total para denotar ese número como el umbral correspondiente a esas imágenes. A continuación, se seleccionan en ambas imágenes los píxeles que corresponden a ese valor de umbral y a todos los que estén por debajo de este y son guardados, aquellos que no cumplen con esta condición son desechados. Con los píxeles extraídos de la imagen a corregir y la de referencia se crean dos matrices respectivamente, cuyas filas son los valores de rojo, verde y azul de estos, y las columnas representan la cantidad escogida en una imagen y otra. Una vez obtenidas las dos matrices es generado un sistema sobredeterminado [41] con estas para calcular una matriz de corrección del color M mediante (2.3). La matriz M es obtenida haciendo uso de la función mldivide o también conocida como división por la izquierda, esta matriz siempre tiene como dimensiones tres filas por tres columnas. M es usada, como lo indica el nombre, para corregir el color en la imagen que se está procesando; para lograrlo, como describe el algoritmo que se implementó, es multiplicado cada píxel de la imagen a normalizarle el color por la matriz, haciendo uso de (2.2), obteniendo de esta forma otro píxel con los valores de rojo, verde y azul modificados. Seguidamente es reconstruida la imagen donde son remplazados todos los píxeles con el color corregido por los originales. Las posibles complicaciones del método propuesto dependen de las dimensiones de las imágenes a analizar..

(41) CAPÍTULO 2. MATERIALES Y MÉTODOS. 30. La programación del método del cálculo de la distancia métrica de cuaterniones se puede observar en el Anexo I. 2.4. Especificación de histogramas. La especificación del histograma, a veces llamado emparejamiento del histograma o normalización del histograma, constituye una operación básica en el procesamiento de señales. Este método consiste en la transformación de un histograma en otro, cambiando la frecuencia de ocurrencia del histograma a procesar a partir de un histograma de referencia [39]. La facilidad con la que se pueden calcular los histogramas usando software y su bajo consumo de recursos de hardware en su implementación, han hecho de esta herramienta una de las más usadas en el procesamiento en tiempo real. La ecualización del histograma es una técnica bastante conocida y sirve para obtener un histograma uniforme de tal manera que los niveles de gris son distribuidos sobre la escala y un número igual de píxeles son colocados en cada nivel de gris. Para un observador, esta ecualización hace que las imágenes se vean más balanceadas y con mejor contraste. Como consecuencia, una imagen ecualizada, permite que ciertos detalles sean visibles en regiones oscuras o brillantes. Por otro lado, la especificación del histograma se refiere a una clase de transformación de la imagen con el objetivo de obtener una imagen a partir de histogramas de una forma deseada. Por ejemplo, se desea obtener aproximadamente la misma distribución de niveles de gris de una imagen con respecto a otra imagen que se considera que tiene un buen nivel de brillo. Para realizar la especificación de un histograma se procede de la siguiente forma [16]: 1. Ecualizar la imagen original 2. Especificar la función de distribución de probabilidad deseada y obtener la función de transformación 3. Aplicar la función de transformación a los niveles obtenidos en la ecualización La dificultad de obtener un histograma especificado está en obtener aquel que dé lugar a una imagen con el realce apropiado. Cuando no se obtiene el histograma deseado se puede aplicar una función de densidad probabilística particular o utilizar el histograma de otra imagen conocida..

Figure

Figura 1.2. Planos del modelo RGB en una imagen.
Figura  1.3.  Distancia  del  vector  a  la línea gris en el modelo RGB;
Figura 2.1. Imágenes de referencia utilizadas para corregir el color mediante el método  de especificación de histogramas
Tabla 2.1. Características de las imágenes a procesar.
+7

Referencias

Documento similar

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)