Paquete en Python para la reducción de dimensionalidad en imágenes a color

Texto completo

(1)Departamento De Computación. Título: Paquete en Python para la reducción de dimensionalidad en imágenes a color. Autora: Liliam Fernández Cabrera. Cabrera. Tutor: M.Sc. Roberto Díaz Amador.. Santa Clara, Cuba, 2018.

(2) Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas, y se encuentra depositado en los fondos de la Biblioteca Universitaria “Chiqui Gómez Lubian” subordinada a la Dirección de Información Científico Técnica de la mencionada casa de altos estudios. Se autoriza su utilización bajo la licencia siguiente: Atribución- No Comercial- Compartir Igual. Para cualquier información contacte con: Dirección de Información Científico Técnica. Universidad Central “Marta Abreu” de Las Villas. Carretera a Camajuaní. Km 5½. Santa Clara. Villa Clara. Cuba. CP. 54 830 Teléfonos.: +53 01 42281503-1419. i.

(3) La que suscribe Liliam Fernández Cabrera, hago constar que el trabajo titulado Paquete en Python para la redimensionalidad de imágenes a color fue realizado en la Universidad Central “Marta Abreu” de Las Villas como parte de la culminación de los estudios de la especialidad de Licenciatura en Ciencias de la Computación, autorizando a que el mismo sea utilizado por la institución, para los fines que estime conveniente, tanto de forma parcial como total y que además no podrá ser presentado en eventos ni publicado sin la autorización de la Universidad.. ______________________ Firma del Autor. Los abajo firmantes, certificamos que el presente trabajo ha sido realizado según acuerdos de la dirección de nuestro centro y el mismo cumple con los requisitos que debe tener un trabajo de esta envergadura referido a la temática señalada.. ____________________________ Firma del Tutor. ___________________________ Firma del Jefe del Laboratorio. ii.

(4) RESUMEN Un enfoque eficiente de las técnicas del procesamiento digital de imágenes permite dar solución a muchas problemáticas en los campos investigativos que precisan del uso de imágenes para búsquedas de información. Estas imágenes después de ser procesadas tienen una amplia gama de usos en diferentes campos tales como la medicina, en diagnósticos en tomografías digitalizadas de pacientes enfermos; la astrofísica, al determinar estados de la materia en cuerpos celestes muy lejanos, así como la robótica en detección de objetos en tiempo real, entre otros. La reducción de dimensionalidad en imágenes de color a escala de grises como parte del procesamiento digital de imágenes es vital en la percepción humana para observadores con una visión de color deficiente y en el análisis de estas imágenes por los métodos de búsqueda de información. La eficiencia de los algoritmos que utilizan la reducción de dimensionalidad de imágenes a color es vital debido a la importancia de los campos en que se utiliza y a los grandes volúmenes de información que se procesan en sus aplicaciones, por lo que surge la necesidad de un paquete de algoritmos que realice una eficiente reducción de dimensionalidad de imágenes a color. En este trabajo de diploma se evaluarán las posibilidades de implementación de herramientas de reducción de dimensionalidad en imágenes en un paquete en el lenguaje Python que sea no propietario, fácil de utilizar y disponible. En la implementación del paquete se aprovecha la ventaja que ofrece contar con un compendio de los métodos de conversión a escala de grises más importantes desarrollados en este siglo de acuerdo con las publicaciones recientes, al ser esta un área activa de investigación.. iii.

(5) ABSTRACT An efficient approach to digital processing technics allows achieving solutions to problems in diverse investigation field that use digital images for information search. These images after being processed have a wide range of uses in fields like medicine, diagnosing sick patients by digitalized tomographies; astrophysics, detecting matter status in faraway celestial bodies, and robotics, real time object detection, among others. The reduction of color images dimensionality as part of the digital image processing is vital for human perception of images in grayscale to vision deficient human observers and analysis of these grayscale images by knowledge search methods. The efficiency of the algorithms that use dimensionality reduction of color images is fundamental because the huge information volume that needs to be processed; this is why the necessity of an algorithms package that reduces the dimensionality of color images in an efficient and robust way. In this basic degree thesis there will be evaluated the implementation of dimensionality reduction methods in python programming language, which is free software, easy to use, and available. In the package implementation we take advantage of a compendium of state of the art grayscale conversion methods developed in this century, related to recent publications.. iv.

(6) TABLA DE CONTENIDOS INTRODUCCIÓN..................................................................................................................... 1 CAPÍTULO 1. GENERALIDADES .................................................................................... 4 1.1. La Imagen Digital a Color ............................................................................................ 4. 1.1.1 Imagen Digital ............................................................................................................. 5 1.1.2 Imagen a Color. Espacio de Color .............................................................................. 6 1.1.3 Estándares de Colores ................................................................................................. 9 1.2 Técnicas de Reducción de los Espacios de Color ............................................................ 10 1.2.1 Métodos clásicos de conversión de color a escala de grises. .................................... 11 1.2.2 El Problema de la conversión de color a escala de grises. ........................................ 14 1.2.3 Categorías de los métodos en estado-del-arte de C2G. ............................................. 16 1.3 Conclusiones del capítulo ................................................................................................ 26 CAPÍTULO 2. Materiales y Métodos ............................................................................ 27 2.1. El Lenguaje Python ..................................................................................................... 27. 2.2. Diagrama de las Bibliotecas de Reducción de Dimensionalidad creadas................... 28. 2.2.1. Decolorize (Decolor_linear2006) ........................................................................ 28. 2.2.2. GcsDecolor2 ........................................................................................................ 29. 2.2.3. SPDecolor ............................................................................................................ 31. 2.2.4. Kim09 (Decolor_nonlinear2009) ........................................................................ 33. 2.3. Procedimiento de evaluación utilizado. ...................................................................... 34. 2.3.1. Diseño del experimento ....................................................................................... 35. 2.3.2. Bases de casos utilizadas ..................................................................................... 35. 2.3.3. Medidas Objetivas ............................................................................................... 35. 2.3.4. Medidas Subjetivas .............................................................................................. 38. 2.4. Análisis Estadístico de los Resultados ........................................................................ 38. 2.5. Conclusiones del Capítulo .......................................................................................... 39 v.

(7) CAPÍTULO 3. Resultados y Discusión ........................................................................ 40 3.1. Evaluación comparativa de los métodos implementados. .......................................... 40. 3.1.1. Objetiva. .............................................................................................................. 40. 3.1.2. Subjetiva. ............................................................................................................. 41. 3.2 Diseño e implementación del paquete de conversión de imágenes a escala de grises: C2G y la herramienta asociada: C2GApp. ............................................................................. 43 3.2.1. Implementación del paquete de algoritmos C2G ................................................ 44. 3.2.2. Implementación de la aplicación visual C2G_app .............................................. 45. 3.3. Conclusiones del capítulo ........................................................................................... 47. CONCLUSIONES .................................................................................................................. 48 RECOMENDACIONES ........................................................................................................ 49 BIBLIOGRAFÍA ..................................................................................................................... 50 ANEXOS .................................................................................................................................. 53. vi.

(8) LISTA DE FIGURAS Figura 1 Ejemplo de separación de canales RGB........................................................................ 4 Figura 2 Comparación de cromaticidades encerradas en un espacio de color. ........................... 6 Figura 3 Comparación entre los modelos de color RGB y CMYK. Esta imagen demuestra la diferencia de aspecto de los colores en un monitor de ordenador (RGB) en comparación con su reproducción en CMYK en el proceso de impresión. ................................................................. 7 Figura 4 Izquierda: Mezcla de colores aditivos (Tres colores superpuestos en un vacío se suman para crear el blanco) Derecha: Mezcla de colores sustractivos (Tres colores en un papel blanco, se restan para volver el papel negro). .......................................................................................... 8 Figura 5 Modelo de color RGB. .................................................................................................. 9 Figura 6 Imagen del Monet, de Claude Oscar (Francia, 1840-1926) obra maestra “Impresión del Amanecer” convertida a escala de grises por cinco métodos diferentes: b) la función rgb2gray de Matlab, c) L* del CIEL*a*b*, d) RTCP, e) ApparentGreyscale, f) Kim09. ........................ 11 Figura 7 Conversión de RGB a escala de grises usando el método de suma pesada con los pesos NTSC. De arriba hacia abajo: coordenadas en los cubos RGB en 3D, imágenes RGB originales, imágenes en escala de grises, y sus histogramas. ...................................................................... 12 Figura 8 Conversión de RGB a escala de grises de las mismas tres imágenes de colores usando la capa L* del espacio de color CIEL*a*b*. ............................................................................. 13 Figura 9 Conversión de RGB a escala de grises de las mismas tres imágenes de colores usando la componente L del espacio de color HSL. .............................................................................. 14 Figura 10 Tres parámetros independientes de control son usados: realce de control , selección de escala , supresión de sonido . Ejemplo usando = 0.3, = 25, y = 0.001. .............. 16 Figura 11 Diagrama de Flujo Decolor_Linear2006 .................................................................. 29 Figura 12 Diagrama de Flujo GcsDecolor2 ............................................................................... 31 Figura 13 Diagrama de Flujo SPDecolor .................................................................................. 32 Figura 14 Diagrama de Flujo Decolor_nonlinear2009 .............................................................. 34 Figura 15 Las imágenes muestran, en la (a) la imagen original a color, del (b)-(e) las imágenes resultantes de los métodos propuestos y en la (f) la imagen resultante con la preservación de contraste en los pétalos. ............................................................................................................. 36. vii.

(9) Figura 16 Las imágenes muestran, en la (a) las imágenes originales a color, el (b) las imágenes resultantes de los métodos propuestos y en la (c) las imágenes resultantes con CCFR incluido. ................................................................................................................................................... 37 Figura 17 Valores de CCPR, CCFR y Marca-E para los cuatro métodos. ................................ 41 Figura 18 Resultados del SPSS para los sujetos 1 y 2 respectivamente. ................................... 41 Figura 19 Resultados del SPSS para los sujetos 3 y 4 respectivamente. ................................... 41 Figura 20 Imagen principal de la aplicación. ............................................................................ 45 Figura 21 Muestra del trabajo con imágenes. ............................................................................ 45 Figura 22 Muestra de las medidas de evaluación. ..................................................................... 46 Figura 23 Muestra de los algoritmos de transformación. .......................................................... 46 Figura 24 Muestra seleccionar imagen. ..................................................................................... 46 Figura 25 Muestra resultados de la aplicación. ......................................................................... 47. viii.

(10) LISTA DE TABLAS Tabla 1 Los métodos en estado-del-arte para la conversión de C2G con mapeo global. .......... 17 Tabla 2 Los métodos en estado-del-arte para la conversión de C2G con mapeo local. ............ 21 Tabla 3 Los métodos en estado-del-arte para la conversión de C2G con mapeo híbrido. ........ 23 Tabla 4 Comparación de CCPR, CCFR y Marca-E. ................................................................. 40 Tabla 5 Evaluaciones subjetivas de los métodos. ...................................................................... 42. ix.

(11) INTRODUCCIÓN El color es una sensación humana asociada a la respuesta del cerebro a un estímulo visual específico y el cual experimentamos como un solo atributo. Aunque podemos, de una forma precisa, describir el color a través de la medición de su distribución espectral de poder, esto lleva a un extenso grado de datos altamente superfluos. La razón se debe a que la muestra de color de la retina de los ojos usa solamente tres anchos de banda, correspondientes a la luz roja, verde y azul pertenecientes a la respuesta de tres tipos de células sensitivas (llamadas cones), correspondientes al L (largo), M (medio) y S (corto) en relación a la longitud de onda de la frecuencia de banda a la que ellas responden. Las señales de estos sensores junto a las de las barras (sensibles solo a la intensidad), se combinan en el cerebro para dar diversas sensaciones de color. Desafortunadamente la producción de color en imágenes digitales RGB es similar en cierto aspecto al uso de tres sensores para las luces R, G, y B, pero sin sensores para la intensidad solamente (como las barras) y la ausencia de un analizador similar al cerebro humano para interpretar contextual y psicológicamente las señales de estos tres sensores. Las antes mencionadas característica de la producción de color en imágenes digitales dificulta el proceso de interpretar el color en imágenes descuidando o reduciendo su contenido cromático porque esta tarea se convierte en un problema de reducción de dimensionalidad, del espacio 3D de la representación RGB al espacio 2D o 1D de intensidad: la reducción de color y la conversión a escala de grises (C2G) respectivamente. Para algunos métodos de reducción de color es un problema similar a la cuantificación de color y a comprimir la dimensionalidad de gamut. Sin embargo, en cualquier caso, hay una pérdida de información visual, y la mayoría de las veces la conversión por lo general preserva el contraste entre la luminosidad y el brillo sin un apropiado manejo del significado de la cromacidad (tonalidad y saturación). Este es el caso del método clásico de conversión de imágenes C2G cuyo uso está muy difundido. El uso más recurrente de la reducción de color es la conversión de imágenes C2G, también llamado supresión de color o decoloración, las cuales pueden dividirse en dos grupos, el primero tiene como meta la percepción humana de imágenes en escala de grises, incluyendo el problema de la conversión de color o la re coloración de imágenes para observadores humanos con una visión de color deficiente; el segundo grupo tiene como meta el procesamiento de imágenes en 1D, incluyendo visión artificial, el uso de métodos bien establecidos para el análisis de imágenes en escala de grises tales como la segmentación, umbralización, textura de segmentación, etc. Más o menos, el primer grupo de métodos necesitan generar una imagen en escala de grises perceptualmente equivalente a la imagen original a color, donde las diferencias percibidas entre los colores de la imagen a color deben ser proporcionales a las diferencias percibidas en los grises en la imagen en escala de grises, tarea bastante compleja. En cambio, el segundo grupo 1.

(12) de métodos necesitan generar imágenes en escala de grises con consistencia global, esto es, cuando dos pixeles tienen el mismo color en la imagen a color, deberán tener el mismo nivel de gris en la imagen en escala de grises. Este trabajo es un estudio comparativo de más de 20 métodos C2G desarrollados durante los últimos 18 años de este siglo de acuerdo con las publicaciones más recientes, no obstante, otros métodos adicionales publicados en este lapso de tiempo son mencionados, confirmando que el problema de la conversión de C2G es una activa área de investigación, principalmente porque este problema raramente asegura la calidad y la eficiencia simultáneamente. Objetivo General: Implementar un paquete en Python para la reducción de dimensionalidad en imágenes a color. Objetivos Específicos: 1. 2. 3.. Determinar a partir del estado del arte, cuáles de los métodos existentes pueden ser apropiados para las aplicaciones en desarrollo actualmente. Implementar el paquete Python para la reducción de dimensionalidad en imágenes a color. Realizar un manual de usuario para el uso del paquete elaborado. Tareas de investigación:. 1.. Descripción de los principales métodos para la reducción de dimensionalidad en imágenes a color.. 2.. Implementación del paquete Python para la reducción de dimensionalidad en imágenes a color.. 3.. Realización de pruebas de funcionamiento a la solución planteada.. 4.. Realización del manual de usuario. Justificación de la Investigación:. Python es un lenguaje de programación interpretado cuya filosofía hace hincapié en una sintaxis que favorezca un código legible. Se trata de un lenguaje de programación multiparadigma, ya que soporta orientación a objetos, programación imperativa y, en menor medida, programación funcional. Es un lenguaje interpretado, usa tipado dinámico y es multiplataforma, cualidades que lo han convertido en uno de los principales lenguajes usados actualmente. Por estas razones existe la necesidad de un paquete en este lenguaje para el trabajo con imágenes y su transformación C2G.. 2.

(13) Hipótesis de Investigación: 1. La programación en un lenguaje amigable permitirá a especialistas de computación su uso eficiente, además de posibles extensiones consecuentes. 2. Las nuevas implementaciones de los métodos de conversión de imágenes de color a escala de grises permitirán mayor claridad y facilidades de interpretación a especialistas que no son del área de computación, en particular, fotógrafos, médicos, etc.. Estructura de la Tesis: A continuación, el desarrollo de la tesis se estructura de la siguiente forma. En el Capítulo 1 se desarrolla el marco teórico de forma que este permita un conocimiento general del tema abordado y la comprensión adecuada de los capítulos siguientes por parte de personal no especialista en temas de Ciencias de la Computación. También se muestran los antecedentes investigativos de las diversas técnicas de reducción de los espacios de color que permiten llevar imágenes a escala de grises. En el Capítulo 2 se exponen los resultados de la presente investigación, así como lo referente a los métodos implementados. En este capítulo, se demuestran las ventajas de usar el lenguaje de programación Python y su impacto final en la implementación de los métodos. Además, son señalados los diagramas de flujo diseñados de los métodos implementados, así como las medidas de evaluación utilizadas para medir sus desempeños. En el Capítulo final se muestran los resultados obtenidos en la implementación de las medidas de evaluación, así como la aplicación creada para el uso del paquete. Se desarrolla el Manual de Usuario, que expondrá de forma detallada, las utilidades del Software desarrollado, así como todas las ventajas de su uso por personal con tareas de corte investigativo computacional. Finalmente aparecen las conclusiones de la presente Tesis de Grado y el listado de imágenes y tablas utilizadas.. 3.

(14) CAPÍTULO 1. GENERALIDADES En este capítulo se reseñan las nociones básicas, en aspectos teóricos y matemáticos del planteamiento del problema. Se definen los conceptos de imagen digital, así como el sistema de representación matemática de la misma, los espacios de color como forma de organización específica de los colores en la imagen digital. También se realiza un estudio de las diferentes técnicas de reducción de los espacios de color, así como su aplicación. Estos antecedentes dieron paso a este trabajo. De esta manera está constituido el marco teórico para el desarrollo del mismo. 1.1 La Imagen Digital a Color Las imágenes digitales a color están hechas de píxeles, y los píxeles están formados por combinaciones de colores primarios. Un canal en este contexto es la imagen en escala de grises del mismo tamaño que la imagen a color, hecha de uno de estos colores primarios. Por ejemplo, una imagen de una cámara digital estándar tendrá los canales rojo, verde y azul. Una imagen en escala de grises tendrá sólo un canal. En el dominio digital, puede haber cualquier número de colores primarios convencionales para formar una imagen; un canal en este caso es similar a una imagen en escala de grises sobre cualquier color primario convencional. Por extensión, un canal es cualquier imagen en escala de grises del mismo tamaño que la "propia" imagen, y asociado con ella. Una imagen RGB tiene tres canales: rojo, verde y azul. Los canales RGB derivan u obedecen a los receptores de color del ojo humano, y se usan en monitores de ordenador y escáneres de imagen. Si la imagen RGB es de 24 bits (estándar desde 2005), cada canal tiene 8 bits, para el rojo, verde y azul, o sea, la imagen está compuesta de tres imágenes (una por cada canal, Figura 1), donde cada imagen puede almacenar píxeles con intensidades de brillo convencional entre 0 y 255. Si la imagen RGB es de 48 bits (alta resolución), cada canal está hecho de imágenes de 16 bits.. Figura 1 Ejemplo de separación de canales RGB.. Una imagen CMYK tiene cuatro canales: cian, magenta, amarillo y negro. CMYK es el estándar para imprimir. Una imagen CMYK de 32 bits (estándar también desde 2005) está hecha de 4.

(15) cuatro canales de 8 bits, uno para el cian, uno para el magenta, uno para el amarillo y uno para el negro. No es común almacenar imágenes CMYK de 64 bits (16 bits por canal), debido al hecho de que CMYK es dependiente de dispositivo, mientras que RGB es el estándar genérico para almacenamiento independiente de dispositivo. En digitalización de imágenes, los canales de color se convierten a números. Como las imágenes contienen miles de píxeles, cada uno con múltiples canales, los canales se codifican normalmente con el menor número de bits posible. Los valores típicos son 8 bits por canal o 16 bits por canal. Como el cerebro no percibe necesariamente diferencias en cada canal para el mismo grado que en otros canales, es posible que cambiar el número de bits para cada canal resulte en un almacenamiento más óptimo; en particular, para imágenes RGB, comprimir más el canal azul y después el rojo puede ser mejor que dar el mismo espacio a cada canal. Este tipo de compresión "preferencial" es el resultado de estudios que muestran que la retina humana en realidad utiliza el canal rojo para distinguir el detalle, junto con el verde en menor medida, y usa el canal azul como información ambiental o para el fondo. (Ortod, 2005) 1.1.1 Imagen Digital Una imagen digital o gráfico digital es una representación bidimensional de una imagen a partir de una matriz numérica, frecuentemente en binario (unos y ceros). Dependiendo de si la resolución de la imagen es estática o dinámica, puede tratarse de una imagen matricial (o mapa de bits) o de un gráfico vectorial. Las imágenes digitales se pueden obtener de varias formas:  . Por medio de dispositivos de entrada de conversión analógica-digital como los escáneres y las cámaras digitales. Directamente mediante programas informáticos editores de mapas de bits y dibujo vectorial, como por ejemplo realizando dibujos con el ratón o tableta digitalizadora gráfica incluyendo el lápiz óptico, por otro lado, mediante un programa de renderización 3D a mapa de bits.. Las imágenes digitales se pueden modificar mediante filtros, añadir o suprimir elementos, modificar su tamaño, etc. y almacenarse en un dispositivo de grabación de datos como por ejemplo un disco duro. La mayoría de formatos de imágenes digitales están compuestos por una cabecera que contiene atributos (dimensiones de la imagen, tipo de codificación, etc.), seguida de los datos de la imagen en sí misma. La estructura de los atributos y de los datos de la imagen es distinto en cada formato. Además, los formatos actuales añaden a menudo una zona de metadatos ("metadata" en fotografía (Escala de sensibilidad, flash, etc.) Estos metadatos se utilizan muy a menudo en el formato extensión de cámaras digitales y videocámaras. (Ortod, 2005) 5.

(16) 1.1.2 Imagen a Color. Espacio de Color Un espacio de color es un sistema de interpretación del color, es decir, una organización específica de los colores en una imagen o video. Depende del modelo de color en combinación con los dispositivos físicos que permiten las representaciones reproducibles de color, por ejemplo, las que se aplican en señales analógicas (televisión a color) o representaciones digitales. Un espacio de color puede ser arbitrario, con colores particulares asignados según el sistema y estructurados matemáticamente. Un modelo de color es un modelo matemático abstracto que describe la forma en la que los colores pueden representarse como tuplas de números, normalmente como tres o cuatro valores o componentes de color (RGB y CMYK son modelos de color). Sin embargo, un modelo de color que no tiene asociada una función de mapeo a un espacio de color absoluto es más o menos un sistema de color arbitrario sin conexión a un sistema de interpretación de color. Añadiendo cierta función de mapeo entre el modelo de color y un espacio de color de referencia se obtiene una "huella" en el espacio de color de referencia. A esta "huella" se la conoce como gama de color y, en combinación con el modelo de color, define un nuevo espacio de color. Por ejemplo, Adobe RGB y sRGB son dos espacios de color absolutos diferentes basados en el modelo RGB. (Figura 2). Figura 2 Comparación de cromaticidades encerradas en un espacio de color.. En el sentido más genérico de la definición dada, los espacios de color se pueden definir sin el uso de un modelo de color. Estos espacios son un conjunto de nombres o números definidos por la existencia de un conjunto correspondiente de muestras de color físico. Se puede crear un amplio rango de colores mediante pigmentos de colores primarios (cian (C), magenta (M), amarillo (Y), y negro (K)). Esos colores definen un espacio de color específico. Para crear una representación tridimensional de un espacio de color, se puede asignar la cantidad de magenta al eje X de la representación, la cantidad de cian a su eje Y, y la cantidad de amarillo a su eje Z. 6.

(17) El espacio 3D resultante proporciona una única posición por cada color posible que puede ser creado combinando estos tres pigmentos. Sin embargo, este no es el único espacio de color posible. Por ejemplo, cuando se muestran los colores en un monitor de ordenador, normalmente se definen en el espacio de color RGB (rojo, verde y azul, Figura 1.3). Esta es otra forma de crear básicamente los mismos colores (limitado por el medio de reproducción, como el fósforo (CRT) o filtros y luz de fondo (LCD)), y el rojo, el verde y el azul pueden considerarse como los ejes X, Y y Z. Otra manera de crear los mismos colores es usando su matiz (eje X), su saturación (eje Y), y su brillo (eje Z). A esto se le llama modelo de color HSV.. Figura 3 Comparación entre los modelos de color RGB y CMYK. Esta imagen demuestra la diferencia de aspecto de los colores en un monitor de ordenador (RGB) en comparación con su reproducción en CMYK en el proceso de impresión.. Para definir un espacio de color, la referencia estándar habitual es el espacio de color CIELAB o CIEXYZ, los cuales están diseñados específicamente para abarcar todos los colores que el ser humano puede ver. Dado que "espacio de color" es un término más específico para ciertas combinaciones de un modelo de color más una función de mapeo, el término "espacio de color" tiende a usarse también para identificar modelos de color. Al identificar un espacio de color, automáticamente se identifica el modelo de color asociado. Informalmente, los dos términos se suelen intercambiar con frecuencia, aunque esto es estrictamente incorrecto. Por ejemplo, aunque varios espacios de color específicos se basan en el modelo RGB, no existe tal cosa como: el espacio de color RGB. La conversión del espacio de color es la traducción de la representación de un color de una base a otra. Esto ocurre normalmente en el contexto de convertir una imagen representada en un espacio de color a otro espacio de color, teniendo como objetivo que la imagen convertida se parezca lo más posible a la original. El modelo de color RGB está implementado de formas diferentes, dependiendo de las capacidades del sistema utilizado. De lejos, la implementación general más utilizada es la de 24 bits, con 8 bits, o 256 niveles de color discretos por canal. Cualquier espacio de color basado en 7.

(18) ese modelo RGB de 24 bits está limitado a un rango de 256×256×256 ≈ 16,7 millones de colores. Algunas implementaciones usan 16 bits por componente para un total de 48 bits, resultando en la misma gama con mayor número de colores. Esto es importante cuando se trabaja con espacios de color de gama amplia (donde la mayoría de los colores se localizan relativamente juntos), o cuando se usan consecutivamente un amplio número de algoritmos de filtrado digital. El mismo principio se aplica en cualquier espacio de color basado en el mismo modelo de color, pero implementado en diferentes profundidades de color. El espacio de color CIE 1931 XYZ fue uno de los primeros intentos de producir un espacio de color basado en medidas de percepción de color y es la base de casi todos los demás espacios de color. Entre los derivados de CIE XYZ se encuentran CIELUV, CIEUVW, y CIELAB. El espacio de color RGB utiliza una mezcla de colores aditivos, porque describe qué tipo de luz necesita ser emitida para producir un color dado. RGB almacena valores individuales para el rojo, el verde y el azul. El espacio de color RGBA es RGB con un canal adicional alfa para indicar transparencia. Entre los espacios de color basados en RGB se incluye sRGB, Adobe RGB y ProPhoto RGB. CMYK utiliza síntesis sustractiva de color utilizada en el proceso de impresión, porque describe qué clase de tinta necesita aplicarse para que la luz reflejada desde el sustrato y a través de la tinta produzca un color dado. Se empieza con un sustrato blanco (lienzo o página), y se utiliza la tinta para sustraer el color del blanco para crear una imagen (Figura 1.4). CMYK almacena valores de tinta para cian, magenta, amarillo y negro. Hay muchos espacios de color CMYK para diferentes conjuntos de tintas.. Figura 4 Izquierda: Mezcla de colores aditivos (Tres colores superpuestos en un vacío se suman para crear el blanco) Derecha: Mezcla de colores sustractivos (Tres colores en un papel blanco, se restan para volver el papel negro).. YIQ se utilizaba en las emisiones de televisión en formato NTSC (Norte América, Japón) por razones históricas. Este sistema almacena un valor de luminancia con dos valores de cromancia, correspondientes a las cantidades de azul y rojo. Es similar al esquema YUV utilizado en la mayoría de sistemas de captura de vídeo y en el sistema PAL (Australia, Europa, excepto Francia, que usa SECAM), excepto que el espacio de color YIQ se rota 33° con respecto al espacio de color YUV. El esquema YDbDr usado por SECAM se rota de otra forma. 8.

(19) YPbPr es una versión escalada de YUV. Es bastante común en su forma digital, YCbCr, usado ampliamente en compresión de vídeo y esquemas de compresión de imagen como MPEG y JPEG. xvColor es un nuevo espacio de color de vídeo digital internacional estándar publicado por la Comisión Electrotécnica Internacional (IEC 61966-2-4). Se basa en los estándares ITU BT.601 y BT.709 pero extiende la gama más allá de los R/G/B primarios especificados en esos estándares. (Wright, 1981) 1.1.3 Estándares de Colores Un estándar o modelo de colores es un modelo matemático abstracto que permite representar los colores en forma numérica, utilizando típicamente tres o cuatro valores o componentes cromáticos. Es decir, un modelo de colores sirve en una aplicación que asocia a un vector numérico un elemento en un espacio de color.. Figura 5 Modelo de color RGB.. Se sabe que se puede generar una vasta gama de colores por mezcla aditiva de los colores primarios rojo, azul y verde. Estos colores juntos determinan un espacio de colores. Se puede imaginar este espacio como un cubo alineado al sistema de coordenadas de un espacio tridimensional, en el cual la cantidad de color rojo se representa a lo largo del eje X y la cantidad de amarillo a lo largo del eje Z. (figura 1.5) En esta representación, cada color tiene una posición única. HSV (hue, saturation, value), también conocido como HSB (hue, saturation, brightness) es usado a menudo por artistas porque es más natural pensar sobre un color en términos de matiz y saturación que en términos de componentes de color aditivos o sustractivos. HSV es una transformación de un espacio de color RGB, y sus componentes y colorimetría son relativos al espacio de color RGB del que deriva. HSL (hue, saturation, lightness/luminance), también conocido como HLS o HSI (hue, saturation, intensity) es bastante similar a HSV, con la "claridad" reemplazando el "brillo". La diferencia es que el "brillo" de un color puro es igual al brillo del blanco, mientras que la claridad de un color puro es igual a la claridad de un gris medio. 9.

(20) Los modelos de colores más usados son RGB, CMYK, HSL, HSV y el modelo tradicional de coloración. (Anderson, no date) 1.2 Técnicas de Reducción de los Espacios de Color Acorde con la CIE (Commission Internationale de l’Eclairage), si el color es percibido como la propiedad de una fuente de luz es llamado una apertura o color auto luminoso, o si es la propiedad de una superficie, es llamado un color objeto. Para colores apertura, las dimensiones son:   . Tonalidad (T): La sensación según la cual un área parece ser similar a uno de estos colores percibidos, correspondiente a los colores primarios rojo, amarillo, verde, azul y magenta (tonos primarios). Saturación (S): La sensación según la cual el color percibido de un área aparenta ser más o menos cromático, juzgado en proporción a su brillantez. Representa la pureza del color percibido como brillante o pálido. Brillantez (B): La sensación a través de la cual un área parece emitir más o menos luz. Corresponde a un sentimiento en términos de luz, como oscuro o luminoso, y caracteriza el nivel luminoso del estímulo del color.. Para colores objeto las mismas definiciones de tonalidad y saturación son utilizadas, pero la intensidad depende de la luz incidente y la reflectabilidad de la superficie, ambas definen el termino de luminosidad (L). La luminosidad L (x, y), reflectabilidad R (x, y) e iluminación IL (x, y) son asociadas por, L (x, y) = IL (x, y) R (x, y). La luminosidad es el atributo mediante el cual el objeto parece reflejar o transmitir más o menos la luz incidente, aunque la brillantez es el atributo de fuente de luz mediante el cual la luz emitida es ordenada de brillante a oscura, siendo un valor fotométrico (con unidades cm/m²). El término luminancia (Ʌ) es empleado en la literatura para indicar el concepto de luminosidad y brillantez juntos. Tonalidad y saturación tratados juntos se denominan cromacidad, entonces un color puede ser caracterizado por su luminancia y cromacidad. La apariencia visual de una imagen a color puede ser reproducida fielmente a una imagen a escala de grises. La conversión puede preservar los rasgos distintivos y un orden razonable del color, mientras respeta la luminancia original de los colores. La usual elección de luminancia como la cantidad para los valores grises es porque esta es la respuesta acromática al estímulo de un color, midiendo cuanta luz parece tener un color comparado con una luz blanca equivalente. La visión humana en si misma depende de la luminancia más que de cualquier otra cosa. (L.~Busin, N.~Vandenbroucke and L.~Macaire, 2008) 10.

(21) Figura 6 Imagen del Monet, de Claude Oscar (Francia, 1840-1926) obra maestra “Impresión del Amanecer” convertida a escala de grises por cinco métodos diferentes: b) la función rgb2gray de Matlab, c) L* del CIEL*a*b*, d) RTCP, e) ApparentGreyscale, f) Kim09.. Mapear la información de una imagen a color en 3D hacia una imagen de 1D en escala de grises preservando la apariencia original, el contraste y los mejores detalles no es una tarea trivial. No hay una solución general para este problema, debido al hecho de que la mayoría de los algoritmos existentes no pueden ejecutar bien en ciertas circunstancias y las imágenes resultantes en escala de grises tienen bajo contraste y baja interpretabilidad. (Kingdom, 2011) Para el procesamiento de intensidad de imágenes, las características importantes de la conversión de C2G son:   . La necesidad de que cuando dos pixeles tienen el mismo color, estos tengan el mismo nivel de gris en la imagen en escala de grises. La necesidad de un mapeo continuo reduciendo los datos artificiales de la imagen, tales como los contornos falsos en regiones de color homogéneo. Esas restricciones no son conocidas para todos los métodos de conversión de C2G, principalmente son términos de mapeo local.. 1.2.1 Métodos clásicos de conversión de color a escala de grises. La noción de “clásicos” está relacionada con los métodos para la conversión de C2G desarrollados durante el siglo XX que todavía están en uso en algunos softwares o aplicaciones. 1. Los métodos de suma pesada. También llamados métodos directos, en cuyos: Gray = aR + bG + cB. Alternativas:  La recomendación CIE BT.601, con ajuste a = 0.298936021, b = 0.587043074, y c = 0.114020904; como en los formatos de televisión monocromática NTSC, 11.

(22)     . PAL, y SECAM. También usada por la función rgb2gray de Matlab, la estándar posdata, y el espacio de color YUV. La recomendación CIE BT.709usada en la televisión de alta definición (HDT) donde a = 0.2126, b = 0.7152, y c = 0.0722. La “conversión promedia”, en la cual a = b = c = 1/3. Para propósitos de detección de rostro, a = 0.85, b = 0.10, y c = 0.05. Para la segmentación de células en imágenes de tumores, a = 0.219, b = 0.581, y c = 0.200. El modo no lineal (corrección-gamma), donde Gray = a RR + b GG + c BB.. Se nota que en todas las alternativas a  0, b  0, c  0 y a + b + c = 1. En la suma pesada persiste el problema de los colores con una pequeña diferencia de luminosidad, pero gran diferencia en cromacidad (tonalidad y saturación), ya que no se distinguirán en la imagen en escala de grises. Será lo mismo para imágenes con un único color dominante o con baja iluminación de color. (Bala and Braun, 2003). Figura 7 Conversión de RGB a escala de grises usando el método de suma pesada con los pesos NTSC. De arriba hacia abajo: coordenadas en los cubos RGB en 3D, imágenes RGB originales, imágenes en escala de grises, y sus histogramas.. 2. Los espacios de color luminancia-cromancia. Así como un color puede ser expresado por su luminosidad (imagen en escala de grises) y cromacidad (tonalidad y saturación), en la literatura de la ciencia del color hay varios espacios de colores estándares que sirven para separarlos. Categorizados en la familia de los espacios luminancia-cromancia están: 12.

(23)      . YUV, CIEL*a*b*, HSV, HSL, YIQ, YCbCr, etc.. La luminancia obtenida de cada uno de esos espacios de color es diferente, entonces la transformación de RGB a escala de grises puede ser cumplida a través de ellos con resultados diferentes.. Figura 8 Conversión de RGB a escala de grises de las mismas tres imágenes de colores usando la capa L* del espacio de color CIEL*a*b*.. 13.

(24) Figura 9 Conversión de RGB a escala de grises de las mismas tres imágenes de colores usando la componente L del espacio de color HSL.. El espacio de color HSL debe sus capacidades a dos hechos: 1) La luminancia (L) es desemparejada de la cromancia, y 2) La tonalidad (T) y saturación (S) están íntimamente relacionas a la manera en que los humanos perciben la cromancia. Ideal para aplicaciones de procesamiento de imágenes donde la cromancia es de importancia más que la percepción del color en su totalidad. (Bala, Eschbach and York, 2004) 1.2.2 El Problema de la conversión de color a escala de grises. El propósito general de esta tarea de reducción de dimensión es como utilizar el rango limitado en la escala de grises para preservar tanto como sea posible las características originales, las estructuras salientes, el contraste de color, y otras importantes metas visuales y restricciones lógicas. (Hassen, Wang and Salama, 2015) A pesar de la gran proliferación de los métodos de conversión C2G, no todos estos algoritmos están listos para la gran variedad de aplicaciones prácticas, por los siguientes problemas (Song et al., 2010): 1. Las vistas visuales no están bien definidas, por lo que no es claro como preservar vistas importantes en las imágenes en escala de grises transformadas. 2. Algunos algoritmos tienen un tiempo de costo extremadamente alto para computarlos; y 14.

(25) 3. Otros requieren interacciones humano-computadora para tener una transformación razonable. Los propósitos visuales para la conversión de C2G son los siguientes cinco: 1. Preservación de característica. Las características de la imagen a color deben permanecer definidas en la imagen en escala de grises. 2. Magnitud de contraste. La magnitud de los contrastes de la escala de grises debe reflejar la magnitud de los contrastes de los colores (Wu and Toet, 2014). El contraste de color entre dos pixeles p y q, en el espacio de color CIEL*a*b* es, 2. 2. Cp, q = √(𝐿∗𝑝 − 𝐿∗𝑞 ) + (𝑎𝑝∗ − 𝑎𝑞∗ ) + (𝑏𝑝∗ − 𝑏𝑞∗ ). 2. 3. Polaridad de contraste. La polaridad positiva o negativa del cambio de nivel de gris en los contrastes de la escala de grises debe corresponder visualmente al cambio de polaridad de la luminancia en los contrastes de color. 4. Fidelidad de Luminosidad. Las imágenes a color y escala de grises deben tener un estímulo similar de luminosidad. 5. Rango dinámico. El rango dinámico de los niveles de gris en la imagen en escala de grises debe concordar visiblemente con el rango dinámico de los valores de luminancia en la imagen a color. Las restricciones lógicas para la conversión C2G son las cuatro siguientes: 1. Mapeo continuo. La trasformación debe ser una función continua, reduciendo datos artificiales, tales como un contorno falso en regiones homogéneas de la imagen. 2. Consistencia global. Cuando dos pixeles tienen el mismo color en la imagen a color, tendrán el mismo nivel de gris en la imagen a escala de grises. También llamado consistencia del mapeo. (Haritha and Reddy, 2013) 3. Preservación de la escala de grises. Cuando un pixel en la imagen a color es gris, este tendrá el mismo nivel de gris en la imagen a escala de grises. 4. Disposición de la luminancia. Cuando una secuencia de píxeles de luminancia creciente en la imagen a color comparte la misma tonalidad y saturación, tendrá crecientes niveles de gris en la imagen a escala de grises. También llamado consistencia local de la luminancia cuando está relacionada con gradientes de luminancia. (Wu and Toet, 2014) Dos criterios prácticos pueden ser considerados (Benedetti et al., 2010): 1. Alta eficiencia. La transformación de C2G es asociado a aplicaciones. Para modificar interactivamente los resultados de conversión, el algoritmo debe ser lo suficiente rápido para una interacción preferida a tiempo real. 2. Aprendizaje no supervisado. El algoritmo no necesita intervención del usuario para evadir la variabilidad de la escala de grises final causada por criterios subjetivos. El aprendizaje no supervisado es particularmente importante cuando el algoritmo de conversión de C2G es una etapa pre-procesamiento de un sistema de procesamiento de imágenes digitales o un esquema de análisis de imágenes.. 15.

(26) 1.2.3 Categorías de los métodos en estado-del-arte de C2G. Los métodos en estado-del-arte tratan de satisfacer algunos objetivos y restricciones citados adoptados de las estrategias de mapeo global, local, o híbrido. (Kim et al., 2009) . Mapeo Global de C2G. El mismo mapeo de C2G es usado para todos los píxeles en la información. Mapea consistentemente los mismos colores a los mismos valores en la escala de grises sobre una imagen, garantizando una conversión homogénea de las regiones de color constante. Sería más desafiante determinar un mapeo global que preserve características locales en posiciones diferentes al mismo tiempo. Los métodos de mapeo global pueden más específicamente dividirse en:  . Algoritmos de imágenes independientes, tales como el cálculo de la luminancia, y Algoritmos de imágenes dependientes incorporando información estadística sobre el color de la imagen, o información multi-espectral.. El más popular de los algoritmos de mapeo global de imágenes dependientes es Decolorize (Grundland and Dodgson, 2007).. Figura 10 Tres parámetros independientes de control son usados: realce de control , selección de escala de sonido . Ejemplo usando = 0.3, = 25, y = 0.001.. , supresión. 16.

(27) . Mapeo Local de C2G. También llamado métodos espaciales, se basan en la suposición de que la transformación de C2G necesita ser definida tal que píxeles diferentes entre sí sean preservados. El mapeo de valores de píxeles es espacialmente variado, dependiendo de las distribuciones locales de los colores. El paso de avance hacia los algoritmos espaciales es motivado porque para ciertas aplicaciones, preservar la información de la luminancia por si misma puede no resultar en la salida deseada. Aunque el mapeo local ha ayudado a la hora de preservar las características locales, regiones de colores constantes pueden ser convertidos no homogéneamente si el mapeo cambia en las regiones.. . Mapeo Híbrido de C2G. Algunos métodos de conversión de C2G globales tienen en cuenta aspectos locales, mientras que algunos métodos de conversión de C2G locales consideran coherencias globales. Estos métodos realizan la tentativa de preservar las características tanto locales como globales simultáneamente, y su meta es aumentar la exactitud perceptual más que exagerar el discernimiento. Como ejemplo, el método ApparentGrayscale (Smith, 2008), el cual usa un enfoque de dos pasos, el primero, asigna globalmente valores de gris y determina el orden de color, y el segundo, localmente realza la escala de grises para reproducir el contraste original. Tabla 1 Los métodos en estado-del-arte para la conversión de C2G con mapeo global.. No. 1. Autores Bala and Braum. Año. Método. Descripción. Dificultades. 2004. BalaB04. Se proponen dos alternativas: espaciado por igual en gris y espaciado de acuerdo a su diferencia de color en 3D a partir de colores adyacentes a aquellos a lo largo de la dimensión de luminosidad. Únicamente para gráficos por encima de 10 colores y no es aplicable a imágenes complejas (Smith, 2008) (Song et al., 2013). Impone el contraste de color entre los píxeles considerando variaciones de brillo de acuerdo a. Significantes contrastes de color no pueden ser bien representados en la imagen en escala de grises, el orden de. (Bala and Braun, 2003). 2. Gooch, Olsen, Tumblin, And Gooch. 2005. Color2Gray (Gooch et al., 2002). 17.

(28) 3. 4. 5. Rasche, Geist, and Westall. Grunland And Dogson. Kim, Jang, Demouth,. 2005 (a,b). Rasche05. 2007. Decolorize (Grundland and Dodgson, 2007). 2009. Cui, Hu, Razdan, and. Kim09 (Kim et al., 2009). and Lee. 6. (Rasche, Geist and Westall, 2005). 2009. Cui09. tonalidades en el espacio de color CIEL*a*b*. grises contradice el orden de la luminancia de colores. Enfocado en la reducción de dimensión de color para observadores con deficiencia de color. Define restricciones directamente en diferente pares de colores obteniendo un mapeo lineal global continuo para asignar colores similares a valores similares de la escala de grises usando una comparación prudente de pares entre colores muestreados. El orden de la escala de grises contradice el orden de luminancia de los colores, además es requerida una cuantificación del color para reducir el extremo costo computacional del procedimiento de optimización, lo que resulta en datos artificiales en imágenes naturales con tonos continuos. Similar al Rasche05, pero mejorando la eficiencia computacional al usar el análisis de componente predominante (PdCA) para encontrar el componente en 1D que maximiza el contraste. No toma en consideración diferencias cromáticas que son espacialmente distantes, mapeando en algunos casos colores diferentes hacia niveles de gris bastante similares. Es necesaria la intervención del usuario. Optimiza el Color2Gray usando un rápido modelo paramétrico no lineal. El mapeo global es una función no lineal de la luminosidad, cromancia y tonalidad de colores. El contraste significante de los colores no puede ser bien representado en la imagen en escala de grises, enturbiando los detalles finos. La influencia de contraste cromático en aspectos discriminantes requiere de intervención por parte del usuario. Introduce el ISOMAP La imagen en escala de grises para formar un método no puede presentar datos lineal de reducción de artificiales tales como ruido de 18.

(29) Wonka. 7. Lu, Xu,. (Cui et al., 2010). 2012. and Jia. 8. 9. Song, Tao, Chan, Bu, and Yang. Zhu, Hu, and Liu. RTCP (Lu, Xu and Jia, 2012). 2013. Song13 (Song et al., 2013). 2013. Zhu13 (Zhu, Hu and Liu, 2014). 10. Jin and Ng. 2015. Jin15. dimensión para mapear vectores con alta dimensionalidad de color a los de baja dimensionalidad. sal y pimienta, en dependencia del parámetro k en los vecinos-cercanos-k (KNN) busca cuando no es lo suficientemente grande. Al incrementar k incrementa significativamente el tiempo computacional. Adopta contexto espacial en consideración del método global, propone una función bimodal de energía de preservación de contraste, junto con restricciones locales y no locales Primero define la Oportunidad de Ocurrencia (CoH) de acuerdo al principio Helmholtz-Kohlrausch, para medir el nivel de atención de cada pixel en la imagen a color. Después introduce estadísticas de la imagen natural para estimar el CoH de cada pixel. La técnica de optimización para resolver el modelo es iterativa, necesitando un alto tiempo de ejecución. Puede no ser capaz de capturar todos los detalles de la imagen y tiende a producir datos falsos en la escala de grises. Reproduce la apariencia percibida de una imagen a color en su versión en escala de grises. Basado en la Teoría de Filtro, introduce el concepto de Canal Saliente para medir el nivel de contraste de diferentes canales. El cálculo del saliente puede no converger, por lo que establece el canal saliente a 0. La optimización de la función de energía será vulnerable a gran ruido. El ajuste en el mapa de contraste puede causar datos artificiales. Basado en la combinación de valores de píxeles en los canales R,G y B. EL problema de. Los parámetros 𝜏 y 𝜇 se pueden seleccionar de acuerdo a reglas sin su cálculo óptimo. El tamaño de la ventana de muestra debe ser seleccionado manualmente, si es muy pequeño la imagen computada en escala de grises no podrá preservar bien el CoH, convergentemente si la ventana de prueba se vuelve mayor el CoH puede preservarse mejor, pero el ruido es incluido al mismo tiempo. 19.

(30) (Jin, Li and Ng, 2014). 11. 12. 13. Liu, Liu, Xie, Wang, and Liang. Yoo, Lee, and Lee. Liu, Liu, Wang, And Leung. 2015. GcsDecolor 1 (Liu et al., 2015). 2015. Yoo15. 2016. SPDecolor (Liu et al., 2017). optimización trae consigo la maximización de la varianza de la imagen saliente en escala de grises Propone un modelo no Contiene un parámetro 𝜀1 para lineal de mapeo global de evadir la inestabilidad similaridad de gradiente numérica con valores típicos de correlación (Gcs) entre 1.3 y 1.5, pero es trabajando en el espacio de color RGB dependiente de la imagen directamente y determina la solución con el máximo valor Gcs a partir del modelo paramétrico lineal inducido candidatos discretizados de imágenes Preserva la significancia Desde que ignora los valores de una secuencia de color durante la decoloración a de saturación y luminosidad de tonalidades similares y así través del mapeo de colores de tonalidad similar, colores a una parrilla en el espacio de color los cuales solo forman una CIELAB secuencia por mérito de diferida saturación o luminosidad, no será detectado como una secuencia de color. Como varios parámetros para ser ajustados por el usuario Un modelo polinomial En la actualidad hace uso de la multivarianza de orden función rgb2gray de Matlab dos el cual optimiza solo como inicialización, pero parámetros de peso futuras versiones considerarán parcial. El propósito de esta decoloración como inicialización la imagen semiparamétrica es obtenida por otros enfoques mitigar el modelaje y las más avanzados deficiencias numéricas de la penalización del gradiente de error (GE) bajo la formulación polimonial multivarianza de orden dos. 20.

(31) 14. Sowmya, Govind, And Somar. 2016 C2Gcodesvd. La imagen de entrada en RGB es convertida al espacio CIEL*a*b* para procesar los componentes de luminancia y cromancia independientemente. La información de cromancia de la imagen de entrada a color es entonces analizada usando SVD. La ejecución es estadísticamente menos significante que el CPDecolor. Sin embargo, tiene baja complejidad computacional. Tabla 2 Los métodos en estado-del-arte para la conversión de C2G con mapeo local.. No. 1. Autores Bala and. Año. Método. Descripción. Dificultades. 2004. BalaE04. Aplica un filtro de alto pase para cada canal cromático del espacio de color de CIEL*a*b para forzar el contraste local, pesa la salida con un término dependiente de la luminancia y agrega la cromaticidad filtrada al canal de luminosidad. Susceptible a problemas en la cromancia o luminosidad, y puede convertir no homogéneamente regiones constantes de color. Tiene el peor desempeño en la evaluación de Cadik. Propone un método local basado en el gradiente de color para obtener la mejor imagen perceptual en escala de grises medido en su espacio de color Coloroid, así como en el espacio de color CIEL*a*b*. Los detalles de la imagen y aspectos salientes pueden perderse por comportamiento impredecible en regiones inconsistentes del campo gradiente y puede convertir no homogéneamente la apariencia de regiones constantes de color. Utiliza un enfoque de dos escalas. La imagen es descompuesta como segmentos perceptuales. El tono gris global de la resultante imagen en. Necesita intervención del usuario. Eschbach. 2. Neumann, Cadík, and. (Bala, Eschbach and York, 2004). 2007. (Neumann, Cadik and Nemcsics, 2007). Nemcsics. 3. Wu, Shen, and Liu. Neuman07. 2012. Wu12 (Wu, Shen and Liu, 2012). 21.

(32) escala de grises es determinado por el color promediado de cada grupo circundante 4. Zhou, Sheng,. 2014. CPDM. and Ma. 5. 6. 7. Liu, Liu, Xie, Wang, and Liang. Günes, Kalkan, And Durmus. Nguyen And Havlicek. 2015. GcsDecolor 2 (Liu et al., 2015). 2015. Gunes15 (Güneş, Kalkan and Durmuş, 2016). 2015. Constrained Optimization Grayscaler (COG) (Havlicek, no date). Usa saliente de color e información de posición para mantener el contraste original. Aunque es garantizada una mejor ejecución para la mayoría de las imágenes, hay algunos casos en los cuales la detección del saliente falla para destacar el objeto saliente. Similar al GcsDecolor 1 pero con un solucionador no iterativo utilizando una estrategia de búsqueda discreta. En comparación con el GcsDecolor 1 tiene ventaja en términos de simplicidad. Tiene el parámetro 𝜀2 para prevenir la inestabilidad numérica. A pesar de ser muy robusto, cuando 𝜀2 tiende a 0 descalifica el modelo ingenuo. Con propósitos de Dificultad para determinar clasificación los cuáles y cuantos aspectos son coeficientes adaptativos de los mejores para suficiente conversión C2G son información discriminante optimizados para generar imágenes en escala de grises más discriminantes para reducir el error en la clasificación de imagen basado en algoritmos genéticos (GA) La imagen en escala de grises es modelada como una combinación lineal de los canales de color L*a*b* donde los coeficientes mezclados son computados por un esquema programado de restricciones cuadráticas. No reportados. 22.

(33) usando aspectos de dominio de la modulación de la imagen a color de entrada 8. You, 2016 Barnes, And Walker. You16 (You, Barnes and Walker, 2016). Mide dos propiedades: brillantez y contraste de color. Un gráfico basado en un cuandro de optimización balancea las mediciones de la brillantez y el contraste. Para resolver la optimización, un método basado en la norma 𝐿1 convierte las discontinuidades de color a discontinuidades de brillantez. No reportados. Tabla 3 Los métodos en estado-del-arte para la conversión de C2G con mapeo híbrido.. No. 1. 2. Autores. Año. Smith, 2008 Landes, Thollot y Myszkowski. Kuk, Ahn y Cho. 2011. Método. Descripción. Dificultades. ApparentGrayscale. Usan un acercamiento en dos pasos para asignar globalmente valores grises y determinar el ordenado del color y además para mejorar localmente la escala de grises reproduce el contraste original aumentando el brillo localmente para mejorar los filos cromáticos.. Un contraste de color significativo no puede ser bien representado en una imagen de escala de grises, puede produces hechos falsos locales ya que la mejora del detalle puede conducir a pixelar la imagen. No se puede restaurar el contraste cromático entre regiones no adyacentes.. Adopta un contexto espacial en consideración de un método global para. Se necesita interacción humana, además dificultando encontrar parámetros óptimos. (Smith, 2008). Kuk11. 23.

(34) (Kuk, Ahn and Cho, 2011). buscar colores punteros usando k-means. Se consideran simultáneamente los contrastes locales y globales y se codifican usando una función energética.. 3. 4. Ancuti, Ancuti y Bekaert. Lu, Xu y Jia. 2011. Ancuti11 (Ancuti, Ancuti and Bekaert, 2011). 2014 CPDecolor (Lu, Xu and Jia, 2012). 5. Wu y Toet. 2014. Wu14 (Wu and Toet, 2014). Se mezcla la información cromática y la luminancia para conservar la disparidad inicial de color mientras se mejora el contraste cromático, lo que permite que áreas salientes y no salientes tengan diferentes variaciones de tonalidades.. para preservar la misma percepción de la imagen original, ya que falta una guía visual para automáticamente generar imágenes óptimas en escala de grises.. Pueden aumentarse los hechos falsos en la imagen a colores debido a la compresión. Ajustar manualmente los parámetros angulares puede perjudicar el contraste cromático y puede fallar cuando se emplean regiones que no reflejan la verdadera información saliente de la imagen.. El método de decoloración preservando el contraste generaliza el modelo de mapeo considerando pares de colores no locales y combinando los límites locales y no locales en la optimización.. No preserva bien el contraste local.. Se calcula un mapa de pesos para cada canal de color, este mapa esta. La contribución relativamente fuerte al factor de contraste a los pesos compuestos puede resultar en una sobre mejora de los bordes en las estructuras, y la tonalidad perceptual puede perderse.. compuesto por varias métricas visuales de calidad. A continuación, un mapa con pesos de múltiple resolución es construido para cada. 24.

(35) canal aplicando una pirámide gaussiana de transformación a cada mapa. 6. Jin, Li y Ng. 2014. Jin14 (Jin, Li and Ng, 2014). Utiliza un enfoque variacional usando un método de optimización de maximización de varianza y de conservación del brillo. Una función de. Puede causar varios errores en algunas regiones suaves debido a la sobrepoblación de contornos. Presenta parámetros que deben ser definidos por el usuario.. energía determina las transformaciones locales para combinar los canales de colores. 7. Ji, Fang, Wang y ma. 2015. Ji15 (Ji et al., 2016). Presenta un mapeo rápido y eficiente para preservar rasgos dominantes en las imágenes a color. Se basa en una variante tradicional de diferencias. Algunos rasgos locales en la imagen de color no pueden ser preservados en la imagen de escala de grises resultante.. gaussianas que se llama filtro de luminancia. 8. Du, He, Sheng, Ma, y Lau. 2015. Du15 (Du et al., 2015). Enfatiza el contraste de color en las áreas borde basadas en un modelo. Dada que la función de mapeado considera no solo la información del. basado en regiones. Se desarrolla una función de mapeado paramétrico. color de los pixeles objetivos sino además del color que rodea a esta. basada en información global del color así como de contraste local.. área, el mismo color en la imagen original puede ser mapeada a valores diferentes a cada escala de grises.. 25.

(36) 1.3 Conclusiones del capítulo En este capítulo se especifican los conceptos necesarios sobre imagen digital, espacio de color y estándares de colores. Se define toda la teoría sobre las técnicas de reducción de los espacios de color, así como los métodos clásicos de conversión C2G. Se expresan los problemas existentes en la conversión de color a escala de grises, el cómo esta no es una tarea trivial debido a la alta complejidad que representa la reducción de dimensionalidad de imágenes a color. Se presenta un compendio de los métodos en estado-del-arte actuales en los cuales se basa esta tesis.. 26.

(37) CAPÍTULO 2. Materiales y Métodos 2.1 El Lenguaje Python Python es un lenguaje de programación de alto nivel cuya filosofía hace hincapié en una sintaxis muy limpia y que favorezca un código legible. Se trata de un lenguaje de programación multiparadigma ya que soporta orientación a objetos, programación imperativa y, en menor medida, programación funcional. Es un lenguaje interpretado, usa tipado dinámico, es fuertemente tipado y multiplataforma. (Knowlton, 2009) Python es un lenguaje de programación multiparadigma. Esto significa que más que forzar a los programadores a adoptar un estilo particular de programación, permite varios estilos: programación orientada a objetos, programación imperativa y programación funcional. Otros paradigmas están soportados mediante el uso de extensiones. Python usa tipado dinámico y conteo de referencias para la administración de memoria. (Martelli, 2007) Otro objetivo del diseño del lenguaje es la facilidad de extensión. Se pueden escribir nuevos módulos fácilmente en C o C++. Python puede incluirse en aplicaciones que necesitan una interfaz programable. (Oliphant, 2007) Los usuarios de Python se refieren a menudo a la Filosofía Python que es bastante análoga a la filosofía de Unix. El código que sigue los principios de Python de legibilidad y transparencia se dice que es "pythonico". Contrariamente, el código opaco u ofuscado es bautizado como "no pythonico". Estos principios fueron famosamente descritos por el desarrollador de Python Tim Peters en El Zen de Python                 . Bello es mejor que feo. Explícito es mejor que implícito. Simple es mejor que complejo. Complejo es mejor que complicado. Plano es mejor que anidado. Disperso es mejor que denso. La legibilidad cuenta. Los casos especiales no son tan especiales como para quebrantar las reglas. Aunque lo práctico gana a la pureza. Los errores nunca deberían dejarse pasar silenciosamente. A menos que hayan sido silenciados explícitamente. Frente a la ambigüedad, rechaza la tentación de adivinar. Debería haber una -y preferiblemente sólo una- manera obvia de hacerlo. Aunque esa manera puede no ser obvia al principio a menos que usted sea holandés. Ahora es mejor que nunca. Aunque nunca es a menudo mejor que ya mismo. Si la implementación es difícil de explicar, es una mala idea. 27.

(38)  . Si la implementación es fácil de explicar, puede que sea una buena idea. Los espacios de nombres (namespaces) son una gran idea ¡Hagamos más de esas cosas! Tim Peters, El Zen de Python. 2.2 Diagrama de las Bibliotecas de Reducción de Dimensionalidad creadas. En este epígrafe se hará una descripción de la teoría matemática detrás de los métodos implementados, además de los Diagramas de flujo de cada uno para una mejor comprensión de los mismos y de su desempeño. 2.2.1 Decolorize (Decolor_linear2006) Este método está basado en la publicación “Decolorize: fast, contrast enhancing, color to grayscale conversion” (Grundland and Dodgson, 2007). Tiene la ventaja de un mapeo constante, una consistencia global y preservación de la escala de grises, así como unas previsibles propiedades de arreglo de luminancia, saturación y tonalidad. El algoritmo tiene como entrada una imagen a color RGB de la forma (𝑅𝑖 , 𝐺𝑖, 𝐵𝑖 ) ∈ [0,1]3 y produce una imagen en escala de grises como salida de la forma 𝑇𝑖 ∈ [0,1]. Evadiendo los problemas de corrección gamma, se asumen valores de color y escala de grises lineales. El proceso es controlado por tres parámetros: el grado de realce de la imagen λ, el típico tamaño de las características relevantes de la imagen en píxeles 𝜎 y la proporción de los píxeles de la imagen en el borde exterior . Los valores de color RGB de cada pixel son convertidos a valores de color YPQ, cuyos canales son análogos a los canales de colores en el procesamiento visual humano. Este consiste en un canal de luminancia acromático 𝑌𝑖 ∈ [𝑌𝑚𝑖𝑛 , 𝑌𝑚𝑎𝑥 ] = [0,1] y un par de canales cromáticos de colores opuestos: amarillo-azul 𝑃𝑖 ∈ [−𝑃𝑚𝑎𝑥 , 𝑃𝑚𝑎𝑥 ] = [−1,1] y rojo-verde 𝑄𝑖 ∈ [−𝑄𝑚𝑎𝑥 , 𝑄𝑚𝑎𝑥 ] = [−1,1]. Para encontrar los ejes de color que mejor representen la pérdida en los diferentes contrastes cromáticos al mapear la conversión de color a escala de grises, se introduce una nueva estrategia de reducción de dimensionalidad basada en un análisis de componentes predominantes. En contraste a los principales métodos de análisis de componentes, los cuales se optimizan con la variabilidad de observaciones, el método de análisis de componentes predominantes se optimiza con las diferencias entre las observaciones. Posteriormente se propone fusionar la información de luminancia y cromancia de la imagen y finalmente se utiliza la saturación para calibrar la luminancia mientras se ajusta su grado dinámico y se compensa el ruido de la imagen. La transformación resultante del color y los valores de saturación (𝑅𝑖 , 𝐺𝑖, 𝐵𝑖 , 𝑆𝑖 ) a niveles de gris 𝑇𝑖 puede ser representada como un mapeo linear continuo: 28.