3.3 Procesamiento de imágenes
3.3.4 Mejora de la imagen
3.3.4.1 Métodos de mejora en el dominio espacial
3.3.4.1.1 Transformaciones de intensidad o de niveles de gris Procesamiento de punto
La forma más simple de T corresponde a un entorno 1x1, en cuyo caso g depende sólo del valor de f en el punto (x,y). Como la mejora en cada punto depende sólo del nivel de gris en ese punto, las técnicas de esta categoría se designan como procesamiento de punto. En estas condiciones, T se convierte en una función de transformación del nivel de gris de la forma:
Donde r y s indican el nivel de gris de f(x,y) y g(x,y) respectivamente. En la siguiente figura, se muestra en (a) el efecto de producir una imagen de mayor contraste que la inicial, al oscurecer los niveles de gris que se encuentran por debajo de m e iluminar los niveles por arriba de este valor en la imagen original. Esta técnica es conocida como de aumento de contraste (35).
En la figura (b), T(r) produce una imagen de dos niveles (binaria).
63 En la siguiente figura se muestran tres tipos de funciones básicas utilizadas frecuentemente en la mejora de la imagen:
● Lineal ● Logarítmica ● De potencia
Fig. 3.3.6 Funciones básicas utilizadas en la mejora de la imagen (35). Transformación lineal
Como se observa en la figura anterior, hay dos tipos de transformaciones lineales:
a. La lineal produce como resultado una imagen idéntica a la de entrada b. La negativa da como resultado el negativo de la imagen original (35). En la figura siguiente en (a) se ve la imagen original de una mamografía y en (b) el negativo de la misma.
Fig. 3.3.7 Transformación lineal.
64
Transformación logarítmica
Cuando el rango dinámico de una imagen excede la capacidad del dispositivo de presentación, en cuyo caso sólo las partes más brillantes de la imagen aparecerán en la pantalla, es usual recurrir a una transformación logarítmica del tipo:
Donde c es un factor de escala, y se asume que r>=0. Esta transformación realiza la compresión deseada.
Esta es la técnica usada para representar la Transformada de Fourier, donde el rango dinámico es habitualmente mucho mayor que el de los sistemas de visualización estándar que son capaces de reproducir fielmente, en consecuencia sólo las partes más brillantes de la imagen son visibles en la pantalla.
En la siguiente figura en (a) se observa la Transformada de Fourier de una imagen, y en (b) la transformación logarítmica de esta con c=1 (35).
Fig. 3.3.8 (a) Transformada de Fourier de una imagen. (b) Transformación logarítmica de la imagen “a” (35).
Como se puede ver la transformación logarítmica ayuda a visualizar niveles de gris antes no distinguibles.
La transformación logarítmica inversa lleva a cabo una transformación contraria a la anterior.
Transformación de potencia
Las transformaciones de función de potencia tienen la forma básica
65 En la siguiente figura se muestran los distintos gráficos de función para distintos valores de . Las curvas que corresponden a valores de >1 tienen un efecto contrario sobre la imagen a las que tienen <1.
Fig. 3.3.9 Curvas de transformación de potencia (35).
La aplicación de estas curvas sobre una imagen tiene un resultado similar a la transformación logarítmica.
Esta transformación también se utiliza para manipular el contraste de una imagen como se muestra en las siguientes figuras.
Fig. 3.3.10 Aumento de contraste
66
En la figura (a) se observa la imagen original, y en (b), (c) y (d) se muestra el aumento de contraste producido con c=1 y con valores de gamma de 3.0, 4.0 y 5.0 respectivamente.
Transformación lineal por partes
Fraccionamiento del nivel de gris
A veces se desea destacar un rango específico de nivel de gris en una imagen apoyándose la solución en una de estas dos ideas básicas:
1. Adjudicar un nivel alto a aquellos niveles de gris en el rango de interés, y un valor bajo para los restantes (Figura a).
2. Aumentar el nivel de gris del rango de interés, pero preservar el resto de los valores naturales (Figura b) (35).
Fig. 3.3.11 Transformaciones lineales para el fraccionamiento del nivel de gris (35). Aumento de contraste
En la siguiente figura se observa una transformación típica de aumento de contraste. Los puntos de control (r1,s1) y (r2,s2) determinan la forma de la función de transformación.
● Si r1=s1 y r2=s2 la transformación es una función lineal que no produce cambios en el nivel de gris.
67 ● Si r1=r2, s1=0 y s2=L–1, la transformación se vuelve una función de
umbral cuyo resultado es una imagen binaria (35).
Valores intermedios producen distintos grados de distribución del nivel de gris, afectando el contraste.
Fig. 3.3.12 Transformación lineal para el aumento del contraste (35). En la figura:
a. Función de transformación b. Imagen con bajo contraste
c. Resultado de aumento de contraste d. Resultado de aplicar la función de umbral Modificación del histograma
Puede encararse el mejoramiento de la imagen actuando sobre el histograma. El histograma de una imagen digital con niveles de gris en el rango [0, L-1] es una función discreta definida como:
Donde “rk” es el k-ésimo nivel de gris, “nk” es el número de píxeles de la imagen con ese nivel de gris, n es el número total de píxeles de la imagen y k=0, 1,2,..., L-1 (33).
68
A continuación en la figura se muestran 4 tipos de histogramas según la imagen sea:
Fig. 3.3.13 Histogramas típicos según el tipo de imagen (33).
Se observa que p (rk) da una estimación de la probabilidad de que aparezca el nivel de gris “rk”. La suma de los componentes de un histograma normalizado es igual a 1.
Si se parte de una formulación continua, para cada r del intervalo [0,1], y nos centramos en las transformaciones de la forma s= T(r) que producen un nivel de gris s para cada valor de píxel r de la imagen original, la función de transformación debe cumplir con las siguientes propiedades:
a) T(r) da un valor único y monótonamente creciente en el intervalo 0 1
b) 0 1 para 0 1 (33)
La condición a) preserva el orden entre negro y blanco de la escala de grises, mientras que la condición b) garantiza una aplicación que es coherente con el rango de valores de píxeles permitidos. Los niveles de gris se pueden ver como cantidades que varían aleatoriamente, y pueden caracterizarse por su densidad de probabilidades pr(r) y ps(s) (33).
De la teoría elemental de probabilidades, si y son conocidas y 1 y verifica la condición a), entonces se satisface:
69 Una técnica de mejora se basa en la modificación de la apariencia de una imagen digital al controlar la función de densidad de probabilidad de sus niveles de gris por medio de una función de transformación T(r) (33).
Sea la función de transformación (función de distribución acumulada de r):
Y donde:
Sustituyendo en (1) se tiene:
Que da una densidad uniforme en el intervalo de definición de la variable transformada s.
Esto significa que cuando se emplee una función de transformación igual a la función de distribución acumulada de r se produce una imagen cuyos niveles de gris tiene densidad uniforme (33).
La técnica empleada se llama “ecualización o linealización del histograma”. La ventaja que presenta este algoritmo frente a la manipulación manual del contraste es que su aplicación resulta completamente automática, esto es la información necesaria para implementar este proceso puede ser extraído de la propia imagen original, aunque sólo sea capaz de generar una aproximación a un histograma plano (33).
A veces se desea tener la posibilidad de especificar determinados perfiles del histograma capaz de detectar determinados niveles de gris, lo que lleva a considerar el histograma original y el que se desea obtener, desarrollándose para este propósito un método llamado “especificación del histograma” (33).
Estos dos métodos son globales, en el sentido de que los píxeles se modifican mediante una función de transformación basada en la distribución de los niveles de gris en toda la imagen (33).
Aunque a veces resulta de interés la mejora general de la imagen, a menudo se requiere actuar sobre los detalles en un área pequeña de la misma. Una solución consiste en generar funciones de transformación
70
basadas en la distribución de los niveles de gris en una vecindad de cada píxel de la imagen (33).
3.3.4.1.2 Filtrado espacial
El filtrado espacial plantea otra visión del problema. Se basa en el empleo de máscaras espaciales, también llamados filtros espaciales.
La idea es simple: Consiste en determinar g en el punto (x,y) a partir de los valores de f en un entorno predefinido en (x,y).
Normalmente se basa en el empleo de máscaras (plantillas, ventanas o filtros), las cuales son una pequeña distribución bidimensional (por ejemplo 3x3) en la que los valores de los coeficientes determinan la naturaleza del proceso, el cual se llama procesamiento por máscaras o filtrado. En los filtros lineales la aproximación básica consiste en sumar productos entre los coeficientes de la máscara y las intensidades de los píxeles bajo la máscara en un punto determinado de la imagen (33).
La matriz anterior es una máscara 3x3 con pesos “wi”. Con “zi” se indican los píxeles de la imagen en los lugares correspondientes. El píxel que ocupa la posición 5 se reemplaza por R con:
Luego se traslada la máscara hasta el pixel siguiente y se repite el procedimiento.
Los filtros espaciales no lineales operan también en entornos, pero su operación se basa directamente en los valores de los píxeles y no utilizan explícitamente los coeficientes como en el caso lineal. Entre los más comunes se encuentran los que calculan la mediana del nivel de gris en el entorno, o el filtro de máximo con R=máx{zi} (33).
Filtros suavizantes
Se emplean para lograr que la imagen aparezca algo borrosa en algunas etapas del preprocesado, para la eliminación de los pequeños detalles antes de la extracción de un objeto. También para la reducción de ruido mediante el aumento de la borrosidad (33).
71 A modo ilustrativo se observa en la siguiente figura un filtro pasa bajo unidimensional.
Fig. 3.3.14 Filtro suavizante (33).
Se puede ver que en el dominio espacial todos los coeficientes son positivos. La construcción más simple sería como:
La respuesta R en este caso será el valor promedio de todos los píxeles en el área de la máscara, por lo cual se suele llamar máscara de promediado. Una de las principales dificultades en este tipo de máscaras es que difumina los bordes y otros detalles de realce.
Para eliminar ruido se puede usar un filtro de mediana el cual no es lineal pero más robusto al borroneo (33).
Filtros realzantes
El objetivo de estos filtros es destacar los detalles finos de una imagen o intensificar los detalles. Entre estos se encuentran los filtros pasa alto, un ejemplo unidimensional se muestra en la siguiente figura:
Fig. 3.3.15 Filtro realzante (33).
Observando la figura en el dominio espacial, se deduce que la máscara debe tener valores positivos en su centro y negativos en la periferia. Por ejemplo:
72
Se puede observar que la suma de todos los coeficientes es cero.
Cuando la máscara está sobre un área de nivel de gris casi constante, la salida del filtro es cero o muy pequeña. Este filtro elimina el término de frecuencia cero y hace muy pequeñas las frecuencias bajas, por lo tanto provoca que la imagen queda muy oscura (33).
Se obtienen sin embargo resultados mejores usando un filtro high-boost, el cual usa la idea de que una imagen filtrada pasa alto puede ser calculada como la diferencia entre la imagen original y la imagen filtrada pasa bajo (33).
Multiplicando la imagen original por un factor de amplificación A se obtiene el filtro high-boost, y de aquí se deduce que:
● Si A=1 se tiene un filtro pasa alto normal.
● Si A>1 parte de la propia imagen original se añade al resultado del filtro pasa alto, lo que devuelve parcialmente las componentes de baja frecuencia, con lo que la imagen final se parece más a la original con un realce de los bordes, lo cual depende del valor de A (33).
Otros filtros espaciales
Como se mencionó anteriormente el promediado de los píxeles en una región tiende a difuminar la imagen. Como esta operación es análoga a la integración, puede pensarse que la diferenciación produzca el efecto contrario, esto es aumentar la nitidez de una imagen. El método más común es el del gradiente (33).
73 Para f(x,y) el gradiente viene dado por:
Y con un módulo:
Se puede discretizar el problema y aproximarse por:
A partir de la región de imagen:
Otra opción es sumando los valores absolutos:
También puede usarse diferencias cruzadas:
Las cuales pueden ser implementadas con máscaras del tipo (máscaras de Roberts):
Empleando un entorno 3x3 la aproximación al gradiente se puede hacer como:
74
Las máscaras generalmente usadas son:
Uno de los usos más frecuentes de estas máscaras es para destacar bordes.