• No se han encontrado resultados

Comparación de los métodos Wavelet y transformada de Fourier en el reconocimiento de patrones

N/A
N/A
Protected

Academic year: 2020

Share "Comparación de los métodos Wavelet y transformada de Fourier en el reconocimiento de patrones"

Copied!
116
0
0

Texto completo

(1)

(2) )l.0-1~.

(3) INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY. I. T. E. S.. M. · C. C. M.. BTBtIOTECA. COlfCCION Df Nf60CIOS Y ALTA DIRfCCro, "COMPARACION DE LOS MÉTODOS WAVELET Y TRANSFORMADA DE FOURIER EN EL RECONOCIMIENTO DE PATRONES". T E S I S Que para obtener el grado de. MAESTRA EN CIENCIAS DE LA COi\1PUTACIÓN. P r e s e n t a : JUANA JULIETA NOGUEZ J/i.ONROY i\sesor·. DR. JUAN FCO. CORONA :BLRGUEÑO Diciembre, 1998.. ,,,.

(4) No. Adquis.. 1(f 'I B. Precin:. Procedencia:. --. . J.

(5) INSTITUTO TECNOLÓGICO Y DE ESTUDIOS SUPERIORES DE MONTERREY. COMPARACIÓN DE LOS MÉTODOS WAVELET Y TRANSFORMADA DE FOURIER EN EL RECONOCIMIENTO DE PATRONES. Tesis presentada por. JUANA JULIETA NOGUEZ MONROY. Aprobada en contenido y estilo por:. Dr. Juan Francisco Corona Burgueño Asesor. Dr. Carlos Rodríguez Lucatero Miembro del jurado. M. C. Edgar Vallejo Clemente Miembro del jurado. Dr. Martín López Director del Programa.

(6) DEDICATORIA. A ti Dios, creador y dador de vida, por permitirme disfrutar de tu maravilloso don y compartirlo con mis semejantes ... A ti Enrique, por tu apoyo, amor y comprensión, porque mi amor por ti es inmenso y por permitirme disfrutar y compartir cada instante de mi vida a tu lado.. A ti Ale, a quien adoro, por ser el gran regalo de Dios que me anima e impulsa dar lo mejor de mi.. A ti Mamá y Papá, que con su ejemplo y amor al trabajo supieron guiarme y transmitirme la fe en la vida y apoyarme en la primera parte de mi vida.. A ti Coco, por ser tan buena hermana y porque te quiero mucho. ¡¡¡.

(7) RECONOCIMIENTOS Deseo agradecer y dar mi más sincero reconocimiento a las personas que me brindaron su apoyo y colaboración y que estuvieron siempre cerca de mí para que esta tesis fuera posible:. Al Dr. Juan Feo. Corona Burgueño, por su paciencia, motivación, asesoría, comprensión y apoyo; por su gran generosidad al compartir no sólo sus conocimientos, sino también sus valores y por ser una gran persona.. Al lng. Jesús Rodríguez Guerrero, por su gran apoyo y confianza, porque con su ejemplo y guía contagia su espíritu de triunfador.. A mis profesores de la maestría por la dedicación y empeño con que realizan su labor, permitiendo que uno reciba las mejores bases y conocimientos.. Al ITESM por ayudarme a crecer como persona.. A la comunidad del ITESM Campus Hidalgo por permitirme trabajar codo a codo compartiendo metas y sueños.. iv.

(8) TABLA DE CONTENIDO DEDICATORIA ...................................................................iii. RECONOCIMIENTOS ......................................................... iv. LISTA DE FIGURAS ........................................................... ix. LISTA DE TABLAS .............................................................xi. RESUMEN ...........................................................................1. INTRODUCCIÓN ................................................................2 ,. CAPITULO 1.........................................................................3. 1.0 MARCO DE REFERENCIA ........................................ 3 1.1 Definición del problema ...................................... 4 1.2 Objetivo ...............................................................4 1.3 Justificación ........................................................ 5 1.4 Contribución ........................................................ 7 1.5 Producto Final. ..................................................... ? ,. CAPITULO 2........................................................................8. V.

(9) 2.0 REVISIÓN DE CONCEPTOS BÁSICOS DE IMÁGENES DIGITALES ................................................................... 8 2.1 El modelo de imagen ............................................ 8 2.2 Rangos dinámicos ................................................. 9 2.3 Resolución ............................................................. 1 2.4 Muestreo y cuantización ...................................... 11 2.5 Relaciones básicas entre pixeles ......................... 12 2.6 Técnicas de interpolación ................................... 18. ,. CAPITULO 3 .......................................................................20. 3.0 TRANSFORMADA DE FOURIER EN DOS DIMENSIONES ........................................................... 20 3.1 Definición de la transformada de Fourier .............. 20 3.2 Los componentes de Fourier en dos dimensiones ............................................. 28 3.3 La transformada discreta de Fourier en dos dimensiones ............................................. 30 3.4 La transformada rápida de Fourier ....................... 34 3.5 Algoritmo computacional. ..................................... 37. ,. CAPITULO 4 .......................................................................39. 4.0 LA TRANSFORMADA WAVELET ............................... 39 4.1 Definición ..............................................................42 4.2 La transformada discreta wavelet ........................ 43 4.3 Análisis de multiresolución (algoritmo piramidal) ........................................... 47 4.4 Algoritmo computacional ...................................... 50. vi.

(10) ,. CAPITULO 5.......................................................................51. 5.0 PROCESAMIENTO DE IMÁGENES DE NIVEL BAJO E INTERMEDIO .............................. 51 5.1 Visión de nivel bajo .............................................. 53 5.2 Visión de nivel intermedio ..................................... 59 ,. CAPITULO 6.......................................................................64. 6.0 RECONOCIMIENTO DE IMÁGENES ........................ 64 6.1 Definición del universo de trabajo ...................... 70 6.2 Transformación en la escala de grises ................ 7·1 6.3 Detección de bordes ............................................ 72 6.4 Diseño y obtención de características de la imagen ...................................................... 74 6.5 Métodos de reconocimiento ............................... 80 ,. CAPITULO 7 .......................................................................82. 7.0 DESARROLLO DE UN RECONOCEDOR DE CARAS HUMANAS .............................................. 82 7. 1 Objetivo .............................................................. 82 7.2 Análisis .............................................................. 82 7.3 Diseño ............................................................... 85 7 .4 Construcción ...................................................... 89 ,. CAPITULO 8 .......................................................................90. B.O. RESULTADOS OBTENIDOS .................................... 90 8.1 Reconocedor con Transformada de Wavelet ...... 90 8.2 Reconocedor con Transformada de Fourier. ...... 91 vii.

(11) ,. CAPITULO 9 .......................................................................93 9.0 CONCLUSIONES .......................................................93 9.1 Trabajo Futuro ............................................................. 97 ANEXOS .............................................................................98 ANEXO 1. Algoritmos .......................................................... 98 ANEXO 2. Resultados del experimento ............................ 101 REFERENCIAS ..................................................................109 ,. BIBLIOGRAFIA..................................................................111. viii.

(12) LISTA DE FIGURAS Figura 2.1 Cambios de nivel de intensidad en una imagen .................................. 9 Figura 2.2 Imágenes con diferente resolución ...................................................... 1O Figura 2.3 Representación de una imagen en una matriz, con valores en niveles discretos de gris entre O y 7 ........................... 11 Figura 2.4 Vecindad -4 de p N4(p) ........................................................................ 13 Figura 2.5 Vecindad diagonal de p N0 (p) .............................................................. 13 Figura 2.6 a) q E { (x+1, y), (x-1, y), (x, y+1), (x, y-1)} ....................................... 14 Figura 2.6 b) q está en No(P) y el conjunto N4(p) n N4(q) no está vacío ............. 15 Figura 2. 7 a) Letra original ................................................................................... ·16 Figura 2.7 b) Letra trasladada una unidad a la derecha ...................................... 16 Figura 2.8 Rotación de 90° de una imagen .......................................................... 16 Figura 2.9 Aplicando la función de reflexión f(i,-j) ................................................ 17 Figura 3.1 Representación gráfica de una señal discreta en tiempo ................... 20 Figura 3.2 Secuencia de muestra unitaria ........................................................... 21 Figura 3.3 Función exponencial real .................................................................... 21 Figura 3.4 Secuencia de forma senoidal ..............................................................22 Figura 3.5 Ejemplo de secuencia formada por muestras unitarias con retardo y escalamiento .......................................................................23 Figura 3.6 Señal continua discretizada .................................................................24 Figura 3. 7 Representación de un sistema ............................................................24 Figura 4.1 Función de escalamiento \ll(t), wavelet W(t) y siguiente nivel de detalle ................................................................. 39 Figura 4.2 Función base de Haar ........................................................................ .45 Figura 4.3 Función base Daubechies-4 ............................................................... .45 Figura 4.4 Diferentes familias wavelet obtenidas del paquete wavelab de la Universidad de Stanford en los Estados Unidos ........... .46 Figura 4.5 Escalamiento de un bloque de 16 muestras de datos ........................ .49 Figura 5.1 Proceso para el reconocimiento de imágenes ..................................... 52 Figura 5.2 Máscara para detectar puntos aislados diferentes de fondo constante .............................................................................. 55 Figura 5.3 Máscara de 3x3 general que muestra los coeficientes y las posiciones de los elementos de la imagen correspondiente ........... 56 Figura 5.4 Entorno de vecindad 3 x 3 y máscaras del gradiente .......................... 58 Figura 6.1 Orden en que se lleva a cabo el procesamiento de imágenes ............ 65 Figura 6.2 Diagrama a bloques de un Sistema de Reconocimiento Automático .....................................................................-...................... 66 Figura 6.3 Formación de un vector de imagen a partir de una imagen ................ 67 Figura 6.4 Etapas del diseño de un Sistema de Reconocimiento Automático de Formas .........................................................................70 Figura 6.5 Transformación de una imagen a escala de grises (O a 8) .................. 71. ix.

(13) Figura 6.6 Ventanas de Kirsh como operadores para la obtención de Bordes de una imagen .................................................................... 73 Figura 6.7 Ejemplo de aplicación de detección de bordes a una imagen ......... .66 Figura 6.8 Representación unidimensional del contorno de un objeto, Empleando código cadena ............................................................... 75 Figura 7 .1 Elementos principales de los diagramas de flujo de datos propuestos en la metodología de Yourdon .................. .................... ..82 Figura 7.2 Diagrama de flujo de datos propuesto para reconocer una cara humana ......................................... ..................................... 83 Figura 7.3 Detalle del proceso 1 (Lectura y procesamiento de la Base Inicial de Imágenes) ............................................................ .. 84 Figura 7.4 Diseño Modular del Sistema Reconocedor de Caras Humanas ..... .. .. 85 Figura 7.5 Siguiente nivel modular de la Base Inicial de Imágenes .......... ........ 86 Figura 8.1 Resultados obtenidos con el reconocedor de imágenes que emplea transformada wavelet. ...... ............................................. 90 Figura 8.1 Resultados obtenidos con el reconocedor de imágenes que emplea transformada de Fourier.......... ... .. ................................ 91 Figura 9.1 Imagen original y correspondiente de bordes o contornos .......... .... 93 Figura 9.2 Cuadro comparativo de desempeño de transformada de Fourier y transformada Wavelet para reconocer imágenes que ya se encontraban en el Banco de Imágenes .......................... .94 Figura 9.3 Cuadro comparativo de desempeño de transformada de Fourier y transformada Wavelet para reconocer imágenes con variaciones, de las que ya se encontraban en el Banco de Imágenes...... ... ... ................. .... ......................... ... .... .....95 Figura 9.4 Imagen jeff-01.pgm con su correspondiente imagen de bordes y una variación llamada jeff-02.pgm con su correspondiente imagen de bordes .. ... ............................... .... ... .. ............................... 95. X.

(14) LISTA DE TABLAS Tabla 4.1 Coeficientes de tres funciones wavelet .......................................... .46 Tabla 5.1 Niveles y operaciones del procesamiento integral de imágenes ..... 51 Tabla 6.1 Situaciones que pueden presentarse en el reconocimiento automático ......................................................................................69 Tabla 6.2 Ejemplo de descomposición wavelet con base en promedios y coeficientes de detalle ........................................... 78 Tabla 7.1 Lista de programas construidos ...................................................... 89. xi.

(15) RESUMEN Este proyecto consideró diseñar algoritmos y desarrollar pruebas para el reconocimiento de patrones e imágenes en dos dimensiones, empleando en forma paralela la transformada rápida de Fourier y la transformada discreta Wavelet, con objeto de determinar cuál de ellas brinda mejores resultados. Es un proyecto de investigación interno, cuya inquietud surgió a través de lecturas de nuevas herramientas para el procesamiento digital de señales, como la transformada wavelet y su aplicación dentro del área de reconocimiento de patrones. Se tiene una amplia gama de aplicaciones de reconocimiento de formas o imágenes, tales como el reconocimiento de caras, huellas dactilares o iris para la identificación de personas que utilizan tarjetas de crédito, licencias de conducir, pasaporte; control de acceso a áreas restringidas, reconocimiento de tumores o malformaciones en estudios médicos, visión de robótica para tareas industriales, control de calidad de productos, estudio de tomas áreas de satélites para identificar recursos y ubicación de objetos de interés, etc. El universo de trabajo para este proyecto se definió en torno al reconocimiento de caras humanas. La transformada de Fourier se ha utilizado ampliamente en muchas áreas de física y en otras ciencias incluidas en un amplio rango de tecnologías modernas como el reconocimiento de imágenes, el procesamiento de imágenes médicas, sismología, redes telefónicas y líneas de telecomunicaciones [2.1]. Por otra parte, la transformada wavelet fue desarrollada en forma independiente en diferentes campos tales como matemáticas, física cuántica, ingeniería eléctrica y geología sísmica, como un método alterno para resolver problemas de resolución, y gracias al intercambio de estas disciplinas en los últimos diez años han surgido nuevas aplicaciones de esta transformada, entre las que destacan la compresión de imágenes, turbulencias, radares, predicción de terremotos, visión humana y la que nos interesa ahora [4.1]. En el ámbito computacional, el reconocimiento automático de formas abarca un conjunto de técnicas y herramientas matemáticas con aplicación en numerosas disciplinas: ingeniería, medicina, biología, etc.; siendo uno de sus principales objetivos el que una computadora pueda recibir información digitalizada de un objeto real, se compare con otras imágenes de las mismas características que se le proporcione y sea capaz de decidir si la imagen concuerda con las características de otra, tomando en cuenta que pueden existir distorsiones provocadas por el ambiente en el que se toma la información. Este trabajo aporta un cuadro comparativo entre los métodos de Fourier y Wavelet, aplicados al reconocimiento de caras humanas, mostrando mejores resultados la transformada Wavelet al aplicarse ambos métodos sobre un conjunto selecciondo de caras humanas..

(16) INTRODUCCIÓN En el presente trabajo de tesis usted encontrará el desarrollo de un reconocedor de imágenes, orientado principalmente a caras humanas, que permite elegir en forma alterna la transformada de Fourier y la transformada Wavelet como puntos focales para obtener los descriptores de las imágenes que sirven como base para la labor de reconocimiento, así como cuadros comparativos de los resultados obtenidos. El término wavelet significa pequeña onda u "endita"; sin embargo aún no se tiene una traducción directa al español, por lo que se preservó su nombre en el idioma inglés para identificar esta transformada. Este documento está organizado de la siguiente forma: en el primer capítulo se define un marco de referencia, se describe el potencial de la transformada wavelet, se muestra la justificación de este trabajo describiendo su objetivo, la contribución y el producto final. En el segundo capítulo se proporcionan las definiciones y conceptos básicos de las imágenes digitales, así como algunas de las operaciones básicas que sobre ellas se efectúan. El tercer capítulo describe algunos conceptos básicos del procesamiento digital de señales y proporciona las definiciones de diversas transformadas de Fourier, así como un algoritmo para la construcción de la transformada rápida de Fourier. En el cuarto capítulo se muestra una semblanza histórica del surgimiento de la transformada wavelet, se proporciona su definición y se describe un algoritmo para su implementación. En el quinto capítulo se muestran los conceptos básicos del procesamiento de imágenes de nivel bajo e intermedio, que se aplican en forma indirecta para lograr el reconocimiento de alto nivel. El sexto capítulo describe el proceso para lograr el reconocimiento de imágenes, se define el universo de trabajo y se describen los procesos principales desarrollados en este trabajo: detección de bordes, obtención de características y el método de reconocimiento de decisión teórica, basado en discriminantes. En el séptimo capítulo se dan detalles de la construcción del prototipo para reconocer automáticamente imágenes, describiendo su análisis y diseño. En el octavo capítulo se muestran los resultados obtenidos. Por último, en el capítulo noveno se mencionan las conclusiones de este trabajo y se muestran algunas ideas que podrían permitir la continuación de esta investigación.. 2.

(17) CAPÍTULO 1 1.0 MARCO DE REFERENCIA.. Esta propuesta es un proyecto de investigación interno, cuya inquietud surgió a través de lecturas de nuevas herramientas para el procesamiento digital de señales, como la transformada wavelet y su aplicación dentro del área de reconocimiento de patrones. El procesamiento digital de imágenes es útil en el mejoramiento de la información visual y gráfica para interpretación humana y en el procesamiento de datos de escena para la percepción de máquinas autónomas. Dentro de este ámbito es muy importante determinar qué herramientas matemáticas y computacionales pueden dar mejores resultados aprovechando los avances tecnológicos actuales. Tradicionalmente se han empleado los métodos de Fourier, basados en transformadas de senos y cosenos para el tratamiento de imágenes y audio, sin embargo, en los últimos diez años surgió la transformada wavelet como una técnica promisoria que vislumbra mejores resultados respecto al actual desempeño que han tenido los métodos de Fourier. La transformada de Fourier proporciona la información de frecuencias de la señal, pero no indica en que tiempo existen estos componentes de frecuencia. La información anterior no se requiere cuando se trabaja con señales estacionarias, es decir cuando los contenidos de frecuencia no cambian con el tiempo. Pero, existe una gran cantidad de aplicaciones en las que se tienen señales no estacionarias, por ejemplo las señales biológicas, entre las que destacan la actividad eléctrica del corazón, los electrocardiogramas y los electroencefalogramas, que requieren mayor profundidad en estudio del comportamiento de la señal, eso dio origen a la necesidad de buscar representaciones de frecuencia-tiempo a través de transformadas que permitan la localización en tiempo de los componentes espectrales. En primer término surgió la transformada Rápida de Fourier y fue la primera en activar en forma importante el procesamiento de señales teniendo múltiples aplicaciones en medicina, análisis espectral, acústica, filtrado y procesamiento de imágenes entre otras. El problema de la transformada Rápida de Fourier está relacionado con el principio de incertidumbre de Heisenberg, debido a que permite conocer en intervalos de tiempo las bandas de frecuencia que existen, pero no es posible conocer en forma exacta en el tiempo las representaciones de frecuencia de la señal. El problema también está relacionado con el ancho de la función ventana que se emplea, si se usa una ventana de longitud infinita, se tiene una resolución en frecuencia perfecta, pero no se obtiene información en el tiempo, si por el contrario se elige un ancho de ventana pequeño se obtiene buena resolución en tiempo, pero una muy pobre resolución en frecuencia. 3.

(18) Actualmente se están trabajando en forma separada métodos de reconocimiento de patrones basados en la transformada rápida de Fourier y en forma aislada muy pocos sobre transformada wavelet, esta última está en proceso de exploración en otros campos tan diversos como astronomía, acústica, ingeniería nuclear, neurofisiología, música, imagen de resonancia magnética fractales, turbulencia, predicción de terremotos, radares, reconocimiento de voz, visión humana, y aplicaciones en matemáticas puras, tales como solución de ecuaciones diferenciales parciales. Estas investigaciones se están llevando a cabo en una gran variedad de países, entre los que destaca Estados Unidos, en el que se tiene un proyecto muy interesante en colaboración entre la Universidad de Stanford y el Programa de Datos de Astrofísica de la NASA [1.1]. 1.1 Definición del problema El reconocimiento de imágenes requiere un considerable esfuerzo computacional en cada una de sus etapas. En particular la obtención de características que serán la base de reconocimiento es una de las que requieren mayores recursos. Los métodos tradicionales de transformada rápida de Fourier utilizados con gran éxito para el análisis de señales utilizan un número de operaciones del orden O(nlogn). La transformada wavelet rápida, por sus características de algoritmo piramidal, puede reducir a orden O(n) el número de operaciones para obtener las características del vector asociado a la imagen. En algunos artículos se hace mención sobre los resultados de la transformada rápida de Fourier en el procesamiento digital de señales, en particular para el reconocimiento de patrones, pero sería muy interesante tener cuadros comparativos de su desempeño respecto a la transformada wavelet.. 1.2 Objetivo Debido al potencial que vislumbra la transformada wavelet, se propone elaborar algoritmos y desarrollar pruebas de reconocimiento de patrones e imágenes en dos dimensiones, empleando en forma paralela la transformada rápida de Fourier y la transformada Wavelet, con objeto de determinar cuál de ellas brinda mejores resultados. En particular este trabajo plantea un desarrollo y pruebas con cada uno de estos métodos (Fourier y Wavelet) aplicados al reconocimiento de caras humanas. aunque se tiene un gran potencial y cantidad de aplicaciones entre las que se pueden mencionar la visión de robots, el procesamiento de imágenes vía satélite, el reconocimiento de huellas digitales, de manuscritos, de voz, etc. 4.

(19) Se eligieron como criterios de comparación la complejidad algorítmica de los métodos, el tiempo de ejecución y el porcentaje de correctud o decisiones correctas al aceptar o rechazar nuevas imágenes para su reconocimiento.. 1.3 Justificación Dentro del paradigma cognitivo, el intento de construir modelos de procesos intelectuales se vio considerablemente impulsado por el avance de los recur&os tecnológicos, siendo de gran importancia las modernas computadoras digitales. Estos esfuerzos se sistematizaron dentro de un área de estudios de carácter fuertemente interdisciplinaria a la que se le dio el nombre de Inteligencia Artificial. Esta área ha evolucionado y sus resultados han influenciado en forma importante aspectos de arquitectura de computadoras, así como modelos de pensamiento. El reconocimiento de patrones es una de las áreas de la Inteligencia Artificial, que entre sus objetivos contempla el que una computadora pueda recibir información digitalizada de un objeto real y pueda compararla con otra imagen de las mismas características que se le proporcione en un momento dado, y dicha computadora pueda decidir si este segundo objeto es similar al primero o concuerda con las características de otro objeto que también se tenga almacenado, tomando en cuenta que la imagen presentada puede no ser exactamente igual a la primera, debido a alguna distorsión provocada por el ambiente del que se toma la nueva información. Una imagen digital en dos dimensiones, es una imagen f(x,y) que ha sido discretizada tanto en coordenadas espaciales como en brillantez. Se puede considerar a una imagen digital como a una matriz cuyos índices de filas y columnas identifican un punto en la imagen y su correspondiente valor del elemento de la matriz identifica el nivel de gris en ese punto. Los elementos de dicho arreglo digital son llamados elementos de imágenes, elementos de dibujo o pixel es. El proceso de reconocimiento de imágenes no es tan simple, debido a que implica identificar o clasificar objetos sobre las bases de atributos y de sus valores de relación-atributo y esto se complica cuando se tiene una base muy grande de imágenes contra las cuales se desea comparar, por ejemplo la identificación de huellas digitales de persona contra las que se tengan almacenadas en un archivo policiaco, o bien un rostro tomado de una cámara contra los archivos de fotografías de una empresa bancaria. En lo referente al procesamiento de señales, se han aplicado transformaciones matemáticas para obtener mas información, que no se encuentra disponible en su forma original. Existe un gran número de transformaciones que se pueden aplicar, pero entre ellas quizás la más popular es la transformada de Fourier.. 5.

(20) En la práctica la mayoría de las señales son señales en el dominio del tiempo en su formato original, debido a que su medición es una función del tiempo. Sin embargo en la mayoría de los casos, la información útil está escondida en el contenido de frecuencia de la señal. El espectro de frecuencia de una señal muestra los componentes de frecuencia de dicha señal, es decir, permite visualizar las frecuencias que existen en esa señal. La transformada de Fourier permite obtener la representación en amplitud y frecuencia de la señal. Aunque la transformada de Fourier es quizás la mas popularmente usada, no es la única. Existen muchas otras transformadas tales como la transformada Hilbert, la distribución Wigner, la transformada Radon y la transformada Wavelet, que por el momento nos interesa. La transformada wavelet fue desarrollada como un método alterno a la transformada rápida de Fourier para resolver el problema de la resolución. El análisis wavelet se hace en forma similar a la función ventana mencionada anteriormente, en el sentido de que la señal es multiplicada por una función similar a la función ventana en la transformada de Fourier de tiempo corto y la transformada se calcula en forma separada para diferentes segmentos de la señal en el dominio del tiempo. Sin embargo existen al menos tres grandes diferencias entre la transformada rápida de Fourier y la Wavelet: 1. Las transformaciones de Fourier de la señal a la que se aplicó la ventana no se preservan y por lo tanto los picos simples son vistos como senoides, es decir, presenta pérdida de información de la señal original, debido a que al utilizar senos y cosenos, la transformada de Fourier presenta un solo conjunto de funciones base. 2. En la transformada wavelet, el ancho de la ventana se cambia mientras se calcula la transformada para cada componente espectral simple, lo cual es probablemente la característica más significativa de esta transformada, mientras que en la transformada de Fourier el ancho de la ventana se mantiene fija sin importar los componentes espectrales que contenga la señal.. 3. Cada función wavelet individual está localizada en el espacio, mientras que las funciones de Fourier de senos y cosenos no lo están, debido a la transformada de Fourier presenta partes reales y partes imaginarias. La transformada de Fourier y la transformada wavelet tienen también similitudes importantes [1.2), entre las que se destacan: 1) Las dos son operaciones lineales que generan una estructura que contiene log2n segmentos de diferentes longitudes. Debido a que ambos métodos son recursivos y trabajan sobre el principio de divide y vencerás, en cada cambio de nivel o iteración se va reduciendo el conjunto de datos en segmentos que son la mitad del anterior. 6.

(21) 2) Las propiedades matemáticas de las matrices involucradas en las transformaciones son similares también. Tanto la matriz transformada inversa de la transformada rápida de Fourier (FFT), como la de la transformada wavelet discreta (DWT), es la transpuesta original. Es decir, en ambos casos, se puede aplicar el proceso inverso (o la transformada inversa) para recuperar la señal original. 3) En ambas transformadas los resultados pueden ser vistos como una mapeo en el espacio función a un dominio diferente. La transformada de Fourier permite obtener la representación en frecuencia de la señal y la transformada Wavelet muestra una representación también de la frecuencia, pero en el espacio en el que ocurre.. 1.4 Contribución A continuación se listan las principales aportaciones de este trabajo: 1) Desarrollar métodos de aplicación de la transformada wavelet y de la transformada rápida de Fourier. 2) Elaborar herramientas dimensiones.. para. el. reconocimiento. de. imágenes. en. dos. 3) Brindar cuadros comparativos que muestren el desempeño tanto de la transformada rápida de Fourier como la de la transformada Wavelet. 4) Contribuir a la difusión y conocimiento de la transformada wavelet para diferentes aplicaciones.. 1.5 Producto final Mostrar cuadros comparativos del desemper10 de la Transformada rápida de Fourier contra la transformada Wavelet a través del desarrollo de un prototipo que reconozca caras humanas en dos dimensiones, con objeto de determinar cuál de ellas brinda mejores resultados Los criterios seleccionados de comparación de los algoritmos son: la complejidad algorítmica de los métodos, el tiempo de ejecución y el porcentaje de correctud o decisiones correctas que presenta cada método al aceptar o rechazar nuevas imágenes para su reconocimiento. 7.

(22) CAPÍTULO 2 2.0 REVISIÓN DE CONCEPTOS BÁSICOS DE IMÁGENES DIGITALES A continuación se describen en forma breve los conceptos básicos de la representación digital de imágenes y de las operaciones básicas que se aplican. Debido a la complejidad que implica el procesamiento digital de imágenes en tres dimensiones, y a que las imágenes en color requieren mucho más capacidad de almacenamiento en disco, se orientaron los trabajos experimentales de esta tesis hacia imágenes en dos dimensiones y en blanco y negro.. 2.1 El modelo de imagen Un modelo simple de imagen puede referirse a una función de intensidad de luz en dos dimensiones, denotada por f(x,y), donde el valor de amplitud de la función f en las coordenadas espaciales (x,y) da la intensidad (brillantez) de la imagen en ese punto. Debido a que la luz es una forma de energía f(x,y) debe ser un valor finito mayor o igual a cero, es decir: O ::; f(x,y) < oo Las imágenes que percibe la gente en actividades visuales cotidianas normalmente consisten de la luz reflejada de los objetos. La naturaleza básica de la función f(x,y) se puede caracterizar por dos componentes: 1) La cantidad de luz fuente incidente en al escena que se está viendo 2) La cantidad de luz reflejada por el objeto en la escena. Estos elementos son llamados de manera más formal : iluminación y componentes de reflexión, y se denotan por i(x,y) y r(x,y) respectivamente. Para formar la función f(x,y) se combinan como producto las funciones i(x,y). y r(x,y) : f(x,y) = i(x,y)r(x,y) Donde O < i(x,y) < oo y. O ::; r(x,y) ::; 1. 8.

(23) Esta última indica que la reflexión esta limitada por O (absorción total) y 1 (reflexión total). La naturaleza de la función de iluminación esta determinada por la fuente de luz, mientras que la reflexión está asociada a las características de los objetos en escena. 2.2 Rangos Dinámicos. Los rangos dinámicos se refieren a la separación entre los extremos de luz y oscuridad. Por ejemplo en las impresiones de imprenta, el rango dinámico se define normalmente de 8 a 1, donde el negro más negro se representa como un 1 y el blanco más blanco como un 8. Este concepto también puede representarse por números de niveles de gris. A cada valor del rango también se le llama nivel de intensidad y su valor depende de la imagen misma y de la aplicación para la que se usará. Como base de comparación las imágenes monocromas de la televisión utilizaban 128 niveles de intensidad y en visión artificial se han empleado con éxito 64 niveles. Las imágenes que se utilizarán para probar el sistema poseen de O a 256. En la figura 2.1 se muestran dos imágenes de la misma toma, con diferente nivel de intensidad.. Figura 2.1 Cambios de nivel de intensidad de grises. 9.

(24) 2.3 Resolución. Adicional al rango dinámico, la resolución es la segunda característica responsable de la calidad de la presentación de la imagen y está relacionada con la cantidad de muestras que se toman de la misma, en su proceso de digitalización o discretización. A mayor número de muestras se obtiene una mejor resolución, pero se requiere una mayor cantidad de almacenamiento en memoria; por ello es necesario establecer un número óptimo de muestras dependiendo de la imagen de que se trate, de su tamaño y de la aplicación que tendrá En fotografía el tamaño del grano fija el límite y puede establecerse en 1µ (106m), Una buena impresora láser trabaja a 600 puntos por pulgada o más (aproximadamente 42 µ de espaciado). La resolución angular del ojo humano percibe un minuto de arco o 3/10000 radianes. Esto se debe a que la parte del cristalino del ojo que forma una imagen es de 3000 longitudes de onda de diámetro. Por ello para el material que se examina de cerca (aproximadamente a 30 cm.) la resolución permitida por el ojo es en el mejor de los casos 100 µ , es decir 104 m o 0.1 mm. Debido a lo anterior en sistemas de visión se han empleado con éxito resoluciones de 512 x 512, 256 x 256 y 64 x 64 muestras por imagen. En la figura 2.2 se pueden observar dos imágenes con diferente resolución.. Figura 2.2 Imágenes de diferente resolución.. 10.

(25) 2.4 Muestreo y cuantización El Dr. Rafael González [2.1] nos dice: "Para que sea adecuado el procesamiento de una imagen en computadora, la función de la imagen f(x, y) debe ser digitalizada tanto espacialmente como en amplitud. La digitalización de las coordenadas espaciales (x, y) es llamada muestreo de la imagen, mientras que la digitalización de la amplitud recibe el nombre de cuantización de niveles de gris." Un modo muy familiar de representar una función de dos dimensiones es una matriz rectangular, la conveniencia de este tipo de matriz para efectuar cálculos la hace indispensable. Se supone que una imagen continua f(x, y) se aproxima mediante muestras igualmente esparcidas colocadas en la forma de un arreglo N x M, donde cada elemento del arreglo es una cantidad discreta. /(0,0) ...... .f(O,l) ........ f(O,M -1) f(x,y) = /(1,0) ...... .f(l,l) ........ f(l,M -1). f. (N -1,0)/ (N -1,1)/ (N -1,M -1). El lado derecho de esta ecuación representa lo que comúnmente se le llama imagen digital. Cada elemento del arreglo es un elemento de la imagen, el cual recibe el nombre de elemento de imagen, "pixel" o "pel" y es muy empleado para denotar a los elementos de una imagen. El proceso de digitalización requiere decidir sobre los valores de N, M y los números de los niveles discretos de grises permitidos para cada pixel. O. O. 2. O. 5. 7. 3. O. 4. 6. o. o. o o. Figura 2.3 Representación de una imagen en una matriz, con valores en niveles discretos de gris entre O y 7.. ll.

(26) Es común en el procesamiento digital de imágenes que se asignen estas cantidades como potencias de dos, es decir. N. =. 2". y Donde G denota el número de niveles de gris. Suponiendo que los niveles discretos de la escala de grises estén igualmente espaciados entre O y G, el número de bits requeridos para almacenar una imagen digitalizada es: b. =. NxMxm;. Sí M = N. b = N2 m. Por ejemplo una imagen de 128 x 128 con 64 niveles (2 6 ) de grises requiere 98, 304 (128x128x6) bits de almacenamiento. Sin embargo, dependiendo de como se haya efectuado el proceso de digitalización de la imagen, sucede en ocasiones que la cantidad de información real es mucho menor que la cantidad de datos capturados . En este caso es muy importante considerar la posibilidad de emplear compresión de datos para tener cantidades más adecuadas de datos a fin de poder transmitirlas a través de los diferentes medios de comunicación. Por otra parte para un valor fijo de resolución espacial, la apariencia de una imagen puede mejorarse en muchos casos usando un esquema adaptivo donde el proceso de muestreo depende de las características de la imagen. Se requiere un muestreo fino en general para las vecindades entre las transiciones de niveles de gris de la figura, mientras que puede emplearse un muestreo grueso en regiones de suavidad relativa o relativamente homogéneas o similares en sus niveles de gris.. 2.5 Algunas relaciones básicas entre pixeles En la siguiente notación se emplean letras minúsculas (como p o q) para denotar a los pixeles. Se emplea S para indicar a un subconjunto de pixeles de la función f(x, y) que representa a una imagen. 2.5.1 Vecindad de un pixel Un pixel p en las coordenadas (x, y) tiene cuatro vecindades horizontales y verticales, cuyas coordenadas son: (x+1, y),. (x-1, y}, (x, y+1 ), (x, y-1). 12.

(27) A este conjunto de pixeles se le llama vecindad 4 de p y se denota por N4(p). Cada pixel está a una unidad de distancia de (x, y), y algunas vecindades de p están fuera de la imagen digital si (x, y) están en el borde de la imagen.. (x, Y+ l). (x-1,y). '. ~. .111. (x,y) p. (x+ l, y). (x, y-1). Figura 2.4 Vecindad - 4 de p N4(p). La vecindad diagonal de p tiene las coordenadas: (x+1, y+1 ),. (x-1, y-1 ), (x-1, y+1 ), (x-1, y-1). y se denota por No (p).. .. q•. ~"q. (X, y). p. cr. ~"q. Figura 2.5 Vecindad diagonal de p No (p).. Estos puntos junto con la vecindad 4 son llamados vecindad 8 de p, denotada por Na(P) 13.

(28) 2.5.2 Conectividad La conectividad entre pixeles es un concepto importante empleado para establecer fronteras de objetos y componentes de regiones en una imagen. Para establecer si dos pixeles están o no conectados, se debe determinar si son adyacentes en algún sentido (si son vecinos - 4) y si sus niveles de gris satisfacen un criterio especificado de similaridad (es decir sí son iguales). Por ejemplo, en una imagen binaria con valores O y 1, dos pixeles pueden ser vecinos - 4, pero se dice que no están conectados a menos que tengan el mismo valor. Se consideran 3 tipos de conectividad a) Conectividad - 4. Dos pixeles p y q con el mismo valor de nivel de gris V están conectados - 4 si q está en el conjunto N4(p) b) Conectividad - 8. Dos pixeles p y q con el mismo valor de nivel de gris V están conectados - 8 si q está en el conjunto N8 (p). c) Conectividad - m. Dos pixeles p y q con el mismo valor de nivel de gris V están conectados - m sí: 1) q está en N4(p), o 2) q está en No(P) y el vacío.. conjunto N4(p) n N4(q) es el conjunto. .q. q. (x. Y). ~"q. p. ......q Figura 2. 6. a) q. E. {. (x+1, y), (x-1, y), (x, y+1 ), (x, y-1)}. 14.

(29) 1. ... 3. q. -. [X, Y). p. -. -. ... ... 3. Figura 2. 6 b) q está en N0 (p) y el conjuntoN 4(p) n N4(q) está vacío. La conectividad mixta es una modificación de la conectividad - 8 y se introduce para eliminar las conexiones múltiples que suelen causar dificultades cuando se utiliza la conectividad - 8. Un pixel p es adyacente de un pixel q si ambos están conectados. Se puede definir la adyacencia -4, -8 o -m dependiendo de del tipo de conectividad especificada. Una trayectoria o camino desde un pixel p con coordenadas (x, y) a un pixel q con coordenadas (s, t) es una secuencia de pixeles distintos con coordenadas (xo, Yo),. (x1. Y1 ), .. . (x n, Y n). Donde: (Xo, Yo) = (x, y) , (x n, y n) = (s, t) , (xi, y¡) está conectado con (x i+1, y i+1 ), n ~ i ~ 1 y n es la longitud de la trayectoria. Si p y q son pixeles de un subconjunto S de una imagen, entonces p está conectado a q en S si existe una trayectoria de p a q formada enteramente por pixeles en S. Para cualquier pixel p en S, el conjunto de pixeles en S que está conectada a p es llamado componente conexo y este concepto es fundamentalmente importante en el análisis automatizado de imágenes. 2.5.3 Operaciones digitales binarias Algunas de las operaciones requeridas para las imágenes digitales, son la traslación, la rotación y la reflexión.. 15.

(30) TRASLACIÓN. La traslación de una imagen f(i, j) por un desplazamiento (k, 1), donde k y I son enteros, produce una nueva imagen digital f(i-k, j-1) . Esta representación no es tan sencilla de aplicar, debido a que deben considerarse ciertas acciones cuando hay localidades vacías o bien para los valores frontera que al desplazarse quedan fuera de la matriz original f(i, j). Como ejemplo se muestra en la figura 2.7, una letra digitilizada desplazada una unidad a la derecha.. 7. 7. 6. 6. s. s. 4. 4. 3. 3. 2. 2. . o. 1. 2. 3. 4. s. 6. 7. o. 8. Figura 2. 7 a ) Letra original. 1. 2. 3. 4. s. 6. 7. Figura 2.7 b) Letra traslada una unidad a la derecha. ROTACIÓN La rotación implica un desplazamiento de la figura, alrededor de un eje imaginario definido. Se tienen tres versiones básicas de rotación para múltiplos de 90°, representados por f(-j, i), f(-i, -j) y f(j, i) que corresponden a 90°, 180° y 270° respectivamente. En la siguiente figura se puede apreciar una rotación de 90° .. Figura 2.8 Rotación de 90° ( f(-j,i) ) 16.

(31) Cuando se desea rotar una figura en ángulos diferentes de múltiplos de 90°, es necesario aplicar otro tipo de técnicas como las de interpolación. REFLEXIÓN La reflexión implica considerar que existe un eje o espejo a partir del cual se reflejan los elementos de la imagen. Se consideran cuatro versiones básicas de reflexión: arriba/abajo, f(i,-j), izquierda/derecha, f(-i,j), NE/SO, fU,i) y NO/SE, f(-j,-i). Ejemplo:. Figura 2.9 Aplicando la función de reflexión f(i, -j). De igual manera que en la rotación, cuando se desean ejes arbitrarios para la reflexión es necesario considerar técnicas de interpolación para este efecto. 17.

(32) 2.6 Técnicas de interpolación En la práctica al digitalizar una imagen se obtiene un conjunto finito de muestras, que pueden verse como el número de celdas de muestra en unidades área, dentro de las fronteras de la función f (x, y) que representa a la imagen. Sin embargo, puede suceder que la transformación no esté del todo correcta o bien que las mediciones efectuadas estén incompletas. En este caso es posible determinar valores intermedios o puntos deseados empleando técnicas de interpolación. Desde Newton hasta Lagrange se han diseñado diversos algoritmos donde a partir de muestras originales es posible calcular valores intermedios, que dan como resultado curvas suaves para estimar ciertos valores faltantes. Los métodos de interpolación son muy variados debido a que su utilización depende de la función con que se va a trabajar, o bien de los valores tabulados. Por ejemplo, la interpolación polinomial nos permite dada una función o una sucesión de datos, encontrar un polinomio que nos asegure que evaluando esa sucesión de datos, el valor obtenido es igual a su valor original. La ventaja fundamental que esto representa es que es más fácil obtener el valor a través del polinomio, que a través de la función original o de los datos discretos. Algunos de los métodos de interpolación más adecuados para las imágenes de dos dimensiones son los siguientes:. 2.6.1 Interpolación del vecino más cercano Esta clase de interpolación inicia con muestras discretas f(i, J) y proporciona valores interpolados en cualquier punto (x, y) donde x y y varían de manera continua. Se aplica el principio de la interpolación lineal en una dimensión, donde para encontrar f(i + p), dada las muestras f(i) y f(i + 1), donde p es un VALOR entre O y 1, y se aplica: f(i + p) = (1 - p) f(i) + p f(i + 1). Si p tomara el valor exacto de cero o de uno, la fórmula toma un valor exacto de la muestra. En dos dimensiones se consideran las cuatro muestras de las esquinas de una unidad cuadrada en {i, j),(i+1,J), (i, j + 1), (i + 1, j + 1). A continuación puede asignarse el valor f(i + p, j + q) al punto obtenido del redondeo de i + p y j + q respecto a los enteros más cercanos. f(i + p, j + q) = (1 - p) (1 - q) f(i, j) + p (1 - q) f(i+1, j) +q(1-p) f(i, }+1) + p q f( i+1, }+1) 18.

(33) 2.6.2 Interpolación spline cúbica Las aproximación polinómica segmentaria más común usando polinomios cúbicos entre parejas sucesivas se llama interpolación spline cúbica [2.2) . Un polinomio cúbico general involucra cuatro constantes; así que hay suficiente flexibilidad en el procedimiento del trazador cúbico para garantizar no solamente que la interpolante sea continuamente diferenciable en el intervalo, sino que tenga también una segunda derivada continua. Dada una función f definida en [a, b) y un conjunto de números, llamados los nodos, a= Xo < X1 < ... < Xn = b, un interpolante spline cúbico, S, para f es una función que satisface las siguientes condiciones: a) S es un polinomio cúbico, denotado S¡, en el subintervalo [x¡, X¡+ 1] para cadaj= O, 1, ... , n -1; b) S (x¡) = f (x¡) para cadaj =O, 1, ... , n - 2; c) Sj+1 (x¡+1) = Sj(X¡+1) para cadaj=O, 1, ... , n - 2; d) Sj+1 (x¡+1) = Sj (x¡+1) para cada j =O, 1, ... , n - 2; e) S'j+1 (x¡+1) = S'j (x¡+1) para cadaj =O, 1, ... , n - 2; f) Se satisface una del siguiente conjunto de condiciones de frontera: S" (xo) = S"(xn) = O (frontera libre) S' (Xo) = (Xo) y S' (Xn) = f' (Xn) (frontera sujeta). r. Aunque los splines cúbicos pueden definirse con otras condiciones de frontera, las condiciones dadas arriba son suficientes. Cuando se satisfacen las condiciones de frontera libre, el spline se llama spline natural y su gráfica se aproxima a la forma que tomaría una varilla larga flexibe si se forzara a pasar por cada uno de los puntos de los datos {(><o, f (xo) ), (x1, f (X1) ), ... , (Xn, f (Xn) )}. En general, las condiciones de frontera sujeta nos llevaran a aproximaciones más exactas ya que incluyen más información acerca de la función; sin embargo, para que este tipo de condición a la frontera se implemente, es necesario tener, ya sea los valores de la derivada a los extremos, o una aproximación de estos valores. Los polinomios se formulan de modo que las conexiones entre las ecuaciones cúbicas separadas sean suaves. Si los polinomios se limitan al orden cúbico, no ocurren las violentas oscilaciones de las versiones de orden superior, produciendo un ajuste mucho más aceptable para los datos con abruptos cambios locales.. 19.

(34) CAPÍTULO 3 3.0 TRANSFORMADA DE FOURIER EN DOS DIMENSIONES. Una vez digitalizada la imagen es posible aplicar sobre ella diferentes técnicas para su análisis. Es posible analizar tanto sus componentes en tiempo, como en frecuencia; para esto último se ha utilizado con éxito la transformada de Fourier. A fin de poder dar una definición se mostrarán primero algunos conceptos que sirven como antecedente. Una secuencia de números n, en los cuáles SE~ denota a x(n) como el n-ésimo número de la secuencia, está escrito formalmente como: x = { x(n) ,. - oo < n. <. oo. }. Aunque esta secuencia no siempre surge de un muestreo analógico de la señal, se acostumbra llamar a x(n) como la n-ésima muestra de la secuencia. Para representar gráficamente una señal discreta en el tiempo se utiliza un tipo de gráficas como el siguiente: x(n). r. 156. -5 -4 -3 -2 -1 O 1 2 3. 7 8 9 10 11. 4. Figura 3.1 Representación gráfica de una señal discreta en tiempo. El concepto de señal discreta se refiere a que la función x(n) sólo está definida para valores enteros den y que x(n) simplemente no está definida para valores no enteros den.. 20.

(35) Se define una secuencia de muestra unitaria o(n), como una secuencia que tiene los siguientes valores:. 8(n). ={. 0,n ~ O. 1,n = O 3.1. 1. o Figura 3.2 Secuencia de muestra unitaria Esta secuencia de muestra unitaria tiene la misma función en señales y sistemas discretos en tiempo, que la función impulso en señales continuas. Se tiene diferentes tipos de secuencias: Una secuencia exponencial real es una secuencia cuyos valores son la forma a", como se muestra en la siguiente figura:. o. n. Figura 3.3 Función exponencial real. 21.

(36) Una secuencia senoidal tiene valores de la forma Acos(won+(j>) , donde A representa la amplitud de la señal, w0 representa la frecuencia de la señal y (j> la fase o desplazamiento de la misma, respecto al origen. A continuación se muestra un ejemplo de una señal senoidal:. o. n. Figura 3.4 Secuencia de forma senoidal.. Una secuencia exponencial compleja es de la forma:. Donde cr indica el desplazamiento de la señal respecto al origen, wo indica la frecuencia angular, expresada en radianes y j es la representación del término imaginario. Además una secuencia x(n) se define como periódica de periodo N si: x(n)=x(n+N) V n. 3.1. Una secuencia arbitraria se puede expresar como la suma de muestras unitarias a las que se les ha aplicado un retardo o un factor de escalamiento, lo cual de manera general se puede expresar como: C1J. x(n). = ¿x(k)o(n--k) k=-«>. 3.2. 22.

(37) Como ejemplo se muestra la siguiente secuencia, que puede verse como la suma de muestras unitarias, a las cuales se les ha aplicado un factor de retardo y escalamiento: x(n). ª1 ª-3 2. 7 n. -4. -3. -2. -1. 1. 3. 4. ª2. 5. 6. a1. Figura 3.5 Ejemplo de secuencia formada por muestras unitarias con retardo y escalamiento.. En este ejemplo, la secuencia x(n) puede expresarse como: x(n) = a_3 6(n+3) + a16(n-1) + a2(n-2) + a1(n-7). 3.1 Definición de la transformada de Fourier Así como es posible representar una señal discreta a través de funciones impulso con retardo y escala en tiempo, es posible tener una representación en términos de senoides o exponenciales complejas que permitan su representación en términos de la frecuencia, de gran utilidad en el procesamiento de señales. Suponga que tiene una señal continua que se ha discretizado, obteniéndose una secuencia discreta: { x(no), x(no + An), x(no + 2An), ... , x(no + [N - 1]An)} 3.3. 23.

(38) A través de tomar a N muestras separadas en L\n unidades, como se muestras en la figura 3.6.. x(n) = x(no + n L\n). 3 .4 Donde ahora n toma los valores discretos O, 1, 2, . . . N - 1; es decir las secuencias { x(O), x(1 ), x(2), ... , x(N - 1)} denotan a cualquier muestra N uniformemente espaciada a partir de la función continua correspondiente. x(n). x(no + 2An). x(n 0 + 3An) 1 1. :.. An. X(n 0 + (N - 1)An). ~. •. 1. 1 1 1 1. 1 1. 1 1 1 1. 1. no Figura 3.6 Señal continua discretizada. Un sistema se define matemáticamente como un operador o transformación único que mapea una secuencia de entrada x(n) a una secuencia de salida y(n) y se denota como: y(n)=T[x(n)] 3.5. Y puede representarse como se muestra en la figura 3.7:. x(n). J---•. ----•I~. - - - T - [_i__. y(n). Figura 3. 7 Representación de un sistema 24.

(39) Si se aplican restricciones a T[ ] es posible definir clases de sistemas discretos en tiempo, en particular los sistemas lineales e invariantes son de gran utilidad en el procesamiento de señales. Si se tienen x1(n) y x2(n) como entradas a un sistema y se obtienen Y1(n) y Y2(n) como respuestas, el sistema es lineal sí y sólo sí se cumple que : T[a x1(n)+b x2(n)]= a T[x1(n)] + b T[x2(n)] = a Y1(n) + b Y2(n) 3.6 Para constantes arbitrarias a y b. El hecho de que una secuencia arbitraria x(n) pueda representarse como una suma de retardos y escalamientos de secuencias de muestra unitarias, junto con la ecuación 3.6 sugieren que un sistema lineal también puede caracterizarse por completo empleando su respuesta de muestra unitaria. Sea hk(n) la respuesta a una muestra unitaria en n=k, definida como o(n-k), de la ecuación 3.2 se tiene: y(n)=. {tx(k)o(n-k)] 3.7. Empleando la ecuación 3.6, la expresión anterior se puede escribir como: co. «>. y(n) =. ¿. x(k)T[8(n-k)] = ¿x(k)hk(n). k=-«i. k=-«>. 3.8 De acuerdo a esta ecuación la respuesta al sistema se puede expresar como la respuesta del sistema a o(n - k); sin embargo si sólo se ha impuesto la linealidad, hk(n) dependerá tanto de n, como de k y eso disminuye su utilidad computacional. Para obtener resultados más útiles se aplica una restricción adicional llamada invarianza. Los sistemas invariantes se caracterizan por la propiedad de que si y(n) es la respuesta a x(n), entonces y(n-k) es la respuesta a x(n-k), donde k es un entero positivo o negativo. Cuando n está asociado con el tiempo, la invarianza corresponde a la invarianza en el tiempo. La propiedad de invarianza implica que si h(n) es la respuesta a o(n), entonces la respuesta de o(n - k) es simplemente h(n - k) y la ecuación 3.8 se convierte a: 25.

(40) y(n). "' = ¿x(k)h(n-k) k=-<CJ. 3.9 Entonces, cualquier sistema lineal invariante caracterizado por su respuesta a la muestra unitaria h(n).. está. completamente. De igual forma que las secuencias continuas se pueden representar por números de diferentes formas, también las señales discretas en tiempo pueden tener diferentes representaciones. Una propiedad fundamental de los sistemas lineales invariantes es su respuesta de estado estacionario, ya que si se aplica una entrada senoidal al sistema, se obtiene una respuesta senoidal de la misma frecuencia que la entrada, con amplitud y fase determinada por el sistema. Debido a esta propiedad la representación de la señal en términos de senoides o exponenciales complejas es de gran utilidad. Si se supone una secuencia de entrada definida por: x(n). =efwn. Para - oo < n < oo , es decir una exponencial compleja de frecuencia en radianes w, usando la ecuación 3. 9 se tiene:. L. "' y(n) = "' h(k)efw(n-k) = efwn "'f.h(k)e-fwk k=-CO. k=-CO. 3.10 Se define: "' H(e 1w) = ¿h(k)e-1w1c k=-<CJ. 3.11 Entonces la respuesta y(n) de la ecuación 3.1 O puede expresarse como :. 3.12. 26.

(41) H( eiw) es una función continua de w y periódica, de periodo 21t y por ello pue_de representarse en series de Fourier. De hecho la ecuación 3.10 expresa a H(eJW) en la forma de series de Fourier, donde los coeficientes de Fourier corresponden a la respuesta de la muestra unitaria h(n), con la observación de que h(n) puede ser evaluada a partir de H( eiw) por medio de la relación utilizada para obtener los coeficientes de Fourier de una función periódica, es decir:. h(n) = _l J,r H(eiw)eiwndw 21r -,r 3.13 Donde: "' H(eiw) = ¿h(n)e-jwn n=-a:>. 3.14 Esta ecuación tiene una interpretación adicional como una representación de la secuencia h(n). Específicamente es útil considerar a la ecuación 3.13 como una representación de la secuencia h(n) formada por una superposición de señales exponenciales cuya amplitud compleja está determinada por la ecuación 3. 14 . Por esta razon a las ecuaciones 3.13 y 3. 14 se les considera como el par de transformadas de Fourier para la secuencia h(n). Para una secuencia general x(n) se define la transformada de Fourier como:. X(eiw). "' = ¿x(n)e-jwn n=-«>. 3.15 Donde w es una frecuencia expresada en radianes. La transforma de Fourier inversa se define como:. 3.16 El hecho de que una secuencia pueda representarse como una superposición de exponenciales complejas es de gran utilidad debido a que en los sistemas invariantes la respuesta a la aplicación de la exponencial compleja está completamente determinada por la respuesta en frecuencia. Hoy en día la transformada de Fourier es ampliamente utilizada en muchas áreas de Física y en otras ciencias, particularmente como una forma para analizar 27.

(42) problemas que surgen en el procesamiento de señales electrónicas, en óptica y en la solución de ecuaciones diferenciales. El desarrollo en los años 60's del algoritmo llamado transformada rápida de Fourier (FFT) abrió la posibilidad de un amplio uso de la transformada de Fourier en la física computacional y en muchas otras áreas de física y matemáticas. Muchas de las computadoras utilizadas para la física computacional son evaluadas principalmente por su capacidad para ejecutar algoritmos de transformada rápida de Fourier. Los algoritmos de la transformada rápida de Fourier están actualmente sistemas de incluidos en un amplio rango de tecnologías modernas como imágenes médicos, sismología, redes telefónicas y líneas de telecomunicaciones. Aunque los teoremas de Fourier para las diferentes transformadas que llevan su nombre son más familiares en una dimensión, es muy importante mostrar una representación de dos dimensiones que sea factible de aplicar a señales o imágenes que para nosotros están representadas en dos dimensiones. Para su determinación se aplica el teorema de que cualquier función física que varíe periódicamente en el tiempo a una frecuencia f, se puede expresar como una superposición de componentes senoidales de frecuencias f, 2f, 3f, 4f, etc., por lo que es posible aplicar la técnica de solución de problemas divide y vencerás para analizar una imagen mediante senoides espaciales que corren en varias direcciones con diferentes longitudes de onda.. 3.2 Los componentes de fourier en dos dimensiones. Para esta definición cambiaremos un poco la notación, debido a que una imagen en dos dimensiones puede representarse como una función f(x,y). La transformada de Fourier en dos dimensiones F(u, v) de una función en dos dimensiones f(x, y) está definida por: F(u, v) = ["'["'f(x,y)e- 121r<mvy)dxdy. 3.17. Las funciones de la forma exp [-j21t(ux+vy)] ,dependen de la elección de u y v 28.

(43) La exponencial puede descomponerse en dos términos: ces [2n(ux+vy)] y sen [2n(ux+vy)] 3.18 o en cuatro términos ces 21t ux Ces 21t vy,. sen 21t ux Sen 21t vy. sen 21t ux Ces 21t vy,. ces 21t ux Sen 21t vy 3.19. Para funciones f(x,y) que son simétricas en los ejes x y, es posible aplicar para su análisis funciones de la forma: ces 2n ux ces 21t vy 3.20 Es decir, a partir de la ecuación 3.17 se puede representar:. F(u, v) =([..,f(x,y)Cos2m,xCos2m,ydxdy Y su transformada inversa: 3.21. f(x,y). =([.., F(u, v)Cos2nxuCos21l)'vdudv. En general, para funciones no simétricas se necesitarían términos adicionales expresados por las siguientes dos expresiones estándar, llamadas par de transformadas de Fourier:. F(u, v) = [..,[..,f(x,y)e- 121r(w:+".Y)dxdy. f(x,y). = [..,[.., F(u, v)e 121r(xu.yv>dudv 3.22. 29.

(44) 3.3 La transformada discreta de fourier en dos dimensiones: Considerando que es posible representar a una imagen de dos dimensiones empleando una función matriz [f], escrita como una matriz N X M:. [!] =. f (0,0).... f (0,1) .. .. /(1,0).... /(1,1) .. .. [ f(N-1,0). f(O,M -1) ] f(N-1),M-1. Se definen tanto la transformada de Fourier discretas (DFT) y la transformada Inversa Discreta de Fourier (DhFT) en dos dimensiones empleando la notación de sumatoria de la siguiente forma: F(u, v). 1. M-JN-1. MN. x=Oy=O. =-. ¿ ¿ f (x,y) exp[- j21r(ux / M + vy / N)] 3.23. Para u = O, 1, 2, ... , M-1, v= O, 1, 2, ... , N-1. y M-1N-1. f(x,y) = ¿¿F(u, v)exp[J21r(uxl M + vy/ N)] u=O v=O. 3.24 Para x = O, 1, 2, ... , M-1 y y = O, 1, 2, ... , N-1. El muestreo de una función continua está ahora en una malla de dos dimensiones, con divisiones de ancho Lix en el eje x y Liy en el eje y. Como en el caso de una dimensión, la función discreta f(x,y) representa muestras de la función. f(xo+x.::ix, Yo+y.::iy) para x = O, 1, 2, ... , M-1 y y = O, 1, 2, ... , N-1. En forma análoga esto se aplica a F(u,v). Los incrementos de muestreo en los dominios del espacio y frecuencia están relacionados por las siguientes expresiones: 1 Liu = - M!!.x. 3.25 y. 30.

(45) 1. L\v=-NL\y. 3.26 Cuando se muestrea la imagen a través de una matriz cuadrada N X N, las ecuaciones 3.23 y 3.24 [3.1] se convierten a: }. F(u, v) = N. N-IN-1. ¿ ¿ f (x, y) exp[- j21r(ux + ry )! N] x=O y=O. 3.27 Para u, v = O, 1, 2, ... , N-1 } N-IN-1. f(x,y). =-. N. ¿¿F(u, v)exp[¡21r(ux+ry)! N] u=O v=O. 3.28 Para X, y= O, 1, 2, .... 1. N-1. En la práctica muchas de las imágenes se digitalizan en matrices cuadradas, por lo que estas dos últimas ecuaciones (3.27 y 3.28) se emplean con frecuencia. La transformada discreta de Fourier en dos dimensiones posee propiedades muy útiles que se aprovechan en el desarrollo de algoritmos del procesamiento de imágenes. Algunas de las propiedades más importantes son:. a)Simetría del conjugado respecto al origen. La transformada discreta de Fourier en dos dimensiones tiene el mismo valor para su simétrico conjugado, es decir F(u, v) = F·(-u, -v) 3.29 Siempre y cuando f(x, y) sea real. I F(u, v) 1 = 1 F(-u, -v)I. b) Propiedad de Traslación Las propiedades de traslación del par de transformadas de Fourier son: 31.

(46) f(x,y) exp U21t(UoX+Voy)/N] <:::> F(U-Uo, V - Vo) 3.30 y f(x - Xo, y - Yo)<:::> F(u,v) exp [-j21t(UXo+VYo)/N] 3.31 Donde la doble flecha indica la correspondencia, en ambos sentidos, entre una función y su transformada de Fourier. Si se eligen u0 = v 0 = N/2 se tiene exp U21t(UoX+VoY)/N ]. =e i21t(x+y) =(-1 t+y. Por lo que: f(x,y) (-1 t+y <:::> F(u-N/2, v-N/2) 3.32 De esta forma el origen de la transformada de Fourier de f(x,y) se puede mover al centro del cuadrado de frecuencia N X N correspondiente, simplemente multiplicando f(x,y) por (-1 t+y Debe notarse que un corrimiento en f(x,y) no afecta la magnitud de la transformada de Fourier, es decir I F(u, v) exp [-j21t(UXo+Vyo)/N] 1. =1 F(u, v) 1 3.33. e) Periodicidad La transformada discreta de Fourier y su inversa son periódicas, con periodo N, esto es: F(u,v). =F(u+N, v) =F(u, v+N) =F(u+N, v+N) 3.34. d) Rotación Empleando las coordenadas polares: X=. r. COS (). u= ú) cos. y= r sen B. <p. v = w sen. </J. entonces f (x, y) y F (u, v) se convierten en f(r, B) y F (m, </J), respectivamente.. 32.

(47) Empleando una sustitución directa, aún se conserva la relación entre el par de transformadas discretas o continuas de Fourier:. f(r, e+ lb) <::::> F( 01, ifJ + lb). 3.35 Es decir, si se rota un ángulo 80 a f(x, y), también se rota a F(u, v) en el mismo ángulo. En forma similar la rotación de F(u, v) en un ángulo, rota a f(x, y) el mismo ángulo.. e ) Propiedad distributiva El par de transformadas de Fourier, tanto continua como discreta, es distributiva para la suma:. 3 {!1(x, y)+ h(x, y)}= 3{f1(x, y)} +3 {h{(x, y)} 3.36 pero no es distributiva para la multiplicación:. 3{J1(x, y)· h(x, y)}* 3{f1(x, y)} · 31/2{(x, y)} 3.37. f ) Escalamiento Para dos escalares a y b.. af(x, y) <::::> aF(u, v) 3.38 y 1. f (ax, by)<::::> labl F(u / a, v / b) 3.39. 33.

(48) g ) El valor promedio Una definición ampliamente usada de la función discreta de Fourier en dos dimensiones es la expresión:. }. N-1 N-l. ](x,y)= N 2 ~~J(x,y) Sustituyendo. 3.40. u = v = O se tiene }. N-1 N-l. N. x=O y=O. F(0,0)= - ¿¿J(x,y). 3.41. Despejando las sumatorias en estas dos últimas ecuaciones se obtiene:. ](x,y}= __!__F(o,o) N. 3.40. 3.4 La transformada rápida de fourier El número de sumas y de multiplicaciones complejas requerido para aplicar la ecuación 3.15 es del orden N2 . Es decir, para cada uno de los N valores de u, la expansión de la sumatoria requiere N multiplicaciones complejas de f(x) por exp[-j2m1x/N] y N-1 sumas de los resultados. Sin embargo, la ecuación 3.15 puede descomponerse apropiadamente para lograr que el número de operaciones de suma y multiplicación sea proporcional a Nlog 2N y a este procedimiento se le llama algoritmo de transformada rápida de Fourier. Esta reducción en el número de operaciones tiene como consecuencia un ahorro significativo en cálculos computacionales. Por ello la transformada rápida de Fourier se convirtió en uno de los algoritmos aritméticos más ampliamente usados en muchas áreas entre las que se destacan el procesamiento digital de señales. La estrategia general que aplica este algoritmo es la técnica divide y vencerás. Este algoritmo toma la ventaja del hecho de que un polinomio de grado N - 1 está determinado completamente por sus valores en N puntos diferentes. Cuando se multiplican dos polinomios juntos de grado N -1, se obtiene un polinomio de grado 34.

(49) 2N - 2. Si se pueden encontrar los valores del polinomio en 2N - 1 puntos, se considera determinado completamente, pero podemos encontrar el valor de los resultados en cualquier punto, simplemente evaluando los dos polinomios a ser multiplicados en un punto, y entonces multiplicar esos dos números.. Esto conduce al siguiente esquema general para la multiplicación de dos polinomios de grado N - 1:. o Evalúa los polinomios de entrada en 2N - 1 puntos distintos o Multiplica los valores obtenidos en cada punto o Interpola para encontrar el resultado único del polinomio que tiene el valor dado en los puntos dados Veamos este algoritmo primero en una sola variable, recordando que la transformada de Fourier de dos dimensiones puede obtenerse a partir de la transformada en una dimensión. Sea la ecuación 1 N-1. F(u)= - ¿J(x)exp[- j21ruxl N] N x=O. 3.41. Si. WN. = exp[-j2n/N] 3.42. La ecuación anterior puede representarse como: 1. N-1. N. x=O. F(u)= - ¿J(x)wNux. Donde N es de la forma N expresarse como:. = 2n. y. 3.43. n es entero positivo, por lo que N puede. N=2M. donde M es también un entero positivo. Sustituyendo N = 2M en la ecuación 3.41 se tiene:. 35.

(50) }. 2M-I. F(u)=- ¿J(x)v2: 2M. .r=O. =_!_[_l I:J(2x)w~2x) +-1 ~J(2x+l)W2~2x+l)J· 2 M. M. x=O. 3.44. x=O. De la ecuación 3.42 se tiene 2ux W2M. -W:ux M. Por lo que la ecuación 3.44 se puede expresar como: } [. }. M-1. }. M-1. .r=O. M. x=O. ]. F(u)= - -¿J(2x)v,: +-¿J(2x+1)v,:wi:w . 2 M. 3.45. Definiendo }. M-1. 3.46. Fpar(u)= -¿J(2x)v,: M. x=O. para u = O, 1, 2, ... , M - 1 y. }. M-1. ¿ f (2x + 1)v,: M. F°;nrpar (u)= -. 3.47. x=O. para u = O, 1, 2, ... , M - 1 Entonces la ecuación 3.45 se reduce a:. 3.48. También debido a que. w:. -wuM. u+M M -. 36.

(51) Ya que u+M _ -Wu W2M 2M. La ecuación 3.48 puede expresarse como: 3.49. Este tratamiento revela cosas interesantes: una transformada de N-puntos puede calcularse dividiendo la expresión original en dos partes, los cálculos de la primera mitad de F(u) requiere evaluar las dos transformadas de (N/2) puntos dadas en las ecuaciones 3.46 y 3.47. Los valores resultantes de Fpar (u) y de Fimpar(u),entonces se sustituyen en la ecuación 3.48 para obtener F(u) para u= O, 1,2, ... (N/2 - 1). La otra mitad se obtiene directamente de la ecuación 3.4 7 sin evaluaciones adicionales de la transformada. El número de operaciones de sumas y multiplicaciones requeridas para aplicar el algoritmo FFT es: m(n). = 1/2 2" 1092 2" = 1/2 N 1092 N. Donde N es una potencia entera de 2. y. a(n) = 2" log 2" = Nlog2N. n>=1. 3.5 Algoritmo computacional Suponiendo que está disponible el tipo complejo (complex) en el compilador, el algoritmo descrito anteriormente puede construirse en el lenguaje C, en forma recursiva. Se requiere definir los valores de las raíces complejas unitarias. 37.

(52) Se sabe que:. wt. = cos(2º) _!!)_ + i sen (2º) _!!)_ N+l. N+l. Se puede construir una rutina que calcule el arreglo w utilizando las funciones trigonométricas convencionales, donde N+1 debe ser potencia de dos.. Entonces puede definirse el algoritmo: fft(complex p[], int N, int k). { int i,j if (N==1) { pO=p[k]; p1 =p[k+1 ]; p[k] = pO + p1; p[k+1] = p0-p1; } else { for (i==O; i<= N/2; i++) { j=k+2*i; t[i] = pU]; t[i+1 +N/2] = p0+1 ]; } for (i=O; i<=N; i++) p[k+i] = t[i]; fft(p, n/2, k) fft(p,N/2,(k+1 +N)/2]; j = (outN+1 )/(N+1 ); for (i=O;i<=N/2; i++) { pO = w[i*j]*p[k+(N/2)+1 +i]; t[i] = p[k + 1] + pO; t[i + (N/2)+1] = p[k+i]-pO; } for (i = O; i <=N; i++) p[k+i] = t[i]; } }. Donde el arreglo p[ ] contendrá al final los coeficientes característicos de la transformada de Fourier en una dimensión.. 38.

Referencias

Documento similar

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

por unidad de tiempo (throughput) en estado estacionario de las transiciones.. de una red de Petri

Missing estimates for total domestic participant spend were estimated using a similar approach of that used to calculate missing international estimates, with average shares applied

We have created this abstract to give non-members access to the country and city rankings — by number of meetings in 2014 and by estimated total number of participants in 2014 —

Por lo tanto, en base a su perfil de eficacia y seguridad, ofatumumab debe considerarse una alternativa de tratamiento para pacientes con EMRR o EMSP con enfermedad activa

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,