UNIVERSIDAD NACIONAL DE PIURA

(1)

1

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE CIENCIAS

ESCUELA PROFESIONAL DE INGENIERIA ELECTRÓNICA Y TELECOMUNICACIONES

TESIS

“IMPLEMENTACIÓN DE UN SISTEMA DE MEDICIÓN PARA EL ESTUDIO DEL MOVIMIENTO PARABOLICO UTILIZANDO

VISION ARTIFICIAL”

PRESENTADA POR:

RABANAL RABANAL ELI ALBERTO

PARA OPTAR EL TITULO PROFESIONAL DE:

INGENIERO ELECTRÓNICO Y TELECOMUNICACIONES

Línea de investigación:

Informática, Electrónica y Telecomunicación Sub Línea de Investigación

Sistemas Digitales

Piura, Perú

2020

(2)

2

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE CIENCIAS

ESCUELA PROFESIONAL DE INGENIERÍA ELECTRÓNICA Y TELECOMUNICACIONES

“IMPLEMENTACIÓN DE UN SISTEMA DE MEDICIÓN PARA EL ESTUDIO DEL MOVIMIENTO PARABOLICO UTILIZANDO VISION

ARTIFICIAL”

Línea de investigación:

Sistemas Digitales

(3)

3

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE CIENCIAS

ESCUELA PROFESIONAL DE INGENIERIA ELECTRÓNICA Y TELECOMUNICACIONES

“IMPLEMENTACIÓN DE UN SISTEMA DE MEDICIÓN PARA EL ESTUDIO DEL MOVIMIENTO PARABOLICO UTILIZANDO VISION

ARTIFICIAL”

Línea de investigación:

Sistemas Digitales

APROBADA POR:

JURADO:

PRESIDENTE

(4)

4

(5)

5

DECLARACIÓN JURADA DE AUTENTICIDAD DE TESIS

Yo: Eli Alberto Rabanal Rabanal, identificado con CU/DNI N.º 73499101 Bachiller de Escuela Profesional de Ingeniería Electrónica y Telecomunicaciones, de la Facultad de Ciencias y domiciliado en calle Ramon Castilla AA. HH Miguel Grau Etapa II Mz N Lote 33 del Distrito Piura Provincia Piura Departamento Piura Celular: 999 533 634 Email:

[email protected]

DECLARO BAJO JURAMENTO: que la tesis que presento es auténtica e inédita, no siendo copia parcial ni total de una tesis desarrollada, y/o realizada en el Perú o en el Extranjero, en caso contrario de resultar falsa la información que proporciono, me sujeto a los alcances de lo establecido en el Art. N.º 411, del código Penal concordante con el Art. 32º de la Ley N.º 27444, y Ley del Procedimiento Administrativo General y las Normas Legales de Protección a los Derechos de Autor.

En fe de lo cual firmo la presente.

Piura 30 marzo del 2020

Artículo 411.- El que, en un procedimiento administrativo, hace una falsa declaración en relación a hechos o circunstancias que le corresponde probar, violando la presunción de veracidad establecida por ley, será reprimido con pena privativa de libertad no menor de uno ni mayor de cuatro años.

Art. 4. Inciso 4.12 del Reglamento del Registro Nacional de Trabajos de Investigación para optar grados académicos y títulos profesionales –RENATI Resolución de Consejo Directivo Nº 033-2016-SUNEDU/CD

………

DNI N.º 73499101

(6)

6

DEDICATORIA

Esta tesis la dedico a mi madre la Sra. Aurora Rabanal Chávez, que estuvo siempre a mi lado brindándome su mano amiga, dándome a cada instante una palabra de aliento para llegar a culminar mi profesión

Compartir con mi madre y disfrutar a su lado momentos únicos, es uno de las mayores muestras del amor de Dios hacia mi vida, esta gran bendición es una de las más importantes para la vida de toda persona, poder vivir, crecer y disfrutar al lado de la persona que te trajo a la vida… eso es simplemente hermoso, ignorado por algunos, tal vez; pero esto no quita méritos o belleza a todos esos hermosos momentos que pueden comprender el disfrutar a tu madre.

(7)

7

AGRADECIMIENTO

En primer lugar, agradezco por todo el apoyo brindado desde muy pequeño a mi madre que es mi mayor motivo para realizar todo esto y mis metas, deseo expresar mi agradecimiento al asesor de esta tesis, por la dedicación y apoyo que ha brindado a este trabajo, por el respeto a mis sugerencias e ideas y por la dirección y el rigor que ha facilitado a las mismas. Gracias por la confianza ofrecida desde que llegué a esta facultad.

Así mismo, agradezco a mis compañeros por su apoyo personal y humano, con quien he compartido proyectos e ilusiones durante estos años. Un trabajo de investigación es siempre fruto de ideas, proyectos y esfuerzos previos que corresponden a otras personas.

En este caso mi más sincero agradecimiento a mi asesor Mg. Juan Manuel Jacinto Sandoval con quien estaré siempre en deuda. Gracias por su amabilidad para facilitarme, su tiempo y sus ideas. Por su orientación y atención a mis consultas sobre metodología, mi agradecimiento.

Pero un trabajo de investigación es también fruto del reconocimiento y del apoyo vital que nos ofrecen las personas que nos estiman, sin el cual no tendríamos la fuerza y energía que nos anima a crecer como personas y como profesionales. Gracias a mi familia, a mi madre, porque con ellos compartí una infancia feliz, que guardo en el recuerdo y es un aliento para seguir escribiendo sobre la infancia. Gracias a mis amigos, que siempre me han prestado un gran apoyo moral y humano, necesarios en los momentos difíciles de este trabajo y esta profesión sin su apoyo este trabajo nunca se habría escrito y, por eso, este trabajo es también es el suyo. A todos, muchas gracias.

(8)

8

ÍNDICE GENERAL

I. ASPECTOS DE LA PROBLEMATICA ... 16

I.1. DESCRIPCIÓN DE LA REALIDAD PROBLEMÁTICA. ... 16

I.2. JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN ... 16

I.3. OBJETIVOS ... 17

I.4. DELIMITACIÓN DE LA INVESTIGACIÓN... 17

II. MARCO TEORICO ... 19

II.1. ANTECEDENTES DE LA INVESTIGACIÓN ... 19

II.2. BASES TEÓRICAS ... 22

II.2.1. FUNDAMENTO TEORICO ... 22

II.2.2. MOVIMIENTO DE PROYECTIL ... 22

II.2.3. TIPOS DE MOVIMIENTO ... 24

II.2.4. VISION ARTIFICIAL ... 27

II.2.5. PROCESAMIENTO DE IMAGENES ... 27

II.2.6. LA IMAGEN DIGITAL ... 28

II.2.7. DISPOSITIVOS DE CAPTURA DE IMÁGENES ... 28

II.2.8. IMÁGENES BLANCO/NEGRO Y COLOR ... 31

II.2.9. RESOLUCIÓN ESPACIAL Y EN AMPLITUD ... 32

II.2.10. REPRESENTACIÓN DE IMÁGENES DIGITALES ... 33

II.2.11. PROCESAMIENTO Y ANALISIS DE IMÁGENES DIGITALES ... 34

II.2.12. PROCESAMIENTO BASICO DE IMÁGENES ... 34

II.2.13. TRANSFORMACIÓN DE VECINDAD ... 38

II.2.14. OPERACIONES DE FILTRADO ... 41

II.2.15. HISTOGRAMA ... 42

II.2.16. OPERACIONES MORFOLÓGICAS. ... 43

II.2.17. DILATACIÓN Y EROSIÓN. ... 43

II.2.18. EROSION BINARIA ... 44

II.2.19. DILATACIÓN BINARIA ... 45

II.2.20. ESPACIOS DE COLORES Y COLORIMETRÍA ... 45

II.2.21. MOMENTOS INVARIANTES DE HU ... 49

II.2.22. OpenCV ... 50

II.3. GLOSARIO DE TÉRMINOS BÁSICOS ... 53

II.4. HIPÓTESIS ... 55

III. MARCO METODOLÓGICO ... 56

(9)

9

III.1. MÉTODOS Y PROCEDIMIENTOS ... 56

III.1.1. DESCRIPCIÓN DEL PROYECTO ... 56

III.1.2. SOFTWARE DE DESARROLLO ... 58

III.1.3. METODOLOGÍA ... 58

IV. RESULTADOS Y DISCUSIÓN ... 71

IV.1. RESULTADOS ... 71

IV.2. DISCUSIÓN ... 75

CONCLUSIONES ... 76

RECOMENDACIONES ... 78

REFERENCIAS BIBLIOGRÁFICAS... 79

ANEXOS ... 80

(10)

10

ÍNDICE DE FIGURAS

FIG.N°1TRAYECTORIA PARABÓLICA DE UN PROYECTIL QUE SALE DEL ORIGEN CON VELOCIDAD VI.EL VECTOR VELOCIDAD V CAMBIA CON EL TIEMPO TANTO EN MAGNITUD COMO EN DIRECCIÓN.ESTE CAMBIO ES EL RESULTADO DE LA ACELERACIÓN EN LA DIRECCIÓN Y NEGATIVA.LA COMPONENTE X DE VELOCIDAD PERMANECE CONSTANTE EN EL TIEMPO PORQUE NO HAY ACELERACIÓN A LO LARGO DE LA DIRECCIÓN HORIZONTAL.LA COMPONENTE Y DE VELOCIDAD ES CERO EN EL PICO DE

LA TRAYECTORIA... 23

FIG.N°2CAPTURA DE UNA IMAGEN 3D POR UN DISPOSITIVO CCD ... 30

FIG.N°3FIGURA DEL ÁRBOL CAPTURADA POR UNA CÁMARA CON 4X4 SENSORES DE INTENSIDAD ... 31

FIG.N°4CUATRO REPRESENTACIONES DE LA MISMA IMAGEN CON VARIACIÓN ... 32

FIG.N°5REPRESENTACIONES DE LA MISMA IMAGEN CON VARIACIÓN EN EL NÚMERO ... 33

FIG.N°6CONVENCIÓN DE EJES UTILIZADA PARA LA REPRESENTACIÓN ... 34

FIG.N°7FUNCIONES DE PUNTO Y VECINDAD... 35

FIG.N°8OPERACIÓN INDIVIDUAL ... 36

FIG.N°9REPRESENTACIÓN DEL OPERADOR IDENTIDAD ... 37

FIG.N°10REPRESENTACIÓN DEL OPERADOR INVERSO... 37

FIG.N°11REPRESENTACIÓN DEL OPERADOR UMBRAL ... 38

FIG.N°12TRES NÚCLEOS REPRESENTATIVOS DE FILTROS PASO BAJO ... 41

FIG.N°13TRES NÚCLEOS REPRESENTATIVOS DE FILTROS PASO ALTO ... 42

FIG.N°14HISTOGRAMA ... 42

FIG.N°15OPERACIÓN MORFOLÓGICA DE UN ELEMENTO ESTRUCTURANTE S[U,V] SOBRE ... 43

FIG.N°16MODELO ADITIVO RGB ... 48

FIG.N°17MODELO HSV... 49

FIG.N°18LOGO OPENCV ... 51

FIG.N°19MOVIMIENTO SEMIPARABÓLICO ... 57

FIG.N°20ELEMENTOS DEL SISTEMA A IMPLEMENTAR ... 57

FIG.N°21ESQUEMA DE FUNCIONAMIENTO DEL SISTEMA ... 59

FIG.N°22CAPTURA DE UN FOTOGRAMA DEL VIDEO DE LA ESCENA ... 61

FIG.N°23MARCAS SUPERIOR E INFERIOR DE COLOR VERDE PARA MEDIR LA ALTURA ... 61

FIG.N°24IMAGEN BINARIZADA – MARCAS COLOR VERDE ... 63

FIG.N°25 IMAGEN BINARIZADA – PROYECTIL COLOR ROJO ... 64

FIG.N°26DELIMITACIÓN DEL ÁREA DE TRABAJO... 65

FIG.N°27HALLANDO LA ALTURA EN PÍXELES ... 67

FIG.N°28HALLANDO LA ALTURA EN CENTÍMETROS ... 68

FIG.N°29HALLANDO TIEMPO Y DISTANCIA ... 70

FIG.N°30IMAGEN OBTENIENDO LA ALTURA ... 71

FIG.N°31IMAGEN POSICIÓN INICIAL DE LA ESFERA ... 72

(11)

11

FIG.N°32IMAGEN SIGUIENDO TRAYECTORIA 1 ... 72

FIG.N°33IMAGEN SIGUIENDO TRAYECTORIA 2 ... 73

FIG.N°34IMAGEN OBTENIENDO POSICIÓN FINAL ... 73

FIG.N°35IMAGEN INICIAL CON MEDICIÓN DE ALTURA ... 80

FIG.N°36IMAGEN INICIAL DEL RECORRIDO DE LA ESFERA ... 80

FIG.N°37IMAGEN DEL RECORRIDO DE LA ESFERA EN OTRO TIEMPO ... 81

FIG.N°40IMAGEN DEL RECORRIDO FINAL DE LA ESFERA, SE OBTIENE TIEMPO Y DISTANCIA ... 82

(12)

12

ÍNDICE DE ANEXOS

ANEXO N°1RESULTADOSENIMÁGENESDELPROCESADODEMEDICIÓNDELSISTEMA ... 80

ANEXO N°2INSTALARPYTHON ... 83

ANEXO N°3INSTALAROPENCV... 84

ANEXO N°4CÓDIGODELPROGRAMAENPYTHONPARADETECTARLOSCOLORES ... 85

ANEXO N°5CÓDIGODELPROGRAMAENPYTHON ... 87

(13)

13 RESUMEN

En el presente proyecto se desarrolla y se implementa un sistema de medición para el estudio del movimiento parabólico de caída libre utilizando visión artificial.

Hay diferentes variables que intervienen en este movimiento, tanto para el movimiento rectilíneo uniforme y el movimiento parabólico de caída libre.

Para dar solución a la medición y comprobación experimental tanto de las variables como de las fórmulas, se pensó en esta propuesta de visión artificial.

El sistema a implementar consta de una cámara webcam, con conexión usb, de medianas prestaciones, como es 30 cuadros por segundo, la resolución en HD de 1 megapíxel, ésta conectada a un sistema digital, como es una computadora personal o una laptop, con su respectivo software hecho con el lenguaje de programación Python, ejecutándose o corriendo sobre cualquier sistema operativo, como Windows o Linux.

En la escena del proyecto, interviene una esfera, un soporte que puede deslizarle para las diferentes alturas que se requiera estudiar. En este soporte se pondrán unas marcas de color para poder medir automáticamente la altura. La esfera también será de un determinado color para poderla procesar y obtener los datos que se necesitan.

Para el procesamiento se realizará, como se dijo, empleando el lenguaje de programación Python, juntamente con las librerías de visión por computadora OpenCv, que facilitan en gran medida el procesamiento. Como se sabe, Python es un lenguaje de programación de licencia libre, no cuesta, por lo tanto, cualquier alumno que quiera experimentar puede hacerlo.

Vision Artificial, Python, movimiento parabólico, caída libre, OpenCv.

(14)

14 ABSTRACT

In the present project a measurement system is developed and implemented for the study of parabolic movement of free fall using artificial vision.

There are different variables involved in this movement, both for the uniform rectilinear movement and the free fall parabolic movement.

To solve the experimental measurement and verification of both the variables and the formulas, this artificial vision proposal was considered.

The system to be implemented consists of a webcam camera, with USB connection, of medium performance, such as 30 frames per second, the resolution in HD of 1 megapixel, this connected to a digital system, such as a personal computer or a laptop, with its respective software made with the Python programming language, running or running on any operating system, such as Windows or Linux.

In the project scene, a sphere is involved, a support that can slide you to the different heights that you need to study. Color marks will be placed on this support to automatically measure the height. The sphere will also be of a certain color to be able to process it and obtain the data that is needed.

For processing it will be done, as stated, using the Python programming language, together with the OpenCv computer vision libraries, which greatly facilitate the processing. As is known, Python is a free license programming language, it does not cost, therefore, any student who wants to experience can do so.

Artificial Vision, Python, trajectory of a mobile, OpenCv.

(15)

15

INTRODUCCIÓN

Los Laboratorios Computarizados se utilizan en la enseñanza de Física desde hace más de 30 años. En estos laboratorios, los estudiantes pueden registrar de forma automática medidas de una amplia gama de magnitudes físicas: fuerza, velocidad, temperatura, presión sonora, campo magnético, etc. Incluso es posible trabajar con las señales adquiridas en tiempo real.

La enseñanza, si es de calidad, es en su mayor parte una actividad planificada y consciente, con unos objetivos generales claros. Esto no quiere decir que no haya margen de improvisación o de libertad de cátedra, sino que cualquier hecho, actividad, situación o cambio, puede y debe generar una oportunidad de aprendizaje para el alumno. Y esto desborda los límites de la propia especialidad de cada profesor. Así, en cada uno de los pasos de la experiencia que se presenta, se muestran multitud de posibilidades de aprendizaje y de relación con otras materias.

Uno de los campos con mayor desarrollo es el de la Visión por Computador o Visión Artificial, con numerosas aplicaciones en ámbitos tan diferentes como la Robótica, el diseño de productos, el control de calidad, la Biomecánica o el desarrollo de videojuegos y la Realidad Aumentada.

Hay evidencias de que el uso de nuevas tecnologías para el registro automático de señales supone una mejora en la enseñanza de la Física, ya que amplía las posibilidades de realizar experimentos, adquirir datos y proporciona una nueva forma interactiva de interpretar los resultados.

(16)

16

I. ASPECTOS DE LA PROBLEMATICA

I.1. DESCRIPCIÓN DE LA REALIDAD PROBLEMÁTICA.

Una de las estrategias, en la enseñanza de la Física, es el trabajo experimental, el cual se convierte en una herramienta fundamental a la hora de enseñar. La importancia de la actividad experimental radica principalmente en que brinda la posibilidad de corroborar, en algunos casos, de manera sencilla y de forma adecuada, muchos de los fenómenos físicos que se estudian en la teoría y además permite que los estudiantes puedan enfrentarse al aprendizaje de la física no desde lo abstracto de la ciencia sino desde una perspectiva enfocada en algo real y cotidiano.

La enseñanza de la física se ha convertido con el pasar de los años en un reto para los docentes, situación que puede deberse a la falta de interés y el sentimiento de apatía que causa en los estudiantes solo escuchar la palabra

“física”.

Este reto viene acompañado con la falta de equipos de medición de diferentes experimentos. Estos equipos que no se incorporan a los laboratorios de las instituciones por diferentes causas, hacen difícil comprobar y corroborar los diferentes temas de estudio. Uno de estos temas es el Movimiento parabólico de caída libre.

¿Será posible implementar un sistema de medición para el estudio del movimiento parabólico utilizando visión artificial?

I.2. JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN

Cuando el estudiante puede realizar actividades experimentales no solo corrobora conceptos, sino que también construye su propio conocimiento desde el hacer, situación que le permite plantear hipótesis y desarrollar un método que les conducirá a la obtención de resultados con los cuales pueden comprobar la hipótesis planteada o bien justificar de manera argumentativa los resultados que se ajusten a sus predicciones.

Que los estudiantes puedan generar discusiones en torno a resultados obtenidos de manera experimental enriquece sus conocimientos en la física,

(17)

17

además de contribuir a su formación integral permitiéndole tener capacidad de análisis y de pensamiento crítico ante situaciones que debe afrontar diariamente.

La falta de equipos de medición en los laboratorios de física en nuestras instituciones, como la nuestra, para experimentar y corroborar la teoría que se enseña, motivan también esta investigación.

I.3. OBJETIVOS

OBJETIVO GENERAL

Implementar un sistema de medición para el estudio del movimiento parabólico utilizando visión artificial.

OBJETIVOS ESPECÍFICOS

✓ Implementar algoritmos de procesamiento de imágenes digitales mínimas para aumentar la velocidad de procesamiento, por el manejo de la variable tiempo.

✓ Conocer el tiempo de medición del Estudio del Movimiento Parabólico de caída libre.

✓ Conocer la existencia de un dispositivo que mida las variables del Movimiento Parabólico de caída libre.

✓ Seleccionar la cámara de video adecuada.

✓ Comprobar si el sistema se puede implementar utilizando el lenguaje de programación Python.

I.4. DELIMITACIÓN DE LA INVESTIGACIÓN

El estudio de medición será el movimiento parabólico, específicamente, el movimiento parabólico de caída libre.

El proyecto será desarrollado, en los ambientes de la Universidad Nacional de Piura, escuela profesional de Ingeniería Electrónica y Telecomunicaciones.

Se utilizará una correcta iluminación, es decir iluminación natural, no se tomará en cuenta ambientes oscuros.

(18)

18

Se acondicionará la escena para comprobar los resultados teóricos y experimentales.

La cámara se colocará de forma fija a una determinada distancia de la escena, tratando de encuadrar el recorrido que hará el proyectil.

(19)

19

II. MARCO TEORICO

II.1. ANTECEDENTES DE LA INVESTIGACIÓN

En la Tesis: “DISEÑO DE UNA EXPERIENCIA DE TIRO PARABÓLICO PARA BACHILLERATO”, presentada por Víctor Peña Maniega de la Universidad Valladolid de España, presenta un sistema para el diseño de una experiencia de laboratorio de tiro parabólico para alumnos de Bachillerato. El objetivo general es que dicha experiencia sea novedosa, motivante y un ejemplo práctico de la aplicación de las diversas fases del método científico. Para ello, se utiliza un lanzador casero de proyectiles de aire comprimido, y la grabación en video digital como herramienta de trabajo y análisis. También se presentan opciones de cómo realizar el tratamiento de vídeos e imágenes y de cómo planificar el montaje adecuado para ello. Por último, se presentan diferentes variantes posibles de presentación a los alumnos. En la realización y justificación de este trabajo se han tenido en cuenta las tendencias pedagógicas actuales, en especial la idea de que cualquier situación es buena para que los alumnos adquieran un conocimiento, una habilidad o una actitud.

En la tesis: “SEGUIMIENTO EN TIEMPO REAL DE OBJETOS SOBRE SECUENCIA DE IMÁGENES EMPLEANDO DISPOSITIVOS DE LÓGICA PROGRAMABLE” presentada por MARLON STEEPHEN NARVÁEZ RODRIGUEZ y MIGUEL ANDRÉS SARRIA FERNÁNDEZ, de la

UNIVERSIDAD TECNOLÓGICA DE PEREIRA, FACULTAD DE

INGENIERÍAS: ELÉCTRICA, ELECTRÓNICA, FÍSICA Y CIENCIAS DE LA

COMPUTACIÓN PROGRAMA DE INGENIERÍA ELECTRÓNICA,

PEREIRA, COLOMBIA, han desarrollado un sistema de grado donde se plantea una metodología para determinar, en tiempo real, la ubicación y orientación de un objeto en movimiento, sobre una superficie plana, durante un intervalo de tiempo.

Se utilizaría para ello una cámara y una tarjeta de video para la adquisición de las imágenes, el procesamiento se realizaría empleando dispositivos de lógica programable con visualización en pantalla. Los principales problemas al realizar este tipo de aplicaciones es el alto costo computacional y económico de los elementos que se utilizan para tal, como también de la velocidad de respuesta del sistema a implementar. Se propone una solución de compromiso entre la precisión en la determinación de la información obtenida, el costo computacional y la

(20)

20

velocidad de la técnica. Con la técnica a desarrollar se pretende en primer lugar realizar la adquisición de la imagen, el preprocesamiento y procesamiento de la imagen, la identificación del objeto para luego abordar el problema de seguimiento de este y finalmente su visualización. En la parte de identificación se utiliza segmentación por color y una técnica para el seguimiento del objeto.

En la tesis: “TÉCNICAS DE PROCESADO DE IMAGEN PARA EL SEGUIMIENTO DE OBJETOS DESDE VEHÍCULOS AÉREOS NO TRIPULADOS” presentada por Natalia Ibáñez Sáez, de la UNIVERSIDAD DE VALLADOLID, del Departamento de Teoría de la Señal y Comunicaciones e Ingeniería Telemática para obtener el GRADO EN INGENIERÍA DE TECNOLOGÍAS DE TELECOMUNICACIÓN, han realizado una herramienta de procesamiento de imagen capaz de realizar la detección y seguimiento de objetos en movimiento grabados desde vehículos aéreos no tripulados. El problema de realizar video vigilancia desde cámaras móviles, como sucede en el caso de vehículos aéreos no tripulados, supone retos adicionales a los existentes en situaciones en las que la cámara está fija. Por ello, varios de los métodos utilizados en el caso de cámara fijan no son aplicables cuando la cámara está en movimiento. En el estado del arte se han analizado varios de los métodos utilizados en el problema de video vigilancia con cámara móvil y se ha seleccionado el método basado en alineamiento de la imagen mediante puntos característicos basado en flujo óptico por ser un método que proporciona buenos resultados y cuyo tiempo de ejecución es relativamente bajo.

El método seleccionado para realizar la herramienta deseada tiene como parte fundamental la comparación de dos flujos ópticos: un flujo óptico real, que describe el movimiento que se produce en los puntos seleccionados y un flujo óptico artificial, que describe el movimiento global de la imagen y que corresponde al movimiento del fondo de la imagen. Mediante la comparación de ambos flujos es posible compensar el movimiento producido por la cámara móvil y que, de este modo, todo el movimiento que recoja la cámara corresponda a los objetos en movimiento. Así mismo, es fundamental realizar un posterior seguimiento de los objetos móviles que permite realizar un filtrado espacial y temporal de los mismos, eliminando posibles falsas detecciones de objetos móviles producidos por errores en la fase de detección. Este seguimiento

(21)

21

proporciona también información sobre la trayectoria de los objetos y se realiza mediante el filtro de Kalman.

Por último, la herramienta realizada se ha probado con dos bancos de vídeos diferentes. El primero de ellos corresponde a una serie de vídeos grabados con una cámara de fotos en distintas situaciones de iluminación, movimiento de la cámara y en presencia de diferente número de objetos. Estos vídeos han sido utilizados para fijar los parámetros de funcionamiento de la herramienta y realizar un análisis cuantitativo que refleje la influencia de las características del vídeo en el funcionamiento de la herramienta, así como el tiempo que tarda la herramienta en inicializarse. El segundo banco de vídeos consiste en vídeos grabados por un vehículo aéreo no tripulado controlado de forma teledirigida. Estos vídeos han sido utilizados para evaluar cualitativamente el buen funcionamiento de la herramienta a través de la comprobación visual de los vídeos procesados.

(22)

22 II.2. BASES TEÓRICAS

II.2.1. FUNDAMENTO TEORICO

Un proyectil es un objeto sobre el cual la única fuerza que actúa sobre él es la gravedad. Hay una variedad de ejemplos de proyectiles: un objeto que se lanza (hacia abajo) desde un precipicio es un proyectil; un objeto que se lanza verticalmente hacia arriba es también un proyectil; y un objeto que es lanzado hacia arriba en ángulo también es un proyectil. Todos estos ejemplos se dan con la condición de que la resistencia del aire se desprecia.

Un proyectil es cualquier objeto que, una vez que está en movimiento, es influenciado solamente por la fuerza hacia abajo de la gravedad.

II.2.2. MOVIMIENTO DE PROYECTIL¹

Quien haya observado una pelota de béisbol en movimiento observó movimiento de proyectil. La bola se mueve en una trayectoria curva y regresa al suelo. El movimiento de proyectil de un objeto es simple de analizar a partir de dos suposiciones: 1) la aceleración de caída libre es constante en el intervalo de movimiento y se dirige hacia abajo y 2) el efecto de la resistencia del aire es despreciable. Con estas suposiciones, se encuentra que la trayectoria de un proyectil siempre es una parábola, como se muestra en la figura siguiente. A lo largo de este capítulo se usan estas suposiciones.

La expresión para el vector de posición del proyectil como función del tiempo se sigue directamente de la ecuación:

1 FÍSICA PARA CIENCIAS E INGENIERÍA. SERWAY JEWETT

(23)

23

Fig. N° 1 Trayectoria parabólica de un proyectil que sale del origen con velocidad vi. El vector velocidad v cambia con el tiempo tanto en magnitud como en dirección. Este cambio es el resultado de la aceleración en la dirección y negativa. La componente x de velocidad permanece constante en el tiempo porque no hay aceleración a lo largo de la dirección horizontal. La componente y de velocidad es cero en el pico de la trayectoria.

donde las componentes x y y de la velocidad inicial del proyectil son:

La expresión de la ecuación se grafica en la figura anterior, para un proyectil lanzado desde el origen, de modo que ri = 0. La posición final de una partícula se considera como la superposición de su posición inicial ri , el término vi t, que es su desplazamiento si no hubiese aceleración presente; y el término 1/2gt² que surge de su aceleración debida a la gravedad.

En otras palabras, si no hubiera aceleración gravitacional, la partícula continuaría moviéndose a lo largo de una ruta recta en la dirección vi. En consecuencia, la distancia vertical 1/2gt² desde la que “cae” la partícula en línea recta, es la misma distancia desde la que caería un objeto que se deja caer desde el reposo durante el mismo intervalo de tiempo.

(24)

24 II.2.3. TIPOS DE MOVIMIENTO

II.2.3.1. Movimiento rectilíneo uniforme (M.R.U)

Un movimiento es rectilíneo cuando describe una trayectoria recta y uniforme cuando su velocidad es constante en el tiempo, es decir, su aceleración es nula.

Esto implica que la velocidad media entre dos instantes cualesquiera siempre tendrá el mismo valor. Además, la velocidad instantánea y media de este movimiento coincidirán.

De acuerdo a la 1ª Ley de Newton toda partícula permanece en reposo o en movimiento rectilíneo uniforme cuando no hay una fuerza neta que actúe sobre el cuerpo.

Ya que en realidad no podemos afirmar que algún objeto se encuentre en reposo total.

El MRU se caracteriza por:

a) Movimiento que se realiza en una sola dirección en el eje horizontal.

b) Velocidad constante; implica magnitud y dirección inalterables.

c) La magnitud de la velocidad recibe el nombre de rapidez. Este movimiento no presenta aceleración (aceleración = 0).

El M.R.U. es un movimiento con velocidad constante, puesto que se realiza en línea recta y con rapidez constante. Una velocidad constante tiene un módulo que se calcula así:

v = d / t Donde:

v = velocidad

d = espacio o distancia t = tiempo

(25)

25

II.2.3.2. Movimiento rectilíneo uniformemente acelerado (MRUA) El Movimiento rectilíneo uniformemente acelerado (MRUA), Movimiento rectilíneo uniformemente variado (MRUV) o también Movimiento Unidimensional con Aceleración Constante es aquél en el que un móvil se desplaza sobre una trayectoria recta y con aceleración constante. Esto implica que, para cualquier intervalo de tiempo, la aceleración del móvil tendrá siempre el mismo valor. Un ejemplo de este tipo de movimiento es el de caída libre, en el cual la aceleración considerada constante es la correspondiente a la gravedad.

Tipos de movimiento variado

Movimiento Acelerado: Es aquel en donde la aceleración actúa a favor de la velocidad, de modo que el módulo de la velocidad aumenta a través del tiempo.

Movimiento Desacelerado: Se le llama también movimiento retardado, y es aquel en donde la aceleración actúa en contra de la velocidad provocando que ésta disminuya su valor a medida que transcurre el tiempo

Ecuaciones Escalares del M.R.U.V.

Donde:

(+) = Movimiento Acelerado. (–) = Movimiento Desacelerado. V f = Velocidad final

Vo = Velocidad inicial a = aceleración (+ / –) t = tiempo

e = distancia o espacio

(26)

26 Movimiento de caída libre

Se dice que un cuerpo está en caída libre cuando al moverse sólo se ve afectado de su propio peso. Esto ocurrirá únicamente en el vacío.

Aceleración de la Gravedad

La atracción gravitatoria que ejerce la Tierra sobre todos los cuerpos que le rodean hace que éstos se aceleren cuando son dejados en libertad.

g = 9,8 m/s² Ecuaciones escalares de la Caída Libre:

Movimiento Parabólico

Cuando lanzamos un cuerpo al aire vemos que él se ve obligado a bajar por causa de la gravedad. Si el tiro fuera inclinado y el medio fuese el vacío, el móvil describiría una trayectoria curva llamada parábola, la cual tendrá una forma final que dependerá de la velocidad y ángulo de disparo.

(27)

27 II.2.4. VISION ARTIFICIAL

También conocida como visión por computador (del inglés computer vision) o visión técnica, es un sub campo de la inteligencia artificial y es el campo de acción más ambicioso del procesamiento digital de imágenes. Básicamente el objetivo es automatizar funciones de inspección visual, tradicionalmente utilizadas por el hombre como, por ejemplo.

Los objetivos típicos de la visión artificial incluyen:

La detección, segmentación, localización y reconocimiento de ciertos objetos en imágenes (por ejemplo, caras humanas).

La evaluación de los resultados (ej.: segmentación, registro).

Registro de diferentes imágenes de una misma escena u objeto, hacer concordar un mismo objeto en diversas imágenes.

Seguimiento de un objeto en una secuencia de imágenes.

Mapeo de una escena para generar un modelo tridimensional de la escena; tal modelo podría ser usado por un robot para navegar por la escena.

Estimación de las posturas tridimensionales de humanos.

Búsqueda de imágenes digitales por su contenido.

II.2.5. PROCESAMIENTO DE IMAGENES²

Imagen: Es la proyección en perspectiva en el plano bidimensional de una escena tridimensional en un determinado instante de tiempo t0.

Fotograma: Es una matriz bidimensional de valores de intensidad lumínica obtenidos para un tiempo t0 constante. Pudiera decirse en cierta forma que es una imagen discretizada.

Píxel (Picture Element): Es cada de una de las posiciones en que es discretizada una imagen, o lo que es lo mismo, cada una de las posiciones de un cuadro.

2 Rafael C. Gonzales, Richard E. Woods, “Tratamiento Digital de Imágenes”

(28)

28

Imagen binaria: Son aquellas imágenes cuyos píxeles solo tienen dos valores:

cero y uno.

II.2.6. LA IMAGEN DIGITAL³

Son el principal ingrediente de lo que se conoce como Visión Artificial y representan mediante algún tipo de codificación, normalmente en una matriz de números de dos dimensiones, una escena del entorno.

Existen dos tipos de imágenes utilizadas frecuentemente en Visión Artificial: imágenes de intensidad e imágenes de alcance (también llamadas imágenes de profundidad o perfiles de superficie). Las imágenes de intensidad miden la cantidad de luz que incide en un dispositivo fotosensible, mientras que las imágenes de alcance estiman directamente la estructura en tres dimensiones (3D) de la escena ya que su fundamento radica en el uso de sensores de alcance ópticos y algún fenómeno físico para adquirir la imagen. Un ejemplo típico de una imagen de intensidad es una fotografía, mientras que de una imagen de alcance es, por ejemplo, la imagen que obtiene el oftalmólogo sobre el grado de rugosidad de la córnea de un paciente o las imágenes de un radar.

Aunque la filosofía de los diferentes tipos de imágenes es diferente, en cualquier caso, tras su captura tendremos una matriz de valores en dos dimensiones (2D), es decir, una imagen digital.

II.2.7. DISPOSITIVOS DE CAPTURA DE IMÁGENES

Para la adquisición de imágenes digitales se requieren dos elementos básicos. El primero es un dispositivo físico que es sensible a una determinada banda del espectro de energía electromagnético (tal como rayos X, ultravioleta, visible, infrarrojo, etc.) y que produce una señal eléctrica de salida proporcional al nivel de energía incidente en cualquier instante de tiempo. El segundo,

3 Gonzalo Pajares Martinsanz, Jesús Manuel de la Cruz García, José Manuel molina

pascual, Juan Cuadrado Pardo, Alejandro López Correa, “Imágenes digitales - Procesamiento practico con java”

(29)

29

denominado digitalizador, es un dispositivo que cumple la función de convertir la señal eléctrica continua de salida del dispositivo físico en un conjunto discreto de localizaciones del plano de la imagen y, después, en la cuantización de dicha muestra. Esto implica, en primer lugar, determinar el valor de la imagen continua en cada una de las diferentes localizaciones discretas de la imagen (cada valor localizado de forma discreta se denomina muestra de la imagen) y, luego, asignar a cada muestra una etiqueta entera discreta, que es representativa del rango en el que varía la muestra.

Una vez capturada la señal continua y cuantificada espacialmente y en amplitud, se obtiene una imagen digital, que es como se representa en el computador, es decir, tendremos la matriz (2D) de números como ya hemos mencionado anteriormente. Éstos son los valores que se manipulan para extraer información de las imágenes mediante programas (software).

Supongamos que tenemos una señal analógica, que bien podría ser una línea de video analógica. Esta señal (línea) analógica de video se convierte a una imagen digital muestreando la señal analógica a intervalos determinados. El procedimiento consiste en medir el voltaje de la señal a intervalos de tiempo fijos.

El valor del voltaje en cada instante se convierte a un número que es almacenado y se corresponde con la intensidad de la imagen en ese punto. La intensidad en cada punto depende tanto de las propiedades intrínsecas del objeto que se está viendo como de las condiciones de luz de la escena. Repitiendo este procedimiento para todas las líneas de video que constituyen una imagen, se pueden grabar los resultados obtenidos en el computador, de suerte que habremos conseguido una imagen digital que, en definitiva, es una matriz de números.

La imagen puede accederse como una matriz bidimensional (2D) de datos, donde cada punto o dato se denomina píxel.

Además de las cámaras de televisión que generan una imagen de video, uno de los sensores más usados para la visión artificial son loa dispositivos de acoplamiento de carga (Charge Coupled Devices - CCD). Entre los dispositivos CCD, que generalmente también producen una señal continua de video, cabe distinguir dos categorías: sensores de exploración de línea y sensores de exploración de área. Estos sensores CCD se basan en unos elementos

(30)

30

semiconductores llamados photosites. Los fotones procedentes de la escena excitan el elemento semiconductor, de forma que el grado de excitación es proporcional a la cantidad de carga acumulada en el photosite y, por lo tanto, a la intensidad luminosa en ese punto.

Estos photosites se pueden representar en forma de matriz como se muestra en la siguiente figura:

Fig. N° 2 Captura de una imagen 3d por un dispositivo CCD

Supongamos una matriz de photosites situados detrás de una lente y sobre los que se proyecta una imagen procedente de la escena 3D. La señal de estos sensores se procesa en el propio sensor (cámara) o en otro dispositivo (tarjeta de procesamiento de imágenes digitales) y los valores digitales se envían al computador.

Para clarificar un poco más estos conceptos, analicemos el ejemplo sencillo mostrado en la figura siguiente:

(31)

31

Fig. N° 3 Figura del árbol capturada por una cámara con 4x4 sensores de intensidad

Supongamos una escena 3D cuya representación digital en forma de matriz, tal como se almacena en el computador, resulta ser la que se muestra en la figura. En este caso se utiliza una matriz de 16 elementos (4x4) para representar el árbol; lógicamente, cuantos más sensores dispongamos en la cámara, más precisión podemos tener en la reproducción de la imagen. Esto es lo que se conoce como resolución espacial de la imagen.

II.2.8. IMÁGENES BLANCO/NEGRO Y COLOR

En definitiva, e independientemente del tipo de sensor utilizado, la imagen que ha de ser tratada por el computador se presenta digitalizada espacialmente en forma de matriz con una resolución de M x N elementos.

Si la imagen es en Blanco y Negro (B/N), se almacena un valor por cada píxel. Se suele utilizar un rango de valores para su representación, que generalmente es de 0 a 2n-1. Uno de los valores más utilizados de n es 8; esto significa que el rango de valores para este caso varía de 0 a 255. En este caso, el 0 representa el negro absoluto y el 255, el blanco absoluto. Esto indica que podemos tener una resolución o precisión en los grises posibles de 256. El hecho de utilizar 256 niveles es porque con 8 bits del computador se pueden codificar 256 valores distintos desde la combinación 00000000, que representa el nivel 0, hasta la combinación 11111111, que representa el nivel 255.

En el caso de las imágenes en color, los elementos de la matriz vienen dados por tres valores, que representan cada uno de los componentes básicos del color en cuestión. Estos componentes son el Rojo (R), Verde (G) y Azul (B), el

(32)

32

conocido código RGB. En este caso el conjunto de valores (0,0,0) es el negro absoluto; el (255,255,255), el blanco absoluto; el (255,0,0), el rojo puro; el (0,255,0), el verde puro; el (0,0,255), el azul puro. Como es lógico, la combinación de distintos valores proporciona otros colores, por ejemplo, el (255, 255, 51) es un tono de amarillo o el (204, 153, 102), es un tono marrón. El número de colores posible resulta ser 255.

II.2.9. RESOLUCIÓN ESPACIAL Y EN AMPLITUD

Para comprender mejor el sentido y la diferencia que existe entre resolución espacial y en amplitud, vamos a ilustrar los conceptos en las siguientes figuras:

Fig. N° 4 Cuatro representaciones de la misma imagen con variación en el número de píxeles utilizados

(33)

33

Fig. N° 5 Representaciones de la misma imagen con variación en el número de niveles de gris utilizados

Como se muestra en las figuras anteriores, dependiendo del número de píxeles que tenga el dispositivo y de niveles de grises con que se trabaje en el computador, la imagen poseerá más o menos resolución espacial y en amplitud respectivamente.

II.2.10. REPRESENTACIÓN DE IMÁGENES DIGITALES

Como ya se ha mencionado antes, el termino imagen se refiere a una función de intensidad bidimensional, la cual puede ser representada como f(x,y),f(i,j),I(x,y),I(i,j), etc., donde x e y, o bien, i y j son las coordenadas espaciales y el valor de f o I en cualquier punto (x,y) o (i,j) es proporcional a la intensidad o nivel de gris de la imagen en ese punto.

(34)

34

Fig. N° 6 Convención de ejes utilizada para la representación de imágenes digitales

II.2.11. PROCESAMIENTO Y ANALISIS DE IMÁGENES DIGITALES

Aunque la distinción entre procesamiento y análisis de imágenes digitales no es obvia de forma inmediata, el procesamiento de imágenes puede ser visto como una transformación de una imagen a otra imagen, es decir, a partir de una imagen, se obtiene otra imagen modificada. Por otro lado, el análisis es una transformación de una imagen en algo distinto a una imagen; en consecuencia, el análisis es un determinado tipo de información representando una descripción o una decisión. En la mayoría de los casos, las técnicas de análisis de imágenes digitales son aplicadas a imágenes que han sido procesadas previamente. Desde el punto de vista de un observador humano, el análisis de imágenes es una tarea fácil y rápida, algo que no ocurre en visión artificial. Igualmente, la capacidad de percepción humana permite procesar rápidamente una imagen para detectar en ella características de interés, por ejemplo, bordes o regiones.

II.2.12. PROCESAMIENTO BASICO DE IMÁGENES

El procesamiento de datos en el sistema de visión puede enfocarse desde 2 perspectivas:

Alteración píxel a píxel de los datos en una escala global (individuales).

Operaciones basadas en múltiples puntos (vecindad).

(35)

35

La generación de un nuevo píxel en una imagen será una función bien del valor de cada píxel en su localización individual, o bien de los valores de los píxeles en la vecindad de un píxel dado, como se indica en la figura siguiente:

Fig. N° 7 Funciones de punto y vecindad

Existen aún otras operaciones, que no se clasifican ni como individuales ni como vecindad ya que trasforman las imágenes por otros procedimientos; son transformaciones que operan globalmente sobre los valores de intensidad de la imagen cuyo efecto es un realzado de la imagen original, operaciones aritméticas y lógicas, estas últimas basadas en la teoría del algebra de Boole, y operaciones que realizan transformaciones geométricas, sin modificar los valores de intensidad.

II.2.12.1. OPERACIONES INDIVIDUALES

Las operaciones individuales implican la generación de una nueva imagen modificando el valor del pixel en una simple localización basándose en una regla global aplicada a cada localización de la imagen original. El proceso consiste en obtener el valor del píxel de una localización dada en la imagen, modificándolo por una operación lineal o no lineal y colocando el valor del nuevo pixel en la correspondiente localización de la imagen nueva. El proceso se repite para todas y cada de las localizaciones de los pixeles en la imagen original.

(36)

36

Fig. N° 8 Operación individual

Como se aprecia en la figura anterior, el operador individual es una transformación uno a uno. El operador f se aplica a cada píxel en la imagen o sección de la imagen y la salida depende únicamente de la magnitud del correspondiente píxel de entrada; la salida es independiente de los píxeles adyacentes. La función transforma el valor del nivel de gris de cada píxel en la imagen y el nuevo valor se obtiene a través de la ecuación:

q(x,y) = f(p(x,y))

La función f puede ser un operador lineal o no lineal. El proceso matemático es relativamente simple. La imagen resultante es de la misma dimensión que la original.

II.2.12.2. OPERADOR IDENTIDAD

Este operador crea una imagen de salida que es idéntica a la imagen de entrada. La función de transformación es:

q=p

El operador identidad deja la imagen de entrada invariante. En la siguiente figura se muestra la función de transformación dada por la ecuación anterior:

(37)

37

Fig. N° 9 Representación del operador identidad

II.2.12.3. OPERADOR INVERSO O NEGATIVO

Este operador crea una imagen de salida que es inversa de la imagen de entrada. Este operador es útil en diversas aplicaciones tales como imágenes médicas. Para una imagen con valores de gris en el rango de 0 a 255 la función de transformación resulta ser:

q = 255 - p

En la siguiente figura se muestra la función de transformación dada por la ecuación anterior:

Fig. N° 10 Representación del operador inverso

(38)

38 II.2.12.4. OPERADOR UMBRAL

Esta clase de transformación crea una imagen de salida binaria a partir de una imagen de grises, donde el nivel de transición está dado por el parámetro de entrada p_1. La función de transformación es la siguiente:

𝑞 = { 0𝑝𝑎𝑟𝑎𝑝 ≤ 𝑝₁ 255𝑝𝑎𝑟𝑎𝑝 > 𝑝₁}

En la siguiente figura se muestra la función de transformación dada por la ecuación anterior:

Fig. N° 11 Representación del operador umbral

II.2.13. TRANSFORMACIÓN DE VECINDAD

En las operaciones de vecindad modifican el nuevo valor del píxel en la imagen de salida depende de una combinación de los valores de los píxeles en la vecindad de la imagen original que está siendo transformada.

Dentro de la categoría de operaciones de vecindad se incluyen las operaciones de filtrado. Las operaciones de filtrado tienen la particularidad de eliminar un determinado rango de frecuencias de las imágenes.

(39)

39

II.2.13.1. Nociones y propiedades de vecindad

Se dice que todo píxel p, de coordenadas (x,y), tiene cuatro píxeles que establecen con él una relación de vecindad horizontal o vertical, que son:

Horizontal: (x-1, y) y (x+1, y) Vertical: (x, y-1) y (x, y+1)

Estos cuatro pixeles definen lo que se conoce como entorno de vecindad- 4 y nos referimos a ellos como E_4 (p).

Los cuatro vecinos diagonales de p tienen coordenadas:

(x-1, y-1), (x+1, y-1), (x-1, y+1), (x+1, y+1)

y nos referimos a ellos como E_D (p). Estos píxeles junto con los E_4 (p) se llaman los vecinos-8 de p y se denotan como E_8 (p).

Existen excepciones dadas cuando el píxel (x, y) es un punto del borde de la imagen, en cuyo caso algunos de los vecinos definidos anteriormente no existen.

II.2.13.2. Conectividad

Sea V el conjunto de valores de intensidad de los píxeles que se permiten estén adyacentes, por ejemplo, si sólo se desea que exista conectividad entre los píxeles con intensidades 80,81 y 83, entonces V = {80,81,83}. Consideremos tres tipos básicos de conectividad:

Conectividad-4. Dos píxeles p y q con valores de V están 4-conectados si q está en el conjunto E_4 (p).

Conectividad-8. Dos píxeles p y q con valores de V están 8-conectados si q está en el conjunto E_8 (p).

Conectividad-m (mixta). Dos píxeles p y q con valores de V están m-conectados si q está en el conjunto E_4 (p) o q está en E_D (p) y E_4 (p)∩E_4 (q)=∅.

(40)

40

Un píxel p es contiguo a otro píxel q si están conectados. Se puede definir la adyacencia-4, 8 o m, dependiendo del tipo de conectividad especificada. Dos subconjuntos imagen S1 y S2 son contiguos si algún píxel se S1 es contiguo a algún píxel de S2.

Un camino desde el píxel p con coordenadas (x, y) hasta un píxel q con coordenadas (s, t) es una secuencia de varios píxeles con coordenadas,

(x_0,y_0 ),(x_1,y_1 ),…,(x_n, y_n )

donde (x_0, y_0 ) = (x, y) y (s, t),(x_i, y_i ) son adyacentes a (x_(i-1), y_(i-1) ), con 1 ≤ i ≤ n, y n es la longitud del camino. Se pueden definir caminos -4, 8 o m dependiendo del tipo de adyacencia usada.

Si p y q son píxeles de un subconjunto de imagen S, entonces p está conectado a q en S si existe un camino desde p hasta q formado de píxeles pertenecientes a S. Dado un píxel p cualquiera de S, el conjunto de píxeles de S que están conectados a p se llaman componente conectado de S. Se deduce que dos píxeles cualesquiera de un componente conectado están a su vez conectados entre sí y que los componentes conectados distintos son disjuntos.

Un camino simple es un camino sin píxeles repetidos y un camino cerrado es un camino simple en el cual el primer píxel es un vecino del último.

(41)

41

II.2.14. OPERACIONES DE FILTRADO

Las operaciones de filtrado basan su operatividad en la Convolución de la imagen utilizando el denominado núcleo de Convolución. Cabe distinguir dos tipos de filtros: paso alto y paso bajo, que en el contexto de la teoría de señales supone que los primeros dejan pasar las altas frecuencias de la señal y los segundos, las bajas. En el caso de las imágenes nos referimos a frecuencias espaciales. De una forma, las altas frecuencias se asocian a cambios bruscos de intensidad en pequeños intervalos espaciales, es decir, bordes, mientras que las bajas frecuencias se refieren a cambios lentos en la intensidad.

II.2.14.1. Filtros Paso Bajo

En la siguiente figura se muestran algunos núcleos de convolución que caracterizan los filtros paso bajo:

𝑃𝐵₁ ≡1 9[

1 1 1 1 1 1 1 1 1 ]

𝑃𝐵₂ ≡ 1 10[

1 1 1

]

𝑃𝐵₃ ≡ 1 16[

1 2 1

2 4 2

1 2 1

]

Fig. N° 12 Tres núcleos representativos de filtros paso bajo

II.2.14.2. Filtros Paso Alto

En la siguiente figura se muestran algunos núcleos de Convolución que caracterizan los filtros paso alto:

(42)

42 𝑃𝐴₁ ≡ [

0 −1 0

−1 5 −1

0 −1 0

]

𝑃𝐴₂ ≡ [

−1 −1 −1

−1 9 −1

−1 −1 −1 ]

𝑃𝐴₃ ≡ [

1 −2 1

−2 5 −2

1 −2 1

]

Fig. N° 13 Tres núcleos representativos de filtros paso alto

II.2.15. HISTOGRAMA

El histograma de una imagen es la representación gráfica o analítica de la distribución relativa de cada valor posible de pixel de imagen, y en caso de imágenes grises de 8 bits será un vector de 256 componentes, siendo la componente i el número de pixeles de nivel i en la imagen, dividido por el número total de pixeles:

El histograma es formalmente la función estadística de densidad de probabilidad en forma discreta de los distintos niveles de gris dentro de la imagen.

Fig. N° 14 Histograma

(43)

43

II.2.16. OPERACIONES MORFOLÓGICAS.

Las operaciones morfológicas a imágenes se definen como procedimientos en los cuales cada nuevo pixel de la imagen resultante es obtenido de una operación no lineal entre un conjunto de puntos de la imagen original F[x, y] y un conjunto de puntos conocido con el nombre de elemento estructurante S[x, y].

Este elemento estructurante recorre toda la imagen para obtener todos los puntos de la nueva imagen, sin cambiar el tamaño de la imagen de salida.

Fig. N° 15 Operación morfológica de un elemento estructurante s[u,v] sobre un área de la imagen f[x,y] para obtener una imagen g[x,y].

Dependiendo de los elementos estructurantes y de las operaciones utilizadas, los filtros morfológicos, pueden detectar bordes en las imágenes, filtrar objetos de tamaños menores a uno determinado, suavizar fondos de texturizados, detectar fallos en patrones de textura, etc.

II.2.17. DILATACIÓN Y EROSIÓN.

Las operaciones morfológicas binarias de dilatación y erosión para imágenes binarias consisten en tomar el elemento estructurante (uno de cuyos puntos se considera el origen) y superponerlo a la imagen.

(44)

44

Si en el proceso de erosión el elemento estructurante está completamente contenido en la imagen, el punto de ésta se mantiene, de lo contrario pasa a ser del color del fondo. La erosión se aplica para reducir salientes de objetos, eliminar partes de tamaño menor que el elemento estructurante, eliminar conexiones insignificantes entre objetos mayores.

En el proceso de dilatación si parte del elemento estructurante es igual al contenido de la imagen, el punto de la imagen pasa a ser igual al punto origen del elemento estructurante, de otra forma pasa a ser del color del fondo. La dilatación se aplica para rellenar entrantes de objetos y unir pequeñas separaciones en las imágenes.

II.2.18. EROSION BINARIA

La transformación de la erosión es el resultado de comprobar si el elemento estructurante B está completamente incluido dentro del conjunto X. Cuando no ocurre, el resultado de la erosión es el conjunto vacío:

Cuando los objetos de la escena sean menores que el elemento estructurante, éstos desaparecerán. Otra interpretación de la erosión supone tomar el valor mínimo de la imagen en el entorno de vecindad definido por el elemento estructurante.

Su utilidad consiste en definir una geometría determinada al elemento estructurante y pasarlo sobre la imagen. Los objetos menores al elemento estructurante no aparecerán en la imagen resultante. Los objetos que queden de la transformación habrán sido degradados. Por tanto, la erosión supone una

(45)

45

degradación de la imagen. La aplicación iterativa de esta transformación hará que se eliminen todos los objetos existentes en la imagen.

II.2.19. DILATACIÓN BINARIA

La dilatación es la transformación dual a la erosión. El resultado de la dilatación es el conjunto de elementos tal que al menos algún elemento del conjunto estructurante B está contenido en el conjunto X, cuando B se desplaza sobre el conjunto X:

Esta operación representa un crecimiento progresivo del conjunto X. Al pasar el elemento estructurante dentro del conjunto, éste no se modificará. Sin embargo, en la frontera del conjunto X, al desplazar a B, el conjunto resultado se expansionará. La aplicación iterada de este operador haría degradar la imagen, haciendo coincidir el conjunto dilatado con la imagen.

La dilatación también se interpreta como el valor máximo del entorno de vecindad definido por el elemento estructurante.

Las aplicaciones de las operaciones de erosión seguida con una dilatación no son conmutativas. Los resultados son diferentes dando paso a las aperturas y cierres morfológicos.

II.2.20. ESPACIOS DE COLORES Y COLORIMETRÍA

Como ya se mencionó en una sección anterior, es posible representar los colores en base a una composición de colores fundamentales, imitando lo que hace nuestro ojo. En base a este hecho, es que se han creado espacios de colores que, de alguna manera u otra, permiten representar un conjunto de valores.

(46)

46

Normalmente no se pueden representar todos los colores que son realmente visibles, sin embargo, son lo suficiente como para representar la gran mayoría de colores que vemos regularmente.

Un espacio de color define un modelo de composición del color. Por lo general un espacio de color lo define una base de N vectores (por ejemplo, el espacio RGB lo forman 3 vectores: Rojo, Verde y Azul), cuya combinación lineal genera todo el espacio de color. Los espacios de color más generales intentan englobar la mayor cantidad posible de los colores visibles por el ojo humano, aunque existen espacios de color que intentan aislar tan solo un subconjunto de ellos.

Existen espacios de color de:

Una dimensión: escala de grises, escala Jet, etc.

Dos dimensiones: sub-espacio rg, sub-espacio xy, etc.

Tres dimensiones: espacio RGB, HSV, YCbCr, YUV, YI'Q', etc.

Cuatro dimensiones: espacio CMYK.

De los cuales, los espacios de color de tres dimensiones son los más extendidos y los más utilizados para la mayoría de las aplicaciones. En el caso que se cuente con un espacio de una dimensión de profundidad, estaríamos en presencia de un espacio de color que en la práctica puede representar el grado de luminosidad de la imagen; es básicamente una imagen en escala de grises, y no entrega información de color. Pero si queremos trabajar con colores, los modelos existentes especifican tres coordenadas, o atributos, que representan su posición dentro de un espacio de color específico. Estas coordenadas no nos dicen cuál es el color, sino que muestran dónde se encuentra un color dentro de un espacio de

(47)

47

color en particular. A continuación, se hará una descripción de los espacios de color más relevantes, así como los más importantes para este trabajo.

II.2.20.1. Espacio de color RGB

Este modelo es el más utilizado para visualizar imágenes digitales en una pantalla en los formatos actuales. Como se ha dicho anteriormente, es un modelo aditivo, en el que sumando distintas cantidades de colores primarios podemos conseguir otros colores. En los archivos gráficos que utilizan este modelo utilizamos para representar una tripleta (R, G, B).

Contienen tres planos de imágenes independientes, uno por cada color primario.

Cuando estos planos se inyectan a un monitor que utiliza este sistema, la pantalla de fósforo reproduce una imagen a color. Es un sistema aditivo que, variando la cantidad de color rojo, verde y azul agregados al negro, se produce nuevos colores.

En los archivos gráficos el sistema RGB se usa para representar cada píxel con una tripleta o terna de la forma (R, G, B), quedando representado en un sistema cartesiano, como se puede apreciar en la figura.

En este sistema los colores vienen definidos por un punto del cubo, así los vértices comunes son los colores secundarios, el origen de coordenadas es el negro, y el punto donde se sumarian los 3 colores primarios será el vértice del color blanco.

Y si trazamos una línea que una el negro con el blanco representará toda la escala de grises.

A un píxel se le asigna un valor entre 0(negro) y 255(blanco). La idea es la siguiente: si por ejemplo queremos un color rojo tendríamos que darle un valor alto a la coordenada del rojo y valores más pequeños a las otras dos coordenadas.