5. MARCO DE REFERENCIA
5.2. Marco teórico
5.2.7 Funcionamiento de la cámara
Las características propias de la cámara que se usara para el desarrollo del aplicativo, permite definir la resolución adecuada que se necesita para obtener la información necesaria para el procesamiento, almacenamiento y tratamiento de la imagen, definiendo la manera en que se debe captar (tomar la foto). Se debe encontrar el formato adecuado y el formato que nos puede brindar la cámara como lo son: raw, tiff, jpg ; la resolución más baja nos permite manejar un procesamiento más rápido pero la calidad puede que no sea la indicada, se puede comprimir la imagen pero se perdería información que es vital , también se puede organizar más datos para tener la mejor información tales como nitidez, saturación, contraste con la mejor adecuación de estos datos la información captada puede ser más eficiente .
Hay maneras de generar ruido y daños a la imagen que impiden que sea buena por lo cual el tomar la foto de la mejor manera garantiza lo mejor, en las cámaras baratas se encuentran resoluciones de 256x256
que resulta de una resolución tan baja que es casi inaceptable en muchos casos (65000 pixeles) , hasta cámaras con 4064x2704 que pueden generar imagen de gran tamaño sin perder la calidad llegando las cámaras profesionales hasta unos 20millones de pixeles lo cual para este uso ya es una imagen demasiado pesada para un procesamiento normal, tal vez sea estética o no pero se debe tomar en cuenta que tomar una buena foto que sirva requiera un proceso adecuado, buscar la fuente de luz eficaz , la dirección y las difusiones entre otras[45],[46],[47],[48],[49],[50].
El Pixel: al tomar una imagen con una cámara fotográfica, al aumentarle el zoom se puede observar que las imágenes están divididas en líneas y cada línea tiene una serie de puntos que se superponen unos a otros y están compuestos por 3 colores (rojo, verde, azul) combinando esas intensidades se pueden obtener millones de colores diferentes; con su máxima luminosidad obteniendo el blanco y su mínima el negro.
Resolución: La resolución de las pantallas viene dada por #1*#2 donde #1 es el número de pixeles en horizontal y el segundo #2 indica el número de pixeles en vertical; Las cámaras digitales poseen sensores matriciales que permiten captar la luz y luego almacenarla en memorias o tarjetas extraíbles para su posterior reproducción, la
resolución se mide en mega pixeles (1.048.576pixeles) donde se puede concluir que cada mega pixel es una unidad de medida de superficie. [5]
6. METODOLOGIA
Se realizó un dispositivo de reconocimiento de personas mediante el uso de la biometría del iris y el respectivo análisis de las características únicas de cada persona, mediante la captura, acondicionamiento, procesamiento de la imagen, selección de características y la comparación con su base de datos. Comparando a su vez funcionamiento de REDBI 2.0 con el REDBI, verificando las respectivas mejoras.
Figura 8. Diagrama de bloques de la solución propuesta.
En la Figura 8 se puede observar el diagrama de bloques de funcionamiento general del proyecto REDBI 2.0, en la Figura 9
se ve el
proceso iniciando en la captura, procesamiento, clasificación explicados paso a paso en la continuación del documento.
Figura 9. Diagrama de flujo de solución
6.1. Captura de la Imagen
El primer paso en el desarrollo del software base consta en la captura de la imagen, con las condiciones requeridas para su posterior procesamiento, condiciones como:
La resolución de la cámara, debe ser lo suficientemente alta para poder capturar todos los detalles del iris y de manera correcta.
El usuario debe colocarse siempre en la misma posición, siendo un proceso mecánico que permita el análisis más acertado posible.
Al ser cada usuario diferente se debe asegurar que la imagen capturada coincida con los diámetros especificados de la imagen para hallar el centro de la misma, siendo que el usuario se pueda alejar o acerca un poco enfocando la cámara.
Se crea un cuadro de captura de imagen para darle al usuario la posibilidad de recordar la posición en la que estaba al momento de tomar la imagen y ayudar al proceso.
Al realiza el desarrollo y pruebas específicas el problema sobre el dispositivo de captura se solvento realizando pruebas con usuarios específicos y bases de datos de imágenes de iris.
Se debe entrar a solucionar otro de los grandes problemas de este proceso, la iluminación, ya que por la textura natural de la córnea tiene una alta capacidad de reflexión por sus características propias, lo cual afecta la imagen que se toma,[6] Para mejorar este proceso se puede obtener una cámara de iridologia[7], esta cámara ya cuenta con todos
las especificaciones y con las adecuaciones necesarias para facilitar una captura adecuada de la imagen del iris.
La cámara o iriscopio es usado en procesos de análisis de iris para verificar el estado físico y fisiológico de las personas mediante el análisis del mismo y la esclerótica, detectando manchas o posibles alteraciones en las formas del ojo, tiene un costo aproximado de 300 USD (dólares), se buscó usar una cámara que tuviera la capacidad de captura y verificación del iris como funcionamiento principal, ya que al usar un microscopio común no se tiene la lente ni la manera de captura especifica por lo que el diseño físico entraría a ser un problema en el planteamiento, sin dejar de lado la opción del microscopio ya que por costo y beneficio puede mejorar un futuro desarrollo o una etapa posterior de funcionamiento, así como la
Figura 10. Cámara Iriscopio [48]
vinculación de cámaras especiales en el hardware como la cámara de la raspberry pi 3.
La cámara es un dispositivo de verificación del iris de 5MP, con conexión USB, 2 LEDs de iluminación y un software propio de análisis de patrones médicos del iris, y un activador de funcionamiento.
6.2 Segmentación de la imagen.
Después de haber dado solución a la captura de imágenes del iris, el paso a seguir fue la segmentación de la imagen; este proceso divide la imagen en regiones u objetos cuyos pixeles poseen características similares. Este proceso es una de las partes más importantes en un sistema de visión artificial ya que esto permite la separación de objetos para su posterior análisis. Para realizar este proceso se inició con la detección de círculos, usando la función de la librería cv “HoughCircles” esta función usa la transformada de círculos de Hough, basado en el algoritmo de detección de centros y radios de una imagen circular. Este método es usado por que este algoritmo es muy inmune a la presencia de ruido y a la variación de la iluminación[9]. Para el uso de esta función se necesitan los valores aproximados de los radios mínimos, máximos del iris y la pupila, mediante la transformada circular de Hough, se procede a encontrar los círculos como se muestra en la Figura 11.
La detección y grafica de los círculos no es un proceso que determine el funcionamiento final del algoritmo ya que no es necesario mostrar el circulo de la pupila o el iris para su funcionamiento, La variable a considerar es el centro de la imagen, sabiendo por las pruebas realizadas que al hallar el centro de la imagen, siempre y cuando se detecte un circulo que corresponda a los umbrales de la pupila o el iris, la imagen normalizada resultante será una que permitirá la continuación del proceso, de lo contrario lo interrumpirá, de allí que cada usuario debe realizar un número de pruebas para identificar el punto exacto en el que funciona su iris, y memorizarlo.
6.3 Normalización de la imagen.
Después de encontrar los círculos del iris y la pupila se pasa a la normalización, este proceso también es muy importante ya que si no se hace una correcta normalización de la imagen mucha información se perderá, Este proceso facilita el reconocimiento biométrico ya que las imágenes pueden venir en varios tamaños que dependen de la distancia a la cámara, la posición del ojo o la dilatación de la pupila, lo que hace esta función es tomar esas imágenes y pasarlas de coordenadas rectangulares a polares haciendo así que la imagen del iris tome un tamaño constante[10] como se muestra en la Figura 12.
Figura 12.Normalización del iris [10]
Esta función está basado en el Ruber Sheet Model (imagen3) de J. Daugman.
A cada punto de la región del iris se le asigna un par de coordenadas polares [r,θ], donde r está en el intervalo [0,1] y θ es el ángulo que está entre [0,2π] con estas coordenadas se convierte cualquier imagen del iris en un rectángulo constante[11].
A cada par de puntos se le asignan un par de coordenadas de la como se ve a continuación: ( ( ) ( )) ( ) (1) Donde: ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) (2,3) Siendo:
( ) La región del iris.
( ) Las coordenadas cartesianas originales.
( ) Las coordenadas polares normalizadas.
La función de normalización recibe como parámetros iniciales la imagen a escala de grises que se va a normalizar, el radio mínimo que es el de la pupila y el radio máximo que es el del iris, también pide los valores de salida de la imagen normalizada del iris Figura 13.
El indicador amarillo Señala el iris del usuario
El indicador de color verde señala la pupila del usuario
El indicador de color rojo señala la parte de la esclerótica del ojo.
La imagen normalizada del iris resultante muestra todo el componente de la misma, siendo la esclerótica, y la pupila tomadas aparte y parte de las pestañas vinculadas al iris de comparación, se realizara un recorte de la imagen tomando la parte menos afectada por la iluminación interna y externa, así como la que tenga menos vinculación de las partes del ojo, el resultado de esta imagen depende de la captura inicial, ya que se tiene un tamaño fijo para el circulo a capturar sea de la pupila o el iris siendo que si no se toman esas medidas la imagen resultante producirá una falla y el reconocimiento será nulo, al momento de realizar la captura de la imagen del ojo, se tiene una dimensión especifica de la ventana de funcionamiento, se
especifican las coordenadas del iris y se realiza un recorte de la imagen por medio de la función “rezise” el recorte de la imagen normalizada en la Figura 13 el resultado se aprecia en la Figura 14.
Figura 14. Imagen normalizada del iris con recorte de selección
El tamaño de la imagen del iris normalizado puede variar según la toma de la misma, así como el resultado de su comparación, según se ve en la Figura 14 obteniendo más datos de funcionamiento.
6.4 Extracción de características.
Después de realizar la normalización de la imagen del iris se pasa a la extracción de características, a partir de estas se realiza la comparación y posterior clasificación. Por la naturaleza del iris y su apariencia aleatoria hace de este órgano perfecto para el reconocimiento biométrico. Con el fin de lograr la mayor f idelidad de este programa se procede a conseguir la mayor cantidad de información posible, de manera que puedan realizarse comparaciones confiables entre plantillas, Los procesos para realiza la comparación depende de la toma de la imagen, sabiendo que se tiene una base de datos por cada usuario presente en el aplicativo, se tiene en cuenta que aun cuando el usuario tenga clara la posición para la toma de la imagen esta no será igual, y puede que tampoco sea parecida, la imagen puede moverse un poco a la derecha o a la izquierda, un poco arriba o abajo y de esta manera ya habría tomado nuevas características o nueva información que harían que la fiabilidad de la imagen disminuyera, por lo cual se debe tomar características que estén presentes de manera general en el análisis y no de manera particular.
La extracción de características depende de los filtros o métodos utilizados para administrar o aprovechar la información de nuestra imagen normalizada, véase la Figura 14, a continuación se muestra el
componentes de cada imagen y obtener una selección y método adecuado para la captación de características.
6.4.1 Filtros de imagen.
Los filtros en las imágenes permiten obtener características específicas mediante la segmentación, la creación de umbrales, la verificación de puntos para rellanar o vaciar dejando formas específicas, tomando un resultado para una comparación final, en el proceso de análisis de la imagen del iris se verifico el funcionamiento de los filtros y el resultado de las imágenes, así como la comparación respectiva entre una y obteniendo así el mejor método para el análisis respectivo.
Entre los filtros de prueba se encuentra el filtro de líneas de Hough con umbrales del filtro de Canny, filtros de erosión y dilatación, usados comúnmente para la limpieza de imágenes binarizadas con ruido que limitan la comparación de formas específicas, filtros matemáticos como el filtro de gradiente que permite distorsionar la imagen en escala de grises según un respectivo umbral de funcionamiento, el filtro de sombre (Tophat) y sombrero negro (Blackhat) que procesan la imagen con un umbral dejando sus colores oscuros resaltados para un análisis posterior de las imágenes con sombras, se puede ver el resultado de los filtros a partir de una imagen normalizada y recortada del iris en la Figura 14.
Se puede ver en la Figura 15 el resultado de los filtros y el tratamiento que realiza a las imágenes respectivas, el proceso de prueba para cada filtro se realizó de la siguiente manera.
1) Se toma cada coordenada de la imagen y se almacena en un arreglo, según el número de 1 o ceros lógicos y se guarda para su posterior comparación.
2) Se toma de los filtros de Canny, Tophat, Blackhat el número correspondiente a líneas o datos diferentes que ya arroja de Figura 15. Resultado de los filtros aplicados a la imagen normalizada.
manera automática el filtro respectivo y se guarda su valor para su respectiva comparación.
3) Se realiza la mezcla de filtros, tomando el filtro de erosión o dilatación respectivamente y binarizado su información, tomando los 1 lógicos, las partes blancas de la imagen y los ceros lógicos y adquiriendo un promedio resultante.
4) Se guardan los datos directos de filtros como el Canny, el Tophat, la binarizacion con acumulación de puntos y se guarda como datos de comparación, asumiendo que la cantidad de datos no se presentara de la misma manera en dos usuarios.
Estos métodos de filtrado permiten darle a la imagen del iris una claridad al momento de su captura eliminando los posibles ruidos que se pudieron obtener al momento de la captura, por el movimiento o los índices de luz dejando como resultado el uso del filtro de dilatación aplicado a la imagen para la mejora de la textura, como se ve en la Figura 16 que apoya al algoritmo de detección de círculos.
Para en análisis de la imagen y la toma de muestra de características se determinó que los filtros no permitían obtener la información adecuada tras las pruebas, ya que los métodos de uso no daban una respuesta adecuada que permitiera aprovechar los métodos propuestos, por lo cual se planteó la idea del análisis del histograma de la imagen.