Capítulo 5. Metodología Propuesta
5.2. Descripción General de un Sistema de Reconocimiento de Rostros
Para realizar un sistema de reconocimiento automático de rostros existen muchas variables que considerar, dependiendo de estas se pueden utilizar distintos métodos en conjunto para lograr el mejor desempeño del sistema, sin embargo, esto sólo se consigue con un gran número de pruebas, ya que algunos métodos dan mejores resultados que otros, dependiendo el problema que se trate de resolver.
La función principal de un sistema de rostros es la comparación de una imagen de entrada con un conjunto de imágenes que el sistema tiene como entrenamiento, y decidir cual imagen es la que más se parece.
Como ya se ha mencionado el algoritmo principal de este sistema de reconocimiento de rostros es el Análisis de Componentes Principales (PCA), cuyo objetivo es reducir la dimensión de un conjunto de datos, de modo que la nueva base describa mejor las características del conjunto. En términos matemáticos, se desea encontrar los componentes principales de la distribución de rostros.
5.2.1. Factores de Ruido.
Antes de poder utilizar el sistema de reconocimiento hay que contar con una base de datos, que contenga una cierta cantidad de imágenes, para que pueda funcionar el sistema, cada persona (denominada clase), debe contar con un determinado número de imágenes y como mínimo deben ser tres personas con una imagen de cada uno.
Existen cinco factores principales que pueden afectar la eficiencia del sistema al momento de tomar las fotos como son:
La Iluminación. Este factor puede considerarse como el más problemático de todos. Sólo con una pequeña variación en la iluminación de dos imágenes de la misma clase el sistema podría confundirse a tal grado de considerar que es otra clase (Ver Figura 5.1).
La Distancia. La distancia puede cambiar al tomar fotos, es por esto que se corre el riesgo de meter ruido, como por ejemplo, que no solo aparezca el rostro sino también los hombros, brazos, etc. Haciendo más difícil comparar. Observar Figura 5.2.
Figura 5.2 Ruido provocado por cambios de distancia.
El Fondo de la Imagen. Si el fondo no fuera uniforme, el sistema puede confundir el rostro y tomar la imagen completa con lo que tenga alrededor. Observar Figura 5.3.
Figura 5.3 Ruido provocado por cambios de fondo.
Cambios Faciales. Si las fotos fueron tomadas en distintos días, puede ser que la persona cuando se tomo las imágenes de entrenamiento utilizaba un tipo de peinado, y cuando se realizo la prueba tenía otro, o inclusive pudo haber tenido gorra. Observar Figura 5.4.
Figura 5.4 Ruido provocado por cambios faciales.
Orientación del Rostro. Esto se debe a que una persona se mueve al tomar la foto por ejemplo: por una distracción. Observar Figura 5.5.
Hay que tener encuentra que algunas imágenes se utilizaran para el entrenamiento del sistema y otras para el reconocimiento, y que al aumentar el número de fotos por clase también aumenta dramáticamente el tiempo de entrenamiento.
Las imágenes de entrenamiento deben ser distintas a las que se utilizan para el reconocimiento, estas últimas incluso pueden tomarse en el instante que se quiera probar el sistema, previamente entrenado con las imágenes de la clase que se quiera utilizar.
5.2.2. Etapas del Sistema.
1. Etapa de entrenamiento. En el proceso de entrenamiento se utiliza una base de datos de imágenes como entrada, y por medio de PCA obtener sus Eigenvectores, Eigenvalores y Eigenfaces, para poder formar el face space. Que se utiliza para que las imágenes de entrenamiento se han proyectadas sobre él. Y obtener sus vectores característicos. Como se muestra en la Figura 5-6.
2. Proyección de imagen(es) de prueba. Una vez que está entrenado el sistema, y se desea reconocer una persona, se coloca la imagen para ser proyectada al face space y de esta forma obtener su vector característico, como se muestra en la Figura 5.7.
Conjunto de entrenamiento. 1, 2, 3,… M Procesamiento digital de la imagen Computar imagen promedio i Calcular vectores de desviación i = i - i Cálculo de la matriz de covarianza Calcular Eigenvectores, Eigenvalores. Cálculo de Eigenfaces Ordenar por eigenvalor Proyectar cada imagen de entrenamiento al “face space” Obtener el vector característico de cada imagen. Imagen(es) de prueba. Vectores de desviación media Proyectar al “face space” Cálculo del vector característico.
3. Etapa de Reconocimiento. Esta etapa consiste en la comparación a través de un clasificador euclidiano de los vectores característicos de las imágenes de entrenamiento y el vector característico de una imagen de prueba.
El funcionamiento del clasificador euclidiano consiste en las siguientes etapas:
1. Dado un vector (el vector característico de una imagen de prueba), calcular las distancias euclidianas de a cada uno de los vectores característicos de las imágenes
de entrenamiento .
2. Asignar a la imagen , tal que la distancia es mínima. La figura 5.9 muestra el diagrama a bloques de este proceso de reconocimiento.
La función de distancia del clasificador euclidiano es obviamente la distancia euclidiana. Sin embargo, se pueden emplear otras métricas, como la distancia Manhattan o la distancia Minkowsky. La elección de estas métricas debe hacerse tomando en cuenta la carga computacional que su cálculo conlleva. Finalmente la Figura 5.10 muestra un diagrama generalizado del sistema de reconocimiento de
Vector característico de la(s) imagen(es) de
prueba.
Clasificador euclidiano Cálculo de las distancias
euclidianas entre los vectores característicos. Vector característico de la(s) imagen(es) de entrenamiento. Función de decisión de distancia mínima
Figura 5.8 Diagrama a bloques de la etapa de reconocimiento.