Seminario
Aplicaciones de las Redes Neuronales
(WebSOM)
Inteligencia Artificial 5oInformática IA curso 2012-2013 CCIA Noviembre 2012Usos de los Mapas Auto-Organizativos
Idea base:Aprovechar las capacidades de auto-organización para aplicar métodos basados en SOM sobre colecciones ...
... con un gran número de datos
I muchos elementos⇒muchos vectores
... con datos complejos
I muchos atributos⇒vectores de alta dimensión
Campos de aplicación
1 SOM en visualización de datos 2 SOM en compresión de datos
3 SOM en extracción de prototipos y características
Campos de aplicación (I)
SOM en visualización de datosObjetivo:reducción de dimensiónsobre vectores con un gran no de dimensiones
I Escalado multidimensional
Mapeo de un espacion-dimesional (capa de entrada) a un espacio bidimensional (capa de competición)
I Resumir datos multidimensionales en un”mapa plano”
Permite el descubrimiento y visualización de relaciones entre datos de entrada
I SOM preservan la”topología semántica”de los datos de entrada,
capturándola y trasladándola a la capa de competición
F Datos de entrada”semánticamente próximos”activarán neuronas próximas
I Relaciones no evidentes en el conjunto de entrada se hacen
visibles en el mapa
Ejemplo: Mapa de la ”pobreza” mundial
(Helsinki University of Technology)http://www.cis.hut.fi/research/som-research/worldmap.html
Países descritos mediante vectores de 39 indicadores de calidad de vida (nivel educativo, sistema sanitario, etc)
Despues del entrenamiento del SOM:
I cada neurona de competición se ”especializa” en paises (1 ó más)
con caraterísticas similares
I paises con niveles de riqueza similares activan neuronas próximas
Campos de aplicación (II)
SOM en compresión de datosObjetivo:usar elescalado dimensionalpara generar una nueva versión”compacta”de los datos de entrada que preserve las relaciones”semánticas”entre ellos
Explotar la”salida”del SOM para obtener una versión más manejable de los datos de entrada
I Entrada: patrones de entrada (ndimensiones) I Salida: construida a partir de la capa de competición
F Neurona ganadora”representa”al patrón de entrada
Patrón entrada→clase discreta
F Todas las neuronas”representan”al patrón de entrada
Patrón entrada→vector de”correspondencias”(proximidad con neuronas)
SOM en extracción de prototipos y características
Objetivo:explotar”conocimiento implícito”descubierto por SOM
I Identificación devectores representantesde cada uno de los
”grupos”asociados a las neuronas de competición
I Selección de componentes (o combinaciones de componentes)
que”dominan”la activación de las neuronas
F También permite ponderación de componentes
WebSOM: organización de documentos
Herramienta para la organización de grandes colecciones de docs. textuales
Organiza los documentos estructurándolos en un”mapa”en función de su contenido
Documentos similares (misma temática) se ubican en zonas próximas del”mapa”
Permite la navegación por ese”mapa de documentos”
(estructuración en niveles)
http://websom.hut.fi/websom/
Tareas:
1 Representación de documentos
I Documentos = vectores numéricos representando su contenido I Representación de palabras y ponderación
2 Organización de los documentos (entrenamiento del SOM) 3 Generación del interfaz de presentación
I Asignación de documentos a posiciones del mapa (neuronas) I Etiquetado del mapa (neuronas)
WebSOM: representación de documentos (I)
Transformación de cada documento en unvector numérico
Problema: gran número de palabras⇒reducir dimensión
Fase 1:preprocesamiento de la colección Filtrado:
eliminarpalabras vacias
tomar palabras presentes en al menos 30 docs.
Normalización de palabras (extracción de raices) Agrupar palabras en”clases de palabras”usando SOM
I Creación demapa de categorías de palabras(≈diccionario de ”sinónimos”)
Mapa de categorias de palabras(WCM:word category map)
1 Cada palabra de la colección tiene asociado un vector que
representa su”contexto medio”de aparición(ventana de longitud 1) I se asigna un vector aleatorio único a cada palabraWi(≈función hash [huella única])
I media de los vectores aleatorios de las palabras que aparecen antes deWi(contexto anterior medio)
I media de los vectores aleatorios de las palabras que aparecen después deWi(contexto posterior medio) 2 Entrenarword category mapcon los vectores resultantes
I Es un SOM que”agrupa”palabras con contextos medios similares I IDEA:sinónimos y palabras cercanas semánticamente ó palabras
que representan conceptos relacionados”caen”en la misma neurona (= categoría)
WebSOM: representación de documentos (II)
Mapa de categorías de palabras
Fase 2:representación de documentos
Las palabras de cada doc. son filtradas y normalizadas Cada palabra se pasa por elword category mapya entrenado para obtener su ”clase” (neurona activada)
El vector que representará al doc. será unhistogramade la frecuencia de las categorías del WCM que contiene ese doc.
I Un componente por cada neurona/categoria del WCM
Reducción de dimensión
I decenas de miles de palabras→cientos/miles de categorias
WebSOM: organización y visualización de docs. (I)
Con los vectores asociados a cada uno de los docs. de la colección se entrena otro SOM (elmapa de documentos)
IDEA:Cada neurona especializa en un tipo de documentos(≈tema)
Cada doc. ocupa un lugar en el mapa en función de su contenido Docs. de temática similar ”caen” en misma neurona(o una próxima)
A cada punto (neurona) del mapa de documentos se le asocia: Lista de docs.”ubicados”en ese punto
Lista de palabras descriptivas
I Tienen
alta frecuencia de aparación en docs. de esa neurona baja frecuencia de aparación en docs. de otras neurona
Construcción de la interfaz de navegación/presentación
División en niveles de detalle
Etiquetado de puntos(neuronas) y regiones en base a las palabras descriptivas y su ”fuerza”
Dentro de cada nivel→colorindica ladensidad de documentos
en una región del mapa
WebSOM: organización y visualización de docs. (II)
WebSOM: Esquema general del proceso
Temas a desarrollar
Ejemplos de usos prácticos de los SOM
I en visualización de datos
I en reconocimiento de formas y procesam. de imágenes I en preprocesamiento de datos
I otros, ...
Usos prácticos de las redes neuronales en general
I Predicción y clasificación I Procesamiento de imágenes I etc
Revisión de herramientas/sistemas relacionados (con SOMs ó con RNAs en general)
etc,...
Referencias
WebSOM:http://websom.hut.fi/websom
T. Kohonen:http://www.cis.hut.fi/research/som-research