En el desarrollo de la metodología para la creación de un sistema generador de
patrones, se identifican un conjunto de elementos básicos, involucrados en una
serie de fases, con actividades determinadas.
La figura 3.4, presenta un esquema en el que muestran los elementos
conceptuales básicos, empleados por la metodología a desarrollar:
CAPÍTULO 3. METODOLOGÍA PROPUESTA.
Lic. René Tadeo Figueroa Tabares 43
Tabla 3.1 Glosario básico de elementos empleados por la metodología propuesta.
3.2.1 FASES DE LA METODOLOGÍA PROPUESTA
En la elaboración de la metodología para la creación de un sistema generador de
patrones en el contexto de minería de texto, se involucra un grupo de actividades
que se encuentran separadas en 5 fases principales, las cuales son citadas a
continuación:
Fase 1. Extracción de oraciones y elementos sintácticos.
Fase 2. Formación de Patrones básicos.
Fase 3. Generación de Patrones de Interés.
Fase 4. Validación de Patrones de Interés.
Fase 5. Clasificación de Patrones de Interés. De donde se propone lo siguiente:
3.2.2 INTEGRACIÓN ENTRE FASES Y ELEMENTOS DE LA METODOLOGÍA PROPUESTA.
Partiendo de la integración entre componentes y fases, se crea una visión global
de la metodología a desarrollar, y da inicio a la creación de un modelo descriptivo
generalizado, representado por el esquema contenido en la figura 3.5, donde se
muestra la sucesión de cada una de las fases en relación con los elementos
requeridos .
Glosario Básico
Término Descripción
Texto Fuente Bloque o agrupación de texto, que contiene la información de un dominio especifico acerca del tema a tratar. (significativo, representativo, y con diversidad) Elementos Sintácticos Conformados por las palabras que con una semántica determinada definen el tipo
de acción dentro una oración.
Componentes Básicos Componentes que hacen referencia a las funciones gramaticales que cumplen las palabras dentro de una oración.
Patrón Básico Plantilla formada por componentes estructurales definidos por los elementos sintácticos extraídos de una oración.
Patrón de Interés
Plantilla formada por componentes estructurales definidos por la mayor generalización obtenida de los componentes estructurales de un con junto de patrones con características semánticas similares.
Patrones Selectos Conjunto formado por agrupaciones de patrones con características semánticas similares.
CAPÍTULO 3. METODOLOGÍA PROPUESTA.
Lic. René Tadeo Figueroa Tabares 44
Texto fuente.
Elementos sintácticos.
Patrones básicos. Patrones de interés. Filtros. Patrones selectos. fase 1. Extracción fase 2. Formación fase 3. Generación fase 4. Validación fase 5. Clasificación Texto fuente.
Elementos sintácticos.
Patrones básicos. Patrones de interés. Filtros. Patrones selectos. fase 1. Extracción fase 2. Formación fase 3. Generación fase 4. Validación fase 5. Clasificación
Figura 3.5 Integración entre fases y elementos de la metodología propuesta [Elaboración Propia].
La integración mostrada por la figura 3.5, entre fases y elementos será descrita de manera general a continuación:
Fase 1. Extracción de oraciones y elementos sintácticos. (A partir de un texto fuente) En esta fase se realiza lo siguiente:
• Identificar el medio ambiente y el tema que dará origen a los patrones básicos.
• Seleccionar un bloque de texto, denominado Texto Fuente.
• Extraer las oraciones qué representan mayor relevancia en el tema tratado
• Identificar los elementos sintácticos de cada oración empleados en la formación de patrones básicos.
El objetivo de esta fase es obtener las oraciones más representativas a partir del Texto Fuente, e identificar los Elementos Sintácticos presentes en dichas oraciones.
CAPÍTULO 3. METODOLOGÍA PROPUESTA.
Lic. René Tadeo Figueroa Tabares 45
Fase 2. Formación de Patrones básicos. (A partir de elementos sintácticos) En esta fase se realiza lo siguiente:
• Formar Patrones básicos a partir de los elementos sintácticos identificados en cada oración.
Los objetivos en esta fase son crear Patrones básicos a partir de los elementos sintácticos de cada oración, empleando una plantilla, e identificando entre los Patrones básicos, cuales poseen mayores semejanzas, permitiendo la agrupación de patrones básicos por similitud.
Fase 3. Generación de Patrones de Interés. (A partir de Patrones básicos) En esta fase se realiza lo siguiente:
• Obtener los Componentes Semánticos, para generar los Patrones de Interés a partir de los Componentes Sintácticos, extraídos de Patrones básicos.
El objetivo en está fase es generar Patrones de Interés, que posean características de similitud con los elementos sintácticos de dos o más Patrones básicos formados en la fase anterior.
Fase 4. Validación de Patrones de Interés. (Filtrado) En esta fase se realiza lo siguiente:
• Realizar procesos de filtrado para seleccionar los patrones de mayor interés. El objetivo de esta fase es reducir de forma considerable la cantidad inicial de Patrones de Interés a través de procesos de filtrado.
Fase 5. Clasificación de Patrones de Interés. (Patrones Selectos) En esta fase se realiza lo siguiente:
• Clasificación de los patrones de interés.
El objetivo de esta fase es integrar los Patrones de Interés a través de la creación de un conjunto de patrones que poseen características de similitud.
Conclusión. (Portabilidad de los Patrones Selectos) Se pretende comprobar la capacidad de un conjunto de patrones para operar sobre dominios diferentes al de origen.
CAPÍTULO 3. METODOLOGÍA PROPUESTA.
Lic. René Tadeo Figueroa Tabares 46
3.2.6 ESQUEMA DE LA METODOLOGÍA PROPUESTA.
En este punto se visualiza un esquema representando de una manera abstracta
los principales componentes, las fases requeridas y las actividades básicas, para
el desarrollo de la metodología para la creación de un sistema generador de
patrones en el contexto de minería de texto.
Figura 3.6 Metodología para la creación de un sistema generador de patrones [Elaboración Propia]. Fase 1. Extracción de oraciones y elementos
sintácticos.
Fase 2.Formación de Patrones básicos.
á
Fase 3. Generación de Patrones de Interés.
Fase 4. Validación de Patrones de Interés.
Fase 5.Clasificación de Patrones de Interés.
Texto fuente
Contexto de estudio.
Temas diferentes al del
texto qué origino los
patrones de interés.
Conclusión: portabilidad de los patrones selectos.
CAPÍTULO 3. METODOLOGÍA PROPUESTA.
Lic. René Tadeo Figueroa Tabares 47