Analizador léxico-sintáctico para el lenguaje de animacuento
Texto completo
(2) MISC-03-1-8. AGRADECIMIENTOS. A Dahlan Leguízamo Arango, Filólogo y Licenciado en Español y Lenguas Clásicas, de la Universidad Nacional, Bogotá. Consultor para Instituciones Educativas sobre Bilingüismo.. A Betulia Pantoja de Cardona, Licenciada en Pedagogía, con estudios Superiores en Español y Mayores en Administración, de la Universidad Javeriana, Bogotá. Investigadora y Docente de español en primaria y bachillerato.. Al Politécnico Grancolombiano, Institución Universitaria, por el apoyo económico y en tiempo, y a mis jefes y compañeros que estuvieron siempre dispuestos a colaborar.. A Germán y Amanda, mis padres, quienes siempre me apoyaron e impulsaron a tener fe en mí.. A mi esposa Adriana y mi hija Ana Cristina, por su apoyo, experiencia, paciencia y haber sacrificado tanto tiempo familiar en pro de mi progreso académico y profesional, y el desarrollo de la pedagogía a través de la informática.. A los profesores, asesores y jurados de este trabajo por su dedicación y aportes para lograr un resultado excelente.. A Dios, por comandar mi vida y darme esta gran oportunidad.. Sinceramente,. Juan Carlos Muñoz Ruiz. 1.
(3) MISC-03-1-8. INDICE. AGRADECIMIENTOS................................................................................................ 1 INTRODUCCION........................................................................................................ 5 1. ESTRUCTURA......................................................................................................... 9 1.1. PLANTEAMIENTO DEL PROBLEMA .............................................................. 9 1.1.1. Marco General................................................................................................... 9 1.1.2. Marco General................................................................................................. 10. 1.2. OBJETIVO GENERAL...................................................................................... 10 1.3. RESULTADOS ESPERADOS ........................................................................... 11 2. PROPUESTA PEDAGÓGICA .............................................................................. 13 2.1. Análisis Educativo.............................................................................................. 14 2.2. Fundamento Teórico de la Propuesta Educativa................................................ 15. 3. ANTECEDENTES DEL PROCESAMIENTO DE LENGUAJES...................... 22 3.1. Procesamiento del lenguaje natural.................................................................... 22 3.2. Definición de categorías Gramaticales................................................................ 24 3.3. Gramática .......................................................................................................... 29 3.4. Métodos de Parseo (Análisis Gramatical) ........................................................... 31. 4. ESTADO DEL ARTE DE ANALIZADORES ...................................................... 33 4.1. Analizadores Léxicos .......................................................................................... 33 4.1.1. FLEX.....................................................................................................................................................33 4.1.2. LEX .......................................................................................................................................................34. 4.2. Analizadores Sintácticos..................................................................................... 36 4.2.2. Lekta .....................................................................................................................................................37 4.2.3. O2RTED ..............................................................................................................................................39 4.2.4. LOAD-AND-GO ................................................................................................................................40 4.2.5. Analizador sintáctico en Pascal........................................................................................................41. 4.3. Analizadores Semánticos .................................................................................... 43 4.3.1. Analizador semántico en Pascal.......................................................................................................44. 4.4. Editores.............................................................................................................. 45 4.4.1. ICEedito ...............................................................................................................................................45 4.4.2. Editores de líneas, objetos de tipo {lineedit} ................................................................................45 4.4.3. Editores de texto con formato ..........................................................................................................46 4.4.4. Editores de texto simple ....................................................................................................................46 4.4.5. Editores de texto mejorados .............................................................................................................46. 2.
(4) MISC-03-1-8. 4.5. Compiladores ..................................................................................................... 46 4.5.1. ALE.......................................................................................................................................................46 4.5.2. La Maquina De Pila ...........................................................................................................................47 4.5.3. Funcionamiento del compilador en Pascal.....................................................................................48. 4.6. Generadores de Analizadores............................................................................. 49 4.6.1. Yacc ......................................................................................................................................................49 4.6.2. PleNa ....................................................................................................................................................50 4.6.3. Analizador de lenguaje para Animacuento....................................................................................51 4.6.4. Edición Interactiva de entornos incrementales..............................................................................52 4.6.5. Bison.....................................................................................................................................................53 4.6.6. Departamento de Lenguajes y Sistemas Informáticos de la Universidad de Alicante ..........54. 4.7. Diccionario de algunos términos de la investigación sobre el estado del Arte...... 55. 5. DESARROLLO DEL MEC: ANALIZADOR LEXICO-SINTACTICO PARA EL LENGUAJE DE ANIMACUENTO .......................................................................... 57 5.1. Identificación de necesidades Educativas ............................................................ 57 5.2. Entorno para el diseño del MEC ........................................................................ 58 5.2.1. Educación ............................................................................................................................................58 5.2.2. Calidad de la composición y escritura ............................................................................................59 5.2.3. Preparación de los maestros.............................................................................................................59 5.2.4. Pedagogía: ...........................................................................................................................................60 5.2.5. Experiencia personal..........................................................................................................................60 5.2.6. Herramientas tecnológicas al alcance de todos.............................................................................61 5.2.7. Ausencia del espacio para la imaginación......................................................................................61. 5.3. Establecimiento del Papel del Computador en este MEC ................................... 62 5.4. Soluciones Existentes.......................................................................................... 62 5.5. Diseño del MEC.................................................................................................. 62 5.5.1. El entorno.............................................................................................................................................63 5.5.2. Diseño Educativo ...............................................................................................................................63 5.5.3. Diseño de Comunicación ..................................................................................................................64 5.5.4. Diseño Computacional ......................................................................................................................65 5.5.5. Preparación..........................................................................................................................................67. 5.6. Evaluación.......................................................................................................... 70 5.7. Pruebas Realizadas............................................................................................. 71 5.7.1. Ejemplo de estructuras gramaticales ...............................................................................................71. 6. CONCLUSIONES Y TRABAJOS FUTUROS...................................................... 73 6.1. Trabajos Futuros................................................................................................ 74. BIBLIOGRAFIA........................................................................................................ 75 ANEXO 1. COMPONENTES Y RELACIONES...................................................... 79 ANEXO 2. MANUAL DEL USUARIO ..................................................................... 80 ANEXO 3. DOCUMENTO DE ARQUITECTURA.................................................. 87 Control de Revisiones................................................................................................. 87. 3.
(5) MISC-03-1-8. Estructura de Uso de Módulos................................................................................... 88 Descripción Global de la estructura de uso de módulos ............................................ 88 Presentación....................................................................................................................................................89 Lógica de aplicación .....................................................................................................................................90 Almacenamiento............................................................................................................................................91. Descripción de Componentes.................................................................................... 91 Descripción de Dependencias .................................................................................... 91. Estructura Física........................................................................................................ 92 Descripción Global de la estructura Física................................................................ 92 Descripción de Dependencias .................................................................................... 94. Estructura de Procesos............................................................................................... 94 Descripción de Componentes.................................................................................... 94. ÍNDICE DE FIGURAS. Figura 1: Analizador Sintáctico en Pascal - Expresión y su ………………………………42 representación en un árbol de expansión. Figura 2: Analizador Sintáctico en Pascal - Expresión y su ………………………………43 representación en un árbol de expansión. Figura 3: Compilador en Pascal – Proceso de compilación ………………………………47 de un fragmento del programa Figura 4: Compilador en Pascal – Funcionamiento de un linker ………………………….48 Figura 5: Ejemplo estructura gramatical …………………………………………………..71. 4.
(6) MISC-03-1-8. INTRODUCCION. El proyecto completo de AnimaCuento incluye, por un lado, el diseño e implementación de una herramienta pedagógica, y por otro, la animación gráfica que corresponde a dicha implementación. El objetivo principal de este trabajo es comple tar la primera parte, es decir, el diseño e implementación de la herramienta pedagógica, dejando por fuera la mayor parte del trabajo de animación correspondiente, ya que éste es un proyecto de grado del Magíster en Ingeniería de Sistemas y Computación con énfasis en Informática Educativa, y no en Computación Gráfica. Esta segunda parte del proyecto completo de AnimaCuento, podría constituir en sí mismo, otro proyecto de grado en Animación. El diseño e implementación de la Herramienta comprende a su vez, dos aspectos principales: El diseño educativo de AnimaCuento como Ejercitador de Gramática Normativa, y el análisis del problema de interpretar el lenguaje natural en lengua española. El Material Educativo Computarizado, MEC, que aquí se presenta busca aportar una herramienta pedagógica para facilitar el refuerzo en la asimilación de distintos aspectos de la Gramática Normativa como herramienta para la cátedra de español a nivel de primaria y secundaria principalmente, a través de un ambiente de composición escrita. Es muy importante que los profesores y planteles educativos jueguen un papel activo en la utilización de MECs, pues no sólo les sirve a ellos para facilitar la enseñanza, sino que les puede apoyar en la medición o diagnóstico de los resultados de aprendizaje. En este contexto, el MEC se convierte en un gran indicador de sus facultades pedagógicas o métodos de enseñanza y así es posible hacer los cambios necesarios a tiempo. Las herramientas tecnológicas que hoy facilitan y complementan. 5.
(7) MISC-03-1-8. los métodos de enseñanza, son también valiosas herramientas para orientar al maestro y facilitar su evaluación, condición que debe ser aprovechada por las instituciones que quieren mantener y mejorar la calidad de su personal docente. Con el presente trabajo se hará una investigación sobre el Constructivismo, como base teórica que orienta el tipo de conocimiento que se intenta desarrollar a través de Animacuento, pues desde esta perspectiva, lo que se logra con esta herramienta pedagógica es, entre otros objetivos, la construcción por parte del alumno de un conocimiento que sea realmente significativo para su vida, y que por lo tanto, posea la perdurabilidad necesaria en su memoria para que luego sea capaz de utilizarlo en forma práctica. Tal tipo de conocimiento se construye a través de la experiencia personal del niño, al explorar y descubrir las múltiples posibilidades que le brinda AnimaCuento, apropiándose del proceso cognitivo y no como “víctima” del mismo. El niño es el personaje principal, el protagonista del aprendizaje, quien toma la iniciativa y construye a partir de su propia personalidad, ya no lo es el maestro. Por estas razones, es claro que el marco teórico que orienta y desde el cual se genera esta propuesta pedagógica es sin duda, el Constructivismo. Resulta en cierta forma paradójico en el presente proyecto, que pretenda reforzar aspectos de la Gramática Normativa desde una perspectiva Constructivista, supuestamente más abierta y libre de esquemas. La razón de esto es que los enfoques descriptivos de la Gramática, como el Generativismo contemporáneo, aunque son muy exitosos en cuanto al alcance de los análisis sintáctico y semántico, todavía no satisface la necesidad que tiene la escuela de proporcionar una comprensión estándar del uso de la lengua. Carecen de herramientas didácticas enfocadas al estudiante común que posee poca erudición. Por eso, aún después de estar supuestamente revaluada hace décadas, la gramática normativa se sigue hoy en día enseñando en la escuela. Adicionalmente, la Real Academia de la Lengua Española está trabajando en un proyecto que combina ambos enfoques grama ticales -normativo y descriptivo- con el. 6.
(8) MISC-03-1-8. fin de facilitar su aprendizaje, proyecto que puede ser implementado fácilmente por AnimaCuento gracias a su naturaleza flexible que permite establecer las normas gramaticales a ser practicadas. El pasado mes de Junio de 2003, se reunió la comisión interacadémica de la Asociación de Academias de la Lengua española con el objeto de elaborar una nueva gramática general, de carácter normativo y descriptivo, la cual se dará a conocer en el 2005. El secretario de la Real Academia Española, Guillermo Rojo, afirmó que este progreso en el español está condicionado al avance de los cursos del idioma como lengua extranjera y, «lo más importante de todo, por el manejo de la lengua en los medios de comunicación pública, como es el caso de Estados Unidos, donde ya hay casi 40 millones de hispanohablantes y donde 2 cadenas de televisión emiten en español las 24 horas del día», afirmó. El director de la Real Academia de la Lengua Española y presidente de las 22 instituciones afiliadas que existen en el mundo, Víctor García de la Concha, agregó que todas las academias "trabajan en plano de la igualdad y al servicio de la unidad de la lengua, que es el gran objetivo". Por otro lado, la interpretación del lenguaje natural por parte del sistema computarizado viene siendo un gran reto desde los inicios de la informática, pues el hombre ha tenido que simplificar y restringirse a pequeños “lenguajes especia lizados” que limitan sus posibilidades de comunicación con la máquina. Es así como los programadores han tenido que aprender lenguaje de máquina, adaptándose a ellas, en lugar de adaptar las máquinas al lenguaje natural. Esto es obvio después de entender la alta complejidad que nuestro lenguaje implica para el procesamiento de información, pues tenemos gramáticas muy complejas, diccionarios extensos y ni hablar de sinónimos y palabras derivadas. Este problema ha sido evidente desde que se inició la comunicación hombre- máquina a través del lenguaje humano y existe ya una larga serie de intentos (algunos exitosos y otros no) por lograr que la máquina sea capaz de recibir mensajes de usuarios en lenguaje natural y los interprete. Entre estos. 7.
(9) MISC-03-1-8. intentos se encuent ran analizadores léxicos, sintácticos, semánticos, traductores y decodificadores de voz entre otros. El presente analizador de lenguaje será formulado con el objetivo principal de alimentar las entradas para AnimaCuento, una herramienta didáctica que fomenta la creatividad en los niños, mientras refuerza sus conocimientos en gramática. A pesar de la existencia de muchos analizadores de lenguaje de uso libre, se encontró una alta complejidad en los mismos, que deriva en desperdicios de memoria para el caso en estudio, pues. AnimaCuento dispone de un diccionario limitado para animación. debido a que la salida consiste en animaciones preprogramadas. Sin embargo, el diccionario para construcción de oraciones es tan amplio como se quiera, sin afectar la memoria utilizada en la parte gráfica. Cabe anotar que es muy importante aprovechar los adelantos tecnológicos para facilitar la labor pedagógica y de aprendizaje de los niños, pues cada vez es más difícil captar su concentración por la inmensa cantidad de estímulos externos, diferentes a la educación, de que son objeto. La tecnología, así como un muy buen profesor, puede motivar a los niños a tener gusto por el estudio y el aprendizaje, es pues la hora de romper de una vez por todas con los paradigmas de la educación, la resistencia al cambio, y abrir las aulas escolares hacia las mil posibilidades de la informática. Juan Carlos Muñoz Ruiz. 8.
(10) MISC-03-1-8. 1. ESTRUCTURA. 1.1. PLANTEAMIENTO DEL PROBLEMA 1.1.1. Marco General Para estudiar la problemática aquí presentada, se hace necesario conocer algunas de las características principales que determinan el estado de la educación en Colombia en el aspecto que aquí interesa. Estas son: •. La deserción escolar 1 a temprana edad por falta de motivación hacia el aprendizaje por parte de los niños, y la baja calidad en las habilidades de composición creativa y correctaa escritura, en la población infantil colombiana.. •. El computador como medio de enseñanza-aprendizaje, permite crear situaciones que el usuario puede vivir, analizar, modificar, y someter a prueba sus propios patrones de pensamiento 2. •. Según Censo 1993 3 , el 41% de la población Colombiana son menores de 18 años – mercado potencial de la educación básica.. •. Los planteles de educación básica manifiestan que es cada vez más palpable la necesidad del acceso al refuerzo escolar y muchos han implementado ya sus propios programas de refuerzo en horario adicional.. 1. Secretaría de Educación de Risaralda, Anuario Estadístico1995 Hoy en día existe un dilema entre la gramática normativa (tradicional que hoy por hoy se enseña en los colegios) y la gramática descriptiva o generativa. Esta última es considerada ideal por cuanto no excluye ciertas construcciones gramaticales que difieren de la gramática tradicional. Aunque esta es una alternativa muy adecuada, la gramática generativa no ha logrado reemplazar a la gramática normativa en cuanto a la necesidad de transmitirle al estudiante una comprensión estándar de la lengua. a. 2. GALVIS, Alvaro H., Ingeniería de Software Educativo, Universidad de los Andes, Bogotá, 1997. 3. La dirección http://www.dane.gov.co.. 9.
(11) MISC-03-1-8. •. Plan Nacional Agenda de Conectividad con sus programas Internet Social y Computadores para Educar4 .. 1.1.2. Problema Particular Si se quiere desarrollar una herramienta informática que favorezca la motivación hacia la creatividad, el aprendizaje y estudio, y refuerce las habilidades de lectoescritura, la inquietud principal es: ¿Es posible analizar e interpretar gráficamente textos de lenguaje natural durante la interacción con el programa?. El problema informático a resolver es la posibilidad de analizar gramaticalmente textos en lenguaje natural del idioma español, generando un código intermedio para su posterior análisis y animación.. El problema pedagógico a resolver es la ejercitación de conocimientos gramaticales previamente adquiridos para reforzarlos y la motivación hacia la creatividad en composición de historias.. 1.2. OBJETIVO GENERAL - Diseñar y desarrollar, a partir de una propuesta pedagógica, una herramienta de refuerzo de conocimientos sobre la gramática normativa del lenguaje natural en idioma español que a su vez, sea de ayuda para la labor del profesor. Diseñar y Desarrollar el sistema computarizado “ANALIZADOR LÉXICOSINTACTICO PARA EL LENGUAJE DE ANIMACUENTO”, el cual consiste en la clasificación sintáctica de los componentes de una oración, a partir de la selección, por parte del usuario, de un conjunto de elementos disponibles. El análisis ratifica el. 4. http://www.agenda.gov.co. 10.
(12) MISC-03-1-8. correcto uso de estructuras gramaticales que el profesor desea ejercitar en sus alumnos, y el archivo de resultados le permite conocer los desempeños individuales. Nota: Los usuarios de este sistema comprenden niños desde la edad de los 8 años en adelante, con conocimientos básicos de gramática y ortografía. El mantenimiento está a cargo del profesor. 1.3. RESULTADOS ESPERADOS AnimaCuento es un Material Educativo Computarizado para ejercitar el uso de la Gramática Normativa en el lenguaje natural del id ioma español, que permite al profesor controlar los elementos gramaticales a ejercitar y el desempeño en la práctica de sus alumnos. Se contará con la implementación de un editor que recibe texto, lo analiza e interpreta su sintaxis de acuerdo con los requerimientos del profesor. Concretamente, el resultado final será un Material Educativo Computarizado que facilita el refuerzo de conocimientos en gramática española mediante la ejercitación. Se espera que el módulo gráfico sea totalmente desarrollado en un posterior trabajo para lograr la animación de las historias relatadas. El profesor o tutor puede preparar las estructuras gramaticales que van a ser practicadas por cada alumno, así mismo, hace el seguimiento de la evolución del proceso de aprendizaje mediante los registros internos del ejercitador. El profesor puede definir el vocabulario fuente con el cual los usuarios pueden dejar volar su imaginación y ejercitar su creatividad en la composición de textos escritos que luego serán animados. AnimaCuento está definido para ser usado con Gramática Normativa, pues esa es la que se enseña en los colegios y es la que la mayoría de los niños necesita ejercitar;. 11.
(13) MISC-03-1-8. pero como las estructuras gramaticales se pueden definir en este sistema, es posible adaptarlo a otra gramática que tenga definiciones claras y no dependa de la comprensión subjetiva del lector. El diseño del programa es tan amplio que permite inclusive adaptarlo fácilmente a otro idioma.. 12.
(14) MISC-03-1-8. 2. PROPUESTA PEDAGÓGICA. Animacuento es un MEC, Material Educativo Computarizado, cuya interfase aparece ante el usuario como un ejercitador que le permite hacer una simulación de su fantasía a partir de la teoría Constructivista. Se espera que un niño con los conocimientos gramaticales y ortográficos básicos, y con las operaciones elementales que es capaz de manejar a esa edad, asimile ciertas normas y palabras a través de la práctica, y la motivación de ver su historia animada cuando el proyecto esté completo. Esa misma motivación es necesaria para fomentar la creatividad, pues para escribir un AnimaCuento es necesario que el niño sea creativo, construya su propia historia a partir de unas condiciones léxicas que se le establecen; pero siempre poniendo a trabajar su imaginación. Es necesario que el niño haya recibido los conocimientos anteriormente, puesto que AnimaCuento es una herramienta para lograr refuerzo escolar, de otra forma resultaría un proceso de aprendizaje a través de ensayo y error que para este tema tan claramente definido por normas, no se justifica.. Cabe anotar una aclaración para evitar confusiones entre las teorías educativas, pues el refuerzo escolar aquí referido se refiere a la consolidación de conocimientos mediante la práctica y total entendimiento de la materia a través de una metodología Constructivista. En el conductismo se habla del refuerzo o reforzamiento como elemento de reconocimiento a un resultado positivo o negativo que genera el alumno durante el aprendizaje, así se motiva o desmotiva para seguir generando dicho resultado. Por lo anterior, se solicita no confundir el refuerzo conductista (herramienta de enseñanza) con el refuerzo escolar, (resultado esperado en el alumno después de aplicar una metodología Constructivista en este caso).. 13.
(15) MISC-03-1-8. En su diseño, este Sistema se construye como un MEC de tipo heurístico 5b donde predomina el aprendizaje experiencial, pues el diseño proporciona muchas opciones para crear ambientes, personajes y situaciones que descritas con el lenguaje natural, llevan a experimentar diferentes maneras de expresarse, de escribir las palabras y éstas pueden ser probadas con el MEC. Esta metodología es lo que refuerza el carácter Constructivista de la presente herramienta pedagógica.. 2.1. Análisis Educativo Según Osorio 6 , “Con el MEC (Material Educativo Computarizado) se pretende apoyar el fortalecimiento de las habilidades y capacidades básicas para el desarrollo de los niños. En particular, se apoya el desarrollo de la autoestima, la creatividad, la capacidad de razonamiento, y en especial la colaboración. No pretende enseñar contenidos curriculares”.. Esa es la clave, AnimaCuento no es un texto de estudio, es una herramienta motivadora para el refuerzo del aprendizaje básico de la escritura, gramática y ortografía. Es muy importante que los niños a partir de la vivencia de alguno de sus héroes o personajes creados, pudiendo seguirle los pasos como si estuvieran compartiendo con él, tengan la posibilidad de desarrollar su autoestima, de fomentar el trabajo individual, de poder cumplir unas metas específicas, mientras en el transcurso del juego, va reforzando sus conocimientos con el fin de poder avanzar en el juego mismo. La clave de este juego es que le permite al niño la posibilidad de entretenerse, lo que lo motiva fuertemente mientras se educa. 5. DWYER, T. (1974) ‘Heuristic Strategies for using computers to enrich Education. International Journal of Man-Machine Studies’, 6, 137-195 b heurístico: del griego “heurisco” que significa encontrar, es decir que se podría llamar un método “encontrativo”. Esta es la misma raíz de la palabra “Eureka”: lo encontré. 6 OSORIO G., Luz Adriana, “MINGA: Herramienta Colaborativa, Lúdica y Distribuida en el Contexto de Ludomática”. Universidad de los Andes, Facultad de Ingeniería – Departamento de Sistemas y Computación. Santafé de Bogotá, Marzo 30 de 1.998. 14.
(16) MISC-03-1-8. El AnimaCuento es una herramienta motivadora que además, al trabajar con oraciones escritas, hará el proceso de refuerzo ortográfico, de redacción y el usuario se tendrá que esforzar para mejorar e incrementar su vocabulario.. 2.2. Fundamento Teórico de la Propuesta Educativa El aprendizaje humano es un proceso complejo que ha sido descrito parcialmente por las teorías psicológicas que oscilan entre el Conductismo y el Cognoscitivismo.. El enfoque conductista ha sido tradicionalmente usado en la educación en América Latina, pero durante las últimas dos décadas se han comenzado a implementar versiones prácticas de enfoques llamados “más humanos” y orientados por el Cognoscitivismo.. 2.2.1. Enfoque Cognoscitivo. Las teorías cognoscitivas se basan en dejar de ver al niño como un adulto pequeño y se comienza a valorar la infancia como una etapa única y valiosísima en el desarrollo del ser humano. En esta época el hombre construye la mayor parte de sus procesos mentales y su ejercitación le permite desarrollarse y ajustarse a las exigencias de la vida. Por esto, es necesaria una educación basada en las actividades propias del niño, como son los juegos y la ejercitación de la imaginación.. Se tienen en cuenta las diferentes etapas de desarrollo por las que pasa el niño y que regulan su proceso de aprendizaje. Se distinguen en estos estudios pedagogos como Decroly, Dewey, Claparede, Montessori, Piaget y Freinet. 7. 7. NOT, Louis, “Las Pedagogías del Conocimiento”, Fondo de Cultura Económica, Santafé de Bogotá, 1.994. 15.
(17) MISC-03-1-8. La nueva pedagogía se basa en la estructuración cognoscitiva, pasando de una educación intelectual guiada desde el exterior, a un proyecto en el cual el alumno se convierte en el elemento activo de un conjunto de procesos de los que él mismo tiene que asegurar la dirección. (Montessori). De al misma forma, Claparede considera que los métodos que no llegan al alumno sino desde fuera, son inadaptados a una buena educación, pues ésta no puede ser eficaz sino en y por la acción, vinculada a las necesidades del alumno.. Decroly fundamenta la adquisición de los conocimientos en la exploración, por parte del alumno, de lo s intereses adquiridos en el contacto con su medio: observar, asociar, expresar son las claves del método, así se pueden proponer actividades acordes a las necesidades que los alumnos manifiestan. Así mismo, Dewey adopta el principio de “Aprender haciendo” y sustituye la construcción de las nociones con la acción propia suscitada por las necesidades y los intereses, abandonando la recepción pasiva de los conocimientos al término de una acción externa.. El maestro está llamado a hacer que los alumnos descubran por sí mismos los conocimientos a través de ejercicios que para ellos sean juegos.. Otros principios de la auto estructuración del conocimiento predican que: •. Para que el alumno sea el autor de su propio desarrollo, se invita a centrar el estudio en el niño mismo y no en el adulto.. •. El problema se enfoca en las diferencias entre los individuos. •. Una predicción de la auto estructuración es el rechazo a los modelos adultos tradicionalmente propuestos. •. Liberar al niño es también volver a concederle la palabra. •. Todos los sistemas estudiados en esta corriente repudian la obligación y restricción como instrumentos metodológicos.. 16.
(18) MISC-03-1-8. Las pedagogías aquí propuestas caracterizan un método de enseñanza basado en la libertad, la experiencia y la creatividad. AnimaCuento, como herramienta de aprendizaje y refuerzo tiene un enfoque cognoscitivo, en cuanto a la asimilación dinámica de los conocimientos, así como el desarrollo de la motivación y la creatividad.. Lo que hace definitivamente al AnimaCuento una herramienta. Constructivista es que la iniciativa que genera el proceso de aprendizaje surge del estudiante y que el conocimiento no está completamente predeterminado, sino que en gran medida se construye desde la exploración y creatividad del niño; el niño deja de ser Objeto de la enseñanza y se convierte en el Sujeto que aprende, en el protagonista. La teoría cognoscitiva de Piaget aporta las razones por las cuales es adecuado enseñar la Gramática después de los 7 años de edad, pues es cuando se desarrolla la habilidad de comprender las relaciones entre objetos (palabras) y las operaciones posibles que pueden construirse a partir de ellas. 2.2.1.1. Psicología Evolutiva de Jean Piaget8. Se basa en que el conocimiento no es una copia de la realidad sino una percepción transformadora de la misma, llegando a lo que se concibe como operación. Pero una operación nunca se encuentra aislada sino que siempre está vinculada con otras y hace parte de una estructura total llamada estructura de operaciones. Esta es la base del conocimiento y el problema central consiste en entender la formación, elaboración, organización y funcionamiento de tales estructuras.. Piaget habla de estadios o etapas del desarrollo de las estructuras cognoscitivas relacionadas con las edades de las personas: •. Sensoriomotor: 0 a 2 años, solo hay conciencia de los objetos permanentes.. •. Pensamiento simbólico: 2 a 4 años, donde se dan los comienzos del lenguaje, de la función simbólica y por ende, del pensamiento o representación.. 8. GALVIS, Alvaro H. Ingeniería de Software Educativo, Universidad de los Andes, Bogotá. 1.997. 17.
(19) MISC-03-1-8. •. Pensamiento intuitivo: 4 a 7 años. Aunque hay comprensión de ideas y razonamiento transductivo; en este pensamiento todavía no hay conversiones que son el criterio psicológico para la presencia de operaciones reversibles.. •. Operaciones concretas: 7 a 12 años. Se realizan operaciones sobre objetos: clasificación y ordenamiento, y las demás operaciones de la lógica de clases y de relaciones, de la geometría y de la física elemental. Se desarrolla la idea de número, se realizan operaciones espaciales y temporales. Hay manifestaciones de reversibilidad y uso de razonamiento inductivo.. •. Operaciones formales: 12 años o más. Hay uso de pensamiento hipotético deductivo y de pensamiento formal abstracto. Se controlan variables, se verifican enunciados, se tiene sentido de proporcionalidad y se pueden efectuar operaciones o transformaciones.. Los factores que inciden o intervienen en el aprendizaje o modificación de estructuras cognoscitivas son la maduración, la experiencia, el equilibrio y la transmisión social. La maduración depende del desarrollo biológico de la persona, en el caso de AnimaCuento, se está estableciendo un grupo de edad objetivo que determina el estado de maduración del usuario al cual va dirigido el producto. El principio de la experiencia es determinante, pues por eso AnimaCuento busca que el usuario tenga contacto directo con el producto, juegue muchas veces, y entre más juegue, más experimentación tendrá y más conocimientos reforzará. El nivel de maduración determinará las nuevas posibilidades de experimentación y así el usuario será el determinante de la velocidad de su desarrollo y perfeccionamiento en el tema de aprendizaje. En la medida en que el usuario cometa errores, buscará el equilibrio para solucionarlos, y este equilibrio no es más que la corrección y aprendizaje de las palabras correctamente usadas, sólo así logrará su meta final. La transmisión social se da en la medida en que el usuario asimila los conocimientos correctos para poder seguir jugando, ya no se equivoca al escribir las palabras y es un hecho que ha reforzado sus conocimientos en gramática y ortografía, mientras ha estado jugando a animar historias.. 18.
(20) MISC-03-1-8. Es así como la génesis del comportamiento del aprendizaje se explica enfatizando los mecanismos fundamentalmente intelectuales y endógenos, según Piaget, aunque otros cognoscitivistas la explican enfatizando los mecanismos de influencia sociocultural (Vigotski) o socio afectivos (Wallon) 9 . Sin discrepar en gran medida, diversas corrientes de la psicología cognitiva dan origen a la postura Constructivista; que para el caso de AnimaCuento, parece tener los elementos perfectos que permiten desarrollar una herramienta motivadora que ejercite y refuerce los conocimientos en cuestión.. 2.2.1.2. Constructivismo. El Constructivismo postula la existencia y prevalencia de procesos activos en la construcción del conocimiento. Habla de un sujeto cognitivo que rebasa claramente, en su labor constructiva, lo que le ofrece su entorno.. El individuo, en lo cognitivo y en lo social, no es sólo un producto del ambiente, ni un simple resultado de su disposición interna, sino una construcción propia que se va produciendo día a día, como resultado de la interacción entre esos dos factores. De esta forma, el conocimiento no es una copia fiel de la realidad, sino una construcción que el ser humano hace con los esquemas que posee y han sido construidos en su relación con el medio que lo rodea.. Los principios del aprendizaje Constructivista determinan que: •. El aprendizaje es un proceso constructivo interno, autoestructurante.. •. El grado de aprend izaje depende del nivel de desarrollo congnitivo.. •. Punto de partida de todo aprendizaje son los conocimientos previos.. •. El aprendizaje es un proceso de re-construcción de saberes culturales.. 9. RIGO, Lemini (1992), AGUILAR 1982, CASTORINA (1993-1994), COLL (1990), HERNANDEZ (1991), RIVIERE 1987. 19.
(21) MISC-03-1-8. •. El aprendizaje implica un proceso de reorganización interna de esquemas.. •. El aprendizaje se produce cuando entra en conflicto lo que el alumno ya sabe con lo que debería saber.. Y definitivamente, el proceso de construcción depende de dos aspectos fundamentales 10 : •. De los conocimientos previos o preconceptos sobre la nueva información o de la actividad o tarea a resolver.. •. De la actividad externa o interna que el aprendiz realice al respecto.. La postura Constructivista se alimenta de aportes de diversas corrientes psicológicas asociadas genéricamente a la psicología cognitiva: el enfoque psicogenético Piagetiano, la teoría de los esquemas cognitivos, la teoría Ausbeliana de la asimilación y el aprendizaje significativo, la psicología sociocultural Vigotskiana, así como algunas teorías instruccionales entre otras.. Todas comparten el principio de la importancia de la actividad constructiva del alumno en la realización de los aprendizajes escolares.. La convergencia de las teorías cognoscitivas en el constructivismo responde a problemas como: El desarrollo psicológico del individuo, la identificación y atención a la diversidad de intereses, necesidades y motivaciones de los alumnos respecto al proceso de enseñanza-aprendizaje, el replanteamiento de los contenidos curriculares, el reconocimiento de la existencia de diversos tipos de aprendizaje escolar, la búsqueda de alternativas novedosas para la selección, organización y distribución del conocimiento escolar; la importancia de promover la interacción entre el profesor y los alumnos, la revalorización del papel del docente como mediador del conocimiento.. 20.
(22) MISC-03-1-8. Según Coll11 , la concepción Constructivista se organiza en torno a tres ideas fundamentales 12 : •. El alumno es el responsable último de su propio proceso de aprendizaje.. •. La actividad mental constructiva del alumno se aplica a contenidos con algún grado de elaboración, así el alumno no tiene que construir todo.. •. La función del docente es conectar los procesos de construcción del alumno con el saber colectivo culturalmente organizado. Debe orientar y guiar la actividad constructiva.. En el caso de AnimaCuento, el reconocimiento es claramente la construcción de una historia completa que el usuario ha creado y la puede ver animada. Esto es específicamente el componente motivador, pues si el usuario es capaz de escribir su historia de manera adecuada, con correcta ortografía y gramática, tendrá como recompensa la animación de su imaginación.. 10. DIAZ Barriga (2002) COLL 1990 12 DIAZ Barriga, 2002 11. 21.
(23) MISC-03-1-8. 3. ANTECEDENTES DEL PROCESAMIENTO DE LENGUAJES. 3.1. Procesamiento del lenguaje natural El procesamiento del lenguaje natural, trata de hacer al computador capaz de entender órdenes escritas en lenguaje humano, abriendo una puerta a los diálogos directos entre el hombre y la computadora, lo que facilitaría labores como la de escribir en un procesador de texto, trabajar en las hojas de cálculo, jugar y hasta programar en lenguaje de computador. La idea es que una vez el computador entienda el lenguaje, responda iniciando la interacción con el quehacer diario. La tarea de que el computador entienda el lenguaje natural humano escrito es una tarea posible; pero no en toda su extensión y magnitud debido a la complejidad que ésta encierra, aunque se puede hacer un prototipo inicial fácil de aplicar en experiencias como la que se va a desarrollar en este caso. Una de las principales dificultades que aparecen en el desarrollo de este tipo de tareas, es la misma que se presenta en un traductor de un lenguaje natural humano a otro; los existentes son una aproximación a lo que puede llegar a ser un traductor humano, pero no lo pueden reemplazar. De manera general, un procesador del lenguaje natural no se preocupa por la forma en que una oración es introducida al computador, su trabajo está en extraer la información a partir de esas oraciones. En este momento, la concentración está orientada a que se entienda el lenguaje que se le va a introducir al programa a través de una terminal de computador en forma escrita. Para este caso, la idea es desarrollar un sistema clasificador del lenguaje natural del idioma español que analizará las palabras de una oración con el fin de asignar su. 22.
(24) MISC-03-1-8. correspondiente clasificación sintáctica, y establecerá si está escrita en forma correcta.. 3.2. Definición de categorías Gramaticales13 Algunas definiciones de la gramática normativa de la clasificación de palabras son: •. Artículo: Es una parte invariable de la oración que se antepone al sustantivo o nombre, o al que haga las veces de éste, con el fin de limitar la extensión de su significado. El artículo puede ser determinado o indeterminado. El primero precede a sustantivos tomados en sentido concreto o determinado (el, la, lo, los, las). El artículo indeterminado es el que se junta a sustantivos tomados en sentido vago o indeterminado (un, una, unos, unas).. •. Contracción: Es una modificación al artículo determinado “el”, cuando va precedido de “a” o “de”, en cuyos casos la contracción resulta en “al” y “del”.. •. Sustantivo o Nombre : Es toda palabra que sirve para designar personas, animales, cosas y lugares. Por su extensión se divide en común y propio, entendiendo por extens ión el número el número de individuos que abraza.. •. Sustantivo común: Es el que se le da a un ser determinado para identificarlo y diferenciarlo de los mismos de su especie. También por su extensión el sustantivo común se subdivide en colectivo, individual, partitivo y proporcional.. 13. EDELVIVES, F.T.D.; “Gramática Española”, Librería Voluntad. Santafé de Bogotá, 1.958. 23.
(25) MISC-03-1-8. •. Sustantivo común: Conviene a todos los seres de una misma especie o clase. Por su composición, los sustantivos se dividen en simple o compuesto. Por su origen los sustantivos son primitivos o derivados (nominales, adjetivales, ve rbales) y los nominales pueden ser aumentativos, diminutivos, despectivos, gentilicios y patronímicos.. •. Adjetivo: Es la parte variable de la oración que modifica al sustantivo calificándolo o determinándolo. El adjetivo calificativo es el que designa alguna cualidad del sustantivo y se divide según el origen, composición, terminación y apreciación. Para este análisis sólo se clasificarán los adjetivos calificativos como tales. El adjetivo determinativo es el que precisa la extensión de los sustantivos, limitando o concretando su significación general (Eje: este, algún, segundo, etc.) Estos pueden ser posesivos, demostrativos, numerales e indefinidos.. •. Adjetivos posesivos: Determinan la significación del nombre, denotando a la vez posesión o pertenencia. (mío, tuyo, su, etc.).. •. Adjetivos demostrativos: Determinan la significación del sustantivo mediante una relación de lugar (este, ese, aquel, etc.). •. Adjetivos numerales: Determinan la significación del sustantivo añadiéndole la idea de número u orden. (cien, segundo, etc.) Estos se clasifican en cardinales, ordinales, proporcionales y partitivos.. •. Adjetivos indefinidos : Limitan la significación del sustantivo de un modo vago o general (Algunos, pocos, cierto, mucho, etc.). 24.
(26) MISC-03-1-8. •. Pronombres: Es la parte variable de la oración que designa una persona o cosa sin nombrarla, y denota a la vez las personas gramaticales. Los pronombres se dividen en personales, posesivos, correlativos e indefinidos. Los pronombres personales son los que designan las personas gramaticales, poniéndose en lugar de nombres de personas o cosas personificadas. Las personas gramaticales son las que intervienen en la oración y no pueden ser más de tres: la que habla, llamada primera, aquella a quien se habla, llamada segunda; y aquella de quien se habla, llamada tercera. Todos los sustantivos comunes no propios denotan tercera persona. Pronombres indefinidos designan de un modo vago o general las personas o cosas a que se refieren. (alguien, nadie, algo, nada, cualquiera, etc.).. •. Verbo : Es la parte variable de la oración que expresa esencia, estado, acción o pasión, casi siempre con expresión de tiempo y de personas. Los verbos, por su significancia, se dividen en copulativos y predicativos. Los verbos copulativos reducen la significación al lazo de unión entre el predicado nominal y su sujeto (Verbo ser) Los verbos predicativos envuelven la idea de un predicado, es decir, de cualidad y atributo, y expresa siempre un estado, acción o pasión (dormir, escribir, amar, etc.). •. Sujeto: Es la palabra u oración que expresa la idea o pensamiento de quien se afirma o niega lo que el verbo expresa.. •. Predicado : Es aquello que se dice del sujeto en la oración e incluye necesariamente un verbo.. 25.
(27) MISC-03-1-8. •. Modos del verbo •. Conjugación: Es la serie ordenada de las distintas formas que puede tomar el verbo cambiando las terminaciones. Los accidentes gramaticales del verbo expresados en la conjugación son: voces, modos, tiempos, números y personas. Voz es el accidente que denota si el sujeto acciona sobre el verbo o es el verbo el que acciona sobre el sujeto. Voz pasiva (Yo soy amado) y voz activa (yo amo).. •. Modos: Son las distintas maneras generales de expresar la significación del verbo. En castellano hay cinco modos: infinitivo, indicativo, potencial, subjuntivo e imperativo. El modo indicativo expresa de una manera absoluta e independiente un hecho real y objetivo. El modo potencial indica el hecho no como real, sino como posible. El modo imperativo enuncia el hecho como un mandato o ruego. El modo infinitivo comprende los nombres verbales que son el infinitivo (acción independiente de quién la realice), el participio (Como un adjetivo) y el gerundio (como un adverbio). El modo subjuntivo expresa el hecho como subordinado a otro verbo que expresa deseo, temor, voluntad.. •. Tiempos : Son las distintas formas del verbo que denotan la época o momento en que sucede o se realiza. Se dividen en simples (Cuando usan una sola palabra: yo quiero) y compuestos (Cuando usan dos o más palabras: he jugado). Tanto los tiempos simples como los compuestos. 26.
(28) MISC-03-1-8. denotan lo expresado por el verbo, como presente, pasado o futuro con relación al momento en que se habla. Persona, en el verbo es el accidente que especifica el sujeto de la acción o estado del verbo que expresa. Las personas en el verbo son las mismas de que se trata en el pronombre personal, denominadas primera, segunda y tercera. Número en el verbo, es el accidente que sirve para indicar la unidad o pluralidad del sujeto (singular o plural). Por su conjugación, los verbos se dividen en regulares, irregulares, defectivos, pronominales y unipersonales. Los verbos regulares son los que en todos los tiempos y personas conservan sus raíces y toman las terminaciones de la conjugación a la que pertenecen. (Ejemplo: amar, temer, partir). Verbos irregulares son los que se conjugan alterando sus raíces, las terminaciones propias de la terminación regular a que pertenecen, o ambas. (Ejemplo: jugar, traer, tañer, conducir). Verbos defectivos, carecen de algún tiempo o persona (soler, abolir, concernir). Los verbos pronominales se conjugan con dos pronombres personales, empleados uno como sujeto y el otro como complemento, o también con un sustantivo y su correspondiente pronombre de tercera persona como: yo me arrepiento, tu te quejas, Pedro se duele. Verbos unipersonales son los que sólo se usan en el infinitivo y en la tercera persona del singular de todos los tiempos: alborear, nevar, llover.. 27.
(29) MISC-03-1-8. Existen otros verbos que son impersonales y se usan sin sujeto determinado: cuentan, se dice, importa, conviene, haber, etc. Los verbos auxiliares son HABER y SER por ayudar a la conjugación de los demás verbos. Hay 24 verbos de irregularidad propia o especial que son: dar, andar, estar, caber, caer, haber hacer, poder, poner, querer, saber, ser, tener, traer, valer, ver, yacer, asir, decir, ir, oír, salir, venir y erguir. •. El Adverbio: Es una parte invariable de la oración que sirve para calificar o determinar la significación del verbo o la del adjetivo, y a veces la de otro adverbio. Así, los adverbios son como los adjetivos del verbo y de toda otra palabra que tenga sentido calificativo o atributivo. Los adverbios son de lugar, tiempo, modo, orden, cantidad, afirmación, negación y duda.. •. Preposición: Son partículas llamadas impropiamente parte de la oración, y no tienen valor de por sí en el habla; sirven para enlazar dos palabras e indicar la relación que hay entre ellas. Las propias son: a, ante, bajo, cabe, con, contra, de, desde, en, entre, hacia, hasta, para, por, según, sin, so, sobre, tras. Las preposiciones impropias son: ad, des, ex, in, inter, infra, per, sub, super, trans.. •. La Conjunción: Es la parte invariable de la oración que sirve para unir dos oraciones entre sí, o dos palabras de la misma naturaleza, expresando, a la vez, la relación que entre ellas existe. Eje: No pude salir porque estaba enfermo, Antonio y Pedro van a estudiar o a jugar. Una expresión conjuntiva es la locución que tiene el valor o significado de conjunción. Eje: Con objeto de, a fin de que, no obstante.. 28.
(30) MISC-03-1-8. •. Interjección: Es toda voz que expresa repentina e impremeditadamente algún efecto vehemente del alma. Generalmente forma por sí sola una oración completa. Eje: ¡Hola!. 3.3. Gramática La gramática de un lenguaje se construye con el interés de establecer el rango de secuencias correctas, seleccionando las oraciones que se identifican como problemáticas o entendibles. 3.3.1. Gramáticas libres de Contexto Una oración se puede descomponer en sujeto y predicado, y allí encontrar si el sujeto está compuesto por sustantivos, adjetivos o artículos. Finalmente, no importa cuántas clasificaciones hay dentro del sujeto, simplemente lo es y el resto es predicado. Chomsky, en 1956 comenzó con el trabajo formal en lenguajes. Las gramáticas libres del contexto son muy importantes por dos razones: El formalismo es lo suficientemente poderoso para poder construir bastantes formas de los lenguajes naturales, y lo suficientemente restringidos para construir parsers (Analizadores gramaticales) eficientes para hacer su análisis. La Gramática Normativa es totalmente libre de contexto y esto facilita la programación de su análisis. Adicionalmente, la Gramática Normativa es la que se enseña en los colegios por no requerir conocimientos adicionales por parte del aprendiz.. 3.3.2. Gramáticas dependientes de Contexto. Son gramáticas que definen sus clasificaciones. de acuerdo con el sentido o. significado que se le quiera dar a la oración. Dependen de la intención, de la cultura,. 29.
(31) MISC-03-1-8. inclusive de los dialectos, respetando la intencionalidad, ortografía y pronunciación de quien habla o escribe. 3.3.3. Gramática Estructurada por Frases 14. Dentro de las gramáticas Regulares o Gramáticas de Lenguaje Natural, encontramos las gramáticas estructuradas por frases, teniendo cada una de estas gramáticas entre sus principales componentes: •. Un Símbolo Inicial, siendo el identificador de la gramática.. •. Un Conjunto Finito de Elementos No Terminales. Cada uno de estos Elementos No Terminales tiene un elemento que lo define y que es mas específico en su definición.. •. Un Conjunto Finito de Elementos Terminales, siendo los elemento finales de la estructura gramatical y son los mas específicos de la misma.. •. Un conjunto Finito de Reglas de Escritura, las que determinarán las condiciones de una gramática.. Como ejemplo podremos tener: <frase 3ª persona singular> => <sujeto><verbo><complemento><punto>, donde <frase 3ª persona singular> es un Elemento Inicial, <sujeto>, <verbo>, <complemento> y <punto> son Elementos No Terminales. A su vez, <sujeto> => <artículo definido><sustantivo> <artículo definido> => la, siendo este un Elemento Terminal. Una regla que utilizaremos en este ejemplo es que los nombres de los Elementos Iniciales y los Elementos No Terminales estarán dentro de signos de mayor y menor, mientras que los Elementos Terminales no estarán dentro de ningún signo.. Construyendo la definición completa de esta gramática tenemos: 14. BROOKSHEAR, J. Glenn. Teoría de la Computación: Lenguajes formales, autómatas y complejidad. ADDISON-WESLEY IBERO AMERICANA, 1993. 30.
(32) MISC-03-1-8. <frase 3ª persona singular> => <sujeto><verbo><complemento><punto> <sujeto> => <artículo definido><sustantivo> <artículo definido> => la <sustantivo> => casa <sustantivo> => bola <verbo> => <verbo tercera persona del singular> <verbo tercera persona del singular> => es <complemento> => <adjetivo> <adjetivo> => roja <punto> => .. Si escribimos cualquiera de estas dos frases: “La casa es roja.” y “la bola es roja.”, según su composición estará bien escrita.. 3.4. Métodos de Parseo (Análisis Gramatical) 3.4.1.Top-down. Comienza por las categorías sintácticas, y poco a poco va llegando a lo particular hasta que convierte la definición en la palabra misma.. 3.4.2. Bottom-up. Se comienza por las palabras individuales y se reemplazan por sus categorías sintácticas, con las reglas de escritura se reemplaza el análisis actual por uno del mismo tamaño o uno más pequeño.. 31.
(33) MISC-03-1-8. 3.4.3. Mezcla. La ventaja de los top-down es que nunca consideran categorías inexistentes en oraciones aceptables. Su desventaja está en que el Analizador Gramatical trabaja desde la categoría y busca si la palabra pertenece a la categoría. Así mismo, el uso de las reglas de reescritura puede tomar bastante tiempo descomponiendo los constituyentes sin fijarse en las categorías que representan las palabras en análisis. Los métodos bottom-up deben considerar todos los sentidos de cada palabra y construir estructuras que nunca llegarán a ser legales dentro de una gramática establecida. De cualquier modo, usar una de las técnicas por separado llevaría a no usar la información en el momento adecuado. Los métodos de mezcla tratan de tomar las ventajas de los bottom- up y los Top-down y descartar las desventajas para hacer un proceso más eficiente. Ejemplo de esto es el método de Earley15, dado por la necesidad de sintetizar y coordinar el conocimiento proveniente de las áreas de la lingüística, las matemáticas y la informática16. En este trabajo se ha optado por separar, en diferentes herramientas, el análisis morfológico del análisis sintáctico, integrando posteriormente ambas, de modo que los resultados obtenidos por una primera fase de análisis, puedan ser usados en la siguiente.. 15. HERNANDEZ, Carlos J. GACC. Un generador de parsers para gramáticas atribuidas basado en el algoritmo de Earley, Universidad de los Andes, Bogotá, 1.995 16 http://coleweb.dc.fi.udc.es/cole/library/abstracts/Cab98a.html. Integración de herramientas para el análisis automático de los lenguajes naturales. 32.
(34) MISC-03-1-8. 4. ESTADO DEL ARTE DE ANALIZADORES. 4.1. Analizadores Léxicos Un analizador léxico es un Autómata finito que reconoce los componentes léxicos de una cadena de símbolos del alfabeto. Analiza los símbolos que se pueden usar en el lenguaje. 4.1.1. FLEX17. Realiza todos los posibles análisis morfológicos de cada palabra de un texto en español, partiendo de su lexema y estudiando sus morfemas. Esto hace que tenga un reducido tamaño y alta eficiencia. Como los analizadores generados por Flex son deterministas, ha sido necesario definir un mecanismo para que los reconocedores generados tengan un comportamiento no determinista.. FLEX trabaja con ICE. integrando un entorno de analizadores no deterministas incrementales que utilizan elementos gráficos de interacción con menú desplegable, apoyándose en la herramienta AIDA de Ilog para desarrollar la aplicación ICEeditor. Para implementar el editor de componentes léxicos es preciso utilizar editores de tipo textedit ya que es el único tipo que permite la utilización de diferentes combinaciones de fuentes y colores dentro del mismo texto. Esta es una característica muy deseable en ICEeditor, puesto que permite al usuario identificar fácilmente los cambios introducidos en los componentes léxicos desde el último análisis realizado.. 17. Dirección http://coleweb.dc.fi.udc.es/cole/library/html/Alo94/node8.html. 33.
(35) MISC-03-1-8. La restricción a la que llevan los analizadores de FLEX por ser deterministas pueden pasar por alto alguna posible solución, requiriéndose otra herramienta como complemento, convirtiendo el ahorro de memoria y eficiencia en otros gastos.. 4.1.2. LEX. Es una herramienta particular que ha sido ampliamente usada para especificar analizadores léxicos para una variedad de lenguajes. Se hace. referencia a la. herramienta como el compilador Lex, y a su especificación de entrada como el lenguaje Lex. La discusión de una herramienta existente permite mostrar cómo la especificación de patrones usando expresiones regulares puede estar combinada con acciones, como por ejemplo, crear entradas en una tabla de símbolos, expandir macros, o incluso generar documentación automáticamente. El programa Lex está diseñado para ser utilizado junto con el programa Yacc para el análisis sintáctico. Primero, se prepara una especificación de un analizador léxico creando un programa contenido, por ejemplo en el fichero prog.l, en lenguaje Lex. Entonces, prog.l se pasa a través del compilador Lex para producir un programa en C, que por defecto se denomina lex.yy.c en el sistema operativo UNIX. Éste consiste en una representación tabular de un diagrama de transición construido a partir de las expresiones regulares de prog.l, junto con una rutina estándar que usa la tabla de reconocimiento de lexemas. Las acciones asociadas con expresiones regulares en prog.l son trozos de código C, y son transcritas directamente a lex.yy.c. Finalmente, lex.yy.c se pasa a través del compilador C para producir un programa objeto, que por defecto se llama a.out, el cual es el analizador léxico que transforma una entrada en una secuencia de tokens.. 34.
(36) MISC-03-1-8. 4.1.3. Analizador léxico del compilador de Pascal18. Su misión es comprobar que se han usado sólo tokens (símbolos) correctos. La entrada es un programa fuente. Sobre este programa fuente realiza las siguientes operaciones: •. Aísla los tokens que componen el programa fuente.. •. Identifica qué tipo de tokens son (identificadores, constante, instrucciones, etc).. •. Almacena los tokens necesarios (identificadores, constantes) en la tabla de símbolos. Esta tabla se usará en el resto de fases de análisis y traducción.. Dado el siguiente programa fuente, se obtendría el siguiente análisis: Programa fuente: A := b + c * 3.74; Análisis léxico: id[1], asignación, id[2], suma, id[3], producto, cte[1], delimitador. a la vez que se generaba la siguiente tabla de símbolos:. Variables: Referencia. Símbolo. 1. a. 2. b. 3. c. Constantes. 18. Referencia. Símbolo. 1. 3.74. - A. Prieto; A. Lloris, J.C. Torres, "Introducción a la Informática", McGraw-Hill, Madrid, 1.995. 35.
(37) MISC-03-1-8. Cuando el analizador léxico encuentra algún carácter que no es un token, produce un error léxico. Suelen ser similares a: invalid character, o unexpected character.. 4.2. Analizadores Sintácticos. Un analizador sintáctico es un Autómata de pila que reconoce la estructura de una cadena de componentes léxicos. Revisa las construcciones válidas de símbolos.. 4.2.1. ICE19 (Incremental Context-Free Environment): Ambiente incremental libre de contexto. LE-LISP. A partir de una gramática con reglas expresadas en el mismo formalismo que el utilizado por Yacc se genera un analizador sintáctico no determinista e incremental para dicha gramática. La utilización de un analizador sintáctico escrito en LE- LISP proporciona una serie de ventajas, como son: Disponibilidad de un entorno interactivo para que el usuario pueda entablar una mejor comunicación con el analizador. Esto hace necesaria la existencia de la parte interpretativa de ICE. 19. http://coleweb.dc.fi.udc.es/cole/library/html/Alo94/node8.html. 36.
(38) MISC-03-1-8. 4.2.2. Lekta: Traducción automática basada en el formalismo LFG con entrada y salida por voz 20 21 .. Este sistema fue iImplementado en C.. Empleará una gramática estocástica en lugar de la de estados finitos, que tiene la ventaja de poderse generar de forma automática. Lekta es una herramienta de celdas para el desarrollo de prototipos de una máquina traductora (MT) entre dos idiomas. Lekta sigue un acercamiento de transferencia al MT, y está inspirado en la teoría clásica de LFG . La herramienta ha sido implementada en C y actualmente corre bajo Sun Solaris 2.x. El modelo lingüístico que se ha adoptado está inspirado en JULIETTA 22 , un prototipo de Traducción Automática basado en la Gramática Léxico-Funcional (LFG) 23 . En primer lugar, se obtiene la estructura de constituyentes (denominada estructura-c en LFG), por medio de un analizador para gramáticas libres de contexto. El segundo nivel de representación consiste en una matriz de pares atributo-valor (denominada estructura- f en LFG), obtenida por medio de la resolución de ecuaciones funcionales asociadas con cada nodo de la gramática. Dicha operación consiste en la unificación de rasgos, común a todas las gramáticas basadas en unificación. 24. .. El sistema que están desarrollando actualmente se distingue a su vez de JULIETTA en varios aspectos: está implementado en C y no en Prolog,. 20. J. G. de Amores Carredano UNIVERSIDAD DE SEVILLA J. F. Quesada Moreno CENTRO INFORMÁTICO CIENTÍFICO DE ANDALUCÍA D. Tapias Merino TELEFÓNICA INVESTIGACIÓN Y DESARROLLO. 21 La dirección http://www.fing.us.es/lekta/lekta_manual.html 22 J. G. Amores: A Lexical-Functional Grammar-Based Machine Translation System for Medical Abstracts. Tesis Doctoral. Universidad de Sevilla (1992). 23 J. Bresnan: The Mental Representation of Grammatical Relations. Cambridge, Massachussets: MIT Press (ed. 1982). 24 S. Shieber: An Introduction to Unification-Based Approaches to Grammar. Stanford, California: Center for the Study of Language and Information, CSLI Lecture Notes Series 4 (1986).. 37.
(39) MISC-03-1-8. Cuestiones de eficiencia han demostrado la conveniencia de abordar cada parte del análisis mediante técnicas diferentes, y así el análisis sintáctico se suele implementar con alguno de los modelos de análisis sintáctico (parsing) desarrollados para gramáticas libres de contexto, 25 mientras que para el análisis semántico se recurre a la unificación (aunque en general la unificación permite el tratamiento de cualquier información, no sólo semántica, sino sintáctica, pragmática, o de cualquier otro tipo). En lo que respecta a parsing el principal problema que aparece es la explosión combinatoria. Es decir, la necesaria ambigüedad que debe permitir la especificación gramatical de un lenguaje natural que suele generar problemas de complejidad exponencial. 26. .. Se puede hablar de algoritmos que se han desarrollado específicamente para el análisis de lenguajes naturales, entre los que se encuentran los siguientes: El trabajo de Earley27 Propone la mezcla de parseos Top-Down y Bottom-Up para el análisis de gramáticas libres de contexto. El formalismo DCG (Definite Clause Grammar) para Prolog. 28. , bajo el cual subyace. la idea consistente en expresar una gramática como un conjunto de cláusulas de la lógica de primer orden. En concreto, como cláusulas de Horn, de forma que el analizador se modela como un demostrador de teoremas, cuyos axiomas son la gramática y donde el teorema que se debe demostrar es la expresión lógica de la entrada que el parser debe analizar. Esta es la técnica usada en el sistema JULIETTA .. 25. A. V. AHO y J. D. Ullmann: The Theory of Parsing, Translation, and Compiling. V. I: Parsing. Englewood Cliffs, NJ: Prentice-Hall (1972). 26 G. E. BARTON, R. C. Berwick y E. S. Ristad: Computational Complexity and Natural Language. Cambridge, Massachussets: MIT Press (1987). 27. EARLEY: ‘An efficient context -free parsing algorithm’. Communications of the ACM, 14, pp. 453460. (También en Grosz, Sparck Jones y Webber, 1986:25-33) (1970). 28 F. C. N. PEREIRA y D. H. D. Warren: Definite Clause Grammars for language analysis a survey of the formalism and a comparison with augmented transition networks. Artificial Intelligence, 13:321278. (También en Grosz, Sparck Jones y Webber 1986, pp. 101-124) (1980).. 38.
(40) MISC-03-1-8. La idea de "tabla de subcadenas bien formadas" o charts 29 , que pretende, fundamentalmente, resolver los problemas de redundancia en el análisis de subestructuras, que provocan los algoritmos descendentes como DCG. El estudio de estas técnicas los ha convencido de la utilidad que supone un análisis mixto (ascendente y descendente de forma simultánea, en la línea que persigue el algoritmo basado en charts).. 4.2.3. O2RTED: El Analizador de Lekta. O2RTED puede definirse como un modelo de análisis sintáctico para gramáticas libres de contexto. Los objetivos fundamentales que persigue son los siguientes: 1. Definir un lenguaje para la especificación de gramáticas, con una gran potencia expresiva, que permita al lingüista modelizar fenómenos complejos de una forma natural. 2. Lograr una gran eficiencia, de forma que se permita su utilización en tiempo real. 3. Permitir la implementación de múltiples estrategias de análisis, para lo cual es necesario contar con un modelo flexible donde las estrategias sean independientes del módulo de control del análisis. Para lograr estos objetivos O2RTED hace uso de las siguientes técnicas: La orientación a objetos, La dirección por eventos, una modelización heurística de la gramática, un modelo especial de organización de la memoria diseñado específicamente para mejorar los procesos de computación simbólica que aparecen en este ámbito.. 29. M. KAY: Algorithm Schemata and Data Structures in Syntactic Processing. En Grosz, Sparck Jones y Webber, 1986. pp. 35-70 (1980).. 39.
Documento similar
pilares cortos debe evitarse en lo posible (figuras 85, 86 87, 88 y 89), y en todo caso, proporcionar un análisis y posterior diseño especial que aseguren que en caso de fallar
Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en
Las actividades supervisadas representan aquellas que sucedes dentro de la clase y para las cuales se requiere que el.. estudiante realice
ESTRUCTURACIÓN Y ACCESO A LOS CONTENIDOS, LOS RECURSOS DIDÁCTICOS DIGITALES Y SERVICIOS PARA EL APRENDIZAJE. Qué criterios se establecen para la selección, clasificación y acceso
Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura
[r]
[r]