El Grupo de SistemasInteligentes Aplicados a Ingeniería (G-SIAI) se crea en marzo de 2003 para nuclear los proyectos de investigación de los docentes del área de la Facultad de Ingeniería de la Universidad Nacional del Comahue a través de la propuesta y coordinación de trabajos finales de asignatura y de tesis de grado.
Dentro de este tema se propone la línea de investigación que combina las técnicas utilizadas en sistemasinteligentes con la búsqueda y reconocimiento de patrones en arreglos tanto lineales (cadenas de textos) como multidimen- sionales (imágenes o volúmenes).
En este art´ıculo se describen, en forma resumida, los trabajos de investigaci´on y de- sarrollo que se est´an llevando a cabo en la l´ınea de investigaci´on “SistemasInteligentes” en las ´areas de Text Mining, Web Mining y Web Intelligence, y que abordan principal- mente tareas como: clustering de textos cor- tos multilig¨ ues, categorizaci´on sem´antica de textos, medidas de calidad de la informaci´on en la Web, detecci´on de plagio y atribuci´on de autor´ıa, miner´ıa de opini´on y sentimien- tos, integraci´on de agentes y t´ecnicas de mi- ner´ıa de textos, y uso de arquitecturas cogni- tivas para agentes web; en especial aquellas basadas en l´ogica, razonamiento argumenta- tivo y teor´ıa de decisi´on cualitativa. En par- ticular, pondremos especial ´enfasis en aque- llas problem´aticas que se est´an comenzando a investigar en forma conjunta con investi- gadores de Alemania, Austria, Espa˜ na y Gre- cia en el contexto de un proyecto FP7, recien- temente aprobado en la Uni´on Europea.
Los métodos tradicionales de análisis de datos incluyen el trabajo con variables estadísticas, varianza, desviación estándar, covarianza y correlación entre los atributos; análisis de componentes (determinación de combinaciones lineales ortogonales que maximizan una varianza determinada), análisis de factores (determinación de grupos correlacionados de atributos), análisis de clusters (determinación de grupos de conceptos que están cercanos según una función de distancia dada), análisis de regresión (búsqueda de los coeficientes de una ecuación de los puntos dados como datos), análisis multivariable de la varianza, y análisis de los discriminantes [Michalski et al., 1982]. Todos estos métodos están orientados numéricamente y son esencialmente cuantitativos. Los métodos basados en sistemasinteligentes [Konenko y Kukar, 2007], permiten obtener resultados de análisis de la masa de información que los métodos convencionales no logran, tales como: los algoritmos TDIDT, los mapas auto organizados (SOM) y las redes bayesianas. Los algoritmos TDIDT permiten el desarrollo de descripciones simbólicas de los datos para diferenciar entre distintas clases [Quinlan, 1986; 1990]. Los mapas auto organizados pueden ser aplicados a la construcción de particiones de grandes masas de información. Tienen la ventaja de ser tolerantes al ruido y la capacidad de extender la generalización al momento de necesitar manipular datos nuevos [Kohonen, 1982; 1995]. Las redes bayesianas pueden ser aplicadas para identificar atributos discriminantes en grandes masas de información, y detectar patrones de comportamiento en análisis de series temporales. [Heckerman et al., 1995].
En esta tesis se estudia y analiza el uso de sistemasinteligentes (redes neuronales, lógica difusa, etc.) en aplicaciones para una central de generación eléctrica de ciclo com- binado (central de CC). En una primera parte, se describe el proceso y se comentan los principales problemas asociados a la operación documentados en la literatura. Se realiza un estudio del estado del arte de las aplicaciones disponibles para centrales de CC, que atacan los problemas de operación antes mencionados. En una segunda parte, se estudia el problema de la modelación matemática de una central de CC. Se analizan modelos fenome- nológicos, simplificados, empíricos, y modelos comerciales. Se estudian las ventajas que ofrecen los sistemasinteligentes sobre las técnicas convencionales, y luego se desarrolla un modelo para la simulación de la turbina de gas de la central de CC San Isidro, propiedad de Endesa Chile. Finalmente, en una tercera parte se estudia el problema de la detección y el diagnóstico de fallas en centrales de CC. Se analizan los enfoques clásicos, para luego proponer un nuevo esquema de detección, diagnóstico y corrección de fallas para sensores de la turbina de gas de la central San Isidro. Todas las conclusiones se realizan a partir de los resultados obtenidos bajo datos de operación reales de la planta.
sistemasinteligentes, las redes neuronales nos permite tener resultados favorables y auto regulables, ya que al manejar redes neuronales nuestro sistema va aprendiendo y a mayor entrenamiento el grado de certeza aumenta. Este sistema está pensado para un fácil manejo, utilizando interfaces muy amigables, teniendo en cuenta que los principales usuarios serán personal administrativo, y como lugar de aplicación la Universidad Nacional de Trujillo, siendo por este motivo que se realiza la aplicación teniendo como datos de ejemplo docu- mentos de la Universidad Nacional de Trujillo, los cuales será nuestra población.
Por otra parte, se estima una metodología de trabajo que combina los métodos, las técnicas y las herramientas básicas utilizadas en ingeniería de software con aquellas que proveen los diferentes tipos de sistemasinteligentes. En este sentido la articulación de las soluciones se orientará hacia la búsqueda de algoritmos más eficientes en un ambiente que permita efectuar estudios comparativos y evaluaciones de las diferentes soluciones. Básicamente se busca la generalización de los resulta- dos a casos de clasificación en diferentes ámbitos (físicos, biológicos, agronómicos, astronómicos, etc.) centrados en la misma problemática de agrupamientos con límites difusos.
En la actualidad son necesarios algoritmos muy eficientes que puedan dar respuesta en tiempo real a problemas del usuario o del sistema, y que permitan trabajar con los nuevos sistemas operativos y máquinas. Por ello, es muy importante poder caracterizar el funcionamiento de dichos algoritmos, y así conocer sus limitaciones y potencia intrínseca al resolver nuevos problemas no estudiados. Esto supone definir el comportamiento de los algoritmos con relación a distintas clases de problemas, sobre instancias de dimensión creciente; y de esta manera deducir los métodos o modificaciones necesarias que permitan generar un motor de búsqueda eficiente.
En el contexto, a fin de proveer la inteligencia a la selección, entre los sistemasinteligentes se encuentran las redes neuronales, que son interconexiones masivas en paralelo de elementos simples y que responden a una cierta jerarquía intentando interactuar con los objetos reales tal como lo haría un sistema neuronal psicológico [38]. Poseen la característica de asimilar conocimiento en base a las experiencias mediante la generalización de casos, que las convierte en una herramienta interesante en el desarrollo de los modelados de la presente investigación [40]. Las redes bayesianas son herramientas estadísticas orientadas a la inferencia probabilística y en el ámbito de la tutorización electrónica se pueden utilizar para modelar la incertidumbre asociada al estudiante y su nivel de conocimientos. También se pueden aplicar los algoritmos genéticos que se fundamentan en el concepto biológico de la evolución natural y son utlizados en procesos de optimización [41,42]. Se fundamentan en los mecanismos de la selección natural, por los que sólo sobreviven los individuos mas aptos, luego de la interacción entre los mismos, pertenecientes a una población de posibles soluciones.
Los programas basados en técnicas de los SistemasInteligentes suelen adoptar la forma de tutoriales en los que el estudiante puede tomar la iniciativa. Las diferencias más notables con respecto a los programas tutoriales convencionales, se deben a la forma en que se concibe su diseño. Un programa tutorial tradicional trata de inducir en el estudiante la respuesta correcta mediante una serie de estímulos que han sido cuidadosamente planificados. En cambio un programa tutor inteligente intenta simular alguna de las capacidades cognitivas del estudiante y utilizar los resultados de esta simulación como base de las decisiones pedagógicas a tomar. El control de la iniciativa, en un tutorial convencional, corresponde totalmente a la computadora, mientras que en el inteligente hay situaciones en las que puede corresponder al estudiante.
La redefinición del módulo del estudiante, en submódulos y con interfaces bien definidas busca solucionar algunos problemas generales que afectan a los sistemas tutores inteligentes desde hace años que es el solapamiento de funcionalidades. Esto facilitará los circuitos y se mejorará la interacción entre los módulos, separando completamente al módulo en cuestión del verdadero dominio de aplicación. Con este enfoque no se rompe con la estructura clásica de los sistemas tutores inteligentes, sino que esta nueva visión supone una mayor flexibilidad y adaptación de nuevos dominios a las aplicaciones que la utilicen, como ya se explicó. Actualmente, se está trabajando en el rediseño de los módulos que corresponden al estudiante como se plantea, para integrarlo al módulo tutor del módulo del tutor y al sistema evaluador con predicción y diagnóstico a fin de obtener un sistema tutor inteligente flexible. A esta etapa sobreviene la selección de las tecnologías disponibles más aptas en cada caso. Así, una vez llevada a cabo la implementación e integración de los módulos, el paso siguiente será contrastar el sistema con los datos recabados hasta el momento para generar conclusiones al
La implementación de sistemas AMI también conlleva otros desafíos no directamente relacionados con el ámbito energético. Entre ellos, uno de los más escabrosos (por lo que se ha decidido presentarlo sucintamente en este documento), es el de la privacidad de los datos de cada uno de los usuarios que estará disponible en la red. Los medidores inteligentes recabarán y transmitirán datos muy valiosos sobre los hábitos de consumo de los usuarios, que sin duda serán de gran utilidad a la hora de gestionar la demanda y el consumo de energía. Pero también es cierto, que además esos datos contendrán información privada, más o menos detallada, de hábitos de comportamiento de los usuarios: horarios de descanso, de uso de diferentes aparatos electrónicos (TV por ejemplo) y electrodomésticos, de comida o información sobre la utilización de vehículos eléctricos con interconexión domiciliaria; lo cual puede suponer una indebida invasión a su privacidad. Así, la puesta en funcionamiento de un sistema de medición inteligente requerirá la intervención de distintos actores sociales, organismos gubernamentales de aplicación y control, empresas prestadoras del servicio eléctrico, asociaciones de usuarios, etc. Se deberá definir claramente la forma en que será manipulada toda la información disponible, a fin de que no pueda ser mal utilizada por terceras partes (o empleada por ejemplo comercialmente sin el debido consentimiento el usuario), o eventualmente, adulterada por el propio usuario o consumidor.
La investigación actual en Sistemas Tutoriales Inteligentes busca diseñar sistemas de aprendizaje fundamentados en principios propios y en nuevas teorías de aprendizaje así como su implementación con herramientas actuales. La evolución del área ha ido desde diseños generales hacia aplicaciones específicas con nuevas tecnologías (especialmente agentes) y nuevos estilos de sistemas (ambientes y sistemas colaborativos). Esta área de investigación se reconoce como Inteligencia Artificial en Educación (IAED)[3].
A partir del marco teórico descrito y de los paradigmas de desarrollo de sistemas multiagentes, se ha propuesto una arquitectura básica y se planteó la selección del tutoerizado. Esta arquitectura presenta una forma más efectiva de comunicación entre el usuario y el sistema, ya que considera el estilo de aprendizaje del estudiante. Determinado el marco teórico, se seleccionarán las herramientas metodológicas y el ambiente de desarrollo más adecuado, a fin de: a) Diseñar un módulo de agentes (AgPP) para llevar a cabo la tarea de generación de estrategias de enseñanza en el módulo del tutor, que permita la adición de nuevos protocolos de enseñanza que se adapten a las necesidades de cada del alumno (a través de su perfiles) y b) Diseñar un agente (modelo de estudiante) que permita obtener los diferentes estilos de aprendizaje de los estudiantes de acuerdo sus preferencias. c) La etapa siguiente es el diseño del módulo evaluador y completar el módulo del dominio.
Se les atribuye “inteligencia” a estos sistemas por su capacidad de resolver los problemas que presenta a los estudiantes y de explicar cómo lo hacen. Los STI se caracterizan por representar separadamente la materia que se enseña (modelo del dominio) y las estrategias para enseñarla (modelo pedagógico). Por otro lado, caracterizan al alumno (modelo del estudiante) para procurar una enseñanza individualizada. Además, de una manera cada vez más necesaria y al igual que cualquier software que se comunica con usuarios, la interfaz de comunicación se corresponde con un módulo bien planificado, de fácil manipulación y que favorece el proceso de comunicación tutor-alumno. [5]
Mientras el tutor es responsable de la personalizaci´on en la realimentaci´on en los STIs, en los ILEs los estudiantes generalmente reciben realimentaci´on ´ unica y la in- formaci´on como una funci´on de su interacci´on con el ambiente construido en el sis- tema. Aunque, los mecanismos precisos difieren sustancialmente entre ILEs, la individua- lizaci´on est´a, al menos, bajo control parcial de los estudiantes. La realimentaci´on m´as rica es generada por la interacci´on del estudiante con el ambiente de aprendizaje, no con el tutor. La informaci´on m´as rica debe darse como funci´on de las elecciones del estu- diante y acciones en el ambiente de aprendizaje, en vez del discurso generado por el tutor. Los principios que sostienen al m´etodo de ense˜ nanza/aprendizaje basado en pregun- tas gu´ıa el dise˜ no para sistemas de aprendizaje que difieren sustancialmente de un STI. Dicho muy ampliamente, la inteligencia de un ILE est´a distribuida en las herramientas que lo componen, en lugar de estar centralizada. Estas herramientas computacionales pueden incluir video interactivo u otra representaci´on gr´afica, y permiten a los estu- diantes investigar y aprender t´opicos libres de control externo. Mientras esta libertad se deriva desde argumentos fundamentados sobre como ocurre el aprendizaje efectivo, tambi´en tiene beneficios pr´acticos. Los ILEs no son intensivos en conocimiento como los STIs. Se benefician de alguna representaci´on expl´ıcita de t´opicos que investiga el aprendiz, pero no son omniscientes, ‘no saben todas las respuestas correctas’. Adem´as, como muchos ILEs no buscan ense˜ nar, son libres de obligaciones de trabajar con un Modelo del Estudiante y tomar decisiones pedag´ogicas m´as complejas. Por otro lado, los ILEs tienen sus propios desaf´ıos. Si a un estudiante se le da una ‘herramienta’ que magnifica su habilidad para descubrir ideas interesantes, ¿qu´e lo previene de usar este poder para equivocarse en un vasto mar de temas sin inter´es? ¿C´omo sabr´an que clase de conocimiento construir? ¿C´omo juzgar´an tales construcciones?
Originalmente se creía que las emociones no tenían relación con el funcionamiento racional y preciso de los sistemas de cómputo; sin embargo, diversos estudios científicos han demostrado la importancia de las emociones en la comunicación humana y en la toma de decisiones (Damasio, 1996). Algunos de estos estudios se enfocan en casos de personas quienes han perdido la capacidad de expresar emociones y como esta pérdida ha afectado sus vidas. Un caso es el de un hombre joven llamado Phineas Gage que trabajaba en la construcción de las vías del ferrocarril en Estados Unidos. A sus 23 años era una persona exitosa, había logrado escalar diversos puestos en su trabajo gracias a su excelente trato y su capacidad de tratar con los trabajadores ferrocarrileros. Desafortunadamente, durante un accidente una varilla de acero le cayó en la cabeza enterrándosele; la varilla entró por la parte central del cráneo y salió por detrás de la oreja izquierda, pasándole por detrás de los ojos. En los análisis que se practicaron, de manera milagrosa la única parte que resultó con daños graves fue la glándula encargada de generar las emociones en los humanos. Tras una corta recuperación, Gage regreso a su trabajo. Parecía ser el mismo; sin embargo, su trato ya no era el mismo, había sufrido un cambio en su conducta. Su facilidad para relacionarse con las demás personas había desaparecido. Ya no era el jefe fácil de tratar y no era capaz de demostrar emoción alguna. Los médicos que lo atendieron y que estudiaron su caso llegaron a la conclusión de que debido a la falta de las emociones ya no podía comunicarse con las demás personas (Damasio, 1996).