3. LA TEORÍA DE LOS CONJUNTOS DIFUSOS
4.2. Metodología de aplicación
4.2.1. Datos de entrada
La definición de los datos de entrada es la primera fase a seguir en la creación de un sistema de inferencia difusa, o sistema de reglas difusas. Para ello deben elegirse las variables de entrada, determinarse el dominio de definición de las mismas, subdividirse dicho dominio y definirse, a partir de la subdivisión, los diversos números difusos que van a formar los condicionantes de las reglas difusas.
Para elegir qué variables van a constituirse en datos de entrada, si el sistema lógico difuso va a emplearse para reproducir la gestión histórica, deben tenerse en cuenta los datos existentes, los objetivos perseguidos al obtener las reglas de explotación y las circunstancias concretas de cada caso en particular.
Si el sistema de inferencia difusa va a ser definido a partir de un algoritmo determinístico, hay que unir a las circunstancias anteriores otras específicas para esta aplicación. En primer lugar, el análisis de la información disponible y del sistema de gestión a reproducir ya se ha realizado con anterioridad, puesto que dicho análisis es fase necesaria en la definición de cualquier algoritmo de gestión, siendo preciso únicamente recopilarlo. En segundo lugar, la existencia de un algoritmo previo permite un rango de posibles datos de entrada más amplio, ya que a los datos procedentes de registros históricos pueden unirse los resultados intermedios, o incluso finales, del modelo. Como ejemplo podría tomarse el caso de un sistema de gestión con dos embalses en paralelo (A y B), con el objetivo de definir un sistema lógico difuso para la gestión de las sueltas del embalse A. En este caso se podría
se podría construir un sistema lógico difuso cuyos datos de entrada fueran, además de los correspondientes al embalse A (volumen almacenado y entradas), los del embalse B. De esta forma se utilizan resultados del modelo determinista (en este caso volúmenes del embalse B) para definir el sistema de inferencia difusa. En este caso el sistema lógico difuso se emplearía para detallar el modelo determinista, de forma que el gestor del embalse A, a partir de datos medibles de forma directa, sea capaz de tomar decisiones sin necesidad de recurrir a simulaciones del modelo determinista al completo, sino únicamente operando el sistema de inferencia difusa para el embalse A, que obviamente debe presentar datos de entrada del embalse B al hallarse éste en paralelo.
Dadas las múltiples posibilidades, el rango de datos de entrada disponible es muy elevado. Decidir cuáles tomar en consideración depende finalmente del uso que se quiera dar al sistema lógico difuso y su relación con la aplicación que tenga el algoritmo determinístico. En el ejemplo anterior, al tratarse de un sistema de inferencia difusa de detalle, es necesario un mayor número de datos respecto al algoritmo original. La decisión debe ser tomada con juicio de experto, teniendo en cuenta todas las variables y con sumo cuidado. Sin embargo, en el caso de sistemas definidos a partir de algoritmos, existe una “regla de oro” que permite solventar este proceso de decisión. Esta regla dice que, si el sistema lógico difuso a definir va a ser aplicado sobre los mismos elementos de gestión que el algoritmo determinista (misma escala), con exactamente los mismos objetivos (mismo fin), la solución más eficiente consiste en tomar exactamente los mismos datos de entrada que dicho algoritmo. Ello es debido a que en el proceso de determinación del algoritmo de origen se ha realizado un análisis de qué datos de entrada son importantes.
Una vez decididas las variables de entrada, es necesario proceder a la caracterización de las mismas. En un sistema lógico difuso cada una de las clases en las que se decida dividir cada variable de entrada debe caracterizarse con un único número difuso. Dichos números difusos pueden ser definidos en la práctica de varios modos distintos, atendiendo a criterios de experto o a los datos existentes, adoptando varias formas en sus funciones de pertenencia, lo que sin duda supone un amplio abanico de posibilidades en su definición y, por ende, en el sistema lógico difuso resultante.
La forma utilizada en el presente documento para definir estos números difusos, tal y como exponen Russell y Campbell (1996), consiste en dividir equitativamente el dominio de cada variable de entrada en n-1 intervalos, siendo n el número de clases en las cuales se desea dividir dicho dato de entrada; y utilizar los límites de dichos intervalos para definir los vértices de los números difusos triangulares que caracterizan las n clases en las que se pretende dividir dicha variable; de forma que los vértices de un número difuso vengan determinados por 3 límites consecutivos y exista un solape parcial entre números difusos contiguos, como muestra la siguiente figura:
Figura 19.- División en categorías empleando números difusos triangulares
La imagen muestra cinco números difusos triangulares, cada uno de los cuales representa una de las categorías en las que se divide la variable de entrada. En este caso, por ejemplo, el número difuso de color verde y tramo punto-raya podría corresponder a un valor "medio" del dato de entrada, mientras que el rojo y trama de rayas cortas podría corresponder a un valor "bajo" o "medio-bajo". También se observa un solape parcial entre un número con sus adyacentes, así como el hecho de que todos los vértices de los números difusos se hallan en valores del eje x correspondientes a la división del dominio de la variable en 4 partes iguales, es decir, n-1 divisiones.
Como ejemplo, suponer que se desea caracterizar el dato de entrada “volumen almacenado”, cuyo dominio es el intervalo [0, 10], empleando números difusos, de forma
0.00 0.25 0.50 0.75 1.00
correspondientes a las 3 clases anteriores se deben recorrer estos límites de acuerdo a la secuencia 0-5-10.
El número difuso correspondiente a la categoría inferior, según Russell y Campbell (1996), debe presentar los dos vértices inferiores idénticos e iguales al valor inferior del intervalo, por lo que deben ser iguales a 0. El vértice restante se obtiene siguiendo la secuencia de límites 0-5-10, siendo igual a 5, por lo que el número difuso “bajo” queda definido por [0, 0, 5]. Para que el nivel “medio” solape parcialmente con el “bajo”, respetando los límites de intervalos anteriores, deben solaparse dos vértices entre sí, y puesto que “medio” es superior a “bajo”, los vértices a solapar deben ser los dos vértices superiores de “bajo”(0 y 5), que se convierten en los dos vértices inferiores de “medio”. Para definir el vértice superior de este último únicamente debe seguirse la secuencia numérica de los límites. En este caso, al ser el segundo vértice igual a 5, el tercer vértice es, siguiendo la secuencia 0-5- 10, igual a 10. El número difuso “medio” queda caracterizado por el número difuso triangular [0, 5, 10]. Para definir el número difuso “alto” es necesario solapar dos vértices con “medio”, por lo que los vértices superiores de éste (5 y 10) se convierten en los vértices inferiores de “alto”. Al ser “alto” la categoría superior los dos vértices superiores deben ser idénticos e iguales al valor superior del intervalo, por lo que el número difuso resultante queda determinado por [5, 10, 10]. Gráficamente el resultado es el siguiente:
Figura 20.- Ejemplo de división de volumen almacenado en categorías empleando números difusos
0 0.25 0.5 0.75 1 0 1 2 3 4 5 6 7 8 9 10 P e rt e ne nc ia Hm3
División de volumen almacenado en números difusos
Bajo Medio Alto
En resumen, basta con dividir el dominio de la variable en función de los números difusos que se empleen en su caracterización y asignar los vértices de dichos números difusos en base a los límites de dichas divisiones, teniendo en cuenta que los vértices de los números deben ser límites consecutivos, que los números extremos presentan dos vértices idénticos, y que cada número debe compartir dos vértices con sus adyacentes.