• No se han encontrado resultados

Obtenci´ on de las reglas

En el paso anterior se han obtenido los antecedentes de las reglas, se tra- ta de las variables de entrada m´as influyentes para cada intervalo salida Ij,

para cada intervalo de salida ENNj. Donde la regla Rj ha sido formulada,

la condici´on m´as importante se ha dado para la salida en un intervalo dado

Ij = [−b,−c). La regla obtenida es que los pesos asociados se proporcio-

nan como la caracter´ıstica m´as importante de este intervalo, si µui[−b,−c) y σui[−b,−c) son la media y la desviaci´on est´andar de la variable ui en el rango

de salida [−b,−c). Luego se toma como antecedente de dominio y por lo tanto para este intervalo, los valores que la variable ui toma en el interva-

lo (µui[−b,−c)−σui[−b,−c), µui[−b,−c)+σui[−b,−c)) [Martinez, Castellanos, 2009a ].

Por lo tanto, se obtiene como la primera regla o norma importante sobre el intervalo salida [−b,−c)

Si ai ∈(µui[−b,−c)−σui[−b,−c), µui[−b,−c)+σui[−b,−c))→salida∈[−b,−c) = Ij

(4.3) O lo que es el mismo:

Dondei es el n´umero de variables de entrada y j es el n´umero de inter- valos de salida. De esta manera se indica que en el rango de salida Ij, la

variable m´as importante es la i-th variable de entrada y se esta dando los valores tomados por la i-th variable de entrada para el conjunto de salida

Ij. Por ´ultimo, la extracci´on de conocimiento para cada red ENNj se hace

obteniendo una regla o un subconjunto de reglas para cada intervalo de salida. Cada regla Rj corresponde a un intervalo de salida. Cada intervalo

salida tiene asociado una red ENNj, la red ha sido entrenada y cuyos pesos

asociados definen las variables que deben ser antecedentes de cada regla. Siguiendo el mismo proceso se enuncian normas o reglas m´as generales con un antecedente o normas m´as finas con m´as de un antecedente ´unico.

Rj : Si ai ∈[m, n)∧ · · · ∧aj ∈[p, q) entonces Ij (4.5)

Se comprueba que la regla se verifica para los valores extremos del in- tervalo, y adem´as para el resto de los valores dentro del rango de variaci´on del antecedente.

4.5.1.

Ejemplo de una aplicaci´on

El par´ametro de volumen es uno de los par´ametros m´as importantes en la investigaci´on forestal, cuando se trata de algunos inventarios forestales. Por lo general, algunos ´arboles son cortados peri´odicamente con el fin de obtener dichos par´ametros mediante tablas de cubicaci´on para cada ´arbol y en un entorno determinado. De esta manera, se construye un repositorio para poder calcular el volumen de madera para una zona determinada o los bosques y para las especies arb´oreas dadas en diferentes entornos naturales.

Se ha utilizado un archivo de conjunto de datos, con el fin de implemen- tar el m´etodo explicado. El ejemplo de aplicaci´on es un conjunto de datos de eucaliptos obtenidos de una regi´on en Espa˜na. El objetivo principal es detectar las relaciones entre todas las variables que est´an en nuestro estu- dio, y tambi´en se trata de estimar el volumen de madera. Las variables de entrada consideradas para la red son di´ametro, espesor de corteza (corteza), crecimiento de di´ametro, altura y edad. La variable de salida fue el volumen de la madera.

Han sido entrenadas redes de neuronas ENN, pero en todo caso el apren- dizaje no mejora inicialmente cuando se testea todo el conjunto. La relaci´on

Tabla 4.1: Las variables de entrada m´as importantes: pesos asociados en cada intervalo de volumen de salida (o clase) con el error cuadr´atico medio (MSE) obtenido por ENN.

Clase Edad Diametro Altura Corteza Active Performance 1 -0.147 -0.046 0.705 1.279 MSE = 0.060 2 0.036 0.788 0.596 0.586 MSE = 0.110 3 0.142 0.670 0.669 0.495 MSE = 0.019 4 -0.181 0.840 0.8248 0.57 MSE= 0.062

Los valores en negrita representan las variables m´as importantes en cada clase

de error no debe ser aceptable, el conocimiento aprendido por la red tiene un error que se considera demasiado grande. La partici´on a partir de los pesos asociados en intervalos de divisi´on diferentes para todos los patro- nes, se realiza por primera vez en positivos y negativos. Se concluye y por ´

ultimo cuatro redes ENN han sido entrenadas. El error es menor cuando el conjunto de patrones total se divide en subconjuntos y una red ENN est´a entrenada para cada subconjunto de patrones. En este ejemplo, por ´

ultimo, cuatro redes neuronales se construyeron, una para cada conjunto de patrones S1,· · ·, S4. Una red neuronal se entrena para cada intervalo.

Ahora, en cada uno de los conjuntos de patrones obtenidos, las variables de entrada m´as importantes, se hallan en cada uno de los subconjuntos, mediante el algoritmo de extracci´on (ME). A continuaci´on, en la tabla 4.1 es muestra los pesos de las cuatro redes entrenadas obtenidos en la primera fase MB.

En el segundo paso, se aplica el m´etodo denominado ME. Ahora, cuan- do el conjunto est´a dividido en cuatro subconjuntos y obtenidos sus pesos asociados, se observa en cada subconjunto obtenido o clase, que es posible detectar que la variable de entrada m´as importante est´a cambiando en cada clase. Debido a que los pesos asociados en cada red ENN var´ıan. La corteza aparece como la variable m´as importante, seguido por la altura en la pri- mera clase. En la segunda clase la variable de entrada m´as importante ha cambiado y ahora la variable principal es el di´ametro y en la tercera clase da la misma importancia para el di´ametro y la altura. Mientras que en la cuarta clase es el di´ametro de la variable m´as importante de nuevo. Los pesos se estudian cuando son estables y no cambian.

Tabla 4.2: Los valores de las variables en cada ENNi. Antecedentes de do-

minio de las reglas.

Clase Volumen Diametro Corteza Altura Edad

Media 1 43.39 9.55 8.84 11.9 12.9 Desviaci´on 1 20.7 2.06 4.76 2.32 4.54 Media 2 95.13 13.13 17.4 16.41 12.9 Desviaci´on 2 12.55 1.16 5.16 1.62 4.44 Media 3 161.33 15.61 26.087 19.48 1.4 Desviaci´on 3 25.24 1.27 5.66 2.03 3.38 Media 4 476.87 22.89 69.3 25.88 15.43 Desviaci´on 4 226.21 4.19 30.1 4.33 2.53

La tabla 4.2 muestra el dominio posible de los antecedentes de las reglas. En el tercer paso de la soluci´on es un conjunto de reglas. De las anterio- res secciones se han obtenido las siguientes reglas a partir de las redes de neuronas ENN. Son reglas extra´ıdas anteriormente para el caso estudiado del volumen de la madera. Cuando la red ha aprendido es posible obtener un buen conjunto de reglas, si existe una relaci´on entre el buen aprendizaje y la red entrenada. Para cada intervalo de salida de un conjunto de reglas se obtiene con una o m´as variables como antecedentes, parte de las reglas obtenidas son:

corteza∈[4,13.6]∩altura∈[9.5,14.2] → volumen∈[22,64]

diametro´ ∈[12,14.3]∩altura∈[12.4,22.5] → volumen∈[82,107]

di´ametro∈[14.3,16.9]∩altura∈[20.4,31.7] → volumen∈[136,186]

di´ametro∈[18.2,27]∩altura∈[39,99] → volumen∈[250,703]

diametro´ ≥14.3∩altura≥20.4 → volumen≥136

di´ametro≥14.3∩corteza≥40 → volumen≥136

El problema objeto de estudio es la predicci´on del volumen de la madera, las reglas obtenidas son ´utiles para estimar la cantidad de madera usando variables t´ıpicas de la vegetaci´on. El conocimiento obtenido se compara con otros m´etodos tales como repositorio con las tablas de volumen para un ´

arbol dado de una determinada especie, as´ı como los m´etodos estad´ısticos de la regresi´on etc. Los resultados son similares en cada caso.