3. MATERIAL y MÉTODOS
3.5 Construcción de las Tarifas de Cubicación
En la construcción de las Tarifas se deben tener presentes los siguientes aspectos: a) Elección de las entradas o variables explicativas.
b) Campo de validez.
c) Elección, tamaño y distribución de la muestra. d) Información que debe acompañar una Tarifa.
a) Elección de las entradas o variables explicativas
Es muy importante seleccionar cuidadosamente las entradas, también llamadas variables explicativas o variables independientes. Van a ser las variables con las que vamos a trabajar y serán las que nos darán el volumen final del árbol. Se aconseja que las variables explicativas sean pocas, sean fáciles de medir, y además es conveniente que estén fuertemente correlacionadas con el volumen y débilmente relacionadas entre sí. Las variables independientes más utilizadas y que mejor explican el volumen del árbol son el diámetro normal, la altura total y la altura parcial.
b) Campo de validez
Las Tarifas son válidas para la especie y para el área cubierta por la muestra de árboles sobre la que se han tomado las observaciones. Es decir, la Tarifa es específicamente válida para la especie y para la masa forestal objeto de cubicación.
37
c) Elección, tamaño y distribución de la muestra
Se elige la especie forestal. El tamaño de la muestra va a depender de la especie forestal elegida, de su variabilidad morfológica, del tamaño del área a muestrear y de la variabilidad ecológica del terreno. Cuanto mayor sea la variabilidad morfológica de la especie, cuanto más extensa sea la superficie a muestrear y cuanta más variabilidad ecológica haya en la zona a muestrear, entonces mayor será el número de árboles que debe contener la muestra.
“De las experiencias de J. Pardé y J. Bouchon, podemos deducir que el número de árboles a muestrear puede oscilar entre 45, cuando queremos cubicar bosquetes de muy pequeñas dimensiones; 600 en masas forestales con superficies en torno a las 1.000 Has.; 1.500 para una región natural y 4.500 para la totalidad del área de presencia de una determinada especie arbórea cuando esta se encuentra en situaciones de calidad de estación muy variadas” (LÓPEZ PEÑA, 2005).
Una vez elegido el número de árboles de la muestra y que son necesarios para crear la Tarifa, hay que distribuirlos por toda la masa forestal objeto de cubicación.
- Se divide la superficie de masa forestal a cubicar según las distintas calidades de estación. - El número de árboles a muestrear se reparte en proporción a la superficie de cada calidad de estación.
- Dentro de cada calidad de estación se reparte el número de árboles a muestrear en proporción al área basimétrica de cada clase diamétrica.
d) Información que debe acompañar una Tarifa
Toda Tarifa de Cubicación debe venir respaldada o acompañada de la siguiente información:
- Especie para la que la Tarifa es aplicable. - Zona geográfica de validez.
- Definición de la variable dependiente y sus unidades de medida. - Definición de las variables independientes y sus unidades de medida. - Número de árboles que se han medido para la construcción de la Tarifa. - Zona geográfica en la que se han tomado las muestras.
- Método de construcción de la Tarifa y modelos ensayados. - Medidas apropiadas de precisión.
- Autor y fecha de publicación de la Tarifa.
Para la construcción de la Tarifa de Cubicación, utilizaremos el método matemático que habitualmente se presenta bajo la forma de ecuaciones que resultan de la aplicación del método estadístico de regresión de mínimos cuadrados.
Se han calculado dos estadísticos de comparación utilizados con frecuencia en modelización forestal para determinar la bondad del ajuste:
1.- El Coeficiente de Determinación Ajustado (R2adj) que representa la fracción de la variación total en los valores de la variable dependiente que es explicada por el modelo, teniendo en cuenta el número total de parámetros a estimar y el tamaño de la muestra.
38 2 2 1 2 1 ˆ ( ) 1 1 ( ) n i i i adj n i i i y y n R n p y y
Siendo: iy
:valor observado de la variable dependienteˆ
iy
:valor de la variable dependiente predicho por el modelo iy
:valor promedio de la variable dependienten: número total de datos usados en el ajuste del modelo
p: número de parámetros a estimar
2.- Error Absoluto Medio, que muestra el valor absoluto promedio de los residuos.
1 n i i E E n
Siendo:E : Error Absoluto Medio
Ei: la diferencia entre el valor observado y el valor predicho
n: número total de datos usados en el ajuste del modelo
Primeramente, en el análisis de regresión, se ha verificado que las variables explicativas para la variable dependiente tengan significancia estadística. De este modo es posible obtener estimados fiables de los verdaderos coeficientes de regresión poblacional que permitan realizar inferencia estadística sobre ellos.
“El investigador debe preocuparse más por la pertinencia lógica o teórica de las variables explicativas para la variable dependiente y por su significancia estadística. Si en este proceso obtenemos una (R2adj) elevada, muy bien; por otra parte, si (R2adj) es baja, esto no
significa que el modelo sea necesariamente malo” (GUJARATI, 2011).
A continuación, para la selección del mejor modelo, se ha utilizado el Coeficiente de Determinación Ajustado (R2adj).
“Para comparar dos modelos con base en el coeficiente de determinación, ajustado o no, el tamaño de la muestra n y la variable dependiente deben ser los mismos” (GUJARATI, 2011)
39
Esto es así, porque si los modelos tienen variables dependientes distintas, sus Coeficientes de Determinación no son equiparables pues provienen de residuos con diferentes órdenes de magnitud y por tanto no son directamente comparables.
Después, se ha considerado el Error Absoluto Medio de los modelos como medida de bondad del ajuste cuando se comparaban modelos con la misma variable dependiente.
Por último, otro aspecto que se ha tenido en cuenta es la simplicidad del modelo. Los modelos de dos o tres variables explicativas dan buenos resultados en el cálculo del volumen y son preferibles a otros modelos con más variables explicativas que, aunque sean más precisos, tienen el inconveniente de que cuantas más variables explicativas haya en el modelo, mayor es el riesgo de multicolinealidad y autocorrelación entre las variables y por tanto la precisión dada por el modelo es menos fiable.
Se ha tenido siempre presente lo siguiente: “Existen varios problemas asociados con los
sistemas de volumen que violan el principio fundamental de independencia y distribución homogénea de los errores con media cero y varianza constante: multicolinealidad, autocorrelación y heterocedasticidad son los más importantes. Aunque los estimadores obtenidos en el ajuste de regresión permanecen insesgados ante la presencia de multicolinealidad, autocorrelación y heterocedasticidad, estos no son los más eficientes”
(MYERS, 1990; KOZAK, 1997).
Sin embargo, el problema de heterocedasticidad o falta de homogeneidad de la varianza puede minimizarse. En muestras grandes los estimadores poseen ciertas propiedades estadísticas deseables que son conocidas como propiedades de muestra grande o propiedades asintóticas. Una propiedad de las muestras grandes es que el estimador es asintóticamente insesgado. Otra propiedad es que el estimador es consistente, es decir, que el estimador se aproxima al verdadero valor a medida que crece el tamaño de la muestra.