Trayectorias de Evolución y Factores de Cambio
CAPÍTULO 4. TRAYECTORIAS DE EVOLUCIÓN Y FACTORES DE CAMBIO
2.3. Análisis de la relación entre Patrones de evolución y otras variables
El estudio de las relaciones entre los patrones de evolución identificados en el apartado anterior y otras variables relacionadas con el medio socioeconómico, determinadas características de la familia y del sistema de producción, se realizó mediante Análisis Discriminante (AD).
El Análisis Discriminante (AD) es un técnica estadística multivariante cuyo objetivo fundamental es analizar si existen diferencias significativas entre grupos de objetos u observaciones definidos a priori, respecto a un conjunto de variables predictoras (variables independientes) que son métricas, y si las hay, a que se deben y en que sentido se presentan. También se puede utilizar para pronosticar el grupo preestablecido al que pueden pertenecer nuevas observaciones. Por tanto, se puede considerar el AD como un tipo de análisis de grupos o perfiles, siendo su naturaleza descriptiva, o bien como una técnica predictiva cuando se trata de clasificar nuevos individuos u observaciones.
Capítulo 4. Trayectorias de Evolución y Factores de Cambio
126
En el AD los grupos de pertenencia de cada individuo están previamente definidos (variable categórica dependiente) y tiene la capacidad de tratar dos o más grupos, denominándose en este último caso análisis discriminante múltiple.
Si tenemos un conjunto de n objetos divididos en q grupos (Gi; i=1,...,q) de tamaños (ng;g=1,...,q) que constituyen una partición de la población de la que dichos objetos proceden, y un conjunto de variables explicativas numéricas observadas sobre dichos objetos Y =
(Y1,...,Yp), podemos utilizar esta información para discriminar entre los q grupos anteriores (Salvador, 2004).
La construcción del modelo discriminante exige unos requisitos que deben cumplirse; las variables utilizadas en el análisis deben cumplir con la hipótesis de normalidad y heterocedasticidad. La última supone contrastar la hipótesis nula de igualdad de las matrices de varianza y covarianza de las variables analizadas (Huberty, 1994). Se utiliza el estadístico M de Box que contrasta hasta qué punto las matrices de varianzas–covariancias para cada variable pueden proceder o no de la misma población, es decir si difieren o no significativamente. El proceso llevado a cabo por el AD consiste en la reducción de las variables explicativas a unas nuevas variables “canónicas”, combinación lineal de las originales, que son expresadas en la función discriminante y que permiten una mejor explicación de las diferencias entre grupos (Bisquerra, 1989).
Existen varios procedimientos para la obtención de las funciones discriminantes, siendo el procedimiento de Fisher el utilizado en este trabajo, ya que es uno de los más utilizados (Salvador, 2004). Posteriormente, hay que seleccionar un método de selección de variables, habiéndose utilizado el de la Lamba de Wilks que permite medir el poder discriminante de un conjunto de variables. Para crear o derivar las funciones discriminantes existen dos tipos de algoritmos de selección: el método de introducir variables independientes juntas (método directo o simultáneo) y el método de inclusión por pasos (Vicens, 1996). En el primero las funciones discriminantes se calculan basándose en el conjunto completo de variables independientes, sin considerar la capacidad discriminante de cada variable individualmente. En el segundo se incluyen las variables independientes de una en una, según su capacidad discriminante; este último método es el utilizado en este trabajo.
En el proceso de inclusión por pasos es necesario proporcionar un valor F de entrada y de salida de la variables en la función discriminante. Si el valor obtenido al introducir una variable en el conjunto discriminante no es inferior al valor de entrada, la variable considerada no entra en dicho conjunto, y si el valor obtenido al eliminarla del conjunto de discriminación no es superior al de salida, la variable considerada no sale de dicho conjunto (Huberty, 1994; Guisande et al., 2006). En el análisis se tomó como criterio de entrada una significación máxima de F de 0,05 y para eliminar de 0,06.
El número de funciones discriminantes se determina mediante un contraste de hipótesis secuencial, mediante el estadístico de Lambda de Wilks y la correlación canónica. Las
Capítulo 4. Trayectorias de Evolución y Factores de Cambio
127 funciones discriminantes resultantes permiten describir los grupos y determinan el porcentaje de la varianza total explicada por la suma de las funciones obtenidas (Pérez, 2005).
Para interpretar el resultado obtenido, es decir el significado de las funciones discriminantes, se utiliza la matriz de estructura que mide la correlación lineal entre cada variable independiente y las funciones discriminantes. De esta forma, es posible interpretar el significado de las funciones utilizando, para cada una de ellas, aquéllas variables con los que mayor correlación tienen (Pérez, 2005). Así mismo, para analizar el sentido de la discriminación, es decir qué grupos separa cada función discriminante y en qué sentido, se puede utilizar además de las representaciones gráficas una comparación de los centroides de los grupos, que es una medida resumen de las diferencias entre los grupos (Hair et al., 1999). Por último, para determinar la capacidad predictiva de la función discriminante se construyen matrices de clasificación; así, para evaluar la eficiencia se construye la denominada tabla de confusión, que nos muestra el número de sujetos correcta e incorrectamente clasificados sobre el total de la muestra utilizada en el análisis discriminante (Visauta y Martori, 2003).
El nuestro caso el AD se realizó a partir de variables independientes diferentes a las utilizadas en la clasificación e identificación de los patrones de evolución (variable dependiente). Con ello se pretendía identificar las circunstancias que influyen o ayudan a interpretar dichos patrones de evolución. Uno de los principales problemas en el AD es la elección adecuada de las variables, sobre todo cuando se tiene un número considerable de ellas (Bisquerra, 1989). Por esta razón, varios autores recomiendan realizar un análisis exploratorio previo de los datos, con el fin de elegir las variables que cumplan con criterios de normalidad y que no se correlacionen entre sí para evitar solapamiento de los resultados (Salvador y Gargallo, 2003; Visauta y Martori, 2003; Hair et al., 2006;). Bajo estas condiciones, se realizó un análisis preliminar a un total de 43 variables referidas al entorno físico, la familia y la estructura de las explotaciones en las dos fechas de estudio (1990 y 2004). Se eliminaron 14 variables que no cumplieron la prueba normalidad (P > 0,05). Posteriormente, sobre las 29 restantes se realizo un análisis de correlación de Pearson y se eliminaron siete variables más que estaban correlacionadas (P > 0,05). Finalmente, se realizó un ACP con las 22 variables restantes, cuyas características se muestran en la Tabla 2. El ACP se ha planteado frecuentemente para sustituir en el AD las variables originales por factores (White, 1982; Gil et al., 2003), con lo que se garantiza, por un lado, evitar complicaciones derivadas de la multicolinealidad (Hair et al., 2006), y por otro, se reduce considerablemente el número de variables independientes y la interpretación de las funciones descriptivas o explicativas es más clara y sencilla.
Los resultados del AD pueden interpretarse desde dos ópticas: considerando el significado de las funciones discriminantes entre grupos, bien por el análisis de la matriz de estructura y los coeficientes estandarizados de dichas funciones (Bisquerra, 1989), o bien por el sentido de la discriminación entre los grupos establecidos, es decir, identificando cuales son los grupos que separa o describe cada función discriminante y si lo hace en sentido positivo o negativo. Con este método, utilizado en este trabajo, se recurre a la representación gráfica del espacio de
Capítulo 4. Trayectorias de Evolución y Factores de Cambio
128
discriminación y a los perfiles multivariantes correspondientes a cada grupo (Guisande et al., 2006).
Tabla 2. Variables del entorno socio-económico, familia y explotación utilizadas en el AD
Denominación Variable Tipo
Población1 Evolución de la población de derecho del municipio en % Entorno Explot. Vacuno1 Evolución del número de explotaciones de vacuno en % Entorno
Distancia Distancia a la cabecera de comarca (km) Entorno
Tur_rural1 Evolución de los establecimientos de turismo rural en % Entorno Pob_Agric1 Evolución de la población activa en sector agrícola en % Entorno Pob_Serv1 Evolución de la población activa en sector servicios en % Entorno
Edad 90 Edad del ganadero en 1990 (años) Familia
Pluri_total 90 Pluriactividad de la familia en 1990 (valor de 0 a 2: ninguno, un
miembro, dos miembros o más) Familia
No.personas 90 No. de personas en la familia en 1990 Familia
Edad 04 Edad del ganadero en 2004 (años) Familia
Estudios 04 Nivel de estudios del ganadero en 2004 (valor de 0 a 3: sin
estudios, primarios, secundarios, superiores) Familia
Pluri_total 04 Pluriactividad de la familia en 2004 (valor de 0 a 2: ninguno, un
miembro, dos miembros o más) Familia
No.personas 04 No. de personas en la familia en 2004 Familia
No.hijos >16 04 No. de hijos mayores de 16 años en 2004 Familia
UGO/UGT 90 % de Unidades Ganaderas de ovino sobre el total en 1990 Explotación
UTA 90 Unidades de Trabajo Año totales en 1990 Explotación
Ing-leche/IT 90 % de ingresos por venta de leche sobre ingresos totales en
1990 Explotación
Subv/IT 90 % de subvenciones sobre ingresos totales en 1990 Explotación
UGO/UGT04 % de Unidades Ganaderas de ovino sobre el total en 2004 Explotación
UTA 04 Unidades de Trabajo Año totales en 2004 Explotación
Subv/IT 04 % de subvenciones sobre ingresos totales en 2004 Explotación
Dinámica 04 Índice de dinámica de la explotación en 2004 (valor entre –2 y +10 según el número de cambios tecnológicos realizados por el ganadero en los últimos cinco años)
Explotación 1 Turismo rural calculado como (2004-2000)/2000x100; Población de derecho (2001-1991)/1991x100; Explotaciones de vacuno (2001-1991)/1991x100 y Población activa (2003-1991)/1991x100.
Capítulo 4. Trayectorias de Evolución y Factores de Cambio
129
3. Resultados