Descripción de los sistemas de vacuno en los Pirineos Centrales
CAPÍTULO 3. DESCRIPCIÓN DE LOS SISTEMAS DE VACUNO EN LOS PIRINEOS CENTRALES
1. Introducción y objetivos
2.3. Tipología de las explotaciones de vacuno de carne
Para el establecimiento de la tipología de explotaciones se utilizaron técnicas estadísticas multivariantes, en particular Análisis Factorial por el método de Componentes Principales (ACP) y Análisis Cluster o de Conglomerados (AC). Se utilizaron los paquetes estadísticos SPSS13.0. y STATISTICA 6.
El objetivo genérico de los métodos factoriales es reducir la información proporcionada por un gran número de variables, eliminar las redundantes y obtener otras nuevas variables sintéticas, para que de esta manera se facilite el análisis e interpretación de la heterogeneidad de la matriz original de datos. Por otra parte, el AC permite la clasificación automática de las observaciones de la muestra en grupos homogéneos en función de una serie de variables, en este caso obtenidas en el ACP.
A partir de la información procedente de la encuesta a explotaciones referida a la estructura de las explotaciones, grado de intensificación y manejo técnico de los rebaños se realizó un ACP sobre 9 variables: ha de Superficie Agrícola Útil (SAU); Unidades Ganado Bovino (UGB); UGB por ha de superficie forrajera; % de días de pastoreo en zonas intermedias sobre pastoreo total; Unidades de Trabajo Año totales (UTA); % de terneros cebados sobre terneros totales vendidos propios; gasto en concentrado (€) por UGB; ha de SAU por UTA; y % de ha de prados de siega sobre pastos totales. Las variables fueron elegidas en función de su representatividad, asegurando los criterios de normalidad y no multicolinealidad.
Capítulo 3. Descripción de los Sistemas de Vacuno en los Pirineos Centrales
47
2.3.1. Análisis de Componentes Principales
El Análisis de Componentes Principales (ACP) es un método utilizado para la simplificación o reducción de la dimensión de individuos, casos o variables cuantitativas para obtener nuevas variables, denominadas componentes o factores principales, que explican la mayor parte de la varianza de la matriz de datos original, y cuyo objetivo es facilitar la interpretación de los resultados obtenidos (Serrano, 2002). El método realiza una combinación lineal de todas las variables y las reduce en función de la intercorrelación que presenten entre ellas para crear un menor número de factores no correlacionados (Hair et al., 2006). Es decir, el proceso obtiene un número reducido de k factores capaces de explicar el mayor porcentaje posible de la varianza total. Dentro de los métodos factoriales, existen diferentes métodos de extracción de factores, en función del enfoque que se adopte (Carrasco y Hernán, 1993). El análisis puede ser exploratorio, cuando no se conoce a priori el número de factores y se pretende demostrar la existencia de factores comunes sospechados, o confirmatorio, cuando los factores son establecidos a priori; en éste último se utilizan contrastes de hipótesis para su corroboración. El ACP es un método exploratorio de factores comunes.
El ACP tiene sentido si se cumplen las condiciones de parsimonia e interpretabilidad. Una forma para comprobar la primera condición es mediante la medida de adecuación de la muestra de Kaiser-Mayer-Olkin (KMO) o la Medida de Suficiencia de Muestreo (MSA), que pueden tomar valores entre cero y uno. Hair et al. (2006) indican valores del MSA < 0,5 = inaceptable; 0,5 o superior = despreciable; 0,6 o superior = mediocre; 0,7 o superior = regular y 0,8 o superior = sobresaliente. Por su parte Pérez (2005) indica los siguientes valores de KMO para validar el análisis: < 0,5 = inaceptable; > 0,5 y ≤ 0,75 = aceptable y > 0,75 = buena. La varianza total explicada por cada componente o factor indica la importancia que tienen para interpretar satisfactoriamente los resultados. La elección de estos factores se basa en criterios que garantizan que cada componente principal obtenido explique el mayor porcentaje de la variación total, o más que cada variable estandarizada (Visauta y Martori, 2003). De esta manera, la varianza total explicada por los k primeros componentes debe ser próxima al 100%. Establecer el porcentaje mínimo de varianza que deben explicar los factores depende de la aplicación concreta del ACP, aunque varios autores recomiendan que entre el 70% y 80% de la varianza explicada por el menor número de variables es suficiente para validar el análisis (Bisquerra, 1989; Hair et al., 2006). En este sentido, se recomienda la retención de aquellos componentes cuyo Valor Propio sea mayor a uno y que sean los necesarios para que conjuntamente puedan explicar el mayor porcentaje posible de la varianza total (Carrasco y Hernán, 1993), siendo éste el criterio utilizado en el trabajo.
La interpretación de los factores obtenidos se realiza en función de las variables originales que presentan un mayor coeficiente de correlación con los factores. Algunos autores recomiendan considerar valores (cargas factoriales) mayores a 0,5 (Visauta y Martori, 2003; Pérez, 2005). En este trabajo se establecieron cargas factoriales de 0,5 como mínimo, con lo que se logró
Capítulo 3. Descripción de los Sistemas de Vacuno en los Pirineos Centrales
48
que cada componente estuviera relacionado con un menor número de variables y con ello favorecer la interpretación.
Las cargas factoriales utilizadas son las representadas en la matriz de factores rotados. Algunos autores indican que con el uso de estas matrices la carga factorial se incrementa, sin que con ello se altere la proporción explicativa de los factores (Bisquerra, 1989). Existen diversos métodos para la rotación de factores que pueden ser oblicuos u ortogonales. Para el análisis de los datos se utilizó el método de rotación Varimax. Éste es un método ortogonal (mantiene la condición de perpendicularidad entre cada uno de los factores rotados), recomendado por Carrasco y Hernán (1993), sobre todo cuando existe un número reducido de variables. De esta forma, cada componente rotado presenta una elevada correlación con un número menor de variables, además con el proceso de normalización de Kaiser utilizado, se evita que factores con una mayor capacidad explicativa pesen más en el cálculo y condicionen la rotación (Hair et al., 2006).
2.3.2. Análisis Cluster Jerárquico
El método de Análisis Cluster o de Conglomerados (AC) es una técnica, en muchas ocasiones utilizada de manera complementaría al ACP, para la clasificación de un amplio número de sujetos o casos en subgrupos de máxima homogeneidad interna y máxima heterogeneidad externa (Guisande et al., 2006), que trata de situarlos en grupos, conglomerados o clusters, no conocidos (Carrasco y Hernán, 1993). El AC no debe confundirse con el Análisis Discriminante (AD), ya que el objetivo de éste último es explicar o describir una clasificación establecida a priori, mientras que el AC intenta generar esa clasificación.
El AC puede ser no jerárquico7F
8 y jerárquico (Serrano, 2002); el método jerárquico es el más utilizado cuando se requiere clasificar datos o individuos con una estructura de árbol en función de diferentes niveles de jerarquía. En el AC jerárquico ascendente o aglomerativo8F
9, utilizado en este trabajo, se parte de tantos grupos iniciales como individuos en el estudio; se trata de conseguir agrupaciones sucesivas entre ellos, de forma que progresivamente se vayan integrando en clusters que a su vez se unirán entre sí a un nivel superior, formando grupos mayores que finalmente se unirán en un cluster general único que contiene a toda la muestra. Todos los casos analizados son representados en un dendograma (Pérez, 2005; Guisande et
al., 2006). En cada paso del algoritmo sólo un objeto cambia de grupo, mientras que los grupos
establecidos han sido anidados en los pasos anteriores. Es decir, si un objeto ha sido asignado a un determinado grupo, este ya no cambiará más (Vicens, 1996).
Para la realización del AC se utilizaron las coordenadas de las explotaciones en los primeros factores o ejes previamente obtenidos en el ACP y que explicaban el mayor porcentaje de la
8 A diferencia del jerárquico, en el AC no jerárquico se conoce a priori el número de grupos que se desea. 9 El AC jerárquico descendente o disociativo parte de un conglomerado general (conjunto de individuos), que se van dividiendo en grupos más pequeños y homogéneos hasta llegar en última instancia a cada uno de los sujetos como un conglomerado más simple.
Capítulo 3. Descripción de los Sistemas de Vacuno en los Pirineos Centrales
49 varianza total. De esta manera, se cumple con los requisitos mínimos necesarios para la aplicación de este tipo de análisis, es decir, los factores no están correlacionados, la unidad de medida es la misma, el número de factores explicativos se reduce y se favorece la interpretación (Martínez-Ramos, 1984).
La aplicación práctica de este análisis supone considerar dos decisiones principales: el criterio de agregación y el algoritmo de clasificación. El criterio de agregación o la medida de distancia permite medir la similitud entre dos individuos genéricos a partir de la matriz de datos de entrada, para obtener una matriz de similitud o disimilitud entre los individuos (Visauta y Martori, 2003). En los análisis se utilizó la Distancia Euclídea al cuadrado entre cada par de observaciones como método para calcular la distancia entre individuos, que es el que normalmente se utiliza con el método de agrupación de Ward (Carrasco y Hernán, 1993). Como algoritmo de clasificación o de vinculación de casos se utilizó el método de Ward o de mínima varianza, que considera como distancia entre dos grupos el menor incremento de la varianza residual global. Este método es el indicado cuando se tiene un número reducido de variables y tiende a formar clusters esféricos o compactos del mismo tamaño (Carrasco y Hernán, 1993).
En cuanto al número de grupos resultantes del AC, éste puede determinarse visualmente en el dendograma resultante del análisis, en función de la distancia de ligamiento entre grupos (cuando las distancias sucesivas entre los pasos marquen un repentino salto), o también puede recurrirse a algunos estadísticos como el Criterio Cúbico de Clustering, el valor seudo F o seudo T (SAS, 1994).
Capítulo 3. Descripción de los Sistemas de Vacuno en los Pirineos Centrales
50
3. Resultados