4. PROBLEMA DE INVESTIGACIÓN
7.5. Procesamiento y análisis estadístico de datos
La información obtenida en las encuestas por cada sujeto de estudio fueron vaciadas en el programa de Excel®. Utilizando las funciones de dicho programa se comprobaron
errores numéricos y se rectificaron los datos (Heeringa et al., 2010).
Posteriormente, se procedió a la transferencia de la información al software Statistica
versión 7 (Statistica, 2006). El diseño de la base de datos se realizó de la siguiente manera:
Cada columna del software contenía el nombre de la variable correspondiente a la pregunta planteada. En las filas de la variable se insertó el valor de la calificación que otorgó cada turista en el respectivo agroecosistema turístico que visitó. El grupo de variables de una temática sirvió para integrar el indicador del factor social, el indicador del factor ambiental y el indicador del factor económico.
Estadísticas descriptivas
Por cada agroecosistema y por cada indicador de los diferentes factores, se estimaron las estadísticas descriptivas que corresponden a los promedios, desviación estándar, rango (mínimo-máximo), sumatorias (totales), frecuencias y porcentajes (Heeringa et al., 2010). Estos estadísticos se calcularon principalmente para caracterizar los
agroecosistemas turísticos, los datos personales de los propietarios y los turistas.
Para la determinación de la percepción de los propietarios sobre el manejo de los factores sociales, económicos y ambientales se utilizó el promedio y análisis de varianza (ANOVA)
Análisis de Varianza (ANOVA)
Para los propietarios y los turistas, se aplicó un análisis de varianza (ANOVA) por cada factor evaluado (factor social, ambiental y económico) con el propósito de determinar si existen diferencias significativas entre estos (Pfeffermann y Rao, 2009). Esta prueba no
114
indica donde existen tales diferencias, sólo indica si hay diferencias entre los agroecosistemas turísticos (López-Collado, 2012), por tanto es necesario aplicar pruebas de Tukey.
Dicho análisis consiste en la partición de la varianza de los valores de cada variable y está basado en las siguientes fuentes de variación:
- El error (95%)
- Los objetos de estudio (los 12 agroecosistemas turísticos) - Asume una distribución de probabilidad F (Fisher).
Puesto que la distribución F es la razón entre varianzas muestrales, ésta se empleó como la estadística de prueba.
Además del estadístico F, también asume el cálculo del cuadro medio del error y cuadrado medio de los tratamientos (en este caso, cada agroecosistemas turísticos fue considerado como un tratamiento).
El ANOVA es similar al análisis de regresión y los dos pertenecen a modelos lineales. Los modelos lineales se caracterizan por investigar la relación entre una variable respuesta que puede tomar valores cuantitativos y una o más variables explicatorías. En este estudio, en el ANOVA las variables respuesta fueron los 12 agroecosistemas turísticos y las variables explicatorías fueron los valores de las respuestas a la preguntas realizadas (Pfeffermann y Rao, 2009).
El ANOVA arroja el valor de p (0.05), e indica que si el valor es < 0.05 no se acepta la
hipótesis nula (Pfeffermann y Rao, 2009). En este sentido, se consideró en este estudio, que si p < 0.05 existe diferencia entre la percepción de los turistas respecto al
manejo de los factores sociales, ambientales y económicos de los agroecosistemas turísticos que visitó.
115 Prueba de F
Bajo la H0 el test estadístico F que se calcula en el ANOVA tiene una distribución F de Fisher con (k-1, n-k) grados de libertad.
La prueba de F es un estimador que “acompaña” al ANOVA y permite determinar
efectos de diferentes factores involucrados (sociales, ambientales y económicos) por separado, para esto se utilizan las sumas de cuadrados tipo III (SS III). Para dos o más tratamientos (agroecosistemas turísticos), la prueba de F es equivalente a la prueba de t^2 (Student) (López-Collado, 2012).
Prueba de Tukey
Además del ANOVA, se aplica una prueba de comparación de medias de Tukey, asumiendo grupos homogéneos (Pfeffermann y Rao, 2009). La prueba estadística que utiliza el método post hoc de Tukey es la comparación de medias y se utilizó para
identificar cuál es el agroecosistema turístico con diferente valor de percepción por los turistas en el factor social, económico y ambiental.
Prueba de Kruskall-Wallis
Es un método no paramétrico que se utiliza para probar si el grupo de datos que se tomaron a partir de las encuestas proviene del mismo universo muestral (agroecosistema turístico). Intuitivamente, es similar al ANOVA, pero es una extensión de la prueba de la U de Mann-Whitney para tres o más grupos (agroecosistemas turísticos).
Ya que es una prueba no paramétrica, la prueba de Kruskal-Wallis asume, bajo la hipótesis nula, que los datos vienen de la misma distribución.
Análisis de componentes principales
El método de Análisis de Componentes principales permite obtener una combinación lineal de las variables (un índice) que tenga por finalidad resumir la información con la
116
condición que maximice la varianza de las variables. La aplicación de componentes principales es habitualmente para la obtención de indicadores complejos y estudiar la relevancia de las variables en la explicación de los fenómenos turísticos.
Con la finalidad de conocer la relación que existe entre las variables de percepción seleccionadas para el aspecto social, ambiental y económico y la semejanza de manejo de los agroecosistemas estudiados, se realizó el análisis de componentes principales. En este sentido, el análisis de componentes principales se realizó con las variables originales obteniendo el Componente Principal 1 más el Componente Principal 2 que superan el 60% de la variabilidad total que aporta cada variable, como lo sugiere la literatura (Niefer, 2006). Esta técnica permite determinar el número de clúster a ser formados (Statsoft, 1999). En general, el análisis de componentes principales se aplicó para conocer los indicadores de sustentabilidad de los desarrollos ecoturísticos y saber cómo se agrupaban o diferenciaban entre ellos. Una vez obtenidos los gráficos y valores, se procedió a realizar un análisis discriminante (Heeringa et al., 2010), el cual
permitió identificar el grado de manejo del recurso social, ambiental y económico. Análisis de regresión (correlación Spearman)
Spearman R puede ser pensado como el coeficiente de correlación ordinaria de Pearson (Pearson r), es decir, en términos de la proporción de variabilidad representada, excepto que Spearman R se calcula a partir de filas. Spearman R asume que las variables en estudio se midieron en al menos un ordinal (orden de importancia) la escala. Es decir, las observaciones individuales (casos) se pueden clasificar en dos series ordenado. En este sentido, se promedió la calificación del factor social, ambiental y económico del propietario y la que asignó el turista a las variables relacionadas (Operacionalización de hipótesis 3; Cuadro 10); por tanto, se procede a realizar un análisis de relación y correlación por cada factor (social, ambiental y económico).
117
Se estima los valores de la r que indican el grado de ajuste de la relación entre las variables de percepción de propietarios y visitantes, la ecuación de regresión: y = a + bx y la probabilidad asociada (α = 0.05) para determinar diferencias significativas entre las variables independientes.
118