ANÁLISIS DE RESULTADOS Y ESTADÍSTICO - María de Guadalupe Panduro Rivera.pdf

RESUMEN

3. METODOLOGÍA

3.9 ANÁLISIS DE RESULTADOS Y ESTADÍSTICO

Los resultados de los parámetros de calidad de agua fueron comparados con los límites permisibles establecidos en las normas oficiales mexicanas NOM- 127-SSA1-1994 y NOM-041-SSA1-1993, y en la guía internacional de la OMS- 2011 para la calidad del agua potable.

Por otro lado, se realizó un análisis estadístico descriptivo con promedios y desviaciones estándar, así como con medianas y valores máximos y mínimos, para cada uno de los municipios y por temporadas de estudio, utilizando sólo datos de muestras de agua de consumo humano es decir suprimiendo los valores de las determinaciones en muestras de lagunas y depósitos de agua para inyección (no son fuente de abastecimiento directa de agua). Para la

estadística descriptiva se excluyeron los casos donde la variable tuvo un valor de cero, o bien no pudo ser determinada.

Las variables de estudio fueron analizadas para determinar su distribución normal mediante la prueba de Shapiro-Wilks, que es la herramienta más recomendable para testar la normalidad de una muestra (Guisande-González et al., 2006). Esta prueba fue realizada con el software Statgraphics Centurion XV.II, definiendo como hipótesis nula que una muestra de los datos proviene de una distribución normal. Valores de p menores que 0.05 conducen al rechazo de esa hipótesis al nivel de significancia del 5%, es decir, se podría afirmar que no existe una distribución normal en los datos. El definir si las variables siguen una distribución normal o no permitió decidir qué tipo de pruebas se deberá aplicar al análisis de los datos.

Del total de las variables a las que se les aplicó la prueba de Shapiro-Wilks, el 94.11% de ellas resultaron con una distribución no normal, esto se muestra en la Tabla B1 del Anexo B. Este dato dio la pauta para la aplicación de pruebas no paramétricas en el análisis de los resultados.

3.9.1 ANÁLISIS DE COMPARACIÓN MÚLTIPLE

Se efectuó un análisis de comparación múltiple de los diferentes parámetros (Statistica 10) para contrastar la variación entre los municipios de estudio por cada temporada de muestreo, tomándose en cuenta solamente las variables determinadas; además, sólo se tomaron en cuenta sitios de abastecimiento de agua para consumo humano. Para ello primero se aplicó la prueba no paramétrica de Kruskal-Wallis con la que se compararon más de dos grupos tomando en cuenta los valores de las medianas, con un nivel de confianza del 95%. Asimismo se realizaron comparaciones entre temporadas para un mismo municipio empleando la prueba de medianas de Mann-Whitney (Wilcoxon), que consiste en comparar las medianas de dos conjuntos de datos. Posteriormente para determinar cuáles municipios son significativamente diferentes de otros en su respectiva temporada de muestreo se utilizó la prueba de comparación múltiple no paramétrica (Statistica 10) basado en el test de Kruskal-Wallis.

Finalmente para expresar gráficamente dichas comparaciones, resumir y analizar las variaciones de los datos, se utilizaron diagramas de caja y bigotes.

3.9.2 ANÁLISIS DE CORRELACIÓN MÚLTIPLE

También se llevó a cabo un análisis de correlación múltiple (Statgraphics Centurion XV.II) por temporada de muestreo para cada municipio mediante coeficientes de correlación de Spearman, con el fin de establecer el grado de asociación entre especies químicas que sugieran su origen o posibles fuentes en común, o bien la forma química en la que probablemente se encuentran en el agua de estudio. Para realizar este análisis sólo se consideraron sitios de abastecimiento de agua para consumo humano.

3.9.3 ANÁLISIS MULTIVARIADO

Se aplicaron técnicas de estadística multivariada (Statistica 10) como lo fueron el análisis de conglomerados (AC) y el análisis de componentes principales (ACP) con el objetivo de identificar fuentes de contaminantes, encontrar diferencias y similitudes entre sitios de muestreo, observar asociaciones entre contaminantes y determinar los parámetros que influyen mayormente en la variación de los datos.

Antes de la aplicación de ambas técnicas se requirió un tratamiento previo de los datos. Los valores debajo de los límites de detección fueron remplazados por sus respectivos límites de detección (Fharnham et al., 2002). Al conocer la falta de normalidad en los datos, se normalizaron por medio de una transformación logarítmica (Kowalkowski et al., 2006). Después de este tratamiento, se procedió a estandarizar los datos transformados a fin de minimizar los efectos de las diferencias en las unidades de medida y varianza, y para hacer los datos adimensionales (Lattin et al., 2003).

3.9.3.1 ANÁLISIS DE COMPONENTES PRINCIPALES (ACP)/

ANÁLISIS FACTORIAL (AF)

El conjunto de estos dos métodos es utilizado con frecuencia para identificar posibles factores o fuentes que influyen en la calidad del agua. El ACP es una técnica apropiada para formar nuevas variables a partir de combinaciones lineales de las variables originales. El número máximo de nuevas variables es el número de variables originales, y las nuevas variables no se encuentran correlacionadas entre ellas (Sharma, 1996). El ACP, se puede ver como una técnica para la reducción de dimensiones, es decir que reduce el número de variables, que representan la variabilidad de los datos en gran proporción y encontrar un número pequeño de combinaciones lineales no correlacionadas de las variables originales, que son capaces de explicar la parte esencial de la estructura de covarianza de los datos de interés (Petersen et al., 2001). Por otro lado el AF reduce aún más la contribución de las variables menos significativas obtenidas por el ACP y el nuevo grupo de variables son conocidas como varifactores (VF) que son extraídos a través de la rotación del eje definido por el ACP, como resultado un número pequeño de factores podrán explicar la misma cantidad de información que las observaciones originales.

Los términos “fuerte”, “moderado”, y “débil” son criterios aplicados a las cargas factoriales (factor loadings), referidos a valores de carga absolutos de >0.75, 0.75-0.50 y 0.50-0.30, respectivamente (Shrestha & Kazama, 2007). En este estudio dicho análisis se aplicó a las variables normalizadas y estandarizadas para extraer los VF significativos y reducir la contribución de las variables con mejor significancia, basándose en el criterio de eigenvalues>1 para determinar el número de factores más significativos. En éste análisis se empleó la normalización Varimax como método de rotación para una interpretación mejor

de los resultados. El objetivo del ACP/AF fue el de identificar los factores o fuentes que influyen mayormente en la calidad del agua de los sitios muestreados en cada una de las temporadas de muestreo.

3.9.3.2 ANÁLISIS DE CLUSTER (AC)

El AC es un grupo de técnicas multivariadas cuyo propósito principal es agrupar objetos en función de las características que poseen. El AC clasifica objetos, de modo que cada objeto es similar a los otros en el grupo con respecto a un criterio de selección predeterminado. La aglomeración jerárquica es el enfoque más común, proporciona relaciones de similitud intuitiva entre cualquier muestra y todo el conjunto de datos, y típicamente se ilustra por un dendrograma (diagrama de árbol) (McKenna, 2003). El dendrograma ofrece un resumen visual de los procesos de agrupamiento, presentando una imagen de los grupos y su proximidad, con una reducción en la dimensionalidad de los datos originales. La distancia Euclidiana por lo general da la similitud entre dos muestras y una distancia puede ser representada por la diferencia entre los valores analíticos de las muestras (Otto, 1998). En este trabajo se aplicó un AC aglomerativo jerárquico al conjunto de datos normalizados y estandarizados, utilizando el método de Ward, ya que de acuerdo a Sharma (1996), genera una proporción mayor de observaciones correctas clasificadas en comparación con otros métodos. Además se utilizó la distancia Euclidiana cuadrada como medida de similitud por ser una de las más empleadas. La finalidad de aplicar el AC en este estudio fue la de encontrar similitudes e identificar agrupaciones tanto de las variables de estudio como de los sitios de muestreo para cada temporada de muestreo.

In document María de Guadalupe Panduro Rivera.pdf - Repositorio CIATEJ (página 53-57)