Análisis discriminante. - TRATAMIENTO DE DATOS

VENEZUELA Camarones

4.4 TRATAMIENTO DE DATOS

4.4.4 Análisis discriminante.

Por medio de un análisis de funciones discriminantes se pronosticó la pertenencia de los sujetos a cada uno de los estratos establecidos a priori. Para este análisis se definió como factor de clasificación al estrato longitudinal o sector geográfico y como funciones dependientes las variables morfométricas normalizadas. En este caso, el número máximo de funciones discriminantes es de tres, al considerar cuatro posibles stocks. La contribución de cada variable a la discriminación de los grupos se determinó con base en la magnitud relativa de su respectivo coeficiente estandarizado y en el análisis de la matriz de estructuras, que consiste en los coeficientes de correlación entre cada una de las funciones discriminantes y cada una de las variables clasificadoras. A partir del promedio de cada una de las variables para cada stock, y aplicando las funciones discriminantes se calculó el centroide para cada stock (Salvador, 2000).

El poder discriminante de cada una de las funciones establecidas se midió con base en dos valores: 1) el Lambda de Wilks (Λ), que mide el poder discriminante de un conjunto de variables y toma valores entre 0 y 1, de forma que, cuanto más cerca de 0 esté, mayor es el poder discriminante de las variables consideradas, y 2) la correlación canónica, que mide en términos relativos, el poder discriminante de la i-esima función discriminante, ya que es el porcentaje de la variación total en dicha función que es explicada por las diferencias entre los grupos. Toma valores entre 0 y 1,de forma que cuanto más cerca de 1 esté su valor, mayor es la potencia de la i-esima función discriminante (Salvador, 2000; Ferrán, 2001).

Por medio del empleo de “algoritmos por pasos” se determinó qué variables aportan información relevante a la discriminación, para lo cual se empleó el criterio del Lambda de Wilks (Λ) (Salvador, 2000; Ferrán, 2001).

También se obtuvieron los coeficientes de las funciones de clasificación, a nivel de cada sector; estas funciones se emplearon con la totalidad de los individuos para determinar a que sector parecían pertenecer, siendo esto indicado por la función con la que se obtuviera el mayor valor (Ato & López, 1994). Este resultado se contrastó con las asignaciones realizadas a priori, y se realizó una tabla de clasificación donde se tabuló el número de individuos bien asignados a un sector. Esta tabla arrojó un valor del porcentaje de datos bien asignados a su respectivo stock, lo cual nos indica la efectividad de las funciones discriminantes establecidas para cada sector (Salvador, 2000).

Fue necesario realizar un segundo Análisis Discriminante, pero en esta ocasión las asignaciones a priori se realizaron por “Nubes de Estaciones”, es decir, se ubicó la totalidad de estaciones muestreadas y se asumió que los grupos formados podían ser stocks; esto con el fin de comparar los resultados y discutir la posible estructura poblacional de la especie.

La Homocedasticidad es una hipótesis que se utiliza en algunas técnicas multivariadas y se refiere a la igualdad de las matrices de varianzas y covarianzas de las variables analizadas en diversos grupos (Díaz, 1999; Salvador, 2000). Para probarla se emplea la prueba M de Box, donde la hipótesis nula plantea la homocedasticidad y la alternativa la heterocedasticidad (desigualdad de matrices de varianzas y covarianzas), es decir:

Identificación de stocks de pargo rayado. Metodología 50 Ho : ΣPT = ΣGS = ΣGC = ΣGN

Ha :No todas las Σ son iguales

El estadístico se calcula por medio de la siguiente ecuación:

2 1 2 1 q n q g n g

S

M

g − = −

∏

=

donde

S

_g y S hacen referencia a los determinantes de las matrices de varianzas y covarianzas de cada uno de los sectores y la combinada de todos los sectores; n-q es igual al tamaño de la muestra menos el número de sectores geográficos; y ng-1 el tamaño

de cada grupo menos 1.

Nuestros datos no presentaron homocedasticidad (M = 431.744; valor p de 0,000), por lo tanto, la clasificación se realizó sin asumir homocedasticidad (Díaz, L., 1999).

Por lo dispendioso de probar la multinormalidad de los datos se procedió a realizar un análisis discriminante empleando los rangos (prueba no paramétrica). Debido a que empleando este procedimiento se obtuvo una clasificación similar a la obtenida con los datos no ranqueados, se asumió que no existía inconveniente al no verificar el supuesto de multinormalidad.

Para construir la matriz de disimilaridad se empleó la Distancia Generalizada de Mahalanobis, cuya fórmula es la siguiente:

(X

X

) (S

X

)

D

=

−

' −1

−

_i_≠

_j

donde

(X

−X

)

es un vector cuyos valores representan la diferencia de los promedios de cada variable en el sector i y el sector j,

(X

−X

)

es el vector transpuesto y es un estimador de la matriz de varianzas y covarianzas combinada intra-grupal (“pooled within-group matrix”). Esta distancia viene expresada en unidades de desviación típica y considera tanto el efecto de las unidades como la correlación entre las variables (Giraldo & Rodríguez, 1997; Díaz, L., 1999).

1 −

S

Mediante el método multivariado no paramétrico del análisis de clasificación jerárquica, se agruparon las observaciones con base en la distancia de los puntos. Cada punto fue constituido por los promedios de las diferentes variables para cada sector geográfico.

El método de agrupamiento fue el de promedio aritmético no ponderado (UPGMA, unweighted pair group method using arithmetic averages); en este caso se considera que el valor de similitud entre la Unidad Muestral candidata a incorporarse y el grupo o núcleo, es igual a una similitud promedio resultante de los valores de similitud entre el candidato y cada uno de los integrantes del grupo o núcleo (Crisci & López, 1983). Este agrupamiento se graficó en forma de dendrograma, para determinar la presencia de más de un stock.

Con el objeto de visualizar claramente la separación de los sectores geográficos, se repitió el análisis discriminante con un conjunto reducido de datos (Anexo H), para lo cual en cada sector se agruparon los individuos por rangos de longitud estándar de 1 cm, para cada variable morfométrica se promediaron los valores de los individuos incluidos en ese rango; posteriormente, se eliminaron los rangos de talla no comunes para todos los sectores.

Identificación de stocks de pargo rayado. Metodología 52 Las rutinas se llevaron a cabo empleando los software Microsoft Excel, STATGRAPHICS Plus for Windows (Anexo I) y SPSS.

5. RESULTADOS

In document Identificación de stocks de pargo rayado, Lutjanus synagris (Linnaeus, 1758) en el área norte del Caribe Colombiano (página 68-73)

Análisis discriminante.

VENEZUELA Camarones

4.4 TRATAMIENTO DE DATOS

4.4.4 Análisis discriminante.

S

S

M

∏

=

S

(X

X

) (S

X

X

)

D

=

−

−

i≠

j

(X

−X

)

(X

−X

)

S

_i_≠

_j