Clasificación de los países y períodos de acuerdo a la tipología elaborada

PARTE I. A NÁLISIS RETROSPECTIVO

IV. T IPOLOGÍA D EMOGRÁFICA DE LA M IGRACIÓN N ETA A NÁLISIS TRANSVERSAL DEL

IV.2 Objetivos y preguntas

IV.3.2 Clasificación de los países y períodos de acuerdo a la tipología elaborada

En el Gráfico IV.1 (a y b) se proyectan las observaciones (país-período) sobre los planos factoriales, definidos por la intersección de los tres factores o componentes hallados. En

I II III IV Valores negativos de la migración neta masculina en edades adultas y avanzadas. Valores positivos de la migración neta masculina en edades adultas y avanzadas. Valores positivos de la TMN

femenina en edades adultas y avanzadas.

Valores negativos de la TMN femenina en edades adultas y avanzadas.

104

ellos se aprecia que las observaciones quedan representadas con claridad como una nube de puntos dentro del espacio vectorial.

Gráfico IV.1 Representación de las observaciones (país-período) en el primer y segundo plano factorial.

Es plausible en este caso considerar el uso de un método de clasificación como son las técnicas de Análisis de Conglomerados (Cluster), que nos permitirá identificar qué países se asocian más o menos a cada uno de estos patrones de calendario y sexo en la migración neta identificados en IV.3.1.2.

IV.3.2.1

Agrupación de las observaciones en base al Análisis de Conglomerados

El análisis de conglomerados es un procedimiento exploratorio, que parte de la construcción de una matriz de distancias o similitudes entre las observaciones (en este caso países-períodos) en cuanto a determinadas variables. En esta investigación, las variables empleadas en la identificación de distancias entre observaciones son los componentes o factores obtenidos mediante el ACP y presentados en IV.3.1.

El objetivo es identificar en función de las distancias (entre observaciones y grupos, e inter-grupos), cuáles son aquellas observaciones que comparten características comunes respecto a las variables empleadas en la definición de distancia, conformando un mismo grupo.

El Análisis de Conglomerados hace uso de algoritmos que forman grupos dividiendo o agregando las observaciones proyectadas en la nube de puntos que definen las variables en cuestión, que en este caso son los componentes principales (Gráfico X.2 en anexo).

105

Se trabajó con la familia de los métodos Jerárquicos Aglomerativos, los cuales parten de la nube de puntos de las observaciones y acercan los puntos menos distantes o disimilares de forma sucesiva, hasta llegar a formar un grupo con todos los individuos. Éstos consideran todos los niveles de distancia, de tal manera que los grupos de nivel superior contienen a los grupos de niveles inferiores, por eso se llaman jerárquicos.

Dentro de este grupo se trabajó con el llamado método de Ward en el que se emplea una definición de distancia euclidiana canónica. En él se maximiza la dispersión inter-grupos y se minimiza la intra-grupos, agrupando primero a las observaciones más cercanas entre sí y recalculando el baricentro de cada grupo a media que se añade una nueva observación al mismo.

Los algoritmos de clasificación jerárquica son robustos, es decir que un método para los mismos datos produce los mismos resultados y no requieren de un número de clases preestablecido, y ello significa que la dinámica de “árbol” mediante la que funciona esta forma de clasificación permite mostrar la estructura de clases propia de los datos (Pardo & Cabarcas 2001: 78).

En las técnicas de análisis de conglomerados la elección de un número óptimo de grupos con el que trabajar es arbitraria y depende del investigador. En este caso la elección de los grupos se fundamenta en los resultados arrojados por el Test de Calinsky y Harabsz (Pseudo F) y el Test de Duda y Hart (Pseudo t2_{). El primero de ellos recoge la relación} entre las varianzas y es análogo al Test F del análisis multivariado. El segundo, evalúa la significatividad de la reducción de la suma de cuadrados que produce el incremento del número de grupos.

Gráfico IV.2 Test de Calinsky y Harbsz. Valores del Pseudo F.

Número de grupos P se ud o F

106

El Gráfico IV.2 muestra cómo en la realización del test de Calinsky y Harbsz los valores de Pseudo F aumentaron gradualmente hasta alcanzar un máximo en el escenario donde se consideraban hasta 6 grupos. Este máximo indica el número adecuado de grupos.

A pesar de un crecimiento marginal del indicador a partir del grupo 11, parece claro que la población tiene un número definido de grupos cercano a 6. Similares son los resultados obtenidos para el test de Duda y Hart y el dendograma (Gráfico X.2 ver en Anexo). Éste último muestra con precisión de qué manera se formaron los grupos mediante el algoritmo de Ward, y parece indicar la existencia de hasta 6 grandes grupos.

De esta forma se obtuvieron los grupos que resumen la variabilidad de las observaciones de país-período según el patrón migratorio por sexo y edades vigente en cada caso.

IV.3.2.2

Metodología empleada en la caracterización de los grupos

En los siguientes gráficos las observaciones se discriminan con claridad en la clasificación obtenida, y ello es verificable tanto en el primer y segundo plano factorial (Gráfico IV.3 y Gráfico IV.4), como en el plano definido por el segundo y tercer componentes (Gráfico IV.5).

Como evidencian las diferencias en las distancias intergrupales al pasar de un gráfico a otro, i. e. de un plano factorial al otro, es necesario que la interpretación y caracterización de cada grupo se haga atendiendo a su posición en el mayor número posible de planos factoriales, pues ello enriquece el análisis.

Gráfico IV.3 Proyección de los grupos en el primer plano factorial

-6 -4 -2 0 2 4 C o mp o n e n te 2 -4 -2 0 2 4 Componente 1

107

Gráfico IV.4 Proyección de los grupos en el segundo plano factorial

Gráfico IV.5 Proyección de los grupos con el segundo y tercer componente

Véase un ejemplo. En el primer plano factorial (Gráfico IV.3) el grupo 1 y 4 guardan una distancia entre sí de dimensiones considerables. Ambos están bien representados por los valores positivos del componente 2, pero se diferencian en cuanto a su representación sobre el componente 1, ya que las observaciones del grupo 1 se sitúan sobre los valores positivos de este eje mientras que el grupo 4 muestra valores negativos. Sin embargo, en el gráfico que refleja el plano factorial definido por los componentes 2 y 3 (Gráfico IV.5), ambos grupos apenas se distinguen, lo que supone que comparten características en cuanto al patrón de movilidad de edades avanzadas de ambos sexos y sólo se diferencian en cuanto al signo de la migración neta de las edades jóvenes.

Este ejemplo demuestra que la riqueza de la interpretación viene dada por el análisis conjunto del comportamiento de cada grupo en cuanto a la totalidad de variables

-6 -4 -2 0 2 4 C o mp o n e n te 3 -4 -2 0 2 4 Componente 1

Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5 Grupo 6

-6 -4 -2 0 2 4 C o mp o n e n te 3 -4 -2 0 2 4 Componente 2

108

empleadas (componentes) en el mayor número posible de planos factoriales, que en este caso reflejan patrones de sexo y edad de la migración neta.

En el anexo se presenta un listado detallado de la ubicación de las observaciones dentro de cada grupo (Tabla X.3 y Tabla X.4). Pero la caracterización y análisis de los grupos en cuanto al patrón de sexo y edades de la migración neta se presentan en la siguiente sección. Allí la mirada se dirige a la trayectoria de cada país inter e intra-grupos.

IV.4Análisis empírico

IV.4.1 Tipología de calendarios y sexo de la migración neta latinoamericana, 1950-

In document El componente demográfico en las migraciones exteriores de América Latina, 1950-2050 (página 117-122)