CHILE
El uso de mŽtodos factoriales sin duda puede presentar complejidades adicionales a la propia del objeto de estudio. Como se ha dicho: Òlos datos iniciales son numerosos pero cada uno de ellos es claro (É) el an‡lisis factorial proporciona resultados menos numerosos pero poco claros en tŽrminos de los datos iniciales (É) Esta traducci—n de los resultados factoriales (los valores finales del ’ndice1) en tŽrminos de datos iniciales constituye el primer aspecto en la interpretaci—nÓ. (Escofier, B. y Pages, J., 1992.).
1. An‡lisis en componentes principales
El mŽtodo con el cual se ha construido el ISHO es el An‡lisis en Componentes Principales cl‡sico y estandarizado (ACP).
El mŽtodo de s’ntesis de los datos
En este cap’tulo y como una manera de hacer ampliamente comprensible la lectura de los resultados del ISHO, s—lo es preciso retener que el ACP resume los datos considerando adem‡s las ponderaciones que cada variable presenta, es decir, es sensible a la mayor o menor contribuci—n de cada variable a la situaci—n global de seguridad objetiva. Finalmente, el ACP resume la mayor cantidad posible de informaci—n presente en los datos originales, expres‡n- dolos sintŽticamente ahora en una œnica
variable principal. Ser‡, entonces, esa nueva y œnica variable principal la que, contrastada (estandarizada) con un perfil ideal, permitir‡ calcular los valores finales del Indice de Seguridad Humana objetiva. No hay que olvidar que el mŽtodo incorpora la idea de espacios diferenciados para la poblaci—n econ—micamente activa y para aquella econ—micamente inactiva. Las varia- bles empleadas para las personas inactivas se escogieron de manera que el valor del
1N.d.r
’ndice que se les calcula no los ÒpenaliceÓ en las variables que no les son pertinentes. Es decir, el c‡lculo de la Seguridad Humana de los inactivos se ha realizado teniendo en cuenta s—lo aquellas variables que le son aplicables asumiendo ,a partir de un supuesto conceptual (refrendado por los datos), que el resto de las dimensiones est‡n cubiertas por la situaci—n de seguridad de los activos de quienes dependen los primeros.
En principio el An‡lisis en Componentes Principales considera, en cualquiera de sus versiones, la ponderaci—n de los casos. Lo que diferencia los distintos tipos de an‡lisis en realidad es la ponderaci—n asociada a las variables iniciales. En efecto, el an‡lisis cl‡sico incorpora por defecto la ponderaci—n uniforme de las variables :
En este caso, impl’citamente se hace desempe–ar a las variables un rol equilibrado. Para un adecuado uso de este mŽtodo se requiere que las variables sean medidas en la misma unidad.
El an‡lisis estandarizado se aplica justamente cuando las variables no se miden en las mismas unidades. Entonces esto se resuelve llevando las variables a una misma escala. Ello se lleva a cabo ponderando cada variable por una magnitud inversamente proporcional a su dispersi—n. Esta dispersi—n se mide a travŽs de la desviaci—n est‡ndar de la variable.
v
JX
JK1
(1/s1)
v
JX
JKw
KEn el an‡lisis cl‡sico y estandarizado se generan tres familias de resultados :
(1) Las coordenadas principales (akl) o
componentes tŽcnicas de la ponderaci—n del indicador k. Esta familia de coeficientes es wk-normada.
En efecto, åkwk(akl)2=1
(2) Las contribuciones absolutas de los indicadores a las varianzas de las variables principales .
(3) Los coeficientes de regresi—n (bkl), que
aparecen directamente en la formulaci—n del ’ndice.
El an‡lisis en Componentes Principales permite, adem‡s de reducir la dimensionalidad, extraer el m‡ximo de variabilidad en los datos (es decir la informaci—n m‡s sustancial). El ACP se ha empleado en este trabajo de manera bastante parecida al an‡lisis de regresi—n.
En efecto, se tiene un conjunto de variables explicativas, que se consideran como constitutivas de la seguridad de las personas. Al inicio del procedimiento, estas variables ponderadas y combinadas tienen como resultado la elaboraci—n de una nueva variable, tal que, a cada categor’a de descriptor se le asocia un valor calculado como combinaci—n lineal de los valores que toma esa categor’a en las distintas variables que constituyen el campo objetivo de la seguridad.
Por analog’a con el an‡lisis de regresi—n, se puede pensar al conjunto de valores del ’ndice para un descriptor dado, como la variable Òpor explicarÓ (en ACP el tŽrmino que la designa es el de Òvariable principalÓ). Contrariamente al an‡lisis de regresi—n, en d—nde se ajusta un modelo a la variable Òpor explicarÓ o variable ÒdependienteÓ, para la cual sus valores son conocidos de antemano, el ACP produce los valores de esta nueva variable.
En realidad, una vez desarrollado el mŽtodo por completo, se obtiene un conjunto de variables principales, combinaciones linea- les de variables iniciales, dos a dos no
correlacionadas y con bases de misma norma igual a uno. Es por eso que se dice que las variables principales son dos a dos ÒortonormadasÓ.
En verdad, estas variables se han construido en el ACP para descomponer la variabilidad total de la nube multivariante. Esta nube multivariante corresponde en la definici—n del ’ndice a las categor’as de un descriptor. En efecto, para construir el ’ndice, interesa conocer la variabilidad o magnitud de las interdistancias entre las categor’as de un mismo descriptor.
Como se puede apreciar en el p r i m e r gr‡fico factorial regiones-Activos 1996
(Gr‡fico 7), interesa saber, por ejemplo, si, considerando conjuntamente las doce variables mencionadas anteriormente, la Ia. regi—n es m‡s o menos similar a la Regi—n Metropolitana que la IIa. regi—n. Interesa adem‡s saber cu‡les variables sustentan esta figura. En efecto, no todas las variables iniciales tienen la misma importancia al construir una variable sintŽtica.
Esta variable sintŽtica es justamente aquella que permite visualizar lo mejor posible el escalamiento de las regiones en funci—n de las doce variables iniciales de interŽs. Mediante el gr‡fico citado se puede apreciar la nube que representa a la poblaci—n activa por regiones. Los ejes de este gr‡fico nos permiten representar conjuntamente un 52%
de la varianza total.
Selecci—n de variables y segmentaci—n de la base de datos
Durante el proceso de evaluaci—n conceptual de las variables a ser incluidas en el ’ndice se lleg— a la conclusi—n - como se ver‡ m‡s adelante - de que la mayor’a de ellas eran variables asociadas con la situaci—n laboral. Este hecho result— congruente con los resultados de otras l’neas del proyecto (grupos de discusi—n y estudio de familias), las cuales mostraron la centralidad de la variable empleo como fuente, detonante, agravante y a veces incluso promotora de soluciones en relaci—n con las situaciones de inseguridad vividas y percibidas por la gente (ver cap’tulos correspondientes).
Sin embargo, al momento de elaborar una base de datos para el ISHO qued— claro que no pod’a medirse con esas mismas variables a personas inactivas (en su gran mayor’a j—venes estudiantes y due–as de casa) que por definici—n no buscan trabajar. Claramente la seguridad de esas personas, al menos en los aspectos materiales, se funda en buena medida en la seguridad de los otros activos de quienes depende. Sin embargo, a este grupo de inactivos s’ le son exigibles las variables referidas a los otros mecanismos de seguridad, como los relativos a la salud, a la escolaridad y a los recursos de tipo institucional y patrimonial. Por ello es que, para el caso del ’ndice objetivo, la base de datos hubo de segmentarse en dos grupos: activos e inactivos. A cada grupo se le calcul— su situaci—n de logro en cada uno de los mecanismos de seguridad diferencialmente definidos para unos y otros. Sin embargo, y m‡s all‡ de esta precisi—n en el mŽtodo, en este ac‡pite se presentan puntajes del ISHO fundidos en una sola base nacional, relev‡ndose las diferencias entre activos e inactivos cuando sea œtil para mostrar alguna tendencia interesante.
As’, a cada variable principal se le asocia un porcentaje de varianza que corresponde a la varianza de la nube proyectada perpen- dicularmente sobre ella. De manera que se puede trabajar la varianza total de la nube descomponiŽndola aditivamente en las distintas variables generadas por el mŽtodo. En resumen, el mŽtodo permite comenzar con un conjunto de variables, por lo general correlacionadas, y generar un conjunto de variables dos a dos ortonormadas. Las se- gœndas se obtienen como combinaciones lineales de las primeras. El ACP ordena estas nuevas variables segœn el porcentaje de varianza total de la nube multivariante que cada una de ellas abarca. As’ la ÒprimeraÓ variable principal es aquella que presenta la mayor varianza de la nube proyectada perpendicularmente de los pun- tos iniciales (las categor’as de descriptores). De este modo se obtiene la descomposici—n de la varianza total de la nube de categor’as
para cada descriptor, sobre cada una de las variables principales:
En efecto, se puede decir que ll es la parte
de varianza total asociada a la elŽsima variable principal.
Para la construcci—n del Indice Objetivo de Seguridad Humana realizamos una an‡lisis segœn esta misma metodolog’a para cada uno de los descriptores de interŽs. Estos son:
· Regiones
· Zonas (urbano-rural) · Ingresos
· Edades
· Sexo
Para cada descriptor se realiza un an‡lisis distinto.
A cada an‡lisis le corresponde una matriz de datos, en la cual a cada categor’a de descriptor le corresponden dos filas: una que representa a los activos y la otra a los inactivos. Es importante se–alar que los datos analizados en el ’ndice objetivo se refieren a la poblaci—n en edad de trabajar mayor de 18 a–os.
As’, en nuestro an‡lisis se introduce una ponderaci—n determinada por el descriptor. En realidad, la matriz de datos se presenta de la siguiente manera:
( )
å
å
=
=
= l l p j j DX
Var
VarM
l
1÷
÷
÷
ø
ö
ç
ç
ç
è
æ
÷
÷
÷
ø
ö
ç
ç
ç
è
æ
=
n np n px
x
x
x
v
v
....
...
...
...
1 1 1 11X
en donde vi representa el ÒpesoÓ de la categor’a i del descriptor D. Este peso se determina como frecuencia relativa de la categor’a (de activos o inactivos) en la poblaci—n de los chilenos mayores de 18 a–os de edad declarada al momento de la encuesta CASEN.
De esto el mŽtodo incorpora la idea de
espacios diferenciados para poblaci—n econ—micamente activa y para aquella econ—micamente inactiva.
Estandarizaci—n de los valores del ’ndice
El c‡lculo de la estandarizaci—n del ’ndice para activos e inactivos se construye a base de un perfil ideal m‡ximo tal que, en cada variable, le corresponde el valor m‡ximo observado. Se procede en seguida a calcular de manera similar un perfil m’nimo observado.
Para cada descriptor se formula una doble matriz de datos. La primera matriz corresponde a los datos de los activos, la segunda a los inactivos. En seguida se definen estos perfiles ideales m‡ximo y m’nimo para la matriz de activos y luego para la matriz de inactivos. N—tese que para cada categor’a de descriptor se cuenta con dos perfiles: el perfil activo y el perfil inactivo.
El c‡lculo del ’ndice objetivo estandarizado para los activos se calcula como el puntaje alcanzado por la categor’a sobre la primera variable principal (aquella que concentra la variabilidad m‡xima proyectada de la nube). Este puntaje es estandarizado relativamente a los puntajes alcanzados por los perfiles ideales m‡ximo y m’nimo sobre esta misma variable. El ’ndice objetivo estandarizado para los inactivos se calcula del mismo modo.
Dualidad individuos - variables: claves para la interpretaci—n de las nubes de puntos:
ÒÉSi se contemplan simult‡neamente los dos gr‡ficos (el que representa a la nube de individuos y el que representa a la nube de variables), un individuo quedar‡ del lado de las variables para las que presente valores fuertes y del lado opuesto de aquŽllas en que presente valores dŽbiles.
ÒEl gr‡fico de individuos es una representaci—n aproximada de las distancias entre ellos. El de variables se puede considerar como un elemento explicativo de esta representaci—n: dos individuos situados en un mismo extremo de un eje quedan cercanos por tener ambos generalmente valores fuertes en las variables situadas del mismo lado que ellos y generalmente valores dŽbiles en las variables situadas en el lado opuesto.(É)
ÒLos individuos extremos en esas variables quedar‡n normalmente lejos del origen. As’ son localizados con facilidad aquellos individuos particulares que est‡n causando, ellos solos, correlaciones fuertes. (É) ÒLas f—rmulas de transici—n relacionan la coordenada de un individuo sobre un eje con el conjunto de las coordenadas de
todas las variables en el eje de ese mismo rango. No se puede interpretar la posici—n
de un individuo, en funci—n de la (posici—n) de una sola variable (y rec’procamente). ÒLas variables son, fundamentalmente, vectores antes que simples puntos. La importancia no radica en la proximidad entre un individuo y un conjunto de puntos que representan variables, sino en el alejamiento de ese individuo en la direcci—n de este conjunto de variables.Ó (Escofier, B.; Pages, J., 1992)
INDICE DE SEGURIDAD HUMANA