ENCOPE BENEFI-
3.3 Comparación y discusión de las variables aplicadas en el análisis
Debido a que la codificación de las variables difiere no sólo entre la ENOE y la ENCOPE, sino también entre los diferentes levantamientos de la ENCOPE y sobre todo entre la ENCOPE-UNAM y la ENCOPE-INEGI, se tuvo que realizar una armonización entre las variables de interés, e identificar cuáles de estas variables eran susceptibles de homogeneizarse. A continuación se describe a grandes rasgos la definición de estas variables.
La variable género se codificó de manera binaria, de tal manera que en todas las encuestas el valor uno correspondiera a “Hombre” y cero a “Mujer”. De la misma manera, en la variable alfabetismo el valor uno corresponde a aquellas que respondieron afirmativamente que saben leer y escribir y el valor cero corresponde a aquellas personas que contestaron negativamente.
Debido a que las variables correspondientes a la educación no eran homogéneas en todas las encuestas se decidió crear la variable escolaridad, que corresponde a los años de educación terminada. En la ENCOPE 2008-I se tenía sólo información por niveles de escolaridad y no por años; sin embargo, en la ENCOPE 2008-II y 2009-I se tenía la información en niveles y en años. De tal forma se consideró que si respondieron que tenían educación preescolar correspondía a 2 años de escolaridad, primaria a 8 años, secundaria a 11 años, preparatoria, normal, o carrera técnica a 14 años, licenciatura o educación profesional a 18 años, maestría a 20 años y doctorado a 23 años de escolaridad.
La variable de estado conyugal se transformó a una variable binaria, en donde el valor uno corresponde a las personas que declararon estar casados (as) o vivir en unión libre y el valor cero son aquellas personas que respondieron estar separadas, divorciadas, viudos (as) o solteros (as).12
12 Sin embargo, con el propósito de hacer más claro este indicador, para las tablas descriptivas (5.3-5.8, 6.3-6.8), se utilizó una definición simple, donde uno corresponde a casado (a) y cero a soltero (a), el resto de los estados civiles no se toman
Para crear la variable región se utilizaron las variables que contenían el municipio al que pertenecía el entrevistado. Los Estados que componen a cada región del país se indican a continuación:
• Región Nororiente: Coahuila, Durango, Nuevo León, Tamaulipas y San Luis Potosí. • Región Occidente: Aguascalientes, Colima, Guanajuato, Jalisco, Michoacán, Querétaro • Nayarit y Zacatecas.
• Región Central: Distrito Federal, Estado de México, Hidalgo, Morelos, Puebla y Tlaxcala. • Región Noroccidente: Baja California, Baja California Sur, Chihuahua, Sinaloa y Sonora.
• Región Sureste: Campeche, Chiapas, Guerrero, Oaxaca, Quintana Roo, Tabasco, Veracruz y Yucatán.
En la ENOE se seleccionaron a aquellos individuos correspondientes a la Población Económicamente Activa, ya que los Subprogramas aquí evaluados están dirigidos a un subgrupo de esa parte de la Población, en específico a los a los desempleados y subempleados buscadores de empleo. Además, se unificó la variable Empleo, la cual tiene valor uno si la persona respondió estar empleada o subempleada y cero en otro caso.
Para definir el tiempo de búsqueda de trabajo, en la ENOE se identificaron a los individuos que indicaron buscar trabajo y se tomaron en cuenta las semanas que respondieron como duración de búsqueda de empleo. Por otro lado, en la encuestas ENCOPE se definió el tiempo de búsqueda como el periodo transcurrido desde la fecha en que terminó el curso de capacitación (o se entregó el apoyo) y la fecha de inicio del primer trabajo.
Es pertinente mencionar que en la ENCOPE es posible que las personas que no trabajan tengan algún ingreso declarado, el cual tiene como posible fuente ingresos provenientes de redes sociales (familia), apoyos de programas gubernamentales, laborales temporales independientes no consideradas como trabajo, entre otros. Considerando esta salvedad, se construyó el ingreso mensual, en donde las personas que declararon su ingreso de forma diaria éste se multiplicó por treinta, las de ingreso semanal se multiplicó por cuatro y las personas que lo declararon quincenalmente se multiplicó por 2, tomando también en cuenta los ingresos por pieza producida.
La variable correspondiente a las prestaciones de salud se redujo a una variable binaria, en donde aquellas personas que tienen acceso a algún sistema de salud público (IMSS, ISSSTE, PEMEX, Naval, etc) tienen valor uno y aquellas que respondieron negativamente tienen valor cero.
La variable prestaciones se codificó como una variable binaria, en donde el valor uno corresponde a las personas que declararon al menos tener una de las siguientes prestaciones en su
trabajo: aguinaldo, vacaciones con goce de sueldo, o reparto de utilidades. Si no declararon tener alguna de las anteriores se imputó el valor cero.
Es importante mencionar que como en toda encuesta se encontraron varios casos atípicos u “outliers”, en su mayoría en los ingresos declarados, por lo que se decidió, además de excluir los casos evidentemente desproporcionados, no incluir en la muestra a las personas con ingresos dentro del 5% más alto y más bajo de la distribución. Adicionalmente, se excluyeron de la muestra a los individuos mayores de 65 años. Obviamente, tenemos que descartar también las observaciones incompletas en las variables que utilizamos para el análisis.
4. Metodología
Para la evaluación seguimos el marco del modelo de Roy-Rubin definiendo contrafactuales, determinando potential outcomes para tratados y no tratados (Rosenbaum & Rubin, 1983). Lo esencial de este marco es que pensamos en el efecto del impacto como la diferencia del resultado (por ejemplo, el ingreso) de una persona tratada con su resultado en el caso de si esta persona no hubiera sido tratada. Esta diferencia es hipotética, porque nunca observamos las mismas personas en ambas situaciones; observamos alguien sólo como tratado o como no tratado. El marco de Roy- Rubin define cómo estimar la diferencia hipotética, es decir, el impacto de un tratamiento usando la información observable.
En términos técnicos, sea yi0 el resultado potencial para alguien que no participe (Di=0) en el programa de interés (Empleo Formal o una modalidad de Bécate), y sea yi1 el resultado potencial para un participante (Di=1). El efecto causal es dado por yi1–yi0, pero es imposible observar esta diferencia porque no podemos observar alguien (la persona i) en dos estados al mismo tiempo. Observamos yi=yi0+(yi1–yi0)Di, entonces sólo tenemos yi1 o yi0, pero nunca ambos. ¿Cómo podemos identificar el efecto causal? Discutimos en breve la estrategia de la identificación. Todos los detalles se encuentran en Lee (2005); una referencia más accesible es Khander et al. (2010).