Estructura de la hoja de cálculo para la obtención de

Coeficiente V de Cramér y tamaño del efecto

Apéndice 3.2.-. Estructura de la hoja de cálculo para la obtención de

La hoja de cálculo se ha organizado de la siguiente manera:

1) Disposición de datos: la hoja de cálculo recoge las constantes o parámetros del modelo,

como son los datos de la población, de las frecuencias relativas de la población, 𝑓𝑓̂_{𝑖𝑖,𝑗𝑗,𝑘𝑘}, calculadas a partir de los anteriores y los extraídos de la MCVL. Estos datos se utilizan en las expresiones [3.6], [3.7], [3.8], [3.10], [3.11] y [3.12] del planteamiento del problema de optimización. Se ha reservado una celda para introducir el p-valor mínimo, 𝑝𝑝𝐶𝐶𝑝𝑝𝑝𝑝𝑇𝑇𝑒𝑒𝑚𝑚í𝑛𝑛

��, exigido en los 10 ajustes correspondientes a los pares tipo de pensión/género, según la expresión [3.15].

2) Uso de funciones de Excel: se ha aligerado el problema planteado en la herramienta

Solver mediante el uso de fórmulas en celdas de la hoja de cálculo que recojan parte de las restricciones del problema de optimización. Así se ha dispuesto el cálculo provisional de los valores de la sub-muestra a obtener para cada cohorte, 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑆𝑆𝑆𝑆𝑆𝑆, mediante la función ENTERO(q*𝑁𝑁_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝐼𝐼𝑁𝑁𝑆𝑆𝑆𝑆), que realiza el truncamiento para obtener números naturales, como es el caso y se recoge en la expresión [3.9]. Al considerar valores de q inferiores a la unidad, se tiene garantizado que los valores provisionales de la sub-muestra son menores que los de la población. En lugar de añadir las restricciones

[3.10] y [3.11] al planteamiento de Solver, se han recogido en otro bloque de celdas de

la hoja de cálculo. Así, se ha calculado la diferencia entre el valor provisional obtenido de las cohortes de la sub-muestra, 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑆𝑆𝑆𝑆𝑆𝑆, con el correspondiente de la MCVL, de manera que con la función condicional SI() de Excel se asigna como valor definitivo para 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑆𝑆𝑆𝑆𝑆𝑆 en cada iteración el menor de los dos siguientes: �𝑅𝑅𝑁𝑁𝑇𝑇𝑅𝑅𝑅𝑅𝑂𝑂�𝑞𝑞 ∗ 𝑁𝑁_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝐼𝐼𝑁𝑁𝑆𝑆𝑆𝑆�; 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀�, es decir, si el número de pensiones propuesto para 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑆𝑆𝑆𝑆𝑆𝑆, 𝑅𝑅𝑁𝑁𝑇𝑇𝑅𝑅𝑅𝑅𝑂𝑂�𝑞𝑞 ∗ 𝑁𝑁_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝐼𝐼𝑁𝑁𝑆𝑆𝑆𝑆�, está incluido en la MCVL, se mantiene, si no, se asigna el número de pensiones existentes en la MCVL, 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀, menor que el que sugiere la constante de proporcionalidad. Una vez determinados los valores de 𝑛𝑛_{𝑖𝑖,𝑗𝑗,𝑘𝑘}𝑆𝑆𝑆𝑆𝑆𝑆, una celda contiene la fórmula para determinar el tamaño de la sub-muestra, expresión [3.13] y otro bloque de celdas calcula el valor de las frecuencias esperadas para cada cohorte, expresión [3.14], para poder realizar el test. Para obtener el p-valor en cada tipo de pensión y género se ha utilizado la función de Excel DISTR.CHICUAD.CD()16 que requiere dos argumentos, el valor del estadístico chi-cuadrado y los grados de libertad. Los valores de ambos vendrán dados por funciones definidas por el usuario que se explican a continuación.

3) Definición y uso de funciones definidas por el usuario: para realizar el test de ajuste

de Pearson en cada uno de los 10 casos, ya se ha declarado que se han definido dos funciones mediante Visual Basic Aplicado a Excel. La función ChiCuadradoTotal() devuelve el valor del estadístico 𝒳𝒳2, según expresión [3.16] y siguientes, a partir de la selección del rango de valores observados y del rango de valores esperados, realizando la reagrupación en cohortes de 5 o más elementos, según expresiones [3.17] y siguientes del planteamiento. La segunda función GruposChiCuadradoTotal() devuelve el número de cohortes reagrupadas, con 5 o más elementos, tal y como indican las restricciones [3.17] y siguientes. Los códigos de Visual Basic están en el Apéndice 2.4.

4) Planteamiento del problema en Solver y opciones de cálculo: el planteamiento del

problema de Solver que completa el procedimiento del problema de optimización para la búsqueda de sub-muestras de gran tamaño representativas de la población se resume

en el Gráfico 3.1. La función objetivo a maximizar, “q_PROPOR_MCVL_INSS” está ubicada en una celda de la hoja de cálculo que irá tomando los valores de la constante de proporcionalidad a partir de un valor inicial ubicado en una celda contigua. La fórmula ubicada en la celda objetivo es igual a la celda variable, “=q_inicial”, cumpliendo así el planteamiento de maximizar “q” respecto a “𝑞𝑞” de la expresión [3.5]. Una de las restricciones de [3.6], que sea mayor del 1%, aparece explícitamente en el planteamiento de Solver, mientras que la segunda restricción de [3.6] está garantizado su cumplimiento por el resto de restricciones y definiciones del problema, [3.9], [3.10] y

[3.11]. Las restricciones para mejora del ajuste de [3.15] se recogen también en el

planteamiento de Solver. En cuanto a las opciones elegidas de Solver, se ha optado por una precisión en el cumplimiento de restricciones de 0,000001 y el escalado automático. Las opciones específicas del motor GRG: convergencia de 0,0001; derivados=“Adelantada”; usar inicio múltiple con tamaño de población igual a 100 y valor de inicialización aleatorio igual a 1.17

Gráfico 3.1.- Planteamiento problema optimización en Solver

5) Resolución para distintos p-valores: por último se ha elegido resolver el problema

para 9 casos o valores del p-valor: 0,8; 0,9; 0,95; 0,97; 0,98; 0,99; 0,999; 0,9995 y 0,9999; como ejemplo de combinaciones de ajuste y gran tamaño. En la ejecución del método GRG de Solver se ha tomado como valor de partida el 1% para p-valor igual a 0,80 y después el valor de q solución proporcionado en la resolución anterior, salvo en algún caso que se ha proporcionado otro valor de partida, como para p-valor igual a 0,999 que se le ha proporcionado el valor de 3,4%18. Se podría tratar de resolver para

Sólo se ha modificado el valor de la precisión de las restricciones para la resolución en el caso de p-valor mínimo igual a 0,9999, para poder obtener un valor que con esa precisión diera una solución factible, ya que con mayor precisión no se obtenía solución, pero que en todo caso mejora la representatividad de la sub-muestra. 18_{Esto sucede con la versión tipo que viene instalada con Microsoft Excel. Con el motor de resolución LSGRG}

otros valores mínimos de p-valor inferiores a 0,9999, pero para p-valores superiores al “p-valor mínimo”19 habría que adaptar el planteamiento combinado del problema, ya que no se obtiene solución. Esa adaptación se hará tanto en la hoja de cálculo como en el planteamiento de Solver, buscando criterios más próximos a obtener sub-muestras próximas a la obtenida con un MAE, en especial el criterio de asignar el valor disponible en la MCVL si el que resulta de la constante de proporcionalidad es superior. De todas maneras, hay que tener en cuenta que se ha obtenido en el Capítulo 4 otra sub- muestra mediante MAE contenida en la MCVL, con un tamaño del 1%, aproximadamente, con un menor p-valor alcanzado de 0,9999445, por lo que hay poco margen de mejora.

Tabla 3.A1.- Informe de respuestas de Solver para el caso de p-valor ≥ 0,999 Microsoft Excel 14.0 Informe de respuestas

Hoja de cálculo: [DesembolsoPensiones2010_Submuestras_Proced_C.xlsm]SubManual_99 Informe creado: 06/04/2015 2:03:41

Resultado: Solver llegó a la probabilidad para una solución global. Motor de Solver

Motor: GRG Nonlinear

Tiempo de la solución: 0,998 segundos. Iteraciones: 0 Subproblemas: 2

Opciones de Solver

Tiempo máximo Ilimitado, Iteraciones Ilimitado, Precisión 0,000001, Usar escala automática

Convergencia 0,0001, Tamaño de población 100, Valor de inicialización aleatorio 1, Adelantada de derivados, Inicio múltiple

Máximo de subproblemas ilimitado, Máximo de soluciones de enteros Ilimitado, Tolerancia de enteros 1%, Asumir no negativo

Celda objetivo (Máx.)

Celda Nombre Valor original Valor final

$K$579 q_PROPOR_MCVL_INSS 3,400% 3,464%

Celdas de variables

Celda Nombre Valor original Valor final Entero

$L$579 q_inicial 3,400% 3,464% Continuar

Restricciones

Celda Nombre Valor de la celda Fórmula Estado Demora

$R$566 P_Value_FF_H 0,9990003 $R$566>=$M$579 Vinculante 0,0000000 $T$566 P_Value_FF_M 0,9999963 $T$566>=$M$579 No vinculante 0,0009963 $B$566 P_Value_IP_H 1,0000000 $B$566>=$M$579 No vinculante 0,0010000 $D$566 P_Value_IP_M 1,0000000 $D$566>=$M$579 No vinculante 0,0010000 $F$566 P_Value_JUB_H 0,9999191 $F$566>=$M$579 No vinculante 0,0009191 $H$566 P_Value_JUB_M 0,9995441 $H$566>=$M$579 No vinculante 0,0005441 $N$566 P_Value_ORF_H 1,0000000 $N$566>=$M$579 No vinculante 0,0010000 $P$566 P_Value_ORF_M 1,0000000 $P$566>=$M$579 No vinculante 0,0010000 $J$566 P_Value_VIU_H 1,0000000 $J$566>=$M$579 No vinculante 0,0010000 $L$566 P_Value_VIU_M 1,0000000 $L$566>=$M$579 No vinculante 0,0010000 $L$579 q_inicial 3,464% $L$579>=$M$579 No vinculante 2,464%

Fuente: Elaboración propia

Por último, se quiere remarcar que el objetivo de la resolución es encontrar soluciones factibles que proporcionen valores suficientemente elevados a la constante de proporcionalidad y, por tanto, al tamaño de la sub-muestra. No se trata tanto de justificar que la solución encontrada es el máximo global de la constante de proporcionalidad.

Apéndice 3.3.- Resultados de planteamientos alternativos de

In document La Muestra Continua de Vidas Laborales (MCVL) como fuente generadora de datos para el estudio del sistema de pensiones (página 190-193)