• No se han encontrado resultados

M` etode bootstrap

Recordem que treballem a la carpeta C:\TM . Un cop al SAS, executeu: libname prac ’C:\TM\’;

Necessiteu utilitzar el procediment proc surveyselect per seleccionar diverses mostres d’una mateixa poblaci´o i despr´es aplicar el m`etode bootstrap. Treballarem amb la poblaci´o d’assegurats que hav´ıem desat a l’arxiu prac.prob1.

Exercici 1 Seleccionem 50 mostres aleat`ories simples de mida n = 300 del marc mostral prac.prob1. A continuaci´o, i per a cada mostra, calculem la mediana d’edat dels assegurats que tenen 10 anys d’antiguitat o m´es. L’objectiu ´es donar un interval de confian¸ca al 95%, per a aquest estad´ıstic amb el m`etode bootstrap.

libname prac ’C:\TM’;

Proc surveyselect data=prac.prob1

out=prac.p6e1 sampsize=300 method=srs rep=50 seed=12345 stats;

run;

Proc sort data=prac.p6e1; by replicate; run; data prac.p6e2; set prac.p6e1; if (antig>10); run;

proc freq data=prac.p6e2; table replicate;

run ;

proc means data=prac.p6e2 median; var edat;

by replicate;

output out=prac.p6e3 median=median; run;

proc print data=prac.p6e3; run;

52 Guia de pr`actiques de mostreig estad´ıstic proc iml;

use prac.p6e3;

read all var{replicate} into replicate; read all var{median} into median;

print replicate median; n=nrow(median); print n; start ordena(v); v0=v; v[rank(v)]=v0; rr=v; return(rr); finish; medianord=ordena(median); i_limitinf=int(n*0.025); i_limitsup=int(n*0.975); print i_limitinf; print i_limitsup; me=sum(median)/n; meinf=medianord[i_limitinf]; mesup=medianord[i_limitsup]; print ’mediana es’ me;

print ’limit inferior es’ meinf ’i superior es’ mesup; quit;

Part 2 Exercicis individuals

Exercici 2 Agafeu una mostra de mida n = 1000 del marc mostral que trobem a prac.prob2 (visites a un museu). Mitjan¸cant el m`etode bootstrap (feu 10 submostres de mida 300), calculeu el m´ınim i el m`axim, i un interval de confian¸ca al 95% de la durada de la visita al museu per a cada dia de la setmana. Compareu el resultat amb el valor real del marc mostral.

Exercici 3 Mitjan¸cant el m`etode bootstrap (25 mostres de mida 1000), calculeu la vari`ancia de la r`atio prestacions per assist`encia dividit per ingressos mensuals a l’Enquesta de discapacitats (prac.hogares), per a aquelles llars que reben prestacions. Doneu un interval de confian¸ca al 95% per a aquesta estimaci´o.

Exercici 4 Mitjan¸cant el m`etode bootstrap (25 mostres de mida 100), calculeu la vari`ancia del percentil 25% dels ingressos familiars mensuals (recordem que hav´ıem posat una marca de classe a cada nivell de renda) i dels ingressos individuals mensuals (valor que hav´ıem assignat tenint en compte els ingressos familiars i el nombre d’individus de la llar). Doneu un interval de confian¸ca al 95% per a ambdues estimacions.

Solucions

Pr`actica 1

Part 1

Exercici 3. La variable en q¨uesti´o ´es replicate. Part 2

Exercici 11. Total (corecust) = 10608; Mitjana (edat) = 47.2613. Exercici 12. Std.Error = 0.4995.

Exercici 13. Total (corecust) = 11170.

Exercici 14. Total (corecust) = 11170, Std.Error = 1016.9469. Exercici 15. Total (corecust) = 11170; IC(95%) = [9160.0436; 13180]

Exercici 16. Mitjana (edat) = 43.58, Std.Error = 1.6266; IC(95%) = [40.3524; 46.8076]. Part 3

Exercici 18. La darrera observaci´o seleccionada a la mostra ´es la n´umero 52240. Exercici 19. Mitjana (durada) = 54.25; IC(95%) = [50.9754; 57.5246].

Exercici 20.

dia Freq. a la mostra Freq. a la poblaci´o

1 292 439 2 876 800 3 584 856 4 2629 785 5 584 1450 6 14898 17800 7 32716 30450

Exercici 21. La mida de la mostra necess`aria ´es de n = 1153. La sintaxi necess`aria per obtenir-ho:

data dades;

input alfa p Npob merror; cards; 0.05 0.75 52580 0.05 ; run; data mostra; set dades; z=probit(1-alfa/2); b=(merror/z)*(merror/z); n=(4*p*(1-p))/b;

put ’mida mostra ’ n; run;

Exercici 22. Mitjana (t) = 52.1128; IC(95%) = [51.3161; 52.9095].

Exercici 23. L’obra preferida pels visitants ´es la n´umero 3, en una proporci´o del 56.67%; IC (95%) = [55.007; 58.339].

Exercici 24.

Obra Prefer`encia IC (95%) O1 2.69% [2.15 ; 3.24] O2 19.08% [17.76 ; 20.40] O3 56.67% [55.01 ; 58.34] O4 17.11% [15.84 ; 18.37] O5 4.45% [3.76 ; 5.14]

54 Guia de pr`actiques de mostreig estad´ıstic Pr`actica 2 Part 1 Exercici 5. a) Observacions incloses: 4,6,7,8,10 b) Observacions incloses: 4,7,8,9,10 c) Observacions incloses: 7,9,10,1,5 d) Observacions incloses: 2,5,7,8,10 e) Observacions incloses: 4,5,6,9,10 Exercici 6. Observacions incloses: 3,7,9. Part 2

Exercici 8. Total (corecust) = 10608; mitjana (edat) = 47.2613. Exercici 9. Total (corecust) = 10594, Std.Error = 310.3655. Exercici 10. Total (corecust) = 11034.

Exercici 11. Total (corecust) = 10686. Exercici 12. a) Total (corecust) = 10685.98 b1) Suma (SamplingWeight) = 19918.06 b3) Total (corecust) = 10895.72 Part 3 Exercici 13.

Ex. 9. Mitjana (edat) = 47.6993, Std.Error = 0.5071 Ex. 10. Mitjana (edat) = 53.2756

Ex. 11. Mitjana (edat) = 47.4842 Ex. 12.a) Mitjana (edat) = 47.4842

Ex. 12.b1) Suma (SamplingWeight) = 19918.06 Ex. 12.b3) Mitjana (edat) = 47.4842

Exercici 14.

Proporci´o de visitants en diumenge Estimador Std. Error Par`ametre poblacional

61.2% 3.08 57.91%

Exercici 15.

Proporci´o de visitants en diumenge Estimador Std. Error Par`ametre poblacional

Pr`actica 3

Part 2

Exercici 12.

Taula de la variable antig

Base de dades prob1sm p3e7 p3e8 p3e5 Estratificades Disseny mostral Marc Contr. Autop.

Mitjana antig 9.54 9.41 9.85 9.09 L´ımit inferior IC – 8.30 8.81 8.67 L´ımit superior IC – 10.52 10.89 9.52

Taula de la variable edat

Base de dades prob1sm p3e7 p3e8 p3e5 Estratificades Disseny mostral Marc Contr. Autop.

Mitjana edat 47.08 48.07 48.37 46.44 L´ımit inferior IC – 46.38 46.72 45.75 L´ımit superior IC – 49.76 50.03 47.13 Exercici 14.

Taula de la variable antig

Base de dades p3e7 p3e8 p3e5 Estratificades Disseny mostral Contr. Autop.

Mitjana antig 9.43 9.85 9.10 L´ımit inferior IC 8.32 8.83 8.69 L´ımit superior IC 10.54 10.87 9.50

Taula de la variable edat

Base de dades p3e7 p3e8 p3e5 Estratificades Disseny mostral Contr. Autop.

Mitjana edat 48.07 48.38 46.44 L´ımit inferior IC 46.40 46.75 45.78 L´ımit superior IC 49.73 50.00 47.09 Part 3

Exercici 15. Mitjana (durada) = 51.7370; IC (95%) = [51.5945; 51.8795].

Exercici 16. Seed = 12345: Mitjana (durada) = 51.68; IC (95%) = [50.80; 52.56]. Exercici 17. Seed = 12345: Mitjana (durada) = 52.11; IC (95%) = [51.29; 52.93]. Exercici 18. Seed = 12345: Mitjana (durada) = 51.7004; IC (95%) = [51.5602; 51.8406].

56 Guia de pr`actiques de mostreig estad´ıstic Pr`actica 4

Part 1

Exercici 1. n = 218185 persones a la mostra. Exercici 2. n = 70500 llars a la mostra.

Exercici 3. Mitjana (edat) = 39.56; IC (95%) = [39.47; 39.66]. A l’INE, l’edat mitjana ´es de 39.14 anys.

Exercici 4. Mitjana (edat) = 39.56; IC (95%) = [39.44; 39.68]. Exercici 5. Mitjana (edat) = 39.56; IC (95%) = [39.44; 39.68]. Exercici 6. Mitjana (edat) = 38.85; IC (95%) = [38.71; 38.99]. Exercici 7. Mitjana (edat) = 38.85; IC (95%) = [38.71; 38.99]. Exercici 8. n = 11092 milions de llars.

Exercici 9. Mitjana (im mens) = 4.0528; mitjana (pres ian) = 178377.56. Exercici 11. Total (ing men) = 11092357000; total (im mens pp) = 11092357000. Exercici 12. Total (ing men) = 2.0927154E12; total (im mens pp) = 2.0927154E12. Exercici 13.

Mitjana (ing men) = 161657, IC (95%) = [160358; 162956]; Mitjana (im mens pp) = 52870, IC (95%) = [52443; 53297]. Exercici 14.

Mitjana (ing men) = 161657, IC (95%) = [160389; 162925]; Mitjana (im mens pp) = 52870, IC (95%) = [52456; 53284];

Si no es tenen en compte els conglomerats, std.error (im mens pp) = 126.2534. Part 2

Exercici 15. Percentatge de llars amb un o m´es membres amb certificat de minusvalidesa: 7.732%; IC (95%) = [7.507; 7.957].

Exercici 16.

Percentatge de llars unifamiliars: 14.08%, amb un IC (95%) = [13.7616; 14.3909]; Percentatge d’individus que viuen sols: 4.60%, amb un IC (95%) = [4.4889; 4.7184]. Exercici 17.

Percentatge de llars amb ratio superior a 0.5: 0.1135%, IC (95%) = [0.0825%; 0.1445%]; Mitjana ratio = 0.1245, IC (95%) = [0.1088; 0.1401].

Exercici 18.

Total de persones amb certificat de minusvalidesa i en llars unifamiliars = 84170, amb un IC (95%) = [75636; 92704];

Total de persones amb certificat de minusvalidesa i en llars unifamiliars, de m´es de 75 anys = 19416, amb un IC (95%) = [15516; 23317]: Homes - Total = 4986, IC (95%) = [3229; 6744]; Dones - Total = 14430, IC (95%) = [10942; 17918].

Pr`actica 5

Part 1

Exercici 3. Constant: ˆβ0= 19.9192, altura: ˆβ1= 0.3008, sexe: ˆβ2= 10.1567.

Exercici 4.

Sense correcci´o - Constant: ˆβ0= 21.5558, altura: ˆβ1= 0.2906, sexe: ˆβ2= 7.9222;

Amb correcci´o - Constant: ˆβ0= 21.5558, altura: ˆβ1= 0.2906, sexe: ˆβ2= 7.9222.

Exercici 5.

Sense correcci´o - Constant: ˆβ0= 19.1678, altura: ˆβ1= 0.3052, sexe: ˆβ2= 11.4606;

Amb correcci´o - Constant: ˆβ0= 19.1678, altura: ˆβ1= 0.3052, sexe: ˆβ2= 11.4606.

Exercici 6.

Sense correcci´o - Constant: ˆβ0= 17.8920, altura: ˆβ1= 0.3135, sexe: ˆβ2= 13.2694;

Amb correcci´o - Constant: ˆβ0= 17.8920, altura: ˆβ1= 0.3135, sexe: ˆβ2= 13.2694.

Exercici 7.

Sense correcci´o - Constant: ˆβ0= 18.0366, altura: ˆβ1= 0.3126, sexe: ˆβ2= 13.0550;

Amb correcci´o - Constant: ˆβ0= 18.0366, altura: ˆβ1= 0.3126, sexe: ˆβ2= 13.0550.

Exercici 8.

Sense correcci´o - Constant: ˆβ0= 33.9208, altura: ˆβ1= 0.2287, sexe: ˆβ2= −8.3123;

Amb correcci´o - Constant: ˆβ0= 33.9208, altura: ˆβ1= 0.2287, sexe: ˆβ2= −8.3123.

Exercici 9.

Sense correcci´o - Constant: ˆβ0= 19.2693, altura: ˆβ1= 0.3021, sexe: ˆβ2= 12.1019;

Amb correcci´o - Constant: ˆβ0= 19.2693, altura: ˆβ1= 0.3021, sexe: ˆβ2= 12.1019.

Part 2

Exercici 10.

Afixaci´o proporcional:

Amb correcci´o - Categoria de refer`encia (diumenge): βˆ0 = 69.9240, dilluns: βˆ1 =

45.4093, dimarts: ˆβ2= −31.2365, dimecres: ˆβ3= −40.6299, dijous: ˆβ4= −25.9907,

divendres: ˆβ5= −55.2812, dissabte: ˆβ6= −45.5199;

Sense correcci´o - Categoria de refer`encia (diumenge): ˆβ0 = 69.9240, dilluns: ˆβ1 =

45.4093, dimarts: ˆβ2= −31.2365, dimecres: ˆβ3= −40.6299, dijous: ˆβ4= −25.9907,

divendres: ˆβ5= −55.2812, dissabte: ˆβ6= −45.5199.

Afixaci´o no proporcional:

Amb correcci´o - Categoria de refer`encia (diumenge): βˆ0 = 69.7568, dilluns: βˆ1 =

49.8207, dimarts: ˆβ2= −30.1230, dimecres: ˆβ3= −39.8201, dijous: ˆβ4= −24.9680,

divendres: ˆβ5= −55.2145, dissabte: ˆβ6= −45.2849;

Sense correcci´o - Categoria de refer`encia (diumenge): ˆβ0 = 69.7568, dilluns: ˆβ1 =

49.8207, dimarts: ˆβ2= −30.1230, dimecres: ˆβ3= −39.8201, dijous: ˆβ4= −24.9680,

divendres: ˆβ5= −55.2145, dissabte: ˆβ6= −45.2849.

Comentari sobre els errors est`andards de les estimacions: en els models amb correcci´o que tenen en compte el mostreig dut a terme, els errors est`andards de les estimacions s´on considerablement menors que els errors est`andards de les estimacions en els models que no tenen en compte el mostreig.

58 Guia de pr`actiques de mostreig estad´ıstic Pr`actica 6

Part 1

Exercici 1.

50 r`epliques: Mediana edat = 56.82, IC (95%) = [54; 60]; 200 r`epliques: Mediana edat = 56.9825, IC (95%) = [53; 61]. Part 2

Exercici 3. R`atio prestacions per assist`encia respecte a ingressos mensuals: Var(ratio) = 0.133, IC (95%) = [0.042; 0.224]. La sintaxi usada per a la resoluci´o de l’exercici ´es: proc surveyselect data=prac.hogares

out=p6e3 sampsize=1000 method=srs rep=25 seed=12345 stats;

run;

proc sort data=p6e3; by replicate; run;

/*Seleccionem les llars que reben prestacions:*/ data p6e3;

set p6e3;

if (pres_ian>0); run;

proc freq data=p6e3; table replicate; run ;

/*C`alcul de l’estimaci´o puntual*/ proc means data=p6e3 mean;

var ratio; by replicate;

output out=p6e3b mean=mean; run;

/*Utilitzant el procediment de l’exercici 1, calculem l’IC (al 95%).*/ proc iml;

use p6e3b;

read all var{replicate} into replicate; read all var{mean} into mean;

print replicate mean; n=nrow(mean); start ordena(v); v0=v; v[rank(v)]=v0; rr=v; return(rr); finish; meanord=ordena(mean); i_limitinf=int(n*0.025)+1; i_limitsup=int(n*0.975); me=sum(mean)/n; meinf=meanord[i_limitinf]; mesup=meanord[i_limitsup]; quit;

Bibliografia

Ardilly, P.; Till´e, Y. Sampling Methods: Exercises and Solutions. Springer, 2005.

Fuller, C.H. Weighting to adjust for survey nonresponse. Public Opinion Quarterly, num. 38, 239-46, 1974.

Heeringa, S.G.; West, B.T.; Berglund, P.A. Applied Survey Data Analysis. CRC Press, 2010. Chapman & Hall/CRC Statistics in the Social and Behavioral Science.

Holt, D.; Elliot, D. Methods of weighting for unit non-response. The Statistician, num. 40, 333-42, 1991.

Lavall´ee P. Le sondage indirect. Editions de l’Universit´e de Bruxelles, 2002. Lohr, S. Sampling: Design and Analysis. Brooks/Cole, 2010.

Lohr, S. Solutions Manual for Sampling: Design and Analysis [en l´ınia]. Brooks/Cole, 2010. Lohr, S. Computer Programs for Sampling: Design and Analysis [en l´ınia]. Brooks/Cole, 2010. Lumley, T. Complex Surveys: A Guide to Analysis Using R. Wiley, 2010. Wiley Series in Survey

Methodology.

Mandell, L. When to weight: Determining nonresponse bias in survey data. Public Opinion Quar- terly, num.38, 247-51, 1974.

Pfeffermann, D. The role of sampling weights when modeling survey data. International Statistical Review, num. 61, 317-37, 1993.

Pfeffermann, D. The use of sampling weights for survey data analysis. Statistical Methods in Medical Research, num. 5, 239-61, 1996.

S¨arndal, C.-E.; Swensson, B.; Wretman, J. Model assisted survey sampling. Springer, 1997. SAS Institute Inc. SAS/OR R 9 User’s Guide: Mathematical Programming. SAS Institute Inc.,

2002.

Skinner, C.J.; Holt, D.; Smith, T.M.F. Analysis of complex surveys. Wiley, 1989. Till´e, Y. Sampling Algorithms. Springer, 2006.

Till´e, Y. Teor´ıa de muestreo, traducci´o de Th´eorie des sondages. Till´e, Y. Th´eorie des sondages. Dunod, 2001.

UCLA ATS Stat Consulting Group. UCLA Stat Computing Portal: Survey Data Analysis Portal [en l´ınia]. UCLA ATS Stat Consulting Group [Data de consulta: 04/2011]. Disponible a: <http://statcomp.ats.ucla.edu/survey/>.

Documento similar