SUPÒSIT PRÀCTIC
Convocatòria: 194
Prova: 1
Exercici: 4
2
L'arxiu E1.TXT conté nou columnes amb informació de 1.450 registres extrets de les compres efectuades per consumidors d'un determinat territori. La primera columna indica un identificador individual, la segona conté el codi territorial on resideix el consumidor l'any 2009, de la tercera a la setena columna s’indiquen els imports de les seves compres en euros efectuades l’any 2005, 2006, 2007, 2008 i 2009, respectivament, la vuitena columna xifra l'edat del consumidor i la darrera columna mesura els ingressos del consumidor l’any 2009.1. A partir de l’arxiu E1.TXT, establiu tres categories d'edat: menys de 25 anys, entre 25 i 44 anys, i consumidors de 45 anys o més. Quin dels tres grups de consumidors ofereix una major freqüència de compra en referència a l’any 2005? I quin percentatge representa?
Resposta:
3
2. Comenteu l’evolució en termes reals dels imports de les compres efectuades pels1.450 consumidors en el període 2005-2009, tenint en compte la informació següent:
IPC general de Catalunya (mitjana anual). Base 2006=100 IPC2005= 96,5
IPC2006=100,0 IPC2007=103,0 IPC2008=107,2 IPC2009=107,3 Resposta:
4
3. Els establiments comercials del territori fan una previsió de facturació per a l’any2010 de 150.000 €. Si les expectatives sobre el volum dels d’ingressos dels consumidors per a l’any 2010 són que es produirà una minoració del 5%, comenteu si esteu d’acord amb l’esmentada previsió dels establiments a partir d’una possible relació causal lineal entre la variable import de les compres i la variable ingressos.
Resposta:
5
4. Considereu que els 1.450 consumidors corresponen a una extracció basada en unamostra aleatòria simple d’una població total d’1.345.622 consumidors. D’altra banda, se sap que la distribució poblacional per grups d’edat correspon als percentatges següents:
Proporció
< 25 anys 22,5%
25-44 anys 45,8%
>=45 anys 31,7%
o Calculeu els factors d’elevació per a cadascun dels tres grups d’edat i eleveu el valor de la mitjana i el valor de la suma total de la variable import de les compres per a l’any 2005.
Resposta:
o Comenteu el possible biaix que té la mostra esmentada respecte a la població que vol representar.
Resposta:
6
5. A partir de l’arxiu E1.TXT, es defineixen tres categories de despesa: menys de 50euros, entre 50 i 100 euros, i més de 100 euros.
o A partir d’aquesta estratificació dels consumidors, calculeu la taula dels imports de les compres de l’any 2005 corresponents als codis territorials
“43267”, “43268”i “43269”, i escriviu els resultats corresponents a la taula següent:
Any 2005 < 50 euros 50-100 euros >100 euros Total Codi territorial 43267
Codi territorial 43268 Codi territorial 43269 Total
o Suposant que els 1.450 consumidors del fitxer de dades corresponen a la totalitat de la població de cada codi territorial i que la totalitat de les dades individuals estan sotmeses al secret estadístic, avalueu el grau de sensibilitat o seguretat de cada cel·la de la taula obtinguda anteriorment i apliqueu algun criteri per a difondre-la de forma més segura, als efectes de preservar la identitat dels consumidors implicats. Indiqueu, també, la regla d’identificació de cel·les no segures que heu emprat.
Resposta:
Completa la següent taula de magnituds segura als efectes de la seva difusió pública.
Any 2005 < 50 euros 50-100 euros >100 euros Total Codi territorial 43267
Codi territorial 43268 Codi territorial 43269 Total
7
6. En relació a l’arxiu E1.TXT, considereu que en els darrers cinc registres (des del1.446 fins al 1.450 en relació a l’identificador individual) els manca la variable import de les compres de l'any 2005. En aquesta situació, apliqueu la tècnica d’imputació probabilística “Hot-Deck seqüencial”, establint com a camp de control la variable edat, per tal d’assignar valors versemblants a les dades mancants.
o Quin seria el valor total de la variable import de les compres abans i després de les imputacions efectuades anteriorment? Comenteu les diferències de variabilitat.
Resposta:
o Expliqueu breument quines altres tècniques d’imputació probabilística podrien ser d’aplicació en aquest cas.
Resposta: