EXERCICIS D ESTADÍSTICA I PROBABILITAT

101  Descargar (0)

Texto completo

(1)

EXERCICIS D’ESTADÍSTICA I PROBABILITAT

Òscar Forner Gumbau

Materials de suport a la docència en valencià

DEPARTAMENT D’ESTADÍSTICA I INVESTIGACIÓ OPERATIVA UNIVERSITAT D'ALACANT

158

(2)

Òscar Forner Gumbau

Aquest material docent ha rebut una beca del Servei de Política Lingüística de la Universitat d'Alacant

L’edició d’aquest material s’ha fet dins el marc del conveni per a la promoció de l’ús social del valencià signat per la Universitat d’Alacant amb la Conselleria d’Educació.

ISBN: 978-84-9717-319-3 Dipòsit legal: A 566-2014

Alacant, febrer de 2014 (1a edició)

Edició: Universitat d'Alacant. Servei de Política Lingüística Apartat de Correus 99 - 03080 Alacant

A/e: servei.pl@ua.es tel. 96 590 34 85 Impressió: Limencop

Universitat d’Alacant.

Edifici de Ciències Socials – Planta baixa

http://www.limencop.com tel. 96 590 34 00 Ext. 2784

(3)

Presentació... VII

Introducció... IX

1. Exercicis d’estadística descriptiva ... 11

1.1 Conceptes i fórmules bàsiques ... 11

1.1.1 Definicions ... 11

1.1.2 Tipus de gràfics ... 12

1.1.3 Mesures de centralització ... 15

1.1.4 Mesures de posició no central ... 16

1.1.5 Mesures de dispersió ... 18

1.1.6 Gràfic de caixa i bigots ... 20

1.1.7 Mesures de concentració ... 21

1.2 Exercicis resolts ... 23

Exercici 1 ... 23

Exercici 2 ... 28

Exercici 3 ... 30

Exercici 4 ... 31

Exercici 5 ... 35

Exercici 6 ... 44

Exercici 7 ... 48

1.3 Exercicis proposats ... 53

Exercici 1 ... 53

Exercici 2 ... 54

Exercici 3 ... 54

Exercici 4 ... 55

Exercici 5 ... 55

Exercici 6 ... 56

Exercici 7 ... 56

(4)

2.1.1 Definicions ... 59

2.1.2 Concepte de probabilitat ... 61

2.1.3 Probabilitat condicionada ... 62

2.1.4 Dependència i independència de successos ... 63

2.1.5 Probabilitat composta ... 63

2.1.6 Probabilitat total ... 64

2.1.7 Teorema de Bayes ... 64

2.1.8 Diagrama en arbre ... 64

2.2 Distribucions de probabilitat discretes i contínues. Definicions. ... 65

2.3 Distribució binomial ... 67

2.3.1 Funció de probabilitat, funció de distribució, esperança i variància d’una distribució binomial... 68

2.3.2 Taula de la distribució binomial ... 69

2.4 Distribució normal ... 71

2.4.1 Representació i característiques ... 71

2.4.2 Distribució normal estàndard ... 72

2.4.3 Tipificació de la variable ... 72

2.4.4 Taula de la corba N(0, 1) ... 73

2.5 Aproximació de la distribució binomial mitjançant la distribució normal ... 74

2.6 Exercicis resolts ... 75

Exercici 1 ... 75

Exercici 2 ... 77

Exercici 3 ... 78

Exercici 4 ... 79

Exercici 5 ... 80

Exercici 6 ... 81

Exercici 7 ... 82

Exercici 8 ... 83

Exercici 9 ... 84

Exercici 10 ... 85

Exercici 11 ... 87

Exercici 12 ... 88

Exercici 13 ... 89

Exercici 14 ... 90

(5)

Exercici 1 ... 93

Exercici 2 ... 94

Exercici 3 ... 94

Exercici 4 ... 95

Exercici 5 ... 96

Exercici 6 ... 96

Exercici 7 ... 97

Exercici 8 ... 97

Exercici 9 ... 97

Exercici 10 ... 98

Exercici 11 ... 98

Exercici 12 ... 99

Exercici 13 ... 99

Exercici 14 ... 99

Exercici 15 ... 100

Bibliografia ... 101

(6)
(7)

VII

La Universitat d’Alacant vol ser una universitat multilingüe amb personal i estudiants plurilingües actius, i això només és possible amb una bona formació en llengües, un component clau per a una universitat competitiva. Tot i que l’entorn més eficaç per a l’aprenentatge de les llengües és la immersió social o l’aprenentatge natural al si de la família, en l’àmbit escolar i universitari, aquests entorns es poden generar amb el tractament integrat de llengües i continguts.

Des de l’equip de govern de la Universitat d’Alacant valorem la docència en valencià (i en altres llengües) com un component molt positiu en la formació universitària dels futurs professionals que estudien en aquesta Universitat. És una obligació de la Universitat formar bons professionals que en un futur pròxim puguen exercir en valencià, en castellà i en anglès, o en qualsevol altra llengua.

Aquest material docent que ara presentem és un resultat més d’aquest compromís de l’actual equip de direcció de la Universitat de preparar bons professionals. Per a fer possible que els alumnes actuals i futurs de la Universitat puguen exercir de manera competent la seua professió en valencià hem de preparar bons professors que puguen impartir la docència en valencià i proporcionar materials de suport amb la millor qualitat possible.

Un altre objectiu de la Universitat és promoure el coneixement en obert i facilitar i compartir recursos entre les universitats i els seus usuaris. Per això, aquests materials estan disponibles en edició digital i en el Repositori de la Universitat d’Alacant (RUA).

L’edició de materials docents en valencià, l’autoarxivament en el RUA i l’impuls del coneixement en obert, són accions que formen part del desplegament d’una de les línies estratègiques de política lingüística: “Millorar i augmentar l’oferta de la docència en valencià i garantir-ne una bona qualitat lingüística” del Pla de Política Lingüística de la Universitat d’Alacant (BOUA de 5 de juliol de 2011).

Aquestes iniciatives de suport a l’ús del valencià com a llengua d’ensenyament i aprenentatge han comptat amb el suport de la Generalitat Valenciana a través del conveni per a la promoció de l’ús del valencià.

Manuel Palomar Sanz Rector

(8)
(9)

IX

Aquest material és un complement al quadern Introducció a l’Estadística de la col·lecció Joan Fuster de materials docents en valencià, on es desenvolupaven els continguts de l’assignatura Introducció a l’Estadística del primer curs del grau de Gestió i Administració Pública de la Universitat d’Alacant.

L’objectiu d’aquest quadern és tindre un material que reforce els coneixements adquirits de l’assignatura a classe i que els alumnes els puguen posar en pràctica de forma autònoma resolent exercicis.

El quadern està dividit en dos temes, el primer dedicat a exercicis d’estadística i el segon a exercicis de probabilitat. Al principi de cada tema es fa un repàs de la teoria necessària per a la resolució dels exercicis, la qual cosa fa que es puga utilitzar aquest quadern sense la necessitat de consultar l’altre i, a més, puga ser utilitzat com a material de suport per a qualsevol assignatura d’estadística bàsica d’altres titulacions.

El quadern té una col·lecció de 44 exercicis, 22 dels quals resolts pas a pas i els altres 22 amb les solucions (excepte en els exercicis on donar la solució seria fer completament la resolució de l’apartat o de l’exercici). Amb aquests 44 exercicis he volgut abastar tot tipus d’exercicis necessaris per al correcte aprenentatge dels continguts de l’assignatura. Els exercicis resolts estan fets amb els càlculs molt detallats perquè l’alumne entenga clarament com es fan, però es recomana que tota aquella operació o càlcul de paràmetres que es puga fer amb la calculadora científica es faça, ja que així es guanya molt de temps a l’hora de resoldre els exercicis.

Amb aquest material també he volgut potenciar l’ús del valencià en la docència, ja que crec que és una millora en la formació dels estudiants. Això no hauria sigut possible sense l’ajuda de Xavier Casero, responsable de l’Àrea d’Assessorament Lingüístic del Servei de Política Lingüística, al qual agraïsc la seua ajuda i les seues correccions.

Per últim, vull donar les gràcies a la meua família pel suport que m’ha donat sempre en tot el que he fet, i sobretot, a la meua parella, Mónica, que sempre està al meu costat ajudant-me en tot el que pot, i als meus fills, Aitana i Manel, per la felicitat i afecte que em donen.

Òscar Forner Gumbau

Professor del Departament d’Estadística i Investigació Operativa Universitat d’Alacant, gener de 2014

(10)
(11)

11

bàsiques i les fórmules que utilitzarem per a resoldre els exercicis.

1.1 Conceptes i fórmules bàsiques

1.1.1 Definicions

- Individu o element: persones o objectes que contenen certa informació que es vol estudiar.

- Població: conjunt d'individus o elements que compleixen certes propietats comunes.

- Mostra: subconjunt representatiu d’una població, l’estudi de la qual serveix per a inferir característiques de tota la població.

- Grandària de la població: nombre d'individus que formen la població. En relació amb la grandària de la població, aquesta pot ser finita o infinita.

- Variable o caràcter: propietat, tret o qualitat dels elements de la població, i que pretenem estudiar.

- Variable qualitativa: els valors que pren no són quantificables. Una variable qualitativa pot ser, a més, nominal, si no és possible establir un ordre en les seues modalitats; o ordinal, si per contra sí que s’hi pot establir un ordre.

- Variable quantitativa: és aquella els valors de la qual són quantitats numèriques amb les quals podem fer operacions aritmètiques. Dins d’aquest tipus de variables podem distingir-ne dos grups:

 Discretes: quan no admeten un valor intermedi entre dos qualssevol dels seus valors i cada valor de la variable és un nombre natural.

 Contínues: quan admeten un valor intermedi entre dos qualssevol dels seus valors. En aquests casos, els valors de la variable són nombres reals.

(12)

- Freqüència absoluta: és el nombre de vegades que apareix cada valor de la variable. La denotarem per .

La suma de les freqüències absolutes, , és el nombre total d’observacions de la variable. La denotarem per .

- Freqüència relativa: és el quocient entre la freqüència absoluta d’un valor de la variable i el nombre total d’observacions de la variable. La denotarem per .

La suma de les freqüències relatives, , és la unitat.

La freqüència relativa és el tant per u d’observacions que pertanyen a cada valor de la variable. Si multipliquem la freqüència relativa per 100%, representarà el percentatge de la mostra o població que té aquest valor:

- Freqüència absoluta acumulada: és la suma de les freqüències absolutes fins un valor determinat de la variable. La denotarem per .

- Freqüència relativa acumulada: és la suma de les freqüències relatives fins un valor determinat de la variable. La denotarem per .

També podríem definir la freqüència relativa acumulada com el quocient entre cada una de les freqüències absolutes acumulades i el nombre total d’observacions de la variable.

La freqüència relativa acumulada és el tant per u d’observacions fins a un valor determinat de la variable. Si multipliquem la freqüència relativa acumulada per 100%, representarà el percentatge acumulat de la mostra o població fins un valor determinat de la variable:

1.1.2 Tipus de gràfics

 Diagrama de barres

Cada valor diferent de la variable està representat per un rectangle. Com a base de cada rectangle es prenen segments d’igual amplitud sobre l’eix d’abscisses i l’altura de cadascun d’ells és proporcional a la freqüència absoluta del valor que representa.

(13)

 Diagrama de sectors

Per a fer el diagrama de sectors es divideix l’àrea total del cercle en tantes porcions com valors diferents de la variable hi haja. Cada valor ve representat per un sector circular, l’àrea del qual ha de ser proporcional a la seua freqüència absoluta. Una manera ràpida de calcular l’angle corresponent a cada sector és multiplicar la freqüència relativa de cada valor diferent per 360º.

 Polígon de freqüències

S’obté unint, mitjançant segments de recta, els extrems superiors de les barres d’un diagrama de barres.

 Histograma

Es construeix a partir de la taula de freqüències. Sobre l’eix d’abscisses s’escriuen els intervals, alçant sobre cadascun d’aquests un rectangle que té aquest segment com a base. El criteri per a calcular l’altura de cada rectangle és el de mantenir la proporcionalitat entre les freqüències absolutes (o relatives) de cada interval i l’àrea dels rectangles.

Les condicions bàsiques per a un traçat correcte de l’histograma són:

 Els rectangles han d’aparèixer juxtaposats, per a respectar la continuïtat de la variable.

 La mesura de la base de cada rectangle ha de ser l’amplitud de la classe corresponent.

 Si l’amplitud és constant, l’alçada de cada rectangle es pren com la freqüència absoluta, , de l’interval sobre el qual està situat.

 En el cas que els intervals no siguen tots de la mateixa amplitud, l’alçada de cada rectangle serà la densitat de freqüència de l’interval corresponent, és a dir, el quocient entre la freqüència absoluta de l’interval i la seua amplitud.

També podem representar un histograma de freqüències acumulades. Els passos a seguir són els mateixos que abans però tenint en compte les freqüències absolutes acumulades en lloc de les freqüències absolutes.

 Polígon de freqüències

S’obté unint, mitjançant segments de recta, els punts mitjans de les bases superiors dels rectangles de l’histograma. Es prolonga la línia poligonal fins a tallar l’eix d’abscisses en els punts mitjans dels intervals anterior al primer i següent a l’últim, assignant-los d’aquesta manera freqüència nul·la.

(14)

És important assenyalar que l’àrea que hi ha per davall del polígon de freqüències és igual a la suma de les àrees dels rectangles de l’histograma.

També podem representar un polígon de freqüències acumulades. Per a realitzar aquest polígon el que hem de fer és unir els vèrtexs superiors drets dels rectangles de l’histograma de freqüències acumulades mitjançant una línia poligonal.

 Gràfic de tija i fulles

El gràfic de tija i fulles es construeix a partir de les dades originals de les variables quantitatives, tant discretes com contínues.

Les indicacions per a la seua construcció són les següents:

- Per al nombre de dades que nosaltres manegem, els gràfics han de tenir sempre de 4 a 12 files.

- Les dades han de tenir el mateix nombre de dígits tant enters com decimals. Si no és així, afegirem zeros a dreta o esquerra (segons ens convinga).

- Una vegada aconseguit el mateix nombre de dígits, les dades es divideixen en dos parts: la de l'esquerra serà la tija i la de la dreta les fulles.

- Es dibuixa una línia vertical i a la seua esquerra s’anoten en columna les tiges ordenades de menor a major. Les tiges han de ser consecutives i abastar tot el recorregut de la variable.

- A la dreta de la línia vertical s’anoten les fulles corresponents a cada tija. Les fulles s’ordenen de menor a major i han d’ocupar el mateix espai. Han d’haver-hi tantes fulles com nombre d’observacions.

- Hem d’indicar les xifres decimals que presenten les nostres dades. Si les nostres dades presenten xifres decimals, farem el gràfic com si no en tingueren i al final, indicarem per quina quantitat cal multiplicar les dades del gràfic per a obtenir les nostres dades originals. Així, si tenim dos xifres decimals, al final del gràfic escriurem × 0,01.

- Si volem aconseguir més files en el nostre gràfic podrem dividir cada tija en dos files, reservant el símbol * per a la primera meitat de les fulles possibles i el símbol º per a la resta, o en 5 files, on els símbols utilitzats són:

* per al 20% inicial de fulles t per al 20% següent

f per al 20% següent s per al 20% següent º per a l'últim 20%

(15)

El gràfic de tija i fulles és molt útil per les raons següents:

- Ens presenta les dades ordenades, cosa que serà útil per al càlcul d'algunes mesures que veurem posteriorment.

- És una tècnica d’organització de les dades que permet obtindre simultàniament la distribució de freqüències i la seua representació gràfica, ja que, si ho girem, ens presenta la forma que té l’histograma (la forma de l’histograma és la mateixa que la del gràfic de tija i fulla si aquest últim el girem 90º cap a l'esquerra).

1.1.3 Mesures de centralització

 Mitjana aritmètica

La mitjana aritmètica és defineix com la suma de totes les dades dividit pel nombre de dades. La denotarem per .

 Mediana

Si ordenem les dades de menor a major, la mediana és el valor que hi ha al mig de les dades, és a dir, té tantes dades per davall com per damunt. Si el nombre de dades és parell, assignarem a la mediana la mitjana aritmètica dels dos termes centrals. La denotarem per .

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real de totes les dades, no serà possible calcular de forma exacta la mediana, per la qual cosa, aproximarem el càlcul de la mediana de la manera següent:

on,

és el límit inferior de la classe mediana és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior a la mediana

és la freqüència absoluta de la classe mediana és l’amplitud de la classe mediana

 Moda

La moda és el valor o valors de la variable que més vegades es repeteixen, és a dir, és el valor o valors de la variable que tenen més freqüència absoluta. La denotarem per .

(16)

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real de totes les dades, no serà possible calcular de forma exacta la moda, per la qual cosa, aproximarem el càlcul de la moda de la següent manera:

on,

és el límit inferior de la classe modal

és la freqüència absoluta de la classe anterior a la modal

és la freqüència absoluta de la classe posterior a la modal és l’amplitud de la classe modal

Utilitzarem aquesta fórmula si els intervals no tenen tots la mateixa amplitud:

on,

és el límit inferior de la classe modal

és la densitat de la classe anterior a la modal

és la densitat de la classe posterior a la modal és l’amplitud de la classe modal

1.1.4 Mesures de posició no central

 Quartils

Ja hem vist que la mitjana, en les dades ordenades de menor a major, deixa a la seua esquerra el 50% de les dades. Podem considerar també valors que divideixen el conjunt de les dades en quatre parts iguals, és a dir, deixen a la seua esquerra el 25%, el 50% i el 75% de les observacions. Aquests valors es denominen quartils i es denoten com a , i respectivament. És clar que

= per definició.

Vegem com es calcula el .

Per a trobar el primer quartil, s’ordenen els valors de menor a major i a continuació se cerca en aquesta sèrie ordenada el primer valor que supera el lloc .

Pot ocórrer que l’ordre de l’observació coincidisca exactament amb (succeeix quan és múltiple de 4). En tal cas, el primer quartil s'obté prenent aquesta observació i la següent, i calculant-ne la mitjana aritmètica.

Per a trobar , el procediment és anàleg però considerant en compte de .

(17)

* Si les dades vénen agrupades amb intervals, com no coneixem el valor real de totes les dades, no serà possible calcular de forma exacta el , per la qual cosa, aproximarem el càlcul del de la manera següent:

on,

és el límit inferior de la classe on està el és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior on està el

és la freqüència absoluta de la classe on està el és l’amplitud de la classe on està el

Per a trobar , el procediment és anàleg però considerant en compte de .

Aleshores la fórmula serà:

 Percentils

Fins ara ens hem interessat per obtenir aquells valors la posició dels quals representava un percentatge molt concret de la mostra: 25, 50 i 75 per cent.

Però, generalitzant, podrem estar interessats a obtenir qualsevol posició dins de les dades. Per a això establirem una fórmula general de càlcul per a obtenir qualsevol posició relativa:

on,

és el percentatge a calcular

és el valor entre 1 i 100, equivalent al percentatge cercat

és el límit inferior de la classe on està el és el nombre de dades

és la freqüència absoluta acumulada de la classe anterior on està el és la freqüència absoluta de la classe on està el

és l’amplitud de la classe on està el

(18)

1.1.5 Mesures de dispersió

Les mesures de dispersió permeten calcular la representativitat d’una mesura de tendència central. La seua finalitat és estudiar fins a quin punt, per a una sèrie de valors, les mesures de centralització són representatives de tota la informació de les dades. Mesurar la representativitat d’una mesura de posició central equival a quantificar la separació de les dades respecte a aquesta mesura.

Anomenem dispersió o variabilitat, la major o menor separació dels valors d’una distribució respecte d’un altra que pretén ser la seua síntesi. Aleshores, per exemple, serà més representativa la mitjana aritmètica d’una variable com més agrupats estiguen els valors d’aquesta al voltant de la mitjana i al contrari, serà menys representativa quan els valors estiguen més dispersos respecte a la mitjana.

Vegem a continuació quatre mesures de dispersió absolutes.

 Rang o recorregut

És la diferència entre el màxim i el mínim valor que presenta una distribució.

Aleshores, un valor elevat del recorregut indicaria que la diferència entre el major i el menor valor de la variable és alta, fet que podria portar a pensar que també ho és la dispersió.

 Recorregut interquartílic

És la diferència entre el tercer quartil i el primer quartil d’una distribució.

Aquesta mesura ens ofereix l'amplitud de l’interval en el qual es troba el 50%

dels valors centrals de la distribució. Aleshores, un valor elevat indicaria que el 50% dels valors centrals es troben en un interval ampli, cosa que podria portar a pensar en una dispersió alta.

 Variància

És la mitjana de la suma de les desviacions de les dades respecte a la mitjana aritmètica al quadrat.

Com més concentrats estiguen els valors al voltant de la mitjana aritmètica, més pròximes a zero estaran les desviacions i aleshores menor serà la variància. Si, per contra, els valors estan molt dispersos respecte a la mitjana

(19)

aritmètica, els quadrats de les desviacions seran grans i, aleshores, la variància també.

Nota: Hi ha una altra mesura de dispersió, similar a la variància, coneguda com a quasi variància, la qual es calcula de la següent manera:

 Desviació típica

És l’arrel quadrada positiva de la variància. La seua interpretació és similar a la de la variància, amb la diferència que la desviació típica ve mesurada amb la mateixa unitat que la variable.

Vegem a continuació tres mesures de dispersió relatives.

 Coeficient d’obertura

És el quocient entre els valors extrems de la variable.

Representa el nombre de vegades que el valor màxim és major que el valor mínim. Com més gran siga aquest valor més dispersió relativa tenen les dades.

 Rang o recorregut relatiu

És el quocient entre el rang i la mitjana aritmètica.

Representa el nombre de vegades que el recorregut conté la mitjana aritmètica.

Com més gran siga aquest valor, més dispersió relativa tenen les dades.

 Coeficient de variació de Pearson

És el quocient entre la desviació típica i la mitjana aritmètica.

(20)

Quan comparem dos distribucions, les seues dispersions es poden comparar mitjançant la desviació típica si les mitjanes aritmètiques són iguals. Si no és així, utilitzarem el coeficient de variació de Pearson.

El coeficient de variació de Pearson representa el nombre de vegades que la desviació típica conté la mitjana aritmètica; aleshores, com més gran siga el coeficient de variació de Pearson més vegades la desviació típica contindrà la mitjana aritmètica, és a dir, menys representativitat tindrà la mitjana aritmètica i més dispersió relativa tindran les dades.

Aquest coeficient també es pot expressar en percentatges:

1.1.6 Gràfic de caixa i bigots

Un gràfic o diagrama de caixa i bigots és una representació gràfica, basada en els quartils, que ajuda a avaluar la forma de les distribucions. Aquest gràfic és molt sensible per a detectar casos extrems, per tant, aquest gràfic indicarà quan la distribució té valors extremadament grans o xicotets.

Una aproximació a la forma d’aquests gràfics és la següent:

○ ● ● x x ● ● ○

La caixa està formada entre el i el . Dins de la caixa es troben el 50% de les dades de forma centralitzada.

Per a la construcció d’aquest gràfic necessitarem calcular una sèrie de valors que descrivim a continuació:

Mediana (es troba sempre a l’interior de la caixa) Primer quartil (marca la paret inferior de la caixa) Tercer quartil (marca la paret superior de la caixa) Recorregut interquartílic:

Factor d’escala:

Frontera interior inferior:

Frontera interior superior:

Frontera exterior inferior:

(21)

Frontera exterior superior:

x Valors adjacents:

- Valor adjacent inferior: valor de les dades més pròxim a (frontera interior inferior), sent major o igual que aquest.

- Valor adjacent superior: valor de les dades més pròxim a (frontera interior superior), sent menor o igual que aquest.

○ ● Valors atípics: són aquells valors que cauen fora dels rangs de la distribució.

- Valors atípics menors (●): són els valors de les dades que estan entre (frontera interior inferior) i (frontera exterior inferior) o entre (frontera interior superior) i (frontera exterior superior).

- Valors atípics majors (○): són els valors de les dades que estan per davall de (frontera exterior inferior) o per damunt de (frontera exterior superior).

1.1.7 Mesures de concentració

Les mesures de concentració d’una distribució de freqüències tracten de posar en relleu el major o menor grau d’igualtat en el repartiment del total dels valors de la variable. Són, per tant, indicadors del grau d’equidistribució de la variable.

Es denomina concentració la major o menor equitat en el repartiment de la suma total de la variable considerada.

Per a mesurar el nivell de concentració en la distribució d’una variable utilitzarem dos eines: una de gràfica (corba de Lorenz) i una altra d’analítica (índex de Gini).

 Índex de Gini

Per a calcular aquest índex, ens ajudarem d’una taula en la qual construirem els valors que ens fan falta per a aplicar la fórmula de l'índex de Gini.

Columna amb els valors de la variable Freqüència absoluta

Freqüència absoluta acumulada Freqüència relativa acumulada

Producte que ens indicarà el total que correspon a cada interval Columna que acumula els valors de la columna anterior Columna anterior de forma percentual (o de tant per u)

Calcula la diferència entre les columnes i

(22)

Amb els resultats obtinguts en la taula, aplicarem la fórmula de l’índex de Gini, que és la següent:

L’índex de Gini va de 0 a 1. Quan és 0 significa que hi ha igualtat de repartiment i quan és 1 significa que està tot concentrat en un únic individu.

Aleshores, això significa que quan ens done un valor pròxim a 0 direm que la concentració és baixa i si ens dóna un valor pròxim a 1 direm que la concentració és alta.

 Corba de Lorenz

Per a dibuixar la corba de Lorenz gastarem la distribució utilitzada per a la determinació de l'índex de Gini .

Els passos a seguir per a representar aquesta corba són:

- Representem els eixos cartesians

- Fem un quadrat els costats del qual estan dividits en una escala de l’1 al 100, de manera que en el vèrtex inferior esquerre està l’origen de coordenades

- En l’eix d’abscisses representem i en el d'ordenades - Tracem una diagonal dins del quadrat

- Representem els punts ( ), els quals unirem mitjançant una línia poligonal anomenada corba de Lorenz

La corba necessàriament haurà de situar-se per davall de la diagonal, ja que els valors de la variable analitzada sempre han d’estar ordenats de menor a major.

Per la mateixa raó la corba haurà de ser sempre creixent.

La corba que indica l'existència de concentració mínima o equidistribució ( ) coincideix amb la diagonal, ja que en cadascun dels punts d'aquesta diagonal es verifica que = .

Com més gran siga la concentració de la variable major serà la separació que presenta la corba respecte de la diagonal.

(23)

1.2 Exercicis resolts

1. En un test realitzat a un grup d’alumnes universitaris s’han recollit les següents puntuacions:

101 102 112 113 92 91 106 104 100 95 104 98 96 117 89 99 114 100 98 104 93 92 99 90 108 116 93 109 105 91

a. Construeix la taula de freqüències apropiada amb intervals solapats i d’igual amplitud aplicant-hi la fórmula de Sturges.

b. A partir de la taula anterior, digues el percentatge d’alumnes que tenen una puntuació entre 103 i 110.

c. A partir de la taula anterior, digues el percentatge d’alumnes que tenen una puntuació inferior a 100.

d. A partir de la taula anterior, digues el percentatge d’alumnes que tenen una puntuació superior a 112.

e. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències absolutes.

f. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències acumulades.

g. Construeix un gràfic de tija i fulles apropiat i construeix a partir d’ell la taula de freqüències.

Solució a.

- Nombre de dades:

- Unitat de precisió:

-

- - Formula de Sturges

-

- Calculem el rang final perquè hem hagut d’arredonir l’amplitud

(24)

- Calculem :

- Calculem :

aleshores el primer interval és:

La resta d’intervals són:

- Fem la taula de freqüències:

b.

Mirant la taula que hem fet, podem observar que hi ha puntuacions inferiors a , és a dir, el

Per a calcular quantes puntuacions són inferiors a interpolararem en l’interval on es troba el valor , és a dir, en l’interval

26 x

23

108 110 113

Intervals Marca

classe

(25)

Aleshores, és el percentatge d’alumnes que tenen una puntuació entre i .

c.

Per a calcular quantes puntuacions són inferiors a interpolarem en l’interval on es troba el valor , és a dir, en l’interval

18 x

10

98 100 103

Aleshores, és el percentatge d’alumnes que tenen menys de punts.

d.

Per a calcular quantes puntuacions són superiors a interpolarem en l’interval on es troba el valor , és a dir, en l’interval

26 x

23

108 112 113

El és el percentatge d’alumnes que hi ha per davall dels punts, aleshores per a saber el percentatge d’alumnes que tenen una puntuació superior als punts el que fem és restar aquest percentatge al

(26)

El percentatge d’alumnes amb una puntuació superior a és del

e.

f.

0 1 2 3 4 5 6 7 8 9

[88,93[ [93,98[ [98,103[ [103,108[ [108,113[ [113,118[

Histograma i polígon de freqüències absolutes

0 1 2 3 4 5 6 7 8 9

[89,93[ [93,98[ [98,103[ [103,108[ [108,113[ [113,118[

Polígon de freqüències absolutes

(27)

g.

A partir d’aquest gràfic obtenim les següents classes:

Intervals 0

5 10 15 20 25 30 35

[89,93[ [93,98[ [98,103[ [103,108[ [108,113[ [113,118[

Histograma i polígon de freqüències acumulades

0 5 10 15 20 25 30 35

[89,93[ [93,98[ [98,103[ [103,108[ [108,113[ [113,118[

Polígon de freqüències acumulades

8 9

9 0 1 1 2 2 3 3 5 6 8 8 9 9 10 0 0 1 2 4 4 4 5 6 8 9 11 2 3 4 6 7

(28)

Com la unitat de precisió d’aquestes dades és 1, sumarem i restarem a cadascun dels intervals 0,5 i la taula de freqüències quedarà així:

Intervals

2. En la següent taula apareixen el nombre d’intervencions per dia dels bombers d’Alacant en el mes de març de 2013:

Nombre d’intervencions Nombre de dies

10

8

9

4

a. Completa la taula de freqüències donada.

b. Fes amb les dades de la taula anterior un histograma de freqüències absolutes.

c. Quants dies han fet 7 intervencions o més?

d. Quin percentatge de dies han fet menys de 3 intervencions?

Solució a.

b.

Com els intervals no tenen la mateixa amplitud l’alçada de cada rectangle serà la densitat de freqüència de l’interval corresponent, és a dir, el quocient entre la freqüència absoluta de l’interval i la seua amplitud.

Intervals Marca

classe

10 6 8 9 4

(29)

c.

Mirant la taula que hem fet, podem observar que hi ha dies que han fet menys de 7 intervencions, aleshores 13 dies han fet 7 intervencions o més.

d.

Per a calcular quants dies han fet menys de 3 intervencions interpolarem en l’interval on es troba el valor , és a dir, en l’interval

10 x

0

0 3 5

0

0,5 1 1,5 2 2,5 3 3,5 4 4,5

[0,5[ [5,7[ [7,10[ [10,12[

Histograma amb intervals de diferent amplitud Intervals

10 5 8 9 4

(30)

Aleshores, és el percentatge de dies que fan menys de 3 intervencions.

3. En una empresa que es dedica a la fabricació de bolígrafs. Es fan paquets de 500 bolígrafs per a la seua distribució, però abans es passa un control de qualitat consistent a comprovar si escriuen correctament una mostra de 20 bolígrafs. Si en la mostra que hem agafat trobem un bolígraf o cap que escriga malament donem el paquet per bo; si en trobem 2 o 3 de defectuosos tornem a revisar el paquet, i si n’hi trobem 4 o més de defectuosos rebutgem el paquet.

Hem revisat 15 paquets i ens donen els següent nombre de bolígrafs defectuosos:

0 0 2 1 0 5 0 1 3 4 0 1 0 2 2

a) Construeix la taula de freqüències apropiada amb els resultats de la revisió (bo, revisar i rebutjar)

b) Fes amb les dades de la taula de freqüències un diagrama de barres i un diagrama de sectors.

Solució a.

b.

0 1 2 3 4 5 6 7 8 9 10

Bo Revisar Rebutjar

Diagrama de barres Resultats

Bo 9 Revisar 4 Rebutjar 2

15 1

(31)

Calculem els graus que els correspon a cada resultat:

4. El nombre d’habitants de 50 municipis d’una província espanyola es distribueix de la manera següent:

a. Calcula el nombre mitjà d’habitants per municipi. Es representatiu?

b. Quin nombre d’habitants deixa per damunt seu el 50% de municipis?

c. Quin és nombre més comú d’habitants?

d. Quin és el percentatge de municipis comprès entre 3.000 i 9.000 habitants?

e. Quin és el nombre d’habitants que deixa per davall seu el 25% dels municipis?

Diagrama de sectors

Bo Revisar Rebutjar

Nre. d’habitants Nre. de municipis

(32)

Solució a.

Calculem la mitjana aritmètica:

El nombre mitjà d’habitants per municipi és de 3.230

Per a veure si la mitjana és representativa calculem el coeficient de variació de Pearson.

Primer calculem la desviació típica:

Com que el valor del coeficient de variació de Pearson està molt allunyat de 0, diem que el nombre mitjà d’habitants per municipi que ens ha eixit no és representatiu.

b.

Per a contestar aquesta pregunta el que fem és calcular la mediana.

Posició aleshores la classe mediana és Com l’interval té la freqüència absoluta acumulada igual a , aleshores la mediana és el límit superior d’aquest interval, és a dir,

Nombre d’habitants Marca classe

Nombre de municipis

500

1.500

3.000

6.000

10.000

Nombre d’habitants Marca classe

Nombre de municipis

500 10

1.500 25

3.000 37

6.000 45

10.000 50

(33)

c.

Per a contestar aquesta pregunta el que fem és calcular la moda.

Com els intervals no tenen tots la mateixa amplitud el que fem és calcular la densitat.

La classe modal és

El nombre més comú d’habitants és 1.375 persones.

d.

Per a calcular quants municipis tenen menys de habitants interpolarem en l’interval on es troba el valor , és a dir, en l’interval 37

x 25

2.000 3.000 4.000

Nombre d’habitants Marca

classe

Nombre de municipis

500 0.01

1.500 0.015

3.000 0.006

6.000 0.002

10.000 0.00125

Nombre d’habitants Marca classe

Nombre de municipis

500 10

1.500 25

3.000 37

6.000 45

10.000 50

(34)

El dels municipis té menys de habitants

Per a calcular quants municipis tenen menys de habitants interpolarem en l’interval on es troba el valor , és a dir, en l’interval

50 x

45

8.000 9.000 12.000

El 9 dels municipis té menys de habitants

Aleshores, és el percentatge de municipis que tenen entre i habitants.

e. Per a respondre a aquesta pregunta el que fem és calcular el quartil 1.

Posició , aleshores la classe on està el és

El nombre d’habitants que deixa per davall seu el 25% dels municipis és de habitants.

Nombre d’habitants Marca classe

Nombre de municipis

500 10

1.500 25

3.000 37

6.000 45

10.000 50

(35)

5. Les edats d’un grup de 40 alumnes de 1r de GAP són les següents:

18 20 19 19 25 19 20 18 35 40 21 23 19 18 22 26 19 20 18 18 58 23 35 36 28 25 18 19 20 21 40 22 18 42 45 19 19 20 19 22

a. Calcula els següents paràmetres: la mitjana aritmètica, la moda, el rang, la variància, la desviació típica, el coeficient d’obertura, el rang relatiu i el coeficient de variació de Pearson.

b. Fes el gràfic de caixa i bigots.

c. Construeix un gràfic de tija i fulles apropiat.

d. Construeix la taula de freqüències apropiada amb intervals solapats i d’igual amplitud aplicant-hi la fórmula de Sturges.

A partir de la taula anterior calcula:

e. El percentatge d’alumnes que tenen una edat entre 23 i 27.

f. El percentatge d’alumnes que tenen una edat inferior a 24.

g. El percentatge d’alumnes que tenen una edat superior a 50.

h. A partir de quina edat està el 25% d’alumnes de major edat.

i. Fes un histograma i un polígon de freqüències absolutes.

j. Fes un histograma i un polígon de freqüències acumulades.

k. L’edat mitjana dels alumnes i digues si és representativa.

l. L’edat que divideix els alumnes en dos grups amb el mateix nombre d’alumnes.

m. L’edat més habitual entre aquest grup d’alumnes.

Solució a.

Primer per a facilitar els càlculs ordenarem les dades de menor a major:

18 18 18 18 18 18 18 19 19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 22 22 22 23 23 25 25 26 28 35 35 36 40 40 42 45 58

(36)

Calculem ara els paràmetres demanats:

b.

Calculem primer els valors que ens fan falta:

Valor adjacent inferior: 18

Valor adjacent superior: 35

Valors atípics: 36, 40, 40, 42, 45 i 58

(37)

A continuació fem el gràfic:

(2)

x x ●● ● ○

0 10 20 30 40 50 60 70

c.

Podem fer aquest:

1 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 2 0 0 0 0 0 1 1 2 2 2 3 3 5 5 6 8 3 5 5 6

4 0 0 2 5 5 8

o aquest altre:

1° 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 2* 0 0 0 0 0 1 1 2 2 2 3 3

° 5 5 6 8 3*

° 5 5 6 4* 0 0 2 ° 5

5*

° 5

d.

- Nombre de dades:

- Unitat de precisió:

-

- - Formula de Sturges

-

- Calculem el rang final perquè hem hagut d’arredonir l’amplitud

(38)

- Calculem :

- Calculem :

Aleshores el primer interval és:

La resta d’intervals són:

- Fem la taula de freqüències:

e.

Per a calcular quants alumnes tenen menys de anys interpolarem en l’interval on es troba el valor , és a dir, en l’interval

28 x

0

17 23 24

El dels alumnes té menys de anys.

Intervals Marca classe

28 28

(39)

Per a calcular quants alumnes tenen menys de anys interpolarem en l’interval on es troba el valor , és a dir, en l’interval

32 x

28

24 27 31

El dels alumnes té menys de anys.

Aleshores, és el percentatge d’alumnes que tenen entre i anys.

f.

Mirant la taula que hem fet, podem observar que el 70% dels alumnes té menys de 24 anys.

g.

Per a calcular quants alumnes tenen més de 50 anys interpolarem en l’interval on es troba el valor 50, és a dir, en l’interval

39 x

38

45 50 52

(40)

El dels alumnes té menys de 50 anys, aleshores és el percentatge d’alumnes majors de 50 anys.

h.

Per a contestar aquesta pregunta el que fem és calcular el quartil 3.

Posició , aleshores la classe on està el és

A partir de 27,5 anys es troben el 25% d’alumnes de més edat.

i.

0 5 10 15 20 25 30

[17,24[ [24,31[ [31,38[ [38,45[ [45,52[ [52,59[

Histograma i polígon de freqüències absolutes Intervals Marca

classe

28 28

(41)

j.

0 5 10 15 20 25 30

[17,24[ [24,31[ [31,38[ [38,45[ [45,52[ [52,59[

Polígon de freqüències absolutes

0 5 10 15 20 25 30 35 40 45

[17,24[ [24,31[ [31,38[ [38,45[ [45,52[ [52,59[

Histograma i polígon de freqüències acumulades Intervals Marca

classe

28 28

(42)

k.

Calculem la mitjana aritmètica:

L’edat mitjana dels alumnes és de 25,4 anys

Per a veure si la mitjana és representativa calculem el coeficient de variació de Pearson.

Primer calculem la desviació típica:

Després calculem el coeficient de variació de Pearson.

Com el valor del coeficient de variació de Pearson està relativament prop de 0, diem que l’edat mitjana dels alumnes que ens ha eixit és mitjanament representativa.

0 5 10 15 20 25 30 35 40 45 50

[17,24[ [24,31[ [31,38[ [38,45[ [45,52[ [52,59[

Histograma i polígon de freqüències acumulades

(43)

l.

Per a contestar aquesta pregunta el que fem és calcular la mediana.

Posició aleshores la classe mediana és

L’edat que divideix els alumnes en dos grups amb el mateix nombre d’alumnes és 22 anys.

m.

Per a contestar aquesta pregunta el que fem és calcular la moda.

Com que tots els intervals tenen la mateixa amplitud, farem el següent:

La classe modal és

L’edat més habitual entre aquest grup d’alumnes és 24 anys.

Intervals Marca classe

28 28

(44)

6. En dos pobles de la província de Castelló la superfície de les parcel·les que es dedica al cultiu de la taronja i el nombre de propietaris d’aquestes ve distribuïda segons les taules següents:

Poble A Poble B

a. Compara la concentració de les parcel·les dels dos pobles i indica en quin poble la terra està més repartida.

b. Calcula la mitjana de fanecades que té cada propietari en aquests pobles. En quin dels dos pobles hi ha menys variabilitat?

c. Representa la corba de Lorenz de les dades de les dos taules.

Solució a.

Anem a calcular l’índex de Gini dels dos pobles.

Poble A

Fanecades Nombre de propietaris

14

24

32

18

12

6

4

Fanecades Nombre de propietaris

20

26

30

14

22

5

3

Fanecades

5 14 14 0,1273 70 70 0,0136 0,1137 15 24 38 0,3455 360 430 0,0835 0,262 25 32 70 0,6363 800 1.230 0,2388 0,3975 40 18 88 0,8 720 1.950 0,3786 0,4214 75 12 100 0,909 900 2.850 0,5534 0,3556 150 6 106 0,9336 900 3.750 0,7282 0,2054

350 4 110 1 1.400 5.150 1 -

110 5.150

(45)

Poble B

Comparant els índexs de Gini dels dos pobles podem dir que la terra està més repartida en el poble B, perquè

b.

Calculem la mitjana aritmètica del poble A:

Poble A

La mitjana de fanecades que té cada propietari és de

Fanecades

5 20 20 0,1667 100 100 0,0176 0,1491 15 26 46 0,3833 390 490 0,0863 0,2971 30 30 76 0,6333 900 1.390 0,2447 0,3885 55 14 90 0,75 770 2.160 0,3803 0,3697 85 22 112 0,9333 1.870 4.030 0,7095 0,2238 150 5 117 0,975 750 4.780 0,8415 0,1335

300 3 120 1 900 5.680 1 -

120 5.680

Fanecades

5 14 15 24 25 32 40 18 75 12 150 6 350 4 110

(46)

Calculem la mitjana aritmètica del poble B:

Poble B

La mitjana de fanecades que té cada propietari és de

Per a veure en quin dels dos pobles hi ha menys variabilitat en el nombre de fanecades per propietari calculem el coeficient de variació de Pearson.

Primer calculem la desviació típica del poble A:

Ara calculem la desviació típica del poble B:

Com el valor del coeficient de variació de Pearson és menor en el poble B, direm que hi ha menys variabilitat en aquest poble, encara que com el coeficient de variació de Pearson és tan gran en els dos pobles, les mitjanes no són representatives.

Fanecades

5 20 15 26 30 30 55 14 85 22 150 5 300 3 120

(47)

c.

Calculem primer la corba de Lorenz del poble A.

Poble A

Calculem ara la corba de Lorenz del poble B.

Poble B

0 0,2 0,4 0,6 0,8 1 1,2

0 0,5 1 1,5

pi

Fanecades

5 14 14 0,1273 70 70 0,0136 0,1137 15 24 38 0,3455 360 430 0,0835 0,262 25 32 70 0,6363 800 1.230 0,2388 0,3975 40 18 88 0,8 720 1.950 0,3786 0,4214 75 12 100 0,909 900 2.850 0,5534 0,3556 150 6 106 0,9336 900 3.750 0,7282 0,2054

350 4 110 1 1.400 5.150 1 -

110 5.150

Fanecades

5 20 20 0,1667 100 100 0,0176 0,1491 15 26 46 0,3833 390 490 0,0863 0,2971 30 30 76 0,6333 900 1.390 0,2447 0,3885 55 14 90 0,75 770 2.160 0,3803 0,3697 85 22 112 0,9333 1.870 4.030 0,7095 0,2238 150 5 117 0,975 750 4.780 0,8415 0,1335

300 3 120 1 900 5.680 1 -

120 5.680

(48)

7. La distribució d’habitants (en milions) per comunitat autònoma en Espanya l’any 2012 ve donada segons la taula següent:

Nombre d’habitants Nombre de comunitats

5

5

5

1

3

a. Calcula la mitjana d’habitants per comunitat. És representativa aquesta mitjana?

b. Quin és el nombre d’habitants per comunitat autònoma més habitual?

c. Entre quins valors, de forma centralitzada, es troba el 50% de les comunitats autònomes?

d. Quin nombre d’habitants divideix en dos grups iguals les comunitats autònomes?

e. Quin percentatge de comunitats autònomes té més de 4 milions d’habitants?

f. Estudia la concentració d’habitants a Espanya per comunitats autònomes.

g. Si augmentara a Espanya la població en 50.000 habitants en totes les comunitats autònomes, com es veuria afectada la seua mitjana?

Continuaria tenint la mateixa representativitat?

0 0,2 0,4 0,6 0,8 1 1,2

0 0,5 1 1,5

pi

(49)

h. Si augmentara en Espanya la població un 2% en totes les comunitats autònomes, com es veuria afectada la seua mitjana? Continuaria tenint la mateixa representativitat?

Solució a.

Calculem la mitjana aritmètica:

Nombre d’habitants

0,5 5

1,5 5

2,5 5

4,5 1

7,5 3

19

La mitjana d’habitants per comunitat és de milions d’habitants.

Per a veure si la mitjana és representativa calculem el coeficient de variació de Pearson.

Primer calculem la desviació típica:

Com que el valor del coeficient de variació de Pearson està molt allunyat de 0, diem que el nombre mitjà d’habitants per comunitat que ens ha eixit no és representatiu.

b.

Per a respondre a aquesta pregunta el que fem és calcular la moda.

Com que els intervals no tenen tots la mateixa amplitud el que fem és calcular la densitat.

Nombre d’habitants

0,5 5 5

1,5 5 5

2,5 5 5

4,5 1 0,33

7,5 3 1

19

(50)

Com que hi ha tres intervals amb la mateixa densitat tindrem tres modes, on les seues classes modals són: i

Calculem ara les tres modes:

Els nombres més comuns d’habitants per comunitat autònoma són 1, 1,5 i s ’h b t ts.

c.

Per a calcular entre quins valors, de forma centralitzada, es troba el 50% de les comunitats autònomes, el que fem és calcular el primer i tercer quartil.

Posició , aleshores la classe on està el és

Posició , aleshores la classe on està el és

El 50% de les comunitats autònomes, de forma centralitzada, es troba entre 0,95 i 2,85 milions d’habitants.

Nombre d’habitants

0,5 5 5

1,5 5 10

2,5 5 15

4,5 1 16

7,5 3 19

19

(51)

d.

Per a contestar aquesta pregunta el que fem és calcular la mediana.

Posició aleshores la classe mediana és

El nombre d’habitants que divideix en dos grups iguals les comunitats autònomes és 17,9 milions d’habitants.

e.

Per a calcular quantes comunitats autònomes tenen més de 4 milions d’habitants interpolarem en l’interval on es troba el valor 4, és a dir, en l’interval

16 x

15

3 4 6

El de les comunitats autònomes tenen menys de 4 milions d’habitants, aleshores és el percentatge de comunitats autònomes que tenen més de 4 milions d’habitants.

Nombre d’habitants

0,5 5 5

1,5 5 10

2,5 5 15

4,5 1 16

7,5 3 19

19

(52)

f.

Per a estudiar la concentració d’habitants en Espanya per comunitats autònomes calcularem l’índex de Gini.

Com l’índex de Gini no dóna un valor pròxim a 1, ni un valor pròxim a 0, no podem dir ni que està concentrat ni que està repartit el nombre d’habitants per comunitat autònoma a Espanya.

g.

Si és la variable nombre d’habitants, si augmentem en totes les comunitats 50.000 habitants (0,05 milions d’habitants), definim la variable com:

Aplicant-hi les propietats de la mitjana aritmètica tenim que:

Aplicant-hi les propietats de la desviació típica tenim que:

Aleshores:

h.

Si és la variable nombre d’habitants, si augmentem en totes les comunitats un 2% el nombre d’habitants, definim la variable Z com:

Nombre

d’habitants

0,5 5 5 0,2632 2,5 2,5 0,0505 0,2127 1,5 5 10 0,5263 7,5 10 0,202 0,3243 2,5 5 15 0,7895 12,5 22,5 0,4545 0,335 4,5 1 16 0,8421 4,5 27 0,5454 0,2966

7,5 3 19 1 22,5 49,5 1 -

19 49,5

(53)

Aplicant-hi les propietats de la mitjana aritmètica tenim que:

Aplicant-hi les propietats de la desviació típica tenim que:

Aleshores:

1.3 Exercicis proposats

1. En un estudi en un hospital d’Alacant sobre les mesures, en centímetres, del perímetre cranial dels xiquets en el moment de nàixer, es van recollir en un mes les dades següents:

35,2 34,3 34,2 34,5 35,8 35,5 33,1 34,6 34,2 36,1 34,2 35,6 33,7 36 34,7 35,6 34,3 34,2 33,4 35,9 33,8 33,6 35,2 34,6

a. Construeix un diagrama de tija i fulles.

b. A partir del diagrama de tija i fulles construeix la taula de freqüències.

c. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències absolutes.

d. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències acumulades.

e. Quina és la mesura del perímetre cranial superat només pel 20% dels xiquets?

f. Ara, construeix la taula de freqüències apropiada amb intervals solapats i d’igual amplitud aplicant-hi la fórmula de Sturges d’aquestes dades i fes amb aquesta taula els apartats c i d d’aquest exercici de nou.

Solució

e. El perímetre cranial és de 35,89 centímetres f. El perímetre cranial és de 35,704 centímetres

(54)

2. L’edat de les persones que viuen en un bloc de pisos d’una ciutat són les següents:

a. Calcula l’edat mitjana de les persones que viuen en aquest bloc de pisos i digues si és representativa.

b. Quina és l’edat més comuna entre els habitants d’aquest edifici?

c. A partir de quina edat un veí d’aquest edifici es pot considerar que està entre els 26 veïns més vells?

d. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències absolutes.

e. Fes amb les dades de la taula anterior un histograma i un polígon de freqüències acumulades.

Solució

a. L’edat mitjana és de 29 anys i la representativitat 0,3569 b. L’edat més comuna és 30,9091 anys

c. A partir de 37 anys d’edat

3. La taula següent expressa el salari anual dels treballadors d’una empresa en milers d’euros:

Salari (en milers d’euros)

Nombre de treballadors

5

7

4

2

a. Calcula el valor mitjà dels salaris i digues si aquest valor és representatiu.

b. Quin salari deixa per damunt seu el 50% dels salaris?

c. A partir de quin salari es troben els 5 treballadors que més cobren?

Edat Nombre de persones

90

(55)

d. Quin percentatge de treballadors guanya més de 28.000 euros?

Solució

a. El salari mitjà és de 21.786 euros i la representativitat 0,2671

b. El salari que deixa per damunt seu el 50% dels salaris és de 21.786 euros

c. A partir de 26.250 euros d. Un percentatge del 17,14%

4. A un grup de 20 estudiants de la Universitat d’Alacant se’ls passa un test sobre el nivell d’anglès que tenen. El test puntua de 0 a 36 punts i aquests són els resultats que es van obtindre:

23 23 32 15 30 31 24 24 20 30 20 32 25 22 33 30 10 29 31 32 Fes un diagrama de caixa i bigots amb aquestes dades.

Solució

Valor adjacent inferior: 10 Valor adjacent superior: 33 Valors atípics: no hi ha cap.

5. Dos empreses de sectors productius diferents tenen 100 treballadors cadascuna. En la taula següent veiem les distribucions dels salaris mensuals dels treballadors en euros:

Empresa A Empresa B

Salari Nombre de

treballadors

Salari Nombre de

treballadors

20 10

10 30

10 35

10 24

50 1

Figure

Actualización...

Referencias

Actualización...

Related subjects :