9.3 Estimaci´o puntual
9.4.3 Aplicaci´o a l’estimaci´o de par`ametres
En aquest apartat passem dels intervals de probabilitat (sobre variables aleat`o-
ries que tenen una distribuci´o de probabilitat) als intervals de confian¸ca (sobre
valors desconeguts de par`ametres que no tenen una distribuci´o de probabilitat).
Com a notaci´o, es denotar`a simplificadament com [c±r] a l’interval de la
forma [c−r, c+r].
Interval de confian¸ca per a la mitjana
µ
en poblacions normals (o en
poblacions qualsevol si
n
´es “gran”) assumint vari`ancia
σ
2coneguda
1.
Z
:=
X−µ
σ/√n
∼N(0,1)
2. Per tant,
X−µ
σ/√n
∈[−z
1−α2, z
1− α 2] amb probabilitat 1−α.
3. A¨ıllant
µ, es troba que
µ∈[X±z
1−α2σ
√
n] amb confian¸ca 1−α.
Interval de confian¸ca per a la mitjana
µ
en poblacions normals amb
vari`ancia
σ
2desconeguda
1.
T
:=
X−µ
S/√n
∼t
n−12. Per tant,
X−µ
S/√n
∈[−(t
n−1)
(1−α2),(t
n−1)
(1− α 2)] amb probabilitat 1−α.
3. A¨ıllant
µ, es troba que
µ∈[X±(t
n−1)
(1−α2)
S
√
n] amb confian¸ca 1−α.
Nota: Si
n
´es “gran”,
t
n−1≈
N(µ= 0, σ
2= 1) i es poden usar els quantils de
la normal tipificada (z).
Interval de confian¸ca per a la vari`ancia
σ
2en poblacions normals
1.
H
:=
(n−1)S
2σ
2∼χ
2 n−12. Per tant,
(n−1)S
2σ
2∈[(χ
2 n−1)
α2,(χ
2 n−1)
1−α 2] amb probabilitat 1−α.
3. A¨ıllantσ
2, es troba queσ
2∈[(n−1)S
2(χ
2 n−1)
1−α 2,(n−1)S
2(χ
2 n−1)
α2] amb confian¸ca 1−α.
Interval de confian¸ca per a la proporci´o
p
en prova de Bernoulli
(binomial) amb
n
“gran”
1. Prenem la “proporci´o mostral”,
P�
:=
n `exitsn=X
∼
aprox.N(µ
=p, σ
2=
p(1−p) n)
2. DefinimZ
:=
�P�−p
� P(1−P�) n∼
aprox.N(0,1)
3. Per tant,
�P�−p
� P(1−P�) n∈[−z
1−α2, z
1−α2] amb probabilitat 1−α.
4. A¨ıllant
p, es troba que
p∈[P�±z
1−α2�
�
P(1−P�)
n
] amb confian¸ca 1−α.
S’observa que l’interval t´e la major ampl`aria possible quan la proporci´o
estimada ´es de 0.5.
Definici´o 9.4.1 (Error d’estimaci´o)
S’anomena error d’estimaci´o associat
a un interval de confian¸ca de nivell de confian¸ca
1−α
a la meitat de la seua
ampl`aria.
´
Es a dir, si l’interval ´es [a, b] l’error d’estimaci´o ´es
Error =
b−a
2
Observaci´o 9.4.1 (Reduir l’error de l’interval)
Per a l’estimaci´o sempre
interessar`a un interval amb una confian¸ca suficient (90, 95, 99%) per`o prec´ıs
(el m´es redu¨ıt possible).
La mida de la mostra (n) serveix per a disminuir l’error. De vegades la
mida de la mostra ve determinada per l’error m`axim que es puga assumir.
En ocasions (per exemple per raons de cost econ`omic del mostratge) in-
teressa con´eixer a priori el m´ınim tamany de mostra necessari per tal de poder
fer una estimaci´o del par`ametre amb un error “controlat” per una fita superior,
i amb un nivell de confiuan¸ca prefixat.
Observaci´o 9.4.2
Encara que no es pot calcular l’interval de confian¸ca abans
de recollir les dades, en l’estimaci´o de la proporci´o
p
de proves de Bernoulli
(binomial), l’error d’estimaci´o ´es el valor
z1
−α 2�
�
P(1−P�)
n
.
Si es vol afitar l’error per un valor fixat
E0, es pot anar al pitjor escenari, on
�
P
= 0.5, quedant:
z1
−α 2�
�
P(1−P�)
n
≤z1
−α2�
0.25
n
≤E0.
Ara, a¨ıllant la
n
obtenim que si
n≥
�z1
−α22E0
�
2,
l’error d’estimaci´o en els pitjors dels casos ser`a inferior a
E0, i per tant tamb´e
ho ser`a siga quina siga la proporci´o mostral observada a la mostra.
9.5
Exercicis proposats
Exercici 9.5.1
Una m`aquina fabrica peces de llarg`aria distribu¨ıda normal-
ment amb mitjana i vari`ancia desconegudes. Si agafem una mostra de
50
peces i calculem
x
= 14.3
i s
2= 1.82, calculeu un interval de confian¸ca del
95% per a la mitjana i un altre per a la vari`ancia de les llarg`aries de les peces.
Exercici 9.5.2
Una m`aquina fabrica peces de llarg`aria distribu¨ıda normal-
ment amb mitjana desconeguda i vari`ancia
σ
2= 0.1
cm
2.
Quina mida de mostra caldria triar per a estimar
µ
amb un error m`axim
Exercici 9.5.3
En un sondeig electoral es consulta l’opini´o de
567
persones,
de les quals,
259
votarien al partit
XXX. Calculeu l’interval de confian¸ca al
95%
per a la proporci´o
p
de votants del partit
XXX
entre l’electorat.
Exercici 9.5.4
Calculeu la mida m´ınima de la consulta de l’exercici anterior
per tal de poder estimar el valor de la proporci´o real de votants
pamb un error
m`axim del
0.01
(usant una confian¸ca del
95%).
Exercici 9.5.5
Una mostra aleat`oria de 36 cigarretes d’una determinada mar-
ca don`a un contingut mitj`a de nicotina de 3 mil ligrams. El contingut en nico-
tina d’aquestes cigarretes segueix la llei normal amb una desviaci´o est`andard
d’1 mil ligram. Obteniu i interpreteu un interval de confian¸ca del 95% per al
vertader contingut mitj`a de nicotina en aquestes cigarretes.
Exercici 9.5.6
Els seg¨uents nombres representen el temps (en minuts) que
van tardar 15 operaris a familiaritzar-se amb el funcionament d’una nova m`a-
quina adquirida per l’empresa: 3.4, 2.8, 4.4, 2.5, 3.3, 4, 4.8, 2.9, 5.6, 5.2,
3.7, 3, 3.6, 2.8, 4.8. Suposem que els temps es distribueixen normalment. De-
termineu i interpreteu un interval del 95% de confian¸ca per al vertader temps
mitj`a.
Exercici 9.5.7
Una marca de rentadores vol saber la proporci´o de llars en qu`e
prefereixen usar la seua marca. Prenen a l’atzar una mostra de 100 llars i en
20 diuen que la usarien. Calculeu un interval de confian¸ca del 95% per a la
verdadera proporci´o de llars que preferirien l’esmentada marca de rentadores.
Exercici 9.5.8
Volem ajustar una m`aquina de refrescos de manera que la
mitjana del l´ıquid dispensat quede dins de cert rang. La quantitat de l´ıquid
abocat per la m`aquina segueix una distribuci´o normal amb desviaci´o est`andard
de 0.15 decilitres. Desitgem que el valor estimat que es vaja a obtenir comparat
amb el vertader no siga superior a 0.2 decilitres amb una confian¸ca del 95%.
De quina grand`aria hem de triar la mostra?
Exercici 9.5.9
Una m`aquina ompli caixes amb un cert cereal. El supervisor
desitja con´eixer amb un error d’estimaci´o de m`axim 0.1 i un nivell de confian¸ca
del 90%, una mitjana estimada del pes. Com que la vari`ancia era desconeguda
es va procedir a triar una mostra pilot. Els resultats van ser els seg¨uents:
11.02, 11.14, 10.78, 11.59, 11.58, 11.19, 11.71, 11.27, 10.93, 10.94. Quantes
caixes ha de triar perqu`e es complisquen els requisits proposats?
Exercici 9.5.10
Es desitja fer una enquesta per a determinar la proporci´o
de fam´ılies que no tenen mitjans econ`omics per a atendre els problemes de
salut. Hi ha la impressi´o que aquesta proporci´o est`a pr`oxima a 0.35. Es desitja
determinar un interval de confian¸ca del 95% amb un error d’estimaci´o de 0.05.
De quina grand`aria ha de prendre’s la mostra?
Exercici 9.5.11
Un productor de llavors desitja saber amb un error d’estima-
ci´o de l’1% el percentatge de llavors que germinen en la granja del seu com-
petidor. Quina grand`aria de mostra ha de prendre’s per a obtenir un nivell de
confian¸ca del 95%?
Exercici 9.5.12
Es desitja realitzar una enquesta entre la poblaci´o juvenil
d’una determinada localitat per a determinar la proporci´o de joves que estaria
a favor d’una nova zona d’oci. El nombre de joves de la poblaci´o ´es de 2000.
Determineu la grand`aria de mostra necess`aria per a estimar la proporci´o d’es-
tudiants que estan a favor amb un error d’estimaci´o de 0.05 i un nivell de
confian¸ca del 95%.
Cap´ıtol 10
Proves d’hip`otesi sobre
par`ametres de models coneguts
10.1
Definicions
Situaci´o 10.1.1
Suposem que un experiment aleatori pot modelitzar-se segons
una variable aleat`oria
X
amb una certa distribuci´o. Volem contrastar:
una caracter`ıstica de la distribuci´o que es suposa certa, contra
una desviaci´o de la caracter´ıstica anterior, que es sospita que puga estar
passant.
Per tant, interessa posar a prova la caracter´ıstica inicial (i acceptar que ´es
certa o decidir que ´es falsa, i que ´es certa la desviaci´o sospitada).
Exemple 10.1.1
Una maquina fabricada per a omplir ampolles d’aigua mi-
neral (1500
ml) t´e l’especificaci´o:
X
∼
N(µ
= 1500, σ
2= 15)
on
X
=“volum
omplit per ampolla”. Sospitem que la m`aquina podria funcionar malament,
omplint per davall d’all`o especificat. Aleshores, el que es pot contrastar ´es el
parell:
H
0µ= 1500
(es suposa cert), contra
H
1µ <1500
(es sospita que ompli per defecte)
Definici´o 10.1.1 Prova o contrast d’hip`otesi()En una situaci´o com l’an-
terior, s’anomena:
Hip`otesi nul la (H
0): propietat que se suposa a la variable aleat`oria
X
fins que no hi haja evid`encia del contrari, i que es vol posar a prova.
Hip`otesi alternativa (H
1): propietat distinta a
H
0i se sospita que est`a
passant o es vol contraposar a la hip`otesi nul la.
Les hip`otesis nul les poden ser de molts tipus. En aquest curs ens centrem
en proves on la hip`otesi nul la expressa el valor suposat d’un par`ametre d’un
model conegut. S’anomena hip`otesi simple, front a hip`otesis on es suposa que
el par`ametre pertany a un conjunt de valors (hip`otesi composta).
La hip`otesi alternativa doncs, pot expressar el complementari d’H0
(�=) o
una desigualtat nom´es (>,
<).
Nota 10.1.1 (Procediment estad´ıstic est`andard)
Una prova d’hip`otesi
´es un problema per al qual no hi ha cap t`ecnica que porte a la decisi´o correcta
amb un
100% de seguretat. L’estad´ıstica, per tant, no pot donar la resposta
perfecta, per`o s´ı que ´es capa¸c de donar procediments de decisi´o que inclouen el
nivell de risc d’equivocar-se. L’usuari final ´es qui aprofita aquesta informaci´o
per a triar la seua decisi´o personal.
D’altra banda, la confecci´o d’una prova d’hip`otesi no ´es ´unica. Es poden
dissenyar dos procediments distints per a decidir una mateixa prova d’hip`otesi,
ambd´os amb la mateixa significaci´o, i en aplicar-los sobre la mateixa mostra,
poden donar lloc a dues decisions diferents.
Per tant, l’Estad´ıstica ataca les proves d’hip`otesi de la manera seg¨uent:
1. Crea un estad´ıstic (anomenat
de contrast) amb la condici´o que, si es
suposa
H0
certa, aleshores es coneix la distribuci´o d’aqueix estad´ıstic i
els valors m´es versemblants s´on els que m´es s’aproximen a la
H0
certa.
2. Dins de la suposici´o que
H0
siga certa, es calcula la zona de valors de
manera que la probabilitat que l’estad´ıstic se n’isca de la zona, en la
direcci´o indicada per la hip`otesi alternativa, siga exactament igual a
α.
3. Si una mostra d´ona lloc a un valor d’estad´ıstic de contrast fora de la
zona indicada a l’apartat anterior, aleshores la decisi´o ´es rebutjar
H0.
Nota 10.1.2 (Casu´ıstica en les proves d’hip`otesi)Una vegada est`a plan-
tejada la prova, es poden donar les situacions indicades a la Taula 10.1. Valorar
Taula 10.1: Quatre situacions que es poden donar en resoldre una prova d’hip`otesi
amb una decisi´o (acceptar o rebutjarH
0)
REALITAT
H0
´es certa
H0
´es falsa
D
E
Acceptes
H0
ENCERT
ERROR TIPUS II
C
I
S
I
Rebutges
H0
ERROR TIPUS I
ENCERT
´
O
la gravetat de l’error dep´en de les situacions particulars. Generalment ´es molt
m´es greu l’error tipus I, ra´o per la qual ´es important controlar-la amb un valor
petit.
Definici´o 10.1.2 (Significaci´o i pot`encia d’un contrast)S’anomenasig-
nificaci´o del contrastla probabilitat de l’error tipus I. Es denota per
α
i ha
de ser un valor petit (es sol prendre
0.05,
0.01o
0.1).
S’anomena
pot`encia del contrast
la probabilitat de rebutjar
H
0quan ´es
falsa (el complementari de l’error tipus II). Si es denota per
β
el valor de la
probabilitat de cometre l’error tipus II, aleshores la pot`encia ´es1−β, i interessa
que siga com m´es gran millor.
Malhauradament, no sempre es pot fer pujar la pot`encia sense fer pujar
col lateralment la significaci´o. Normalment ser`a m´es important tenir
α
con-
trolat i petit, per la gravetat que implica l’error tipus I.
Encara que el procediment mencionat a la Nota 10.1.1 ´es la forma est`an-
dard d’abordar les proves d’hip`otesi, una xicoteta variant d’aquest procediment
´es lleugerament m´es informativa, i ´es utilitzada per la majoria de programes
inform`atics que tracten el tema.
Nota 10.1.3 (Procediment estad´ıstic alternatiu)
El procediment est`an-
dard de la Nota 10.1.1 consisteix en crear una regi´o de valors d’acceptaci´o del
contrast, usant el nivell de significaci´o
α. Una volta creada la regi´o, per ca-
da mostra que trobem, calcularem l’estad´ıstic i, segons estiga o no en aqueixa
regi´o, acceptarem o no
H
0. Alternativament:
1. Es calcula el valor concret de l’estad´ıstic de contrast (del qual es coneix la
distribuci´o si es suposa
H
0certa) per a la mostra concreta que es tinga.
2. Dins de la suposici´o que
H
0siga certa, es calcula la probabilitat que
l’estad´ıstic de contrast done un valor tan versemblant o menys (´es a dir,
tan estrany o m´es) que el valor que ha donat amb la mostra concreta.
Aquesta probabilitat d’estranyesa del resultat s’anomena
p-valor (o
p-
value, en angl´es).
3. Ara, comparant el
p-valor amb
α, i decidint:
Acceptar
H
0si
p-valor≥α
Rebutjar
H
0sip-valor< α
tindrem un contrast d’hip`otesi de nivell de significaci´o exactament igual
a
α.
Aix´ı, els programes inform`atics d’estad´ıstica calculen elp-valor de cada mostra
i el responsable del contrast decideix si accepta o no
H
0segons el nivell de risc
que pot assumir.
In document
Estadística bàsica per a l'Enginyeria Tècnica en Informàtica de Gestió
(página 156-163)