Estadística
Resum idees bàsiques
Joan del Castillo2008
Joan del Castillo
Estadística Descriptiva
Conjunt de tècniques per organitzar, simplificar i resumir la informació continguda en un conjunt de dades.
Les dades poden provenir de variables quantitatives o de variables categòriques.
Joan del Castillo
Dades quantitatives
- Dades continues, les que varien de forma continua, com la temperatura, la resistència elèctrica, el nivell de radiació, etc.
- Dades discretes, les que només poden prendre valors enters com per exemple el nombre d'accessos a una determinada pàgina web, etc.
Joan del Castillo
Dades qualitatives
Poden ser:
- Nominals: són una simple etiqueta com per
exemple la marca, l’estat d’un fusible (fos/no fos), etc.
- Ordinals: en les que existeix una relació de ordre
entre els possibles valors, per ex. el resultat d’una exploració qualitativa de la temperatura d’un aparell (fred, tebi, calent).
Joan del Castillo
Recollida d’informació
Codi Edat (anys) Gènere Pes Alçada Fumador
1 20 f 61 170 1 2 20 f 65 171 0 3 19 f 55 166 0 4 20 f 63 170 1 5 18 f 56 170 1 6 18 f 59 160 0 7 16 f 58 165 0 8 20 f 57 169 1 9 20 f 58 165 1 10 20 f 50 153 1 11 18 m 90 171 1 12 18 m 60 168 1 13 19 m 61 172 1 14 22 m 72 187 0 15 21 m 65 170 0
Joan del Castillo
Primeres nocions
Matriu de dades
z Casos (files) i Variables (columnes). z Mida de la mostra = nombre de files = n.
Classes de variables:
z Discretes i Contínues. z Qualitatives i Quantitatives.
Variables discretes:
z Gènere, tabac, color del cabell, nombre de parts,...
Variables contínues:
Joan del Castillo
Descripció de variables:
Variables contínues i quantitatives:
z Exemples: Colesterol en sang, pes, alçada,... z Descripció: mitjanes, variància i desviacions.
Variables discretes:
z Exemples: Gènere, tabac, color del cabell,
nombre de parts,...
z Descripció: freqüències relatives.
Joan del Castillo
Descripció. Variables discretes
Notacióz n = Tamany de mostra.
z A una propietat, x, y = Variables.
Freqüencies absolutes:
z Nombre de casos amb una propietat.
Freqüencies relatives:
z Nombre de casos amb una propietat dividit pel
nombre total de casos.
( ) f A
( ) F A
Joan del Castillo
Enumeració dels elements
{
}
{
}
{
}
{
}
{
}
11,12,13,14,15 1, 2,3, 4,5,6,7,8,9,10 1, 4,5,8,9,10,11,12,13 2,3,6,7,14,15 1, 2,3,...,14,15 H D F NF = = = = Ω =Joan del Castillo
Unió i Intesecció de conjunts
Intersecció: z Homes i fumadors z Dones i fumadores Unió: z Homes o fumadors z Homes o no fumadors{
}
{
}
11,12,13 1, 4,5,8,9,10 H F D F ∩ = ∩ ={
}
{
}
1, 4,5,8,9,10,11,12,13,14,15 2,3,6, 7,11,12,13,14,15 H F H NF ∪ = ∪ =Joan del Castillo
Freqüencies relatives
( ) ( )( ) { } ( ) ( )( ) { } 11,12,13,14,15 5 0.33 15 15 2,3, 6, 7,14,15 6 40% 15 15 F H F f H F F NF F f NF F = = = = Ω = = = = ΩJoan del Castillo
Representació gràfica
Variables discretes (marginals).Homes Dones 0 2 4 6 8 10 Homes Dones
Joan del Castillo
Representació gràfica
Dues variables discretes0 1 2 3 4 5 6 Homes Dones Fumadors No fumadors
Joan del Castillo
Descripció de dades quantitatives
Mesures de localització.z Mitjana i mediana. z Quantils.
Mesures de dispersió.
z Desviació estàndard. Variància. z Rang. Rang interquartil.
Mesures de forma.
z Biaix (sesgo). z Curtosi.
Joan del Castillo
Descripció:Variables Quantitatives
Mitjana Variància Desviació estàndard 1 1 n i i x x n = =∑
(
)
2 2 1 1 1 n i i S x x n = = − −∑
(
)
2 1 1 1 n i i S x x n = = − −∑
Joan del Castillo
Mediana
Com es calcula:
Ordenar les dades de més petit a més gran. -Si el nombre de dades és senar, la mediana és la dada que està en el mig.
- Si el nombre és parell, és la mitjana dels dos valors centrals.
La mediana és “robusta” davant la presència de outliers.
{ } { }
Mediana (m): f xi≤m =f xi≥m
Joan del Castillo
Quartils
Mínim Quartil 1 Màxim
q1 Quartil 2 Mediana Quartil 3 q3 q2 25% 25% 25% 25% 25% 75% 25% 75%
Joan del Castillo
Rang
És la diferència entre els valors observats més gran i més petit: R = xmáx– xmín
- conserva les unitats de mesura de les dades originals.
- valors petits indiquen una menor dispersió.
- es veu extraordinàriament afectada pels valors
extrems (outliers).
Joan del Castillo
Descriptiva variables contínues
Posició Dispersió Forma Extrems Alçada (cm) Media 170.35 Mediana 170 Moda 170 Desviación estándar 9.80 Varianza de la muestra 96.12 Curtosis 5.20 Coeficiente de asimetría -0.96 Rango 102 Mínimo 97 Máximo 199 Suma 158594 Cuenta 931Joan del Castillo
Histograma
Classifiquem les observacions Classes Frecuencia 145 12 155 33 165 244 175 379 185 223 195 39 y mayor... 1
Joan del Castillo
Representació de les freqüències
Histograma 0 50 100 150 200 250 145 150 155 160 165 170 175 180 185 190 195 y ma yor.. . Alçades Fr e cue n ci a Alçada
Joan del Castillo
La llei dels errors
Distribució normal de probabilitats
0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 0,450 -5 -4 -3 -2 -1 0 1 2 3 4 5 95% ( ) 1 exp 2 2 2 x f x π = − 1.96 − 1.96
Joan del Castillo
Distribucions Normals
Són les que tenen funció de densitatz on z Si aleshores
( )
1 exp 1 2 2 2 x f x µ σ πσ − = − , x S µ= σ =(
, 2)
N µ σ 0, 1 µ= σ = N( )
0,1Joan del Castillo
Tendència i errors de dispersió
Tendència central Dispersió σ=0.75, 1, 2. 0. µ= -0.100 0.000 0.100 0.200 0.300 0.400 0.500 0.600 -8 -6 -4 -2 0 2 4 6 8
Joan del Castillo
Classificació i histogrames
Sota condicions “normals”z El 95% de les observacions d’una variable
contínua es troben separades com a màxim dues desviacions de la mitjana.
1.96
x x− ≤ S
Joan del Castillo
Que és un fet estrany ?
Estrany, estadísticament:z Allò que passa un 1 cop de cada 20. z
Molt estrany:
z Allò que passa un 1 cop de cada 100. z
Si no és estrany en direm “normal”.
1/ 20 0.05
p= =
1/100 0.01
p= =
Joan del Castillo
Estudi de dues variables
Dues variables contínues:z Recta de regressió.
Dues variables discretes:
z Taules de contingència. z Test Xi-quadrat de Pearson.
Una discreta i una contínua:
z Proves t de comparació de grups. z Anàlisi de la variància.
Joan del Castillo
Estadística bivariant
Mitjanes Variàncies Covariància 1 1 , n i i x x n = =∑
1 1 n i i y y n = =∑
(
)
2 2 1 1 1 n x i i S x x n = = − −∑
(
)
2 2 1 1 1 n y i i S y y n = = − −∑
(
)(
)
1 1 1 n xy i i i S x x y y n = = − − −∑
Joan del Castillo
Covariància i correlació
Covariància Coeficient de correlació i determinació
(
)(
)
1 1 1 n xy i i i S x x y y n = = − − −∑
xy x y S r S S = No tenen unitats 2r
→
Joan del Castillo
Recta de regressió
Equació de la recta Coeficients:
Coeficient de correlació y de determinació
y a b x
= +
2, xy x S b a y b x S = = − xy x y S r S S = → 0≤r2≤1 Xm 168,47 Ym 62,00 Sx 7,17 Sy 9,27 Sxy 36,43Joan del Castillo
Relació pes i alçada
Recta de regressió 0 20 40 60 80 100 120 150 160 170 180 190 200 Alçada (cm) P es ( K g ) -76,9 0,82 y= + xJoan del Castillo
Probabilitat
Lleis de la probabilitat: z 1 z 2 z 3 z 4 z 5( )
( )
n f A →P A ( ) ( ) ( ) ( ) ( ) ( ) ( )( )
( ) ( )( )
( ) 0, 1, 0. 1 P A P P P A B P A P B P A B P A P A P A C P A C P C ≥ Ω = ∅ = ∪ = + − ∩ = − ∩ = ( ) ( ) ( ) si i son independents P A B∩ =P A P B A BJoan del Castillo
Freqüències relatives
TabacCodi FumadAcum F. Relat
1 1 1 1.000 2 0 1 0.500 3 0 1 0.333 4 1 2 0.500 5 1 3 0.600 6 0 3 0.500 7 0 3 0.429 8 1 4 0.500 9 1 5 0.556 10 1 6 0.600 11 1 7 0.636 12 1 8 0.667 13 1 9 0.692 14 0 9 0.643 15 0 9 0.600 Fre. Relativa 0.000 0.200 0.400 0.600 0.800 1.000 1.200 0 2 4 6 8 10 12 14 16 Evolució de la freqüencia relativa del fumadors (Tabac)
Joan del Castillo
Límit de les freqüències
Freqüència de fumadors en una mostra de 931 persones Freq_relativa 0.000 0.200 0.400 0.600 0.800 1.000 1.200 0 100 200 300 400 500 600 700 800 900 1000
Joan del Castillo
Hi ha relació gènere-Tabac ?
Homes Dones TotalFumador 217 200 417 No_Fuma 244 270 514 Total 461 470 931
(
)
( ( ) )(
)
( ( ) ) 217 0.471 461 200 0.426 470 f H F f F H f H f F D f F D f D ∩ = = = ∩ = = =Joan del Castillo
Comparem les dues taules
Esperats Homes Dones Total Fumador 206.48 210.52 417 No_Fuma 254.52 259.48 514
Total 461 470 931
Observats Homes Dones Total
Fumador 217 200 417
No_Fuma 244 270 514
Joan del Castillo
Test X
2 nde Pearson
(
)
2 2 , 1 3.84 ij ij i j ij E O E = − ≤∑
Un dels 20 descobriments més importants del Segle XXEn el 95% dels casos, si hi ha independència
2 1.96 =
Joan del Castillo
No hi ha evidència de diferencies
Observat Esperat X2 217 206.48 0.54 244 254.52 0.43 200 210.52 0.53 270 259.48 0.43 p-valor = 0.1657 1.92(
)
2 2 , 1 1.92 3.84 ij ij ns i j ij E O E = − = ≤∑
Joan del Castillo
Podem controlar l’Atzar
Sabem mesurar la variabilitat produïda per atzar.
Podem fixar un nivell de confiança per a les nostres afirmacions.
z En biologia el nivell habitual és: 95% - 99%.
És possible saber la veritat i és fàcil detectar errors i falsedats.
Joan del Castillo
Proves diagnòstiques
(
)
Sensibilitat P DP M per descartar (no detectar greu)
Malaltia Salud
Diag. Positiu Ver. Positiu Fals Positiu
Diag. Negatiu Fals Negatiu Ver. Negatiu
(
)
Especificitat P DN S confirmar (diagnostic fals greu)
Estadística
Variables aleatòries discretes
Joan del Castillo2008
Joan del Castillo
Variables aleatòries
Una variable aleatòria, X, representa el resultat numèric d’un experiment aleatori.
z El resultat d’un dau.
z L’alçada d’una persona, escollida al atzar. z Els valors 1 o 0 segons si la persona fuma.
Analitzarem models simples, per tal d’introduir els conceptes d’esperançai
Joan del Castillo
Esperança d’un model arbitrari
Valors i probabilitats: Valor esperat: Interpretació: 1 1 2 2 ... ... n n v p v p X v p =[ ]
1 1 2 2 ... n n E X = ⋅ + ⋅v p v p + + ⋅v p[ ]
nx
→
E x
Joan del Castillo
Propietats de les mitjanes
La mitjana de la suma és suma de mitjanes.
Si multipliquem les dades per una constant, la mitjana també es multiplica.
( ) 1 1 1 1 n 1 n 1 n i i i i i i i x y x y n = n = n = + = +
∑
∑
∑
1 1 1 n 1 n i i i i a x a x a x n = n = = =∑
∑
Joan del Castillo
Propietats de l’Esperança
L’esperança de la suma és la sumad’esperances.
Si multipliquem per una constant, la esperança també es multiplica.
[
]
[ ] [ ]
1. E X Y
+
=
E X
+
E Y
[
]
[ ]
2. E a X
=
a E X
[ ]
nx
→
E x
Joan del Castillo
Distribució de Bernoulli
X pot prendre els valors 1, 0 ambprobabilitats p i (1-p).
Quan p = ½, és el model del llançament d’una moneda. 1 0 1 p X p = −
Joan del Castillo
Valor esperat d’una Bernoulli
Suposem X amb distribució: El valor esperat és: 1 0 1 p X p = −
[ ]
1 0 1(
)
E X = ⋅ + ⋅ −p p = pJoan del Castillo
Distribució Binomial
Anomenem B el nombre d’èxits, en n proves. La probabilitat d’obtenir k èxits és:
on
{
}
n k(
1)
n k P B k p p k − = = − (
!)
! ! n n k k n k = − Joan del Castillo
Valor esperat d’una Binomial
Suposem X amb distribució: Sigui El valor esperat de B és: 1 0 1 p X p = −
[ ]
[ ]
i E B =n E X =n p 1 n i i B X = =∑
Joan del Castillo
Evolució de la mitjana
Calculem la mitjana en 5 sèries de 250 llançaments d’un dau.
[ ]
3.5 n x →E x = 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 113 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193 205 217 229 241[ ]
V X 3.5 →Joan del Castillo
Variància d’un model arbitrari
Valors i probabilitats: Interpretació de la variància: Definició: 1 1 2 2 ... ... n n v p v p X v p =(
)
2[ ]
2 2 1 1 1 n 1 n i i i i x x x x V X n = n = − = − →∑
∑
[ ]
2[ ]
2 V X =E X −E XJoan del Castillo
Càlcul de la variància
1 1 2 2 ... ... n n v p v p X v p = [ ] 2 [ ]2 V X =E X −E X 2 1 1 2 2 2 2 2 ... ... n n v p v p X v p =[ ]
1 1 2 2 ... n n E X = ⋅ + ⋅v p v p + + ⋅v p 2 2 2 2 1 1 2 2 ... n n E X = ⋅ + ⋅ v p v p + + ⋅v pJoan del Castillo
Variància d’una Bernoulli
Valor esperat: Variància: 1 0 1 p X p = − 2 2 2 1 0 1 p X p = −
[ ]
1 0 1(
)
E X = ⋅ + ⋅ −p p =[ ]
2[ ]
2 V X =E X −E X =p p− 2= p(
1− p)
2 E X = pJoan del Castillo
Propietats de les variàncies
(
)
2 2 2 1 1 1 n 1 n i i i i x x x x n = n = − = −∑
∑
La variancia es pot calcular com la mitjana dels quadrats menys el quadrat de la mitjana
Si multipliquem les dades per una constant, la variancia es multiplica pel quadrat.
(
)
2 2(
)
2 1 1 1 n 1 n i i i i a x a x a x x n = n = − = −∑
∑
Joan del Castillo
Propietats de les variàncies
La variància de la suma de variables és la suma de variàncies més dues vegades la covariància.
(
)(
)
1 2 n i i i x x y y n = +∑
− −(
) (
)
(
)
2 1 1 n i i i x y x y n = + − +∑
(
)
2(
)
2 1 1 1 n 1 n i i i i x x y y n = n = =∑
− +∑
− +Per a variables independents:
(
)(
)
1 1 n 0 i i i x x y y n = − − →∑
Joan del Castillo
Propietats de la Variància
La variància de la suma o diferència devariables independents és suma de variàncies.
Si multipliquem per una constant, la variància es multiplica pel quadrat.
[
]
[ ] [ ]
1. V X Y
±
=
V X
+
V Y
[
]
2[ ]
2. V a X
=
a V X
Joan del Castillo
Moments d’una Bernoulli
Valor esperat: Variància: 1 0 1 p X p = − 2 2 2 1 0 1 p X p = −
[ ]
1 0 1(
)
2 E X = ⋅ + ⋅ −p p =E X =p[ ]
2[ ]
2 V X =E X −E X =p p− 2= p(
1− p)
Joan del Castillo
Moments d’una Binomial
Suposem X amb distribució: Sigui
El valor esperat i la variància de B són:
1 0 1 p X p = −
[ ]
[ ]
i E B =n E X =n p 1 n i i B X = =∑
B B n p≈(
,)
[ ]
[ ]
i(
1)
V B =n V X =n p −pJoan del Castillo
Mostra i Població
Mitjana Variància mostral Esperança Variància teòrica 1 1 n n i i x x n = =∑
E x[ ]
=∑
v pk k ( )2 2 1 1 1 n n i i S x x n = = − −∑
[ ]
[ ]
2 2 V X =E X −E X[ ]
n x →E x[ ]
2 n S →V x• Llei dels grans nombres:
( )
( )
n
f A →P A
Joan del Castillo
Funcions de distribució
Sigui X una variable qualsevol. Anomenem
funció de distribució(funció de probabilitat
acumulada) a
Aleshores calculem probabilitats
{
}
( )
( )
P a X
<
≤
b
=
F b
−
F a
( )
P
{
}
Joan del Castillo
Distribució Binomial
Nombre d’èxits en n = 10 proves (p = 0.5)
Valors P(k) F(k) 0 0.001 0.001 1 0.010 0.011 2 0.044 0.055 3 0.117 0.172 4 0.205 0.377 5 0.246 0.623 6 0.205 0.828 7 0.117 0.945 8 0.044 0.989 9 0.010 0.999 10 0.001 1.000
Joan del Castillo
Probabilitats Binomial ( n = 10)
Binomial 0.000 0.050 0.100 0.150 0.200 0.250 0.300 0 2 4 6 8 10 Exits P ro b a b ilit a tsJoan del Castillo
Probabilitats acumulades
0.00000 0.20000 0.40000 0.60000 0.80000 1.00000 1.20000 0 2 4 6 8 10 12( )
P
{
}
F x
=
X
≤
x
Joan del Castillo
Propietats funció de distribució
{
}
( )
( )
4. P a X b< ≤ =F b −F a( )
{
}
1.
F x
=
P
X
≤
x
, es creixent.
( )
2. lim
x↑F x
=
1
( )
3. lim
x↓F x
=
0
Joan del Castillo
Variables aleatòries contínues
Si X és una variable contínua, la funció de distribució és derivable
Anomenen funció de densitata la derivada:
La densitat representa el límit dels histogrames.
( )
'
( )
f x
=
F x
( )
P
{
}
F x
=
X
≤
x
Estadística
Distribució Normal
Joan del CastilloJoan del Castillo
Variables aleatòries contínues
Si X és una variable contínua, la funció de distribució és derivable
Anomenen funció de densitata la derivada:
La densitat representa el límit dels histogrames.
( )
'
( )
f x
=
F x
( )
P
{
}
F x
=
X
≤
x
Joan del Castillo
Variables continues
Són equivalents i
Les dues ens diuen que
{
}
( )
( )
P
b( )
aa
<
X
≤
b
=
∫
f x dx F b
=
−
F a
( )
( )
'
F x
=
f x
{
}
( )
x( )
P X
x
F x
f t dt
−∞≤
=
=
∫
Joan del Castillo
Propietats funció de densitat
( )
4. ∞ f x dx 1. −∞ =∫
( )
1.
f x
≥
0.
( )
( )
2. lim
x↑f x
=
lim
x↓f x
=
0.
{
}
( )
3. P b a a X b< ≤ =∫
f x dxJoan del Castillo
Normal estàndard
Distribució normal de probabilitats
0.000 0.050 0.100 0.150 0.200 0.250 0.300 0.350 0.400 0.450 -5 -4 -3 -2 -1 0 1 2 3 4 5 ( ) 1 exp 2 2 2 x f x π = −
( )
f xJoan del Castillo
Estandardització
Proposició: Utilitzant variables normals, sempre ens podem reduir a la normal N(0,1)
Anomenarem a la funció de distribució de la N(0,1). 2
( ,
)
X
(0,1)
X
N
µ σ
Z
µ
N
σ
−
≈
⇔ =
≈
( )
x φJoan del Castillo
Exemple
Calculem: zon{
}
P 160<X≤170 160 X 170 P µ µ µ σ σ σ − − − = < ≤ 170.35, 9.80 µ= σ={
1.06 0.04}
P Z = − < ≤ − 0.04 1.06f x dx
z( )
− −=
∫
=φ
(
−0.04) (
− −φ
1.06)
(0,1)
Z
≈
N
0.338 = 0.484 0.146 = −Joan del Castillo
Funció de distribució de N(0,1)
x f(x) F(x) -3.50 0.001 0.0002 -3.00 0.004 0.0013 -2.50 0.018 0.0062 -2.00 0.054 0.0228 -1.50 0.130 0.0668 -1.00 0.242 0.1587 -0.50 0.352 0.3085 0.00 0.399 0.5000 0.50 0.352 0.6915 1.00 0.242 0.8413 1.50 0.130 0.9332 2.00 0.054 0.9772 2.50 0.018 0.9938 3.00 0.004 0.9987 3.50 0.001 0.9998 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00( )
x φJoan del Castillo
La distribució normal
Apareix en molts fenòmens reals. Histogrames.
Encara que alguna variable no segueixi la distribució normal, les sumes es comporten segons la distribució normal.
Moltes característiques són el resultat de la suma de petits factors independents.
Valors esperats d’una normal
0.000 0.050 0.100 0.150 0.200 0.250 0.300 0.350 0.400 0.450 -5 -4 -3 -2 -1 0 1 2 3 4 5 2 ( , ) X ≈N µ σ
[ ]
[ ]
2 E X V X µ σ = ⇒ = Joan del Castillo
Teorema central del límit
1. Combinacions lineals de normals sónnormals.
2. La suma de normals independents és normal.
3. TCL: La suma de variables independents de qualsevol tipus és aproximadament normal.
a X
+
b
1 2
...
nX
+
X
+ +
X
Joan del Castillo
Les rèpliques disminueixen
l’error
X és una variable on
z és el valor mitjà z desviació de la mostra
Fem la mitjana de n observacions
zEl valor esperat és zDesviació de la mitjana µ σ
[ ]
Sd x =[ ]
E x =µ[ ]
Sd x =σ 1 i x x n =∑
[ ]
E x =µ n σ[ ]
2 V x n σ =Joan del Castillo
Teorema central del límit
Sigui X una variable qualsevol ambz el valor esperat z la variància
z Fem la mitjana de n observacions
Teorema z La distribució de és µ 2 σ
[ ]
E x =µ[ ]
2 V x =σ 1 i x x n =∑
x 2 ( , ) x N n σ µ ≈Joan del Castillo
Apliquem el TCL a la Binomial
Sigui B una variable Binomial.zSabem que és suma de Bernoullis zL’esperança és zLa variància és Teorema. zon zsempre que
[ ]
E B =n p=µ[ ]
(1 ) 2 V B =n p −p =σ 1 n i i B X = =∑
2 ( , ) ( , ) B n p ≈N µ σ(
)
2 , 1 n p n p p µ= σ = −(
1)
10 n p −p ≥(
)
Si n p 1−p ≥5, amb correccions.Joan del Castillo
Exemple
Hem fet una enquesta a 80 persones. Si la mostra ha estat escollida a l’atzar, quina és la probabilitat d’entrevistar més de 25 dones ?
El model correspon a una Binomial amb
(
1)
n p − p =(
,)
B B n p≈ 80, 0.5 n= p= 80 0.5 0.5 20 10⋅ ⋅ = ≥ 2Podem aproximar per una X≈N( ,µ σ )
2
40, (1 ) 20
n p n p p
µ= = σ = − =
Joan del Castillo
Exemple
Podem aproximar per una X≈N( ,µ σ2){
25}
{
25 ,}
P B> ≈P X > µ=40, σ2=20{
25}
1{
25}
P X> = −P X≤{
25}
X 25 P X P µ µ σ σ − − ≤ = ≤ =P Z{
≤ −3.35}
(
3.35)
1(
3.35)
φ φ = − = − = −1 0.999(
)
1 1 0.999 0.999 = − − =Joan del Castillo
Valors crítics amb error 0.05
Calculeu per a de maneraque: Aleshores
{
1 2}
( ) ( )
2 1 0.95 P z < ≤Z z =φ
z −φ
z =( )
z2 P Z{
z2}
0.975φ
= ≤ =( )
z1 P Z{
z1}
0.025φ
= ≤ = 1, 2 z z Z≈N(0,1)Joan del Castillo
La llei dels errors
Distribució normal de probabilitats
0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 0,450 -5 -4 -3 -2 -1 0 1 2 3 4 5 2 1 exp 2 2 x π − 95% 1 z z2 0.025 0.025
( )
z2 0.975 φ = 1 2 z = −zJoan del Castillo
Valors crítics de la N(0,1)
x f(x) F(x) -3.50 0.001 0.0002 -3.00 0.004 0.0013 -2.50 0.018 0.0062 -2.00 0.054 0.0228 -1.50 0.130 0.0668 -1.00 0.242 0.1587 -0.50 0.352 0.3085 0.00 0.399 0.5000 0.50 0.352 0.6915 1.00 0.242 0.8413 1.50 0.130 0.9332 2.00 0.054 0.9772 2.50 0.018 0.9938 3.00 0.004 0.9987 3.50 0.001 0.9998 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00(
)
1 0.975 1.96 φ− =( )
1 zα φ α− =(
)
1 0.025 1.96 φ− = − 0.975Joan del Castillo
Normal segons la variància
Tendència central Dispersió σ=0.75, 1, 2. 0. µ= -0.100 0.000 0.100 0.200 0.300 0.400 0.500 0.600 -8 -6 -4 -2 0 2 4 6 8
Joan del Castillo
Valors crítics
Suposem unaz És prou gran per aproximar per la Normal. z No cal fer correcció de Yates.
Volem determinar tals que
(300,0.5) B B≈
{
1 2}
0.95 P b ≤ ≤B b = 1, 2 b bJoan del Castillo
Aproximem per la Normal
La Binomial es potaproximar per la normal amb
(300,0.5) B B≈
(
)
2 150, 1 75 n p n p p µ= = σ = − =(300,0.5)
(150,75)
B B
≈
⇒
X
≈
N
Joan del Castillo
Estandarditzem
Determinar: z on{
1 2}
P b ≤X≤b =0.95 1 2 b X b P µ µ µ σ σ σ − − − = < ≤ 2 150, 75 µ= σ ={
1 2}
0.95 P z Z z = < ≤ = 1 1 150 75 b z = −(0,1)
Z
≈
N
2 2 150 75 b z = − 1.96 = − =1.96 1 133, 2 167 b = b =Joan del Castillo
Conseqüències de la simetria
La simetria de la N(0,1) ens dona: Pels valors crítics, la simetria ens dona:
( )
x 1( )
x φ − = −φ( )
(
)
1 1 1 φ α− = −φ− −α 1 zα z−α ⇒ = −Joan del Castillo
Valors crítics N(0,1)
Els valors crítics més usuals són:1 p p z = −z− p-valor Zp 0.025 -1.960 0.975 1.960 0.05 -1.645 0.95 1.645 0.005 -2.576 0.995 2.576 0.01 -2.326 0.99 2.326 0.10 -1.282 0.90 1.282
( )
1 p p z φ− =Joan del Castillo
Aprox. Normal de les freqüències
Per a la freqüència relativatenim l’aproximació: / f =B n
(
, (1 ) /)
f ≈N p p −p n(
)
Sempre que: n p 1−p ≥10L'Estandarització ens dona:
(0,1) (1 ) / (1 ) f p f p n N p p n p p − = − ≈ − −
Joan del Castillo
Precisió en les enquestes
Suposem que fem 50 enquestes amb probabilitat 0.4 d’observar un esdeveniment (α = 0.05).
[ ]
0.4 E f =[ ]
V f = 1.96 0.048 0.1358 error= × =(
)
(
)
inter.freq.= 0.4 0.136,0.4 0.136− + = 0.26,0.54(
0.4 0.6 / 50 0.0048×)
=Joan del Castillo
Precisió en les enquestes
Suposem que fem 2000 enquestes amb probabilitat 0.4 d’observar un esdeveniment (α = 0.05).
[ ]
0.4 E f = [ ] (0.4 0.6 / 2000 0.00012) V B = × = 1.96 0.00012 0.0215 error= × =(
)
(
)
inter.freq.= 0.4 0.022,0.4 0.022− + = 0.38,0.42Joan del Castillo
Intervals per a freqüències
( )
Amb confiança 1-α , o error α (0,1) (1 ) f p n N p p − ≈ − / 2 1 / 2 (1 ) f p z n z p p α −α − ≤ ≤ − 1 (1 ) f p n z p p −α − ≤ − (1 ) f p z n p p α − ≤ −
Joan del Castillo
Intervals per a proporcions
( )
Amb confiança 1-α , o error α (0,1) (1 ) / N f f n p f ≈ − − 1 / 2 1 / 2 (1 ) / z z f f n p f α α − − − ≤ − − ≤ 1 (1 ) / z f f n p f α − ≤ − − 1 (1 ) / p f z f f n α − − ≤ − −
Joan del Castillo
Distribucions derivades de N(0,1)
Distribució Xi-quadrat. Distribució d’Student. Distribució de Fisher. nt
2 nχ
(
,
)
F m n
Joan del Castillo
Distribució Xi-quadrat
Suposem que tenim n normals N(0,1) independents:
Considerem:
Direm que Ch té distribució:
2 n
Ch
≈
χ
1,
2,...,
n(0,1)
Z Z
Z
≈
N
2 2 2 1 2...
nCh Z
=
+
Z
+ +
Z
2 nχ
Joan del Castillo
Densitat d’una distribució
0 0.04 0.08 0.12 0.16 0.2 0 5 10 15 20 25 2 n
χ
( )
f x 0.05 1 c 0.05 Valors críticsJoan del Castillo
Distribució d’Student
Suposem que tenim n+1 normals N(0,1) independents: Considerem: 0
, ,
1 2,...,
n(0,1)
Z Z Z
Z
≈
N
0 2 2 2 1 2,
...
nZ
Ch Z
=
+
Z
+ +
Z
Joan del Castillo
Distribució d’Student
Direm queté distribució d’Student amb n graus de llibertat: n
t
0/
Z
T
Ch n
=
nT
≈
t
nt
Joan del Castillo
Distribució F de Fisher
Suposem que tenim: Aleshores: té distribució 2 2 2 2 1 2 2 2 2 2 1 2 ( ) ... ( ) ... m m n n Ch m Z Z Z Ch n Z Z Z χ χ = + + + ≈ = + + + ≈
( )
( )
// Ch m m F Ch n n =(
,)
F ≈F m nJoan del Castillo
Taules de la de Fisher
F m n(
,)
m
n
Joan del Castillo
Observacions
1. Una és sempre positiva.
2. Una és simètrica.
3. El quadrat d’una és una
2 n
χ
nt
nt
F( )
1,n( )
( )
( )
( )
2 2 0 0 1 /1 / / / Ch Z Z Ch n n Ch n n Ch n n = = 0 / Z Ch nEstadística
Inferència
Joan del Castillo 2008
Joan del Castillo
Intervals de confiança
Intervals per als paràmetres (desconeguts).
Interval per a la mitjana amb variància coneguda.
Teorema de Fisher.
Interval de confiança per a la variància.
Interval de confiança per a la mitjana, sense conèixer la variància.
2
( , )
x N≈ µ σ
Joan del Castillo
Teorema de Fisher
1. 2. 3. 2 2 2 1 2 2 ( ) ( 1) i n x x n S χ σ σ − − − =∑
≈ 1 / n x t S n µ − − ≈ (0,1) / x N n µ σ − ≈ 2 ( , ) x N nσ
µ
⇔ ≈ ( )2 2 1 1 1 n i i S x x n = = −− ∑ Joan del Castillo
Exemple:
Suposem que en una mostra de pesos de 25 persones la desviació resulta S = 12.5, entre quins valors està la veritable σ, amb una confiança del 99% ? 0.01, α = ⇒ 0.005, 1 0.995 2 2 α = − =α
(
)
(
)
2 24 2 24 0.005 9.89 0.995 45.56 χ χ = = 9.89 45.56 a b → = → =Joan del Castillo
Densitat d’una distribució
0 0.04 0.08 0.12 0.16 0.2 0 5 10 15 20 25 2 n
χ
( )
f x 0.005 b 0.005 Valors crítics a 0.99Joan del Castillo
Intervals de confiança per a
Fisher (2) ens diu: 2 2 1 2 ( i ) n x x χ σ − − ≈
∑
2 σ(
)
Fixem un marge d'error: α 0.05 0.01−
(
)
Tindrem un nivell de confiança de 1−α
2 1
Busquem els valors crítics: a≤χn− ≤b 2 2 (xi x) a b σ − ≤
∑
≤Joan del Castillo
Intervals de confiança per a
Utilitzant: Tenim: Equivalentment: 2 σ 2 2 2 (xi x) (xi x) b σ a − − ≤ ≤
∑
∑
2 2 (xi x) (xi x) b σ a − − ≤ ≤∑
∑
2 1 n a≤χ − ≤bJoan del Castillo
Exemple
Tenim que: Aleshores: Finalment{
2}
24 9.89 45.56 0.99 P ≤χ ≤ = 2 2 2 ( ) ( ) 45.56 9.89 i i x −x σ x −x ≤ ≤∑
∑
( ) ( ) 24 2 24 0.995 45.56 b=χ = 9. 0724≤ ≤σ
19. 472Joan del Castillo
Interval per a amb desconeguda
Fisher (3) ens diu: Fixem un marge d’error:
Tindrem un nivell de confiança de
Busquem els valors crítics:
(
0.05 0.01)
α −(
1−α) (
0.95 0.99−)
1 n x n t S µ − − ≈ x a n b S µ − ≤ ≤σ
µ
Joan del Castillo
Intervals de confiança per a
Volem trobar que compleixin:
Per simetria: on Finalment: µ 1 / 2 1 / 2 S S x t x t n n α µ α − − − ≤ ≤ +
{
n1} (
1)
P a t≤ − ≤b = −α( )
a b, a= −b 1 1 / 2 1 / 2 n b t α t−α − − = = / 2 1 / 2 a t= α = −t−αJoan del Castillo
Contrastos d’hipòtesis
Intervals de confiança o contrastos ? Contrastos d’hipòtesis.
z Contrastos per a mitjanes. z Contrastos per a variàncies. z Regió d’acceptació i regió crítica. z Contrastos unilaterals i bilaterals..
Joan del Castillo
Exemple
Es tenen dades sobre 100.000 individus (servei militar) on es conclou que l'alçada mitjana era µ = 170 i la desviació σ = 10.
Es vol decidir si ha augmentat l'alçada
mitjanade la població, amb una confiança
del 95%.
Disposem d'una mostra de n = 25 individus, amb una mitjana de x=172.3
Joan del Castillo
Contrastos d’hipòtesis
El plantejament del problema porta a considerar dues hipòtesis:
z La primera o nul·laés la que pretenem rebutjar. z La segona, o alternativa, és la que creiem certa. z No contemplem la possibilitat que:
z Ens basarem en la distribució de la mitjana:
0 1 : 170 : 170 H H µ µ = > 170 µ< 2 ( , ) x N n σ µ ≈
Joan del Castillo
Contrastos d’hipòtesis
Acceptarem sempre que sigui menor que un cert valor:
Acceptarem quan .
En el segon cas direm que rebutgem la hipòtesi nul·la.
La regió d’acceptació serà:
1: 170 H µ> 0: 170 H µ= x
x b
≤
x b
>
(
,)
A= −∞ b{
}
{
}
(1 ) 0.95 P x∈A =P x b≤ = −α =Joan del Castillo
Densitat de:
0,00 0,05 0,10 0,15 0,20 0,25 160 165 170 175 180(
1−α)
2 ( , ) x N n σ µ ≈ b A x RJoan del Castillo
Contrastos d’hipòtesis
La regió d’acceptació(de ) serà de la forma:
La regió de rebuig(de ) o regió crítica
serà de la forma: 0 H
(
,)
A= −∞ b 0 H(
,)
R= =A b ∞{
}
{
}
(1 ) 0.95 P x∈A =P x b≤ = −α =Joan del Castillo
Determinació del punt crític:
Volem trobar de manera que: Estandarditzant:
{
}
{
}
(1 ) 0.95 P x∈A =P x b≤ = −α = (1 ) 0.95 x b P n µ n µ α σ σ − − ≤ = − = b?
b
=
(0,1) x Z n µ N σ − = ≈Joan del Castillo
Determinació del punt crític:
Cal resoldre: 1 1.645 b n µ z α σ − − = = 1 b z n α σ µ − = +
b
10 170 1.645 25 = +=
173.3
(
,) (
, 173.3)
A= −∞ b = −∞ x=172.3∈A 0 Acceptem H :µ =170Joan del Castillo
Contrastos per a mitjanes
Es poden presentar les situacions:0 0 1 0 : : H H µ µ µ µ = > 0 0 1 0 : : H H µ µ µ µ = < 0 0 1 0 : : H H µ µ µ µ = ≠ 0 0 1 1 : : H H µ µ µ µ = =
x
≈
µ
Joan del Castillo
Regions d’acceptació
Les regions d’acceptació poden ser:
(
)
( )
(
)
( )
,
,
,
0,
A
b
A
a b
A
a
A
b
= −∞
=
=
∞
=
Una cua.Dues cues (bilateral). Una cua.
Una cua, distribució positiva.
Joan del Castillo
Contrast sobre variàncies
En una mostra de 30 individus hem calculat una desviació estàndard de S = 12,5. Volem
decidirsi els individus pertanyen a una
població amb o a un altra amb σ =10 σ =15. 0 1 : 10 Considerem: ( 0.05) : 15 H H σ α σ = = =
( ) {
0,}
A= b = S b≤ Regió d’acceptació ?Joan del Castillo
Contrast sobre variàncies
Estadístic: Regió d’acceptació:
Equació per determinar b:
Estandarditzem... 2 2 1 2 ( 1) n n S χ σ − − ≈
( ) {
0,}
A= b = S b≤{
2 2}
0.95 P S ≤b = 2 2 2 2 (n 1)S (n 1)b P σ σ − − ≤ = Joan del Castillo
Contrast sobre variàncies
Estandardització (suposant ): Busquem a les taules:
{
2}
29 1 0.95, P χ ≤ch−α = 2 1 1 1 2 ( 1) n n b ch−α ch−−α σ − = = 0: 10 H σ = 2 2 2 2 (n 1)S (n 1)b (1 ) 0.95 P α σ σ − ≤ − = − = 2 2 1 2 ( 1) n n S χ σ − − ≈Joan del Castillo
Contrast sobre variàncies
De les taules: Regió d’acceptació: A=( )
0,b ={
S2≤b2}
{
2 146.8}
0.95, P S ≤ = 2 1 42.56, ch−α= b = 2 1 2 (n 1)b ch−α σ − ={
12.1}
0.95 P S≤ = 2 1 146.8 1 ch n ασ − = − 12.5 S= ∉A Rebutgem H0:σ =10 Tenim un 95% de confiança que =15σJoan del Castillo
Comparació de dos grups
Contrastos població-mostra. Comparació de dues mitjanes:
z Mostres independents, variàncies conegudes. z Mostres independents, variàncies iguals. z Dades aparellades.
Comparació de dues variàncies.
Joan del Castillo
Comparació mitjanes de pesos
Observacions: Model: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 2 1 2 2 1 2 .1: , ,..., ( , ) .2 : , ,..., ( , ) x y n x x n y y Gr x x x N Gr y y y N µ σ µ σ ≈ ≈Joan del Castillo
Contrastos d’hipòtesis
El plantegem el problema com a:z Primer suposarem conegudes . z Segon, suposarem desconegudes. z Tercer, ens plantejarem contrastar:
0 1 : : y x y x H H µ µ µ µ = > i y x σ σ y x σ =σ 0: y x H σ =σ
Joan del Castillo
Distribució de l’estadístic
Calculem: Estandarditzant:[
]
V y x− =V y[ ] [ ]
+V x = 2 2 y x y x n n σ +σ y x µ −µ =δ[
]
E y x− = E y[ ] [ ]
−E x =(
)
2 2 (0,1) y x y x y x Z N n n δ σ σ − − = ≈ +y x
−
Joan del Castillo
Exemple-2
Observacions: Contrasteu: suposant z Calculeu: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 0 1 : : y x y x H H µ µ µ µ = ≠ x 810 y σ σ = = y x = = 71.8 61.3 δ =10 (α =0.05)Joan del Castillo
Comparació mitjanes de pesos
Prueba z para medias de dos muestrasVariable 1 Variable 2
Media 71.83 61.25
Varianza (conocida) 100 64
Observaciones 12 8
Diferencia hipotética de las medias 0
z 2.619
P(Z<=z) una cola 0.004
Valor crítico de z (una cola) 1.645 Valor crítico de z (dos colas) 0.009 Valor crítico de z (dos colas) 1.960
Joan del Castillo
Valor esperat de S
2 Del Teorema de Fisher:
Aleshores: 2 2 2 1 2 2 ( ) ( 1) i n x x n S χ σ σ − − − =
∑
≈ 2 2 1 2 ( 1) 1 n n S E E χ n σ − − = = − 2 E S = σ2 Estimador no-esbiaixatJoan del Castillo
Comparació de variàncies
Sabem del Teorema de Fisher: Aleshores: 2 2 1 2 ( 1) , x x x x n n S Ch χ σ − − = ≈ 2 2 1 2 ( 1) y y y y n n S Ch χ σ − − = ≈ 2 1, 1 2 /( 1) /( 1) x y x x x n n y y y S Ch n F S Ch n − − − = ≈ −
Joan del Castillo
Exemple:
Comparació de
Variàncies
Observacions: Contrasteu: z Calculeu: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 x y S S = = y x = = 71.8 61.3 (α =0.05) 7.44 16.40 0 1 : : y x y x H H σ σ σ σ = >Joan del Castillo
Comparació de
Variàncies
Prueba F para varianzas de dos muestrasVariable 1 Variable 2 Media 71.83 61.25 Varianza 269.06 55.36 Observaciones 12 8 Grados de libertad 11 7 F 4.86 P(F<=f) una cola 0.02
Valor crítico para F (una cola) 3.60
Joan del Castillo
Dades aparellades
Colesterol en sang abans i després d’un tractament basat en dieta i esport.
W.Daniel, 1987
Augmenta : 2
Disminueix : 10
d Y X= −
Paci. Abans (Y) Després (X)
1 201 200 2 231 236 3 221 216 4 260 233 5 228 224 6 237 216 7 326 296 8 235 195 9 240 207 10 267 247 11 284 210 12 201 209 Dif. 1 -5 5 27 4 21 30 40 33 20 74 -8
Joan del Castillo
Dades aparellades
1 d n dd
n
t
S
µ
−−
≈
Considerem la diferencia: di= −yi xi, , d = −y x 2(
)
2 1 1 1 n d i i S d d n = = − −∑
, d y x µ =µ −µJoan del Castillo
Contrastem mitjana zero
Volem contrastar en base a0 1 : 0 : 0 d d H H µ µ = > d Y X= − 1 n x n t S µ − − ≈ Una població.
Contrast sobre la mitjana.
Variancia desconeguda. 1 d n d d n t S µ − − ⇒ ≈
Joan del Castillo
Variàncies conegudes
Suposant conegudes .σ σx, y ( ) 2 2 (0,1) y x y x y x Z N n n δ σ σ − − = ≈ +Joan del Castillo
Variàncies iguals, desconegudes
Expressió final del Test
( ) 2 1 1 nx ny y x y x T t S n n δ + − − − = ≈ + 2 2 2 ( 1) ( 1) on ( 2) x x y y x y n S n S S n n − + − = + −
Joan del Castillo
Comparació de variàncies
Distribució del quocient:2 1, 1 2 x y x n n y S F S ≈ − −
(
)
2 2 1 1 1 n x i i x S x x n = = − −∑
(
)
2 2 1 1 1 n y i i y S y y n = = − −∑
Estadística
Anàlisi de la variànciaJoan del Castillo 2008
Joan del Castillo
Anàlisi de la variància
Model:
Un procediment per comparar mitjanes.
Hipòtesis del model:
z Variables normals. z Variàncies iguals. z Independència. 2 11 12 1 1 2 21 22 2 2 2 1 2 .1: , ,..., ( , ) .2 : , ,..., ( , ) ... . : , ,..., ( , ) n n I I In I Gr y y y N Gr y y y N Gr I y y y N µ σ µ σ µ σ ≈ ≈ ≈ 0 1 2 1 : ... : Alguna diferent. I i H H µ µ µ µ µ µ = = = = ≠
(
0, 2)
ij i ij ij y =µ +e e =N σJoan del Castillo
Concentracions arterials d'epinefrina
Es va mesurar en 15 animals de laboratori, dividits en tres grups sotmesos a tres tipus diferents d'anestèsia, la concentració arterial d'epinefrina en plasma sanguini (unitats en 10 nanograms).
z Es pregunta si hi ha diferències entre els tres grups al
99%.
Anestèsia-1 9 12 10 8 15
Anestèsia-2 20 21 23 17 30
Anestèsia-3 6 5 8 16 7
Joan del Castillo
Calculeu:
Volem contrastar:
Suma Promedio Varianza
Anestèsia-1 9 12 10 8 15 54 10.8 7.7 Anestèsia-2 20 21 23 17 30 111 22.2 23.7 Anestèsia-3 6 5 8 16 7 42 8.4 19.3 0 1 2 1 : ... : Alguna diferent. I i H H µ µ µ µ µ µ = = = = ≠ Promedio 13.8 16.9 .. y ≈
µ
S2≈σ2(
)
2 .. ij ij SST=∑
y −y(
1)
2 t N S = − · 3 5 15 N=I n= × =Joan del Castillo
Càlculs Anova:
2 11 12 1 1 2 21 22 2 2 2 1 2 1. 2. . Gr.1: , ,..., , Gr.2 : , ,..., , ... Gr.I : , ,..., , n n I I In I I y y y y S y y y y S y y y y S ⇒ ⇒ ⇒(
)
2 2 . 1 1 1 j i j i ij ij i y y n S y y n • − − = =∑
∑
2 2 1 13.8 1 16.9 i i i i y y I S S I • •• = = = =∑
∑
( )(
)
2 ( ) , 1 1 i j 1 ij i SSE y y I n • I n = − = −∑
− ( ) ( ) 2 2 2 2 1 1 1 1 e i t ij i ij S y y I S y y N • •• •• = − − = − − ∑ ∑Joan del Castillo
Descomposició de la variància
(
)
2(
)
2(
)
2 ij ij ij i ij ij i y −y•• = y•−y•• + y −y•∑
∑
∑
SST = SSA + SSE ( ) ( )(
)
( )(
)
( ) 2 2 2 2 2 2 Tractament (Entre) 1 Error (Dintre) 1 Total 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S SST y y N S • •• • •• = = − = − = = − = − = = − = −∑
∑
∑
Joan del Castillo
Construïu la taula de anova
/ , /
MS=SS gl F=MSA MSE
ANÁLISIS DE VARIANZA
variaciones SS g.l. MS F Fc
Tractament (A) SSA I - 1 MSA F F(I-1,I(n-1))
Error SSE I (n-1) MSE
Total SST n.I - 1 ( ) ( )
(
)
( )(
)
( ) 2 2 2 2 2 2 1 1 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S y y N S SST • •• • •• = − = − = − = − = − = −∑
∑
∑
( )(
)
2 2 2 2 2 2 1 1 1 1 1 e i i i t ij i ij S y y I S I S y y N S • •• •• = − − = = − −∑
∑
∑
Joan del Castillo
Calculeu directament
5 2 54.36 543.6 = ⋅ ⋅ = 14 53.3 746.4 = ⋅ = 3 4 16.9 202.8 = ⋅ ⋅ = ( ) ( )(
)
( )(
)
( ) 2 2 2 2 2 2 Entre 1 Dintre 1 Total 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S SST y y N S • •• • •• = = − = − = = − = − = = − = −∑
∑
∑
( )2 2 1 1 e i i S y y I • •• = − = −∑
54.36Joan del Castillo
Taules de la de Fisher
F m n(
,)
m
n
Joan del Castillo
Anova en Excel
Anestèsia-1 Anestèsia-2 Anestèsia-3
9 20 6
12 21 5
10 23 8
8 17 16
15 30 7
Joan del Castillo
Anàlisi de la variància un factor
Análisis de varianza de un factorRESUMEN
Grupos Cuenta Suma Promedio Varianza
Anestèssia-1 5 54 10.8 7.7 Anestèssia-2 5 111 22.2 23.7 Anestèssia-3 5 42 8.4 19.3
ANÁLISIS DE VARIANZA
variaciones S.cuadrados gl Promedio F p-valor V. crítico
Entre grupos 543.6 2 271.8 16.08 0.0004 3.89
Dentro de los 202.8 12 16.9 Total 746.4 14
SST =SSA SSE+ 16.08 3.89Rebutjem la igualtat de mitjanes.
F V C > ⇔ > / MS=SS gl F=MSA MSE/ MS SS
Joan del Castillo
Interpretació anova
-0.5 0 0.5 0 5 10 15 20 25 30 35 t S 1 S S2 2 1 y•−y• e SAnestèsia-1 Anestèsia-2 Anestèsia-3
9 20 6 12 21 5 10 23 8 8 17 16 15 30 7 ( )2 ( )2 2 1 2, 2 1 , 2 1 1 1 i t e i ij i ij i S S S y y S y y I N •• I • •• = = − = − − − ∑ ∑ ∑