• No se han encontrado resultados

Estadística Descriptiva. Estadística. Dades qualitatives. Dades quantitatives. Recollida d informació. Primeres nocions. Resum idees bàsiques

N/A
N/A
Protected

Academic year: 2021

Share "Estadística Descriptiva. Estadística. Dades qualitatives. Dades quantitatives. Recollida d informació. Primeres nocions. Resum idees bàsiques"

Copied!
26
0
0

Texto completo

(1)

Estadística

Resum idees bàsiques

Joan del Castillo

2008

Joan del Castillo

Estadística Descriptiva

ƒ Conjunt de tècniques per organitzar, simplificar i resumir la informació continguda en un conjunt de dades.

ƒ Les dades poden provenir de variables quantitatives o de variables categòriques.

Joan del Castillo

Dades quantitatives

- Dades continues, les que varien de forma continua, com la temperatura, la resistència elèctrica, el nivell de radiació, etc.

- Dades discretes, les que només poden prendre valors enters com per exemple el nombre d'accessos a una determinada pàgina web, etc.

Joan del Castillo

Dades qualitatives

Poden ser:

- Nominals: són una simple etiqueta com per

exemple la marca, l’estat d’un fusible (fos/no fos), etc.

- Ordinals: en les que existeix una relació de ordre

entre els possibles valors, per ex. el resultat d’una exploració qualitativa de la temperatura d’un aparell (fred, tebi, calent).

Joan del Castillo

Recollida d’informació

Codi Edat (anys) Gènere Pes Alçada Fumador

1 20 f 61 170 1 2 20 f 65 171 0 3 19 f 55 166 0 4 20 f 63 170 1 5 18 f 56 170 1 6 18 f 59 160 0 7 16 f 58 165 0 8 20 f 57 169 1 9 20 f 58 165 1 10 20 f 50 153 1 11 18 m 90 171 1 12 18 m 60 168 1 13 19 m 61 172 1 14 22 m 72 187 0 15 21 m 65 170 0

Joan del Castillo

Primeres nocions

ƒ Matriu de dades

z Casos (files) i Variables (columnes). z Mida de la mostra = nombre de files = n.

ƒ Classes de variables:

z Discretes i Contínues. z Qualitatives i Quantitatives.

ƒ Variables discretes:

z Gènere, tabac, color del cabell, nombre de parts,...

ƒ Variables contínues:

(2)

Joan del Castillo

Descripció de variables:

ƒ Variables contínues i quantitatives:

z Exemples: Colesterol en sang, pes, alçada,... z Descripció: mitjanes, variància i desviacions.

ƒ Variables discretes:

z Exemples: Gènere, tabac, color del cabell,

nombre de parts,...

z Descripció: freqüències relatives.

Joan del Castillo

Descripció. Variables discretes

ƒ Notació

z n = Tamany de mostra.

z A una propietat, x, y = Variables.

ƒ Freqüencies absolutes:

z Nombre de casos amb una propietat.

ƒ Freqüencies relatives:

z Nombre de casos amb una propietat dividit pel

nombre total de casos.

( ) f A

( ) F A

Joan del Castillo

Enumeració dels elements

{

}

{

}

{

}

{

}

{

}

11,12,13,14,15 1, 2,3, 4,5,6,7,8,9,10 1, 4,5,8,9,10,11,12,13 2,3,6,7,14,15 1, 2,3,...,14,15 H D F NF = = = = Ω =

Joan del Castillo

Unió i Intesecció de conjunts

ƒ Intersecció: z Homes i fumadors z Dones i fumadores ƒ Unió: z Homes o fumadors z Homes o no fumadors

{

}

{

}

11,12,13 1, 4,5,8,9,10 H F D F ∩ = ∩ =

{

}

{

}

1, 4,5,8,9,10,11,12,13,14,15 2,3,6, 7,11,12,13,14,15 H F H NF ∪ = ∪ =

Joan del Castillo

Freqüencies relatives

( ) ( )( ) { } ( ) ( )( ) { } 11,12,13,14,15 5 0.33 15 15 2,3, 6, 7,14,15 6 40% 15 15 F H F f H F F NF F f NF F = = = = Ω = = = = Ω

Joan del Castillo

Representació gràfica

ƒ Variables discretes (marginals).

Homes Dones 0 2 4 6 8 10 Homes Dones

(3)

Joan del Castillo

Representació gràfica

ƒ Dues variables discretes

0 1 2 3 4 5 6 Homes Dones Fumadors No fumadors

Joan del Castillo

Descripció de dades quantitatives

ƒ Mesures de localització.

z Mitjana i mediana. z Quantils.

ƒ Mesures de dispersió.

z Desviació estàndard. Variància. z Rang. Rang interquartil.

ƒ Mesures de forma.

z Biaix (sesgo). z Curtosi.

Joan del Castillo

Descripció:Variables Quantitatives

ƒ Mitjana ƒ Variància ƒ Desviació estàndard 1 1 n i i x x n = =

(

)

2 2 1 1 1 n i i S x x n = = − −

(

)

2 1 1 1 n i i S x x n = = − −

Joan del Castillo

Mediana

Com es calcula:

ƒ Ordenar les dades de més petit a més gran. -Si el nombre de dades és senar, la mediana és la dada que està en el mig.

- Si el nombre és parell, és la mitjana dels dos valors centrals.

La mediana és “robusta” davant la presència de outliers.

{ } { }

Mediana (m): f xim =f xim

Joan del Castillo

Quartils

Mínim Quartil 1 Màxim

q1 Quartil 2 Mediana Quartil 3 q3 q2 25% 25% 25% 25% 25% 75% 25% 75%

Joan del Castillo

Rang

És la diferència entre els valors observats més gran i més petit: R = xmáx– xmín

- conserva les unitats de mesura de les dades originals.

- valors petits indiquen una menor dispersió.

- es veu extraordinàriament afectada pels valors

extrems (outliers).

(4)

Joan del Castillo

Descriptiva variables contínues

ƒ Posició ƒ Dispersió ƒ Forma ƒ Extrems Alçada (cm) Media 170.35 Mediana 170 Moda 170 Desviación estándar 9.80 Varianza de la muestra 96.12 Curtosis 5.20 Coeficiente de asimetría -0.96 Rango 102 Mínimo 97 Máximo 199 Suma 158594 Cuenta 931

Joan del Castillo

Histograma

ƒ Classifiquem les observacions Classes Frecuencia 145 12 155 33 165 244 175 379 185 223 195 39 y mayor... 1

Joan del Castillo

Representació de les freqüències

Histograma 0 50 100 150 200 250 145 150 155 160 165 170 175 180 185 190 195 y ma yor.. . Alçades Fr e cue n ci a Alçada

Joan del Castillo

La llei dels errors

ƒ Distribució normal de probabilitats

0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 0,450 -5 -4 -3 -2 -1 0 1 2 3 4 5 95% ( ) 1 exp 2 2 2 x f x π   =   1.96 − 1.96

Joan del Castillo

Distribucions Normals

ƒ Són les que tenen funció de densitat

z on z Si aleshores

( )

1 exp 1 2 2 2 x f x µ σ πσ   = −    , x S µ= σ =

(

, 2

)

N µ σ 0, 1 µ= σ = N

( )

0,1

Joan del Castillo

Tendència i errors de dispersió

ƒ Tendència central ƒ Dispersió σ=0.75, 1, 2. 0. µ= -0.100 0.000 0.100 0.200 0.300 0.400 0.500 0.600 -8 -6 -4 -2 0 2 4 6 8

(5)

Joan del Castillo

Classificació i histogrames

ƒ Sota condicions “normals”

z El 95% de les observacions d’una variable

contínua es troben separades com a màxim dues desviacions de la mitjana.

1.96

x x− ≤ S

Joan del Castillo

Que és un fet estrany ?

ƒ Estrany, estadísticament:

z Allò que passa un 1 cop de cada 20. z

ƒ Molt estrany:

z Allò que passa un 1 cop de cada 100. z

ƒ Si no és estrany en direm “normal”.

1/ 20 0.05

p= =

1/100 0.01

p= =

Joan del Castillo

Estudi de dues variables

ƒ Dues variables contínues:

z Recta de regressió.

ƒ Dues variables discretes:

z Taules de contingència. z Test Xi-quadrat de Pearson.

ƒ Una discreta i una contínua:

z Proves t de comparació de grups. z Anàlisi de la variància.

Joan del Castillo

Estadística bivariant

ƒ Mitjanes ƒ Variàncies ƒ Covariància 1 1 , n i i x x n = =

1 1 n i i y y n = =

(

)

2 2 1 1 1 n x i i S x x n = = − −

(

)

2 2 1 1 1 n y i i S y y n = = − −

(

)(

)

1 1 1 n xy i i i S x x y y n = = − − −

Joan del Castillo

Covariància i correlació

ƒ Covariància

ƒ Coeficient de correlació i determinació

(

)(

)

1 1 1 n xy i i i S x x y y n = = − − −

xy x y S r S S = No tenen unitats 2

r

Joan del Castillo

Recta de regressió

ƒ Equació de la recta

ƒ Coeficients:

ƒ Coeficient de correlació y de determinació

y a b x

= +

2, xy x S b a y b x S = = − xy x y S r S S = → 0r21 Xm 168,47 Ym 62,00 Sx 7,17 Sy 9,27 Sxy 36,43

(6)

Joan del Castillo

Relació pes i alçada

Recta de regressió 0 20 40 60 80 100 120 150 160 170 180 190 200 Alçada (cm) P es ( K g ) -76,9 0,82 y= + x

Joan del Castillo

Probabilitat

ƒ Lleis de la probabilitat: z 1 z 2 z 3 z 4 z 5

( )

( )

n f AP A ( ) ( ) ( ) ( ) ( ) ( ) ( )

( )

( ) ( )

( )

( ) 0, 1, 0. 1 P A P P P A B P A P B P A B P A P A P A C P A C P C ≥ Ω = ∅ = ∪ = + − ∩ = − ∩ = ( ) ( ) ( ) si i son independents P A B∩ =P A P B A B

Joan del Castillo

Freqüències relatives

ƒ Tabac

Codi FumadAcum F. Relat

1 1 1 1.000 2 0 1 0.500 3 0 1 0.333 4 1 2 0.500 5 1 3 0.600 6 0 3 0.500 7 0 3 0.429 8 1 4 0.500 9 1 5 0.556 10 1 6 0.600 11 1 7 0.636 12 1 8 0.667 13 1 9 0.692 14 0 9 0.643 15 0 9 0.600 Fre. Relativa 0.000 0.200 0.400 0.600 0.800 1.000 1.200 0 2 4 6 8 10 12 14 16 Evolució de la freqüencia relativa del fumadors (Tabac)

Joan del Castillo

Límit de les freqüències

ƒ Freqüència de fumadors en una mostra de 931 persones Freq_relativa 0.000 0.200 0.400 0.600 0.800 1.000 1.200 0 100 200 300 400 500 600 700 800 900 1000

Joan del Castillo

Hi ha relació gènere-Tabac ?

Homes Dones Total

Fumador 217 200 417 No_Fuma 244 270 514 Total 461 470 931

(

)

( ( ) )

(

)

( ( ) ) 217 0.471 461 200 0.426 470 f H F f F H f H f F D f F D f D ∩ = = = ∩ = = =

Joan del Castillo

Comparem les dues taules

Esperats Homes Dones Total Fumador 206.48 210.52 417 No_Fuma 254.52 259.48 514

Total 461 470 931

Observats Homes Dones Total

Fumador 217 200 417

No_Fuma 244 270 514

(7)

Joan del Castillo

Test X

2 n

de Pearson

(

)

2 2 , 1 3.84 ij ij i j ij E O E = − ≤

Un dels 20 descobriments més importants del Segle XX

En el 95% dels casos, si hi ha independència

2 1.96 =

Joan del Castillo

No hi ha evidència de diferencies

Observat Esperat X2 217 206.48 0.54 244 254.52 0.43 200 210.52 0.53 270 259.48 0.43 p-valor = 0.1657 1.92

(

)

2 2 , 1 1.92 3.84 ij ij ns i j ij E O E = − = ≤

Joan del Castillo

Podem controlar l’Atzar

ƒ Sabem mesurar la variabilitat produïda per atzar.

ƒ Podem fixar un nivell de confiança per a les nostres afirmacions.

z En biologia el nivell habitual és: 95% - 99%.

ƒ És possible saber la veritat i és fàcil detectar errors i falsedats.

Joan del Castillo

Proves diagnòstiques

(

)

Sensibilitat P DP M per descartar (no detectar greu)

Malaltia Salud

Diag. Positiu Ver. Positiu Fals Positiu

Diag. Negatiu Fals Negatiu Ver. Negatiu

(

)

Especificitat P DN S confirmar (diagnostic fals greu)

Estadística

Variables aleatòries discretes

Joan del Castillo

2008

Joan del Castillo

Variables aleatòries

ƒ Una variable aleatòria, X, representa el resultat numèric d’un experiment aleatori.

z El resultat d’un dau.

z L’alçada d’una persona, escollida al atzar. z Els valors 1 o 0 segons si la persona fuma.

ƒ Analitzarem models simples, per tal d’introduir els conceptes d’esperançai

(8)

Joan del Castillo

Esperança d’un model arbitrari

ƒ Valors i probabilitats: ƒ Valor esperat: ƒ Interpretació: 1 1 2 2 ... ... n n v p v p X v p =

[ ]

1 1 2 2 ... n n E X = ⋅ + ⋅v p v p + + ⋅v p

[ ]

n

x

E x

Joan del Castillo

Propietats de les mitjanes

ƒ La mitjana de la suma és suma de mitjanes.

ƒ Si multipliquem les dades per una constant, la mitjana també es multiplica.

( ) 1 1 1 1 n 1 n 1 n i i i i i i i x y x y n = n = n = + = +

1 1 1 n 1 n i i i i a x a x a x n = n = = =

Joan del Castillo

Propietats de l’Esperança

ƒ L’esperança de la suma és la suma

d’esperances.

ƒ Si multipliquem per una constant, la esperança també es multiplica.

[

]

[ ] [ ]

1. E X Y

+

=

E X

+

E Y

[

]

[ ]

2. E a X

=

a E X

[ ]

n

x

E x

Joan del Castillo

Distribució de Bernoulli

ƒ X pot prendre els valors 1, 0 amb

probabilitats p i (1-p).

ƒ Quan p = ½, és el model del llançament d’una moneda. 1 0 1 p X p = −

Joan del Castillo

Valor esperat d’una Bernoulli

ƒ Suposem X amb distribució:

ƒ El valor esperat és: 1 0 1 p X p = −

[ ]

1 0 1

(

)

E X = ⋅ + ⋅ −p p = p

Joan del Castillo

Distribució Binomial

ƒ Anomenem B el nombre d’èxits, en n proves. La probabilitat d’obtenir k èxits és:

ƒ on

{

}

n k

(

1

)

n k P B k p p k −   = =  −  

(

!

)

! ! n n k k n k  =    

(9)

Joan del Castillo

Valor esperat d’una Binomial

ƒ Suposem X amb distribució:

ƒ Sigui ƒ El valor esperat de B és: 1 0 1 p X p = −

[ ]

[ ]

i E B =n E X =n p 1 n i i B X = =

Joan del Castillo

Evolució de la mitjana

ƒ Calculem la mitjana en 5 sèries de 250 llançaments d’un dau.

[ ]

3.5 n xE x = 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 113 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193 205 217 229 241

[ ]

V X 3.5 →

Joan del Castillo

Variància d’un model arbitrari

ƒ Valors i probabilitats: Interpretació de la variància: Definició: 1 1 2 2 ... ... n n v p v p X v p =

(

)

2

[ ]

2 2 1 1 1 n 1 n i i i i x x x x V X n = n = − = − →

[ ]

2

[ ]

2 V X =E XE X

Joan del Castillo

Càlcul de la variància

1 1 2 2 ... ... n n v p v p X v p = [ ] 2 [ ]2 V X =E XE X 2 1 1 2 2 2 2 2 ... ... n n v p v p X v p =

[ ]

1 1 2 2 ... n n E X = ⋅ + ⋅v p v p + + ⋅v p 2 2 2 2 1 1 2 2 ... n n E X  = ⋅ + ⋅ v p v p + + ⋅v p

Joan del Castillo

Variància d’una Bernoulli

ƒ Valor esperat: ƒ Variància: 1 0 1 p X p = − 2 2 2 1 0 1 p X p = −

[ ]

1 0 1

(

)

E X = ⋅ + ⋅ −p p =

[ ]

2

[ ]

2 V X =E XE X =p p 2= p

(

1 p

)

2 E X  = p

Joan del Castillo

Propietats de les variàncies

(

)

2 2 2 1 1 1 n 1 n i i i i x x x x n = n = − = −

La variancia es pot calcular com la mitjana dels quadrats menys el quadrat de la mitjana

Si multipliquem les dades per una constant, la variancia es multiplica pel quadrat.

(

)

2 2

(

)

2 1 1 1 n 1 n i i i i a x a x a x x n = n = − = −

(10)

Joan del Castillo

Propietats de les variàncies

ƒ La variància de la suma de variables és la suma de variàncies més dues vegades la covariància.

(

)(

)

1 2 n i i i x x y y n = +

− −

(

) (

)

(

)

2 1 1 n i i i x y x y n = + − +

(

)

2

(

)

2 1 1 1 n 1 n i i i i x x y y n = n = =

− +

− +

ƒPer a variables independents:

(

)(

)

1 1 n 0 i i i x x y y n = − − →

Joan del Castillo

Propietats de la Variància

ƒ La variància de la suma o diferència de

variables independents és suma de variàncies.

ƒ Si multipliquem per una constant, la variància es multiplica pel quadrat.

[

]

[ ] [ ]

1. V X Y

±

=

V X

+

V Y

[

]

2

[ ]

2. V a X

=

a V X

Joan del Castillo

Moments d’una Bernoulli

ƒ Valor esperat: ƒ Variància: 1 0 1 p X p = − 2 2 2 1 0 1 p X p = −

[ ]

1 0 1

(

)

2 E X = ⋅ + ⋅ −p p =E X=p

[ ]

2

[ ]

2 V X =E XE X =p p 2= p

(

1 p

)

Joan del Castillo

Moments d’una Binomial

ƒ Suposem X amb distribució:

ƒ Sigui

ƒ El valor esperat i la variància de B són:

1 0 1 p X p = −

[ ]

[ ]

i E B =n E X =n p 1 n i i B X = =

B B n p

(

,

)

[ ]

[ ]

i

(

1

)

V B =n V X =n pp

Joan del Castillo

Mostra i Població

ƒ Mitjana ƒ Variància mostral ƒ Esperança ƒ Variància teòrica 1 1 n n i i x x n = =

E x

[ ]

=

v pk k ( )2 2 1 1 1 n n i i S x x n = = − −

[ ]

[ ]

2 2 V X =E XE X

[ ]

n xE x

[ ]

2 n SV x

• Llei dels grans nombres:

( )

( )

n

f AP A

Joan del Castillo

Funcions de distribució

ƒ Sigui X una variable qualsevol. Anomenem

funció de distribució(funció de probabilitat

acumulada) a

ƒ Aleshores calculem probabilitats

{

}

( )

( )

P a X

<

b

=

F b

F a

( )

P

{

}

(11)

Joan del Castillo

Distribució Binomial

ƒ Nombre d’èxits en n = 10 proves (p = 0.5)

Valors P(k) F(k) 0 0.001 0.001 1 0.010 0.011 2 0.044 0.055 3 0.117 0.172 4 0.205 0.377 5 0.246 0.623 6 0.205 0.828 7 0.117 0.945 8 0.044 0.989 9 0.010 0.999 10 0.001 1.000

Joan del Castillo

Probabilitats Binomial ( n = 10)

Binomial 0.000 0.050 0.100 0.150 0.200 0.250 0.300 0 2 4 6 8 10 Exits P ro b a b ilit a ts

Joan del Castillo

Probabilitats acumulades

0.00000 0.20000 0.40000 0.60000 0.80000 1.00000 1.20000 0 2 4 6 8 10 12

( )

P

{

}

F x

=

X

x

Joan del Castillo

Propietats funció de distribució

{

}

( )

( )

4. P a X b< ≤ =F bF a

( )

{

}

1.

F x

=

P

X

x

, es creixent.

( )

2. lim

x

F x

=

1

( )

3. lim

x

F x

=

0

Joan del Castillo

Variables aleatòries contínues

ƒ Si X és una variable contínua, la funció de distribució és derivable

ƒ Anomenen funció de densitata la derivada:

ƒ La densitat representa el límit dels histogrames.

( )

'

( )

f x

=

F x

( )

P

{

}

F x

=

X

x

Estadística

Distribució Normal

Joan del Castillo

(12)

Joan del Castillo

Variables aleatòries contínues

ƒ Si X és una variable contínua, la funció de distribució és derivable

ƒ Anomenen funció de densitata la derivada:

ƒ La densitat representa el límit dels histogrames.

( )

'

( )

f x

=

F x

( )

P

{

}

F x

=

X

x

Joan del Castillo

Variables continues

ƒ Són equivalents

ƒ i

ƒ Les dues ens diuen que

{

}

( )

( )

P

b

( )

a

a

<

X

b

=

f x dx F b

=

F a

( )

( )

'

F x

=

f x

{

}

( )

x

( )

P X

x

F x

f t dt

−∞

=

=

Joan del Castillo

Propietats funció de densitat

( )

4. ∞ f x dx 1. −∞ =

( )

1.

f x

0.

( )

( )

2. lim

x

f x

=

lim

x

f x

=

0.

{

}

( )

3. P b a a X b< ≤ =

f x dx

Joan del Castillo

Normal estàndard

ƒ Distribució normal de probabilitats

0.000 0.050 0.100 0.150 0.200 0.250 0.300 0.350 0.400 0.450 -5 -4 -3 -2 -1 0 1 2 3 4 5 ( ) 1 exp 2 2 2 x f x π   =  

( )

f x

Joan del Castillo

Estandardització

ƒ Proposició: Utilitzant variables normals, sempre ens podem reduir a la normal N(0,1)

ƒ Anomenarem a la funció de distribució de la N(0,1). 2

( ,

)

X

(0,1)

X

N

µ σ

Z

µ

N

σ

⇔ =

( )

x φ

Joan del Castillo

Exemple

ƒ Calculem: zon

{

}

P 160<X≤170 160 X 170 P µ µ µ σ σ σ − − −   =  < ≤    170.35, 9.80 µ= σ=

{

1.06 0.04

}

P Z = − < ≤ − 0.04 1.06

f x dx

z

( )

− −

=

=

φ

(

−0.04

) (

− −

φ

1.06

)

(0,1)

Z

N

0.338 = 0.484 0.146 = −

(13)

Joan del Castillo

Funció de distribució de N(0,1)

x f(x) F(x) -3.50 0.001 0.0002 -3.00 0.004 0.0013 -2.50 0.018 0.0062 -2.00 0.054 0.0228 -1.50 0.130 0.0668 -1.00 0.242 0.1587 -0.50 0.352 0.3085 0.00 0.399 0.5000 0.50 0.352 0.6915 1.00 0.242 0.8413 1.50 0.130 0.9332 2.00 0.054 0.9772 2.50 0.018 0.9938 3.00 0.004 0.9987 3.50 0.001 0.9998 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00

( )

x φ

Joan del Castillo

La distribució normal

ƒ Apareix en molts fenòmens reals. Histogrames.

ƒ Encara que alguna variable no segueixi la distribució normal, les sumes es comporten segons la distribució normal.

ƒ Moltes característiques són el resultat de la suma de petits factors independents.

ƒ Valors esperats d’una normal

0.000 0.050 0.100 0.150 0.200 0.250 0.300 0.350 0.400 0.450 -5 -4 -3 -2 -1 0 1 2 3 4 5 2 ( , ) XN µ σ

[ ]

[ ]

2 E X V X µ σ  =  ⇒  = 

Joan del Castillo

Teorema central del límit

ƒ 1. Combinacions lineals de normals són

normals.

ƒ 2. La suma de normals independents és normal.

ƒ 3. TCL: La suma de variables independents de qualsevol tipus és aproximadament normal.

a X

+

b

1 2

...

n

X

+

X

+ +

X

Joan del Castillo

Les rèpliques disminueixen

l’error

ƒ X és una variable on

z és el valor mitjà z desviació de la mostra

ƒ Fem la mitjana de n observacions

zEl valor esperat és zDesviació de la mitjana µ σ

[ ]

Sd x =

[ ]

E x

[ ]

Sd x =σ 1 i x x n =

[ ]

E xn σ

[ ]

2 V x n σ =

Joan del Castillo

Teorema central del límit

ƒ Sigui X una variable qualsevol amb

z el valor esperat z la variància

z Fem la mitjana de n observacions

ƒ Teorema z La distribució de és µ 2 σ

[ ]

E x

[ ]

2 V x =σ 1 i x x n =

x 2 ( , ) x N n σ µ ≈

Joan del Castillo

Apliquem el TCL a la Binomial

ƒ Sigui B una variable Binomial.

zSabem que és suma de Bernoullis zL’esperança és zLa variància és ƒ Teorema. zon zsempre que

[ ]

E B =n p

[ ]

(1 ) 2 V B =n pp =σ 1 n i i B X = =

2 ( , ) ( , ) B n pN µ σ

(

)

2 , 1 n p n p p µ= σ = −

(

1

)

10 n pp

(

)

Si n p 1−p ≥5, amb correccions.

(14)

Joan del Castillo

Exemple

ƒ Hem fet una enquesta a 80 persones. Si la mostra ha estat escollida a l’atzar, quina és la probabilitat d’entrevistar més de 25 dones ?

ƒ El model correspon a una Binomial amb

(

1

)

n pp =

(

,

)

B B n p≈ 80, 0.5 n= p= 80 0.5 0.5 20 10⋅ ⋅ = ≥ 2

Podem aproximar per una XN( ,µ σ )

2

40, (1 ) 20

n p n p p

µ= = σ = − =

Joan del Castillo

Exemple

Podem aproximar per una XN( ,µ σ2)

{

25

}

{

25 ,

}

P B> ≈P X > µ=40, σ2=20

{

25

}

1

{

25

}

P X> = −P X

{

25

}

X 25 P X P µ µ σ σ − −   ≤ =   =P Z

{

≤ −3.35

}

(

3.35

)

1

(

3.35

)

φ φ = − = − = −1 0.999

(

)

1 1 0.999 0.999 = − − =

Joan del Castillo

Valors crítics amb error 0.05

ƒ Calculeu per a de manera

que: ƒ Aleshores

{

1 2

}

( ) ( )

2 1 0.95 P z < ≤Z z =

φ

z

φ

z =

( )

z2 P Z

{

z2

}

0.975

φ

= ≤ =

( )

z1 P Z

{

z1

}

0.025

φ

= ≤ = 1, 2 z z ZN(0,1)

Joan del Castillo

La llei dels errors

ƒ Distribució normal de probabilitats

0,000 0,050 0,100 0,150 0,200 0,250 0,300 0,350 0,400 0,450 -5 -4 -3 -2 -1 0 1 2 3 4 5 2 1 exp 2 2 x π   −     95% 1 z z2 0.025 0.025

( )

z2 0.975 φ = 1 2 z = −z

Joan del Castillo

Valors crítics de la N(0,1)

x f(x) F(x) -3.50 0.001 0.0002 -3.00 0.004 0.0013 -2.50 0.018 0.0062 -2.00 0.054 0.0228 -1.50 0.130 0.0668 -1.00 0.242 0.1587 -0.50 0.352 0.3085 0.00 0.399 0.5000 0.50 0.352 0.6915 1.00 0.242 0.8413 1.50 0.130 0.9332 2.00 0.054 0.9772 2.50 0.018 0.9938 3.00 0.004 0.9987 3.50 0.001 0.9998 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00

(

)

1 0.975 1.96 φ− =

( )

1 zα φ α− =

(

)

1 0.025 1.96 φ− = − 0.975

Joan del Castillo

Normal segons la variància

ƒ Tendència central ƒ Dispersió σ=0.75, 1, 2. 0. µ= -0.100 0.000 0.100 0.200 0.300 0.400 0.500 0.600 -8 -6 -4 -2 0 2 4 6 8

(15)

Joan del Castillo

Valors crítics

ƒ Suposem una

z És prou gran per aproximar per la Normal. z No cal fer correcció de Yates.

ƒ Volem determinar tals que

(300,0.5) B B

{

1 2

}

0.95 P b ≤ ≤B b = 1, 2 b b

Joan del Castillo

Aproximem per la Normal

ƒ La Binomial es pot

aproximar per la normal amb

(300,0.5) B B

(

)

2 150, 1 75 n p n p p µ= = σ = − =

(300,0.5)

(150,75)

B B

X

N

Joan del Castillo

Estandarditzem

ƒ Determinar: z on

{

1 2

}

P bXb =0.95 1 2 b X b P µ µ µ σ σ σ − − −   =  < ≤    2 150, 75 µ= σ =

{

1 2

}

0.95 P z Z z = < ≤ = 1 1 150 75 b z = −

(0,1)

Z

N

2 2 150 75 b z = − 1.96 = − =1.96 1 133, 2 167 b = b =

Joan del Castillo

Conseqüències de la simetria

ƒ La simetria de la N(0,1) ens dona:

ƒ Pels valors crítics, la simetria ens dona:

( )

x 1

( )

x φ − = −φ

( )

(

)

1 1 1 φ α− = −φ− α 1 zα zα ⇒ = −

Joan del Castillo

Valors crítics N(0,1)

ƒ Els valors crítics més usuals són:

1 p p z = −zp-valor Zp 0.025 -1.960 0.975 1.960 0.05 -1.645 0.95 1.645 0.005 -2.576 0.995 2.576 0.01 -2.326 0.99 2.326 0.10 -1.282 0.90 1.282

( )

1 p p z φ− =

Joan del Castillo

Aprox. Normal de les freqüències

ƒ Per a la freqüència relativa

tenim l’aproximació: / f =B n

(

, (1 ) /

)

fN p pp n

(

)

Sempre que: n p 1−p ≥10

L'Estandarització ens dona:

(0,1) (1 ) / (1 ) f p f p n N p p n p p= − −

(16)

Joan del Castillo

Precisió en les enquestes

ƒ Suposem que fem 50 enquestes amb probabilitat 0.4 d’observar un esdeveniment (α = 0.05).

[ ]

0.4 E f =

[ ]

V f = 1.96 0.048 0.1358 error= × =

(

)

(

)

inter.freq.= 0.4 0.136,0.4 0.136− + = 0.26,0.54

(

0.4 0.6 / 50 0.0048×

)

=

Joan del Castillo

Precisió en les enquestes

ƒ Suposem que fem 2000 enquestes amb probabilitat 0.4 d’observar un esdeveniment (α = 0.05).

[ ]

0.4 E f = [ ] (0.4 0.6 / 2000 0.00012) V B = × = 1.96 0.00012 0.0215 error= × =

(

)

(

)

inter.freq.= 0.4 0.022,0.4 0.022− + = 0.38,0.42

Joan del Castillo

Intervals per a freqüències

( )

Amb confiança 1-α , o error α (0,1) (1 ) f p n N p p − ≈ − / 2 1 / 2 (1 ) f p z n z p p α −α − ≤ ≤ − 1 (1 ) f p n z p p −α − ≤ − (1 ) f p z n p p α − ≤ −

Joan del Castillo

Intervals per a proporcions

( )

Amb confiança 1-α , o error α (0,1) (1 ) / N f f n p f ≈ − − 1 / 2 1 / 2 (1 ) / z z f f n p f α α − − − ≤ − − ≤ 1 (1 ) / z f f n p f α − ≤ − − 1 (1 ) / p f z f f n α − − ≤ − −

Joan del Castillo

Distribucions derivades de N(0,1)

ƒ Distribució Xi-quadrat. ƒ Distribució d’Student. ƒ Distribució de Fisher. n

t

2 n

χ

(

,

)

F m n

Joan del Castillo

Distribució Xi-quadrat

ƒ Suposem que tenim n normals N(0,1) independents:

ƒ Considerem:

ƒ Direm que Ch té distribució:

2 n

Ch

χ

1

,

2

,...,

n

(0,1)

Z Z

Z

N

2 2 2 1 2

...

n

Ch Z

=

+

Z

+ +

Z

2 n

χ

(17)

Joan del Castillo

Densitat d’una distribució

0 0.04 0.08 0.12 0.16 0.2 0 5 10 15 20 25 2 n

χ

( )

f x 0.05 1 c 0.05 Valors crítics

Joan del Castillo

Distribució d’Student

ƒ Suposem que tenim n+1 normals N(0,1) independents: ƒ Considerem: 0

, ,

1 2

,...,

n

(0,1)

Z Z Z

Z

N

0 2 2 2 1 2

,

...

n

Z

Ch Z

=

+

Z

+ +

Z

Joan del Castillo

Distribució d’Student

ƒ Direm que

té distribució d’Student amb n graus de llibertat: n

t

0

/

Z

T

Ch n

=

n

T

t

n

t

Joan del Castillo

Distribució F de Fisher

ƒ Suposem que tenim:

ƒ Aleshores: té distribució 2 2 2 2 1 2 2 2 2 2 1 2 ( ) ... ( ) ... m m n n Ch m Z Z Z Ch n Z Z Z χ χ = + + + ≈ = + + + ≈

( )

( )

// Ch m m F Ch n n =

(

,

)

FF m n

Joan del Castillo

Taules de la de Fisher

F m n

(

,

)

m

n

Joan del Castillo

Observacions

ƒ 1. Una és sempre positiva.

ƒ 2. Una és simètrica.

ƒ 3. El quadrat d’una és una

2 n

χ

n

t

n

t

F

( )

1,n

( )

( )

( )

( )

2 2 0 0 1 /1 / / / Ch Z Z Ch n n Ch n n Ch n n     = =     0 / Z Ch n

(18)

Estadística

Inferència

Joan del Castillo 2008

Joan del Castillo

Intervals de confiança

ƒ Intervals per als paràmetres (desconeguts).

ƒ Interval per a la mitjana amb variància coneguda.

ƒ Teorema de Fisher.

ƒ Interval de confiança per a la variància.

ƒ Interval de confiança per a la mitjana, sense conèixer la variància.

2

( , )

x N≈ µ σ

Joan del Castillo

Teorema de Fisher

ƒ 1. ƒ 2. ƒ 3. 2 2 2 1 2 2 ( ) ( 1) i n x x n S χ σ σ − − − =

1 / n x t S n µ − − (0,1) / x N n µ σ − 2 ( , ) x N n

σ

µ

⇔ ≈ ( )2 2 1 1 1 n i i S x x n = = −

− ∑ Joan del Castillo

Exemple:

ƒ Suposem que en una mostra de pesos de 25 persones la desviació resulta S = 12.5, entre quins valors està la veritable σ, amb una confiança del 99% ? 0.01, α = ⇒ 0.005, 1 0.995 2 2 α = − =α

(

)

(

)

2 24 2 24 0.005 9.89 0.995 45.56 χ χ = = 9.89 45.56 a b → = → =

Joan del Castillo

Densitat d’una distribució

0 0.04 0.08 0.12 0.16 0.2 0 5 10 15 20 25 2 n

χ

( )

f x 0.005 b 0.005 Valors crítics a 0.99

Joan del Castillo

Intervals de confiança per a

ƒ Fisher (2) ens diu: 2 2 1 2 ( i ) n x x χ σ − − ≈

2 σ

(

)

Fixem un marge d'error: α 0.05 0.01−

(

)

Tindrem un nivell de confiança de 1−α

2 1

Busquem els valors crítics: a≤χn− ≤b 2 2 (xi x) a b σ − ≤

(19)

Joan del Castillo

Intervals de confiança per a

ƒ Utilitzant: ƒ Tenim: ƒ Equivalentment: 2 σ 2 2 2 (xi x) (xi x) b σ a − − ≤ ≤

2 2 (xi x) (xi x) b σ a − − ≤ ≤

2 1 n a≤χ − ≤b

Joan del Castillo

Exemple

ƒ Tenim que: ƒ Aleshores: ƒ Finalment

{

2

}

24 9.89 45.56 0.99 P ≤χ ≤ = 2 2 2 ( ) ( ) 45.56 9.89 i i xx σ xx ≤ ≤

( ) ( ) 24 2 24 0.995 45.56 b=χ = 9. 0724≤ ≤

σ

19. 472

Joan del Castillo

Interval per a amb desconeguda

ƒ Fisher (3) ens diu:

ƒ Fixem un marge d’error:

ƒ Tindrem un nivell de confiança de

ƒ Busquem els valors crítics:

(

0.05 0.01

)

α −

(

1−α

) (

0.95 0.99−

)

1 n x n t S µ − − ≈ x a n b S µ − ≤ ≤

σ

µ

Joan del Castillo

Intervals de confiança per a

ƒ Volem trobar que compleixin:

ƒ Per simetria: on ƒ Finalment: µ 1 / 2 1 / 2 S S x t x t n n α µ α − − − ≤ ≤ +

{

n1

} (

1

)

P a t≤ − ≤b = −α

( )

a b, a= −b 1 1 / 2 1 / 2 n b t α tα − − = = / 2 1 / 2 a t= α = −t−α

Joan del Castillo

Contrastos d’hipòtesis

ƒ Intervals de confiança o contrastos ?

ƒ Contrastos d’hipòtesis.

z Contrastos per a mitjanes. z Contrastos per a variàncies. z Regió d’acceptació i regió crítica. z Contrastos unilaterals i bilaterals..

Joan del Castillo

Exemple

ƒ Es tenen dades sobre 100.000 individus (servei militar) on es conclou que l'alçada mitjana era µ = 170 i la desviació σ = 10.

ƒ Es vol decidir si ha augmentat l'alçada

mitjanade la població, amb una confiança

del 95%.

ƒ Disposem d'una mostra de n = 25 individus, amb una mitjana de x=172.3

(20)

Joan del Castillo

Contrastos d’hipòtesis

ƒ El plantejament del problema porta a considerar dues hipòtesis:

z La primera o nul·laés la que pretenem rebutjar. z La segona, o alternativa, és la que creiem certa. z No contemplem la possibilitat que:

z Ens basarem en la distribució de la mitjana:

0 1 : 170 : 170 H H µ µ = > 170 µ< 2 ( , ) x N n σ µ ≈

Joan del Castillo

Contrastos d’hipòtesis

ƒ Acceptarem sempre que sigui menor que un cert valor:

ƒ Acceptarem quan .

ƒ En el segon cas direm que rebutgem la hipòtesi nul·la.

ƒ La regió d’acceptació serà:

1: 170 H µ> 0: 170 H µ= x

x b

x b

>

(

,

)

A= −∞ b

{

}

{

}

(1 ) 0.95 P xA =P x b≤ = −α =

Joan del Castillo

Densitat de:

0,00 0,05 0,10 0,15 0,20 0,25 160 165 170 175 180

(

1−α

)

2 ( , ) x N n σ µ ≈ b A x R

Joan del Castillo

Contrastos d’hipòtesis

ƒ La regió d’acceptació(de ) serà de la forma:

ƒ La regió de rebuig(de ) o regió crítica

serà de la forma: 0 H

(

,

)

A= −∞ b 0 H

(

,

)

R= =A b

{

}

{

}

(1 ) 0.95 P xA =P x b≤ = −α =

Joan del Castillo

Determinació del punt crític:

ƒ Volem trobar de manera que:

ƒ Estandarditzant:

{

}

{

}

(1 ) 0.95 P xA =P x b≤ = −α = (1 ) 0.95 x b P n µ n µ α σ σ − −  = − =     b

?

b

=

(0,1) x Z n µ N σ − = ≈

Joan del Castillo

Determinació del punt crític:

ƒ Cal resoldre: 1 1.645 b n µ z α σ − − = = 1 b z n α σ µ − = +

b

10 170 1.645 25 = +

=

173.3

(

,

) (

, 173.3

)

A= −∞ b = −∞ x=172.3∈A 0 Acceptem H :µ =170

(21)

Joan del Castillo

Contrastos per a mitjanes

ƒ Es poden presentar les situacions:

0 0 1 0 : : H H µ µ µ µ = > 0 0 1 0 : : H H µ µ µ µ = < 0 0 1 0 : : H H µ µ µ µ = ≠ 0 0 1 1 : : H H µ µ µ µ = =

x

µ

Joan del Castillo

Regions d’acceptació

ƒ Les regions d’acceptació poden ser:

(

)

( )

(

)

( )

,

,

,

0,

A

b

A

a b

A

a

A

b

= −∞

=

=

=

Una cua.

Dues cues (bilateral). Una cua.

Una cua, distribució positiva.

Joan del Castillo

Contrast sobre variàncies

ƒ En una mostra de 30 individus hem calculat una desviació estàndard de S = 12,5. Volem

decidirsi els individus pertanyen a una

població amb o a un altra amb σ =10 σ =15. 0 1 : 10 Considerem: ( 0.05) : 15 H H σ α σ =  =  =

( ) {

0,

}

A= b = S b≤ Regió d’acceptació ?

Joan del Castillo

Contrast sobre variàncies

ƒ Estadístic:

ƒ Regió d’acceptació:

ƒ Equació per determinar b:

ƒ Estandarditzem... 2 2 1 2 ( 1) n n S χ σ − −

( ) {

0,

}

A= b = S b

{

2 2

}

0.95 P Sb = 2 2 2 2 (n 1)S (n 1)b P σ σ  − −  ≤ =    

Joan del Castillo

Contrast sobre variàncies

ƒ Estandardització (suposant ):

ƒ Busquem a les taules:

{

2

}

29 1 0.95, P χ ≤chα = 2 1 1 1 2 ( 1) n n b ch−α ch−−α σ − = = 0: 10 H σ = 2 2 2 2 (n 1)S (n 1)b (1 ) 0.95 P α σ σ  − − = − =     2 2 1 2 ( 1) n n S χ σ − −

Joan del Castillo

Contrast sobre variàncies

ƒ De les taules: ƒ Regió d’acceptació: A=

( )

0,b =

{

S2b2

}

{

2 146.8

}

0.95, P S ≤ = 2 1 42.56, ch−α= b = 2 1 2 (n 1)b ch−α σ − =

{

12.1

}

0.95 P S≤ = 2 1 146.8 1 ch n ασ − = − 12.5 S= ∉A Rebutgem H0:σ =10 Tenim un 95% de confiança que =15σ

(22)

Joan del Castillo

Comparació de dos grups

ƒ Contrastos població-mostra.

ƒ Comparació de dues mitjanes:

z Mostres independents, variàncies conegudes. z Mostres independents, variàncies iguals. z Dades aparellades.

ƒ Comparació de dues variàncies.

Joan del Castillo

Comparació mitjanes de pesos

ƒ Observacions: ƒ Model: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 2 1 2 2 1 2 .1: , ,..., ( , ) .2 : , ,..., ( , ) x y n x x n y y Gr x x x N Gr y y y N µ σ µ σ ≈ ≈

Joan del Castillo

Contrastos d’hipòtesis

ƒ El plantegem el problema com a:

z Primer suposarem conegudes . z Segon, suposarem desconegudes. z Tercer, ens plantejarem contrastar:

0 1 : : y x y x H H µ µ µ µ = > i y x σ σ y x σ =σ 0: y x H σ =σ

Joan del Castillo

Distribució de l’estadístic

ƒ Calculem: ƒ Estandarditzant:

[

]

V y x− =V y

[ ] [ ]

+V x = 2 2 y x y x n n σ +σ y x µ −µ =δ

[

]

E y x− = E y

[ ] [ ]

E x =

(

)

2 2 (0,1) y x y x y x Z N n n δ σ σ − − = ≈ +

y x

Joan del Castillo

Exemple-2

ƒ Observacions: ƒ Contrasteu: suposant z Calculeu: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 0 1 : : y x y x H H µ µ µ µ = ≠ x 810 y σ σ = = y x = = 71.8 61.3 δ =10 (α =0.05)

Joan del Castillo

Comparació mitjanes de pesos

Prueba z para medias de dos muestras

Variable 1 Variable 2

Media 71.83 61.25

Varianza (conocida) 100 64

Observaciones 12 8

Diferencia hipotética de las medias 0

z 2.619

P(Z<=z) una cola 0.004

Valor crítico de z (una cola) 1.645 Valor crítico de z (dos colas) 0.009 Valor crítico de z (dos colas) 1.960

(23)

Joan del Castillo

Valor esperat de S

2

ƒ Del Teorema de Fisher:

ƒ Aleshores: 2 2 2 1 2 2 ( ) ( 1) i n x x n S χ σ σ − − − =

2 2 1 2 ( 1) 1 n n S E E χ n σ −  − = = −       2 E S  =  σ2 Estimador no-esbiaixat

Joan del Castillo

Comparació de variàncies

ƒ Sabem del Teorema de Fisher:

ƒ Aleshores: 2 2 1 2 ( 1) , x x x x n n S Ch χ σ − − = ≈ 2 2 1 2 ( 1) y y y y n n S Ch χ σ − − = ≈ 2 1, 1 2 /( 1) /( 1) x y x x x n n y y y S Ch n F S Ch n − − − = ≈ −

Joan del Castillo

Exemple:

Comparació de

Variàncies

ƒ Observacions: ƒ Contrasteu: z Calculeu: 1 2 3 4 5 6 7 8 9 10 11 12 Grup-f 65 67 67 52 62 50 70 57 Grup-m 75 70 49 73 75 110 86 70 60 58 82 54 x y S S = = y x = = 71.8 61.3 (α =0.05) 7.44 16.40 0 1 : : y x y x H H σ σ σ σ = >

Joan del Castillo

Comparació de

Variàncies

Prueba F para varianzas de dos muestras

Variable 1 Variable 2 Media 71.83 61.25 Varianza 269.06 55.36 Observaciones 12 8 Grados de libertad 11 7 F 4.86 P(F<=f) una cola 0.02

Valor crítico para F (una cola) 3.60

Joan del Castillo

Dades aparellades

ƒ Colesterol en sang abans i després d’un tractament basat en dieta i esport.

W.Daniel, 1987

Augmenta : 2

Disminueix : 10

d Y X= −

Paci. Abans (Y) Després (X)

1 201 200 2 231 236 3 221 216 4 260 233 5 228 224 6 237 216 7 326 296 8 235 195 9 240 207 10 267 247 11 284 210 12 201 209 Dif. 1 -5 5 27 4 21 30 40 33 20 74 -8

Joan del Castillo

Dades aparellades

1 d n d

d

n

t

S

µ

Considerem la diferencia: di= −yi xi, , d = −y x 2

(

)

2 1 1 1 n d i i S d d n = = − −

, d y x µ =µ −µ

(24)

Joan del Castillo

Contrastem mitjana zero

ƒ Volem contrastar en base a

0 1 : 0 : 0 d d H H µ µ = > d Y X= − 1 n x n t S µ − − ƒUna població.

ƒContrast sobre la mitjana.

ƒVariancia desconeguda. 1 d n d d n t S µ − − ⇒ ≈

Joan del Castillo

Variàncies conegudes

ƒ Suposant conegudes .σ σx, y ( ) 2 2 (0,1) y x y x y x Z N n n δ σ σ − − = ≈ +

Joan del Castillo

Variàncies iguals, desconegudes

ƒ Expressió final del Test

( ) 2 1 1 nx ny y x y x T t S n n δ + − − − = ≈ + 2 2 2 ( 1) ( 1) on ( 2) x x y y x y n S n S S n n − + − = + −

Joan del Castillo

Comparació de variàncies

ƒ Distribució del quocient:

2 1, 1 2 x y x n n y S F S ≈ − −

(

)

2 2 1 1 1 n x i i x S x x n = = − −

(

)

2 2 1 1 1 n y i i y S y y n = = − −

Estadística

Anàlisi de la variància

Joan del Castillo 2008

Joan del Castillo

Anàlisi de la variància

ƒ Model:

ƒ Un procediment per comparar mitjanes.

ƒ Hipòtesis del model:

z Variables normals. z Variàncies iguals. z Independència. 2 11 12 1 1 2 21 22 2 2 2 1 2 .1: , ,..., ( , ) .2 : , ,..., ( , ) ... . : , ,..., ( , ) n n I I In I Gr y y y N Gr y y y N Gr I y y y N µ σ µ σ µ σ ≈ ≈ ≈ 0 1 2 1 : ... : Alguna diferent. I i H H µ µ µ µ µ µ = = = = ≠

(

0, 2

)

ij i ij ij y =µ +e e =N σ

(25)

Joan del Castillo

Concentracions arterials d'epinefrina

ƒ Es va mesurar en 15 animals de laboratori, dividits en tres grups sotmesos a tres tipus diferents d'anestèsia, la concentració arterial d'epinefrina en plasma sanguini (unitats en 10 nanograms).

z Es pregunta si hi ha diferències entre els tres grups al

99%.

Anestèsia-1 9 12 10 8 15

Anestèsia-2 20 21 23 17 30

Anestèsia-3 6 5 8 16 7

Joan del Castillo

Calculeu:

ƒ Volem contrastar:

Suma Promedio Varianza

Anestèsia-1 9 12 10 8 15 54 10.8 7.7 Anestèsia-2 20 21 23 17 30 111 22.2 23.7 Anestèsia-3 6 5 8 16 7 42 8.4 19.3 0 1 2 1 : ... : Alguna diferent. I i H H µ µ µ µ µ µ = = = = ≠ Promedio 13.8 16.9 .. y

µ

S2σ2

(

)

2 .. ij ij SST=

yy

(

1

)

2 t N S = − · 3 5 15 N=I n= × =

Joan del Castillo

Càlculs Anova:

2 11 12 1 1 2 21 22 2 2 2 1 2 1. 2. . Gr.1: , ,..., , Gr.2 : , ,..., , ... Gr.I : , ,..., , n n I I In I I y y y y S y y y y S y y y y S ⇒ ⇒ ⇒

(

)

2 2 . 1 1 1 j i j i ij ij i y y n S y y n • − − = =

2 2 1 13.8 1 16.9 i i i i y y I S S I • •• = = = =

( )

(

)

2 ( ) , 1 1 i j 1 ij i SSE y y I nI n = − = −

− ( ) ( ) 2 2 2 2 1 1 1 1 e i t ij i ij S y y I S y y N • •• •• = − − = − − ∑ ∑

Joan del Castillo

Descomposició de la variància

(

)

2

(

)

2

(

)

2 ij ij ij i ij ij i yy•• = y•−y•• + yy

SST = SSA + SSE ( ) ( )

(

)

( )

(

)

( ) 2 2 2 2 2 2 Tractament (Entre) 1 Error (Dintre) 1 Total 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S SST y y N S • •• • •• = = − = − = = − = − = = − = −

Joan del Castillo

Construïu la taula de anova

/ , /

MS=SS gl F=MSA MSE

ANÁLISIS DE VARIANZA

variaciones SS g.l. MS F Fc

Tractament (A) SSA I - 1 MSA F F(I-1,I(n-1))

Error SSE I (n-1) MSE

Total SST n.I - 1 ( ) ( )

(

)

( )

(

)

( ) 2 2 2 2 2 2 1 1 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S y y N S SST • •• • •• = − = − = − = − = − = −

( )

(

)

2 2 2 2 2 2 1 1 1 1 1 e i i i t ij i ij S y y I S I S y y N S • •• •• = − − = = − −

Joan del Castillo

Calculeu directament

5 2 54.36 543.6 = ⋅ ⋅ = 14 53.3 746.4 = ⋅ = 3 4 16.9 202.8 = ⋅ ⋅ = ( ) ( )

(

)

( )

(

)

( ) 2 2 2 2 2 2 Entre 1 Dintre 1 Total 1 e i ij t ij i ij i ij SSA n y y n I S SSE y y I n S SST y y N S • •• • •• = = − = − = = − = − = = − = −

( )2 2 1 1 e i i S y y I • •• = − = −

54.36

(26)

Joan del Castillo

Taules de la de Fisher

F m n

(

,

)

m

n

Joan del Castillo

Anova en Excel

Anestèsia-1 Anestèsia-2 Anestèsia-3

9 20 6

12 21 5

10 23 8

8 17 16

15 30 7

Joan del Castillo

Anàlisi de la variància un factor

Análisis de varianza de un factor

RESUMEN

Grupos Cuenta Suma Promedio Varianza

Anestèssia-1 5 54 10.8 7.7 Anestèssia-2 5 111 22.2 23.7 Anestèssia-3 5 42 8.4 19.3

ANÁLISIS DE VARIANZA

variaciones S.cuadrados gl Promedio F p-valor V. crítico

Entre grupos 543.6 2 271.8 16.08 0.0004 3.89

Dentro de los 202.8 12 16.9 Total 746.4 14

SST =SSA SSE+ 16.08 3.89Rebutjem la igualtat de mitjanes.

F V C > ⇔ > / MS=SS gl F=MSA MSE/ MS SS

Joan del Castillo

Interpretació anova

-0.5 0 0.5 0 5 10 15 20 25 30 35 t S 1 S S2 2 1 y•−ye S

Anestèsia-1 Anestèsia-2 Anestèsia-3

9 20 6 12 21 5 10 23 8 8 17 16 15 30 7 ( )2 ( )2 2 1 2, 2 1 , 2 1 1 1 i t e i ij i ij i S S S y y S y y I N •• I • •• = = − = − − − ∑ ∑ ∑

Referencias

Documento similar

Per executar el codi s’ha de seleccionar la connexió que s’utilitzarà per fer la importació a la base de dades i s’ha de prémer el botó “Executar

- Quan l’article o projecte es presenti en més d’un idioma, indicarem com a títol principal el més proper a la nostra llengua i utilitzarem aquest camp per indicar el títol en

Aquesta Llei és aplicable a les dades de caràcter personal que siguin susceptibles de tractament i a qualsevol ús posterior d'aquestes dades. Tractament de dades personals:

Saber buscar, obtenir i interpretar la informació de les principals bases de dades biològiques que contenen dades genòmiques, transcriptòmiques, proteòmiques i metabolòmiques..

Per exemple, a les institucions hi havia una incertesa contínua sobre si la biblioteca era vista com un lloc “natural” on anar per als serveis de gestió de dades de

Aquesta citació de Hilbert estableix la importància de la matemàtica com a eina per entendre el món. És indiscutible la força que té l’àlgebra lineal dins de les matemàtiques,

Així, la proposta és fer servir un maquinari arduino, per recuperar la temperatura, la humitat i el consum de gas de totes les hores del dia, i amb aquesta informació construir

• Hardware requerit ; placa control, càmera, mòdul comunicació sense fil, mòdul targeta SD, sensors temperatura i humitat, mòdul energia ....