• No se han encontrado resultados

Tema 4. Contrastos d hipòtesis NO-paramètriques

N/A
N/A
Protected

Academic year: 2021

Share "Tema 4. Contrastos d hipòtesis NO-paramètriques"

Copied!
7
0
0

Texto completo

(1)

López-Tamayo, Jordi 1

4.0. Introducció

Fins ara es realitzàvem contrastos sobre el valors assignats a alguns paràmetres (conjunt de paràmetres) que definien una determinada funció de probabilitat f(X;θ). Això implicava:

1. La mostra obtinguda procedia d’una població amb una distribució CONEGUDA.

2. Els procediments d’inferència es centraven en paràmetres DESCONEGUTS d’aquesta funció.

3. S’exigia robustesa a la tècnica inferencial per a que les vulneracions de les hipòtesis no afectessin als CONTRASTOS o a les ESTIMACIONS.

CONTRAST NO-PARAMÈTRIC: Es desenvolupen per a evitar aquest conjunt d’hipòtesis i que es contamini el procés davant variacions dels mateixos.

DUES TÈCNIQUES NO-PARAMÈTRIQUES:

1. El procés es basa en un ESTADÍSTIC de CONTRAST no vinculat amb cap paràmetre poblacional.

2. METODES DE DISTRIBUCIÓ LLIURE. L’ESTADÍSTIC presenta una distribució que NO DEPÈN de la DISTRIBCIÓ DE PROBABILITAT de la POBLACIÓ.

• Generalment no es fan servir els VALORS DE LA MOSTRA, sinó la seva FREQÜÈNCIA i/o el seu ORDRE (en diferents formes).

• Són els únics aplicables si les observacions són NOMINALS/ORDINALS

• Són més EFICIENTS que els seus HOMÒLEGS si la població és NO-NORMAL.

Kruskal-Wallis Mediana K mostres independents

Moses

Wald-Wolfowitz Kolmogorov-Smirnov Mann-Whitney Mediana Dues mostres independents

Kendall Friedman Q de Cochran

K mostres relacionades

Wilcoxon Signes Mcnemar

Dues mostres relacionades

Binomial Ratxes

Kolmogorov-Smirnov Х

2

Una mostra

Escala Ordinal Escala Nominal

Mostra

Tema 4. Contrastos d’hipòtesis NO-paramètriques

Contrastos no-paramètrics més rellevants:

Contrastos de relació entre atributs:

Taules de contingència:

Independència Homogeneïtat

(*) En negreta els que s’analitzaran aquest curs.

Contrastos específics de Normalitat:

Shapiro-Wilk

Lilliefors

Jarque-Bera

Dornik-Hansen

(2)

López-Tamayo, Jordi 3

Test χ 2 : Contrastar si una mostra procedeix d’una determinada distribució de probabilitat CAS 1: Es suposa que F(X) està COMPLETAMENT

ESPECIFICADA Æ NO EXISTEIXEN PARÀMETRES DESCONEGUTS

CAS 2: Es suposa que F(X) NO ESTÀ COMPLETAMENT

ESPECIFICADA Æ ESTIMAR PARÀMETRES DESCONEGUTS CAS 1: Es disposa d’una mostra X={X

1

, …..,X

N

} ALEATÒRIA.

Es classifiquen les N observacions en “r” classes MUTUAMENT EXCLOUENTS de forma que:

⎩ ⎨

"

:"

"

' :"

0 1

0

H No H

bo és Ajust L

H

( ) ( ) ( ) ( )

⎩ ⎨

=

X F X

F H

X F X

F H

0 1

0 0

: :

OBJECTIU: Verificar si una mostra procedeix d’una població amb una DETERMINADA DISTRIBUCIÓ DE PROBABILITAT.

A r

A

A ∪ ∪ ∪

= 1 2 L

χ Æ Tot el camp de variació mostral

Al procedir d’una MAS la:

Probabilitat d’aparèixer Æ

Probabilitat d’aparèixer Æ

Probabilitat d’aparèixer Æ

Per tant, cada E és el VALOR ESPERAT del nombre d’observacions que pertanyen a la

Tema 4. Contrastos d’hipòtesis NO-paramètriques

mostral

Mida elements

conté

Clase → = ∑ →

= r

i i i

i

n N n

A

1

( )

( )

( ) ( ) {

esperat valor

i i

i i

i

n r n n r r

r

i i

i i

E np

n E p n B n

p p n p n n n N n n P

p p A F

r

=

=

=

⎪⎩

⎪ ⎨

=

=

=

,

!

!

! ,...., !

, 1

2 1

2 1 2

1 2

1 1

L L Sota el supòsit que H

0

és certa

r r

i i

A n

A n

A n

M M

1

1

Segueix una distribució MULTINOMIAL com la següent:

On cada:

(3)

López-Tamayo, Jordi 5 Degut a la aleatorietat del mostreig, és d’esperar que les FREQÜÈNCIES OBSERVADES no siguin les mateixes que les FREQÜÈNCIES ESPERADES. Per tant, s’ha de valorar

ESTADÍSTICAMENT si aquestes DISCREPÀNCIES són SUFICIENTMENT IMPORTANTS O NO. Així, l’ESTADÍSTIC del contrast és:

Si les DISCREPÀNCIES són conjuntament GRANS Æ Refusem H

0

Æ La informació mostral indica que no hi ha evidència per a creure que la mostra procedeix d’una població amb la distribució de probabilitat com la proposada per la H

0

( ) ( )

( ) χ α

χ

α ⎟⎟ =

⎜⎜ ⎝

⎛ − ≥

− ≈

− =

∑ ∑

= − −

= = −

r

i

r i

i i

r

i

r

i

r i

i i

i i i

Np Np P n

Np Np n

E E n

1

2 1 , 1 2

1 1

2 1 2

2

NOTES: 1º.- És comporta com un χ

2

assimptòticament Æ en cas contrari reagrupar categories. 2º.- Es pot aplicar tant a variables DISCRETES (incloses ordinals i nominals) I CONTINUES. 3º.- Es aconsellable que la construcció de les classes presenti una probabilitat semblant.

≥ 5

E i

ECET 4.1/4.2

CAS 2: S’ha d’estimar els paràmetres:

On K és el nombre de paràmetres que s’han d’estimar i, per tant, implica una pèrdua de graus de llibertat.

Tema 4. Contrastos d’hipòtesis NO-paramètriques

ECET 4.3

( ) ( ) ( )

( ) ( ( ) )

( )

( ) χ α

θ χ θ

θ

θ θ

θ

θ θ

θ θ

θ θ

α ⎟ ⎟ =

⎜ ⎜

⎛ − ≥

− ≈

− =

=

=

∑ ∑

= − − −

= = − −

r

i

k r i

i i r

i

r

i

k r k

i

k i

i i

i i

k i

k i

i i

E E P n

Np Np n

E E n

p A

P

p A P

1

2 1 , 1 2

1 1

2 1 2

1

2 2

1 2

2 1 2

1

ˆ ˆ

, , ,

, , , ˆ

ˆ

, , , ,

, ,

;

L

L

L

L

(4)

López-Tamayo, Jordi 7

( ) ( )

( " Valor taules W" ) es RH

0

Si

: és contrast

del estadístic L'

- 4º.

senar és n si

i parell és n si

1965 Wilk, - Shapiro

per tabulats

s coeficient els

són a"

"

on

: coeficient

següent el

computa

Es - 3º.

: s estadístic

següents

els obtenen S'

- 2º.

major a menor de

mostra la de ordenació l'

fa Es - 1º.

=

=

= −

=

=

=

=

⎩ ≤

⎨ ⎧

∑ ∑

= −+ −+

=

=

α W

z P W b

k N k N

u u a b u

u z

N i u u

u u

H u No H

al"

m una Norm ribueix co

"X és dist H

k

i

i i N i N N

i i N

i i

N

2 2

1

1 1

1 2 2 1

2 1 0

1 0

2 1 2

"

:"

:

L Shapiro-Wilk

OBJECTIU: És un contrast específic per a verificar si una mostra procedeix d’una distribució normal sense haver de fer cap especificació sobre els seus paràmetres. És molt útil amb mostres de mida petita n<50. Es disposa d’una mostra X={X

1

, …..,X

N

} ALEATÒRIA. Per a realitzar el contrast:

ECET 4.4 Software estadístic: Gretl, R, SPSS, EViews, etc..

⎩ ⎨

"

:"

"

:"

0 1

0

H No H

Normal És

H

Tema 4. Contrastos d’hipòtesis NO-paramètriques

⎩ ⎨

"

:"

"

:"

0 1

0

H No H

aleatòria És

H 4.2. Una mostra. Aleatorietat

OBJECTIU: Verificar si un conjunt d’observacions constitueixen una mostra aleatòria procedent d’una població CONTÍNUA

Test de Ratxes: Una ratxa és una succió de símbols de la mateixa classe que es troba limitat per símbols d’una altra classe.

Exemple 1: QQQQHHHHQQHHHQQQQQQHH

Amb aquests dos tipus d’observacions (Q i H) diem que hi ha 6 ratxes, 3 de Q i 3 d’H Exemple 2: QQQQQQQQQQHHHHHHHHHHH

Exemple 3: QHQHQHQHQHQHQHQHQHQHQ

La idea és que a l’exemple 1 podríem dir que si les observacions procedeixen d’una mateixa població, els símbols Q i H apareixeran barrejats i sense cap mena de sistematització. En canvi, als exemples 2 i 3 ens trobem amb dos sistematitzacions extremes. El cas 2, que presenta molt poques ratxes (2) i, el cas tres, moltes ratxes (21), tantes com elements.

Per tant, el test de ratxes pretén distingir si ens trobem amb un cas com l’exemple 1,

aleatori, o com els altres dos, sistemàtics.

(5)

López-Tamayo, Jordi 9 Per a instrumentalitzar les ratxes:

Variables continues amb un atribut dicotòmic de referència (edat, puntuació, etc) de (home/dona, matí/tarda, GrupaA/GrupB, etc..)

1º.- S’obtenen les ratxes.

2º.- Si el nombre qualsevol de ratxes és inferior a 20. (Taules específiques: p.ex.: Casas Sánchez, et al. 2006, pags 501-502)

3º.- Per valors superiors el nombre de ratxes, R, es distribueix com una normal amb paràmetres:

Variables continues sense atribut dicotòmic de referència (PIB, edat, puntuació):

Es realitza exactament igual que en el cas anterior només que per a obtenir les ratxes es fa la diferència entre el valor de la variable i la mediana. Després s’eliminen els valors zero reduint la mostra. Finalment, els valors negatius determinaran una ratxa i els positius l’altre.

(Software estadístic: Gretl, Spss, Eviews, R, etc..)

( ) ( )

( )

( )

( ) ( )

( )

n N N N

N

n n

n N N N R N

VAR

n n N R N

E

R VAR R E N R

= +

= −

= +

− +

− +

− +

− +

− +

negatives i

positives ratxes

les de elements"

d'

"

nombre el són i On

1 2 2 2

;

2

ECET 4.5

Contrast a doble cua i l’estadístic del contrast s’instrumentalitza com

qualsevol contrast basat en una distribució normal.

OBJECTIU: Pertany al conjunt de test que es denominen de localització i pretén verificar si un conjunt d’observacions {X

i

,Y

i

} d’una distribució BIDIMENSIONAL presenten la mateixa mesura de posició o localització. En aquest cas la mediana. Aquest test és un exemple, ni han d’altres metodologies i per altres mesures de localització/posició. És útil per a valorar la situació de dos individus després que hi hagi passat en el temps algun fenomen. Ex.( valor de l’individu abans d’un tractament i valor del mateix individu després del tractament)

Per a instrumentalitzar el contrast es realitza el següent:

1º.- Es calcula les diferències entre les variables 2º.- S’eliminen les diferències nul·les

3º.- S’assignen els rangs a aquestes diferències de menor a major. (En cas d’empat, s’assigna el rang mitjà).

4º.- Anomenem R

+

a la suma dels rangs que presenten les diferències positives i R

-

a la suma dels rangs que presenten les diferències negatives. Es pot demostrar que:

5º.- Existeixen valors tabulats per exemple a Casas-Sánchez 2006, pag 500. Ara bé, si la mostra és suficientment gran es compleix que:

Tema 4. Contrastos d’hipòtesis NO-paramètriques

( )( )

⎟⎟ ⎠

⎜⎜ ⎝

⎛ + + +

= + +

=

+

− +

24 1 2

; 1 4

) 1 (

2 ) 1 (

n n n n N n R

n R n R

Y X d

i i i

4.3. Dues mostres. Dades emparellades Test de Wilcoxon

Contrast a doble cua i l’estadístic del contrast s’instrumentalitza com qualsevol contrast basat en

ECET 4.6

(Software estadístic: Gretl, Spss, Eviews, R, etc..)

⎩ ⎨

=

Y X

Y X

Me Me

H

Me Me

H

1 0

(6)

López-Tamayo, Jordi 11

⎩ ⎨

"

:"

"

:"

0 1

0

H No H

ts Independen Són

H

n n ·c

···

n ·j

···

n ·2 n ·1

Freqüències marginals

n r.

n rc

···

n rj

···

n rc n rc

A r

···

···

···

···

···

···

···

···

n i.

n ic

···

n ij

···

n i2 n i1

A i

···

···

···

···

···

···

···

···

n 2.

n 2c

···

n 2j

···

n 22 n 21

A 2

n 1.

n 1c

···

n 1j

···

n 12 n 11

A 1

Freqüències marginals

B c

···

B j

···

B 2 B 1

4.3. Taules de contingència: Test d’independència

OBJECTIU: Verificar la independència entre dos factors

∑∑

∑ = • = =

= •

= •

= = • = = = r =

i c

j ij c

j j r

i i c

j

i ij r

i

j

ij n n n n n n n

n

1 1

1 1

1 1

Tema 4. Contrastos d’hipòtesis NO-paramètriques

Condició d’independència (Estadística Econòmica i Empresarial I)

Dos variables són INDEPENDENTS si la seva funció de distribució de probabilitat conjunta és igual al producte de les marginals. Per tant, sota la H

0

( ) ( ) ( )

( ) ( ) ( )

j i ij

i i

j i

j i i i

j i ij

P P P

P P P

B P A P B

A P

c j

i r i

P P B P A P B A P P

*

*

*

1 ,

1

*

*

1 1 11

M M

M M

L L

=

=

=

=

=

RECORDATORI. Només amb que una parella de punts no fos així, ja no hi hauria independència.

Distribució de probabilitat conjunta:

Totes aquestes probabilitats

han de ser estimades a partir

de la informació mostral

(7)

López-Tamayo, Jordi 13

1 P ·c

···

P ·j

···

P ·2 P ·1

Freqüències marginals

P r.

P rc

···

P rj

···

P rc P rc

A r

···

···

···

···

···

···

···

···

P i.

P ic

···

P ij

···

P i2 P i1

A i

···

···

···

···

···

···

···

···

P 2.

P 2c

···

P 2j

···

P 22 P 21

A 2

P 1.

P 1c

···

P 1j

···

P 12 P 11

A 1

Freqüències marginals

B c

···

B j

···

B 2 B 1

1 1

1

1

= •

= •

=

c

=

j j r

i

i

P

P Per tant, s’han d’estimar r+c-2 paràmetres. El -2 és pel fet que dos

paràmetres es poden extreure per la diferència amb la unitat, atès que:

Fem servir el MÈTODE DE LAGRANGIÀ

( )

[ ] ( )

n P n n i

P n P i

P P

P n P

P L

j j i

i c

j j r

i i r

i c

j

j i ij j

i

• •

= •

= •

= = • •

=

=

=

=

=

∑∑

ˆ º. ˆ

3

1 1

, ln ,

ln º.

1

1 1

1 1

: MBLANTS MÀXIMVERSE

ESTIMADORS

els Obtenim

: ns restriccio

dues a Subjecte

- 2º.

: ança Versembl de

funció la Obtenim

Contrast:

1º.- Sota la H

0

Tema 4. Contrastos d’hipòtesis NO-paramètriques

ECET 4.7

( ) ( ) ( )

( )

( )

0 2

) 1 )(

1 ( 1

2 2

?????

. .

1 1

2

ˆ ˆ ˆ

ˆ ˆ ˆ ˆ ˆ

ˆ ˆ ˆ

E RH E P n

Si

E E n

n n P n

P n P n E

P P P P

P B P A P B A P P

c r c

j ij

ij ij

ll d g r

i c

j ij

ij ij

j i j i ij ij

j i ij j

i i i j

i ij

⎟ =

⎜ ⎜

⎛ − ≥

− ≈

=

=

=

=

=

=

=

=

= =

∑∑

α χ

χ

Per tant, obtindrem els VALORS ESPERATS per cada creuament que hauríem d’esperar en el cas que les dues variables FOSIN INDEPENDENTS. Aquests són:

Així, si les freqüències estimades són MOLT DIFERENTS de les freqüències observades, refusem H

0

2º.- L’estadístic del contrast és:

Quants graus de llibertat??. g.d.ll=total categories - nº paràmetres a estimar - 1

g.d.ll=(r*c)-(r+c”)-1=(r-1)*(c-1)

Referencias

Documento similar

No conozco ninguna palabra castellana capaz de juntar cosas tan dispares como la gratitud, el favor, la belleza, la complacencia y la alegría [para nosotros, el placer que

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

[r]

Indicadores municipales de sostenibilidad: Tasa de afiliación a

Tras establecer un programa de trabajo (en el que se fijaban pre- visiones para las reuniones que se pretendían celebrar los posteriores 10 de julio —actual papel de los

El valors de salinitat, clorurs i sulfats, són, en totes les mostres, molt baixos; per contra, la capacitat de canvi catiònic (CCC) presenta els valors més alts del conjunt dels

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

De esta manera, Elster no busca contradecir las aportaciones davidsonianas, sino más bien, llevarlas a un nuevo y más alto nivel de análisis, ya que incluso este filósofo