I.C. para la media:

(1)

Inferencia Estad´ıstica:

Excel, wxMaxima y R

Melilla, Mayo 2014

V´ıctor Blanco

(2)

Contenidos

1 Introducci´on

2 MS EXCEL

3 MS Excel: Complemento An´alisis de Datos

4 wxMaxima

(3)

I.C. para la media:

1 Varianza Conocida:

X ± z₁₋^α

2

√σ n

[PROMEDIO(DATOS) ± INTERVALO.CONFIANZA(alpha, sigma, n)]

2 Varianza Desconocida:

X ± tn−1:1−^α₂

Sn−1

√n

[PROMEDIO(DATOS) ± DISTR.T.INV(ALPHA, n-1)]

(4)

I.C. para la varianza:

1 Media Conocida:

"Pn

i =1(Xi− µ)² χ_n,1−^α

2

, Pn

i =1(Xi− µ)² χ_n,^α

2

#

Usando:

PRUEBA.CHI.INV(1 - ALPHA/2, n), PRUEBA.CHI.INV(ALPHA/2, n)

2 Media Desconocida:

"

(n − 1)Sn−1²

χn−1,1−^α₂

,(n − 1)Sn−1²

χn−1,^α₂

#

Usando:

VAR(DATOS), PRUEBA.CHI.INV(1 - ALPHA/2, n-1) y PRUEBA.CHI.INV(ALPHA/2,

(5)

I.C. para la Proporci´ on:

^ p ± z₁₋^α

2

r^p(1 − ^p) n

[PROMEDIO(DATOS) ± INTERVALO.CONFIANZA(alpha, sigma, n)]

(6)

I.C. para la Diferencia de Medias:

1 Muestras independientes y varianzas conocidas:

(X − Y ) ± z₁₋^α

2

rσ²₁ n +σ²₂

m

[PROMEDIO(MUESTRA1)-PROMEDIO(MUESTRA2) ± DISTR.NORM.INV(1-ALPHA/2)*RAIZ(VAR1/n + VAR2/m)]

2 Muestras independientes y varianzas desconocidas e iguales:

(X − Y ) ± tn+m−2,1−^α₂

s

(n − 1) · S_n−1² + (m − 1) · S_m−1² n + m − 2

r1 n+ 1

m

(7)

I.C. para el Cociente de Varianzas

Fn−1,m−1,^α₂

S_m−1²

S_n−1² ,Fn−1,m−1,1−^α₂

S_m−1² S_n−1²

[DISTR.F.INV(ALPHA/2;n-1, m-1)*VAR(MUESTRA2)/VAR(MUESTRA1), DISTR.F.INV(1-ALPHA/2;n-1, m-1)*VAR(MUESTRA2)/VAR(MUESTRA1)]

(8)

I.C. para la Diferencia de Proporciones

(^p1− ^p2)± z1−^α₂

r^p1(1 − ^p1)

n +^p2(1 − ^p2) m

[PROMEDIO(MUESTRA1)-PROMEDIO(MUESTRA2) ± DISTR.NORM.INV(1-ALPHA/2)*RAIZ(VAR1/n + VAR2/m)]

(9)

Contrastes para la Media

Casos

σ2Conocida

Regi´on de rechazo

σ2 Desconocida

Regi´on de rechazo H0: µ = µ0

H1: µ6= µ0

|x − µ0|

√σ n

>z1−α/2 |x − µ0|

S√_n−1 n

>tn−1,1−α/2

H0: µ≤ µ0

H1: µ > µ0

x − µ0

√σ n

>z1−α

x − µ0 S_n−1

√n

>tn−1,1−α

H0: µ≥ µ0

H1: µ < µ0

x − µ0

√σ n

<zα

x − µ0 S_n−1

√n

<tn−1,α

• Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).

• t-Student: DISTR.T.INV(ALPHA, n-1).

(10)

Contrastes para la varianza:

µDesconocida

Casos Regi´on de rechazo

H0: σ²= σ²0

H1: σ²6= σ²0

(n − 1)S_n−1²

σ²₀ < χ²_n−1,α/2´o (n − 1)S_n−1²

σ²₀ > χ²_{n−1,1−α/2} H0: σ²≤ σ²0

H1: σ²> σ²0

(n − 1)Sn−1²

σ²₀ > χ²n−1,1−α

H0: σ²≥ σ²0

H1: σ²< σ²₀

(n − 1)S_n−1²

σ²₀ < χ²_n−1,α Chi-Cuadrado: PRUEBA.CHI.INV(1-ALPHA, n).

(11)

Contrastes para Proporciones:

Casos Regi´on de rechazo H0:p = p0

H1:p 6= p0

|^p − p0| q^p(1−^p) n

>z_1−α/2 H0:p ≤ p0

H1:p > p0

p − p^ 0

q^p(1−^p) n

>z1−α

H0:p ≥ p0

H1:p < p0

^ p − p0

q^p(1−^p) n

<zα

Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).

(12)

Contrastes para la Diferencia de Medias:

Casos

σ2 1,σ2 2Conocidas

Regi´on de rechazo

σ2 1=σ2 2Desconocidas

Regi´on de Rechazo H0: µ1= µ2

H1: µ16= µ2

|X − Y | qσ²₁

n +^σ_m²¹

>z1−α/2 |X − Y |

q(n−1)·S²_n−1+(m−1)·S_m−1²

n+m−2 ·q

1 n+_m¹

>tn+m−2,1−α/2

H0: µ1≤ µ2

H1: µ1> µ2

X − Y qσ²₁

n +^σ_m²¹

>z1−α

X − Y q(n−1)·S_n−1² +(m−1)·S_m−1²

n+m−2 ·q

1 n+_m¹

>tn+m−2,1−α

H0: µ1≥ µ2

H1: µ1< µ2

X − Y qσ²₁

n +^σ_m²¹

<zα

X − Y q(n−1)·S_n−1² +(m−1)·S²_m−1

n+m−2 ·q

1 n+_m¹

<tn+m−2,α

• Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).

• t-Student: DISTR.T.INV(ALPHA, n+m-2).

(13)

Contrastes para el Cociente de Varianzas

Casos Regi´on de rechazo

H0:^σ²¹

σ²₂ =r0

H1:^σ_σ²¹2 2

6= r0

r0· Sn−1²

S_m−1² <Fn−1,m−1,α/2 ´o r0· Sn−1²

S_m−1² >Fn−1,m−1,1−α/2

H0: ^σ²¹

σ²₂ ≤ r0

H1:^σ²¹

σ²₂ >r0

r0· S_n−1²

S_m−1² >Fn−1,m−1,1−α

H0: ^σ_σ²¹2 2

≥ r0

H1:^σ_σ²¹2 2

<r0

r0· S_n−1²

S_m−1² <Fn−1,m−1,α

F-Snedecor: DISTR.F.INV(ALPHA/2;n-1, m-1).

(14)

Contrastes para la Dif de Proporciones

Casos Regi´on de rechazo H0:p1=p2

H1:p16= p2

|^p1− ^p2| q^p₁(1−^p₁)

n +^{^}^p²^{(1−^}_m^p²⁾

>z_1−α/2 H0:p1≤ p2

H1:p1>p2

p^1− ^p2

q^p₁(1−^p₁)

n +^{^}^p²^{(1−^}_m^p²⁾

>z1−α

H0:p1≥ p2

H1:p1<p2

^ p1− ^p2

q^p₁(1−^p₁)

n +^{^}^p²^{(1−^}_m^p²⁾

<zα

Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).

(15)

MS Excel: Complemento An´ alisis de Datos

1 Inicio→ Opciones de Excel → Complementos

2 Administrar Complementos de Excel→ Herramientas para an´alisis.

(16)

Opciones

• Estad´ıstica Descriptiva (I.C. Media).

• Prueba F para varianzas de dos muestras. (Cociente Varianzas).

• Prueba t para media de dos muestras emparejadas.

• Prueba t para dos muestras suponiendo varianzas iguales.

• Prueba t para dos muestras suponiendo varianzas desiguales.

• Prueba z para media de dos muestras.

(17)

Media:

test mean(data, OPCIONES) OPCIONES:

• ’mean= Media a constrastar (por defecto 0).

• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).

• ’dev: por defecto ’unknown (desviaci´on t´ıpica).

• ’conflevel: Nivel de confianza (por defecto 0.95).

Devuelve:

• ’mean estimate: Media muestral.

• ’conf level: Nivel de confianza.

• ’conf interval: I.C. para la media.

• ’method: Procedimiento usado.

• ’hypotheses: Constraste.

(18)

Media:

test mean(data, OPCIONES)

load("stats")$

data:[78,64,35,45,45,75,43,74,42,42]$

test mean(data, ’conflevel=0.95, ’mean=50);







MEAN TEST mean estimate = 54.3

conf level = 0.95

conf interval = [42.50179070143281, 66.09820929856718]

method = Exactt − test.Unknownvariance.

hypotheses = H0 : mean = 50, H1 : mean#50 statistic = 0.82447052350717

distribution = [student t, 9]

p value = 0.43097991764262







(19)

Varianza:

test variance(data, OPCIONES) OPCIONES:

• ’mean= Por defecto ’unknown (Media poblacional, si conocida).

• ’variance: por defecto 1 (a contrastar).

Devuelve:

• ’var estimate: Cuasi-varianza.

• ’conf interval: I.C. para la varianza.

(20)

Varianza:

test variance(data, OPCIONES)

datos: [203,229,215,220,223,233,208,228,209]$

test variance(datos);







VARIANCE TEST var estimate = 110.75

conf level = 0.95

conf interval = [50.52882423941885, 406.4722219093904]

method = VarianceChi − squaretest.Unknownmean.

hypotheses = H0 : var = 1, H1 : var #1 statistic = 886.0000000000001

distribution = [chi 2, 8]

p value = 0.0







(21)

Proporci´ on:

test proportion(x, n, OPCIONES) x : elementos en la muestra con la caraster´ıstica a analizar- n: elementos en la muestra.

OPCIONES:

Devuelve:

• ’proportiona: Lista de proporciones.

• ’conf interval: I.C. para cociente de varianzas.

(22)

Proporci´ on:

test proportion(x, n, OPCIONES)

test proportion(45, 103, alternative = less);







PROPORTION TEST sample proportion = 0.4368932038835

conf level = 0.95

conf interval = [0, 0.52271414915023]

method = Exactbinomialtest.

hypotheses = H0 : p = 0.5, H1 : p < 0.5 statistic = 45

distribution = [binomial , 103, 0.5]

p value = 0.11845093889015







(23)

Dif. Prop.:

test proportion difference(x1,n1,x2,n2,OPCIONES) x 1, x 2 : elementos en cada muestra con la caraster´ıstica a analizar.

n1, n2: elementos en cada muestra.

OPCIONES:

• ’proportion= Proporci´on a ser contrastada. (por defecto 0.5).

Devuelve:

• ’sample proportion: Proporci´on en muestra.

(24)

Dif. de Medias:

test mean(data1, data2, OPCIONES) OPCIONES:

• ’dev1: por defecto ’unknown (desviaci´on t´ıpica de la primera poblaci´on).

• ’dev2: por defecto ’unknown (desviaci´on t´ıpica de la segunda poblaci´on).

• ’varequal: por defecto false (solo si dev1 y dev2 son desconocidad).

Devuelve:

• ’diff estimate: Diferencia de medias muestrales.

• ’conf interval: I.C. para la diferencia de medias.

(25)

Dif. de Medias:

test mean(data1, data2, OPCIONES)

data1: [20.4,62.5,61.3,44.2,11.1,23.7]$

data2: [1.2,6.9,38.7,20.4,17.2]$

test means difference(data1,data2);







DIFFERENCE OF MEANS TEST diff estimate = 20.31999999999999

conf level = 0.95

conf interval = [−4.854739139651127, 45.49473913965112]

method = Exactt − test.Welchapprox .

hypotheses = H0 : mean1 = mean2, H1 : mean1#mean2 statistic = 1.838004300728477

distribution = [student t, 8.627587401846039]







(26)

Coc. de var:

test variance ratio(data1, data2, OPCIONES) OPCIONES:

• ’mean1= Por defecto ’unknown (Media poblacional 1, si conocida).

• ’mean2= Por defecto ’unknown (Media poblacional 2, si conocida).

Devuelve:

• ’ratio estimate: Cociente de cuasivarianzas.

• ’statistic: Valor del estad´ıstico.

(27)

Coc. de var:

test variance ratio(data1, data2, OPCIONES)

x: [20.4,62.5,61.3,44.2,11.1,23.7]$

y: [1.2,6.9,38.7,20.4,17.2]$

test variance ratio(x,y);







VARIANCE RATIO TEST ratio estimate = 2.316933391522034

conf level = 0.95

conf interval = [0.24741743950027, 17.11723918986183]

method = VarianceratioF − test.Unknownmeans.

hypotheses = H0 : var 1 = var 2, H1 : var 1#var 2 statistic = 2.316933391522034

distribution = [f , 5, 4]







(28)

Dif. Prop.:

test proportion difference(x1,n1,x2,n2,OPCIONES)

test proportions difference(10, 250, 4, 150,alternative = greater);







DIFFERENCE OF PROPORTIONS TEST proportions = [0.04, 0.026666666666667]

conf level = 0.95

conf interval = [−0.021727608336707, 1]

method = Asymptotictest.Yatescorrection.

hypotheses = H0 : p1 = p2, H1 : p1 > p2 statistic = 0.013333333333333 distribution = [normal , 0, 0.018980691943832]

p value = 0.241193599641







(29)

Test de Normalidad:

test normality(x)

Tests de Shapiro-Wilks de Normalidad (para menos de 5000 datos).

Devuelve:

• ’statistic: Valor del estad´ıstico: W.

• ’p value: p-valor para asunci´on de normalidad.

(30)

Test de Normalidad: test normality(x)

x:[12,15,17,38,42,10,23,35,28]$

test normality(x);





SHAPIRO − WILKTEST statistic = 0.92510556951624

p value = 0.43617639188604





(31)

Librer´ıa Inferencia

Inferencia();