Inferencia Estad´ıstica:
Excel, wxMaxima y R
Melilla, Mayo 2014
V´ıctor Blanco
Contenidos
1 Introducci´on
2 MS EXCEL
3 MS Excel: Complemento An´alisis de Datos
4 wxMaxima
I.C. para la media:
1 Varianza Conocida:
X ± z1−α
2
√σ n
[PROMEDIO(DATOS) ± INTERVALO.CONFIANZA(alpha, sigma, n)]
2 Varianza Desconocida:
X ± tn−1:1−α2
Sn−1
√n
[PROMEDIO(DATOS) ± DISTR.T.INV(ALPHA, n-1)]
I.C. para la varianza:
1 Media Conocida:
"Pn
i =1(Xi− µ)2 χn,1−α
2
, Pn
i =1(Xi− µ)2 χn,α
2
#
Usando:
PRUEBA.CHI.INV(1 - ALPHA/2, n), PRUEBA.CHI.INV(ALPHA/2, n)
2 Media Desconocida:
"
(n − 1)Sn−12
χn−1,1−α2
,(n − 1)Sn−12
χn−1,α2
#
Usando:
VAR(DATOS), PRUEBA.CHI.INV(1 - ALPHA/2, n-1) y PRUEBA.CHI.INV(ALPHA/2,
I.C. para la Proporci´ on:
^ p ± z1−α
2
r^p(1 − ^p) n
[PROMEDIO(DATOS) ± INTERVALO.CONFIANZA(alpha, sigma, n)]
I.C. para la Diferencia de Medias:
1 Muestras independientes y varianzas conocidas:
(X − Y ) ± z1−α
2
rσ21 n +σ22
m
[PROMEDIO(MUESTRA1)-PROMEDIO(MUESTRA2) ± DISTR.NORM.INV(1-ALPHA/2)*RAIZ(VAR1/n + VAR2/m)]
2 Muestras independientes y varianzas desconocidas e iguales:
(X − Y ) ± tn+m−2,1−α2
s
(n − 1) · Sn−12 + (m − 1) · Sm−12 n + m − 2
r1 n+ 1
m
I.C. para el Cociente de Varianzas
Fn−1,m−1,α2
Sm−12
Sn−12 ,Fn−1,m−1,1−α2
Sm−12 Sn−12
[DISTR.F.INV(ALPHA/2;n-1, m-1)*VAR(MUESTRA2)/VAR(MUESTRA1), DISTR.F.INV(1-ALPHA/2;n-1, m-1)*VAR(MUESTRA2)/VAR(MUESTRA1)]
I.C. para la Diferencia de Proporciones
(^p1− ^p2)± z1−α2
r^p1(1 − ^p1)
n +^p2(1 − ^p2) m
[PROMEDIO(MUESTRA1)-PROMEDIO(MUESTRA2) ± DISTR.NORM.INV(1-ALPHA/2)*RAIZ(VAR1/n + VAR2/m)]
Contrastes para la Media
Casos
σ2Conocida
Regi´on de rechazo
σ2 Desconocida
Regi´on de rechazo H0: µ = µ0
H1: µ6= µ0
|x − µ0|
√σ n
>z1−α/2 |x − µ0|
S√n−1 n
>tn−1,1−α/2
H0: µ≤ µ0
H1: µ > µ0
x − µ0
√σ n
>z1−α
x − µ0 Sn−1
√n
>tn−1,1−α
H0: µ≥ µ0
H1: µ < µ0
x − µ0
√σ n
<zα
x − µ0 Sn−1
√n
<tn−1,α
• Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).
• t-Student: DISTR.T.INV(ALPHA, n-1).
Contrastes para la varianza:
µDesconocida
Casos Regi´on de rechazo
H0: σ2= σ20
H1: σ26= σ20
(n − 1)Sn−12
σ20 < χ2n−1,α/2´o (n − 1)Sn−12
σ20 > χ2n−1,1−α/2 H0: σ2≤ σ20
H1: σ2> σ20
(n − 1)Sn−12
σ20 > χ2n−1,1−α
H0: σ2≥ σ20
H1: σ2< σ20
(n − 1)Sn−12
σ20 < χ2n−1,α Chi-Cuadrado: PRUEBA.CHI.INV(1-ALPHA, n).
Contrastes para Proporciones:
Casos Regi´on de rechazo H0:p = p0
H1:p 6= p0
|^p − p0| q^p(1−^p) n
>z1−α/2 H0:p ≤ p0
H1:p > p0
p − p^ 0
q^p(1−^p) n
>z1−α
H0:p ≥ p0
H1:p < p0
^ p − p0
q^p(1−^p) n
<zα
Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).
Contrastes para la Diferencia de Medias:
Casos
σ2 1,σ2 2Conocidas
Regi´on de rechazo
σ2 1=σ2 2Desconocidas
Regi´on de Rechazo H0: µ1= µ2
H1: µ16= µ2
|X − Y | qσ21
n +σm21
>z1−α/2 |X − Y |
q(n−1)·S2n−1+(m−1)·Sm−12
n+m−2 ·q
1 n+m1
>tn+m−2,1−α/2
H0: µ1≤ µ2
H1: µ1> µ2
X − Y qσ21
n +σm21
>z1−α
X − Y q(n−1)·Sn−12 +(m−1)·Sm−12
n+m−2 ·q
1 n+m1
>tn+m−2,1−α
H0: µ1≥ µ2
H1: µ1< µ2
X − Y qσ21
n +σm21
<zα
X − Y q(n−1)·Sn−12 +(m−1)·S2m−1
n+m−2 ·q
1 n+m1
<tn+m−2,α
• Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).
• t-Student: DISTR.T.INV(ALPHA, n+m-2).
Contrastes para el Cociente de Varianzas
Casos Regi´on de rechazo
H0:σ21
σ22 =r0
H1:σσ212 2
6= r0
r0· Sn−12
Sm−12 <Fn−1,m−1,α/2 ´o r0· Sn−12
Sm−12 >Fn−1,m−1,1−α/2
H0: σ21
σ22 ≤ r0
H1:σ21
σ22 >r0
r0· Sn−12
Sm−12 >Fn−1,m−1,1−α
H0: σσ212 2
≥ r0
H1:σσ212 2
<r0
r0· Sn−12
Sm−12 <Fn−1,m−1,α
F-Snedecor: DISTR.F.INV(ALPHA/2;n-1, m-1).
Contrastes para la Dif de Proporciones
Casos Regi´on de rechazo H0:p1=p2
H1:p16= p2
|^p1− ^p2| q^p1(1−^p1)
n +^p2(1−^mp2)
>z1−α/2 H0:p1≤ p2
H1:p1>p2
p^1− ^p2
q^p1(1−^p1)
n +^p2(1−^mp2)
>z1−α
H0:p1≥ p2
H1:p1<p2
^ p1− ^p2
q^p1(1−^p1)
n +^p2(1−^mp2)
<zα
Normal: INTERVALO.CONFIANZA(ALPHA, sigma, n).
MS Excel: Complemento An´ alisis de Datos
1 Inicio→ Opciones de Excel → Complementos
2 Administrar Complementos de Excel→ Herramientas para an´alisis.
Opciones
• Estad´ıstica Descriptiva (I.C. Media).
• Prueba F para varianzas de dos muestras. (Cociente Varianzas).
• Prueba t para media de dos muestras emparejadas.
• Prueba t para dos muestras suponiendo varianzas iguales.
• Prueba t para dos muestras suponiendo varianzas desiguales.
• Prueba z para media de dos muestras.
Media:
test mean(data, OPCIONES) OPCIONES:• ’mean= Media a constrastar (por defecto 0).
• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’dev: por defecto ’unknown (desviaci´on t´ıpica).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’mean estimate: Media muestral.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para la media.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
Media:
test mean(data, OPCIONES)load("stats")$
data:[78,64,35,45,45,75,43,74,42,42]$
test mean(data, ’conflevel=0.95, ’mean=50);
MEAN TEST mean estimate = 54.3
conf level = 0.95
conf interval = [42.50179070143281, 66.09820929856718]
method = Exactt − test.Unknownvariance.
hypotheses = H0 : mean = 50, H1 : mean#50 statistic = 0.82447052350717
distribution = [student t, 9]
p value = 0.43097991764262
Varianza:
test variance(data, OPCIONES) OPCIONES:• ’mean= Por defecto ’unknown (Media poblacional, si conocida).
• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’variance: por defecto 1 (a contrastar).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’var estimate: Cuasi-varianza.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para la varianza.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
Varianza:
test variance(data, OPCIONES)datos: [203,229,215,220,223,233,208,228,209]$
test variance(datos);
VARIANCE TEST var estimate = 110.75
conf level = 0.95
conf interval = [50.52882423941885, 406.4722219093904]
method = VarianceChi − squaretest.Unknownmean.
hypotheses = H0 : var = 1, H1 : var #1 statistic = 886.0000000000001
distribution = [chi 2, 8]
p value = 0.0
Proporci´ on:
test proportion(x, n, OPCIONES) x : elementos en la muestra con la caraster´ıstica a analizar- n: elementos en la muestra.OPCIONES:
• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’proportiona: Lista de proporciones.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para cociente de varianzas.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
Proporci´ on:
test proportion(x, n, OPCIONES)test proportion(45, 103, alternative = less);
PROPORTION TEST sample proportion = 0.4368932038835
conf level = 0.95
conf interval = [0, 0.52271414915023]
method = Exactbinomialtest.
hypotheses = H0 : p = 0.5, H1 : p < 0.5 statistic = 45
distribution = [binomial , 103, 0.5]
p value = 0.11845093889015
Dif. Prop.:
test proportion difference(x1,n1,x2,n2,OPCIONES) x 1, x 2 : elementos en cada muestra con la caraster´ıstica a analizar.n1, n2: elementos en cada muestra.
OPCIONES:
• ’proportion= Proporci´on a ser contrastada. (por defecto 0.5).
• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’sample proportion: Proporci´on en muestra.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para cociente de varianzas.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
Dif. de Medias:
test mean(data1, data2, OPCIONES) OPCIONES:• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’dev1: por defecto ’unknown (desviaci´on t´ıpica de la primera poblaci´on).
• ’dev2: por defecto ’unknown (desviaci´on t´ıpica de la segunda poblaci´on).
• ’varequal: por defecto false (solo si dev1 y dev2 son desconocidad).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’diff estimate: Diferencia de medias muestrales.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para la diferencia de medias.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
Dif. de Medias:
test mean(data1, data2, OPCIONES)data1: [20.4,62.5,61.3,44.2,11.1,23.7]$
data2: [1.2,6.9,38.7,20.4,17.2]$
test means difference(data1,data2);
DIFFERENCE OF MEANS TEST diff estimate = 20.31999999999999
conf level = 0.95
conf interval = [−4.854739139651127, 45.49473913965112]
method = Exactt − test.Welchapprox .
hypotheses = H0 : mean1 = mean2, H1 : mean1#mean2 statistic = 1.838004300728477
distribution = [student t, 8.627587401846039]
Coc. de var:
test variance ratio(data1, data2, OPCIONES) OPCIONES:• ’mean1= Por defecto ’unknown (Media poblacional 1, si conocida).
• ’mean2= Por defecto ’unknown (Media poblacional 2, si conocida).
• ´alternative: ’twosided, ’greater, ’less. (Hip´otesis alternativa).
• ’conflevel: Nivel de confianza (por defecto 0.95).
Devuelve:
• ’ratio estimate: Cociente de cuasivarianzas.
• ’conf level: Nivel de confianza.
• ’conf interval: I.C. para cociente de varianzas.
• ’method: Procedimiento usado.
• ’hypotheses: Constraste.
• ’statistic: Valor del estad´ıstico.
Coc. de var:
test variance ratio(data1, data2, OPCIONES)x: [20.4,62.5,61.3,44.2,11.1,23.7]$
y: [1.2,6.9,38.7,20.4,17.2]$
test variance ratio(x,y);
VARIANCE RATIO TEST ratio estimate = 2.316933391522034
conf level = 0.95
conf interval = [0.24741743950027, 17.11723918986183]
method = VarianceratioF − test.Unknownmeans.
hypotheses = H0 : var 1 = var 2, H1 : var 1#var 2 statistic = 2.316933391522034
distribution = [f , 5, 4]
Dif. Prop.:
test proportion difference(x1,n1,x2,n2,OPCIONES)test proportions difference(10, 250, 4, 150,alternative = greater);
DIFFERENCE OF PROPORTIONS TEST proportions = [0.04, 0.026666666666667]
conf level = 0.95
conf interval = [−0.021727608336707, 1]
method = Asymptotictest.Yatescorrection.
hypotheses = H0 : p1 = p2, H1 : p1 > p2 statistic = 0.013333333333333 distribution = [normal , 0, 0.018980691943832]
p value = 0.241193599641
Test de Normalidad:
test normality(x)Tests de Shapiro-Wilks de Normalidad (para menos de 5000 datos).
Devuelve:
• ’statistic: Valor del estad´ıstico: W.
• ’p value: p-valor para asunci´on de normalidad.
Test de Normalidad: test normality(x)
x:[12,15,17,38,42,10,23,35,28]$
test normality(x);
SHAPIRO − WILKTEST statistic = 0.92510556951624
p value = 0.43617639188604
Librer´ıa Inferencia
Inferencia();