Resumen para aplicar pruebas de hipótesis

(1)

Resumen para aplicar pruebas de hipótesis

Componentes formales

• Hipótesis nula (H0) Es la declaración acerca del valor de un parámetro poblacional –como la media- y debe contener la condición de igualdad escrita con el símbolo =, ≤ o ≥

En el caso de la media, la hipótesis nula se expresará en una de las tres posibles formas siguientes: H0: µ = algún valor H0: µ ≤ algún valor H0: µ ≥ algún valor

• Hipótesis alterna (H1) Es la declaración que debe ser verdad si la hipótesis nula es falsa. Si el parámetro al que se refiere es la media, la hipótesis alternativa se expresará en una de tres formas posibles:

H0: µ ≠ algún valor H0: µ > algún valor H0: µ < algún valor

• Error tipo I: Es el error de rechazar la hipótesis nula siendo esta cierta. El error tipo I no es un mal cálculo ni un paso equivocado en el procedimiento sino el error que puede ocurrir por el azar como un suceso raro. La probabilidad de rechazar la hipótesis nula verdadera se denomina nivel de significancia y se denota con el símbolo α (alfa). Los valores usuales de alfa son 0.05 y 0.01

• Error tipo II: Es el error de no rechazar la hipótesis nula siendo esta falsa. La probabilidad de cometer este error se representa con el símbolo β (beta).

Para un tamaño fijo de muestra, una disminución de alfa causa un incremento de beta y el aumento de alfa produce la disminución de beta. Solo el incremento del tamaño de la muestra producirá una disminución de ambos: alfa y beta.

• Estadística de prueba: Es una estadística obtenida de una muestra o un valor basado en datos de muestra.

• Región crítica:El conjunto de todos los valores de la estadística de prueba que nos harían rechazar la hipótesis nula.

• Valor crítico:El valor o valores que separan la región crítica de los valores de la estadística de prueba que no nos harían rechazar la hipótesis nula.

Los valores críticos dependen de la naturaleza de la hipótesis nula, la distribución de muestreo pertinente y el nivel de significancia α.

En una prueba de dos colas, el nivel de significancia α se divide equitativamente entre las dos colas. En una prueba de una cola, este nivel es el área de la región a partir del valor crítico hasta el extremo derecho o izquierdo, según corresponda.

Protocolo

1. Identifique la aseveración original que se probará y exprésela en forma simbólica1_. 2. Dar la forma simbólica que debe ser verdad si la aseveración original es falsa.

3. De las dos expresiones simbólicas obtenidas, usar como hipótesis nula H0 la que contenga la condición de igualdad; H1 será la otra declaración.

4. Escoger el nivel de significancia α con base en la gravedad de un error tipo I. Hacer α pequeña si las consecuencias de rechazar una H0 son graves. Los valores de 0.05 y 0.01 son comunes.

5. Identificar la estadística pertinente para esta prueba y determinar su distribución de muestreo.

6. Determinar la estadística de prueba, los valores críticos y la región crítica. Dibujar una gráfica e incluir las estadísticas de prueba, el o los valores críticos y la región crítica.

7. Rechazar H0 si la estadística de prueba está en la región crítica. No rechazar H0 si la estadística de prueba no está en la región crítica.

8. Expresar la decisión anterior en términos sencillos, no técnicos.

1_{Cuando el investigador desea aplicar una prueba de hipótesis para}_apoyar_{su aseveración, la aseveración debe expresarse de} modo tal que se convierta en la hipótesis alternativa, por lo que no debe contener ninguna condición de igualdad.

(2)

A. Prueba de una afirmación respecto a una media: muestras grandes Consideraciones

1.

Sólo si la muestra es grande (n>30) puede aplicarse el teorema del límite central y concluir que las medias de muestra están distribuidas normalmente, no importa cómo sea la distribución de la población original. De ahí que utilicemos Z como la distribución que sigue la estadística de prueba.

2.

Al aplicar el teorema del límite central, podemos usar la desviación estándar de la muestra s como estimado de la desviación estándar de la población σ siempre que se desconozca σ y el tamaño de la muestra sea grande (>30).

Estadística de prueba

.

Donde, si se desconoce, σ puede ser reemplazado por s obtenido de una muestra grande.

B. Prueba de una afirmación respecto a una media: muestras pequeñas Consideraciones

1.

Si a) la muestra es pequeña (n ≤ 30), b) se conoce σ y c) la población original tiene una distribución esencialmente normal, se puede utilizar la distribución de Z para representar la distribución de la estadística de prueba. La fórmula que se emplea en este caso es la indicada antes para muestras grandes. Una situación como esta ocurre rara vez.

2.

Si a) la muestra es pequeña (n ≤ 30), b) se desconoce σ y c) la población original tiene una distribución esencialmente normal, se puede utilizar la distribución t de Student.

3.

Si a) la muestra es pequeña (n ≤ 30), b) se desconoce σ y c) la población original no sigue la curva normal, sólo podremos usar métodos no paramétricos.

.

C. Prueba de una afirmación respecto a una proporción Consideraciones

1.

Las afirmaciones acerca de una proporción, porcentaje o probabilidad se prueban mediante los mismos procedimientos básicos de las pruebas sobre medias, sin embargo deben satisfacerse las condiciones de un experimento binomial. Es decir: a) tenemos un número fijo de ensayos; b) estos ensayos son independientes; c) las probabilidades se mantienen constantes para cada ensayo, y d) cada ensayo tiene dos categorías de resultados, que clasificamos como “éxito” y “fracaso”.

2.

Se satisfacen las condiciones np ≥ 5 y nq ≥ 5, y por eso la distribución binomial de proporciones

de muestra puede aproximarse con una distribución normal para la cual µ = np y σ = √(npq) n : número de ensayos pˆ : proporción de muestra (x / n)

n

x

Z

x

σ

µ

−

=

n

s

x

t

₌

−

µ

x

(3)

p : proporción de población

q : 1 - p

La estadística de prueba se justifica observando que cuando se usa la distribución normal para aproximar una distribución binomial se sustituyen µ = np y σ = √(npq) para obtener

npq

np

x

z

=

−

=

−

σ

µ

En esta expresión, x es el número de éxitos entre n ensayos. Si dividimos numerador y denominador de la última expresión entre n, y sustituimos x/n por el símbolo

p

ˆ

, tendremos la estadística de prueba mostrada.

D. Inferencias acerca de dos medias: muestras dependientes Consideraciones

1.

Dos muestras son dependientes cuando se obtienen de sujetos comunes. También se denominan muestras apareadas o equiparadas (porque obtenemos dos valores de cada sujeto u obtenemos un valor de cada uno de dos sujetos que comparten una característica).

2.

Dos muestras dependientes se deben seleccionar de dos poblaciones de forma aleatoria. Ambas poblaciones deben estar distribuidas normalmente.

Donde:

d

µ

: valor medio de las diferencias d para la población de datos apareados

d

: valor medio de las diferencias _valores_{x – y}₎ d para los datos de mue stra apareados (igual a la media de los Sd : desviación estándar de las diferencias dde lo s datos de muestra apareados

n : número de pares de datos

E. Inferencias acerca de dos medias: muestras independientes y grandes Consideraciones

1.

Las dos muestras son independientes.

2.

Las dos muestras son grandes.

3.

Si se desconocen los valores σ1 y σ2 , podemos usar s1 y s2, a condición de que ambas muestras

sean grandes.

n

pq

p

Z

=

ˆ

−

n

s

d

t

d d

µ

−

=

(

)

(

)

( )

(

1 )

1

2 2 2

−

=

−

=

∑

n

d

n

d

s

_d i

(4)

El teorema del límite central indica que las medias de muestra tienden a estar distribuidas normalmente. Las diferencias entre las medias de muestra

(

x

₁

−

x

₂

)

también tienden a estar distribuidas normalmente. Con base en tal característica de estas variables, el formato básico de la estadística de prueba sigue siendo:

) ( ) ( ) ( muestra de as estadístic las de estándar desviación aseverado población de parámetro muestra de a estadístic − Estadística de prueba

F. Inferencias acerca de dos medias: muestras independientes y pequeñas Consideraciones

1.

Las dos muestras son independientes.

2.

Las dos muestras se seleccionan aleatoriamente de poblaciones distribuidas normalmente.

3.

Al menos una de las dos muestras es pequeña (n ≤ 30).

Satisfechas esas condiciones, se usa uno de tres distintos procedimientos según sea el caso: Caso 1: Se conocen los valores de las varianzas de ambas poblaciones (caso muy raro). Caso 2: Al parecer ambas poblaciones tienen varianzas iguales.

Caso 3: Las dos poblaciones aparentemente poseen varianzas distintas. Caso 1: (valores de varianzas poblacionales conocidos)

Caso 2 : (varianzas poblacionales iguales)

Donde Sp2 es un estimado conjunto de σ2 (varianza común para ambas poblaciones): 2 2 2 1 2 1 2 1 2 1

)

(

)

(

n

x

Z

σ

µ

+

−

=

2 2 2 1 2 1 2 1 2 1

)

(

)

(

n

x

Z

σ

µ

+

−

=

2 2 1 2 2 1 2 1

)

(

)

(

n

s

n

s

x

t

p p

₊

−

=

µ

(5)

Caso 3 : (varianzas poblacionales desiguales)

Si existen indicios de que ambas varianzas difieren, el método aproximado se basa en la siguiente estadística de prueba.

Donde el valor tabular de t se obtendrá con el valor de grados de libertad menor de ambas muestras.

G. Prueba de una afirmación respecto a una desviación estándar o varianza

Los mismos procedimientos básicos empleados para probar afirmaciones acerca de medias y proporciones de poblaciones pueden utilizarse para probar afirmaciones que se hacen acerca de una desviación estándar de una población σ o una varianza de población σ2

Consideraciones

1.

Es un requisito esencial el que los valores de la población estén distribuidos normalmente.

2.

Dado el supuesto de distribución normal, la estadística de prueba tiene una distribución chi

cuadrada con n – 1 grados de libertad.

Estadística de prueba Donde: n : tamaño de muestra 2

s

: varianza de muestra 2

σ

: varianza de población (dada en la hipótesis nula)

La distribución chi cuadrada posee las siguientes propiedades importantes:

• Todos los valores de chi cuadrada son cero o positivos, y la distribución no es simétrica. • Hay una distribución diferente para cada número de grados de libertad (g.l. = n – 1)

2 2 2

(

1 )

σ

χ

=

n

−

s

)

1 (

)

1 (

)

1 (

)

1 (

2 1 2 2 2 2 1 1 2

−

+

−

+

−

=

n

s

n

s

n

s

_p 2 2 2 1 2 1 2 1 2 1

)

(

)

(

n

s

n

s

x

t

+

−

=

µ

(6)

H. Prueba de bondad de ajuste

Sirve para para probar la hipótesis de que una distribución de frecuencia observada se ajusta a (o concuerda con) alguna distribución propuesta. Se le conoce con el nombre de experimento multinomial, y es semejante a los experimentos binomiales.

Consideraciones

1. Satisface tres de las condiciones de un experimento binomial. Es decir: a) el número de ensayos es fijo; b) los ensayos son independientes, y c) las probabilidades se mantienen constantes para cada ensayo. Los resultados de ensayos individuales se deben clasificar en una y sólo una de varias categorías distintas.

2.

Los datos constituyen una muestra aleatoria. Los datos de muestra consisten en conteos de frecuencia para las k diferentes categorías.

3.

Para cada una de las k categorías, la frecuencia esperada es por lo menos 5. Sin embargo, no es obligatorio que todas las frecuencias observadas sean de por lo menos 5.

Donde:

O : representa la frecuencia observada de un resultado

E : representa la freuencia esperada de un resultado

K : número de diferentes categorías o resultados (k – 1 = grados de libertad)

n : número de ensayos total

La forma de la estadística de prueba chi cuadrado es tal que una concordancia cercana entre los valores observados y los esperados produce un valor pequeño. Un valor grande indica una fuerte discrepancia entre tales valores, rechazándose la hipótesis nula de que no hay diferencia entre los valores

observados y los esperados si chi cuadrado presenta un valor significativamente alto. La prueba es siempre de cola derecha.

I. Comparación de dos varianzas Consideraciones

1.

Usamos dos muestras para comparar las varianzas de las poblaciones de las que se extrajeron las muestras.

2.

Las dos muestras son independientes entre sí.

3.

Las dos poblaciones están distribuidas normalmente. Notación:

2 1

s

: la mayor de las dos varianzas de muestra 1

n

: el tamaño de la muestra que tiene la varianza más grande 2

1

σ

: la varianza de la población de la cual se extrajo la muesta que tiene la varianza más grande Se usan los símbolos

s

₂2,

n

₂y

σ

₂2para la otra muestra y población

La distribución del cociente 2 2 2 1

s

_{de las varianzas de muestra corresponde a la distribución}_F_{, que} posee las siguientes propiedades:

• La distribución F no es simétrica. •

E

O

2 2

₌

∑

(

−

)

χ

(7)

• La forma exacta de la distribución F depende de dos grados de libertad diferentes.

Si las dos poblaciones realmente tienen varianzas iguales, entonces F=s12/s22 tiende a acercarse a 1

porque s12 ys22 tienden a tener el mismo valor. En cambio, si las dos poblaciones tienen varianzas

radicalmente distintas, s12 ys22 tienden a ser números muy distintos. Un valor de F cercano a 1 será

indicio a favor de la conclusión de que

σ

₁2 =

σ

₂2, pero un valor grande de F será indicio en contra de la conclusión de igualdad de varianzas de población.