Fundamentos de la prueba de hipótesis - ESTADISTICA DESCRIPTIVA CON R.pdf

La prueba de hipótesis es un hecho que prueba una suposición con respecto a un parámetro de población. Se utiliza para evaluar la plausibilidad de una hipótesis se mide y examina una muestra aleatoria de la población que se analiza. Existen dos hipótesis diferentes: la hipótesis nula y la hipótesis alternativa. La hipótesis nula suele ser una hipótesis de igualdad entre parámetros poblacionales. La hipótesis alternativa es efectivamente lo opuesto a una hipótesis nula. Por lo tanto, son mutuamente excluyentes y solo una no será rechazada. En el análisis estadístico se establece una afirmación, una hipótesis, se recogen datos que posteriormente se utilizan para probar la aserción. Entonces, una hipótesis estadística es ** Afirmación relativa a un parámetro de la población sujeta a verificación**[60]. Para realizar la prueba de hipótesis vamos a definir el proceso de cuatro pasos para rechazar o no rechazar la hipótesis propuesta:

• Fundamentos de la prueba de hipótesis

• Prueba de una aseveración respecto de una proporción

• Prueba de una aseveración respecto de una media con sd conocida

• Prueba de una aseveración respecto de una media con sd desconocida

• Prueba de una aseveración respecto de una desviación estándar o de una varianza

1. Proponer la hipótesis: Establecer la hipótesis nula (Ho) y alternativa (Ha).

2. Formular un plan de análisis: Planificar cómo haremos el análisis.

3. Analizar datos de muestra: Cálculo e interpretación del estadístico de prueba.

4. Interpretar resultados: Aplicación de la regla de decisión.

6 PRUEBA DE HIPÓTESIS

“ESTADÍSTICA DESCRIPTIVA CON R”

ͳͷ͸

Proponer la hipótesis

La prueba de hipótesis pretende probar la validez de una hipótesis propuesta sobre la población a través de una muestra. Consta de dos partes: La hipótesis nula, y; la hipótesis alternativa.

Hipótesis nula: Afirmación que relaciona atributos para el juicio acerca de la suposición propuesta, se denota con Ho. Siempre esta ligada a un signo de igualdad.

Hipótesis alternativa: Se consideraría válida si la hipótesis nula resulta rechazada, se denota con H1 o Ha. La hipótesis alternativa (Ha) se contrapone a Ho y se valida cuando se rechaza Ho.

Es posible plantear la prueba de hipótesis de dos colas donde el valor crítico estará entre −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼/2 y +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼/2}. Ecuación 6.0:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 = 𝜇𝜇𝜇𝜇₀ [6.0]

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 ≠ 𝜇𝜇𝜇𝜇₀

También se conciben pruebas de hipótesis de una cola donde el valor crítico se localiza en +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼}, en cuyo caso se utiliza la ecuación 6.1:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 ≥ 𝜇𝜇𝜇𝜇₀ [6.1]

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 < 𝜇𝜇𝜇𝜇₀

Otro caso de la prueba de hipótesis de una cola es cuando el valor crítico está en −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼 para lo cual se utiliza la ecuación 6.2:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 ≤ 𝜇𝜇𝜇𝜇0 [6.2]

𝐻𝐻𝐻𝐻1: 𝜇𝜇𝜇𝜇 > 𝜇𝜇𝜇𝜇0

Cabe indicar que una vez definido el planteamiento de hipótesis, se establece el coeficiente de confianza (CC) y el nivel de significancia(𝛼𝛼𝛼𝛼), donde debe cumplirse con la ecuación 6.3:

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 + 𝛼𝛼𝛼𝛼 = 1 [6.3]

El nivel de significancia (𝛼𝛼𝛼𝛼/2) define la zona de no rechazo de Ho.

Para crear los gráficos de prueba de hipótesis con R se deben aplicar conceptos previamente ilustrados. Lo primero que vamos hacer es que basados en la teoría del límite central, la distribución normal estándar irá de (-3,3) por esa razón tenemos que z=seq(-3,3, by=0.1 ) lo que significa que se genera z desde -3 a 3 en pasos de 0.1. Obtenido los valores de z aplicamos la función dnorm(z) para obtener los valores de y de cada z, con esto podemos dibujar la distribución normal estándar.

El valor crítico (vc) y el valor de z de la muestra (zm) se calculan mediante el uso de la función qnorm() y la fórmula 6.4, respectivamente.

“ESTADÍSTICA DESCRIPTIVA CON R”

ͳͷ͸

Proponer la hipótesis

La prueba de hipótesis pretende probar la validez de una hipótesis propuesta sobre la población a través de una muestra. Consta de dos partes: La hipótesis nula, y; la hipótesis alternativa.

Hipótesis nula: Afirmación que relaciona atributos para el juicio acerca de la suposición propuesta, se denota con Ho. Siempre esta ligada a un signo de igualdad.

Hipótesis alternativa: Se consideraría válida si la hipótesis nula resulta rechazada, se denota con H1 o Ha. La hipótesis alternativa (Ha) se contrapone a Ho y se valida cuando se rechaza Ho.

Es posible plantear la prueba de hipótesis de dos colas donde el valor crítico estará entre −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼/2 y +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼/2}. Ecuación 6.0:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 = 𝜇𝜇𝜇𝜇₀ [6.0]

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 ≠ 𝜇𝜇𝜇𝜇₀

También se conciben pruebas de hipótesis de una cola donde el valor crítico se localiza en +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼}, en cuyo caso se utiliza la ecuación 6.1:

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 < 𝜇𝜇𝜇𝜇₀

Otro caso de la prueba de hipótesis de una cola es cuando el valor crítico está en −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼 para lo cual se utiliza la ecuación 6.2:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 ≤ 𝜇𝜇𝜇𝜇0 [6.2]

𝐻𝐻𝐻𝐻1: 𝜇𝜇𝜇𝜇 > 𝜇𝜇𝜇𝜇0

Cabe indicar que una vez definido el planteamiento de hipótesis, se establece el coeficiente de confianza (CC) y el nivel de significancia(𝛼𝛼𝛼𝛼), donde debe cumplirse con la ecuación 6.3:

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 + 𝛼𝛼𝛼𝛼 = 1 [6.3]

El nivel de significancia (𝛼𝛼𝛼𝛼/2) define la zona de no rechazo de Ho.

El valor crítico (vc) y el valor de z de la muestra (zm) se calculan mediante el uso de la función qnorm() y la fórmula 6.4, respectivamente.

ͳͷ͸

Proponer la hipótesis

La prueba de hipótesis pretende probar la validez de una hipótesis propuesta sobre la población a través de una muestra. Consta de dos partes: La hipótesis nula, y; la hipótesis alternativa.

Hipótesis nula: Afirmación que relaciona atributos para el juicio acerca de la suposición propuesta, se denota con Ho. Siempre esta ligada a un signo de igualdad.

Hipótesis alternativa: Se consideraría válida si la hipótesis nula resulta rechazada, se denota con H1 o Ha. La hipótesis alternativa (Ha) se contrapone a Ho y se valida cuando se rechaza Ho.

Es posible plantear la prueba de hipótesis de dos colas donde el valor crítico estará entre −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼/2 y +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼/2}. Ecuación 6.0:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 = 𝜇𝜇𝜇𝜇₀ [6.0]

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 ≠ 𝜇𝜇𝜇𝜇₀

También se conciben pruebas de hipótesis de una cola donde el valor crítico se localiza en +𝑍𝑍𝑍𝑍_{𝛼𝛼𝛼𝛼}, en cuyo caso se utiliza la ecuación 6.1:

𝐻𝐻𝐻𝐻₁: 𝜇𝜇𝜇𝜇 < 𝜇𝜇𝜇𝜇₀

Otro caso de la prueba de hipótesis de una cola es cuando el valor crítico está en −𝑍𝑍𝑍𝑍𝛼𝛼𝛼𝛼 para lo cual se utiliza la ecuación 6.2:

𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻ó𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝐻𝐻𝐻𝐻𝑡𝑡𝑡𝑡 = {𝐻𝐻𝐻𝐻⁰: 𝜇𝜇𝜇𝜇 ≤ 𝜇𝜇𝜇𝜇0 [6.2]

𝐻𝐻𝐻𝐻1: 𝜇𝜇𝜇𝜇 > 𝜇𝜇𝜇𝜇0

Cabe indicar que una vez definido el planteamiento de hipótesis, se establece el coeficiente de confianza (CC) y el nivel de significancia(𝛼𝛼𝛼𝛼), donde debe cumplirse con la ecuación 6.3:

𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 + 𝛼𝛼𝛼𝛼 = 1 [6.3]

El nivel de significancia (𝛼𝛼𝛼𝛼/2) define la zona de no rechazo de Ho.

El valor crítico (vc) y el valor de z de la muestra (zm) se calculan mediante el uso de la función qnorm() y la fórmula 6.4, respectivamente.

ͳͷ͹

Suponga que el valor crítico es vc= 2 y zm no será tomado en cuenta. El valor crítico vc se marca con un punto color negro y zm con un punto color gris usando la función point(vc, 0, …) o point(zm, 0, …). El valor del eje x puede ser vc o zm mientras que para el eje y es cero. El valor de vc se escribe en el eje x usando la función axis(), el parámetro at indica en qué posición (at=c(- vc, 0, vc)) del eje x se ubican los labels (labels=c(“VC=-α/2”,“0”, “VC=α/2”)).

Por último, tenemos que sombrear la zona de rechazo de la prueba de hipótesis. Para ello se usa una variable x que define el o los segmento (s) del eje x que estará (n) sombreado (s). Cuando se sombrea el eje negativo de z, los valores vienen desde -3 hasta el valor crítico (x=seq(-3, vc, by=01)) mientras que si se trata del eje positivo de z vamos desde el valor crítico hasta 3 (x=seq(- 3, vc, by=01)). La densidad para cada x se lo calcula con y=dnorm(x).

Para ubicar el polígono que irá sombreado se usa la función polygon(c(-3,x,-abs(vc)), c(0,y,0), col=“grey95”). Recuerde que para el eje negativo de z iniciamos el polígono con el punto (-3,0), avanzamos con (x,y) y terminamos el polígono con (-3,-vc), para el eje positivo iniciamos el polígono con el punto (vc,0), avanzamos con (x,y) y terminamos el polígono con (3,0). De esta manera configuramos la función polygon(). La zona de no rechazo siempre la escribiremos dentro de la campana del gráfico con la función text().

# GENERAR LOS VALORES DE Z z=seq(-3,3,by=0.1)

# APLICAR LA FUNCIÓN DENSIDAD PARA Z y=dnorm(z)

# VALOR CRÍTICO vc=2

# GRÁFICO DE LA DISTRIBUCIÓN NORMAL ESTÁNDAR par(mar=c(4,3,1,1))

plot(z,y

, xaxt = "n" # SIN ETIQUETAS EL EJE Z , main="Prueba de Hipótesis μ=μo"

, ylim = c(0,0.45) , type="l"

, lwd=1

, col="gray20"

, frame=F)

# PINTAR LA ZONA DE RECHAZO CON μ=μo

# HIPÓTESIS μ>=μo

x=seq(-3,-abs(vc),by=0.01) y=dnorm(x)

polygon(c(-3,x,-abs(vc)), c(0,y,0), col="grey95")

# HIPÓTESIS μ<=μo

x=seq(abs(vc),3,by=0.1) y=dnorm(x)

polygon(c(abs(vc),x,3),c(0,y,0),col="grey95") text(0, 0.14, "Región de", cex=0.8)

text(0, 0.1, "NO RECHAZO", cex=0.8)

# LINEA DE Z=0

“ESTADÍSTICA DESCRIPTIVA CON R”

ͳͷͺ

abline(v=0, lty=2, col="gray40")

# ESCRIBIR EL VALOR CRÍTICO EN EL EJE axis(1

, at = c(-vc, 0, vc) , font = 8

, col.axis = "gray20"

, labels = c("VC=-α/2","0", "VC=α/2"))

# PUNTOS DEL VALOR CRÍTICO

points(-vc,0, cex=1, pch=19, col="black") points(vc,0, cex=1, pch=19, col="black")

Figura 6.0 Pruebas de hipótesis de dos colas

La figura 6.0 presenta el gráfico para una prueba de hipótesis para la media de dos colas (μ=μo).

Sin embargo, el código puede adaptarse perfectamente para pruebas de hipótesis de una cola por izquierda (μ>=μo) y por derecha (μ<=μo).

Tipos de errores

• Error tipo I: El error tipo I se produce cuando el investigador rechaza una hipótesis nula cuando es verdadera. El término nivel de significancia (α) se usa para expresar la probabilidad de error de Tipo I mientras se prueba la hipótesis.

• Error tipo II: Aceptar una hipótesis nula falsa H0 se conoce como error tipo II. El término potencia de la prueba (β) se usa para expresar la probabilidad de error de Tipo II mientras se prueba la hipótesis.

En la toma decisiones podría aparecer uno de los dos tipos de error al intentar validar la prueba de hipótesis. Por lo tanto, es necesario tener la suficiente evidencia estadística para no incurrir en ellos. Los errores de tipo I y II se resumen en la tabla 6.1

Tabla 6.1 Tipos de errores en la prueba de hipótesis Toma de decisión Ho es verdadera Ha es falsa No rechazar Ho Decisión correcta Error tipo II Rechazar Ho Error tipo 1 Decisión correcta

“ESTADÍSTICA DESCRIPTIVA CON R”

ͳͷͺ

abline(v=0, lty=2, col="gray40")

# ESCRIBIR EL VALOR CRÍTICO EN EL EJE axis(1

, at = c(-vc, 0, vc) , font = 8

, col.axis = "gray20"

, labels = c("VC=-α/2","0", "VC=α/2"))

# PUNTOS DEL VALOR CRÍTICO

points(-vc,0, cex=1, pch=19, col="black") points(vc,0, cex=1, pch=19, col="black")

Figura 6.0 Pruebas de hipótesis de dos colas

La figura 6.0 presenta el gráfico para una prueba de hipótesis para la media de dos colas (μ=μo).

Sin embargo, el código puede adaptarse perfectamente para pruebas de hipótesis de una cola por izquierda (μ>=μo) y por derecha (μ<=μo).

Tipos de errores

Tabla 6.1 Tipos de errores en la prueba de hipótesis Toma de decisión Ho es verdadera Ha es falsa No rechazar Ho Decisión correcta Error tipo II Rechazar Ho Error tipo 1 Decisión correcta

ͳͷͺ

abline(v=0, lty=2, col="gray40")

# ESCRIBIR EL VALOR CRÍTICO EN EL EJE axis(1

, at = c(-vc, 0, vc) , font = 8

, col.axis = "gray20"

, labels = c("VC=-α/2","0", "VC=α/2"))

# PUNTOS DEL VALOR CRÍTICO

points(-vc,0, cex=1, pch=19, col="black") points(vc,0, cex=1, pch=19, col="black")

Figura 6.0 Pruebas de hipótesis de dos colas

La figura 6.0 presenta el gráfico para una prueba de hipótesis para la media de dos colas (μ=μo).

Sin embargo, el código puede adaptarse perfectamente para pruebas de hipótesis de una cola por izquierda (μ>=μo) y por derecha (μ<=μo).

Tipos de errores

Tabla 6.1 Tipos de errores en la prueba de hipótesis Toma de decisión Ho es verdadera Ha es falsa No rechazar Ho Decisión correcta Error tipo II Rechazar Ho Error tipo 1 Decisión correcta

ͳͷͻ

In document ESTADISTICA DESCRIPTIVA CON R.pdf - Repositorio UTEQ (página 161-165)