Medidas de Dispersión y Prueba
de Hipótesis
Objetivos Específicos
• Realizara prueba de hipótesis mediante
análisis de diferentes datos estadísticos de la población.
• Aplicar algunas medidas de dispersion
buscando la variabilidad de un problema de gerencia de servicios de salud.
• Utilizar prueba de hipotesis para rechazar o
Medidas de Dispersion
• Son medidas que muestran la variabilidad de
una distribucion de los datos.
• Las medidas de dispersion son
– Rango
– Varianza
– Desviacion estandar
Rango
• Es la diferencia entre la observación mas
grande y la observación mas pequeña en una muestra.
Cuantilas
• Son valores que dividen los datos en porciones
iguales
• Usualmente las quantilas utilizadas son
cuartilas( 25th, 50th y 75th), deciles (10th,20th… 90th) y percentiles
• Las cuartilas se miden mediante la siguiente
Cuartilas
• Los pasos para realizar quartilas son:
– Poner los datos en un rango de orden.
– Dividir los datos en en un grupo “bajo grupo” y “alto grupo” donde divide a la media en ambos grupos
– Encuentra la media en el grupo bajo
• Esta es la cuartila 1
– Encuentre la media en el grupo alto
• Esta es la cuartila 3
Ejemplo
• Tenemos el siguiente grupo de datos impar
– 2,5,3,6,7,4,9
• 2,3,4,5,6,7,9
• Calcular la media : 5
• Dividir en dos grupos con respecto a la media
– 2,3,4,5,6,7,9
• Calcule la media de los dos grupos
– 2, 3 , 4, 5 , 6 , 7,9
Ejemplo
• Cuartilas en un grupo de datos par:
– 2,5,3,4,6,7,1,9
– 1,2,3,4,5,6,7,9
– 4+5/ 2= 4.5
– 1, 2, 3 , 4 ,5 , 6 ,7 ,9
Varianza
• Nos da un estimado de la variabilidad en un
Practiquemos
• Un grupo de datos cuya media es 6
– 2, 3, 6, 8, 11
• Calcule la Varianza
Desviacion estandar
• Es un estimado de la variabilidad promedio de un grupo de datos medidos en las mismas unidades de medidas de los datos originales. Es la raiz
cuadrada de la varianza
Practiquemos
• Un grupo de datos cuya media es 6
– 2, 3, 6, 8, 11
• Calcule la Varianza
– Varianza= 15.75
• Calcule la desviacion estandar
Coeficiente de variación
• Cuando se trata de la variabilidad en muestras
diferentes con diferentes medias, el
Practiquemos
• Una distribución tiene x = 140 y σ = 28.28 y
otra distribucion x = 150 y σ = 24.
– C.V1= 20.2%
– C.V2= 16%
• ¿Cuál de las dos presenta mayor dispersión?
Conceptos basicos
• Estimacion- cuando se interesa estimar los
valores especificos de los parametros de una poblacion
• Prueba de hipotesis- Se ocupa de probar si el
valor del parametro de una poblacion es igual a algun valor especifico.
• Estimaciones de intervalo- es un rango entre
HIPÓTESIS
Es una proposición o aseveración que se
postula como una posible explicación de la relación entre las variables estudiadas.
Se formula cuando existe información para
HIPÓTESIS DE INVESTIGACIÓN
La hipótesis de investigación establece la
relación entre las variables de estudio
que el investigador plantea como el
resultado esperado. Esta es una
HIPÓTESIS ESTADÍSTICA
La hipótesis estadística define una relación aritmética
entre medidas de resumen de uno o más grupos.
Las medidas identifican las variables a ser evaluadas.
• Hipótesis nula
Planteamiento de la hipotesis nula y
alterna
• La hipotesis nula (H0) en el procedimiento de prueba de hipotesis es aquella que plantea que no hay diferencia.
– Es la que contradice a la hipotesis alterna
– Es la que lleva el signo de igualdad
– Existe la direccional y la no direccional
• Direccional- el parametro no es diferente a lo establecido. Dos colas
• No direccional- el parametro es menor o mayor a lo establecido. Una cola
Ejemplos de hipótesis
• Hipótesis de Investigación:
• El peso de los niños alimentados con fórmula
es diferentte del peso de los niños lactados.
– Ho: µ1 = µ2
Ejemplo a discutir
• ¿Cual de los planteamientos de hipotesis esta
mal?
– Ho: u= 100 vs Ha: u ≠ 110
• Las hipótesis nula y la hipotesis alternativa se deben configurar de una forma Que Una de las dos sea cierta.
– Ho: =100 vs Ha: <100
• La hipotesis debe guiar al parametro no a la estadistica
– Ho: p=.50 vs Ha: p ≠ .50
Prueba de Hipótesis
•El objetivo de una prueba de hipótesis es ayudar al investigador a llegar a una conclusión sobre el
parámetro de una población basado en la muestra.
•Con las pruebas de hipótesis se determina si las
Prueba de Hipotesis
• El procedimiento de la prueba de hipotesis se
divide en los siguientes componentes
– Plantea la hipotesis nula y la alterna.
– Luego calcula la prueba estadistica apropiada
– Convierte la prueba estadistica en un valor p
Pasos para realizar una prueba de
Hipotesis
1. Datos- entender los datos
2. Establecer los supuestos-hacer suposiciones en cuanto a la distribucion normal de la
poblacion
Ejercicio de práctica:
• Seleccione un tema que le interesa estudiar.
Escriba una proposición que represente una hipótesis de investigación en termino de la media o la proporción de la variable a
estudiar.
– Escriba las hipótesis estadísticas que
Pasos para realizar la prueba de
Hipotesis
4. Seleccionar la estadistica de prueba
• Se determina dependiendo de la prueba de hipótesis que se este llevando a cabo y el tipo de variable que se expresa en la hipótesis.
• Pruebas de hipótesis sobre la media se calcula Z ó t dependiendo de los supuestos.
• Pruebas sobre la proporción se calcula Z.
Selección de prueba estadística de
acuerdo al diseño y al tipo de variable
Diseño Tipo de variable Prueba Estadística Un grupo Proporciones
Cuantitativas
Prueba Z
Prueba t, prueba Z
Dos grupos independientes Proporciones Rango Cuantitativas
Fisher, Ji cuadrada, Prueba Z U de Mann-Whitney
Prueba t no pareada, prueba Z
Dos grupos relacionados Proporciones Rango Cuantitativas
McNemar, Binomial Signos, Wilcoxon
Prueba t pareada, Correlación de Pearson
Tres o más grupos independientes Proporciones Rango Cuantitativas Ji cuadrada Kruskal-Wallis ANOVA
Tres o más grupos relacionados
Proporciones Rango Cuantitativas
Q de Cochran Friedman
ANOVA con observaciones repetidas
Multivariado Proporciones Cuantitativas
Pasos la prueba de Hipotesis
5. Distribucion de la estadistica de prueba
– La distribución muestral es la clave para la inferencia estadística.
– En algunos casos hay que especificar la distribución de probabilidad de la estadística de prueba
6. Establecer regla de decision
– Determinar el valor(es) crítico(s) de la estadística de prueba teniendo en consideración si es no-direccional o direccional.
6. Establecer regla de decisión
6. Establecer regla de decisión
Pasos para la prueba de hipotesis
• 7. Calcular la estadística de prueba
Estadística de prueba =
estadística de la muestra observada – valor a probar
Pasos para la prueba de Hipotesis
8. Tomar decisión estadística
• Se rechaza o no se rechaza la hipótesis nula.
• Comparar estadística de prueba calculada con
Decisiones de una prueba estadística
Hipótesis nula (Ho)
Verdadera Falsa
Hipótesis nula
No Rechazo 1 – α
confianza
β Error tipo II
Rechazo Α
Error tipo I
Errores en las decisiones de prueba
estadistica
• Error tipo 1-es la probabilidad de rechazar la
Ho cuando esta es correcta.
• Error tipo 2- es la probabilidad de aceptar la
Decisiones de una prueba estadística
• Nivel de confianza – Probabilidad de no rechazar (aceptar) la hipótesis nula cuando es verdadera. Decisión correcta.
• Nivel de significancia – La probabilidad de cometer error tipo I. Esto es rechazar la hipótesis nula siendo verdadera. Se conoce como alfa (α)
• Error tipo II- Probabilidad de no rechazar (aceptar) la hipótesis nula siendo falsa.
Pasos para probar una hipotesis
9. Conclusión
• Si la hipótesis se rechaza:
– Se concluye que los datos son consistentes con la hipótesis alterna.
• Si no se rechaza:
Pasos para probar una hipotesis
10. Valor p e intervalos de confianza
• Valor p – Es el valor que se obtiene para una prueba de hipótesis que representa la probabilidad de que la
estadística de prueba calculada sea ese número o más, bajo la hipótesis nula presentada.
p = P (X >x/ Ho es cierta)
• Determinar valor p correspondiente a la estadística de prueba calculada y compararlo con el alfa (α).
– Si el valor de p obtenido es menor que el valor de alfa (α) se dice que el resultado es significativo.
Valor p e intervalos de confianza
• Intervalos de confianza – Son dos valores numéricos
que con un grado específico de confianza, se considera que incluye el parámetro por estimar.
• Evaluar los intervalos de confianza.
– Es el rango de valores que un parámetro puede tomar a un nivel de significancia dado. Estimador por intervalo. Se
calcula:
Resumen:
Pasos para llevar a cabo una prueba de hipótesis
1. Evaluar datos Es importante entender los datos (medias o proporciones) recopilados ya que de esto depende la prueba estadística que se va a realizar.
2. Repasar supuestos Se utilizan los mismos supuestos que utilizamos cuando construimos intervalos de confianza; igualdad de varianzas,
normalidad de los datos e independencia de muestras.
3. Establecer hipótesis Establecer la hipótesis nula y alterna. Determinar el parámetro a evaluar y la dirección de la evaluación (una cola, dos colas).
Resumen:
Pasos para llevar a cabo una prueba de hipótesis
5. Determinar la distribución de la estadística.
La distribución muestreal es la clave para la inferencia estadística.
6. Establecer regla de decisión (α) Área de rechazo y no rechazo de la hipótesis nula.
7. Calcular la estadística de prueba Usar los datos para calcular la estadística de prueba
8. Tomar decisión estadística Se rechaza o no se rechaza la hipótesis nula.
9. Concluir Si la hipótesis se rechaza, concluimos que los datos son consistentes con la hipótesis alterna. Si no se rechaza decimos que los datos son consistentes con la hipótesis nula.
Tipos de Inferencia
• Estimacion- estimar el valor del parametro
– “¿Cuales son los valores de m o p?”
• Prueba de
Hipotesis-– Decidir el valor del parametro basado en alguna idea preconcebida
Distribucion del muestreo
• La distribucion del muestreo muestra la relacion entre la probabilidad de la estadistica y el valor de la estadistica para todas las posibles muestras de tamano n dibujado de una poblacion .
• La medida de la distribucion de muestreo es
definida en la misma forma que en cualquier otra distribucion .
Relacion entre poblacion y muestra
• Una muestra aleatoria es una seleccion de algunos miembros de la poblacion tal que cada miembro es independientemente escogido y tiene probabilidad de ser seleccionado.
Estimacion de la media y el error
estandar de una distribucion de datos
• Dejar X1,X2…Xn sea una muestra aleatoria de una poblacion con una media y una varianza.
• La muestra significa que en repetidas muestras aleatorias el tamano n de una poblacion tiene una varianza σ ²/n.
• La desviacion estandar de un grupo de medias de muestra es por tanto σ/ √ n y esto se refiere al error estandar de la media.
Ejemplo
• Suponer que una mujer quiere estimar su dia exacto de ovulación para propósitos de evitar embarazos. Existe una teoría que dice que en el momente de ovulación la temperatura del cuerpo incrementa de .5 a 1.0 grados Farenheit. Estos cambios pueden ser utilizados para saber el dia de ovulación. Utilizando este método necesitamos saber la temperatura basal durante el
Solucion al ejemplo
• Calcule la media
– =97.2
• Calcule la desviacion estandar
σ = .13
– 97.2
Teorema del Limite Central
• Las muestras grandes pueden aproximarse a una distribucion normal
– Mientras mas grande el numero de muestra tiende a acercarse a una distribucion normal.
• Por lo tanto cuando sabemos la desviacion estandar de la poblacion y que se tiene una distribucion
Prueba de Z de la distribucion normal
• La prueba de Z se determina con la siguiente
formula:
– U0 representa el valor de la media de la poblacion
especificada por la hipotesis nula
Como interpretar los valores de Z
• Z=0 representa un elemento igual a la media
• Z= 1 representa un elemento es 1 desviacion
estandar mas grande que la media
• Z= 2 el elemento es dos veces mas grande que
la media
• Z=-1 que es un elemento menor a la media
• Z=-2 que es dos elementos mas pequenos que
Ejemplos
• El peso de hombres de 20-29 anos donde H0:
u=170 y Ha= u>170 en una poblacion con una desviacion estandar de 40 libras. La muestra aleatoria es n= 64
– ¿Cuál es la estadistica de Z para una muestra en la cual = 173?
Valor - P
• La estadistica de Z se convierte a un
enunciado de probabilidad llamado “p-value”.
• Valores de p pequenos muestran una buena
Nivel de Significancia
• Frecuentemente se habla del nivel de
significancia de una prueba.
-P > .10 se observa que la diferencia es no significativa
- .05<P < .10 se observa una diferencia no tan significativa
- .01<P < .05 se observa una diferencia significativa - Cuando P < se observa diferencia altamente
Intervalos de confianza
• Los intervalos de confianza pueden ser construidos al
95%, este porciento puede contener el parametro u.
• Los factores que afectan los intervalos de confianza
son:
– n – si el tamano de muestra incrementa el largo de los intervalos de confianza decrese
– S- como desviacion estandar puede reflejar la variabilidad de la distribucion de las observaciones individuales, si
incrementa el largo del intervalo incrementa
Distribucion de T test student
• La distribucion de t es la probabilidad de
distribucion que se usa para los parametros de la poblacion cuando la muestra es pequena y la
varianza es desconocida.
• La distribucion de t tiene las siguientes propiedades:
– La media tiene un distribucion igual a 0
– La varianza es igual a df/(df-2) donde df son los grados de libertad y es > 2
One Sample T test
• El examen de una cola es la prueba en la cual
los valores del parametro van a ser estudiados bajo la hipotesis alterna que sus valores seran mas grandes o mas pequenos que los valores del parametro de la hipotesis nula
– Ho: u=u0 – Ha: u<u0
• T= - u0