Cuando el tamaño de la muestra de la cual se obtuvo la estimación de la media poblacional es grande (≥30) y se conoce el valor de la varianza, se utiliza la distribución Z (normal estandarizada) para realizar pruebas de hipótesis referidas a µ. Esto surge a partir del Teorema Central del Límite, que afirma que la media muestral tendrá una distribución normal, independientemente de la distribución de la variable original.
Al realizar una investigación, el investigador usualmente se plantea una hipótesis; si estudia a toda la población podrá aceptar o rechazar dicha hipótesis con toda certeza, pero si no puede estudiar la población total sino una muestra, entonces deberá seguir un proceso por medio del cual decidirá si aceptar o no su hipótesis con un riesgo conocido de estar equivocado. En eso consiste el proceso de Contraste de Hipótesis, aspecto cuyo aprendizaje reviste gran importancia no solo para quienes realizan investigación sino también para los profesionales que, para actualizar sus conocimientos, requieren de lecturas de artículos científicos en su especialidad. En este material se hace una breve explicación de los fundamentos del contraste de hipótesis y se exponen los elementos que deben ser considerados para seleccionar la pruebaestadística adecuada a los datos, acompañando la lectura de ejercicios que deberán ser resueltos y discutidos con el facilitador para asegurar el aprendizaje deseado. Se anexa a la guía un material complementario donde se presentan varios casos de investigaciones con sus datos respectivos y se detallan para cada uno de ellos, todos los pasos realizados para verificar si la hipótesis planteada puede o no ser aceptada.
Para comprobar la hipótesis específica N° 2 planteada, se utilizó la estadística de prueba del Chi cuadrado, obteniéndose como valor a 15,624 , lo cual permite afirmar que existe ev[r]
1. Expresar las hipótesis nula y alternativa en términos estadísticos 2. Especificar el nivel de significación, α 3. Determinar el tamaño de la muestra, N 4. Establecer los valores críticos que delimitan las regiones de aceptación y rechazo 5. Determinar la pruebaestadística
Ejemplo intervalo de confianza para la diferencia de proporciones poblacionales: Se desea estimar, con una confianza del 95%, la diferencia en la proporción de plantas sanas entre dos poblaciones. Se tomó una muestra de 300 plantas de la población 1 y 260 de la población 2 y se registró el estado sanitario. Resultó que en la primera muestra 67 plantas de estaban sanas, mientras que en la segunda sólo 45.
El intervalo de confianza de la diferencia de proporciones (40-20%= 20%) de la figura 4, se sitúa entre 0,076 (7,6%) y 0,324 (32,4%). Esto es, tenemos un 95% de confianza de que la diferencia de proporciones poblacional se encuentre en este intervalo. Aunque esto supone adelantarnos a lo que se abordará en próximos artículos sobre contraste de hipótesis, la información que nos da el intervalo de confianza, nos per- mite decir que la muestra 1 tiene mayor porcentaje que la muestra 2 (imaginemos que fuera éxito de tratamiento), por- que en el intervalo de confianza no está incluido el 0% (valor nulo que indica ausencia de diferencias), con un riesgo de error menor del 5% (p <0,05).
Uno de los mecanismos, que ha utilizado tanto la psicología como las ciencias sociales para la prueba de hipótesis y la inferenciaestadística, ha con- sistido tradicionalmente en el uso de los p-valores y la estrategia de prueba de hipótesis de nulidad (PHN). Con base a esta estrategia, se han derivado los modelos teóricos o hipótesis de investigación. Estadísticamente hablando, no importa si la hipótesis de nulidad es teóricamente significativa, sólo interesa que prediga algo no predicho por la hipótesis de investigación. El uso de esta estrategia se justifica al disponer de una hipótesis que ha de ser rechazada para aceptar, de este modo, la hipótesis de investigación. Ante un supuesto “efecto” de magnitud desconocida, los investigadores asumen la hipótesis de un “no efecto” o “efecto nulo” como contrapunto o contra-hipótesis, de forma que esta contra-hipótesis es la que se somete a prueba. Desde esta perspectiva, no importa conocer la magnitud de un efecto o su significación sustantiva, basta con que se demuestre que la hipótesis de “no efecto” no se deriva de los datos. Nótese cómo, desde esta perspectiva, la hipótesis nula no parece aportar infor- mación nueva alguna. Supóngase, por ejemplo, que se prueba la no diferencia entre personas jóvenes y mayores en la asunción de riesgo en la conducción. En ese caso, el rechazo de la hipótesis nula no aporta más conocimiento del que se tiene sobre esta diferencia, por otra parte, bien establecida.
Si es factible (probable) obtener un valor de la estadística del test como el obtenido con nuestros datos, bajo el supuesto que H0 es cierta, entonces no tenemos evidencia para rechazarla. En caso contrario los datos muestran cierta evidencia para pensar que H0 debe ser descartada. El valor de esta probabilidad es comparado con el nivel de significación del test, si la probabilidad asociada es menor que el nivel de significación se rechaza la hipótesis nula y en caso contrario ésta es aceptada. Una vez tomada la decisión se debe realizar la conclusión en términos del problema que se está estudiando, generalmente el experto en el área es quien formula la misma.
Entonces para 10 grados de libertad y un nivel de significación del 5% en la tabla “t” obtenemos el valor crítico o teórico de 2,228. Como en nuestro calculo hemos ob- tenido el valor de “t” igual a 2,929, o sea mayor que el dato de la tabla, entonces se debe concluir que la diferencia entre los dos valores medios es significativo, pues sólo existe el 2% de probabilidad de que las dos muestras pertenezcan a la misma pobla- ción; entonces el segmento de turistas A (USA) es superior al segmento del turista B (Europa) en cuanto a las propiedades del gasto medio día.
60. (2002-M4-A-3II) (2 puntos) En un pueblo habitan 700 hombres adultos, 800 mujeres adultas y 500 menores. De él se quiere seleccionar una muestra de 80 personas, utilizando, para ello, muestreo estratificado con afijación proporcional. ¿Cuál será la composición que debe tener dicha muestra?
En general, la estadística se ha convertido en una herramienta imprescindible en el campo de las ciencias sociales, en los trabajos de investigación y a la hora de desarrollar profesionalmente tareas relacionadas con la gestión, la interpre- tación de datos y la toma de decisiones.
La aplicación de un contraste paramétrico de este tipo requiere la normalidad de las observaciones para cada uno de los grupos. La comprobación de esta hipótesis puede realizarse tanto por métodos gráficos (por medio de histogramas, diagramas de cajas o gráficos de normalidad) como mediante tests estadísticos (test de Kolmogorov-Smirnov, test de Shapiro-Wilks). Un número suficiente de observaciones (digamos mayor de 30) justifica la utilización del mismo test. Así mismo, este tipo de metodología exigirá que la varianza en ambos grupos de observaciones sea la misma. En primer lugar se desarrollará el test t de Student para el caso en el que se verifiquen ambas condiciones, discutiendo posteriormente el modo de abordar formalmente el caso en el que las varianzas no sean similares.
7. (2001-M4-A-3II) (2 puntos) Se sospecha que el número de unidades que contiene cada dosis de un medicamento no llega a las 10000 que se indican en el envase. Para comprobar que el contenido medio de las dosis es el indicado tomamos, al azar, 100 dosis y determinamos el número de unidades de cada una, obteniendo de media 9940 unidades y de desviación típica 120 unidades. ¿Qué podemos decir sobre la indicación del envase, para un nivel de confianza del 99 % ?
TIPOS DE PROBLEMAS DE INFERENCIA ESTADÍSTICA DE UNA POBLACIÓN CUYA VARIABLE ALEATORIA ES NORMAL Caso 1º Cálculo de un intervalo de confianza para la media muestral Consiste en construir [r]
−→ Suponemos que los datos han sido generados de acuerdo con un modelo de probabilidad que es desconocido en alguno de sus aspectos.. Basándonos en los datos y en las características con[r]
Realizada la prueba de hipótesis y coeficiente de correlación Rs de Spearman, que el p valor (Sig = .00) de prueba es menor que .05 del nivel de significancia teórica; por tanto se re[r]
4. Se sabe que en una muestra de 36 alumnos se ha medido la variable “velocidad lectora” y el valor obtenido para la media ha sido 9,6. Suponiendo que esta variable tiene una distribu- ción normal en la población con una desviación típica de 4,9, ¿se puede aceptar la hipótesis de que la media poblacional de esta variable es µ = 15, con un riesgo igual o menor al 5 %? Solución:
Berenson, Levine. (2000). Estadística para la Administración y la Economía. Bogotá: McGrawHill Chao, Lincoln. (1998). Estadística para las ciencias Administrativas. Bogotá: McGrawHill. Bogotá. Feller, W. (1973). Teoría de Probabilidades y sus Aplicaciones, 2ª ed. México: Limusa-Wiley. Fraser, D.A.S. (1976). Fundamentos y Técnicas de la InferenciaEstadística. México: Limusa. Freund, J., Smith, R. M. (1989). Estadística, 4ª ed. Prentice Hall..
Si se tiene una muestra representativa de una población, es factible medir en cada una de las unidades de muestreo las variables de interés. Una población puede caracterizarse en función de una o varias variables. De este modo, a cada elemento de la población le corresponde una variable aleatoria cuya notación estadística por convención es x . Los subíndices de x indicarán la variable de que se trate. Por ejemplo, si hemos tomado registro de tres variables diferentes, estas se designarán como. x 1 ; x 2 ; x 3 . De esa manera quedan identificadas población y variable aleatoria asociada. Así en teoría de la inferencia población será el conjunto de individuos que nos interesa estudiar, y variable aleatoria asociada será la característica que medimos en los individuos.
Siguiendo con antecedentes españoles, Jiménez y Ortiz (1992) realizó un estudio evolutivo utilizando la Prueba de Segmentación Lingüística (PSL) teniendo como objetivo analizar el curso evolutivo de la conciencia fonológica, seleccionó una muestra de 290 niños que cursaban la educación infantil, procedentes de colegios públicos de nivel socio económico bajo, se realizó un estudio longitudinal hasta que finalizaron el segundo curso de primaria. Y al ser la conciencia fonológica no homogénea, se analizó su evolución, según la estructura factorial del PSL. Entre los resultados hallados se encuentran: que la segmentación silábica resultaba más fácil que resolver en relación a la segmentación fonémica; siendo las sílabas unidades de lenguaje que demandan menor esfuerzo analítico. Así también les resultó más fácil a los niños el omitir sílabas en posición inicial, omitir sonidos vocálicos en posición inicial, aislar sonidos consonánticos. Al finalizar el periodo de educación infantil, las puntuaciones fueron bajas cuando debían descubrir si la sílaba final es igual en pares de palabras, en segmentación léxica el rendimiento es mejor cuando tienen que descubrir el número de palabras que tiene una oración que no incluye nexos. Finalmente concluyen que las tareas de segmentación silábica son más fáciles que las de segmentación fonémica y evolutivamente el conocimiento de las sílabas precede al conocimiento de los fonemas.