• No se han encontrado resultados

Trabajo Final Control (1)

N/A
N/A
Protected

Academic year: 2021

Share "Trabajo Final Control (1)"

Copied!
26
0
0

Texto completo

(1)

1. En un estudio estadístico, ¿qué es una población y para qué se toma una muestra?

La población de un estudio estadístico es el conjunto de elementos objeto de estudio. Cada elemento se denomina individuo. Cuando el número de individuos de la población es muy grande, tomamos una parte de ésta, denominada muestra. La muestra es un subconjunto de la población y tiene que ser representativa de la misma.

2. ¿Qué significa probar una hipótesis?

Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para toda la población.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero.

3. ¿Qué implica realizar una estimación puntual y en qué consiste la estimación por intervalo para la media?

 ESTIMACION PUNTUAL

Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media µ, o la desviación estándar σ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado (x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional.

 ESTIMACION POR INTERVALO PARA LA MEDIA

Dada una población X, que sigue una distribución cualquiera con media µ y desviación estándar σ.

Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media de la población µ esté contenida en él es de 0,95. Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel de confianza (1 - α) del intervalo es la

(2)

probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza era del 95% (α = 0,05).

4. ¿Por qué no es suficiente la estimación puntual y por qué se tiene que recurrir a la estimación por intervalo?

- Porque la estimación puntual dirá poco sobre el parámetro cuando la varianza ente una estimación y la otra es muy grande.

- Porque dicho intervalo de confianza indicara un rango donde puede estar el parámetro con cierto nivel de seguridad o confianza.

5. Explique el papel que desempeñan las distribuciones de probabilidad en la inferencia estadística.

Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento. Una distribución de probabilidad es similar a la distribución de frecuencias relativas. Sin embargo, en vez de describir el pasado, describe la probabilidad que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales.

Las decisiones estadísticas basadas en la estadística inferencial son fundamentales en la investigación que son evaluadas en términos de distribución de probabilidades.

6. En el contexto de estimación por intervalo, señale en forma específica qué parámetro utiliza cada una de las siguientes distribuciones para realizar estimaciones: T de Student, normal y ji-cuadrada.

T de Student = miu

Chicuadrado = varianza (sigma al cuadrado)

7. Explique qué es un estadístico de prueba y señale su relación con los intervalos de aceptación y rechazo.

Un estadístico de prueba es un número que tiene las dos propiedades siguientes: a) Contienen la información muestral respecto al parámetro de interés.

b) Bajo el supuesto de que la hipótesis nula es verdadera y sigue una distribución de probabilidad conocida

La relación que existe es que hay que calcular el estadístico de prueba ZO para luego

modificar si cae en la región de rechazo o aceptación.

8. ¿Qué son los errores tipo I y tipo II en las pruebas de hipótesis?  ERROR DE TIPO I

Si rechaza la hipótesis nula cuando ésta es verdadera, usted comete un error de tipo I. La probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que usted establece para su prueba de hipótesis. Un α de 0.05 indica que usted está dispuesto a aceptar una probabilidad de 5% de que está equivocado cuando rechaza la hipótesis nula. Para reducir este riesgo, debe utilizar un valor más bajo para α. Sin embargo, si utiliza un valor más bajo para alfa, significa que tendrá menos probabilidades de detectar una diferencia verdadera, si es que realmente existe.

(3)

Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba. Puede reducir su riesgo de cometer un error de tipo II al asegurarse de que la prueba tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo suficientemente grande como para detectar una diferencia práctica cuando ésta realmente exista.

9. Señale y describa de manera breve los tres criterios equivalentes de rechazo de una hipótesis.

10. Mencione un ejemplo de datos o muestras pareadas.

Las muestras pareadas se obtienen usualmente de distintas observaciones realizadas sobre los mismos individuos. Por ejemplo:

Medir la glucosa en 10 personas en la mañana (MUESTRA A) Medir la glucosa de las mismas personas en la tarde (MUESTRA B) Ejercicios de estimación para la media y la desviación estándar

11. En la elaboración de envases de plástico es necesario garantizar que cierto tipo de botella en posición vertical tenga una resistencia mínima de 50 kg de fuerza. Para asegurar esto, en el pasado se realizaba una prueba del tipo pasa-no-pasa, donde se aplicaba la fuerza mínima y se veía si la botella resistía o no. En la actualidad se realiza una prueba exacta, en la que mediante un equipo se aplica fuerza a la botella hasta que ésta cede, y el equipo registra la resistencia que alcanzó la botella.

a) ¿Qué ventajas y desventajas tiene cada método?

Ventajas Desventajas

Prueba del tipo pasa-no-pasa

- Mas rápido y sencillo. - Fácil de aplicar

- Permite determinar con exactitud si la botella resiste los 50kg o no.

- Otorga datos exactos sobre la cantidad máxima de fuerza que puede resistir cada botella. Prueba exacta - No permite conocer la

cantidad máxima de fuerza que puede resistir.

- Tiene mayores costos - Necesita más tiempo y equipo más avanzado. - Es necesario deteriorar las botellas para conocer su resistencia máxima.

b) Para evaluar la resistencia media de los envases se toma una muestra aleatoria de n=20 piezas. De los resultados se obtiene que X=55.2 y S=3. Estime con una confianza de 95% ¿cuál es la resistencia promedio de los envases?

(4)

54,38937525 ≤ µ ≤ 56,01062475

Lo que significa que la resistencia promedio de los envases debe estar en este intervalo para garantizar la confianza de la muestra del estudio c) Antes del estudio se suponía que μ = 52. Dada la evidencia de los datos,

¿tal supuesto es correcto?

El supuesto es incorrecto ya que, con la realización del estudio, se obtuvo el intervalo en donde se debe encontrar el valor de la media poblacional y µ=52 es menor que el límite inferior del intervalo lo que significa que no se incluye dentro de éste, por lo que la suposición previa al estudio no coincide con los resultados posteriores al estudio

d) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)?

Se obtiene que el intervalo de confianza es: 1,317214554 ≤ σ ≤ 2,529715616

Esto significa que el valor de la desviación estándar poblacional se encuentra determinado por este intervalo.

12. Para evaluar el contenido de nicotina en cierto tipo de cigarros elaborados por un proceso se toma una muestra aleatoria de 40 cigarrillos y se obtiene que X = 18.1 mg y S = 1.7.

a) Estime con una confianza de 95%, ¿cuál es la cantidad de nicotina promedio por cigarro?

Al estimar la media poblacional del estudio, se obtuvo el siguiente intervalo de confianza: 17,68571 ≤ µ ≤ 18,51429

Esto significa que el valor de la cantidad promedio de cigarro se encuentra determinada por el intervalo mostrado anteriormente, delimitado por un límite inferior y uno superior.

b) ¿Cuál es el error de estimación en el inciso anterior? El error de estimación es de 0.206155

c) Antes del estudio se suponía que μ = 17.5. Dada la evidencia de los datos, ¿se puede rechazar tal supuesto?

Partiendo de los valores de los límites del intervalo encontrado después del estudio, se puede decir que el supuesto es incorrecto ya que éste es

(5)

menor que el límite inferior del intervalo y no se alcanza a encontrar dentro de este

d) Si se quiere estimar la media con un error máximo de 0.4, ¿qué tamaño de muestra se requiere?

e) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)?

Realizando el procedimiento para estimar la desviación estándar poblacional, se obtiene el intervalo de confianza para esta:

0,98465182 ≤ σ ≤ 1,67417832

El valor de la desviación estándar poblacional se encuentra en el intervalo calculado anteriormente.

f) ¿Qué puede decir sobre la cantidad mínima y máxima de nicotina por cigarro? Es posible garantizar con suficiente confianza que los cigarros tienen menos de 20 mg de nicotina.

Si se puede garantizar con suficiente confianza, pues al momento de hacer el análisis de una muestra representativa de cigarrillos, se encontraron valores máximos y mínimos de la media poblacional de la cantidad de cada uno de ellos. A partir de esto se obtiene un intervalo con un 95% de confianza en donde hay un límite inferior y superior con respecto a la media, que nos indica la tendencia de los valores que representan la cantidad de nicotina en cada uno. Con base en este intervalo, se puede garantizar esto, ya que ambos límites del intervalo son menores a 20 lo que significa que este valor no está incluido dentro del intervalo y que el valor máximo de nicotina presente en los cigarrillos es 18,51429, según la estimación.

13. En un problema similar al del ejercicio 11 es necesario garantizar que la resistencia mínima que tienen un envase de plástico en posición vertical sea de 20 kg. Para evaluar esto se obtuvieron los siguientes datos mediante pruebas destructivas:

(6)

a) Esta variable forzosamente tiene que evaluarse mediante muestreo y no a 100%, ¿por qué?

Se debe realizar mediante muestreo ya que si se evalúa al 100% se tendría que realizar la prueba destructiva a cada uno de los envases de plástico que pertenezcan a la población, la cual es finita pero demasiado grande, entonces implicaría una mayor inversión de tiempo y dinero, lo que no es viable para ningún tipo de estudio o investigación. Por esta razón, se toma una muestra aleatoria representativa de la población y se realizan las pruebas a esta muestra obteniendo los estadísticos correspondientes a ella. Posteriormente, se pueden obtener los mismos estadísticos para la población a partir de los de la muestra a partir de la estimación con un nivel de confianza que garantiza la correspondencia de los valores entre la población y la muestra con un margen de error. Esto es posible hacerlo ya que se considera que las propiedades de la muestra son extrapolables a la población debido a que la muestra es representativa por lo que representa en cantidad y calidad a todos los elementos de la población. En pocas palabras, el muestreo se hace porque permite ahorrar recursos y a la vez obtener resultados parecidos a los que se alcanzarían si se realizara un estudio de toda la población. b) Realice un análisis exploratorio de estos datos (obtenga un histograma y

vea el comportamiento de los datos obtenidos).

Clase Frecuencia

23,7 1 24,6571428 6 0 25,6142857 1 9 26,5714285 7 8 27,5285714 3 12 28,4857142 9 15 29,4428571 4 7

(7)

y mayor 4

El histograma anterior, basado en las pruebas realizadas sobre los envases, permite afirmar, que todos los envases plásticos de la muestra pasan la prueba, pues poseen una resistencia mayor a la que se requiere garantizar. La mayoría de los envases poseen una resistencia superior a 25.6, siendo 27.52 y 28.48 el intervalo de mayor frecuencia para la resistencia de los envases, obtenida mediante las pruebas. El valor máximo obtenido fue 30,4 y el valor mínimo fue 23,7

c) Estime con una confianza de 95%, ¿cuál es la resistencia promedio de los envases?

Estimando el valor de la media poblacional, se obtiene que el intervalo de confianza para ésta es:

26,86336184 ≤ µ ≤ 27,6294953

Entonces, se puede decir que el valor de la resistencia promedio de los envases se encuentra dentro de este intervalo si se quiere garantizar una confianza del 95%.

d) Antes del estudio se suponía que μ = 25. Dada la evidencia de los datos, ¿tal supuesto es correcto?

Comparando la suposición realizada antes del estudio con el intervalo obtenido después del estudio, se puede notar que el valor supuesto de la media poblacional µ=25 es menor al límite inferior del intervalo de confianza de 95% obtenido en el estudio, lo que quiere decir que no se incluye dentro de este y la suposición es incorrecta.

e) Con los datos anteriores, estime con una confianza de 95% ¿cuál es la desviación estándar poblacional (del proceso)?

A partir de los datos y realizando el procedimiento para estimar la desviación estándar poblacional, se obtiene el intervalo de confianza: 1,205970243 ≤ σ ≤ 1,758379939

El valor de la desviación estándar poblacional se debe encontrar en el intervalo calculado anteriormente.

14. En la elaboración de una bebida se desea garantizar que el porcentaje de CO2 (gas) por envase esté entre 2.5 y 3.0. Los siguientes datos fueron obtenidos del monitoreo del proceso

(8)

a) Realice un análisis exploratorio de estos datos (obtenga un histograma y vea el comportamiento de los datos obtenidos).

b) Estime con una confianza de 95%, ¿cuál es el CO2 promedio por envase? c) Se supone que μ debe ser igual a 2.75. Dada la evidencia, ¿es posible rechazar tal supuesto?

d) Con los datos anteriores, estime con una confianza de 95% la desviación estándar del proceso.

e) De los datos muestrales se observa que el mínimo es 2.48 y el máximo 2.73, ¿por qué el intervalo obtenido en el inciso b) tiene menor amplitud?

(9)

15. Una característica importante en la calidad de la leche de vaca es la concentración de grasa. En una industria en particular se fijó como estándar mínimo del producto que se recibe directamente de los establos lecheros sea de 3.0%. Por medio de 40 muestreos y evaluaciones en cierta época del año se obtuvo que X –= 3.2 y S = 0.3.

a) Estime con una confianza de 90% el contenido promedio de grasa poblacional.

b) ¿Cuál es el error máximo de estimación para la media? ¿Por qué?

c) Si se quiere estimar la media con un error máximo de 0.05, ¿qué tamaño de muestra se requiere?

d) Estime con una confianza de 95%, ¿cuál es la desviación estándar poblacional?

e) ¿Qué puede decir acerca de la cantidad mínima y máxima de grasa en la leche? ¿Es posible garantizar con suficiente confianza que la leche tiene más de 3,0% de grasa? Sugerencia: aplique la regla empírica.

De acuerdo a los resultados del primer inciso se plantea la garantía que contiene mas de 3.0% de grasa contenida en la leche. Los intervalos que nos muestra la campaña serán de 3.12 a 3.28 de acuerdo a los datos.

16. En la fabricación de discos compactos una variable de interés es la densidad mínima (grosor) de la capa de metal, la cual no debe ser menor de 1.5 micras. Por experiencia se sabe que la densidad mínima del metal casi

(10)

siempre ocurre en los radios 24 y 57, aunque en el método actual también se miden los radios 32, 40 y 48. Se realizan siete lecturas en cada radio, lo cual da un total de 35 lecturas, de las cuales sólo se usa la mínima. A continuación, se presenta una muestra histórica de 18 densidades mínimas:

a) Argumente en términos estadísticos si las densidades mínimas individuales cumplen con la especificación de 1.5 micras. Sugerencia: aplique la regla empírica.

Si cumple con las especificaciones de 1.5 micras

b) Encuentre un intervalo de confianza de 99% para la media de la densidad mínima.

La media de la densidad mínima es de [1.836 y 2.044].

c) Proporcione un intervalo de confianza de 99% para la desviación estándar.

Intervalo de confianza, para la desviación estándar es de [0.00225 y 0.00806]

d) Dibuje el diagrama de cajas para los datos e interprete los resultados.

Ejercicios de estimación para una proporción

17. En una auditoría se seleccionan de manera aleatoria 200 facturas de las compras realizadas durante el año, y se encuentra que 10 de ellas tienen algún tipo de anomalía.

a) Estime con una confianza de 95% el porcentaje de facturas con anomalías en todas las compras del año.

P = 10/200 = 0.05

b) ¿Cuál es el error de estimación? ¿Por qué?

El error es de 0.05. Ya que es el error promedio o central dentro del intervalo

c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar el porcentaje de facturas con anomalías con un error máximo de 2%?

a) Estime con una confianza de 95% el porcentaje de facturas con anomalías en todas las compras del año.

P=10200=0.05 P+Z α/2P(1-P)n 0.05+1.96

(11)

0.05(1-0.05)200=0,05+0.030 [0.2<=P<=0.8]

c) ¿Qué tamaño de muestra se tiene que usar si se quiere estimar tal porcentaje con un error máximo de 2%?

N=1.962x0.05(1-0.05)0.022=456.19

18. En la producción de una planta se está evaluando un tratamiento para hacer que germine cierta semilla. De un total de 60 semillas se observó que 37 de ellas germinaron.

a) Estime con una confianza de 90% la proporción de germinación que se logrará con tal tratamiento.

[0.5835 < P < 0.6485]

b) Con una confianza de 90%, ¿es posible garantizar que la mayoría (más de la mitad) de las semillas germinarán?

No se garantiza que las semillas germinen

c) Conteste los dos incisos anteriores, pero ahora con 95% de confianza. [0.5662 < P < 0.6485]

19. Para evaluar la efectividad de un fármaco contra cierta enfermedad se integra en forma aleatoria un grupo de 100 personas. Se suministra el

(12)

fármaco y transcurrido el tiempo de prueba se observa x = 65 personas con un efecto favorable.

a) Estime con una confianza de 90% la proporción de efectividad que se logrará con tal fármaco. Realice una interpretación de los resultados. Proporción muestral = 0.65

Proporción de efectividad = intervalo (0.4811; 0.8189)

b) ¿Con base en lo anterior se puede decir que a la mayoría de las personas (más de la mitad) les hizo buen efecto el fármaco?

c) ¿Qué tamaño de muestra debe usarse si se quiere tener un error de estimación máximo de 4% (0.04)?

20. Con respecto al problema del ejercicio 11, los datos anteriores al diseño de la prueba continua muestran lo siguiente: de n = 120 envases de plástico probados para ver si tenían la resistencia mínima de 50 kg de fuerza, x = 10 envases no pasaron la prueba.

a) Estime con una confianza de 95% la proporción de envases que no tienen la resistencia mínima especificada. Haga una interpretación de los resultados.

b) ¿Cuál es el error de estimación?

c) Calcule el tamaño de muestra que se necesita para que el error de estimación máximo sea de 0.03.

Prueba de hipótesis para un parámetro

21. Un inspector de la Procuraduría Federal del Consumidor acude a una planta que elabora alimentos para verificar el cumplimiento de lo estipulado en los envases de los productos en cuanto a peso y volumen. Uno de los productos que decide analizar es el peso de las cajas de cereal, en las cuales para una de sus presentaciones se establece que el contenido neto es de 300 gramos. El inspector toma una muestra de 25 cajas y pesa su contenido. La media y desviación estándar de la muestra son x – = 298.3 y S = 4.5.

a) Suponiendo una distribución normal, pruebe la hipótesis de que μ = 300 contra la alternativa de que es diferente, con un nivel de significancia de 5%. Formular claramente las hipótesis, cálculos y conclusión.

(13)

H0: = 300

H1: ≠ 300

α = 0.05

grados de libertad = 15 -1 = 14

Criterio de rechazo: se rechaza , por lo tanto no se rechaza la hipotesis nula.

b) Repita el inciso anterior pero ahora con un nivel de significancia de 10%.

c) ¿Desde la perspectiva del consumidor del producto cuál debe ser la hipótesis alternativa que debe plantear el inspector en este problema? Argumente.

Se debe plantear que H1: < 300 puesto que eso muestran los datos del

problema.

d) Haga el inciso a) pero ahora planteando como hipótesis alternativa μ < 300.

22. En el problema anterior respecto a la desviación estándar:

a) Pruebe la hipótesis de que σ = 3.0 contra la alternativa que es diferente. b) ¿Si lo que se quiere es proteger al consumidor del exceso de variabilidad, la conclusión del inciso anterior le es favorable? Argumente.

23. Las especificaciones técnicas de un comprensor establecen que el aumento promedio de temperatura en el agua usada como enfriador en la cámara del compresor es menor a 5 °C. Para verificar esto se mide el aumento de temperatura en el agua en 10 periodos de funcionamiento del compresor, y se obtiene que son x = 6.6 y S = 2.0.

a) Plantear las hipótesis para la media que son adecuadas al problema. Argumente.

b) Pruebe las hipótesis planteadas con un nivel de significancia de 5%. c) Si en lugar de trabajar con una significancia de 5%, lo hace con una de 1%, ¿se mantiene la conclusión del inciso anterior? Explique.

(14)

24. En relación con el problema anterior, pruebe la hipótesis para la desviación estándar de σ = 1.5 contra la alternativa de que es mayor.

25. En relación con el ejercicio 16 de este capítulo, con una significancia α = 0.05 pruebe la hipótesis de que la media de la densidad mínima de la capa de metal de los discos es igual a 2.0 micras, contra la alternativa de que es menor.

26. En una planta embotelladora de bebidas gaseosas se desea estar seguro de que las botellas que usan tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi.

a) Formule la hipótesis para la media pertinente al problema. H0: = 200

H1: > 200

b) Si en una evaluación de la presión de estallamiento de 15 botellas seleccionadas al azar se obtiene que x – = 202.5 y S = 7.0; pruebe la hipótesis formulada antes.

c) Si procedió de manera correcta no se rechaza la hipótesis nula, y por lo tanto no se puede concluir lo que desea el embotellador, es decir que μ > 200. Explique por qué no se puede concluir esto a pesar de que la media muestral sí es mayor que 200.

Porque el valor de la desviación estándar es muy grande.

27. En el problema anterior, pruebe la hipótesis para la desviación estándar de σ = 5.0 contra la alternativa de que es mayor

28. Para validar la afirmación de un fabricante que señala que la proporción de artículos defectuosos de sus lotes de producción no supera 5%; se toma una muestra aleatoria de 100 artículos de los últimos lotes y se obtiene que 8 son defectuosos.

a) Formular la hipótesis adecuada al problema, si lo que se quiere es concluir que la afirmación del fabricante es falsa, porque en realidad su calidad es peor.

(15)

c) Si procedió de manera correcta no se pudo concluir que p > 5%. Explique por qué no se puede concluir esto a pesar de que la proporción muestral es mayor a 5%.

d) ¿En este problema cuál sería el tamaño de muestra a usar si se quiere tener un error máximo de estimación de 3%?

29. ¿En el ejercicio 17 de este capítulo es correcto afirmar que más de 8% de las facturas tienen alguna anomalía? Para responder, formule y pruebe la hipótesis pertinente con una significancia de 5%.

30. En un centro escolar se ha venido aplicando una campaña contra el uso del tabaco por parte de los estudiantes. Antes de la campaña, 30% de los alumnos eran fumadores activos, para investigar si disminuyó esta proporción se toma una muestra aleatoria de 150 estudiantes y se detecta que 35 de ellos son fumadores.

Datos: n = 150 p = 0.30 y = 35

p=

35

150

=0.23

a) Formule la hipótesis pertinente al problema. Justifique. H0: p=0.30

H1: p<0.30

b) Con una significancia de 5% verifique la hipótesis planteada. Estadístico de prueba

Z obs=

0.23−0.30

(

0.30)(0.70)

150

=−1.87

Región de rechazo

(16)

Decisión: se rechaza H0 en favor de H1 con un nivel de confianza de 95.

Se concluye que el porcentaje de estudiantes fumadores activos es menor a 3.

c) ¿La conclusión anterior se mantiene si se quiere tomar una decisión con una confianza de 99%? Argumente.

Nivel de significancia α=0.01 Región de rechazo

Decisión: se acepta H0 con un nivel de confianza de 99. Se concluye que

la proporción de estudiantes fumadores activos es igual a 30.

No se mantiene la misma conclusión anterior ya que con un 99% de confianza se determina que el porcentaje de estudiantes es igual al 30%; mientras que con un 95% de confianza se concluyó que el porcentaje de estudiantes fumadores activos era menor al 30%

Prueba de hipótesis (comparación de poblaciones en cuanto a la media y/o varianza)

31. Dos máquinas, cada una operada por una persona, son utilizadas para cortar tiras de hule, cuya longitud ideal debe ser de 200 mm. De las inspecciones de una semana (25 piezas) se observa que la longitud media de las 25 piezas para una máquina es de 200.1 y para la otra es de 201.2. ¿Es significativa la diferencia entre los dos casos? Argumente su respuesta. Si es significativa, ya que las diferencias entre ambos son de 1.2, a pesar de que la diferencia es poca, aun así, esa diferencia puede afectar lo que es la longitud o la calidad de las tiras de hule, cuando se dice que la longitud ideal es de 200mm.

32. Se desea comprar una gran cantidad de bombillas y se tiene que elegir entre las marcas A y B. Para ello, se compraron 100 focos de cada marca y se encontró que las bombillas probadas de la marca A tuvieron un tiempo de vida medio de 1 120 horas, con una desviación estándar de 75 horas;

(17)

mientras que las de la marca B tuvieron un tiempo de vida medio de 1 064 horas, con una desviación estándar de 82 horas.

Datos: α=0.05 MARCA A MARCA B n = 100 n = 100 X = 1120 X = 1064 s = 75 s = 82

a) ¿Es significativa la diferencia entre los tiempos medios de vida? Use α = 0.05. Aplique la prueba T de Student suponiendo igualdad de varianzas. Suponiendo varianzas iguales:

H0: μ1=μ2

H1: μ1≠μ2

Estadístico de prueba

Región de rechazo

Decisión: se rechaza H0 en favor de H1 con un nivel de confianza de 95. Se

concluye que las medias no son iguales.

b) Repita lo anterior, pero sin suponer igualdad de varianzas. Suponiendo varianzas distintas:

H0: μ1=μ2

H1: μ1≠μ2

(18)

Región de rechazo

Decisión: se rechaza H0 en favor de H1 con un nivel de confianza de 95. Se

concluye que las medias no son iguales.

33. En condiciones controladas, en un laboratorio se evaluó en 10 hombres y 10 mujeres, la temperatura que cada persona encontró más confortable. Los resultados en grados Fahrenheit fueron los siguientes:

(19)

a) ¿Cuáles son en realidad los tratamientos que se comparan en este estudio?

Los tratamientos que se comparan en este estudio son las temperaturas de 10 mujeres y 10 hombres entre sí.

b) ¿Las muestras son dependientes o independientes? Explique.

Son independientes al comparar la temperatura a cada temperatura. c) ¿La temperatura promedio más confortable es igual para hombres que para mujeres?

H0: μ(mujer) = μ (hombre)

H1: μ(mujer) ≠ μ (hombre)

Como podemos observar con el análisis obtenido, la temperatura confortable entre mujeres y hombres no obtuvo mucha variación, con lo cual podemos decir que nuestras hipótesis nula no se rechaza ya que no hay suficientes pruebas para demostrar la afirmación.

34. Se prueban 10 partes en cada nivel de temperatura y se mide el encogimiento sufrido en unidades de porcentaje multiplicado por 10. Los resultados fueron los siguientes:

Datos:

TEMPERATURA BAJA TEMPERATURA ALTA

n = 10 n = 10

X = 17.24 X = 20.62

(20)

a) ¿La temperatura tiene algún efecto en el encogimiento? Plantee las hipótesis estadísticas que corresponden a esta interrogante.

H0: μ1=μ2

H1: μ1<μ

b) Por medio de la prueba T de Student pruebe la hipótesis formulada con α = 0.05.

Estadístico de prueba

Región de rechazo

Decisión: se rechaza H0 en favor de H1. Se concluye que el encogimiento

medio de la temperatura alta es mayor que el encogimiento medio de la temperatura baja.

c) ¿Cuál temperatura provoca un encogimiento menor? La temperatura baja provoca un encogimiento menor

d) Mediante una prueba F, compare las varianzas de las temperaturas y comente.

(21)

Región de rechazo

Decisión: se acepta H0 con un nivel de confianza de 95. Se concluye que

las varianzas son iguales.

e) Dibuje los diagramas de cajas simultáneos e interprete.

35. Una compañía de transporte de carga desea escoger la mejor ruta para llevar la mercancía de un depósito a otro. La mayor preocupación es el tiempo de viaje. En el estudio se seleccionaron al azar cinco choferes de un grupo de 10 y se asignaron a la ruta A; los cinco restantes se asignaron a la ruta B. Los datos obtenidos fueron:

a) ¿Existen diferencias significativas entre las rutas? Plantee y pruebe las hipótesis estadísticas correspondientes.

H0: μ (ruta A) = μ (ruta B)

(22)

Conforme al análisis podemos observar que entre la ruta A y B hay diferencias significativas, con lo que podemos decir que la hipótesis nula se rechaza y se acepta la hipótesis alternativa.

b) En caso de rechazar la hipótesis del inciso a), dibuje los diagramas de cajas simultáneos para determinar cuál ruta es mejor.

c) Sugiera otra manera de obtener los datos (diseño alternativo), de manera que se pueda lograr una comparación más efectiva de las rutas. Podríamos compararlas con intervalos de confianza o con ANOVA para obtener datos más exactos

36. Se tienen dos proveedores de una pieza metálica, cuyo diámetro ideal o valor objetivo es igual a 20.25 cm. Se toman dos muestras de 14 piezas a cada proveedor y los datos obtenidos se muestran a continuación:

(23)

α=0.05

PROVEEDOR 1 PREVEEDOR 2

n = 14 n = 14

X = 20.19 X = 21.81

s = 1.58 s = 0.53

a) Pruebe la hipótesis de igualdad de los diámetros de los proveedores en cuanto a sus medias.

H0: μ1=μ2

H1: μ1≠μ2

Estadístico de prueba

Decisión: se rechaza H0 en favor de H1 con un nivel de confianza de 95.

(24)

b) Pruebe la hipótesis de igualdad de varianzas.

Estadístico de prueba

Región de rechazo

Decisión: se rechaza H0 con un nivel de confianza de 95. Se concluye que

las medias no son iguales.

c) Si las especificaciones para el diámetro son 20.25 mm ± 2.25 mm, ¿cuál proveedor produce menos piezas defectuosas?

ESPECIFICACIONES ES = 22.50 EI = 18 LIMITES REALES Proveedor 1 LRS =20.19 + 3(1.58) = 23.35 LRI =20.19 − 3(1.58) = 17.03 Proveedor 2 LRS = 21.81 + 3(0.53) = 23.40 LRI = 21.81 − 3(0.53) = 20.22

(25)

Los dos proveedores tienen piezas defectuosas puesto que ninguno cumple con las especificaciones. Pero se podría afirmar que el proveedor 2 tiene más defectuosos debido a sus límites reales.

d) ¿Con cuál proveedor se quedaría usted?

Debido a que ninguno de los dos proveedores cumple con las especificaciones no me quedaría con ningún proveedor.

37. En Kocaoz, S. Samaranayake, V. A. Nanni A. (2005) se presenta una investigación donde se estudian dos tipos de barras de polímero, cuya tensión se refuerza con fibra de vidrio (FRP). Estas barras, en sustitución de las vigas de acero, son utilizadas para reforzar concreto, por lo que su caracterización es importante para fines de diseño, control y optimización para los ingenieros estructurales. Las barras se sometieron a tensión hasta registrarse su ruptura (en Mpa). Los datos para dos tipos de barras se muestran a continuación:

38.SC

En una prueba de dureza, una bola de acero se presiona contra el material al que se mide la dureza. El diámetro de la depresión en el material es la medida de su dureza. Se dispone de dos tipos de bolas de acero y se quiere estudiar su desempeño. Para ello, se prueban ambas bolas con los mismos 10 especímenes elegidos de manera aleatoria y los resultados son:

a) Analice paso a paso cómo se hizo el experimento y explique por qué es importante realizarlo de esa manera.

b) Pruebe la hipótesis de que ambas bolas proporcionan las mismas mediciones de dureza en cuanto a la media.

(26)

c) Pruebe la igualdad de las bolas sin considerar que están pareadas. Compare los resultados con los obtenidos en el inciso b).

d) ¿En qué situación se esperaría que los análisis de los incisos b) y c) den los mismos resultados?

Referencias

Documento similar

Los datos incluyen: número de muestras, % fuera de tolerancia, tolerancia, promedio, valores deseados, desviación estándar, mínimo, máximo, intervalo y medición en el momento

Desviación estándar 5,277 años Varianza 27.85 Curtosis -0.01 Coeficiente de asimetría 0.874 Rango 19 años Mínimo 21 años Máximo 40 años Cuartil 1 24.8 años Cuartil 3 31 años Si

Para evitar la acumulación de errores al redondear, en la media y en la desviación estándar se retinen un dígito más que en los datos originales (cifra no

El estudio fue diseñado para una confianza del 95%, para detectar una prevalencia de diabetes mellitus (auto-report) de 4% con una desviación estándar supuesta de 1.5%

conocida y desviación típica 9. ¿De qué tamaño, como mínimo, debe ser la muestra con la cual se estime la media po- blacional con un nivel de confianza del 97% y un error

conocida y desviación típica 9. ¿De qué tamaño, como mínimo, debe ser la muestra con la cual se estime la media po- blacional con un nivel de confianza del 97% y un error

Figura 15: Variación mensual de la densidad poblacional media (+ Desviación estándar. – Error estándar) de Concholepas concholepas para datos agrupados de 3 localidades

* N: tamaño muestral; DE: desviación estándar; Min.: valor mínimo; Max.: valor máximo; Curt.: curtosis; Asim.: asimetría; IMC: Índice de Masa Corporal; Calc.: calculado; RTS: