• No se han encontrado resultados

Estadistica II Cibertec

N/A
N/A
Protected

Academic year: 2021

Share "Estadistica II Cibertec"

Copied!
213
0
0

Texto completo

(1)
(2)
(3)

Índice

Presentación 05

Red de contenidos 06

Sesiones de aprendizaje

SEMANA 1 : • Definiciones básicas: Población, marco muestral,

muestra, censo y muestreo: Ventajas y desventajas • Diseño de la encuesta por muestreo. Tipos de muestreo • Distribuciones muestrales

07

SEMANA 2 : • Estimación Puntual. Propiedades de un estimador.

Estimación de intervalos de confianza

• Intervalos de confianza para la media con varianza conocida, muestra grande

• Tamaño muestral para estimar una media

• Intervalo de confianza para la diferencia de medias de dos distribuciones con ambas desviaciones estándar conocidas, muestras grandes

19

SEMANA 3 : • Intervalo de confianza para la media con varianza

desconocida. Muestra pequeña

• Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales, muestras

pequeñas

35

SEMANA 4 : • Intervalo de confianza para una proporción. Muestras

grandes

• Tamaño muestral para estimar una proporción • Tamaño de muestra para poblaciones finitas

Intervalo de confianza para la diferencia de proporciones 45

SEMANA 5 : • Hipótesis estadística. Tipos de errores I y II, Nivel de

significación, Región crítica o región de rechazo. Región de aceptación

• Prueba de Hipótesis para medias, muestras grandes. Prueba bilateral de una hipótesis sobre la media

• Prueba unilateral de una hipótesis sobre la media, caso I, caso II

• Prueba de Hipótesis para la diferencia de medias. Desviación estándar conocidas, muestras grandes

55

SEMANA 6 : • Prueba de Hipótesis para medias, muestras pequeñas

Prueba bilateral de una hipótesis sobre la media

• Prueba unilateral de una hipótesis sobre la media, caso I, caso II

Prueba de Hipótesis para la diferencia de medias

• Desviación estándar desconocidas, Muestras pequeñas 73

(4)

SEMANA 7 : EXAMEN PARCIAL

SEMANA 8 : • Prueba de Hipótesis para las proporciones, muestras

grandes.

• Prueba bilateral de una hipótesis sobre las proporciones

• Prueba unilateral de una hipótesis sobre la media, caso I, caso II

• Prueba de Hipótesis para la diferencia entre dos proporciones

87

SEMANA 9 : • Definición del x² (Chi cuadrado). Ensayos de significación • Prueba de homogeneidad, prueba de independencia • Prueba de bondad de ajuste. Tablas de contingencia • Prueba de Kolmogorov-Smirnov

• Correlación de yates para la continuidad. Coeficientes de contingencia

103

SEMANA 10 : • Análisis de Regresión lineal Simple. Variable independiente, variable dependiente

• Diagrama de dispersión. Método de mínimos cuadrados • Recta de mínimos cuadrados en términos de varianzas

muestrales

• Recta de regresión de mínimos cuadrados. Aplicación e interpretación

123

SEMANA 11 : • Análisis de Regresión lineal múltiple • Recta de regresión de mínimos cuadrados • Aplicación e interpretación

135

SEMANA 12 : • Análisis de Regresión no lineal: Cuadrática • Análisis de Regresión no lineal: Potencial • Análisis de Regresión no lineal: Exponencial • Análisis de Regresión no lineal Logarítmica

149

SEMANA 13 : • Correlación entre dos variables, dependiente e independiente • Coeficiente de correlación lineal (fórmula de Pearson)

163

SEMANA 14 : • Coeficiente de correlación generalizado (Coeficiente de determinación)

• Coeficiente de correlación gradual (fórmula de Spearman)

173

SEMANA 15 : • Serie de tiempo. Introducción a la serie de tiempo • Representación y Clasificación de la serie de tiempo • Análisis de la serie de tiempo

185

SEMANA 16 : • Modelos de estimación.

• Métodos de estimación de la tendencia • Predicción mediante la serie de tiempo

(5)

Presentación

La globalización ha creado un campo muy extenso de desarrollo para los nuevos profesionales, ya sea en servicios o en producción. Es por esto que tienen que estar preparados para enfrentar cualquier reto en el campo laboral. Las comunicaciones y el software han hecho que en la actualidad todo profesional esté en constante contacto con la información estadística. Más aún, muchas veces es necesario realizar alguna medición estadística para tener una idea acerca de la producción de una empresa, del mercado bursátil a nivel mundial, del precio de los metales en el mercado Europeo, el control de epidemias en zonas determinadas, el control de los precios de la canasta familiar, etc, de manera que se pueda tomar la decisión adecuada para que dichos estudios sean siempre favorables.

El propósito de este manual es brindar conceptos claros de estadística inferencial y sus numerosas aplicaciones en el campo laboral. Por otra parte, se pretende dar al futuro profesional las herramientas necesarias para interpretar y evaluar información estadística, para que adquiera destreza en la interpretación, y manejo de las definiciones y teoremas.

En una primera etapa se desarrollará el marco teórico y práctico de la Estadística Inferencial. En la segunda etapa se desarrollará la aplicación de Métodos regresivos para predecir situaciones experimentales basadas en datos reales.

Finalmente es importante resaltar que este curso es netamente práctico. Por ello en cada sesión se desarrollará la teoría necesaria en forma concreta, dándole mayor énfasis a la parte práctica y a la interpretación de resultados.

(6)

Red de contenidos

Muestreo Intervalos de confianza Prueba de hipótesis Regresiones Correlaciones Serie de tiempo σ² conocida σ² desconocida Proporciones σ² conocida σ² desconocida Proporciones Simple Múltiple Lineales No Lineales

(7)

TEORÍA DE MUESTREO

TEMAS

• Definiciones básicas: población, marco muestral, muestra, censo y muestreo. Ventajas y desventajas del muestreo

• Diseño de la encuesta por muestreo. Tipos de muestreo. Determinación del tamaño de muestra

OBJETIVOS ESPECÍFICOS

• Relacionar la población y la muestra

• Estimar las diferencias entre población y muestra

• Realizar, adecuadamente, un muestreo de una población dada • Aplicar distribuciones muestrales

CONTENIDOS

• Definiciones básicas: Población, marco muestral, muestra, censo y muestreo. Ventajas y desventajas del muestreo

• Diseño de la encuesta por muestreo. Tipos de muestreo. Determinación del tamaño de la muestra

ACTIVIDADES

o Determinan, adecuadamente, una muestra de la población. o Determinan el tamaño de la muestra.

S E S ES E

S E M A N AM A N AM A N A M A N A

(8)

TEORÍA DE MUESTREO

La teoría de muestreo es un estudio de las relaciones existentes entre una población y muestras extraídas de la misma. Tiene gran interés en muchos aspectos de la estadística. Por ejemplo, permite estimar cantidades desconocidas de la población (tales como la media poblacional, la varianza, etc.), frecuentemente llamadas parámetros poblacionales o brevemente parámetros, a partir del conocimiento de las correspondientes cantidades muestrales (tales como la media muestral, la varianza, etc.), a menudo llamadas estadísticos muestrales o brevemente estadísticos.

La teoría de muestreo es también útil para determinar si las diferencias que se puedan observar entre dos muestras son debidas a la aleatoriedad de las mismas o si por el contrario son realmente significativas. Tales preguntas surgen, por ejemplo, al ensayar un nuevo suero para el tratamiento de una enfermedad, o al decidir si un proceso de producción es mejor que otro. Estas decisiones envuelven a los llamados ensayos e hipótesis de significación, que tienen gran importancia en teoría de la decisión.

En general, un estudio de inferencias, realizado sobre una población mediante muestras extraídas de la misma, junto con las indicaciones sobre la exactitud de tales inferencias aplicadas a la teoría de la probabilidad, se conoce como inferencia estadística.

MUESTRAS AL AZAR. NÚMEROS ALEATORIOS

Para que las conclusiones de la teoría del muestreo e inferencia estadística sean válidas, las muestras deben elegirse de forma que sean representativas de la población. Un estudio sobre métodos de muestreo y los problemas que tales métodos implican se conoce como diseño de experimentos.

El proceso mediante el cual se extrae de una población una muestra representativa de la misma se conoce como muestreo al azar. De acuerdo con ello cada miembro de la población tiene la misma posibilidad de ser incluido en la muestra. Una técnica para obtener una muestra al azar es asignar números a cada miembro de la población: escritos estos números en pequeños papeles, se introducen en una urna y después se extraen números de la urna, teniendo cuidado de mezclarlos bien antes de cada extracción.

MUESTREO CON Y SIN REEMPLAZO

Si se extrae un número de una urna, se puede volver o no el número a la urna antes de realizar una segunda extracción. En el primer caso, un mismo número puede salir varias veces, mientras que en el segundo un número determinado solamente puede salir una vez. El muestreo, en el que cada miembro de la población puede elegirse más de una vez, se llama muestreo con reemplazo, mientras que si cada miembro no puede ser elegido más de una vez se tiene el muestreo sin reemplazo.

Las poblaciones pueden ser finitas o infinitas. Si, por ejemplo, se extraen sucesivamente 10 bolas sin reemplazo de una urna que contiene 100, se está tomando una muestra de una población finita, mientras que si se lanza al aire una moneda 50 veces, anotándose el número de caras, se está muestreando en una población infinita.

(9)

Una población finita, en la que se realiza un muestreo con reemplazo, puede teóricamente ser considerada como infinita, puesto que puede extraerse cualquier número de muestras sin agotar la población. En muchos casos prácticos, el muestreo de una población finita que es muy grande, puede considerarse como muestreo de una población infinita.

DISTRIBUCIONES MUESTRALES

Considérense todas las posibles muestras de tamaño n que pueden extraerse de una población dada (con o sin reemplazo). Para cada muestra se puede calcular un estadístico, tal como la media, la desviación estándar, etc., que variará de una muestra a otra. De esta forma, se obtiene una distribución del estadístico que se conoce como distribución muestral.

Si, por ejemplo, el estadístico de que se trata es la media muestral, la distribución se conoce como distribución muestral de medias Análogamente se obtendrían las distribuciones mustrales de las desviaciones estándar, varianzas, medianas, proporciones, etc.

DISTRIBUCIÓN MUESTRAL DE MEDIAS

Supóngase que son extraídas de una población finita todas las posibles muestras sin reemplazo de tamaño n, siendo el tamaño de la población N. Si se denota la media y la desviación estándar de la distribución muestral de medias por µx y σx, y la media y la desviación estándar de la población por µ y

σ

, respectivamente, se tiene µ µx = 1 − − = N n N n x

σ

σ

Si la población es infinita, los resultados anteriores se convierten en

µ

µ

x = n x

σ

σ

=

Para valores grandes de n (n≥30) la distribución muestral de medias se aproxima a una distribución normal con media

µ

x y desviación estándar

σ

x independiente de la población de que se trate (siempre que la media y la varianza poblacional sean finitas y el tamaño de la población sea al menos dos veces el tamaño de la muestra). Este resultado en una población infinita es un caso especial del teorema central del límite de teoría de probabilidad superior, que demuestra que la aproximación es tanto mejor conforme n se hace mayor. Esto se indica diciendo que la distribución muestral es normal.

En caso de que la población se distribuya normalmente, la distribución muestral de medias se distribuye también normalmente, incluso para pequeños valores de n (es decir, n < 30).

(10)

DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Supóngase una población infinita y que la probabilidad de ocurrencia de un suceso (conocido como su éxito) es p, mientras que la probabilidad de no ocurrencia del suceso es q = 1 – p (conocido como su fracaso).

Se consideran todas las posibles muestras de tamaño n extraída de esta población y para cada muestra se determina la proporción p de éxito. Entonces se obtiene una distribución muestral de proporciones cuya µp y desviación

estándar σpvienen dadas por p p = µ n p p p ) 1 ( − =

σ

Si la población es infinita, los resultados anteriores se convierten en

p = µ ) 1 ( p p − =

σ

Para grandes valores de n(n≥30) la distribución muestral se aproxima mucho a una distribución normal. Nótese que la población se distribuye binomialmente.

DISTRIBUCIÓN MUESTRAL DE DIFERENCIAS Y SUMAS

Supóngase que se tienen dos poblaciones. Para cada muestra de tamaño n1

extraída de la primera población se calcula un estadístico s1. Esto proporciona

una distribución muestral del estadístico s1 con media

µ

x1 y desviación

estándar

1 x

σ

. Análogamente, para cada muestra de tamaño n2, extraída de la

segunda población, se calcula un estadístico s2. Esto Igualmente proporciona

una distribución muestral del estadístico s2, con media 2 x

µ

y desviación estándar 2 x

σ

. De todas las posibles combinaciones de estas muestras de las dos poblaciones, se puede obtener una distribución de las diferencias (s1-s2)

que se conoce como distribución muestral de diferencias de los estadísticos. Si s1 y s2 son las medias muestrales de las dos poblaciones, las cuales vienen

dadas por x1 y x2, entonces la distribución muestral de las diferencias de medias para poblaciones infinitas con medias y desviaciones estándar

µ

1,

σ

1 y

2

µ

,

σ

2, respectivamente, tiene por media y desviación estándar: 2 1 2 1 2 1

µ

µ

µ

µ

µ

xx = xx = − 2 2 2 1 2 1 2 2 2 1 2 1 x x x n n x

σ

σ

σ

σ

σ

= + = +

El resultado se mantiene válido para poblaciones finitas.

Resultados correspondientes pueden deducirse para las distribuciones muestrales de diferencias de proporciones de dos poblaciones distribuidas binomialmente con parámetros p1, q1 y p2, q2, respectivamente. En este caso s1

y s2 corresponden a las proporciones de éxito, p1 y p2

2 1 2 1 2 1 p p p p p p− =

µ

µ

= −

µ

(11)

2 2 2 1 1 1 2 2 (1 ) (1 ) 2 1 2 1 n p p n p p p p p p − + − = + = −

σ

σ

σ

Si n1 y n2 son grandes (n1≥30 y n2≥30), las distribuciones muestrales de diferencias de medias o proporciones se distribuyen muy aproximadamente como una normal.

A veces, es útil hablar de la distribución muestral de la suma de estadísticos. La media y la desviación estándar de esta distribución vienen dadas por

2 1 2 1 s s s s µ µ µ = − 2 2 2 1 2 1 s s s s

σ

σ

σ

= +

suponiendo que las muestras son independientes.

ERRORES TÍPICOS

La desviación estándar de la distribución muestral de un estadístico se conoce también como su error estándar. En la tabla se han anotado los errores típicos de distribuciones muestrales para diversos estadísticos bajo las condiciones de muestreo aleatorio sin reemplazo para una población infinita (o muy grande) o con reemplazo para una población finita. También, se apuntan notas especia-les que indican las condiciones para las que los resultados son válidos, así como otras notas de interés.

Las cantidades

µ

,

σ

,p,

µ

r y x,s,p,xr

denotan, respectivamente, las medias, desviaciones estándar, proporciones y momentos de orden r respecto de la media en la población y en la muestra.

Es de notar que si el tamaño de la muestra n es bastante grande, las distribuciones muestrales son normales o casi normales. Por esta razón, los métodos se conocen como métodos para grandes muestras. La teoría de pequeñas muestras, o teoría de muestreo exacto, como a veces se llama, se usa cuando n<30. Entonces, las muestras se llaman pequeñas.

Cuando los parámetros de la población, tales como

σ

,p,

µ

rse desconocen,

pueden estimarse mediante sus correspondientes estadísticos muestrales:

r x p s, ,

, si las muestras son suficientemente grandes. Distribución

muestral

Error estándar Observaciones Medias

n x

σ

σ

= Se cumple para muestras grandes o pequeñas. La distribución muestral de medias se ajusta mucho a la normal para n≥30 incluso para poblaciones no normales. Proporciones n p p p ) 1 ( − =

σ

Se cumple para muestras grandes o pequeñas. La distribución muestral de

medias se ajusta mucho a la normal para n≥30 incluso para poblaciones no normales.

(12)

ACTIVIDADES

1. Una población se compone de los cinco números 2, 3, 6, 8, 11. Considere todas las muestras posibles de tamaños que puedan extraerse con remplazamiento de esta población. Halle lo siguiente:

1.1 La media de la población

1.2 La desviación estándar de la población

1.3 La media de la distribución muestral de medias 1.4 El error estándar de medias

2. Supóngase que las alturas de 3 000 estudiantes de una universidad se distribuyen normalmente con media 68,0 pulgadas y desviación estándar 3,0 pulgadas. Si se toman 80 muestras de 25 estudiantes cada una, ¿cuál será la media y la desviación estándar esperada de la distribución muestral de medias resultante si el muestreo se hizo sin reemplazo?

3. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una desviación estándar de 0,30 onzas. Halle la probabilidad de que una muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso total (a) comprendido entre 496 y 500 onzas, (b) de más de 510 onzas.

(13)

4. Las bombillas eléctricas de un fabricante A tienen una duración media de 1400 horas con una desviación estándar de 200 horas, mientras que las de otro fabricante B tienen una duración media de 1200 horas con una desviación estándar de 100 horas. Si se toman muestras al azar de 125 bombillas de cada fabricante, ¿cuál es la probabilidad de que las bombillas de A tengan una duración media que sea al menos (a) 160 horas, (b) 250 horas más que las bombillas de B?

5. Los cojinetes de bolas de una determinada casa pesan 0,50 onzas con una desviación estándar de 0,02 onzas. ¿Cuál es la probabilidad de que dos lotes de 1000 cojinetes cada uno difieran en un peso superior a 2 onzas?

(14)

6. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media 22,40 onzas y desviación estándar 0,048 onzas. Si se extraen 300 muestras de tamaño 36 de esta población, determinar la media esperada y la desviación estándar de la distribución muestral de medias, si el muestreo se hace con reemplazo.

7. Se pesan tres cantidades dando 20,48; 35,97 y 62,34 libras con desviaciones estándar de 0,21; 0,46 y 0,54 libras respectivamente. Halle la media y la desviación estándar de la suma de las cantidades.

8. El voltaje medio de una batería es de 15,0 voltios y la desviación estándar 0,2 voltios. ¿Cuál es la probabilidad de que cuatro de estas baterías conectadas en serie tengan un voltaje conjunto de 60,8 o más voltios?

(15)

9. Una población de 7 números tiene una media de 40 y una desviación estándar de 3. Si se extraen muestras de tamaño 5 de esta población y se calcula la varianza de cada muestra, halle la media de la distribución muestral de varianzas si el muestreo es sin reemplazo.

Autoevaluación

1. Quinientos cojinetes de bolas tienen un peso medio de 5,02 onzas y una desviación estándar de 0,30 onzas. Halle la probabilidad de que una muestra al azar de 100 cojinetes elegidos entre este grupo tenga un peso total (a) comprendido entre 496 y 500 onzas, (b) de más de 510 onzas. 2. Un fabricante despacha 1000 lotes de 100 bombillas cada uno. Si

normalmente el 5% de las bombillas es defectuoso, ¿en cuántos lotes cabe esperar menos de 90 bombillas buenas?

3. Ciertos tubos fabricados por una compañía tienen una duración media de 800 horas y una desviación estándar de 60 horas. Halle la probabilidad de que una muestra al azar de 16 tubos, tomada entre ellos tenga una duración media entre 790 y 810 horas.

4. Se ha encontrado que el 2 % de las piezas producidas por cierta máquina son defectuosas. ¿Cuál es la probabilidad de que en una partida de 400 piezas sean defectuosas 3 % o más?

5. Los resultados de una elección demostraron que un cierto candidato obtuvo el 46% de los votos. Determine la probabilidad de que de 1000 individuos elegidos al azar de la población votante se hubiese obtenido una mayoría de votos para dicho candidato.

6. A y B juegan a «cara y cruz», lanzando cada uno 50 monedas. A ganará el juego si consigue 5 o más caras que B, de otro modo gana B. Determine la proporción contra A de que gane un juego determinado.

(16)

7. Dos distancias se miden y se obtiene 27,3 pulgadas y 15,6 pulgadas, con desviaciones estándar de 0,16 pulgadas y 0,08 pulgadas, respectivamente. Determine la media y la desviación estándar de la diferencia de las distancias.

8. Un cierto tipo de bombilla eléctrica tiene una duración media de 1500 horas y una desviación estándar de 150 horas. Se conectan tres bombillas de forma que cuando una se funde, otra sigue alumbrando. Suponiendo que las duraciones se distribuyen normalmente. ¿Cuál es la probabilidad de que se tenga luz

8.1 al menos 5000 horas? 8.2 como mucho 4200 horas?

9. La desviación estándar de los pesos de una población muy grande de estudiantes es 10,0 libras. Se extraen muestras de 200 estudiantes cada una de la población y se calculan las desviaciones estándares de las alturas de cada muestra. Halle la media y la desviación estándar de la distribución muestral de las desviaciones típicas.

10. Una población está formada por los cuatro números 3, 7, 11, 15. Considere todas las posibles muestras de tamaño dos que pueden extraerse de esta población con reemplazo. Halle lo siguiente:

10.1 la media poblacional

10.2 la desviación estándar poblacional

10.3 la media de la distribución muestral de medias

10.4 la desviación estándar de la distribución muestral de medias

11. Ciertos tubos fabricados por una compañía tienen una duración media de 800 horas y una desviación estándar de 60 horas. Halle la probabilidad de que una muestra al azar de 16 tubos, tomada de ellos tenga una duración media de:

11.1 entre 790 y 810 horas 11.2 menor de 785 horas

12. Los pesos de los paquetes recibidos en un departamento de almacenamiento tienen una media de 300 libras y una desviación estándar de 50 libras. ¿Cuál es la probabilidad de que el peso de 25 paquetes recibidos al azar y cargados en un ascensor supere el límite de seguridad del ascensor, que es de 8 200 libras?

13. Halle la probabilidad de que en los próximos 200 niños nacidos 14.1 menos del 40 % sean niños.

14.2 entre el 43 % y el 57 % sean niñas.

Supónganse iguales las probabilidades de nacimiento de niño y niña.

14. De un total de 1 000 muestras de 200 niños cada una, ¿en cuántas cabe esperar que entre el 40 % y el 60 % sean niñas?

(17)

15. Una urna contiene 80 bolas de las que 60 % son rojas y 40 % blancas. De un total de 50 muestras de 20 bolas cada una, sacadas de la urna con reemplazo, ¿en cuántas cabe esperar 12 bolas rojas y 8 blancas?

16. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la rotura de 4000 y 4500 libras con desviaciones estándar de 300 y 200 libras, respectivamente. Si se comprueban 100 cables de A y 50 cables de B, ¿cuál es la probabilidad de que la media de resistencia a la rotura de B sea (a) al menos 600 libras más que A, (b) al menos 450 libras más que A? 17. En una prueba de aptitud la puntuación media de los estudiantes es de 72

puntos y la desviación típica de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respecti-vamente, difieran en su puntuación media en (a) 3 o más puntos, (b) entre 2 y 5 puntos?

18. Los resultados de una elección mostraron que un cierto candidato recibió el 65 % de los votos. Halle la probabilidad de que en dos muestras al azar compuesto cada una de 200 votantes, haya una diferencia superior al 10 % en las proporciones que votaron a dicho candidato.

Para recordar

Para recordar

Para recordar

Para recordar

 En el uso de Distribuciones muestrales se debe tener en cuenta que las n variables aleatorias independientes a estudiar deben ser continuas.  Para un proceso Normal se debe tener en cuenta la media promedio y

(18)
(19)

INTERVALOS DE CONFIANZA

TEMAS

• Estimación Puntual. Propiedades de un estimador. Estimación de intervalos de confianza

• Intervalos de confianza para la media con varianza conocida, muestra grande

• Tamaño muestral para estimar una media

• Intervalo de confianza para la diferencia de medias de dos distribuciones con ambas desviaciones estándar conocidas, muestras grandes

OBJETIVOS ESPECÍFICOS

• Construir intervalos de confianza para la media de varianza conocida y muestra grande

• Encontrar el tamaño muestral para estimar una media

• Construir intervalos de confianza para diferencias de medias, con varianzas conocidas y muestras grandes

CONTENIDOS

• Estimación Puntual. Propiedades de un estimador. Estimación de intervalos de confianza

• Intervalos de confianza para la media con varianza conocida, muestra grande

• Tamaño muestral para estimar una media

• Intervalo de confianza para la diferencia de medias de dos distribuciones con ambas desviaciones estándar conocidas, muestras grandes

ACTIVIDADES

• Utilizan el concepto de estimación puntual.

• Interpretan el concepto de estimación por intervalo.

• Realizan estimaciones de la media poblacional mediante intervalos de confianza utilizando la distribución normal.

S E S ES E

S E M A N AM A N AM A N A M A N A

(20)

INTERVALO DE CONFIANZA

ESTIMACIÓN DE PARÁMETROS

Una vez que se obtiene algún estadístico (media, desviación estándar o proporción muestral, entre otros) es importante determinar si dichos resultados pueden ser asociados a la población de donde se extrajo la muestra. La estimación de parámetros se encarga de aproximar los valores de estos a partir de los resultados obtenidos de un conjunto de observaciones muestrales y sobre la base de ciertos procedimientos y criterios previamente establecidos. Por esto nos permitirá estimar con precisión la porción de la población (la fracción de la población que posee ciertas características) y la media de la población.

TIPOS DE ESTIMACIÓN a) Estimación Puntual

Una estimación puntual es un solo número que se utiliza para estimar un parámetro de población desconocido. Se puede decir que es la estimación del valor de un parámetro por medio de un valor concreto (único valor) y que se obtiene a partir del cálculo del estimador correspondiente proveniente de una muestra determinada. La desventaja de utilizar este tipo de estimación radica en que no es posible determinar el grado de certeza que se tiene al hacer la estimación.

Por ejemplo, si de una muestra de 36 cajeros automáticos se obtuvo que el tiempo promedio de atención al cliente es de 1.5 minutos con una desviación estándar de 0.5 minutos, estos valores son los estimadores puntuales del verdadero tiempo promedio de atención y de la verdadera desviación estándar del tiempo de atención a los clientes.

b) Estimación por Intervalos

Una estimación de intervalo es un intervalo de valores que se utiliza para estimar un parámetro de población. Esta estimación indica el error de dos maneras: por extensión del intervalo y por la probabilidad de obtener un verdadero parámetro de la población que se encuentra dentro del intervalo bajo un cierto nivel de confianza o certidumbre previamente establecida. Es mejor la estimación cuando este intervalo tiene longitud pequeña y que la probabilidad (nivel de confianza) de que el parámetro se encuentre entre los límites de dicho intervalo (límites de confianza) sea cercano a uno.

Estimador: Cualquier estadística de muestra que se utilice para estimar un

parámetro de población se conoce como estimador, es decir, un estimador es una estadística de muestra utilizada para estimar un parámetro de la población. La media de la muestra x puede ser un estimador de la media de la población µ, y la porción de la muestra se puede utilizar como estimador de la porción de la población.

(21)

Estimación: Cuando se ha observado un valor numérico especifico de

nuestro estimador, se refiere a ese valor como estimación. En otras palabras, una estimación, es el valor específico de una estadística. Por ejemplo, al tomar una muestra se calcula el valor que toma el estimador en esa muestra, entonces se realiza una estimación.

Criterios para seleccionar un buen estimador

Imparcialidad: Esta se refiere al hecho que la media de muestra es un

estimador no sesgado de una media poblacional, porque la media de distribución de muestreo de las medias de muestra tomadas de la misma población es igual a la media de la población misma.

Eficiencia. Se refiere al tamaño de error estándar de la estadística. Si al

comparar dos estadísticas de una muestra del mismo tamaño, se escoge la estadística que tuviera el menor error estándar o menor desviación estándar de la distribución de muestreo.

Coherencia. Una estadística es un estimador coherente de un parámetro

poblacional si al aumentar el tamaño de la muestra, se tiene casi la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población.

Suficiencia. Un estimador es suficiente si se utiliza una cantidad de la

información contenida en la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando.

LIC µ LCS p

[

L − E ≤ θ ≤ L + E

]

= 1 − α

Donde: L: Estadístico correspondiente E: Error estándar de estimación 1 - α: Nivel de confianza

θ: Parámetro por estimar

El error estándar de estimación se establece en función al nivel de confianza y al parámetro por estimar. El intervalo [L – E, L + E] se denomina intervalo de

(22)

confianza, donde sus respectivos límites se denominan “límite inferior de confianza (LIC)” y “límite superior de confianza (LSC)”. En este caso:

LIC = L – E LSC = L + E

Sea X una población distribuida con una media µ desconocida y varianza

σ

2 conocida. Para hallar un intervalo de confianza para µ se necesita encontrar dos estadísticos

p

[

θ

1

µ

θ

2

]

=

1

α

Para una muestra aleatoria de tamaño n suficientemente grande (n ≥30), por el teorema de límite central ( , )

2

n N

x

µ

σ

Si x es una población normal, entonces x es normal para toda muestra n. Además se tiene n x Z

σ

µ

=

Por la simetría de la curva normal se

tiene

p

[

Z

tab

Z

+

Z

tab

]

=

1

α

α

σ

µ

σ

=

+

1

n

Z

x

n

Z

x

p

tab tab

Entonces el intervalo de confianza está dado por

+

n

Z

x

n

Z

x

tab

σ

,

tab

σ

INTERVALO DE CONFIANZA PARA MEDIAS POBLACIONALES

Desviación estándar poblacional (σσσσ) conocida

El error estándar de estimación se calcula de la siguiente forma:

x tab

Z

E

=

*

σ

n

x

σ

σ

=

Donde: x

σ

: Error estándar de la media para una población n : tamaño de muestra

(23)

Desviación estándar poblacional (σσσσ) desconocida

Si n ≥ 30, el error de estimación se calcula según la fórmula: x tab

Z

E

=

*

σ

n

S

x

=

σ

Donde:

S: desviación estándar de la muestra

x

σ

: Error estándar de la media para la población n : tamaño de muestra.

Ztab : se obtiene a partir del nivel de confianza.

Observación: Si se conoce el tamaño de la población (N) y el muestreo es sin

reemplazo, se usa el factor de corrección para población finita (fc) que afecta y multiplica al error estándar de estimación.

1 N n N fc − − =

Tamaño mínimo de muestra para estimar la media poblacional

El tamaño mínimo de muestra se puede calcular a partir de la siguiente expresión: 2 2 2

E

Z

n

=

tab

σ

Para tener el tamaño mínimo de la muestra de una población finita, se aplica el factor de corrección para población finita

1

2

=

N

n

N

n

Z

E

tab

σ

Luego: 2 2 2

)

1

(

E

Z

N

n

N

n

=

tab

σ

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES CON AMBAS DESVIACIONES ESTÁNDAR CONOCIDAS Y MUESTRAS GRANDES

Sea X una variable aleatoria distribuida con media

µ

xy varianza

2

x

σ

conocida. Sea Y una variable aleatoria distribuida con media

µ

xy varianza

2

x

σ

conocida. Para hallar el intervalo de confianza para la diferencia de las medias µx −µy,

se debe encontrar dos estadísticos

[

LIC

µ

1

µ

2

LSC

]

=

1

α

(24)

1. Se elige un nivel de confianza (1 – α)

2. Considérese una muestra aleatoria de tamaño n ≥ 30 de X, y una muestra aleatoria de tamaño m ≥ 30 de Y.

3. Se sabe que la estadística adecuada para estimar (µx −µy) es (XY),

entonces se asume una distribución muestral de (XY) para establecer un intervalo de confianza para (µx −µy).

4. Para n y m suficientemente grande (n ≥ 30 y m ≥ 30); la variable aleatoria Z tiene una distribución aproximadamente normal estándar.

m n Y X Z y x y x 2 2 ) ( ) (

σ

σ

µ

µ

+ − − − = Luego:

α

σ

σ

µ

µ

σ

σ

=

+

+

+

)

(

)

1

(

2 2 2 1 2 2

m

n

Z

Y

X

m

n

Z

Y

X

p

x y o y x o

Se obtiene el intervalo aleatorio

+

+

+

m

n

Z

Y

X

m

n

Z

Y

X

x y o y x o 2 2 2 2

)

(

,

)

(

σ

σ

σ

σ

ACTIVIDADES

1. Se toma una muestra de 60 individuos de una población que se sabe tiene una desviación estándar de 1,4. Se encuentra que la media de esta muestra es de 6,2.

Construya una estimación de intervalo alrededor de la media de la muestra, utilizando un error estándar de la media.

(25)

2. La Universidad de Ciencias Aplicadas está realizando un estudio sobre el peso promedio de los ladrillos que comprenden los pasillos de la universidad. Se enviaron trabajadores que recolecten y pesen una muestra de 421 ladrillos; el peso promedio de esta muestra fue de 6,4 kg. Se sabe con toda certeza que la desviación estándar del peso de los ladrillos es de 3,6 kilogramos. ¿Cuál es el intervalo alrededor de la media de la muestra que incluirá a la media de la población 95,5% de las veces?

3. Para una población con una varianza conocida de 185, una muestra de 64 individuos conduce al valor de 217 como estimación de la media. Construya una estimación de intervalo que incluya a la media de la población 68,3% de las veces.

5 El administrador del Emape está preocupado acerca de la cantidad de automóviles que pasan por las casetas de cobro sin pagar, y está considerando cambiar la manera de hacer los cobros si tal cambio resulta efectivo en cuanto a costos. Se muestreó al azar 75 horas para determinar la tasa de violación. El número promedio de violaciones por hora fue de 7. Si se sabe que la desviación estándar de la población es de 0,9, estime un intervalo que tenga 95,5% de probabilidad de contener a la media real.

(26)

6. La desviación estándar de la duración de los focos de una determinada fábrica es de 100 horas. Para un embarque de 2000 focos, el gerente de control de calidad desea determinar el tamaño de la muestra necesaria, para estimar la duración promedio con error de estimación de 20 horas y un 95% de confianza.

7. Para su producción total de bombillas, la gerencia de una firma electrónica está segura que los limites superior e inferior de vida no difieren en más de 600 horas. Para un nivel de confianza del 90%. ¿Qué tan grande debe tomarse la muestra para encontrar la vida promedio de una bombilla dentro de más y menos 30 horas?

(27)

8. La media y la desviación estándar de las cargas máximas soportadas por 100 cables producidos por la compañía DURAMAS son 20 toneladas y 1,1 toneladas. La media y la desviación estándar de las cargas máximas soportadas por 60 cables producidos por la compañía CABLECOM son 16 toneladas y 0,8 toneladas. Determine el intervalo de confianza al 95% para la diferencia de cargas máximas medias.

9. Una muestra de 150 bombillas del fabricante A dieron una vida media de 1400 horas y una desviación estándar de 120 horas. Una muestra de 100 bombillas del fabricante B dieron una vida media de 1200 horas y una desviación estándar de 80 horas. Halle el intervalo de confianza al 99% para la diferencia de las vidas medias de las poblaciones A y B.

Autoevaluación

1. La panificadora Gabino está interesada en adquirir una camioneta usada. Selecciona al azar 125 ofertas de venta y encuentra que el precio promedio de una camioneta en esta muestra es de $3250. La empresa sabe que la desviación estándar de los precios de las camionetas usadas en la ciudad es de $615. Construya una estimación de intervalo para el precio promedio

(28)

de una camioneta de modo que se pueda tener un 95,5% de certeza de que la media de la población se encuentra en dicho intervalo.

2. La junta directiva de los colegios PAMER considera como su tarea más importante el mantener la cantidad promedio de los alumnos por aula, por debajo del tamaño promedio de las aulas de los colegios TRILCE. El señor Córdova, coordinador de los colegios PAMER, acaba de recibir información confiable que indica que el tamaño de clase promedio de TRILCE en el presente año es de 30,3 estudiantes. Todavía no tiene los datos correspondientes de las 1 621 aulas que se tienen en su propio sistema escolarizado, de modo que Córdova se ve forzado a apoyarse en las 76 aulas que han informado acerca de su tamaño, lo cual le produce un promedio de 29,8 estudiantes. De saber que el tamaño de grupo de sus colegios tiene una distribución cuya media se desconoce y una desviación estándar de 8,3 estudiantes y suponiendo que la muestra de 76 aulas que tiene el señor Córdova es una muestra aleatoria de la población de las aulas del colegio PAMER:

2.1 Encuentre un intervalo en el cual Córdova pueda tener 9,5% de certeza de que contendrá a la medida real.

2.2 ¿Usted cree que el señor Córdova ha conseguido su objetivo? 3. Tula, dueña del salón de belleza Stylos, se ha formado de una buena

reputación entre los residentes del cono este. Cuando un cliente entra a su establecimiento, Tula grita los minutos que el cliente deberá esperar antes de que se le atienda. El único estadístico del lugar, después de ver el fracaso de las poco precisas estimaciones puntuales de Tula, ha determinado que el tiempo de espera real de cualquier cliente está distribuido normalmente con una media igual a la estimación de Tula en minutos y una desviación estándar igual a cinco minutos divididos entre la posición del cliente en la fila de espera. Ayude a los clientes de Tula a construir intervalos de 95% de probabilidad para las situaciones siguientes: 3.1 El cliente es el segundo en la fila de espera, y la estimación de

Tula es de 25 minutos.

3.2 El cliente es el tercero de la fila, y la estimación de Tula es de 15 minutos.

4. El gerente de la división de focos ahorradores de Jossfel Electric debe determinar el número promedio de horas que durarán los focos fabricados por cada una de las máquinas. Fue elegida una muestra de 40 focos de una máquina A y el tiempo promedio de funcionamiento fue de 1,416 horas. Se sabe que la desviación estándar del tiempo te duración es de 30 horas.

4.1 Calcule el error estándar de la media

4.2 Construya un intervalo de confianza de 90% para la media de la población.

5. Javier López acaba de terminar el primer borrador de su tesis, la cual tiene 700 páginas. Javier escribió a máquina el borrador y está interesado en saber el número promedio de errores tipográficos contenidos por página, pero no quiere leer todo el borrador. Como sabe un poco de estadística

(29)

financiera, Javier seleccionó al azar 40 páginas para su lectura y encontró que el número promedio de errores “de dedo” por página era de 4,3; y la desviación estándar de la muestra fue de 1,2 errores por página.

5.1 Calcule el error estándar estimado de la media.

5.2 Construya para Javier un intervalo de confianza de 90% para el número real de errores por página que hay en su escrito.

6. De una población de 540 individuos, se toma una muestra de 60. A partir de esta e encuentra, que la media es de 6,2 y la desviación estándar de 1368.

6.1 Encuentre el error estándar estimado de la media.

6.2 Construya un intervalo de confianza de 96% para la media.

7. En una prueba de seguridad automovilística efectuada por el Centro de Investigación en Seguridad Carretera del Callao, la presión promedio en las llantas de los autos de una muestra de 62 llantas fue de 24 libras por pulgada cuadrada y la desviación estándar fue de 2,1 libras por pulgada cuadrada.

7.1 ¿Cuál es la desviación estándar estimada para esta población? (Hay aproximadamente un millón de autos registrados en el Callao) 7.2 Calcule el error estándar estimado de la media.

7.3 Construya un intervalo de confianza de 95% para la media de la población.

8. Un corredor de la Bolsa de Valores de Lima tiene curiosidad acerca de la cantidad de tiempo que existe entre la colocación de una orden de venta y su ejecución. Para ello se hizo un muestreo de 45 órdenes y encontró que el tiempo medio para la ejecución fue de 24,3 minutos, con una desviación estándar de 3,2 minutos. Ayude al corredor de bolsa con la construcción de un intervalo de confianza de 95% para el tiempo medio para la ejecución de una orden.

9. Una firma constructora desea estimar la resistencia media de las barras de acero utilizadas en la construcción de edificios de departamentos. ¿Qué tamaño debe tener la muestra para garantizar que exista un riesgo de sólo 0., de sobrepasar un error de 5 Kg. o más en la estimación, si la desviación estándar de la resistencia de este tipo de barras se estima en 25 kg?

10. El dueño del recientemente abierto restaurante La buena muerte ha tenido dificultades al estimar la cantidad de comida que se debe preparar cada tarde. Él ha decidido determinar el número medio de clientes a los que se atiende cada noche. Seleccionó una muestra de 30 noches que le arrojaron una media de 71 clientes. Se llegó a la conclusión de que la desviación estándar de la población es de 3,76. Dé una estimación de intervalo que tenga 99,7% de probabilidad de incluir a la media de la población.

11. El gerente de producción de Pulpas Andinas está preocupado debido a que las heladas de los últimos tres años han estado dañando los 2 500

(30)

duraznos que posee la compañía. Con el fin de determinar el grado de daño ocasionado a los árboles, se ha escogido una muestra de 42 duraznos y se encontró que la producción promedio fue de 525 duraznos por árbol, con una desviación estándar de 30 duraznos por árbol.

11.1 Construya un intervalo de confianza de 98% para la producción media por árbol del total de 2500 árboles.

11.2 Si la producción media de duraznos por árbol fue de 600 frutas hace cinco años, ¿qué puede decir el gerente acerca de la posible existencia de daños en el presente?

12. El jefe de las fuerzas policiales recientemente estableció medidas enérgicas para contrarrestar a los traficantes de droga de su ciudad. Desde que se pusieron en funcionamiento dichas medidas, han sido capturados 750 de los 12368 traficantes de droga de la ciudad. El valor promedio, en dólares, de las drogas decomisadas a estos 750 traficantes es de $250000. La desviación estándar del valor en dólares de la droga de estos 750 traficantes es de $41000. Construya, para el jefe, un intervalo de confianza de 90% para el valor medio de los estupefacientes que están en manos de los narcotraficantes de la ciudad.

13. Una compañía tiene 500 cables. Un ensayo con 40 cables elegidos al azar dieron una media de resistencia a la rotura de 2400 libras y una desviación típica de 150 libras. ¿Con qué grado de confianza cabe decir que la media de resistencia a la rotura de los 460 cables restantes sea 2400 ± 35 libras? 14. En una granja de 1000 pollos se va a experimentar con una nueva dieta de

engorde. Si se sabe que la desviación típica del aumento de peso en un periodo de un mes es igual a dos onzas. ¿Qué tamaño debe tomarse una muestra que conduzca a una estimación del aumento de peso de la totalidad de la parvada, si se quiere que esta estimación no contenga un error mayor que 40 lb. (una 1b = 16 oz.) con probabilidad de 0.95?

15. De una orden especial de 1500 taladros recibidos de la compañía Andina de máquinas y herramientas, se probó una muestra de 36 taladros. La muestra tuvo una vida de 1800 horas y una desviación estándar de 150 horas. Construya un intervalo de confianza de un 98% para la vida media de los taladros.

16. De qué tamaño debe ser la muestra para poder tener 95% de confianza en que el error de estimación es de 5 o menos. Suponga que la desviación estándar poblacional es de 25.

17. La revista “Unidos por Siempre” dio a conocer el costo promedio de una boda, que es de s/. 19000 soles. Suponga que la desviación estándar poblacional es de s/. 9400 con una confiabilidad del 95%. ¿Qué tamaño debe tener la muestra si el error de estimación deseado es de s/. 1000 soles?

18. Se cree que los sueldos anuales iniciales de egresados de licenciatura en administración pueden tener una desviación estándar aproximada de $

(31)

2000. Suponga que desea una estimación por intervalo de 95% de nivel de confianza para la media del sueldo anual inicial. ¿De qué tamaño debe tomarse la muestra, si el error de estimación deseado es de $ 200.

19. La empresa de bienes y raíces Fortaleza proporciona costos promedios mensuales de renta de departamentos en el departamento de Arequipa. Suponga que la desviación estándar poblacional es de s/. 220 soles y que el error de estimación es de s/. 50. ¿Cuál es el tamaño de la muestra recomendada para una estimación del intervalo de confianza de 90% del costo de renta promedio poblacional?

20. El tiempo de traslado al trabajo, para residentes en los conos de la ciudad de Lima, tiene una distribución normal con desviación estándar de 6,25 minutos. Si el error de estimación es de 2 minutos. ¿Qué tamaño debe tener la muestra, a una confiabilidad del 90%?

21. Determine el tamaño mínimo de muestra que se debe tomar para estimar al 85% de confianza el porcentaje de limeños que actualmente utiliza Internet diariamente. El año pasado se realizó una investigación que indicó que el 18% de los limeños utilizaba Internet diariamente. Se desea que el error al hacer la estimación no sea mayor que 5%.

22. Un ingeniero industrial está interesado en estimar el tiempo medio requerido para ensamblar una tarjeta de circuito impreso. ¿Qué tan grande debe ser la muestra si el ingeniero desea tener una confianza del 95% de que el error de estimación de la media es menor que 0.25 minutos? La desviación estándar del tiempo de ensamble es 0.45 minutos.

23. Una tienda de departamentos desea estimar, con un nivel de confianza de 0.98 y un error máximo de 0,5, el verdadero valor medio de dólares de las compras a crédito por mes realizadas por sus clientes. Dado que la desviación típica es $ 15, determine el tamaño de la muestra.

24. De dos análogos grupos de enfermos A y B formados de 50 y 100 individuos respectivamente, al primero le fue dado un nuevo tipo de somnífero y al segundo el tipo convencional. Para los pacientes del primer grupo el número medio de horas de sueño fue de 7,82 horas con una desviación estándar de 0,24 horas. Para el segundo grupo el número medio de horas de sueño fue de 6,75 horas con una desviación estándar de 0,30 horas. Halle el intervalo de confianza al 99% para la diferencia del número de horas de sueño inducidas por los dos tipos de somnífero.

25. Una muestra al azar de 200 pilas de la marca A para calculadoras tiene una vida media de 140 horas y una desviación estándar de 10 horas. Una muestra al azar de 120 pilas de la marca B para calculadoras tiene una vida media de 125 horas y una desviación estándar de 9 horas. Determine el intervalo de confianza al 99% para la diferencia de medias de las dos marcas de pilas para calculadoras

(32)

26. Dos grupos al azar de 50 alumnas de una escuela para secretarias ejecutivas aprende taquigrafía por dos sistemas diferentes y luego se someten a una prueba de dictado. Se encuentra que en un minuto el primer grupo obtiene en promedio de 120 palabras con una desviación estándar de 11 palabras, mientras que en un minuto el segundo grupo promedia 110 palabras con una desviación estándar de 10 palabras. Determine el intervalo de confianza al 90% para la diferencia de las medias de los dos métodos.

27. Un investigador desea comparar la efectividad de dos métodos de entrenamiento industrial para obreros que trabajan en plantas ensambladoras de autos. A un primer grupo de 50 trabajadores seleccionados al azar, se les entrena en un nuevo método de ensamblado denominado método I, mientras que al segundo grupo de 60 trabajadores se les capacita con el método II. Después, se observa la efectividad de los dos métodos aprendidos. El primer grupo disminuye el tiempo de ensamblado con un promedio de 48 minutos y una desviación estándar de 9 minutos, mientras que el segundo grupo lo hace con un promedio de 53 minutos y desviación estándar de 12 minutos. Determine el intervalo de confianza al 95% para la diferencia de las medias de los dos métodos aprendidos.

(33)

Para recordar

Para recordar

Para recordar

Para recordar

 La precisión de una estimación puntual puede evaluarse en la muestra, por estimación de un intervalo junto con una medida de la seguridad que tal intervalo contenga la parámetro desconocido de la población.  El intervalo aleatorio es un intervalo en el cual por lo menos uno de sus

(34)
(35)

INTERVALO DE CONFIANZA

INTERVALO DE CONFIANZA

INTERVALO DE CONFIANZA

INTERVALO DE CONFIANZA

PARA MUESTRAS

PARA MUESTRAS

PARA MUESTRAS

PARA MUESTRAS PEQUEÑAS

PEQUEÑAS

PEQUEÑAS

PEQUEÑAS

TEMAS

• Intervalo de confianza para la media con varianza desconocida. Muestra pequeña.

• Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales. Muestras pequeñas.

OBJETIVOS ESPECÍFICOS

• Construir intervalos de confianza para muestras pequeñas

• Construir intervalos de confianza para diferencias de medias, con varianzas desconocidas pero iguales, muestras pequeñas

CONTENIDOS

• Intervalo de confianza para la media con varianza desconocida, Muestra pequeña

• Intervalo de confianza para la diferencia de medias con varianzas desconocidas pero iguales. Muestras pequeñas

ACTIVIDADES

• Utilizan el concepto de estimación puntual.

• Interpretan el concepto de estimación por intervalo.

• Realizan estimaciones de la media poblacional mediante intervalos de confianza para muestras pequeñas utilizando la distribución t student.

S E S ES E

S E M A N AM A N AM A N A M A N A

(36)

INTERVALO DE CONFIANZA MEDIANTE LA DISTRIBUCIÓN T

Los primeros trabajos teóricos sobre la distribución t fueron hechos por W. S. Gossett, durante los primeros años del siglo XX en Dublín, Irlanda, y adoptó el seudónimo de Student, conocida como la distribución t de student.

La distribución t de student se utiliza cuando el tamaño de la muestra es menor de 30 datos y la desviación estándar de la población no se conoce. Además, al utilizar la distribución t de student, se supone que la población es normal o aproximadamente normal.

Los grados de libertad se definen como el número de valores que se pueden Se escoge libremente.

Cuando se elije una distribución t de student para estimar una media de la población se utilizará (n – 1) grados de libertad, tomando como n al tamaño de la muestra.

Sea X una variable aleatoria con distribución aproximadamente normal, con media µ y varianza

σ

2

(desconocida). Además, cuando

σ

2

es desconocida se usa el estimador puntual 2

S .

Considérese una muestra aleatoria de tamaño n (n<30), la media x y la desviación estándar muestral S

Se sabe que x es adecuada para estimar µ, pero como

σ

2es desconocida se usará la distribución muestral de la variable aleatoria T con (n-1) grados de libertad.

n S x T = −

µ

Para hallar un intervalo de confianza para

µ

se necesita encontrar dos estadísticos.

[

θ

1

µ

θ

2

]

=

1

α

p

Por la simetría de la curva normal se tiene

p

[

t

tab

T

+

t

tab

]

=

1

α

α

µ

=

+

1

n

S

t

x

n

S

t

x

p

tab tab

Entonces el intervalo de confianza está dado por

+

n

S

t

x

n

S

t

x

tab

,

tab

Desviación estándar poblacional (σσσσ) desconocida

Si n < 30, el error de estimación se calcula según la fórmula:

[

L − E ≤ θ ≤ L + E

]

= 1 − α

(37)

L: Estadístico correspondiente E: Error estándar de estimación 1 - α: Nivel de confianza

θ: Parámetro por estimar

=

T

tab x

E

*

σ

n

S

x

=

σ

Donde:

S : desviación estándar de la muestra

x

σ : Error estándar de la media para una población

Ttab : Valor obtenido de la tabla de T - Student para "n - 1" grados de

libertad

Observación: Si se conoce el tamaño de la población (N) y el muestreo es sin

reemplazo, se usa el factor de corrección para población finita (fc) que afecta y multiplica al error estándar de estimación (E).

1

N

n

N

f

c

=

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE DOS DISTRIBUCIONES CON VARIANZAS DESCONOCIDAS PERO IGUALES Y MUESTRAS PEQUEÑAS

Sea X una variable aleatoria distribuida con media

µ

xy varianza

2

x

σ

desconocida. Sea Y una variable aleatoria distribuida con media

µ

xy varianza

2

x

σ

desconocida. Sea X la media muestral de una muestra aleatoria de n (n< 30) observaciones de X y sea Yla media muestral de una muestra aleatoria de m (m<30) observaciones de Y.

La variable aleatoria t tiene (n+m -2) grados de libertad desde que la distribución de la variable aleatoria t no depende de (µx −µy)

2 ) 1 ( ) 1 ( 1 1 ) ( ) ( 2 2 − + − + − − − − − = m n S m S n m n Y X T y x y x

µ

µ

Donde: c

S : es la desviación estándar combinada de las dos muestras

2 ) 1 ( ) 1 ( 2 2 − + − + − = m n S m S n Sc x y

[

LIC

µ

1

µ

2

LSC

]

=

1

α

p

Luego:

(38)

α

µ

µ

=

+

+

+

)

1

1

(

)

1

1

1

(

1 2

m

n

S

t

Y

X

m

n

S

t

Y

X

p

o c o c

Se obtiene el intervalo aleatorio

+

+

+

m

n

S

t

Y

X

m

n

S

t

Y

X

)

o c

1

1

,

(

)

o c

1

1

(

ACTIVIDADES

1. De una muestra de 18 gasolineras REPSOL tomadas en la ciudad de Lima, se encontró que el precio promedio de un galón de gasolina sin plomo es de $ 3,17; con una desviación estándar de $ 0,08 por galón. Halle el intervalo de confianza al 95% para el valor real del precio medio de la gasolina sin plomo por galón.

2. Al ensayar un nuevo método de producción, se seleccionaron a 18 empleados al azar, cuya tasa de producción promedio fue de 80 partes por hora, con una desviación estándar de 10 partes por hora. Determine el intervalo de confianza al 90% de la tasa de producción promedio poblacional.

3. En un laboratorio de ensayos de materiales se analiza 20 cables para obtener sus cargas de rotura a la tracción Kg./cm2. Considerando que estas

(39)

cargas se distribuyen normalmente, determine el intervalo de confianza al 90%.

280 295 289 294 308 320 350 300 310 285 302 305 398 397 300 365 380 395 399 360

4. Una agencia de publicidad tiene un registro de datos sobre minutos de anuncios por cada media hora de programas principales de TV. En la siguiente tabla se ve una lista de datos representativos de una muestra de 20 programas preferentes en cadenas principales a las 20:30 horas.

6,0 7,0 1,2 6,6 6,9 6,7 7,2 7,0 7,0 6,3 5,8 6,7 6,0 7,3 6,6 6,4 7,3 7,2 6,0 6,8

Suponiendo que la población es normal, halle el intervalo de confianza al 95% para el número promedio de minutos de anuncios en los principales programas televisivos a las 20:30 p.m.

6. En la siguiente tabla, se presentan los puntos de fusión en grados centígrados de un compuesto químico realizado por dos analistas.

(40)

Analista

01 164,4 165,2 169,2 168,2 167,3 168,2 169,5 167,2 168,1 169,3 Analista

02 163,2 165,3 167,2 168,9 169,9 165,4 167,3 162,3 163,2 165,2 Determine el intervalo de confianza al 90% para la diferencia de medias entre

analistas. Suponga que las varianzas son iguales pero desconocidas.

7. Los tiempos de encendido en segundos de crisoles de humo flotante de dos tipos

diferentes son los siguientes:

TIPO 1 481 506 494 506 661 572 602 487 524 661 TIPO 2 526 511 556 542 491 498 537 582 605 605 Determine el intervalo de confianza al 95% para la diferencia de medias entre analistas. Suponga que las varianzas son iguales pero desconocidas.

8. Dos analistas tomaron lecturas repetidas en la dureza del agua de las napas freáticas a lo largo del valle del Rimac. Determine un intervalo de confianza

(41)

del 95% para la diferencia de lecturas entre los analistas, suponiendo varianzas iguales pero desconocidas.

Analista A 0,46 0,62 0,37 0,45 0,38 0,37 0,44 0,48 0,53 0,47 Analista B 0,82 0,64 0,54 0,55 0,58 0,42 0,48 0,33 0,32 0,25

Autoevaluación

1. Se pidió al personal de ventas de la Distribuidora Continental que presentara informes semanales con los clientes llamados durante la semana. En una muestra de 18 informes semanales se determinó un promedio de 22,4 llamadas a clientes por semana y una desviación estándar de 5 llamadas. Determine el intervalo de confianza al 95% para el número promedio de llamadas semanales a clientes.

2. El diámetro final de un cable eléctrico blindado se distribuye normalmente. Si se toma una muestra de 20 de estos cables, se encuentra que su media es de 0,790 y una desviación estándar es de 0,01. Encuentre el intervalo de confianza al 95%.

3. En un estudio realizado por TEXACO acerca de los precios de la gasolina de 97 octanos en los diferentes grifos de la capital, se encontraron los siguientes precios por galón automóviles.

4,03 4,05 4,15 4,00 3,99 4,00 3,98 3,97 4,10 4,12 4,08 4,05 4,00 4,04 4,05 4,00 3,99 3,97 4,00 3,98

Si el precio de venta de gasolina de 97 octanos sigue una distribución normal, determine el intervalo de confianza al 95% del precio promedio poblacional.

4. La cantidad de horas que duerme una persona que sobresale en su trabajo tiene una distribución normal. En la siguiente tabla se observa la cantidad de horas de sueño por noche de 24 individuos que sobresalen en su trabajo.

Referencias

Documento similar

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

Sanz (Universidad Carlos III-IUNE): &#34;El papel de las fuentes de datos en los ranking nacionales de universidades&#34;.. Reuniones científicas 75 Los días 12 y 13 de noviembre

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)