• No se han encontrado resultados

Estadística

N/A
N/A
Protected

Academic year: 2021

Share "Estadística"

Copied!
138
0
0

Texto completo

(1)
(2)
(3)

ESTADÍSTICA

(4)
(5)

Estadística

Dra. Gilda Melva Franco Espejel * UPIICSA - IPN,

 Academias de Matemáticas

Lie. Martha Leticia Hernández * UPIICSA- IPN,

 Academias de Matemáticas

Lie. Ernesto García García *

UPIICSA- IPN, Academias de Matemáticas

Ing. Rodolfo Matus Quiroz *

UPIICSA - IPN, Academias de Matemáticas

* Becario del Sistema de Becas por exclusividad, COFAA - IPN

(6)

ESTADÍSTICA

Primeraedición: 2003 Primera reimpresión: 2006

© DR 2003. I NSTITUTOPOLITÉCNICO NACIONAL

Unidad Profesional ínterdisciplinaria de Ciencias Sociales y Administrativas

Queda prohibida la reproducción total o parcial de esta obra  por cualquier medio o procedimiento, sin la autorización

escrita del editor 

ISBN 970-92240-5-0

(7)

PRÓLOGO

La Unidad Profesional Interdiscipiinaria de Ingeniería y Ciencias Sociales y Administrativas (UPHCSA) del Instituto Politécnico Nacional promueve entre su personal académico el diseño y la elaboración de material didáctico para ofrecer a los estudiantes de las diversas licenciaturas que se imparten libros de texto acordes al contenido y enfoque de cada asignatura a precios accesibles en comparación con los disponibles en el mercado.

Con base en lo anterior, y atendiendo a esta iniciativa, nos hemos sumado a este esfuerzo dando como resultado esta obra denominada "Estadística11, producto derivado del proyecto de investigación "Material Didáctico para la Enseñanza del Cálculo Integral y la Estadística", con número de registro CGPI 20031888. Esta obra está dirigida a estudiantes de nivel licenciatura de las ramas de ingeniería, ciencias médico-biológicas y ciencias sociales y administrativas que desean una buena base de conceptos y técnicas estadísticas de manera sencilla y accesible para su comprensión y dominio que les permita aplicarlos a problemas propios de su actividad profesional para facilitarles la toma de decisiones

En términos generales, cuando se habla de estadística con el común de las personas, de inmediato se relaciona con porcentajes, promedios y gráficas. Para los más estudiosos, estadística es una disciplina basada en conceptos, reglas, técnicas y métodos para manejo de información.

De igual manera, la información estadística que nos llega cotidianamente a través de los medios masivos de comunicación (prensa, radio, televisión, etc.) influye en nuestra comprensión de las cosas y, en consecuencia, en tomar decisiones que pudieran afectar nuestra forma de vida. De manera similar ocurre con las empresas que, para subsistir, continuamente toman decisiones con base en la información estadística disponible, tanto la obtenida en un contexto político, económico y social nacional e internacional, como la que se genera de manera interna por la propia empresa.

(8)

De aquí, la importancia de estudiar formalmente la estadística y sus técnicas para entender y comprender mejor el mundo que nos rodea que nos permita la racional toma de decisiones.

El contenido de este texto requiere, para su estudio, de un amplio conocimiento y pleno dominio del Cálculo Diferencial e Integral y un curso introductorio de Probabilidad.

Esta obra está estructurada en dos grandes apartados: Estadística Descriptiva y Estadística Inferencia!. El contenido temático comienza por las Distribuciones Frecuenciales y las Distribuciones Muéstrales para continuar con los conceptos de Estimación de Intervalos de Confianza; posteriormente, se plantean las Pruebas de Hipótesis y los Análisis de Regresión y Correlación.

Los temas son presentados con la base teórica necesaria, sacrificando muchas veces el rigor matemático en aras de una mejor comprensión y dominio operativo de las técnicas estadísticas básicas, a través una serie de ejemplos ilustrativos resueltos.

 Asimismo, con el propósito de evaluar el aprendizaje, se presenta al final de cada capítulo una serie de ejercicios propuestos, con su correspondiente solución, para que el estudiante resuelva y verifique los resultados obtenidos.

Se agradecerá al lector cualquier comentario o sugerencia que contribuya a mejorar el contenido y alcances de esta obra.

(9)

 ______________________________________________________________________________ Contenido

CONTENIDO

CAP. Pág.

I Distribuciones frecuencíales 1

1.1 Distribuciones frecuencia les de datos no agrupados 2

1.1.1 Medidas de tendencia central 2

1.1.2 Medidas de dispersión 4

1.2 Distribuciones frecuenciales de datos agrupados 5

1.2.1 Medidas de tendencia central 6

1.2.2 Medidas de dispersión 8

1.3 Gráficas 8

1.4 Ejemplos resueltos 9

1.5 Problemas propuestos 15

II Distribuciones muéstrales 27

11.1 Distribución muestral de medias 27

11.2 Teorema del limite central 28

11.3 Distribución muestral de diferencia de medias 29

11.4 Distribución muestral de proporciones 29

11.5 Ejemplos resueltos 31

11.6 Problemas propuestos 36

III Estimación e intervalos de confianza 43

II 1.1 Estimación 43

III.2 Intervalos de confianza 45

111.2.1 Intervalos de confianza para conocida 45 III,2.2 Intervalos de confianza para desconocida 46 III.2.3 Intervalos de confianza para

(10)

Contenido

111.2.4 Intervalos de confianza para

desconocidos

47

111.2.5 Intervalos de confianza de muestra grande para

 p

47

111.2.6 Intervalos de confianza para

48

111.2.7 Intervalos de confianza para

48

111.2.8 Intervalos de confianza para

49

111.3 Tamaño de muestra y error de estimación

49

111.4 Ejemplos resueltos

50

111.5 Problemas propuestos

57

IV Pruebas de hipótesis 65

IV.1 Tipos de hipótesis

65

IV.2 Tabla de errores tipo I y II

66

IV.3 Hipótesis de una cola y de dos colas

66

IV.4 Procedimiento para resolver una prueba de hipótesis

67

IV.5 Pruebas relativas a medias

(grandes muestras y pequeñas muestras)

67

IV.6 Pruebas relativas a diferencia entre medias

(grandes muestras y pequeñas muestras)

69

1V.6.1 Teorema del limite central

70

IV.7 Pruebas para proporciones en la población

71

(11)

Contenido

V. Análisis de regresión y correlación 95

V.1 Introducción 95

V.2 Método de mínimos cuadrados 97

V.3 Calculo de un estimador de 98

V.4 Inferencias relativas a la pendiente ib de una recta. 98 V.4.1 Método para desarrollar una prueba de hipótesis 99 V.5 Intervalo de confianza par la pendiente b 100

V.6 Análisis de correlación 100

V.7 Ejemplos resueltos 102

V.8 Problemas propuestos 109

(12)
(13)

 ____________________________________________________ DISTRIBUCIONES FRECUENCIALES

CAPITULO I

Distribuciones frecuenciaies

El campo de la estadística trata de la recolección, presentación, procesamiento, análisis y

uso de datos para tornar decisiones, solucionar problemas y diseñar productos y procesos.

La estadística se divide en dos grandes ramas: La estadística descriptiva y la estadística inferencial.

La estadística descriptiva traía de la descripción de una serie de datos y la estadística inferencial estudia el análisis e interpretación de los datos para obtener conclusiones (o inferencias).

Los métodos estadísticos se utilizan como ayuda para describir y entender la variabilidad.

Por variabilidad se entiende a las observaciones sucesivas de un sistema o fenómeno que no producen el mismo resultado.

Por ejemplo: considérese el rendimiento del tanque de gasolina de un automóvil: ¿se recorrerá siempre el mismo kilometraje con cada tanque de combustible? Por supuesto que no, en ocasiones el kilometraje variará considerablemente, ya que dependerá de muchos factores, como son: los cambios en el estado del vehículo como la presión de las llantas, la compresión del motor, el desgaste de las válvulas; las condiciones de manejo (si es en ciudad o en carretera), el tipo de octanaje de la gasolina utilizada, de las condiciones meteorológicas, etc. Estos factores representan fuentes de variabilidad. Considérese la siguiente figura:

(14)

CAPÍTULO I _____________________________________________________________________ 

Frecuencia Datos u observaciones

Figura 1

Esta gráfica permite ver dos características de los datos; la localización o tendencia central y la dispersión o variabilidad.

La localización o tendencia central, puede caracterizarse con el promedio o media.

La variabilidad o dispersión de los datos, puede describirse con la varianza o la desviación estándar.

1.1 Distribuciones frecuenciales de datos no agrupados

Cuando la población es finita y se consideran todos !os elementos de ella (a tratar, uno a uno), se trabaja lo que se dice una distribución de datos no agrupados.

(15)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para una serie de datos, sean:

los elementos diferentes, desde

la frecuencia con que se presentan los elementos diferentes, desde

Se tiene que:

La media es:

La mediana que previo orden, se define según el tamaño del experimento, sea par o impar.

¡Previo ORDEN!

Si

n

es impar:

Si n es par:

= elemento

central

= media aritmética de

los elementos

centrales

La moda que será el elemento de mayor frecuencia.

(16)

CAPÍTULO I ____________________________________________________________________ 

1.1.2 Medidas de dispersión de datos no agrupados

Son aquellas que indican el grado de dispersión o variabilidad de los datos con respecto a una medida de tendencia central.

Como medidas de dispersión, se tienen:

El rangoRes la diferencia del valor máximo menos el mínimo de los datos. Esto es,

es una sucesión de

n

observaciones, entonces

la

varianza,

esta dada por:

 Nota: Si se está trabajando con una muestra, el denominador será

En donde la desviación estándar, que es otra medida de dispersión, quedará representada por:

(17)

 ____________________________________________________ DISTRIBUCIONES FRECUENCIALES

1.2 Distribuciones frecuenciales de datos agrupados

Cuando se tiene una serie de datos de tal manera que se agrupa en clases, para resolver con mayor facilidad de tiempo, espacio y/o dinero, se está trabajando con una distribución frecuencial de datos agrupados.

Para un experimento formado por un número finito n de elementos con k clases de la

misma longitud, donde es decir, número de clases menor o igual que tamaño del experimento.

Cada clase, estará formada por un limite inferior (U)y un límite superior(LS), ejemplo:

Intervalos de clase

Se hace necesario construir los límites reales. Es decir, límite real inferior (IR//) del intervalo /-ésimo, es igual a:

(18)

CAPÍTULO I _____________________________________________________________________ 

tal que, el ejemplo queda:

LRI  L I  LS LRS

0.5

1

5

5.5

5.5

6

10

10.5 10.5

11

15

15.5 15.5

16

20

20.5 20.5

21

25

25.5

Sea x¡ que denota la marca de clase del intervalo /-ésimo, y que es el punto medio del

intervalo de clase, de tal forma que se calcula de la siguiente manera:

1.2.1 Medidas de tendencia central para datos agrupados

Las medidas de tendencia central para el caso de datos agrupados, se calcularán de la siguiente manera:

(19)

 ___________________________________________________ DISTRIBUCIONES FRECUENCIALES

Para calcular la mediana,se hace necesario primero ordenar los datos, después calcular cuál

es ia posición n/2. Es necesario ubicar en qué intervalo se encuentra dicha posición para saber cuál es el limite real inferior de la clase mediana Hay que calcular las frecuencias acumuladas hasta el intervalo de clase anterior a la clase mediana

es igual a la suma de las frecuencias absolutas de los intervalos de clase anteriores hasta el intervalo / - ésimo). Después ubicar la frecuencia de clase mediana. y finalmente calcular la longitud del intervalo de la clase mediana

Mediana:

Para la moda se elige el intervalo de mayor frecuencia y se ubica cuál es el limite real inferior  de la clase modal Se hace necesario encontrar  que está definido como: la diferencia de frecuencia de la clase modal con ei intervalo de clase anterior a la clase modal

como la diferencia de frecuencia de la clase modal con el intervalo de clase posterior a la clase modal. Así como también calcular la longitud del intervalo de clase modal De tal forma que queda:

(20)

CAPÍTULO I________________________________________________________________________ 

1.2-2 Medidas dt dispersión para datos agrupados

Las medidas de dispersión para el caso de datos agrupados, quedan definidas de la manera

siguiente:

La desviación estándar, que se calcula como la raíz cuadrada de la vananza, es decir 

Varianza =

es la marca del intervalo

i

- ésimo

frecuencia de clase del intervalo

i -

ésimo

tamaño del experimento

(21)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

Polígonos de frecuencia.

Es la unión de las marcas de clase en los techos de los rectángulos

en el histograma. El polígono de frecuencia debe quedar cerrado al principio y al final de la

gráfica, a través del hecho de aumentar un intervalo de clase de la misma longitud y con

frecuencia cero (esto quedará sobre el eje de las abscisas, y se unirá en la marca de clase

respectiva.)

1.4 Ejemplos resueltos

Ejemplo núm. 1

Considerar la siguiente serie de datos: 8,7,6,5,9,15,14,13,11,7,12 calcular 

a) lamedia aritmética,

b) la mediana,

c) la moda,

d) la varíanza y la desviación estándar

e) graficar.

Solución

(22)

CAPÍTULO I _____________________________________________________________________   xt   f(x¡)

5

1

6

1

7

2

8

1

9

1

11

1

12

.1

13

1

14

1

15

1

Justificación teórica

b) Ordenando los datos

(23)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

e)

(24)

CAPÍTULO I _____________________________________________________________________ 

Ejemplo núm. 2

Calcular la mediana de la siguiente serie de datos;

2, 3, 9, 21, 18, 12, 4, 4, 15, 17

Solución

¡Ordenando los datos!

2, 3, 4, 4

F

 9, 12, 15, 17, 18, 21

Los elementos centrales son el 9 y el 12, por lo que:

Mediana =

Ejemplo núm. 3

(25)

 ______________________________________________________ DISTRIBUCIONES FRECUENCIALES

Solución

(26)

CAPÍTULO I _____________________________________________________________________ 

(27)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

1.5 Problemas propuestos

Datos no agrupados

1. Sea la siguiente serie de datos: 2,15, 9,16, 3,4,8,4, 5, 5, 5,8. Encontrar: a) Medidas de tendencia central.

b) Medidas de dispersión. c) Graficar.

Resp. media = 7, mediana = 5, moda = 5,

2. Considérese la siguiente serie de datos: 2, 3,4,4,4, 5, 7, 8, 8,9,15. Encontrar: a) Medidas de tendencia central.

b) Medidas de dispersión. c) Graficar.

Resp. media = 6.27, mediana = 5, moda = 4,

3. Sean los siguientes datos: 2,5,5, 5,7, 7,9,10, 15,17. Encontrar: a) Medidas de tendencia central

b) Medidas de dispersión c) Graficar.

(28)

CAPÍTULO I _____________________________________________________________________ 

4. Sea la siguiente serie de datos: 2, 2,3,4, 4, 4, 5,6,7,10,10,12,13,15,2(

Encontrar:

a) Medidas de tendencia central. b) Medidas de dispersión.

c) Gráficar.

Resp. media = 7.8, mediana = 6, moda = 4,

5. Los siguientes datos son las calificaciones de un alumno que estudia en el nivel superior y las frecuencias con que se presentan dichas calificaciones.

Calificaciones Frecuencia

a) Encontrar las medidas de centralización. b) Encontrar las medidas de dispersión. c) G rafear.

(29)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

6. Encontrar las medidas de tendencia central y las medidas de dispersión, así como su gráfica, del siguiente conjunto de datos:

Resp. a) 2.56,2.5, 2.5 6)0.7773,0.8816

7. El número promedio de cursos aprobados de actualización, por cada profesor en una universidad, en un periodo de un año, es como sigue: 3, 2, 0,1,1,1,1,0,1,1,1,1, 0, 1,2,2,8,5, 5, 7,4,3, 3,0 y 0. Se desea conocer: a) Rango. b) Medidas de centralización. c) Medidas de dispersión. d) Graficar. Resp. a) 8  b) 2.12,1,1 c) 4.582, 2.14

8. En una industria, se registró la siguiente producción mensual de archiveros: 1000, 1500,1800,1800,2150/2400. Calcular:

a) Medidas de centralización. b) Medidas de dispersión,

c) Graficar polígono de frecuencias absolutas.

Resp. a) 1775,1800,1800 b) 448.84

(30)

CAPÍTULO I______________________________________________________________________ 

9. En una empresa, durantelO días, se observaron, los minutos del personal que llegó tarde. 10,12,21,8, 6, 15,2,17,30,13 a) Calcular el Rango. b) Medidas de centralización. c) Medidas de dispersión. Resp. a) 28 b) 13.4,12.5, no existe moda c) 7.59

10. Considérese la siguiente serie de datos:

 Xi  frecuencia 3 1 4 1 5 2 6 2 8 3 10 4 11 5 12 7 14 4 15 1

a) Calcular las medidas de centralización b) Calcular las medidas de dispersión.

(31)

 __________________________________________________DISTRIBUCIONESFRECUENCIALES

11. Sean los siguientes datos:

 x¡  f(Xi)  Xi   f(Xi)

3 2 8 5 4 5 10 4 5 8 12 3 6 10 14 2 7 8 16 1 a) Graficar

b) Encontrar medidas de centralización. c) Encontrar medidas de dispersión.

Resp. b) 7.125,6,6 c) 2.93

12. Sean los diferentes precios de unas camisas:

1000, 3000, 2500, 3500, 5000, 1500, 2700, 4500, 2700, 3500. a) Graficar la distribución de frecuencias.

b) Calcular las medidas de tendencia central. c) Calcular las medidas de dispersión.

Resp. b) media = 2990, mediana = 2850, moda = bimodal = 2700 y 3500 c) 1158.83

13. Sean los siguientes datos:

 Xi  /(Xi)  x¡  f(Xi )

10

2

50

5

20

3

60

7

30

7

70

3

(32)

CAPÍTULO I _____________________________________________________________________ 

a) Graficar.

b) Encontrar medidas de tendencia central. c) Encontrar medidas de dispersión,

Resp, b) media = 43, mediana = 45, moda = 30,60 c) s= 17.72

14. Sean los siguientes datos:

a) Graficar.

b) Calcular medidas de centralización c) Calcular medidas de dispersión.

Resp. b) media = 6.052, mediana = moda = 3 c) s = 2.788

Datos agrupados

15. Sea la siguiente serie de datos agrupados:

(33)

 ____________________________________________________ DISTRIBUCIONES FRECUENCIALES

a) Calcular las medidas de centralización. b) Calcular las medidas de dispersión. c) Graficar.

Resp. a) media = 28.75, mediana = 30.5, moda = 3.83, = 116.935, s= 10.81

16. Sea la siguiente tabla de datos:

Intervalos de clase

a) Calcular las medidas de centralización. b) Calcular las medidas de dispersión. c) Graficar.

Resp. a) media = 58.16, mediana = 59.59, moda = 62.8,

= 581.82,5 = 24.12

17. Sea la siguiente tabla de datos:

(34)

CAPÍTULO 1______________________________________________________________________ 

a) Graficar histograma y polígono de frecuencias absolutas, b) Calcular medidas de tendencia central.

c) Calcular medidas de dispersión.

Resp. b) media = 44.9, mediana = 48.83, moda = 57.16

269.64, s = 16.42

18. Sea la siguiente tabla de datos:

LRI LRS f(Xi) 0 - 5 10 5 - 10 20 10 - 15 30 15 - 20 50 20 - 25 20 25 - 30 10

a) Graficar histograma y polígono de frecuencias absolutas. b) Calcular medidas de tendencia central.

c) Calcular medidas de dispersión.

Resp. b) media = 15.35, mediana = 16, moda = 17, c) s = 6.468

(35)

 _____________________________________________________ DISTRIBUCIONES FRECUENCIALES

19. Sean los siguientes datos:

LRI LRS

a) Graficar

b) Calcular medidas de centralización. c) Calcular medidas de dispersión.

Resp. b) media = 21.95, mediana = 22.91, moda = 27.22,

c) s = 9.077

20. Sea la siguiente tabla de datos:

(36)

CAPÍTULO I ______________________________________________________________________ 

a) Graficar

b) Calcular medidas de centralización.

c) Calcular medidas de dispersión.

Resp. b) media = 40.55, mediana = 40, moda = 56.66,

c) s = 18.019

21. Sea la siguiente tabla de datos:

U LS

a) Graficar.

b) Calcular medidas de tendencia central.

c) Calcular medidas de dispersión.

Resp. b) media = 15, mediana = 16, moda = 17.33,

c) s = 4.72

22. Sea la siguiente tabla de datos:

(37)

 ____________________________________________________ DISTRIBUCIONES FRECUENCIALES

a) Graficar.

a) Calcular medidas de tendencia central.

b) Calcular medidas de dispersión.

Resp. b) media = 10.71, mediana = 9, moda = 7.22, c)s =

4.6

Problemas varios

23. Estimar la desviación estándar de la siguiente muestra de datos: 20,5,10,15 y 25.

Resp. 7.91

24. Obtener la variancia de ia siguiente distribución de frecuencias, mediante la fórmula:

Resp. a y b 141.84

de los siguientes

(38)

CAPITULO I______________________________________________________________________ 

25. En una exhibición científica, se anotó la edad de cada uno de los 50 visitantes que

asistieron. Hallar la media de edad y la clase a la que pertenece la mediana.

Edad

Frecuencia

De 0 a < 10

6

De 10 a < 20

18

De 20 a < 30

11

De 30 a < 40

3

De 40 a < 50

0

De 50 a < 60

8

De 60 a < 70

4

Resp. media = 27.6

(39)

 ______________________________

 _______________________________________________________ _________________________ DISTRIBUCIONES MUESTRALESDISTRIBUCIONES MUESTRALES

CAPÍTULO II

CAPÍTULO II

Distribuciones mu

Distribuciones mu

ee

strales

strales

La distribución de probabilidad de un

La distribución de probabilidad de un estadístico recibe el nombre de estadístico recibe el nombre de distribución muestral.distribución muestral.

La distribución muestral de un

La distribución muestral de un estadístico depende:estadístico depende:

• del del tamaño tamaño de de la la poblaciónpoblación •

• del del tamaño tamaño de de las las muestrasmuestras •

• del del método método de de selección selección de de las las muestrasmuestras

11.1 Distribución muestral de medias

11.1 Distribución muestral de medias

Supónganse que una muestra aleatoria de

Supónganse que una muestra aleatoria de nnobservaciones se toma de una población normalobservaciones se toma de una población normal

y varianza y varianza con media

con media Cada observaciónCada observación de ía muestrade ía muestra aleatoria tiene entonces la misma distribución normal que la población que está siendo aleatoria tiene entonces la misma distribución normal que la población que está siendo muestreada. De aquí que, por

muestreada. De aquí que, por la propiedad reproductiva:la propiedad reproductiva:

 Adem

 Además siás si:: también son independientes contambién son independientes con parapara

Se concluye que la media muestral: Se concluye que la media muestral:

(40)

CAPÍTULO

CAPÍTULO

II

II

________

________

_______

_______

_______

_______

_______

_______

________

________

_______

_______

_______

_______

___ 

___ 

tiene una distribución normal con

tiene una distribución normal con

media

media

y vañanza

y vañanza

Si el muéstreo se hace en una población que tiene una distribución

Si el muéstreo se hace en una población que tiene una distribución

de

de probabilidad

probabilidad

desconocida, la distribución de muestreo de la media muestra! seguirá siendo

desconocida, la distribución de muestreo de la media muestra! seguirá siendo

y varianza

y varianza

si el tamaño de la muestra

si el tamaño de la muestra

aproximadamente normal con media

aproximadamente normal con media

es grande.

es grande.

Éste es uno de los teoremas más útiles en la estadística, llamado

Éste es uno de los teoremas más útiles en la estadística, llamado

Teorema del limite centralTeorema del limite central

y

y

dice:

(41)

 ______________________________

 ________________________________________________________ __________________________ DISTRIBUCIONES MUÉSTRALESDISTRIBUCIONES MUÉSTRALES

Conforme

Conforme

es la distribución normal estándar 

es la distribución normal estándar 

11.3 Distribución muestral de diferencia de medias

11.3 Distribución muestral de diferencia de medias

Si se tienen dos poblaciones independientes, con media

Si se tienen dos poblaciones independientes, con media

y varíanza

y varíanza

son las medias muéstrales de dos variables aleatorias

son las medias muéstrales de dos variables aleatorias

independientes de tamaños

independientes de tamaños

de estas poblaciones, entonces la distribución de

de estas poblaciones, entonces la distribución de

muestreo de:

muestreo de:

Es aproximadamente normal estándar, si se cumplen las condiciones del teorema del limite

Es aproximadamente normal estándar, si se cumplen las condiciones del teorema del limite

central.

central.

Si

Si las dos poblaciones son normales, entonces la distribución de muestreo de Z

las dos poblaciones son normales, entonces la distribución de muestreo de Z

es

es

exactamente normal estándar.

exactamente normal estándar.

11.4 Distribución muestral de proporciones

11.4 Distribución muestral de proporciones

Supónganse una población infinita o finita y que la probabilidad de ocurrencia de un suceso

Supónganse una población infinita o finita y que la probabilidad de ocurrencia de un suceso

{conocido como éxito) es

{conocido como éxito) es

 p , p ,

mientras que la probabilidad de no ocurrencia del suceso es

mientras que la probabilidad de no ocurrencia del suceso es

q = l~p. q = l~p.

Se consideran

(42)

CAPÍTULO II_____________________________________________________________________ 

Se obtiene una

distribución muestra! de proporciones

cuya media

y desviación típica

están dadas por:

la distribución muestral se aproxima a una distribución

Para grandes valores de

n

normal.

Nótese que la población se distribuye binomialmente.

Para las distribuciones muéstrales de diferencias de proporciones de dos poblaciones

distribuidas binomialmente con parámetros

respectivamente:

las distribuciones muéstrales de diferencias de

son grandes

(43)

 ________________________________________________________ DISTRIBUCIONES MUÉSTRALES

11.5 Ejemplos resueltos

Ejemplo núm. 1

Una compañía fabrica focos que tienen un periodo de vida que está distribuido aproximadamente en forma normal, con media igual a 1000 horas y una desviación estándar de 50 horas. Encuentre la probabilidad de que una muestra aleatoria de 25 focos tenga una vida promedio de menos de 975 horas.

Solución

Datos:

Justificación teórica

Distribución muestral de medias

(44)

CAPÍTULO II_____________________________________________________________________ 

Ejemplo núm. 2

se saca aleatoriamente de una población que está Una muestra de tamaño

y se registra la media normalmente distribuida, con media y varianza

(45)

 ________________________________________________________ DISTRIBUCIONES MUÉSTRALES

Solución

Datos

Justificación teórica

Distribución muestral para diferencia de medias

(46)

CAPÍTULO II _____________________________________________________________________ 

Ejemplo núm. 3

Se ha encontrado que el 2% de las piezas producidas por cierta máquina está dañado. ¿Cuál

es la probabilidad de que en una remesa de 400 piezas, esté dañado 3% o más?

Solución

Datos

Justificación Teórica

(47)

 ________________________________________________________ DISTRIBUCIONES MUÉSTRALES

Primer método

Mediante la corrección para variables discretas.

Segundo método

3% de 400=12 piezas dañadas.

(48)

CAPITULO II______________________________________________________________________ 

11.6 Problemas propuestos

1. Una población está formada por ios cuatro números 1, 3, 7, 9. Considerar todas las posibles muestras de tamaño 2 que pueden extraerse de esta población con reempíazamiento. Hallar:

a) la media poblacionai

b) la desviación típica poblacionai

c) la media de la distribución muesíral de medias

d) la desviación típica de la distribución muestra) de medias

(49)

 ________________________________________________________ DISTRIBUCIONES MUESTRALES

a) con reemplazamiento b) sin reemplazamiento

Resp.

3. Un grupo de jóvenes emprendedores de la UPIICSA, ha decidido promover un producto de frutas, recubiertas de chocolate amargo, de manera que el recubrimiento sea de 3 mm de espesor. Si funciona e! proceso que ellos han determinado (media de 3 mm y desviación estándar 1 mm), ¿cuál será la probabilidad de obtener una muestra de 25 frutas cubiertas de chocolate amargo, de un total de 169? Encontrar un promedio muestral de más de 3.4.

Resp. 0.0139

4. En !a nevería Tas Delicias" se ha observado que en la temporada primavera-verano, el promedio de las ventas es de 100 It diarios, con una desviación estándar de 10 It. La distribución de ventas es normal. Encuentre la probabilidad de que al tomar una muestra de n -25 consumidores, las ventas promedio a éstos, será menor a 95 It.

Resp. 0.0062

5. Ciertos ventiladores fabricados por una compañía tienen una duración media de 1 000 horas y una desviación típica de 75 horas. Hallar la probabilidad de que una muestra tomada al azar de 25 ventiladores tenga una duración media entre 990 y 1 010 horas.

(50)

CAPÍTULO II ____________________________________________________________________ 

6. Ciertos tubos producidos por una compañía tienen una duración media de 900 horas y

una desviación típica de 80 horas. La compañía despacha 1 000 lotes de 100 tubos

cada uno. ¿En cuántos lotes cabe esperar que la media de las duraciones sobrepase

las 910 horas?

Resp. 106

7. Una población muy grande tiene una media de 20 y una desviación estándar de 1.4,

Si se toma una muestra de 49 observaciones, contestar:

a) ¿Cuál es la media de la distribución de maestreo?

b) ¿Cuál es la desviación estándar de la distribución de muesíreo?

c) ¿Qué porcentaje de posibles valores medios de la muestra diferirán de la

media de la población, por más de 0.2?

Resp.

a) 20

b)0.2 c)

15.87%

8. Una investigación ha revelado que el 60% de los estudiantes universitarios no son

fumadores. Si se toma una muestra de 600 estudiantes, encuentre la media y la

desviación estándar de la distribución de muestreo.

Resp. 360,12

9. Debido a los altos índices de contaminación ambiental en la Ciudad de México, se

(51)

10. El candidato del partido X¡,considera que puede ganar las próximas elecciones en la

ciudad de Guadalajara, si obtiene al menos 55% de los votos en el distrito i. Además supone que alrededor del 50% de los votantes en Guadalajara están a su favor. Si

N= 100 votantes van a votar en el primer distrito, ¿cuál es la probabilidad de que el

candidato Xy reciba al menos 50% de los votos?

Resp. 0.1587

11. Se ha encontrado que el 2% de los tornillos pr oducidos por cierta máquina son defectuosos. ¿Cuál es la probabilidad de que en una partida de 400 piezas, sean defectuosas 3% o más?

Resp. 0.1056

12. Los resultados de una elección demostraron que cierto candidato obtuvo el 46% de los votos. Determinar la probabilidad de que de 200 individuos elegidos al azar de entre la población votante se hubiese obtenido una mayoría de votos para dicho candidato.

Resp. 0.1131

13. Hallar la probabilidad de que en 120 lanzamientos de una moneda, el número de soles esté comprendido entre el 40% y el 60%

Resp. 0.9887

14. Un detallista compra vasos de cristal en grandes cantidades directamente de la fábrica. Tales vasos son envueltos uno por uno. Algunas veces el detallista inspecciona las remesas para determinar la proporción de vasos rotos o defectuosos. ¿Cuál es la probabilidad de que el detallista obtenga una muestra aleatoria de 100 vasos que presenta el 17% o más de defectuosos?

Resp. 0.0154

(52)

CAPÍTULO II _____________________________________________________________________ 

15. La vida promedio del motor de determin ado automóvil es de 5 000 km, con una desviación estándar de 40 km. La distribución es muy aproximada a una normal. El fabricante introduce mejoras en el proceso de fabricación del motor para aumentar el tiempo de vida promedio a 5 050 km y disminuye la desviación estándar a 30 km. Supóngase que se toma una muestra de tamaño 16 del proceso antiguo y otra de tamaño 25 para el proceso nuevo. ¿Cuál es la probabilidad de que la diferencia entre las dos medias muéstrales X  x - X 2 , sea al menos de 25 km? {suponer poblaciones independientes).

Resp. 0.9838 16. Las pilas eléctricas de un fabricante A tienen una duración media de 1 400 horas, con

una desviación típica de 200 horas, mientras que las de otro fabricante B tienen una duración media de 1 200 horas con una desviación típica de 100 horas. Si se toman muestras al azar de 125 pilas de cada fabricante, ¿cuál es la probabilidad de que las pilas de A tengan una duración media que sea al menos 160 horas más, que las pilas deB?

Resp. 0.9772

17. A y B fabrican dos tipos de cables, que tienen unas resistencias medias a la rotura de 4 000 y 4 500 kg, con desviaciones típicas de 300 y 200 kg, respectivamente. Si se comprueban 100 cables de A y 50 cables de B, ¿cuál es la probabilidad de que la media de resistencia a la rotura de B sea al menos 600 kg más que A?

(53)

Resp. 0.0228 19. Cuando se prepara un lote de cierto producto químico, la cantidad de una impureza

del lote es una variable aleatoria, con valor medio de 4 gr, y desviación estándar de 15 gr. Si se preparan 50 lotes de manera independiente, ¿cuál es ia probabilidad (aproximada) de que la cantidad promedio de la muestra de impureza  X sea entre

3.5 y 3.8 gr?

Resp. 0.1642

20. Supóngase que una investigación efectuada recientemente revela que el 60% de los adultos de una población no son fumadores. Si se toma una muestra aleatoria de 600 adultos, encuentre e interprete la media y la desviación estándar de la distribución de muestreo.

Resp. 360,12

21. Una población está formada por los números 3, 7, 11, 15. Considerar tod as las posibles muestras de tamaño dos, que pueden encontrarse de esta población SIN reemplazamtento. Hallar:

a) La media poblacional

b) La desviación típica poblaciona!

c) La media de la distribución muestral de medias

d) La desviación típica de la distribución muestral de medias

Resp. a) 9.0 b)4.47 c)9.0 d)2.58

(54)

CAPITULO II _____________________________________________________________________ 

22. Un proceso para llenar botellas de soda presenta una producción promedio en la que el 10% de las botellas no están completamente llenas. Si mediante este proceso se selecciona al azar una muestra de 225 botellas de un lote de 625 envases llenos, ¿cuál es la probabilidad de que la proporción muestral de botellas parcialmente llenas se encuentre en el intervalo que va del 9 al 11%?

Resp. 0.4680

23. Calcular el valor del factor de corrección para una población finita cuando « = 10 y N=1000.

Resp. FC= 0.9954

24. Si un bote de un galón de cierta clase de pintura cubre en promedio 513.3 pies cuadrados, con un desviación estándar de 31.5 píes cuadrados, ¿cuál es la probabilidad de que el área media cubierta por una muestra de 40 de estos botes esté entre 510 y 520 pies cuadrados?

Resp. 0.6553 25. Una máquina vendedora de refrescos está programada para que la cantidad de

refresco que se sirva sea una variable aleatoria, con una media de 200 mi y una desviación estándar de 15 mi. ¿Cuál es la probabilidad de que la cantidad de refresco

(55)

 __________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

CAPÍTULO III

Estimación e intervalos de confianza

111.1 Estimación

Puesto que las poblaciones se caracterizan por medidas descriptivas numéricas llamadas

 parámetros, la inferencia se ocupa de hacer inferencias acerca de los parámetros de una

población.

La inferencia estadística consiste en aquellos métodos con 1os cuales se pueden realizar

generalizaciones acerca de una población.

del

Unaestimación puntual de algún parámetro población al es un valor único

estadístico

El estadístico que se utiliza para obtener una estimación puntual recibe el nombre de

estimador.

Se dice que un estadístico © es un estimador insesgado del

si

parámetro

Si se consideran todos los estimadores insesgados, posibles de algún parámetro aquel con la varianza más

(56)

CAPITULO III ____________________________________________________________________ 

Las características para un buen estimador son las siguientes:

a) insesgado b) consistente c) eficiente d) suficiente

a) Estimador insesgado.Un estimador es insesgado cuando la media de la distribución

muestra! de medias es igual al correspondiente parámetro de la población.

b) Estimador consistente. Cuando un estimador (tal como se aproxima al

parámetro de la población que se va a estimar (tal como aumentando el tamaño de la muestra, se dice que el estimador es consistentedel parámetro.

c) Estimador eficiente.Si las distribuciones de dos estadísticos tienen la misma media,

el de menor varianza se llama un estimador eficiente.

d) Estimador suficiente. Un estadístico suficiente (tal como es un estimador que

utiliza toda la información que posee una muestra sobre el parámetro que se estima.

(57)

 __________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Para entonces se tiene una probabilidad de de seleccionar una muestra aleatoria que produzca un intervalo que contenga a

El intervalo que se calcula a partir de la muestra seleccionada se llama intervalo de confianzade

se le llama nivel de confianza y a los puntos limites de confianza.

extremos

111.2 Intervalos de confianza

Como las estimaciones de punto rara vez serán iguales a los parámetros que se supone estiman, por lo general es deseable damos alguna libertad de acción mediante el uso de "estimaciones de intervalo".

111.2.1 Intervalos de confianza para

conocida

conocida Teorema 1: Intervalo de confianza para

es el valor de la media de una muestra aleatoria de tamaño tomada de una población normal, con la varianza conocida un intervalo de confianza del

para está dado por:

(58)

CAPITULO III____________________________________________________________________ 

111.2.2 Intervalos de confianza para

desconocida

Teorema 2: Intervalo de confianza para desconocida

son los valores de la media y la desviación estándar de una muestra aleatoria de tamaño tomada de una población normal, con (a varianza desconocida un intervalo

para

de confianza del está dado por:

donde r es la distribución tde student.

llf.2.3 Intervalos de confianza para

conocidos

Teorema 3: Intervalo de confianza para conocidas

son los valores de las medias de muestras aleatorias independientes, de tamaño tomadas de poblaciones normales, con las varianzas conocidas

(59)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

111.2.4 Intervalos de confianza para desconocidos

Teorema 4: Intervalos de confianza para desconocidos

Si

son valores de las medias de muestras aleatorias independientes, de tamaño tomadas de poblaciones normales con varianzas desconocidas pero iguales, un intervalo de confianza del para está dado por:

Tal que:

donde íes la distribución / de student.

111.2.5 Intervalos de confianza de muestra grande para/?

Teorema 5: Intervalos de confianza de muestra grande para/j

 para el parámetro binomial

 p

,

Un intervalo de confianza aproximado del

(60)

CAPITULO III ____________________________________________________________________ 

Hl.2.6 Intervalos de confianza de muestra grande para

Teorema 6: Intervalos de confianza de muestra grande para

Un intervalo de confianza aproximado del la diferencia entre dos parámetros binomiales, está dada por:

donde

donde Z es la distribución normal estándar.

111.2.7 Intervalos de confianza para Teorema 7: Intervalo de confianza para

Si

es el valor de la varianza cíe una muestra aleatoria de tamaño tomada de una población normal; un intervalo de confianza del para está dado por:

(61)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

111.2,8 Intervalos de confianza para

Teorema 8: Intervalos de confianza para

Si son los valores de la varianzas de muestras aleatorias independientes de tamaño tomadas de dos poblaciones normales, un intervalo de confianza del

para está dado por;

 por lo tanto

: son los grados libertad. donde/es la distribución de Fisher 

111.3 Tamaño de muestra y error de estimación

Observar que la dispersión de las distribuciones decrece al aumentar el tamaño de la muestra, luego entonces, se hace necesario conocer el procedimiento para seleccionar el tamaño

muestra!.

Si

es el parámetro que se desea estimar  es la desviación estándar de! estimador  puntual, entonces se aplica el siguiente procedimiento:

(62)

CAPITULO III____________________________________________________________________ 

2. Resolver la siguiente ecuación, para el tamaño de muestra

es un función del tamaño muestra!.

Para la mayoría de los estimadores

111.4 Ejemplos resueltos

Ejemplo núm. 1

entrevistados, están familiarizados con los incentivos en los impuestos

Si

que se ofrecen por instalar ciertos dispositivos para ahorrar energia, construyase un intervalo

con un nivel de confianza del 95% para la correspondiente proporción real.

Solución

Datos

(63)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Ejemplo núm. 2

Un estudio señala que 16 de 200 tractores producidos en una línea de ensamblado requieren

ajustes minuciosos antes de ser embarcados, y lo mismo sucede con 14 de 400 tractores

producidos en otra linea de ensamblado. Calcúlese el intervalo de confianza del 95% para

Solución

(64)

CAPITULO III _____________________________________________________________________ 

Justificación teórica

Intervalos de confianza para diferencia de proporciones para muestras grandes.

Ejemplo núm. 3

aspas , después de cierto intervalo de tiempo en La pérdida promedio en el peso de

un molino de aspas es 3.42 gr, con una desviación estándar de 0.68 gr. Construir un intervalo con un nivel de confianza del 99% para la pérdida promedio real de! peso de las aspas en las

(65)

 __________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Justificación teórica

Intervalos de confianza para

con muestras pequeñas:

Quiere decir que el intervalo al 99% de confianza entre 2.92 gr. y 3.92 gr., contiene la pérdida

promedio del peso.

Ejemplo núm. 4

Los siguientes datos son las horas hombre que semanalmente se pierden en promedio pa

accidentes en 10 plantas industriales, antes y después de que se implante cierto programa d€

seguridad

(66)

CAPITULOIII

 ______________________________________________________ 

Utilice un nivel de significancia de 0.10 para probar si el programa de segundad es eficaz.

Solución

Datos

Justificación teórica

(67)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Ejemplo núm. 5

Supóngase que los índices de refracción de 20 piezas de cristal (aleatoriamente seleccionadas de un gran cargamento adquirido por la óptica) tienen una varianza de

Construyase un intervalo de confianza del 95% para o sea la desviación estándar de la población muestreada.

Solución

Datos

Justificación teórica

(68)

CAPITULO III _____________________________________________________________________ 

la

Se tiene el 95% de confianza que el intervalo de 0.0083 hasta 0.016 contiene a desviación estándar verdadera del índice de refracción.

Ejemplo núm. 6

En una encuesta levantada en una ciudad, 136 de 400 personas respondieron afirmativamente a la pregunta de si el transporte público es adecuado. Con una confianza del

se emplea como una 99%, ¿qué se puede decir acerca del error máximo, si

(69)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Justificación teórica Error:

111.5 Problemas propuestos

Intervalos de confianza para medias

1. La media y la desviación de las cargas máximas soportadas por 60 cables son dadas por 11,09 ton y 0.73 ton respectivamente. Hallar los límites de confianza del 95% para la media de las cargas máximas de todos las cables producidos por la compañía.

Resp.{10.9,11.27) 2. La media y la desviación típica de los diámetros de una muestra de 250 remaches

fabricados por una compañía son 0.72642 plg y 0.00058 plg, respectivamente. Hallar los limites de confianza del 99% para el diámetro medio de todos los remaches fabricados por la compañía.

(70)

CAPITULO III ____________________________________________________________________ 

3. Si una muestra aleatoria de tamaño tomada de una población normal con la vananza tiene la media construya un intervalo de confianza del 95% de la media de la población

Resp.57.7

4. Sea X el Cl (Coeficiente Intelectual) de cualquier alumno de las escuelas primarias de

este país. Se sabe que la varianza de  X es 225, Una muestra de los Cl de 25

alumnos proporciona una media de 108. Considerando que X se distribuye

normalmente, construyase un intervalo de confianza del 95% para la media verdadera los Cl.

113.88

Resp.102.12

Intervalo de confianza para la diferencia de medias; conocidas

5. Se desea estimar la verdadera diferencia en contenido de alquitrán de dos marcas de cigarrillos

marca 1 marca II

Tamaño de la muestra Media muestral

(71)

 _________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Intervalos de confianza para proporciones

6. Encuentre un intervalo de confianza del 95% para el porcentaje de productos defectuosos de la población, dada la siguiente información:

Resp. [0.0735,0.1265]

7. Determinar un intervalo de confianza del 98% para la proporción verdadera de la población, si

Resp. [0.18,0.32]

8. Se hace un estudio para determinar la proporción de votantes de una comunidad cuantificable, que favorecen la construcción de una planta generadora de energía nuclear. Si se tiene que sólo 140 de 400 votantes seleccionados al azar favorecen el proyecto; obtenga un intervalo de confianza del 95% de la proporción de todos los votantes de esta comunidad que se expresan a favor del proyecto.

0.397

Resp. 0.303

9. Supóngase que un investigador de mercado desea estimar la verdadera proporción de usuarios de detergente que prefieren una marca particular. Se selecciona una muestra aleatoria de 100 usuarios y 64 de ellos indican que prefieren esa marca de detergente. Obténgase el intervalo de confianza del 99% para  p, verdadera

proporción de todos los usuarios que prefieren esa marca de detergente.

Resp. 0.50512 0.77488

10. De 270 consumidores encuestados 189 indicaron que estarían dispuestos a pagar más por un empaque resistente al manejo indebido. Calcular un intervalo de confianza

(72)

CAPITULO III ___________________________________________________________________ 

con desconocida (pequeñas muestras) Intervalo de confianza para

11. Un fabricante de pinturas desea determinar el tiempo de secado en promedio de una nueva pintura para interiores. Si en 12 áreas de prueba de igual tamaño él obtuvo un tiempo de secado medio de 66.3 minutos y una desviación estándar de 8.4 minutos, construya un intervalo de confianza del 95% para la media verdadera:

71.6

Resp. 61

12. Se toman 16 tazas de café de una máquina y se miden. Se determina que la media y la desviación típica son 7.5 y 0.8 mi, respectivamente. Determine el intervalo de confianza del 99% para

8.0894

Resp. 6.9106

13. Los resultados de una prueba de turbidez, efectuada en 15 muestras de arena de prueba fueron (en micro amperes):

26.7, 25.8, 24.0, 24.9, 26.4, 25.9, 24.4, 21.7, 24.1, 25.9, 27.3, 26.9, 27.3, 24.8, 23.6

Obtener un intervalo de confianza del 95% para

(73)

 __________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

clase duraron en promedio 402 horas. Las desviaciones estándar de las poblaciones, según se sabe son:

25.7 Resp. 6.3

Intervalo de confianza para desconocidas (pequeñas muestras)

15. Se ha realizado un estudio para comparar el contenido de nicotina de dos marcas de cigarrillos. Diez cigarrillos de la marca A tuvieron un contenido de nicotina en promedio de 3.1 mg, con una desviación estándar de 0.5 mg, mientras que 8 cigarrillos de la marca B tuvieron un contenido de nicotina en promedio de 2,7 mg, con una desviación estándar de 0.7 mg. Suponiendo que los dos conjuntos de datos son muestras tomadas al azar de poblaciones normales con varianzas iguales, construya un intervalo de confianza del 95% de la diferencia real en el contenido promedio de nicotina de ías dos marcas de cigarrillos.

Resp. [-0.20,1]

16. Un educador desea determinar si dos distintos métodos de enseñanza tienen efectos idénticos en el aprendizaje. Se seleccionan aleatoriamente dos clases de estudiantes y se exponen a (os dos métodos diferentes; después se aplica a las dos clases un examen estándar, que abarca los contenidos enseñados, para determinar la efectividad de los métodos. A continuación se muestran los datos:

Clase I Clase II Tamaño de la muestra

(74)

CAPITULO III ____________________________________________________________________ 

Determinar el intervalo de confianza del 95% para la verdadera diferencia entre las dos medias poblacionales en base a la diferencia entre las dos medias muéstrales.

9.53

Resp. 0.47

Intervalo de confianza para muestra grande para

17, Si se tiene que 132 de 200 votantes del distrito A favorecen a un candidato dado para la elección del senado y 90 de 150 votantes del distrito B se expresan a favor de este

la

mismo candidato, obtenga un intervalo de confianza del 99% para

diferencia entre las proporciones reales de votantes de los dos distritos favorables al candidato,

Resp.

Intervalo de confianza para varianzas

18. En 16 recorridos de prueba, el consumo de gasolina de un motor experimental, tuvo una desviación estándar de 2,2 It. Construya un intervalo de confianza del 99% para

midiendo la variable real del consumo de gasolina de este motor.

15.78

Resp. 2.21

(75)

 ___________________________________________ ESTIMACIÓN E INTERVALOS DE CONFIANZA

Intervalo de confianza para razones de dos varianzas

20. Considere la siguiente tabla:

Marca B Marca A

Obtener un intervalo de confianza del 98% de

2.862

Resp. 0.076

Tamaño de muestra y error 

21. A partir de una muestra de 200 observaciones se encontró que, en una remesa, había 20 acumuladores defectuosos. Utilizando un intervalo de confianza del 99%, calcule el error de estimación.

Resp. c = 0.055 22. ¿Qué tamaño de muestra será necesario para producir un intervalo de confianza del

90%, en el caso de la media de la población verdadera, con un error de 1.0 en cualquier sentido, si la desviación estándar de la población es 10.0?

273

(76)

CAPITULO

m _________________________________________________________ 

23. Determine un intervalo de confianza de 95% para los dos casos siguientes:

= 1000

a) = 200 b) Resp. a) 15 ± 0.372

24. Una muestra al azar de 100 observaciones tiene una media de 30 y una desviación estándar de 5.

a) Obtenga un valor con el cual usted tenga 95% de confianza de que no excederá la media de la población

b) ¿Cuál es la probabilidad (riesgo) de que

Resp.

a) 30.825 b) 0.0228

25. Determine el tamaño de muestra necesario para estimar el porcentaje verdadero de la población en un 4%, utilizando un intervalo de confianza del 90%. Es razonable suponer que el valor verdadero es 0.30 o menor.

(77)

 _______________________________________________________________ PRUEBAS DE HIPÓTESIS

CAPÍTULO IV

Pruebas de hipótesis

El objeto de la prueba de significación es evaluar proposiciones o afirmaciones acerca de los valores de los parámetros de la población .

IV.1 Tipos de hipótesis

Se definirán los dos tipos de hipótesis que se requiere formular. La que señala que la proposición es verdadera recibe el nombre dehipótesis nula y se representa por  y la segunda, que afirma que la proposición es falsa, se denominahipótesis alternay se designa mediante el signo

es un enunciado que expresa que el parámetro de la

La

hipótesis nula,

que la proporción es verdadera). La

 población es como se especificó i

es un enunciado que ofrece una alternativa a la

hipótesis alterna

 proposición (por ejemplo el parámetro es mayor que el valor propuesto).

El

nivel de significación

de una prueba es la probabilidad de rechazar una

hipótesis nula que sea verdadera.

Existen dos tipos de errores que son inherentes al proceso de la prueba de significación

si se rechaza

cuando es verdadera. La

Se comete un error tipo

es igual al nivel de significación de una

 probabilidad de un error tipo

(78)

CAPITULO IV ____________________________________________________________________ 

Se comete un error tipo

si se acepta

cuando no es verdadera.

IV.2 Tabla de errores tipo I y II

es:

Si

Falsa

Verdadera

Error tipo //

Decisió

n

es aceptada

Y se toma

esta acción:

Error tipo /

es rechazada

Decisión correcta

IV.3 Hipótesis de una cola y de dos colas

Una prueba de hipótesis de una sola cola indica que la región de rechazo se localiza únicamente en un extremo de la distribución muesíral del estadístico de prueba.

(79)

Una prueba de hipótesis de dos cotasindica que la región de rechazo se localiza en los dos

la

extremos de la distribución muestral del estadístico de prueba. Para detectar que

región de rechazo debe situarse equitativamente en los extremos de las colas derecha e izquierda.

IV.4 Procedimiento para resolver una prueba de hipótesis

1. Planteamiento de hipótesis

2. Graficar 

según sea el caso 3. Buscar en tablas

4. Plantear regla de decisión

5. Encontrar: según corresponda

6. Interpretaciones y conclusiones.

IV.5 Pruebas relativas a "medias"

 Analizaremos las pruebas más comúnmente usadas concernientes a la media de una población. Todas las pruebas de esta sección están basadas en la teoría de la distribución normal, suponiendo que las muestras provienen de poblaciones normales o bien que son lo suficientemente grandes para justificar el uso de aproximaciones normales.

Supóngase que se desea probar la hipótesis nula contra la

alternativa sobre fa base de una muestra aleatoria de

tamañon, tomada de una población normal con la varianza conocida Y las regiones críticas de fas alternativas respectivas son:

(80)

CAPITULO IV____________________________________________________________________ 

donde

la probabilidad de cometer un error de tipo Los valores más frecuentemente utilizados de

son: son 0.05 y 0.01 ; los valores correspondientes de

Cuando y se desconoce la prueba que hemos estado analizando en esta sección no puede utilizarse. La prueba correspondiente está basada en;

con

Es un valor de una variable aleatoria que tiene la distribución grados de libertad. Por lo tanto las regiones criticas de tamaño para probar la hipótesis nula

(81)

 ________________________________________________________________ PRUEBAS DE HIPÓTESIS

IV.6 Pruebas relativas a diferencias entre medias

Existen problemas concernientes a diferencias entre medias, como los siguientes:

Quizás se desea decidir, sobre la base de muestras adecuadas, si los hombres pueden realizar cierta tarea a mayor velocidad que las mujeres, o bien quizás se desea decidir, sobre la base de un estudio de muestra apropiado, si los gastos semanales promedio en alimentación de las familias de una ciudad exceden los gastos de familias de otra ciudad en menos de $5.

Supóngase que tenemos muestras aleatorias independientes de tamaño tomadas de dos poblaciones normales con las medias y las varianzas conocidas

donde es una constante dada,

que deseamos probar la hipótesis nula

contra Tenemos que las regiones críticas pueden expresarse como donde:

Cuando manejamos variables aleatorias independientes de po blaciones con varianzas desconocidas que quizás no sean normales, aún podemos utilizar la prueba que hemos descrito con sustituida por  sustituida por  en tanto que ambas muestras sean lo suficientemente grandes para que se invoque el teorema del límite central.

(82)

CAPITULO IV ___________________________________________________________________ 

IV.6.1 Teorema del límite central

Si constituyen una muestra aleatoria de una población infinita que tiene

entonces la varianza

la media y la función generatriz de momentos la distribución limitante es de:

cuando es la distribución normal estándar 

Cuando son chicos y son desconocidas, la prueba que se ha

venido analizando no puede aplicarse. Sin embargo, en relación con muestras aleatorias independientes tomadas de dos poblaciones normales con la misma varianza desconocida

(83)

 ______________________________________________________________ PRUEBAS DE HIPÓTESIS

bajo las suposiciones dadas son, respectivamente,

1V.7 Pruebas para proporciones en la población

Existen situaciones en las cuales resulta necesario decidir si la proporción en la población, generalmente denotada mediante el simbolo p , es igual a cierta fracción. En la mayor parte de los casos, la proporción en la muestra o el número de éxitos en n ensayos , se utiliza con fines de inferencia. Si un evento ha ocurrido Xveces en nintentos, la proporción en la

Esta fracción puede muestra (por lo regular denotada mediante el símbolo

utilizarse para estimar la proporción de la población p, o la probabilidad de un éxito. Por ejemplo, si 70 de 100 pacientes con cáncer muestran inmediata mejoría al recibir una nueva vacuna, o 0.70, podría utilizarse como estimación de la verdadera proporción de pacientes que mejoran con la nueva vacuna.

Para valores de nsuficientemente grandes, la variable aleatoria binomial X se distribuye casi en forma normal, con media y varianza

(84)

CAPITULO IV____________________________________________________________________ 

IV.8 Pruebas relativas a varianzas

Veamos algunas aplicaciones: un fabricante, obligado a cumplir rígidas especificaciones, tendrá que realizar pruebas de la variabilidad de su producto; un profesor quizá desea saber si son verdaderas ciertas afirmaciones acerca de la variabilidad que puede esperar observar en el desempeño de un estudiante, y un químico farmacéutico probablemente tenga que cerciorarse de si la variación en la efectividad de un medicamento está dentro de límites permisibles.

Dada una muestra aleatoria de tamañon , tomada de una población normal, desearemos probar la hipótesis nula contra una de las alternativas

bien la técnica de la razón de verosimilitud nos lleva a obtener una prueba basada

en el valor de la varianza de la muestra. Con base en el siguiente:

Teorema.Si son la media y la varianza de una muestra aleatoria de tamaño

y la varianza

tomada de una población normal, con la media entonces:

1. son independientes

2. La variable aleatoria tiene una distribución cuadrada con grados de libertad.

(85)

 ________________________________________________________________ PRUEBAS DE HIPÓTESIS

Donde

Hasta donde concierne a la alternativa bilateral, rechazamos la hipótesis nula si y el tamaño de todas estas regiones críticas es, desde luego igual a

IV.9 Hipótesis relativas a dos varianzas

se extraen de poblaciones Si muestras aleatorias independientes de tamaño

normales que tienen la misma vananza, se sigue del teorema.

son las varianzas de muestras aleatorias independientes de tamaño respectivamente tomadas de dos poblaciones normales que tienen la misma vanancia, entonces:

Es un valor de una variable aleatoria que tiene distribución con parámetros

con Que es un valor de una variable aleatoria que tiene la distribución

grados de libertad, Por ello, si la hipótesis nula es válida, la razón de las variancias muéstrales da un estadístico sobre el cual pueden fundamentarse las

(86)

CAPITULO IV____________________________________________________________________ 

contra la hipótesis alternativa La región crítica para probar la hipótesis nula

se define como  Asimismo, la región crítica donde

y esto para probar la hipótesis nula contra la hipótesis alterna

sólo contiene valores correspondientes a causa algunas dificultades, ya que la tabla de

Por eso usamos el recíproco del las colas derechas de

estadístico de la prueba original y haremos uso de la relación.

y la región crítica para De ahí que fundamentemos la prueba en el estadístico

contra la hipótesis alterna entonces probar la hipótesis nula

donde es el valor crítico apropiado de F con grados de libertad.

donde la región crítica es

Para la alternativa bilateral

(87)

 ________________________________________________________________ PRUEBAS DE HIPÓTESIS

IV.10 Ejemplos resueltos

Ejemplo núm. 1

Sea un fabricante de neumáticos, que aseguraba que éstos tenían una vida útil de por lo menos 40 000 km. Supóngase que los resultados de la prueba fueron los siguientes: una muestra de n= 49 , con un valor medio muestral de 38 000 km. Si se sabe que el recorrido de los neumáticos de la población tiene una desviación estándar de 3 500 km, comprobar  hipótesis del fabricante. Considerar  = 0.05

Solución

Datos

Justificación teórica

Prueba de hipótesis para medias, muestras grandes.

(88)

CAPITULO IV ____________________________________________________________________ 

2do. paso

3er. paso

4to. paso Reglas de decisión

Se acepta Se rechaza

Referencias

Documento similar

A partir de este momento los modelos se van a re- petir hasta el siglo XV o incluso más tarde, lo que está indicando que habían llegado a un «ideal sonoro».. LOS INSTRUMENTOS

La fidelidad y la sumisión incondicional en el terreno político al emperador son aquí un desenvol- vimiento de las relaciones peculiares de la clientela mí- Que estas ideas de

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

- En cas de no utilitzar llibre de text, el material curricular utilitzat podrà ser finançat per Banc de Llibres, sempre que siga l'únic recurs utilitzat per a desenvolupar