1
TEMA 7: INFERENCIA ESTADÍSTICA. ESTIMACIÓN DE LA MEDIA
1.-DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES.
Ahora vamos a estudiar una de las situaciones fundamentales (veremos que en estos dos temas de Estadísticas vamos a estudiar 4 casos básicos):
Existe una población con una característica x que tiene unos determinados valores de media μ y desviación σ (por ejemplo en una fábrica de tornillos sabemos que toda la producción tiene una longitud x con una media μ=50 mm y una desviación σ=10mm).
De esa población sacamos muestras de tamaño n (por ejemplos los tornillos anteriores se empaquetan en bolsas de n=40 tornillos).
Pues bien, aquí nos encontramos con el Teorema del Límite Central, que nos dice que la media de esas muestras (el peso medio de las bolsas) sigue una distribución:
𝒙 ̅ 𝑵(𝝁 , 𝝈
√𝒏 )
es decir:IMPORTANTE: SI POBLACIÓN INICIAL NO SIGUE UNA DISTRIBUCIÓN NORMAL, BASTA CON QUE n≥30 para que se CUMPLA.
SI LA POBLACIÓN INICIAL SI SIGUE UNA DISTRIBUCIÓN NORMAL no es necesario n≥30.
NO TE PREOCUPES PUES A NUESTRO NIVEL SIEMPRE SE CUMPLIRÁ UNA U OTRA, CON LO CUAL SIEMPRE PODREMOS APLICARLO
NO LO OLVIDES: LA MEDIA DE LA POBLACIÓN Y LA DE LA DISTRIBUCIÓN DE LAS MUESTRAS ES LA MISMA
Vamos a verlo con nuestro ejemplo:
Teníamos una población (todos los tornillos que se fabrican) con μ=50 mm y una desviación σ=10mm
Empaquetamos en bolsas de 40 tornillos: n=40.
Bien ahora vamos a realizar cálculos sobre esas bolsas (esto es fundamental por ejemplo para controlar la calidad del producto que la fábrica envía a las tiendas), queremos saber la longitud media de los tornillos que van en cada bolsa.
Como n≥30 aunque la producción de la fábrica (población) no siga una distribución normal, podemos afirmar que la longitud media de esas bolsas sigue una distribución:
2
𝑥̅ 𝑁(𝜇 ,
𝜎√𝑛
)
en nuestro caso 𝑥̅ 𝑁(50,
10√40
)
Por tanto
𝒙 ̅ 𝑵(𝟓𝟎 , 𝟏. 𝟔)
y con esto hacemos los cálculos que nos pidan, por ejemplo:a.-¿qué probabilidad hay de que las medias de una muestra sea menos que 48mm?
Es decir nos piden p( ≤48), si recuerdas los ejercicios que hicimos con la tabla, primero tenemos que tipificar:
𝑧 = 48−50
1.6 = −1.25
Por tanto: p( ≤48) = p(z≤-1.25)= 1 – p(z≤1,25) = 1 - 0.8413 = 0.1056
b.-¿cuál será el intervalo característico para el 90% de la media de esas muestras?
Para p=0.9 teníamos que zα/2=1.645 y recordando que el intervalo venía dado por:
Tendremos (50 - 1.645·1.6 , 50 + 1.645·1.6)
(47.37 , 52.63)
Es decir ese fabricante puede decir que el 90% de las bolsas que mande tendrá una longitud media entre 47.37mm y 52.36mm
VÍDEO: puedes ver lo que hemos hecho hasta ahora en este vídeo. Reprodúcelo desde 3’30’’
OTRO EJEMPLO:
3 Ejemplos en Selectividad:
Como nos piden la probabilidad de que sea mayor que z, si z se hace más grande (se va más la derecha), la probabilidad que queda a la derecha de z será menor.
Al estar dividiendo, al ser más pequeña el cociente aumenta
cociente z=
4
2.- INTERVALO DE CONFIANZA PARA LA MEDIA
Vamos con la segunda situación que nos encontraremos: tenemos una población en la que desconocemos μ y vamos a ver qué podemos saber de ella (estimar) a partir de una muestra de la que conocemos su media , veamos un ejemplo:
Con lo aprendido hasta ahora el proceso es muy simple:
VEAMOS UN EJEMPLO:
Es decir hemos tomado una muestra de 100 clientes, n=100 y hemos visto que han gastado una media =100€, a partir de aquí nos piden que con un 90% de probabilidad estimemos como ha sido el gasto medio μ de todos los clientes:
¿en qué intervalo estará la media μ de todo el regimiento con una determinada probabilidad?
Dicho intervalo ser llamará intervalo de confianza
La probabilidad de que eso ocurra se llamará nivel de confianza
5
n=100 =110 σ=20 zα/2=1,645 (ya lo hemos calculado, pero en el examen tienes que hacerlo aunque sepas de memoria el resultado)
si ahora usamos la fórmula:
(110 − 1.645 · 20
√100, 110 + 1.645 · 20
√100)
Intervalo de confianza al 90% para la media: (106.71 , 113.29)
Podemos afirmar que con un 90% de probabilidad el gasto medio μ de todos los clientes ha estado entre 106.71€ y 113.29€. Fácil, ¿eh?
RECUERDA
:
Recuerda que para calcular zα/2 hacíamos lo siguiente:
En otros sitios (algunos vídeos, corrección de Selectividad) lo suelen hacer con la segunda forma que vimos:
Para p=0,8 por ejemplo:
1+𝑝
2 = 0.9
y lo buscamos en la tablaPuedes usar lo que quieras (el primero es más razonado, por si se te olvida la fórmula).
Ejercicio:
Sol: (58.82 , 61.18)
6 Ojo con esto (pero es raro):
En casi todas las ocasiones nos darán la desviación σ. Si esto no ocurre es porque tendremos que calcularla nosotros como vimos en el documento de Conceptos Básicos, por ejemplo:
Es decir calculamos la s de la muestra que sería el valor de σ
Otro ejemplo:
Observa como en el solucionario se usa indistintamente o μ, ya que como recordarás valen lo mismo
7
ERROR Y TAMAÑO DE LA MUESTRA
Cuando realizamos una estimación de la media es fundamental conocer qué error máximo podemos cometer cuando nos movemos por el intervalo de confianza, así como ver de qué forma puedo reducir ese error. Ese error consiste en lo máximo que podemos movernos a la derecha o a la izquierda de la media SIN SALIRNOS DEL INTERVALO.
Viendo la fórmula del intervalo de confianza:
Si lo vemos en un gráfico:
La cantidad que le restamos y le sumamos a la es el error máximo que podemos cometer, tanto si nos vamos a la izquierda o a la derecha, por lo tanto la fórmula que nos da el error máximo que podemos cometer:
IMPORTANTE: el error es la mitad del ancho del intervalo.
A mayor σ y zα/2 mayor error, y mientras mayor la n (como está dividiendo) menor error.
Si despejamos la n:
Tenemos el tamaño mínimo n de la muestra para un determinado error.
2E
RECUERDA:
despeja siempre n antes de hacer los cálculos en los problemas.
8 EJEMPLO:
a.-Calcula el error cometido para un intervalo de confianza al 95%:
σ=6 n= 64
𝐸 = 1.96 · 6
√64= 1.47
MUY IMPORTANTE:
Como n es un número natural no podemos darlo con decimales y siempre tenemos que irnos al número natural más grande que el resultado, es decir:
Por ejemplo: n≈ 23,13 n=24
¡¡no es un redondeo es irnos al natural más grande!!
EJERCICIOS:
9
¡¡¡MUY FÁCIL!!, tan sólo se trata de saber un par de fórmulas Ahora hazlo tú:
Recuerda:
Solución:
a.- I.C=(5.4597 , 7.5403 )
b.- n=1083
10
CÁLCULOS A PARTIR DE LOS INTERVALOS
.En muchos problemas nos darán ya el intervalo de confianza calculado y nos preguntarán por los demás parámetros, por ejemplo:
SÓLO HAY QUE RECORDAR DOS COSAS
LA MITAD DEL INTERVALO ES LA MEDIA:
=𝟐𝟒.𝟒𝟕+𝟐𝟔.𝟔𝟑
𝟐
= 𝟐𝟓. 𝟓𝟓
EL ERROR ES LA MITAD DE LA AMPLITUD (ANCHO DEL INTERVALO):
E=𝟐𝟔.𝟒𝟑−𝟐𝟒.𝟒𝟕 𝟐 =0.98
A partir del error y a partir de E sacamos n
EJERCICIO:
SOLUCIÓN:
a. 524.6 b. n=144
VÍDEOS DE EJERCICIOS
( TE PUEDEN AYUDAR MUCHO A COMPRENDER LO VISTO):1. EJEMPLO 1 2. EJEMPLO 2
11
3.-UN PEQUEÑO “RESUMEN” (CASOS FUNDAMENTALES):
CASO 1:
Nos dan datos de una población y nos preguntan por las medias muestrales:
(Teorema del Límite Central): 𝑵(𝝁, 𝝈
√𝒏)
CASO 2:
A partir de los datos de una muestra calcular el intervalo de confianza, error y tamaño muestra:
12
“FORMULARIO” (CASOS FUNDAMENTALES):
Cálculo de z
α/2:
Supongamos que nos piden el valor para el 80% (a veces nos dan α primero, entoces p=1-α):
p=0.8 nivel de significación: α=1-p =0,2
𝛼2
= 0.1 A p le sumamos
𝜶𝟐
: 0.8+0.1 = 0.9 Otra forma: calculamos 1+𝑝
2 = 0,9
CASO 1:
Nos dan datos de una población y nos preguntan por las medias muestrales:
(Teorema del Límite Central): 𝑵(𝝁, 𝝈
√𝒏) -Tipificar y usar la tabla.
CASO 2
:A partir de los datos de una muestra calcular el intervalo de confianza, error y tamaño muestra:
Si nos dan el intervalo
: ejemplo (24.47 , 26.63 ) LA MITAD DEL INTERVALO ES LA MEDIA:
=𝟐𝟒.𝟒𝟕+𝟐𝟔.𝟔𝟑
𝟐
= 𝟐𝟒. 𝟒𝟓
EL ERROR ES LA MITAD DE LA AMPLITUD (ANCHO DEL INTERVALO):
E=𝟐𝟔.𝟒𝟑−𝟐𝟒.𝟒𝟕 𝟐 =0.98
A partir del error y a partir de E sacamos n
Buscamos 0,9000 en la tabla