TEMA 11: ESTADÍSTICA INFERENCIAL

(1)

TEMA 11: ESTADÍSTICA INFERENCIAL

1. ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL

La estadística descriptiva es una parte de las matemáticas que nos enseña a realizar los siguientes procedimientos:

 Recoger datos estadísticos de manera ordenada.

 Representar los datos mediante tablas o gráficos comprensibles.

 Calcular valores numéricos que permitan sintetizar, analizar y comparar diferentes colecciones de datos estadísticos.

Dado que suele ser inviable medir la población al completo, cualquier descripción sobre ella ha de ser inferida a partir de la muestra a la que sí se tiene acceso. Una vez hecho el estudio en la muestra nos preguntaremos si las conclusiones sacadas en la muestra podemos trasladarlas a la población en general y con qué grado de certidumbre. De esto se encarga la estadística inferencial.

Está claro que para sacar buenas conclusiones a partir de una muestra esta tiene que ser representativa de la población.

2. MUESTREO

2.1 Conceptos básicos

Población. Es el conjunto de individuos que son objeto del estudio estadístico.

A los elementos de la población o muestra se le llaman individuos.

A veces no se puede estudiar la población por diferentes causas, el procedimiento es destructivo, el coste es excesivo, etc. En ese caso se estudia una parte de la población que sea representativa, es decir, sus individuos no posean características especiales que los distingan de los demás; a esta selección

(2)

se le llama muestra. Se realiza un censo cuando se toma toda la población para el estudio estadístico.

Muestra. Parte de la población en la que se miden las características estudiadas.

Las muestras sólo sirven si las conclusiones que se obtienen son fiables. Por tanto, lo importante es saber cómo elegir la muestra, cuántos individuos la componen y qué grado de fiabilidad existe en las conclusiones que se obtienen.

El tamaño de la población o muestra es el número de elementos que componen una u otra, y se suele designar por la letra N.

Muestreo. Es el proceso seguido para la extracción de una muestra.

Nosotros estudiaremos el muestreo probabilístico que es aquel en el que la muestra se elige por métodos aleatorios.

Encuesta. Es el proceso de obtener la información buscada entre los elementos de la muestra.

2.2. Tipos de muestreo

A

) M

UESTREO ALEATORIO SIMPLE

(

M

.

A

.

S

.)

Es aquel que satisface los siguientes dos criterios:

a) Cada individuo debe tener la misma probabilidad de ser elegido.

b) La selección de un individuo no debe afectar a la probabilidad de que sea seleccionado cualquier otro. Esto implica que la elección debería hacerse con reemplazamiento; aunque ello comporte que algún individuo pueda ser elegido más de una vez.

Por tanto, se numeran los elementos de la población y se selecciona al azar los n elementos que debe contener la muestra.

B

)

M

UESTREO ALEATORIO SISTEMÁTICO

Para realizar este tipo de muestreo es necesario ordenar a los individuos de la población asignándole un número a cada uno. El proceso sería el siguiente;

dividimos N (tamaño de la población) entre n (tamaño de la muestra) y nos da como cociente h (coeficiente de elevación). Después elegimos, al azar, uno de los h primeros individuos de la población, por ejemplo el que ocupa el lugar k,

(3)

y a partir de ahí la muestra se iría obteniendo escogiendo individuos de h en h, es decir, 𝑘, 𝑘 + ℎ, 𝑘 + 2ℎ, 𝑘 + 3ℎ, … , 𝑘 + (𝑛 − 1) · ℎ.

C

)

M

UESTREO ALEATORIO ESTRATIFICADO

Este tipo de muestreo divide la población total en clases homogéneas, llamadas estratos. Llamaremos 𝑁1, 𝑁₂, 𝑁₃, … , 𝑁_𝑘 al tamaño de los estratos (con 𝑁1+ 𝑁₂+ 𝑁₃+ ⋯ + 𝑁_𝑘 = 𝑁) y 𝑛₁, 𝑛₂, 𝑛₃, … 𝑛_𝑘 al número de individuos de los respectivos estratos que hay en la muestra (con 𝑛₁+ 𝑛₂+ 𝑛₃+ ⋯ + 𝑛_𝑘 = 𝑛 ).

Según el criterio que elijamos para reflejar los estratos de la muestra tenemos dos subtipos en este muestreo:

C

1) M

UESTREO ALEATORIO ESTRATIFICADO CON AFIJACIÓN IGUAL En este caso no se toma en cuenta el número de individuos que componen cada estrato, sino que todos tienen la misma presencia en la muestra. Esto es, si hay k estratos entonces n_i ⁿ

 k.

C

2) M

UESTREO ALEATORIO ESTRATIFICADO CON AFIJACIÓN PROPORCIONAL

Aquí sí que se toma en cuenta el tamaño de cada estrato. Lo que se pretende es que la muestra mantenga, en su composición, la misma proporción de individuos que cada estrato tenga en la población.

Estratos E1 E2 E3 … Ek Total

Nº de individuos en la población N1 N2 N3 … Nk N Nº de individuos en la muestra n1 n2 N3 … nk n Entonces:

3

1 2

1 2 3

     ^k

k

n n

n n n

N N N N N

d) M

UESTREO POR CONGLOMERADOS

Para extraer una muestra aleatoria por conglomerados se procede así:

 Se segmenta la población en grupos más pequeños, llamados conglomerados, de manera que los elementos de cada conglomerado son heterogéneos respecto de la característica que se va a estudiar y los conglomerados muy parecidos entre sí.

(4)

 se toma una muestra aleatoria simple de conglomerados, de modo que la muestra estará formada por todos sus elementos o por una muestra aleatoria extraída de cada conglomerado.

3. NOTAS SOBRE ESTADÍSTICA DESCRIPTIVA

3.1 Variables estadísticas

La observación del individuo la describimos mediante uno o varios caracteres.

El carácter es, por tanto, una cualidad o propiedad inherente al individuo.

Como por ejemplo el color de pelo, la altura, el número de hijos...

Hay caracteres que son medibles, esto es, se pueden cuantificar con un número y se llaman caracteres cuantitativos, como por ejemplo el peso; Y los que no se pueden medir se llaman caracteres cualitativos, como por ejemplo “el color del pelo.

Se llama modalidad a cada una de las formas en que se pueden presentar el carácter. Por ejemplo, en el caso del carácter “color de pelo”, las modalidades serían: rubio, castaño, negro, pelirrojo y blanco. Las modalidades tienen que ser exhaustivas, es decir, todo individuo tiene que pertenecer a una modalidad, y excluyentes, es decir, un individuo no puede pertenecer a dos modalidades a la vez.

Se llama variable estadística a los valores numéricos de las distintas modalidades que adopta un carácter cuantitativo.

Las variables estadísticas las podemos clasificar de la siguiente manera:

 Discretas: Cuando toman valores aislados. Por ejemplo, el número de hijos.

 Continuas: Cuando pueden tomar cualquier valor dentro de un intervalo. Por ejemplo, la altura.

(5)

3.2 Tablas estadísticas

La presentación de los datos relacionados con una variable estadística se puede hacer mediante las llamadas tablas de distribución de frecuencias. Éstas se forman por varias columnas en las que se registran los siguientes datos.

 Las modalidades o valores de las variables estadística. Se designa por Xi. En el caso de variables cuantitativas continuas: Las marcas de clase, que son el punto medio del intervalo, y que será el valor que se tome como representante del intervalo.

 La frecuencia absoluta de cada valor, 𝑛_𝑖, que representa el número de veces que se repite el valor. (La suma de todas las frecuencias absolutas me da el número total de individuos de la población o muestra).

 La frecuencia relativa, 𝑓_𝑖, que es el cociente de la frecuencia absoluta y el número total de individuos que componen la población o la muestra observada. (La suma total de las frecuencias relativas me da 1).

3.3 Medidas estadísticas

La estadística descriptiva no sólo se encarga de organizar los datos en tablas, sino que también los analiza, es para esto paro lo que están estas medidas.

Entre todas ellas destacamos las siguientes A

) M

EDIDAS DE CENTRALIZACIÓN

Son aquellas que promedian o centralizan el total de datos.

La más importante es la media.

CARÁCTER

CARACTER CUALITATIVO

CARACTER CUANTITATIVO

= VARIABLE ESTADÍSTICA

Variable discreta Variable continua

(6)

La media: Es la media aritmética de los valores de la variable. Sólo se podrá calcular por tanto en variables cuantitativas; en variables continuas se tomará como valores de la variable las marcas de clase.

i· i i

n x x



N

(Para datos no agrupados:

i i

x x



N

)

B

) M

EDIDAS DE

D

ISPERSIÓN

Nos miden la dispersión de la distribución de frecuencias, lo representativas que son las medidas de centralización.

Las más importantes son:

La varianza, Var(X) ó σ²: Es la media aritmética de las desviaciones a la media al cuadrado:

 

²

· ( )

i i

i

n x x Var X

N







o

 

2

i i 2 i

n x

Var X x





N  (Para datos no agrupados:

 

2

2 i i

x

Var X x





N  )

Cuanto más pequeña es la varianza más representativa es la media.

La desviación típica 𝝈: Es la raíz cuadrada positiva de la varianza.

Ejemplo:

Una zapatería de caballero vende en un día 45 pares de zapatos de las tallas siguientes:

39 39 40 43 39 38 41 40 41 39 40 41 41 37 42 40 41 42 42 43 41 40 41 43 38 41 42 41 42 42 44 41 42 39 41 40 44 43 40 40 38 43 41 42 42

(7)

Calcula la media, la varianza y la desviación típica.

Tabla estadística:

xi n_i f_i n ·_i x_i n_i·x_i²

37 1 0.0222 37 1369

38 3 0.0666 114 4332

39 5 0.1111 195 7605

40 8 0.1777 320 12800

41 12 0.2666 492 20172

42 9 0.2 378 15876

43 5 0.1111 215 9245

44 2 0.0444 88 3872

TOTAL 45 1 1839 75271

Media: ¹⁸³⁹ 40.86

 45 x

Varianza: ² ⁷⁵²⁷¹ 40.86² 3.14

  45  Desviación típica:  1.77

Ejemplo:

De una muestra de 75 pilas eléctricas se han obtenido los siguientes datos sobre su duración en horas.

Duración 25-30 30-35 35-40 40-45 45-50 50-55

Nª Pilas 3 5 21 28 12 6

Calcula la media de duración de las pilas, la varianza y la desviación típica.

Tabla estadística:

Intervalos x_i n_i f_i n ·_i x_i n_i·x_i²

[25, 30) 27.5 3 0.04 82.5 226875

[30, 35) 32.5 5 0.0666 162.5 528125 [35, 40) 37.5 21 0.28 787.5 2953125 [40, 45) 42.5 28 0.3733 1190 50575

[45, 50) 47.5 12 0.16 570 27075

[50, 55] 52.5 6 0.08 315 16537.5

TOTAL 75 1 3107.5 131268.75

(8)

Media: ³¹⁰⁷⁵ 41.43

 75

x

Varianza: ² ^131268.75 41.43² 33.80

  75  Desviación típica:  ^5.81

4. DISTRIBUCIONES DE PROBABILIDAD DE UNA VARIABLE ALEATORIA

4.1 Variables aleatorias

Una variable aleatoria de un espacio muestral Ω es la regla que asigna un valor numérico a cada resultado de Ω.

Ejemplo:

Se tira una moneda tres veces y se observa la sucesión de caras y cruces.

El espacio muestral se compone de los 8 siguientes elementos:



     





 ccc,cc ,c c, cc, c , c,c ,

Definimos X la asignación a cada elemento de Ω el mayor número de caras que van saliendo. Así,

𝑋(𝑐𝑐𝑐) = 3

𝑋(𝑐𝑐+) = 𝑋(𝑐 + 𝑐) = 𝑋(+𝑐𝑐) = 2 𝑋(+𝑐+) = 𝑋(+ + 𝑐) = 𝑋(𝑐 + +) = 1 𝑋(+ + +) = 0

𝑋 es por tanto una variable aleatoria discreta que toma los valores 0, 1, 2 y 3.



0,1,2,3



 X Ejemplo:

Se escoge un punto al azar en un círculo de radio r.

Sea X la distancia del punto desde el centro del círculo.

Entonces X es una variable aleatoria continua y su espacio de valores es el intervalo cerrado cuyos extremos son 0 y r, es decir:

 

 

r X  0,

(9)

4.2 Distribuciones de probabilidad

Las distribuciones de probabilidad son idealizaciones de las distribuciones de frecuencias relativas. Cuando la variable es discreta, unas y otras se representan mediante diagramas de barras. Cuando la variable es continua, la distribución estadística viene dada mediante un histograma de frecuencias relativas y su idealización, que es la distribución de probabilidad, mediante una curva.

Una distribución de probabilidad de variable discreta es el resultado de asignar a cada valor de la variable su probabilidad.

xi pi

x1 p1

x2 p2

x3 p3

 

xn pn

 Cada pi es un número comprendido entre 0 y 1.

 0 p_i 1

 La suma de todos los 𝑝_𝑖 es 1:



^





i i

n p

p p

p

p₁ ₂ ₃  1

 Media: _i· _i

i





x p

 Varianza: ² _i² _i ²

i

 



x p  ; Desviación típica: _i² _i ²

i

 



x p  Ejemplo:

Retomemos el ejemplo de variable aleatoria discreta:

Se tira una moneda tres veces y se observa la sucesión de caras y cruces.

El espacio muestral se compone de los 8 siguientes elementos:



     





 ccc,cc ,c c, cc, c , c,c ,

Definíamos X la asignación a cada elemento de Ω el mayor número de caras que van saliendo.

𝑋 era una variable aleatoria discreta que tomaba los valores 0, 1, 2 y 3.

(10)



0,1,2,3



 X

Pues bien, la distribución de probabilidad de esta variable aleatoria será:

xi pi

0 8

1

1 8

3

2 8

3

3 8

1

Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable continua.

Las distribuciones de probabilidad de variable continua se definen por medio de una función, 𝑦 = 𝑓(𝑥), que se llama función de probabilidad o función de densidad. Ha de ser 𝑓(𝑥) ≥ 0. Las probabilidades vienen dadas por el área que hay bajo la curva. Por tanto, el área que hay bajo la totalidad de la curva es 1.

Para hallar la probabilidad 𝑃[𝑎 ≤ 𝑥 ≤ 𝑏], obtendremos el área que hay bajo la curva en el intervalo [𝑎, 𝑏].

Las probabilidades de sucesos puntuales son cero: 𝑃[𝑥 = 𝑎] = 0, por lo tanto:

𝑃[𝑎 ≤ 𝑥 ≤ 𝑏] = 𝑃[𝑎 < 𝑥 < 𝑏]

Ejemplo:

Sea X una variable aleatoria con la siguiente función de densidad f:

 

0.5 si 0 2 0 en otros caso

x x

f x   

  La gráfica de f es:

(11)

𝑃[1 ≤ 𝑥 ≤ 1.5] = Área de la región sombreada del dibujo = ⁵₆.

La media µ y la desviación típica σ, tienen los mismos significados que en las distribuciones estadísticas: La media es el centro de gravedad de la distribución y la desviación típica es la medida de dispersión. Su cálculo requiere herramientas matemáticas superiores.

5. LA DISTRIBUCIÓN NORMAL

El ejemplo más importante de variable aleatoria continua es la variable aleatoria Normal.

La distribución Normal es una ley que describe los fenómenos en cuyo resultado final intervienen un gran número de factores, mutuamente independientes, cuyas acciones se compensan entre sí haciendo prevalecer un tipo medio, normal.

Por ejemplo, medidas morfológicas como la estatura, el peso; Medidas económicas, como el consumo de cierto bien, gasto en ocio; Comportamientos sociales como aceptación de una norma, gusto por las costumbres; Aptitudes psicológicas como cociente intelectual, velocidad de cálculo...

La distribución Normal de media μ y desviación típica, σ, es la función:

1 2

2 2

( ) 1 ·

2

x

f x e







  

  

 



Su función de densidad tiene un gráfico en forma de campana (Campana de Gauss) continua y definida para cualquier valor real, siendo el eje de abscisa asíntota horizontal. Es simétrica y su máximo coincide con la media µ. En los puntos 𝜇 + 𝜎 y 𝜇 − 𝜎 tiene sendos puntos de inflexión.

(12)

Para cada valor de µ (media) y cada valor de σ (desviación típica) hay una curva Normal, que se denomina 𝑁(𝜇, 𝜎). La distribución Normal queda perfectamente descrita conociendo su media y su desviación típica. La variación de una u otro parámetro origina los cambios en la curva.

5.1 Función de distribución

Se llama función de distribución de una variable aleatoria X a la función F(x) que describe los valores que toma la probabilidad acumulada hasta la abscisa x.

 

i ^[ i^]

F x P X x

5. 2 Distribución Normal estándar

La distribución Normal de media 0 y desviación típica 1, σ, se conoce como distribución Normal estándar y la variable correspondiente Normal tipificada y se denota por la letra Z.

Las diferentes áreas que pueden calcularse bajo la curva de la Normal estándar, y, por tanto, las probabilidades de Z, están calculadas y expuestas en diversos modelos de tablas.

Examinemos los casos más frecuentes (supondremos a>0)

Ejemplo:

[ 3,21] 0,9993 P Z 

(13)

Ejemplo:

[ 0,65] 0,2578 P Z 

Ejemplo:

[ 2,36] 0,0091 P Z  

Ejemplo:

[0,85 1,30] 0,1009

P  Z 

5.3 Tipificación

Las distribuciones Normales que tenemos que manejar en la práctica no suelen ser estándar. Una variable X de distribución 𝑁(𝜇, 𝜎) puede transformarse en una variable Z, 𝑁(0,1), mediante un proceso llamado tipificación de la variable X. Éste consiste en hacer el cambio:

Z X 



 

Con esto,

[ ] X a a

P X a P   P Z 

  

      

       

   

(14)

Ejemplo:

Se fabrican unas pilas alcalinas cuya duración en horas sigue una distribución Normal de media 60 horas y desviación típica 5 h. Si se elige al azar una pila,

¿qué probabilidad hay de que dure? : a) Menos de 50 h.

b) Entre 52 y 65 h.

a) ^X ^^N



^60,5



  

2



1



2



1 0.9772 0.0228

5 60

50 50        

  



 P Z P Z P z

X P b)



^ ^



^ _^ ^ ^ ^ ^ _^^



^¹^,⁶^ ^¹

 

^ ^¹

 

^ ^^¹^.⁶



^

5 60 65 5

60 65 52

52 X P X P Z PZ PZ

P



1







1



1.6

 

0.8413



10.9452



0.7865

 PZ PZ

5. 4 Intervalos característicos

Se llama intervalos característicos de una distribución normal a intervalos cuyos extremos equidistan de la media y cuya probabilidad es una cantidad p.

a) Intervalos característicos en una distribución Normal 𝑵(𝟎, 𝟏).

Los intervalos característicos en una distribución normal 𝑁(0, 1) son de la forma (−𝑘, 𝑘) y su probabilidad será p.

𝑃[−𝑘 ≤ 𝑧 ≤ 𝑘] = 𝑝 ⇒ 𝑃[𝑧 ≤ 𝑘] =1 + 𝑝 2

(15)

Ejemplo:

El intervalo característico para una distribución Normal 𝑁(0,1) con probabilidad 0.95 es:

𝑃[−𝑘 ≤ 𝑧 ≤ 𝑘] = .95 ⇒ 𝑃[𝑧 ≤ 𝑘] =1 + 0,95

2 = 0,975 ⇒ 𝑘 = 1.96 Por lo que el intervalo característico es (−1.96, 1.96)

Nota: En los problemas de estimación que se verán más adelante, este valor k que se llama valor crítico se representa por z__/2 y la probabilidad p por 1 − 𝛼.

Los valores más usuales de 1 − 𝛼 son 0.90, 0.95 y 0.99.

b) Intervalos característicos en una distribución Normal 𝑵(𝝁, 𝝈).

Los intervalos característicos para la distribución Normal 𝑁(𝜇, 𝜎) son de la forma (𝜇 − 𝑘, 𝜇 + 𝑘) y su probabilidad será p.

𝑃[𝜇 − 𝑘 ≤ 𝑋 ≤ 𝜇 + 𝑘] = 𝑝

Tipificando 𝑃 [^−𝑘

𝜎 ≤ 𝑍 ≤^𝑘

𝜎] = 𝑝 ⇒ 𝑃 [𝑧 ≤^𝑘

𝜎] =^1+𝑝

2 .

6. DISTRIBUCIÓN BINOMIAL

Muchos experimentos sociales quedan determinados por dos sucesos complementarios: ser hombre/mujer, mayor de 18 años/menor,... En general, a estos sucesos contrarios los calificamos por éxito y fracaso.

(16)

La distribución de probabilidad que estudia estos sucesos recibe el nombre de distribución Binomial.

Esta distribución queda caracterizada por:

 El resultado de una prueba del experimento debe concretarse en dos únicas opciones que, como se ha dicho, llamaremos éxito y fracaso.

 Se realizan n ensayos del experimento.

 La probabilidad de éxito es constante y la denotamos por p.

 Por tanto la probabilidad de fracaso es también constante e igual a 1 − 𝑝 = 𝑞

 La variable aleatoria cuenta el número k de éxitos en las n pruebas.

La distribución Binomial queda caracterizada por los parámetros n y p, y se escribe 𝐵(𝑛, 𝑝).

La probabilidad de obtener k éxitos viene dada por: [ ] n · ^k· ^{n k}

P X k p q

k

  

   

 

6.1 Media y varianza de una distribución Binomial

La media y la varianza de una distribución Binomial 𝐵(𝑛, 𝑝) se obtiene de manera inmediata a través de sus parámetros, siendo:

a) Media: 𝑛 · 𝑝 b) Varianza: 𝑛 · 𝑝 · 𝑞

6.2 Aproximación de la distribución Binomial por una Normal

De Moivre demostró que bajo determinadas condiciones (para n grande y tanto p como q no estén próximos a cero) la distribución Binomial 𝐵(𝑛, 𝑝) se puede aproximar mediante una distribución norma. En general, una Binomial 𝐵(𝑛, 𝑝) se parece a una curva Normal tanto más, cuanto mayor es el producto 𝑛 · 𝑝 (ò 𝑛 · 𝑞, si 𝑞 < 𝑝). Cuando 𝑛 · 𝑝 y 𝑛 · 𝑞 son ambos mayores que 3, la aproximación es bastante buena, y si superan el 5, la aproximación es casi perfecta.

La curva Normal a la cual se aproxima tiene la misma media y la misma desviación típica que la Binomial, es decir:

np npq

  

(17)

Por tanto en las condiciones anteriormente dichas, una Binomial 𝐵(𝑛, 𝑝) se aproxima mediante una Normal 𝑁(𝑛𝑝, √𝑛𝑝𝑞).

El cálculo de probabilidades se hace del siguiente modo:

Corrección de continuidad

a) 0.5 ' 0.5

b) ' 0.5

c) ' 0.5

d) ' 0.5

e) ' 0.5

P X k P k X k

P X k P X k P X k P X k

         

   

       

   

       

   

       

   

       

   

Ejemplo:

Asumimos que el 4% de la población mayor de 65 años tiene la enfermedad de Alzheimer. Supongamos que se toma una muestra aleatoria de 9600 personas mayores de 65 años. Hallar la probabilidad de que menos de 400 de ellas tengan la enfermedad. (Aproximar por una Normal).

X= Tener la enfermedad de Alzheimer. Se trata de una Binomial 𝐵(9600, 0.04)

Entonces: np9600·0.04 384 (aproximamos por Normal).

384

np

 ;   npq 9600·0.04·0.96 19.2



9600,0.04



X' N



384,19.2



B

X   

399.5 384

400 ' 400 0.5 ' 399.5

19.2 0.81 0.7910

P X P X P X P Z

P Z

  

               

       

    

7. DISTRIBUCIONES MUESTRALES

7.1 Distribución de medias muestrales

Elegida una muestra, hallaremos en ella la media 𝑥̅ y la desviación típica s.

Pero ¿hasta qué punto esas 𝑥̅ y s serán representativas de la media 𝜇 y la desviación típica 𝜎 de la población?

(18)

Una muestra es representativa cuando describe acertadamente las características de la población original: sus parámetros serán aproximadamente iguales a los de la población. Pero cada muestra tendrá una media y desviación típica que pueden ser diferentes a las de otra muestra; Así pues, nunca podremos estar seguros de que los parámetros obtenidos en la muestra elegida sean buenos estimadores de los parámetros poblacionales; no obstante, hay un par de cosas ciertas:

Sea µ la media y σ la desviación típica de la población. Para estudiar la media de la población elegimos k muestras distintas, de tamaño n y se obtienen valores para las medias muestrales, 𝑥̅̅̅, 𝑥₁ ̅̅̅, … , 𝑥₂ ̅̅̅ y desviaciones típicas 𝑠_𝑘 ₁, 𝑠₂, … , 𝑠_𝑘 para cada muestra. La distribución de la variable aleatoria de las medias muestrales se representa por 𝑋̅:



x x x_k



X  ₁, ₂,, Entonces:

 La media de las medias muestrales es igual a la media real de la población:

nº de muestras posibles

 



ⁱ 

X

x

donde 𝑥̅ es la media de cada la muestra, 𝑋̅ la media de las medias muestrales y _𝑖 𝜇 la media de la población.

 La desviación típica de las medias muestrales vale

X n

  

Esto significa que la distribución de las medias muestrales¹ de tamaño n, extraídas de una población Normal 𝑁(𝜇, 𝜎), se aproxima a una distribución Normal:

, 

 

  

 

X N

n

Ejemplo:

En un servicio de atención al cliente, el tiempo de espera hasta recibir atención es una variable normal de media 10 minutos y desviación típica 2 minutos. Se toman muestras aleatorias del tiempo de espera de los clientes que llegan un

1 La distribución de las medias muestrales es Normal incluso en el caso de que éstas procedan de poblaciones no Normales, siempre que el tamaño de la muestra sea suficientemente grande (n30). Esto podría demostrarse mediante el Teorema Central del Límite.

(19)

día concreto. ¿Cuál es la probabilidad de que el tiempo medio de espera de una muestra de 25 clientes no supere los 9 minutos?

𝑋 = 𝑇𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑒𝑠𝑝𝑒𝑟𝑎 ⟶ 𝑁(10,2) 𝑋̅ = 𝑇𝑖𝑒𝑚𝑝𝑜 𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑒𝑠𝑝𝑒𝑟𝑎 ⟶ 𝑁 (𝜇, 𝜎

√𝑛) = 𝑁 (10, 2

√25) = 𝑁(10, 0.4) 10 9 10

9 2.5 2.5 1 2.5

0.4 0.4

1- 0.9938 0.0062

P X  PX      P Z     P Z      P Z  

 

 

7.2 Distribución de proporciones muestrales

Cuando se trata de determinar la proporción de una población que tiene un cierto atributo, su estudio es equiparable al de una distribución Binomial. Así pues, su la probabilidad de éxito es p y la de fracaso q = 1 – p.

Supongamos que una proporción p de una población votaría para presidente el candidato A. En una muestra aleatoria de tamaño n obtenida de la población, una cierta proporción 𝑝̂ de la muestra votaría al candidato A, y el conjunto de todas esas proporciones definen una variable aleatoria 𝑃̂, llamada proporción muestral.



p p p_k



Pˆ ˆ ,ˆ , ˆ

2

1 



La distribución de las proporciones muestrales de tamaño n, tiene las siguientes características:

 La media de la distribución de las proporciones muestrales es:_ˆp p.

 La desviación típica de las distribución de la proporciones muestrales es:

ˆp

pq

  n .

Si el tamaño de la muestra n, es suficientemente grande (𝑛 ≥ 30), la distribución de las proporciones muestrales, 𝑃̂, se aproxima a una distribución Normal , pq

N p n

 

 

 .

ˆ  , 

   P N p pq

n

(20)

Ejemplo:

El 3% de las piezas fabricadas por una máquina son defectuosas. ¿Cuál es la probabilidad de que en 50 piezas, el 2% o menos sean defectuosas?

Pˆ= Ser defectuosa, ^ˆ , pq P N p

n

 

  

 

97 . 0 1

03 .

0    

 q p

p

024 . 50 0

97 . 0

· 03 . 0

ˆ   

n pq

p

Entonces ^P^ˆ ^^N



^0.03,0.024



  

⁰^.⁴²



¹



⁰^.⁴²



¹ ⁰^.⁶⁶²⁸ ⁰^.³³⁷²

024 . 0

03 . 0 02 . 02 0

.

ˆ 0        

  



 P Z PZ P Z

P P

8. INFERENCIA ESTADÍSTICA

Elegida una muestra, hallaremos en ella la media 𝑥̅ y la desviación típica s. Pero

¿hasta qué punto esas 𝒙̅ y s serán representativas de la media 𝝁 y la desviación típica 𝝈 de la población?

El problema de la inferencia estadística es a partir de los datos de muestras representativas, inferir resultados acerca de la población.

Por ejemplo, supongamos que se desea conocer la estatura media, µ, de los escolares de una ciudad. Si tomamos una muestra de tamaño 𝑛 = 100, ¿qué valor elegiremos como, plausible, el más aproximado a µ? Si la media de la muestra es 165 cm. ¿Podemos afirmar que µ es “aproximadamente” 165 cm?

En realidad, lo que nos importa es que el valor de la media poblacional no esté demasiado alejado del valor de la media muestral. En nuestro ejemplo, el objetivo sería poder afirmar algo así como que la media poblacional, µ, está en el intervalo [162, 167] con cierta seguridad, con un cierto grado de confianza.

8. 1 Estimación de la media por intervalos de

confianza

(21)

A) I

NTERVALO DE CONFIANZA PARA LA MEDIA

Sea una población de media µ desconocida y desviación típica σ conocida. Se desea estimar la media de la población, y para ello, se toma una muestra de tamaño n. Si 𝑛 ≥ 30 o la población es Normal, la variable de las medias muestrales 𝑋̅ sigue una distribución Normal N ,

n

 

 

 

 .

El intervalo de confianza para la media poblacional μ a nivel de confianza 1 − 𝛼 (nivel de significación α, 0 < 𝛼 < 1) es:

/ 2 , / 2

x Z x Z

n n

 

 

   

 

 

 El valor 1 − 𝛼 da el nivel de confianza y mide la probabilidad que se tiene de que la media poblacional pertenezca al intervalo de dado. Si la confianza es, 1 − 𝛼, suele decirse que el nivel de significación de α.

Esto quiere decir que ^  _/ 2     _/ 2  ^ 1 

 

P x Z x Z

n n

 Observación para el caso de 𝜎 desconocida. En este caso no tenemos más remedio que sustituir 𝜎 por la desviación típica muestral; así el intervalo de confianza para la media poblacional es:

/ 2 s , / 2 s

x Z x Z

n n

 

   

 

 

siendo 𝑥̅ y s la media y desviación típica de la muestra, respectivamente.

Nota:



z__/₂ Z z__/₂



1 P

Entonces:

(22)

 

/2 /2 /2 /2 /2 /2

/2

1

2 1 1

P z Z z P Z z P Z z P Z z P z z

P Z z

     

 

                  

         

 

     

Por lo tanto:

 

/2

1 1 P Z z_  2 

  

  .

Ejemplo:

Una variable aleatoria X se distribuye según una ley Normal 𝑁(𝜇, 𝜎) con media µ desconocida y varianza 𝜎² = 6.25. Se extrae una muestra aleatoria simple de tamaño 𝑛 = 100 y se tiene que su media es 43. Construir un intervalo de confianza para µ al 95% (1 − 𝛼 = 0.95)

5 . 2 25 .

6 

  x 4.3 n100



,2.5



N X 

 

/2

1 1 1 0.95

0.975

2 2

P Z z  _       , entonces z__/2 1.96.

 

2.5 2.5

43 1.96· , 43 1.96· 42.51, 43, 49

100 100

I    

 

Esto significa que µ tiene un 95% de probabilidad de estar comprendido en el intervalo I.

B) E

RROR MÁXIMO ADMITIDO

El radio del intervalo de confianza es Z _/2·

 n

 .

(23)

El radio del intervalo de confianza es el error máximo admitido que se comete al estimar µ mediante la media muestral:

/2

  E Z

n

El Intervalo de confianza para la media es



^{x E x E}^ ^, ^



. Por tanto, la amplitud del intervalo es: A2E

Nota: Si no se conocen los parámetros poblacionales, habrá que sustituirlos por los correspondientes muestrales.

Para aclarar esta idea, supongamos que 1 − 𝛼 = 0.95. Esto quiere decir que para el 95% de las muestras de tamaño n que tomemos y construyamos el correspondiente intervalo, éste contendrá a µ, y el restante 5% no lo contendrá.

Estos distintos intervalos tendrán todos el mismo radio, E, pero, al variar en cada muestra la media, sus extremos variaran, dando lugar a intervalos distintos. Pero como esto se hace con una sola muestra, únicamente podemos decir que tenemos la esperanza de que el intervalo que obtenemos sea uno de los que contienen a µ, y no haber tenido la mala suerte de que sea uno de los pocos que no lo contienen.

C) T

AMAÑO MUESTRAL

Está claro que al aumentar el tamaño n de la muestra disminuye el radio del intervalo, con lo que aumenta la precisión de la estimación. Esto resuelve el problema de determinar el tamaño adecuado de la muestra. Despejando de la fórmula del error se obtiene:

2

n Z / 2

 E

 

  

Ejemplo:

Una variable X se distribuye según una ley Normal, con media µ desconocida y varianza conocida 6.25. ¿Cuál debe ser el tamaño n de la muestra para que al estimar µ mediante la media muestral, al nivel de confianza del 95% se cometa un error máximo menor que 0.30 unidades?

5 . 2 25 .

6 

 

  ^ ^

0.975 1.96

2 95 . 0 1 2

1 95 1

. 0

1  P Z  z__/₂        z__/₂ 

(24)

1.96·2.5 0.30

 

E n , despejando,

4.9 4.9

0.30 16.3 265.69

 0.30 n  n  n n

7.2 Estimación de la proporción por intervalos de confianza

A) I

NTERVALO DE CONFIANZA PARA LA PROPORCIÓN

Sea una población en la que se desconoce la proporción p de individuos que tiene cierta característica. Se desea estimar la proporción p y para ello se toma una muestra de tamaño n. Si 𝑛 ≥ 30, la variable de las proporciones muestrales

Pˆ sigue una distribución Normal , pq N p n

 

 

  .

El intervalo de confianza para la proporción p, con un nivel de confianza 1-α es:

/2 /2

ˆ · pq,ˆ · pq

p Z p Z

n n

 

 

 

 

 

donde 𝑞 = 1 − 𝑝.

Nota: Como la proporción p que se quiere estimar no se conoce, se utilizan para realizar los cálculos 𝑝̂ y 𝑞̂, es decir:



 



  

n q Z p

n p q Z p

p ˆˆ

ˆ · ˆ,

· ˆ

ˆ __/₂ __/₂

El nivel de confianza 1 − 𝛼 mide la probabilidad que se tiene de que la proporción de la población pertenezca al intervalo de dado. Esto es:

 

  



 



ˆ _/₂·   ˆ  _/₂· 1 n Z pq p n p

Z pq p P

Ejemplo:

En una muestra aleatoria de 900 votantes, el 55% prefiere al candidato demócrata de presidente. Hallar un intervalo de confianza aproximado para la proporción de todos los votantes que prefieren al candidato demócrata con un nivel de confianza del 90%.

(25)

ˆ 0.55 ˆ 0.45

p  q ; _ˆ ^0.55·0.45 0.33

p 900 pq

  n  



0.55,0.33



ˆ N

P



0.52,0.57



900 45 . 0

· 55 .

· 0 65 . 1 55 . 0 900 ,

45 . 0

· 55 .

· 0 65 . 1 55 .

0 





  

 I

B) E

RROR MÁXIMO ADMITIDO El error máximo para la proporción es:

/ 2· pq E Z ^ n

C) T

AMAÑO MUESTRAL

El tamaño mínimo de la muestra para un nivel de confianza 1 − 𝛼, con un error máximo E que se está dispuesto a aceptar es:

 

/2 ²·pq2

n Z

 E



Ejemplo:

Tomada, al azar, una muestra de 120 estudiantes de una Universidad, se encontró que 54 de ellos hablaban inglés. Se pretende repetir la experiencia para conseguir que la cota del error que se comete al estimar, por un intervalo de confianza, la proporción de alumnos que hablan inglés en esa Universidad no sea superior a 0.05, con un nivel de confianza del 99%. ¿Cuántos alumnos tendríamos que tomar, como mínimo, en la muestra?

120

n ; ˆ ⁵⁴ 0.45 ˆ 0.55

p120  q y _ˆ ^0.45·0.55 0.05

p 120 pq

  n 



0.55,0.05



ˆ N

P

 

/2 /2

1 1 1 0.99

1 0.99 0.995 2.575

2 2

P Z z_  z_

   ^{ } ^

         

  ^ ^

0.95 1.65

2 90 . 0 1 2

1 90 1

. 0

1  P Z z__/₂       z__/₂ 

(26)

0.45·0.55 0.2475 0.2475 0.05

2.575 0.05 2.75 0.05

2.575

E n   n   n 

0.2475 2 0.2475 4

103 10609 n 657

n   n   

(27)

RESUMEN

DISTRIBUCIONES MUESTRALES

Parámetro de la

población Variable muestral Distribución Muestral

Media μ X X N ,

n

 

 

  

 

Proporción p _Pˆ _







 

n p pq N Pˆ ,

INTERVALOS DE CONFIANZA

Población Intervalo

Intervalo de confianza para la media

μ ^x ^Z^^{/ 2} n^,^x ^Z^^{/ 2} n

 

   

 

 

Intervalo de confianza para la

proporción p ^_





  

n Z pq n p

Z pq

pˆ __/₂· , ˆ __/₂·

ERROR MÁXIMO ADMISIBLE PARA LA MUESTRA

Error máximo

Error máximo para la media μ E Z / 2

 n

 

Error máximo para la proporción p

n Z pq E  __/₂·