An´
alisis Inferencial
Maestr´ıa en Gerencia para el Desarrollo
John F. Moreno T.
Universidad Externado de Colombia
Temas a estudiar:
1. Distribuciones de probabilidad y estimaci´on de par´ametros.
2. Prueba de hip´otesis.
3. Estudio de dos poblaciones y Pruebas de bondad de ajuste.
4. Datos categ´oricos.
I 3 Talleres de 25% cada uno.
I Examen por 25%.
Bibliograf´ıa:
I Moreno Trujillo, J. F. (2017). Estad´ıstica para ciencias
sociales. U. Externado de Colombia.
I Hinton, P. R. (2014). Statistics explained. Routledge.
I Ott, R. L., & Longnecker, M. T. (2015). An introduction to
statistical methods and data analysis. Nelson Education.
Probabilidad: Es una medida de la posible ocurrencia de un evento.
SiΩes el conjunto de todos los posibles resultados de un
experimento aleatorio (Espacio muestral) yA∈Ωes una evento,
entonces:
P[A] = |A|
Reglas b´asicas de probabilidad: 1. P[Ω] =1.
2. 0≤P[A]≤1 para todo A∈Ω.
3. P[A∪B] =P[A] +P[B]−P[A∩B]
Probabilidad condicional e independencia:
DadosAyBen Ω, se define:
P[A|B] =P[A∩B]
P[B] ; P[B|A] =
P[A∩B]
P[A]
Dos eventosAyBson estad´ısticamente independientes si y solo si:
Variables aleatorias: Una variable aleatoria es una funci´on deΩ
en los reales, que a cada posible evento le asigna un valor o valores reales.
Las variables aleatorias pueden ser:
I Discretas (valores finito o infinitos enumerables).
Ladistribuci´on de probabilidad de una v.a. X discreta, es una
funci´on fX(x) que permite determinar el valor de la probabilidad de
queX=x, es decir:
fX(x) =P[X=x]
Ladistribuci´on acumulada de probabilidadde una v.a. X
discreta, es una funci´onFX(x)que permite determinar el valor de
la probabilidad de queX≤x, es decir:
numero ideal de hijos en una familia?.
Se tiene los siguientes valores respuesta.
y fY(y) FY(y)
Ladensidad de probabilidadde una v.a. Y continua, es una
funci´on fY(y) que permite determinar el valor de la probabilidad de
quea<Y<b, tal que:
P[a<Y <b] =
Z b
a
SeaX la variable aleatoria que decodifica el ingreso mensual promedio de profesionales en Colombia (en millones). Se encuentra que:
fX(x) =
( 1
8 para 2≤x≤10
0 en otro caso.
¿Cu´al es la probabilidad de que al seleccionar un profesional al
azar, su salario mensual este entre 3 y 5 millones?
Valor esperado y varianza: Dada una v.a. X de define su valor esperado (media) como:
E[X] =µX = (
∑xxP[X=x] Discreta R∞
−∞x fX(x)dx Continua
Su varianza y desviaci´on como:
V[X] =σX2=E[(X−µX)2] =E[X2]−µX2 ; σX = q
Propiedades de µX:
I E[α] =α.
I E[αX+βY] =αE[X] +βE[Y].
I E[h(X)] =
(
∑xh(x)P[X =x] Discreta R∞
−∞h(x)fX(x)dx Continua
Propiedades de σX2:
I V[α] =0.
I V[αX] =α2V[X].
I V[X+Y] =V[X] +V[Y] +2Cov(X,Y).
I Cov(X,Y) =E{(X−µX)(Y−µY)} es una medida de
asociaci´on lineal.
I ρXY =
Cov(X,Y)
σXσY es una medida de asociaci´on lineal
I Bernulli: X∼ Bernulli(p)
X puede tomar solamente dos valores x=0 (fracaso),x=1
(´exito). El par´ametro pes la probabilidad de ´exito.
fX(x) =px(1−p)1−x ; x=0, 1.
Algunas distribuciones de probabilidad
I Binomial: X∼ Bin(n,p)
X cuenta el n´umero de ´exitos en n repeticiones de un
experimento Bernulli con probabilidad de ´exito p.
fX(x) =
n x
px(1−p)n−x ; x=0,1, ...,n.
I Poisson: X∼ Poisson(λ)
X cuenta el n´umero de eventos ocurridos por unidad de
tiempo o por unidad de ´area. El par´ametro λ corresponde al
promedio hist´orico de eventos observados por unidad de
tiempo.
fX(x) =e
−λ λx
x! ; λ >0 , x=0,1, ...
Algunas distribuciones de probabilidad
I Exponencial: X∼Exp(λ)
X describe el tiempo transcurrido entre dos eventos sucesivos.
fX(x) =λe−λx ; x≥0
E[X] = 1
λ; V[X] =
1
I Normal: X∼ N(µ,σ2)
Una muy importante distribuci´on gracias a los teoremas
l´ımites de la estad´ıstica.
fX(x) = √1
2π σ
exp
−(x−µ)
2
2σ2
; µ ∈R, σ>0, x∈R
Algunas distribuciones de probabilidad
I Normal est´andar: X∼ N(0,1)
φZ(z) =
1 √ 2π exp −z 2 2
; , z∈R
E[X] =0 ; V[X] =1
Algunas distribuciones de probabilidad
I Chi-cuadrado (χ2):Si Z1,Z2, ...,Zn son variables normales est´andar
independientes, entonces:
X2=Z12+Z22+· · ·+Z2n
sigue una distribuci´on chi-cuadrado conn grados de libertad.
fX(x2) =
1 2n/2Γ n
2 (x
I t-Student:
Dadas Z∼N(0,1) yX2∼χn2 independientes, entonces:
t:=pZ
X2/n
sigue una distribuci´ont-Student con n grados de libertad (tn).
f(t) = Γ
n+1 2
√
πnΓ n2·
1
1+tn2
(n+1)/2 ; t∈R
Par´
ametros y estad´ısticos
En general las funciones de distribuci´on o densidad de probabilidad
tienen una serie de par´ametros que permiten establecer algunas
caracter´ısticas de dicha distribuci´on.
Por ejemplo:
I Distribuci´on Binomial fX(x;n,p) = nx
px(1−p)n−x,
x=0,1, . . . ,n.
I Distribuci´on Normal fX(x;µ,σ) =√1
2π σe −(x−µ)2
estad´ısticos, y el valor que estos toman sobre la muestra.
Unestad´ısticoes una expresi´on cuyo valor puede ser calculado
completamente por la observaci´on de los valores de la muestra.
Ejemplo
¯
Distribuci´on muestral:
Como los valores que puede tomar un estad´ıstico depende de la
muestra utilizada para calcularlo,el estad´ıstico es una variable
aleatoria, y buscamos determinar la distribuci´on de esta variable, la
cual se conoce comodistribuci´on muestral del estad´ıstico.
Media y desviaci´on est´andar de la distribuci´on muestral de y¯
I La media de y¯es aleatoria, porque cambia con cada muestra
utilizada para su c´alculo, pero en muestras aleatorias este
valor fluct´ua alrededor de la media poblacionalµ.
I La dispersi´on en la distribuci´on dey¯ es descrita por su
desviaci´on est´andar, que es denominada error est´andar dey¯,
y se denota por σy¯.
Considerando una muestra aleatoria de tama˜nonde una poblaci´on
Seay¯la media muestral calculada a partir de una muestra aleatoria
simple de tama˜nontomada de una poblaci´on con media µ y
desviaci´on est´andarσ. Sean µy¯ yσy¯ la media y la desviaci´on
est´andar dey¯. Se tiene que:
1. µy¯=µ 2. σy¯=σ/
√ n
3. Cuando nes grande (n≥30),la distribuci´on muestral dey¯es
aproximadamente normal con par´ametros µ yσ/
Ejemplo
Se esta realizando una auditoria sobre los 1200 proyectos
ejecutados en los ´ultimos 5 a˜nos en una regi´on para determinar las
demoras que se presentaron en la ejecuci´on final de los mismos. Un
proyecto que presente m´as de 150 d´ıas de retraso es considerado
como proyecto en potencial caducidad.
Para esta tarea se considera como estimador del tiempo de retraso
(x), el tiempo promedio de retraso (x¯), para una muestra aleatoria
Distribuciones de probabilidad y Estimaci´on de par´ametros Estimaci´on de par´ametros
¿Cu´al es la probabilidad de que el tiempo promedio de retraso
¿Cu´al es la probabilidad de que el tiempo promedio de retraso observado sea mayor a 150 d´ıas?
Por el teorema del l´ımite central se tiene quex¯∼N(120,402), luego:
Ejercicio en clase
Para la poblaci´on de inmigrantes ilegales en los Estados Unidos se
sabe que su ingreso semanal tiene una distribuci´on normal con
mediaµ=380d´olares y una desviaci´on est´andar de σ=80. Un
investigador no esta seguro de estos valores, y para verificarlos selecciona una muestra aleatoria de 100 inmigrantes y utiliza su
ingreso semanal promedioy¯ para estimar µ.
1. ¿Cu´al es la distribuci´on muestral dey¯?
Estimaci´
on de par´
ametros
La estimaci´on de los par´ametros asociados a la distribuci´on de una
variable aleatoria se puede hacer por:
I Estimaci´on puntual: se establece un ´unico valor como la
mejor aproximaci´on del valor real del par´ametro.
Para realizar la estimaci´on puntual de un par´ametroθ, se debe
seleccionar un estad´ıstico (estimador) y calcularlo en los valores observados en la muestra.
I Par´ametro: θ.
Propiedades de los estimadores
Si se considera un estimadorθˆ de un par´ametro θ, se dice queθˆ
esinsesgadosi:
E[θˆ] =θ
Distribuciones de probabilidad y Estimaci´on de par´ametros Estimaci´on de par´ametros
Ejemplo
SeaX1,X2, . . . ,Xn una MAS de una poblaci´on normal de con media
µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.
E[X¯] =E "
1
n n
∑
i=1Xi # = 1 n n
∑
i=1E[Xi] =1
Ejemplo
SeaX1,X2, . . . ,Xn una MAS de una poblaci´on normal de con media
µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.
E[X¯] =E "
1
n n
∑
i=1Xi # = 1 n n
∑
i=1E[Xi] =1
nnµ=µ
Ejercicio
I Al elegir entre varios estimadores se debe seleccionar el que sea insesgado.
I Si θˆ1 yθˆ2 son estimadores insesgados deθ, se debe
M´
etodos de estimaci´
on puntual
Dos de los m´etodos m´as utilizados para establecer estimadores
puntuales de uno o m´as par´ametros son:
I M´etodo de momentos.
Consiste en igualar tantos momentos muestrales a momentos poblacionales como par´ametros a estimar.
SeaX1, . . . ,Xn una MAS de una variable X, entonces:
Momentos Poblaciones Momentos Muestrales
Ejemplo
SeaX1, . . . ,Xn una MAS de una variable X∼N(µ,σ2), luego:
I E[X] =µ.
I V[X] =σ2=E[X2]−(E[X])2, entonces E[X2] =σ2+µ2.
Igualando los dos primeros momentos tenemos:
µ=X¯ ; σ2+µ2=1 n
n
∑
i=1Xi2
Ejercicio en clase
Se selecciona una muestra aleatoria simple de una variable aleatoria,X ∼Bin(n,p).
I Construya el estimador de momentos de p.
I Si los valores observados de la muestra son: 7, 9, 3, 4, 4, 8, 4,
de distribuci´on conjunta de la muestra como una funci´on de los par´ametros que se van a estimar, para luego buscar expresiones de los par´ametros que maximicen esta funci´on.
fX(X1, . . . ,Xn;θ1, . . . ,θm)
Cuandox1,x2, ...,xnson los valores muestrales observados, la funci´on solo
depende de los par´ametros y se denominafunci´on de verosimilitud.Los estimadores de m´axima verosimilitudθb1,θb2, ...,θcmson los valores de losθi
Ejemplo
SeaX1,X2, ...,Xn una muestra aleatoria de una distribuci´on exponencial
con par´ametroβ. La funci´on de verosimilitud es:
f(X1,X2, ...,Xn;β) = n
∏
i=1
fXi(x;β) = n
∏
i=1
βe−βxi=βne−β∑ni=1xi
Se busca una expresi´on paraβ que maximice esta funci´on. Este proceso
es m´as sencillo si se considera el logaritmo natural de la funci´on de verosimilitud, construyendo una funci´on que se denomina funci´on de log-verosimilitud, y aplicando primero las propiedades del logaritmo.
Ejemplo
Calculando ahora la derivada de la funci´on de log-verosimilitud
respecto al par´ametro β e igualando a cero se tiene que:
d
dβ ln[f(X1,X2, ...,Xn;β)] = n
β − n
∑
i=1xi=0
Despejando el par´ametro de la ´ultima ecuaci´on se tiene queβˆ =X1¯,
Estimaci´
on por intervalos
Se busca establecer un intervalo que contenga el valor real del
par´ametro con un nivel de confiabilidad determinado y con una
precisi´on que se puede evaluar al considerar la longitud del
luegoZ= X−µ¯
σ/√n∼N(0,1), y se cumple que:
P[−1.96<Z<1.96] =0.95
P
−1.96< X¯−µ σ/
√
n<1.96
=0.95
P
−1.96√σ
n <X¯−µ<1.96
σ √ n =0.95 P
−1.96√σ
n−X¯<−µ<1.96
σ
√
n−X¯
=0.95
P
¯
X−1.96√σ
n<µ<
¯
X+1.96√σ
n
El intervalo de confianza al 95% paraµ, asumiendo queσ es
conocido, est´a determinado por:
¯
X−1.96√σ
n; ¯X+1.96 σ
√ n
Si, por ejemplo, se tiene un muestra den=31 observaciones, y se
sabe que: σ =2 yX¯ =80, entonces un intervalo al 95% de
confianza paraµ es:
80−1.96√2
31; 80+1.96 2
√
31
1. Se debe notar que el intervalo obtenido es aleatorio, ya que
sus extremos dependen del valor de X¯ que cambiar´a con la
muestra.
2. El nivel de confianza del intervalo (95% por ejemplo) significa
que si se consideran 100 muestras aleatorias simples distintas, y para cada una de estas se construye el intervalo, se espera
que 95 de los 100 intervalos contengan el valor real de µ.
En general, siX1,X2, ...,Xn es una muestra aleatoria simple de una
poblaci´on normal de par´ametros µ yσ2, con σ conocido, entonces
un intervalo al100(1−α)%de confianza (o lo que es igual, con significanciaα) para µ esta determinado por:
¯
X−Zα/2√σ
n; ¯X+Zα/2 σ
√ n
Considere una muestra con 50 observaciones del ingreso diario promedio para las familias de una determinada localidad en una ciudad. Se sabe que esta variable sigue una distribuci´on normal conσ=0.6 millones. De
los datos en la muestra se encuentra que el ingreso mensual promedio es
¯
X=2.8millones. Construir un intervalo de confianza para el verdadero valor del ingreso mensual medio al 90% de confianza y otro al 95% de confianza.
Para el intervalo al 90% de confianza se tiene queα=0.1, luego
Zα/2=Z0.05=1.64, y el intervalo es: (2.6604; 2.9395).
Para el intervalo al 95% de confianza se tiene queα=0.05, luego
Notas:
1. Un mayor nivel de confianza implica intervalos de mayor longitud, es decir, menor precisi´on.
2. Si se define laprecisi´on (w) como la longitud del intervalo, se tiene que:
w= (X¯+Zα/2
σ
√
n)−(X¯−Zα/2
σ
√
n) =2Zα/2
σ
√
n
Para un nivel de precisi´on fijowy un nivel de significaci´on fijoα, el
Ejemplo
Se ha controlado el tiempo de respuesta de una entidad a las peticiones, quejas y reclamos de sus clientes encontrando que este sigue una distribuci´on normal con una desviaci´on de 10 d´ıas. Se ha instalado un nuevo procedimiento de respuesta a este tipo de solicitudes y se desea estimar el tiempo de respuesta promedio real (µ) bajo estas condiciones.
Suponiendo que los tiempos de respuesta a´un tienen una distribuci´on normal conσ=10, ¿qu´e tama˜no de muestra es necesario para garantizar
Ejemplo
Se tiene que:
n=
2·10·1.96
4
2
≈97.