Probabilidad y Estimación

(1)

An´

alisis Inferencial

Maestr´ıa en Gerencia para el Desarrollo

John F. Moreno T.

Universidad Externado de Colombia

(2)

Temas a estudiar:

1. Distribuciones de probabilidad y estimaci´on de par´ametros.

2. Prueba de hip´otesis.

3. Estudio de dos poblaciones y Pruebas de bondad de ajuste.

4. Datos categ´oricos.

(3)

I 3 Talleres de 25% cada uno.

I Examen por 25%.

Bibliograf´ıa:

I Moreno Trujillo, J. F. (2017). Estad´ıstica para ciencias

sociales. U. Externado de Colombia.

I Hinton, P. R. (2014). Statistics explained. Routledge.

I Ott, R. L., & Longnecker, M. T. (2015). An introduction to

statistical methods and data analysis. Nelson Education.

(4)

Probabilidad: Es una medida de la posible ocurrencia de un evento.

SiΩes el conjunto de todos los posibles resultados de un

experimento aleatorio (Espacio muestral) yA∈Ωes una evento,

entonces:

P[A] = |A|

(5)

Reglas b´asicas de probabilidad: 1. P[Ω] =1.

2. 0≤P[A]≤1 para todo A∈Ω.

3. P[A∪B] =P[A] +P[B]−P[A∩B]

(6)

Probabilidad condicional e independencia:

DadosAyBen Ω, se define:

P[A|B] =P[A∩B]

P[B] ; P[B|A] =

P[A∩B]

P[A]

Dos eventosAyBson estad´ısticamente independientes si y solo si:

(7)

Variables aleatorias: Una variable aleatoria es una funci´on deΩ

en los reales, que a cada posible evento le asigna un valor o valores reales.

Las variables aleatorias pueden ser:

I Discretas (valores finito o infinitos enumerables).

(8)

Ladistribuci´on de probabilidad de una v.a. X discreta, es una

funci´on fX(x) que permite determinar el valor de la probabilidad de

queX=x, es decir:

fX(x) =P[X=x]

Ladistribuci´on acumulada de probabilidadde una v.a. X

discreta, es una funci´onFX(x)que permite determinar el valor de

la probabilidad de queX≤x, es decir:

(9)

numero ideal de hijos en una familia?.

Se tiene los siguientes valores respuesta.

y fY(y) FY(y)

(10)

Ladensidad de probabilidadde una v.a. Y continua, es una

funci´on fY(y) que permite determinar el valor de la probabilidad de

quea<Y<b, tal que:

P[a<Y <b] =

Z b

a

(11)

SeaX la variable aleatoria que decodifica el ingreso mensual promedio de profesionales en Colombia (en millones). Se encuentra que:

fX(x) =

( 1

8 para 2≤x≤10

0 en otro caso.

¿Cu´al es la probabilidad de que al seleccionar un profesional al

azar, su salario mensual este entre 3 y 5 millones?

(12)

Valor esperado y varianza: Dada una v.a. X de define su valor esperado (media) como:

E[X] =µX = (

∑xxP[X=x] Discreta R∞

−∞x fX(x)dx Continua

Su varianza y desviaci´on como:

V[X] =σX2=E[(X−µX)2] =E[X2]−µX2 ; σX = q

(13)

Propiedades de µX:

I E[α] =α.

I E[αX+βY] =αE[X] +βE[Y].

I E[h(X)] =

(

∑xh(x)P[X =x] Discreta R_∞

−∞h(x)fX(x)dx Continua

(14)

Propiedades de σX2:

I V[α] =0.

I V[αX] =α2V[X].

I V[X+Y] =V[X] +V[Y] +2Cov(X,Y).

I Cov(X,Y) =E{(X−µX)(Y−µY)} es una medida de

asociaci´on lineal.

I ρXY =

Cov(X,Y)

σXσY es una medida de asociaci´on lineal

(15)

I Bernulli: X∼ Bernulli(p)

X puede tomar solamente dos valores x=0 (fracaso),x=1

(éxito). El parámetro pes la probabilidad de éxito.

fX(x) =px(1−p)1−x ; x=0, 1.

(16)

Algunas distribuciones de probabilidad

I Binomial: X∼ Bin(n,p)

X cuenta el n´umero de ´exitos en n repeticiones de un

experimento Bernulli con probabilidad de ´exito p.

fX(x) =

n x

px(1−p)n−x ; x=0,1, ...,n.

(17)

I Poisson: X∼ Poisson(λ)

X cuenta el n´umero de eventos ocurridos por unidad de

tiempo o por unidad de ´area. El par´ametro λ corresponde al

promedio hist´orico de eventos observados por unidad de

tiempo.

fX(x) =e

−λ λx

x! ; λ >0 , x=0,1, ...

(18)

Algunas distribuciones de probabilidad

I Exponencial: X∼Exp(λ)

X describe el tiempo transcurrido entre dos eventos sucesivos.

fX(x) =λe−λx ; x≥0

E[X] = 1

λ; V[X] =

1

(19)

I Normal: X∼ N(µ,σ2)

Una muy importante distribuci´on gracias a los teoremas

l´ımites de la estad´ıstica.

fX(x) = √1

2π σ

exp

−(x−µ)

2

2σ2

; µ ∈R, σ>0, x∈R

(20)

Algunas distribuciones de probabilidad

I Normal est´andar: X∼ N(0,1)

φZ(z) =

1 √ 2π exp −z 2 2

; , z∈R

E[X] =0 ; V[X] =1

(21)

(22)

Algunas distribuciones de probabilidad

I Chi-cuadrado (χ2):

Si Z1,Z2, ...,Zn son variables normales est´andar

independientes, entonces:

X2=Z₁2+Z₂2+· · ·+Z2_n

sigue una distribuci´on chi-cuadrado conn grados de libertad.

fX(x2) =

1 2n/2_Γ n

2 (x

(23)

I t-Student:

Dadas Z∼N(0,1) yX2∼χn2 independientes, entonces:

t:=pZ

X2_/_n

sigue una distribuci´ont-Student con n grados de libertad (tn).

f(t) = Γ

n+1 2

√

πnΓ n₂·

1

1+t_n2

(n+1)/2 ; t∈R

(24)

Par´

ametros y estad´ısticos

En general las funciones de distribuci´on o densidad de probabilidad

tienen una serie de par´ametros que permiten establecer algunas

caracter´ısticas de dicha distribuci´on.

Por ejemplo:

I Distribuci´on Binomial fX(x;n,p) = n_x

px(1−p)n−x,

x=0,1, . . . ,n.

I Distribuci´on Normal fX(x;µ,σ) =√1

2π σe −(x−µ)2

(25)

estad´ısticos, y el valor que estos toman sobre la muestra.

Unestad´ısticoes una expresi´on cuyo valor puede ser calculado

completamente por la observaci´on de los valores de la muestra.

Ejemplo

¯

(26)

Distribuci´on muestral:

Como los valores que puede tomar un estad´ıstico depende de la

muestra utilizada para calcularlo,el estad´ıstico es una variable

aleatoria, y buscamos determinar la distribuci´on de esta variable, la

cual se conoce comodistribuci´on muestral del estad´ıstico.

(27)

(28)

(29)

(30)

Media y desviación estándar de la distribución muestral de y¯

I La media de y¯es aleatoria, porque cambia con cada muestra

utilizada para su c´alculo, pero en muestras aleatorias este

valor fluct´ua alrededor de la media poblacionalµ.

I La dispersi´on en la distribuci´on dey¯ es descrita por su

desviación estándar, que es denominada error estándar dey¯,

y se denota por σy¯.

Considerando una muestra aleatoria de tama˜nonde una poblaci´on

(31)

Seay¯la media muestral calculada a partir de una muestra aleatoria

simple de tama˜nontomada de una poblaci´on con media µ y

desviación estándarσ. Sean µy¯ yσy¯ la media y la desviación

est´andar dey¯. Se tiene que:

1. µy¯=µ 2. σy¯=σ/

√ n

3. Cuando nes grande (n≥30),la distribuci´on muestral dey¯es

aproximadamente normal con par´ametros µ yσ/

(32)

Ejemplo

Se esta realizando una auditoria sobre los 1200 proyectos

ejecutados en los últimos 5 años en una región para determinar las

demoras que se presentaron en la ejecuci´on final de los mismos. Un

proyecto que presente m´as de 150 d´ıas de retraso es considerado

como proyecto en potencial caducidad.

Para esta tarea se considera como estimador del tiempo de retraso

(x), el tiempo promedio de retraso (x¯), para una muestra aleatoria

(33)

Distribuciones de probabilidad y Estimación de parámetros Estimación de parámetros

¿Cu´al es la probabilidad de que el tiempo promedio de retraso

(34)

¿Cu´al es la probabilidad de que el tiempo promedio de retraso observado sea mayor a 150 d´ıas?

Por el teorema del l´ımite central se tiene quex¯∼N(120,402), luego:

(35)

Ejercicio en clase

Para la poblaci´on de inmigrantes ilegales en los Estados Unidos se

sabe que su ingreso semanal tiene una distribuci´on normal con

mediaµ=380dólares y una desviación estándar de σ=80. Un

investigador no esta seguro de estos valores, y para verificarlos selecciona una muestra aleatoria de 100 inmigrantes y utiliza su

ingreso semanal promedioy¯ para estimar µ.

1. ¿Cu´al es la distribuci´on muestral dey¯?

(36)

Estimaci´

on de par´

ametros

La estimación de los parámetros asociados a la distribución de una

variable aleatoria se puede hacer por:

I Estimaci´on puntual: se establece un ´unico valor como la

mejor aproximaci´on del valor real del par´ametro.

(37)

Para realizar la estimaci´on puntual de un par´ametroθ, se debe

seleccionar un estad´ıstico (estimador) y calcularlo en los valores observados en la muestra.

I Par´ametro: θ.

(38)

Propiedades de los estimadores

Si se considera un estimadorθˆ de un par´ametro θ, se dice queθˆ

esinsesgadosi:

E[θˆ] =θ

(39)

Distribuciones de probabilidad y Estimación de parámetros Estimación de parámetros

Ejemplo

SeaX₁,X₂, . . . ,Xn una MAS de una poblaci´on normal de con media

µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.

E[X¯] =E "

1

n n

∑

i=1

Xi # = 1 n n

∑

i=1

E[Xi] =1

(40)

Ejemplo

SeaX₁,X₂, . . . ,Xn una MAS de una poblaci´on normal de con media

µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.

E[X¯] =E "

1

n n

∑

i=1

Xi # = 1 n n

∑

i=1

E[Xi] =1

nnµ=µ

Ejercicio

(41)

I Al elegir entre varios estimadores se debe seleccionar el que sea insesgado.

I Si θˆ1 yθˆ2 son estimadores insesgados deθ, se debe

(42)

M´

etodos de estimaci´

on puntual

Dos de los m´etodos m´as utilizados para establecer estimadores

puntuales de uno o m´as par´ametros son:

I M´etodo de momentos.

(43)

Consiste en igualar tantos momentos muestrales a momentos poblacionales como par´ametros a estimar.

SeaX1, . . . ,Xn una MAS de una variable X, entonces:

Momentos Poblaciones Momentos Muestrales

(44)

Ejemplo

SeaX₁, . . . ,Xn una MAS de una variable X∼N(µ,σ2), luego:

I E[X] =µ.

I V[X] =σ2=E[X2]−(E[X])2, entonces E[X2] =σ2+µ2.

Igualando los dos primeros momentos tenemos:

µ=X¯ ; σ2+µ2=1 n

n

∑

i=1

X_i2

(45)

Ejercicio en clase

Se selecciona una muestra aleatoria simple de una variable aleatoria,X ∼Bin(n,p).

I Construya el estimador de momentos de p.

I Si los valores observados de la muestra son: 7, 9, 3, 4, 4, 8, 4,

(46)

(47)

de distribución conjunta de la muestra como una función de los parámetros que se van a estimar, para luego buscar expresiones de los parámetros que maximicen esta función.

fX(X1, . . . ,Xn;θ1, . . . ,θm)

Cuandox1,x2, ...,xnson los valores muestrales observados, la funci´on solo

depende de los parámetros y se denominafunción de verosimilitud.Los estimadores de máxima verosimilitudθb1,θb2, ...,θcmson los valores de losθi

(48)

Ejemplo

SeaX1,X2, ...,Xn una muestra aleatoria de una distribuci´on exponencial

con par´ametroβ. La funci´on de verosimilitud es:

f(X1,X2, ...,Xn;β) = n

∏

i=1

fXi(x;β) = n

∏

i=1

βe−βxi₌_βn_e−β∑ni=1xi

Se busca una expresi´on paraβ que maximice esta funci´on. Este proceso

es más sencillo si se considera el logaritmo natural de la función de verosimilitud, construyendo una función que se denomina función de log-verosimilitud, y aplicando primero las propiedades del logaritmo.

(49)

Ejemplo

Calculando ahora la derivada de la funci´on de log-verosimilitud

respecto al par´ametro β e igualando a cero se tiene que:

d

dβ ln[f(X1,X2, ...,Xn;β)] = n

β − n

∑

i=1

xi=0

Despejando el parámetro de la última ecuación se tiene queβˆ =_X1_¯,

(50)

Estimaci´

on por intervalos

Se busca establecer un intervalo que contenga el valor real del

par´ametro con un nivel de confiabilidad determinado y con una

precisi´on que se puede evaluar al considerar la longitud del

(51)

luegoZ= X−µ¯

σ/√n∼N(0,1), y se cumple que:

P[−1.96<Z<1.96] =0.95

P

−1.96< X¯−µ σ/

√

n<1.96

=0.95

P

−1.96√σ

n <X¯−µ<1.96

σ √ n =0.95 P

−1.96√σ

n−X¯<−µ<1.96

σ

√

n−X¯

=0.95

P

¯

X−1.96√σ

n<µ<

¯

X+1.96√σ

n

(52)

El intervalo de confianza al 95% paraµ, asumiendo queσ es

conocido, est´a determinado por:

¯

X−1.96√σ

n; ¯X+1.96 σ

√ n

Si, por ejemplo, se tiene un muestra den=31 observaciones, y se

sabe que: σ =2 yX¯ =80, entonces un intervalo al 95% de

confianza paraµ es:

80−1.96√2

31; 80+1.96 2

√

31

(53)

1. Se debe notar que el intervalo obtenido es aleatorio, ya que

sus extremos dependen del valor de X¯ que cambiar´a con la

muestra.

2. El nivel de confianza del intervalo (95% por ejemplo) significa

que si se consideran 100 muestras aleatorias simples distintas, y para cada una de estas se construye el intervalo, se espera

que 95 de los 100 intervalos contengan el valor real de µ.

(54)

En general, siX1,X2, ...,Xn es una muestra aleatoria simple de una

poblaci´on normal de par´ametros µ yσ2, con σ conocido, entonces

un intervalo al100(1−α)%de confianza (o lo que es igual, con significanciaα) para µ esta determinado por:

¯

X−Z_α_/2√σ

n; ¯X+Zα/2 σ

√ n

(55)

Considere una muestra con 50 observaciones del ingreso diario promedio para las familias de una determinada localidad en una ciudad. Se sabe que esta variable sigue una distribuci´on normal conσ=0.6 millones. De

los datos en la muestra se encuentra que el ingreso mensual promedio es

¯

X=2.8millones. Construir un intervalo de confianza para el verdadero valor del ingreso mensual medio al 90% de confianza y otro al 95% de confianza.

Para el intervalo al 90% de confianza se tiene queα=0.1, luego

Z_α_/2=Z0.05=1.64, y el intervalo es: (2.6604; 2.9395).

Para el intervalo al 95% de confianza se tiene queα=0.05, luego

(56)

Notas:

1. Un mayor nivel de confianza implica intervalos de mayor longitud, es decir, menor precisi´on.

2. Si se define laprecisi´on (w) como la longitud del intervalo, se tiene que:

w= (_X¯+Zα/2

σ

√

n)−(X¯−Zα/2

σ

√

n) =2Zα/2

σ

√

n

Para un nivel de precisi´on fijowy un nivel de significaci´on fijoα, el

(57)

Ejemplo

Se ha controlado el tiempo de respuesta de una entidad a las peticiones, quejas y reclamos de sus clientes encontrando que este sigue una distribuci´on normal con una desviaci´on de 10 d´ıas. Se ha instalado un nuevo procedimiento de respuesta a este tipo de solicitudes y se desea estimar el tiempo de respuesta promedio real (µ) bajo estas condiciones.

Suponiendo que los tiempos de respuesta aún tienen una distribución normal conσ=10, ¿qué tamaño de muestra es necesario para garantizar

(58)

Ejemplo

Se tiene que:

n=

2·10·1.96

4

2

≈97.