• No se han encontrado resultados

Probabilidad y Estimación

N/A
N/A
Protected

Academic year: 2019

Share "Probabilidad y Estimación"

Copied!
58
0
0

Texto completo

(1)

An´

alisis Inferencial

Maestr´ıa en Gerencia para el Desarrollo

John F. Moreno T.

Universidad Externado de Colombia

(2)

Temas a estudiar:

1. Distribuciones de probabilidad y estimaci´on de par´ametros.

2. Prueba de hip´otesis.

3. Estudio de dos poblaciones y Pruebas de bondad de ajuste.

4. Datos categ´oricos.

(3)

I 3 Talleres de 25% cada uno.

I Examen por 25%.

Bibliograf´ıa:

I Moreno Trujillo, J. F. (2017). Estad´ıstica para ciencias

sociales. U. Externado de Colombia.

I Hinton, P. R. (2014). Statistics explained. Routledge.

I Ott, R. L., & Longnecker, M. T. (2015). An introduction to

statistical methods and data analysis. Nelson Education.

(4)

Probabilidad: Es una medida de la posible ocurrencia de un evento.

SiΩes el conjunto de todos los posibles resultados de un

experimento aleatorio (Espacio muestral) yA∈Ωes una evento,

entonces:

P[A] = |A|

(5)

Reglas b´asicas de probabilidad: 1. P[Ω] =1.

2. 0≤P[A]≤1 para todo A∈Ω.

3. P[A∪B] =P[A] +P[B]−P[A∩B]

(6)

Probabilidad condicional e independencia:

DadosAyBen Ω, se define:

P[A|B] =P[A∩B]

P[B] ; P[B|A] =

P[A∩B]

P[A]

Dos eventosAyBson estad´ısticamente independientes si y solo si:

(7)

Variables aleatorias: Una variable aleatoria es una funci´on deΩ

en los reales, que a cada posible evento le asigna un valor o valores reales.

Las variables aleatorias pueden ser:

I Discretas (valores finito o infinitos enumerables).

(8)

Ladistribuci´on de probabilidad de una v.a. X discreta, es una

funci´on fX(x) que permite determinar el valor de la probabilidad de

queX=x, es decir:

fX(x) =P[X=x]

Ladistribuci´on acumulada de probabilidadde una v.a. X

discreta, es una funci´onFX(x)que permite determinar el valor de

la probabilidad de queX≤x, es decir:

(9)

numero ideal de hijos en una familia?.

Se tiene los siguientes valores respuesta.

y fY(y) FY(y)

(10)

Ladensidad de probabilidadde una v.a. Y continua, es una

funci´on fY(y) que permite determinar el valor de la probabilidad de

quea<Y<b, tal que:

P[a<Y <b] =

Z b

a

(11)

SeaX la variable aleatoria que decodifica el ingreso mensual promedio de profesionales en Colombia (en millones). Se encuentra que:

fX(x) =

( 1

8 para 2≤x≤10

0 en otro caso.

¿Cu´al es la probabilidad de que al seleccionar un profesional al

azar, su salario mensual este entre 3 y 5 millones?

(12)

Valor esperado y varianza: Dada una v.a. X de define su valor esperado (media) como:

E[X] =µX = (

∑xxP[X=x] Discreta R∞

−∞x fX(x)dx Continua

Su varianza y desviaci´on como:

V[X] =σX2=E[(X−µX)2] =E[X2]−µX2 ; σX = q

(13)

Propiedades de µX:

I E[α] =α.

I E[αX+βY] =αE[X] +βE[Y].

I E[h(X)] =

(

∑xh(x)P[X =x] Discreta R

−∞h(x)fX(x)dx Continua

(14)

Propiedades de σX2:

I V[α] =0.

I V[αX] =α2V[X].

I V[X+Y] =V[X] +V[Y] +2Cov(X,Y).

I Cov(X,Y) =E{(X−µX)(Y−µY)} es una medida de

asociaci´on lineal.

I ρXY =

Cov(X,Y)

σXσY es una medida de asociaci´on lineal

(15)

I Bernulli: X∼ Bernulli(p)

X puede tomar solamente dos valores x=0 (fracaso),x=1

(´exito). El par´ametro pes la probabilidad de ´exito.

fX(x) =px(1−p)1−x ; x=0, 1.

(16)

Algunas distribuciones de probabilidad

I Binomial: X∼ Bin(n,p)

X cuenta el n´umero de ´exitos en n repeticiones de un

experimento Bernulli con probabilidad de ´exito p.

fX(x) =

n x

px(1−p)n−x ; x=0,1, ...,n.

(17)

I Poisson: X∼ Poisson(λ)

X cuenta el n´umero de eventos ocurridos por unidad de

tiempo o por unidad de ´area. El par´ametro λ corresponde al

promedio hist´orico de eventos observados por unidad de

tiempo.

fX(x) =e

−λ λx

x! ; λ >0 , x=0,1, ...

(18)

Algunas distribuciones de probabilidad

I Exponencial: X∼Exp(λ)

X describe el tiempo transcurrido entre dos eventos sucesivos.

fX(x) =λe−λx ; x≥0

E[X] = 1

λ; V[X] =

1

(19)

I Normal: X∼ N(µ,σ2)

Una muy importante distribuci´on gracias a los teoremas

l´ımites de la estad´ıstica.

fX(x) = √1

2π σ

exp

−(x−µ)

2

2σ2

; µ ∈R, σ>0, x∈R

(20)

Algunas distribuciones de probabilidad

I Normal est´andar: X∼ N(0,1)

φZ(z) =

1 √ 2π exp −z 2 2

; , z∈R

E[X] =0 ; V[X] =1

(21)
(22)

Algunas distribuciones de probabilidad

I Chi-cuadrado (χ2):

Si Z1,Z2, ...,Zn son variables normales est´andar

independientes, entonces:

X2=Z12+Z22+· · ·+Z2n

sigue una distribuci´on chi-cuadrado conn grados de libertad.

fX(x2) =

1 2n/2Γ n

2 (x

(23)

I t-Student:

Dadas Z∼N(0,1) yX2∼χn2 independientes, entonces:

t:=pZ

X2/n

sigue una distribuci´ont-Student con n grados de libertad (tn).

f(t) = Γ

n+1 2

πnΓ n2·

1

1+tn2

(n+1)/2 ; t∈R

(24)

Par´

ametros y estad´ısticos

En general las funciones de distribuci´on o densidad de probabilidad

tienen una serie de par´ametros que permiten establecer algunas

caracter´ısticas de dicha distribuci´on.

Por ejemplo:

I Distribuci´on Binomial fX(x;n,p) = nx

px(1−p)n−x,

x=0,1, . . . ,n.

I Distribuci´on Normal fX(x;µ,σ) =√1

2π σe −(x−µ)2

(25)

estad´ısticos, y el valor que estos toman sobre la muestra.

Unestad´ısticoes una expresi´on cuyo valor puede ser calculado

completamente por la observaci´on de los valores de la muestra.

Ejemplo

¯

(26)

Distribuci´on muestral:

Como los valores que puede tomar un estad´ıstico depende de la

muestra utilizada para calcularlo,el estad´ıstico es una variable

aleatoria, y buscamos determinar la distribuci´on de esta variable, la

cual se conoce comodistribuci´on muestral del estad´ıstico.

(27)
(28)
(29)
(30)

Media y desviaci´on est´andar de la distribuci´on muestral de y¯

I La media de y¯es aleatoria, porque cambia con cada muestra

utilizada para su c´alculo, pero en muestras aleatorias este

valor fluct´ua alrededor de la media poblacionalµ.

I La dispersi´on en la distribuci´on dey¯ es descrita por su

desviaci´on est´andar, que es denominada error est´andar dey¯,

y se denota por σy¯.

Considerando una muestra aleatoria de tama˜nonde una poblaci´on

(31)

Seay¯la media muestral calculada a partir de una muestra aleatoria

simple de tama˜nontomada de una poblaci´on con media µ y

desviaci´on est´andarσ. Sean µy¯ yσy¯ la media y la desviaci´on

est´andar dey¯. Se tiene que:

1. µy¯=µ 2. σy¯=σ/

√ n

3. Cuando nes grande (n≥30),la distribuci´on muestral dey¯es

aproximadamente normal con par´ametros µ yσ/

(32)

Ejemplo

Se esta realizando una auditoria sobre los 1200 proyectos

ejecutados en los ´ultimos 5 a˜nos en una regi´on para determinar las

demoras que se presentaron en la ejecuci´on final de los mismos. Un

proyecto que presente m´as de 150 d´ıas de retraso es considerado

como proyecto en potencial caducidad.

Para esta tarea se considera como estimador del tiempo de retraso

(x), el tiempo promedio de retraso (x¯), para una muestra aleatoria

(33)

Distribuciones de probabilidad y Estimaci´on de par´ametros Estimaci´on de par´ametros

¿Cu´al es la probabilidad de que el tiempo promedio de retraso

(34)

¿Cu´al es la probabilidad de que el tiempo promedio de retraso observado sea mayor a 150 d´ıas?

Por el teorema del l´ımite central se tiene quex¯∼N(120,402), luego:

(35)

Ejercicio en clase

Para la poblaci´on de inmigrantes ilegales en los Estados Unidos se

sabe que su ingreso semanal tiene una distribuci´on normal con

mediaµ=380d´olares y una desviaci´on est´andar de σ=80. Un

investigador no esta seguro de estos valores, y para verificarlos selecciona una muestra aleatoria de 100 inmigrantes y utiliza su

ingreso semanal promedioy¯ para estimar µ.

1. ¿Cu´al es la distribuci´on muestral dey¯?

(36)

Estimaci´

on de par´

ametros

La estimaci´on de los par´ametros asociados a la distribuci´on de una

variable aleatoria se puede hacer por:

I Estimaci´on puntual: se establece un ´unico valor como la

mejor aproximaci´on del valor real del par´ametro.

(37)

Para realizar la estimaci´on puntual de un par´ametroθ, se debe

seleccionar un estad´ıstico (estimador) y calcularlo en los valores observados en la muestra.

I Par´ametro: θ.

(38)

Propiedades de los estimadores

Si se considera un estimadorθˆ de un par´ametro θ, se dice queθˆ

esinsesgadosi:

E[θˆ] =θ

(39)

Distribuciones de probabilidad y Estimaci´on de par´ametros Estimaci´on de par´ametros

Ejemplo

SeaX1,X2, . . . ,Xn una MAS de una poblaci´on normal de con media

µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.

E[X¯] =E "

1

n n

i=1

Xi # = 1 n n

i=1

E[Xi] =1

(40)

Ejemplo

SeaX1,X2, . . . ,Xn una MAS de una poblaci´on normal de con media

µ y varianzaσ2. Se tiene queX¯ es una estimador insesgado deµ.

E[X¯] =E "

1

n n

i=1

Xi # = 1 n n

i=1

E[Xi] =1

nnµ=µ

Ejercicio

(41)

I Al elegir entre varios estimadores se debe seleccionar el que sea insesgado.

I Si θˆ1 yθˆ2 son estimadores insesgados deθ, se debe

(42)

etodos de estimaci´

on puntual

Dos de los m´etodos m´as utilizados para establecer estimadores

puntuales de uno o m´as par´ametros son:

I M´etodo de momentos.

(43)

Consiste en igualar tantos momentos muestrales a momentos poblacionales como par´ametros a estimar.

SeaX1, . . . ,Xn una MAS de una variable X, entonces:

Momentos Poblaciones Momentos Muestrales

(44)

Ejemplo

SeaX1, . . . ,Xn una MAS de una variable X∼N(µ,σ2), luego:

I E[X] =µ.

I V[X] =σ2=E[X2]−(E[X])2, entonces E[X2] =σ2+µ2.

Igualando los dos primeros momentos tenemos:

µ=X¯ ; σ2+µ2=1 n

n

i=1

Xi2

(45)

Ejercicio en clase

Se selecciona una muestra aleatoria simple de una variable aleatoria,X ∼Bin(n,p).

I Construya el estimador de momentos de p.

I Si los valores observados de la muestra son: 7, 9, 3, 4, 4, 8, 4,

(46)
(47)

de distribuci´on conjunta de la muestra como una funci´on de los par´ametros que se van a estimar, para luego buscar expresiones de los par´ametros que maximicen esta funci´on.

fX(X1, . . . ,Xn;θ1, . . . ,θm)

Cuandox1,x2, ...,xnson los valores muestrales observados, la funci´on solo

depende de los par´ametros y se denominafunci´on de verosimilitud.Los estimadores de m´axima verosimilitudθb1,θb2, ...,θcmson los valores de losθi

(48)

Ejemplo

SeaX1,X2, ...,Xn una muestra aleatoria de una distribuci´on exponencial

con par´ametroβ. La funci´on de verosimilitud es:

f(X1,X2, ...,Xn;β) = n

i=1

fXi(x;β) = n

i=1

βe−βxi=βne−β∑ni=1xi

Se busca una expresi´on paraβ que maximice esta funci´on. Este proceso

es m´as sencillo si se considera el logaritmo natural de la funci´on de verosimilitud, construyendo una funci´on que se denomina funci´on de log-verosimilitud, y aplicando primero las propiedades del logaritmo.

(49)

Ejemplo

Calculando ahora la derivada de la funci´on de log-verosimilitud

respecto al par´ametro β e igualando a cero se tiene que:

d

dβ ln[f(X1,X2, ...,Xn;β)] = n

β − n

i=1

xi=0

Despejando el par´ametro de la ´ultima ecuaci´on se tiene queβˆ =X1¯,

(50)

Estimaci´

on por intervalos

Se busca establecer un intervalo que contenga el valor real del

par´ametro con un nivel de confiabilidad determinado y con una

precisi´on que se puede evaluar al considerar la longitud del

(51)

luegoZ= X−µ¯

σ/√n∼N(0,1), y se cumple que:

P[−1.96<Z<1.96] =0.95

P

−1.96< X¯−µ σ/

n<1.96

=0.95

P

−1.96√σ

n <X¯−µ<1.96

σ √ n =0.95 P

−1.96√σ

n−X¯<−µ<1.96

σ

n−X¯

=0.95

P

¯

X−1.96√σ

n<µ<

¯

X+1.96√σ

n

(52)

El intervalo de confianza al 95% paraµ, asumiendo queσ es

conocido, est´a determinado por:

¯

X−1.96√σ

n; ¯X+1.96 σ

√ n

Si, por ejemplo, se tiene un muestra den=31 observaciones, y se

sabe que: σ =2 yX¯ =80, entonces un intervalo al 95% de

confianza paraµ es:

80−1.96√2

31; 80+1.96 2

31

(53)

1. Se debe notar que el intervalo obtenido es aleatorio, ya que

sus extremos dependen del valor de X¯ que cambiar´a con la

muestra.

2. El nivel de confianza del intervalo (95% por ejemplo) significa

que si se consideran 100 muestras aleatorias simples distintas, y para cada una de estas se construye el intervalo, se espera

que 95 de los 100 intervalos contengan el valor real de µ.

(54)

En general, siX1,X2, ...,Xn es una muestra aleatoria simple de una

poblaci´on normal de par´ametros µ yσ2, con σ conocido, entonces

un intervalo al100(1−α)%de confianza (o lo que es igual, con significanciaα) para µ esta determinado por:

¯

X−Zα/2√σ

n; ¯X+Zα/2 σ

√ n

(55)

Considere una muestra con 50 observaciones del ingreso diario promedio para las familias de una determinada localidad en una ciudad. Se sabe que esta variable sigue una distribuci´on normal conσ=0.6 millones. De

los datos en la muestra se encuentra que el ingreso mensual promedio es

¯

X=2.8millones. Construir un intervalo de confianza para el verdadero valor del ingreso mensual medio al 90% de confianza y otro al 95% de confianza.

Para el intervalo al 90% de confianza se tiene queα=0.1, luego

Zα/2=Z0.05=1.64, y el intervalo es: (2.6604; 2.9395).

Para el intervalo al 95% de confianza se tiene queα=0.05, luego

(56)

Notas:

1. Un mayor nivel de confianza implica intervalos de mayor longitud, es decir, menor precisi´on.

2. Si se define laprecisi´on (w) como la longitud del intervalo, se tiene que:

w= (X¯+Zα/2

σ

n)−(X¯−Zα/2

σ

n) =2Zα/2

σ

n

Para un nivel de precisi´on fijowy un nivel de significaci´on fijoα, el

(57)

Ejemplo

Se ha controlado el tiempo de respuesta de una entidad a las peticiones, quejas y reclamos de sus clientes encontrando que este sigue una distribuci´on normal con una desviaci´on de 10 d´ıas. Se ha instalado un nuevo procedimiento de respuesta a este tipo de solicitudes y se desea estimar el tiempo de respuesta promedio real (µ) bajo estas condiciones.

Suponiendo que los tiempos de respuesta a´un tienen una distribuci´on normal conσ=10, ¿qu´e tama˜no de muestra es necesario para garantizar

(58)

Ejemplo

Se tiene que:

n=

2·10·1.96

4

2

≈97.

Referencias

Documento similar

El inconveniente operativo que presenta el hecho de que la distribuci´ on de probabilidad de una variable aleatoria es una funci´ on de conjunto se resuelve mediante el uso de

Si bien en el sistema de cavidades nos centr´ abamos en unos par´ ametros espec´ıficos tales como el factor de forma y de calidad, en esta parte del proyecto los par´ ametros que

Calcular los l´ımites

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

En funci´ on del problema concreto a solucionar y del an´ alisis que se haya realizado para establecer los par´ ametros la calidad de los resultados variar´ a, pero como conclusi´ on

Escribe una Funci´ on Langevin que reciba como argumento de entrada un vector de valores x y devuelva como argumento de salida un vector con los valores de la funci´ on de Langevin

Figura 6.39: Parte superior: Funci´on Original f g2dis (x, y) definida en (6.21) con la discontinuidad dada por una par´abola, parte inferior izquierda: Apro- ximaci´on obtenida por

A continuaci´ on se explican las primeras iteraciones, del algoritmo para un su- puesto problema de clasificaci´ on con 6 par´ ametros de entrada, 5 posibles clase de salida y que