Inferencia Estadística. Estimación y Contrastes

Texto completo

(1)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Inferencia Estadística. Estimación

y Contrastes

M Dolores Redondas dolores.redondas@upm.es

E.U. Arquitectura Técnica U.P.M.

(2)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Identicación del comportamiento de una variable El reconocimiento del comportamiento de una variable aleatoria se puede realizar:

I Por métodos deductivos. (Cálculo de probabilidades).

Ejemplos:

I Si z1, . . . ,zn son N(0,1)independientes, la variable:

z2

1 +· · ·+zn2=χ2n.

I Si z es una N(0,1)independiente de unaχ2n, resulta

que: z q 1 nχ2n =tn.

(3)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Con la información empírica de una muestra

{x1, . . . ,xn} de la variable.

I Se supondrá en general que la muestra ha sido obtenida

por m.a.s:

I Todos los individuos de la población tienen la misma

probabilidad de pertenecer a la muestra.

I Los elementos muestrales son independientes. (Supone

reemplazamiento de los individuos muestrales en poblaciones nitas.)

(4)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Llamamos población a un conjunto homogéneo de elementos en los que se estudia una característica dada. ¾Por qué no estudiamos a todos los individuos?

I Ensayos destructivos

I Las muestras sólo existen conceptualmente.

I Es muy caro.

I Requiere mucho tiempo (y puede cambiar la

(5)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Muestreo Aleatorio Simple m.a.s. Está caracterizado por

I Cada elemento tiene la misma probabilidad de salir.

I Es con reemplazamiento (la población es siempre la

(6)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Muestreo Estraticado Se utiliza cuando se sospecha que la característica a estudiar no es homogénea en la muestra (por ejemplo en los sondeos de opinión respecto al sexo o la edad). En estos casos la muestra se toma proporcional a cada uno de los estratos en la pobalción.

Muestreo por Conglomerados Se utiliza cuando no se puede realizar un m.a.s. o por estratos porque no se dispone de una lista de la pobalción aunque si se sabe que existe una caracterización por estratos como regiones / provincias / municipios / barrios / etc...

Muestreo Sistemático Se utiliza cuando los elementos de la población están ordenados por lista. Si el orden de la lista es al azar, este procedimiento es equivalente al m.a.s. aunque es más fácil no cometer errores.

(7)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Obtenida la muestra {x1, . . . ,xn}de la variable aleatoria, X ,

ajustar un modelo que explique su comportamiento supone:

1. Identicar suforma: Normal, exponencial, binomial,. . .

2. Estimar los parámetros de la distribución, que dependen

(8)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Para conjeturar la forma del modelo que explica el comportaniento de una variable aleatoria continua, se compara la forma de su histograma con la función de densidad del modelo teórico.

I Obsérvese que estos dos objetos son comparables.

I Ejemplo: Empleando las utilidades del programa

Statgraphics, discuta si el comportamiento del tamaño de los élitros de los machos y de las hembras contenidos en el archivo Coleop, se puede atribuir a distribuciones normales.

(9)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Una vez identicada la forma genérica de un modelo, que explica el comportamiento de la variable en estudio, es necesario concretar el valor de sus parámetros.

I Esta concreción (estimación) siempre será aproximada

puesto que:

1. Los elementos muestrales son variables aleatorias, con la misma distribución que la variable base.

2. Conjuntamente, la muestra es una variable aleatoria de dimensión n.

3. Los estadísticos extraídos de una muestra son variables aleatorias.

(10)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Existen diversos métodos para la estimación de los parámetros del modelo, a partir de los datos muestrales.

I El método de los momentos consiste en igualar los

momentos de la muestra con los poblacionales: ¯

x =µ, s2 =σ2, . . .

I Este método no emplea la información relativa a la

(11)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I El método de máxima verosimilitud otorga a los

parámetros los valores que maximizan la función de densidad conjunta:

f(x1, . . . ,xn;λ),

siendo λel vector de parámetros del modelo.

I Este método sí emplea la información relativa a la

forma de la distribución.

(12)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Sea X una v.a. Poisson con λ=2.

Calcular la probabilidad de obtener la muestra X = (x1=3,x2 =1,x3 =0,x4 =2,x5=0) P(x) = e −22x 2! Entonces P(X) = e −223 3! e−221 1! e−220 0! e−222 2! e−220 0! y en general P(X) = e −22x1 x1! e−22x2 x2! e−22x3 x3! e−22x4 x4! e−22x5 x5!

(13)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Lo podemos simplicar como P(X) =e−1026 1 2! 1 2! 1 0! 1 2! 1 0! y en general P(X) =e−nλPxiQ1 xi! A lo que llamamos función de densidad conjunta.

En general máxima varosimilitud encuentra el λpara el que

(14)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Propiedades de los estimadores

Diremos que un estimador bθdeθ es centrado o insesgado

para θsi para cualquier tamaño muestra

Eθb

Se dene el sesgo como sesgoθb

(15)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Por ejemplo (x1, . . . ,xn) m.a.s. con E(xi) =µy

Var(xi) =σ2

T(x1, . . . ,xn) =x

es un estimador centrado de µporque

(16)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Por ejemplo (x1, . . . ,xn) m.a.s. con E(xi) =µy

Var(xi) =σ2

T(x1, . . . ,xn) =sx2 = 1

n(xi−x)2

no es un estimador centrado de σ2 porque

E s2

x= n

−1

(17)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Propiedades de los estimadores

Llamaremos eciencia o precisión de un estimador a la inversa de la varianza presici´onθb = 1 Varθb b θ2 es más preciso que bθ1 si Varθb2 ≤Varθb1 o lo que es lo mismo presici´on b θ2 ≥presici´on b θ1

(18)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Una buena medida de los bueno que es un estimador, que además tiene en cuenta el sesgo y la presisión es el Error Cuadrático Medio ECMθb =sesgo b θ 2 +var b θ

Diremos que un estimador es consistente si Eθbn −→ n→∞θ Varθbn −→ n→∞0

(19)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Propiedades de los estimadores de Máxima Verosimilitud

I Son asintóticamente centrados.

I Tienen distribución asintóticamente normal.

I Tienen asintóticamente mínima varianza.

I Son invariantes: SiθbMV es el estimador M.V. de θ, y g

es una función cualquiera, entonces g(θbMV) es

(20)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Distribución en el muestreo de una proporción Observamos la presencia o no de un determinado atributo.

Estimamosbp como el número de elemento r que hemos

observado con el atributo de una muestra de tamaño n.

b

p = r

n X ∼Bi(n,p)

(21)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste Pbp= r n =P(X =r) = n r prqn−r E(bp) =E r n = 1 nE(r) = 1 nnp=p Var(bp) =Var r n = 1 n2Var(r) = 1 n2npq= pq n

(22)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Estimación de los parámetros de una normal

En el caso de normalidad los métodos de los momentos y de máxima verosimilitud arrojan los mismos resultados.

Si una muestra {x1, . . . ,xn}permite conjeturar que una

variable aleatoria X se distribuye como una N(µ, σ), los

métodos de los momentos y de máxima verosimilitud toman

como estimadores deµ yσ, respectivamente:

(23)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste Observaciones:

I Tantox como s¯ 2 son variables aleatorias.

I ¯x ≈N(µ,√σ

n).Consecuentemente:

I E(¯x) =µ

I La desviación típica dex disminuye con el tamaño¯

muestral

I ns2

σ2 −→χ2n−1

I E(s2)6=σ2 lo que justica que, con frecuencia, se

(24)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Una estimación de un parámetro es un valor aproximado

del mismo, por lo que es necesario acotar el error, para

lo que se construyen losintervalos de conanza.

I Un intervalo de conanza para un parámetro es un

intervalo numérico, en el que se encuentra el valor verdadero del parámetro con un nivel de seguridad (conanza) conocido.

(25)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Construcción de intervalos de conanza para la media

de una normal con σ conocida

Sea X ≈N(µ, σ), conσ conocida, y ¯x la media muestral de

una muestra cualquiera de X de tamaño n. Como ¯ x ≈N µ,√σ n , resulta que ¯ x−µ σ/√n ≈N(0,1).

(26)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Sea zα/2 el valor que en una N(0,1), Z, verica que:

P(−zα/2 ≤Z ≤zα/2) =1−α. Entonces, P −zα/2≤ x¯−µ σ/√n ≤zα/2 =1−α.

(27)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste De donde: P ¯ x −zα/2×√σ n ≤µ≤¯x −zα/2× σ √ n =1−α, y el intervalo ¯ x −zα/2×√σ n,x¯−zα/2× σ √ n

(28)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Construcción de intervalos de conanza para la media

de una normal con σ desconocida

Si σ no es conocida no se puede emplear el hecho de que

¯

x−µ

σ/√n ≈N(0,1).

Sin embargo, se puede demostrar que ¯

x −µ

(29)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

De donde, si tα/2 es el valor que en una tn−1:

P(−tα/2≤tn1 ≤tα/2) =1−α,

operando como en el caso anterior se tiene que:

¯ x−tα/2×√ˆs n,x¯+tα/2× ˆ s √ n

(30)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Construcción de intervalos de conanza para una proporción

Utilizando la misma idea y sabiendo que la proporción se aproxima a una normal, podemos obtener el intervalo de conanza para una proporción:

b p−zα/2 r b pbq n ≤p ≤bp+zα/2 r b pbq n

(31)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Construcción de intervalos de conanza para la varianza de proporciones normales

Para construir el intervalo de conanza de la varianza de una normal, tenemos en cuenta que:

ns2 σ2 = (n−1)bs2 σ2 ∼X 2 n−1

Por lo que buscamos valores a y b que veriquen P X2 n−1,a ≤ ns2 σ2 ≤X 2 n−1,b =1−α

(32)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Construcción de intervalos de conanza para la varianza de proporciones normales

O lo que es lo mismo P 1 X2 n−1,b ≤ σ2 ns2 ≤ 1 X2 n−1,a ! =1−α

de donde podemos obtener el intervalo ns2 X2 n−1,b , ns 2 X2 n−1,a !

(33)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Empleando las utilidades del programa Statgraphics genere una muestra aleatoria de tamaño 100 procedente de una N(5,2).

I Emplee esta muestra para analizar el efecto del cambio

del nivel de conanza sobre la longitud del intervalo.

I Discuta qué relación existe entre la precisión de la

estimación y el nivel de conanza.

Suponiendo normalidad, calcule intervalos de conanza para la media y la varianza del tamaño de los élitros de los machos y las hembras contenidos en el archivo coleop.

(34)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Realizar un contraste con respecto a un parámetro,λ,

consiste en analizar si existe evidencia empírica suciente para admitir que este parámetro pueda cumplir alguna condición conocida.

I Contrastes habituales tienen por objeto asegurarse de si

I θ=θ0 I θ > θ0 I θ < θ0

(35)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I En general, la realización de un contraste requiere

determinar con precisión:

I Lo que se quiere contrastar,hipótesis nula, representada

por H0.

I Aquello que se aceptaría si se rechaza la hipótesis nula hipótesis alternativa, representada por H1.

I Un estadístico de distribución conocida, que relacione el

parámetro con los datos muestrales.

(36)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

El contraste de la t para la media de una normal

Sea X una variable aleatoria N(µ, σ),conσ desconocida.

I Supóngase que se desea realizar el contraste:

H0 :µ=µ0, frente a H1 :µ6=µ0,

I Elegida una muestra {x1, . . . ,xn}se sabe que:

¯

x−µ

ˆ

(37)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I De donde, si H0 es cierta: ¯ x −µ0 ˆ s/√n ≈tn−1.

I Por lo tanto, si tα/2 es el valor que en una tn1:

P(−tα/2 ≤tn1 ≤tα/2) =1−α. Es decir: P −tα/2≤ x¯−µ0 ˆ s/√n ≤tα/2 =1−α

(38)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Una vez realizado el cálculo del estadístico t = ¯x−µ0

ˆs/√n ,

I Cuando ocurra que

−tα/2≤t≤tα/2,

no hay evidencia de la falsedad de H0, por lo que no se

(39)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I Si por el contrario t∈/ (−tα/2,tα/2)

habrá evidencia de que la hipótesis nula es falsa y se

rechazará al(1−α)×100%de conanza.

I Al intervalo(−tα/2,tα/2) se le denomina región de aceptación del contraste, mientras que< −(−tα/2,tα/2)

(40)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Todo contraste se resuelve creando, a través de un

estadístico apropiado, estadístico pivote, una zona de aceptación y otra de rechazo.

I Todo contraste lleva asociada una decisión, que puede

ser errónea.

I Error de tipo I : Rechazar H0cuando es cierta. I Error de tipo II : Aceptar H0 cuando es falsa.

I La metodología habitual construye contrastes en los que

(41)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Todo contraste lleva asociado un p-valor, que es una

medida de la abilidad de la decisión tomada.

I Si el estadístico pivote, d, es una medida de

discrepancia entre la hipótesis nula y la muestra observada, se dene el p-valor del contraste como

P(d >dˆ|H0),

(42)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Valores altos de p sugieren conanza en la decisión de

aceptación de la hipótesis.

I Valores bajos de p sugieren conanza en la decisión de

rechazo de la hipótetsis.

I Cuando se realiza un contraste al(1−α)×100%:

I p< α implica rechazar la hipótesis nula. I p> α supone aceptar la hipótesis nula.

(43)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Con la muestra generada en el ejemplo V ,

I Analice el efecto del cambio del nivel de conanza en la

realización del contraste:

H0 :µ=5, frente a H1 :µ6=5.

I Modique la hipótesis nula y discuta qué relación existe

entre la discrepancia entre la hipótesis nula con la muestra, y el p-valor obtenido en los distintos contrastes. Suponiendo normalidad, realice contrastes de hipótesis para la media y la varianza del tamaño de los élitros de los machos y las hembras contenidos en el archivo coleop.

(44)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I En ocasiones la hipótesis que se desea contrastar se

reere a si una muestra conrma el comportamiento de una variable, según un modelo de probabilidad

determinado:

Normal, Poisson, exponencial, . . .

I De estos contrastes (de ajuste), el más común es el test

de la Chi cuadrado, que analiza la concordancia entre el histograma de los datos y la función de densidad (o de probabilidad) del modelo.

(45)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

El test de la chi cuadrado contrasta la hipótesis de que la variable sigue un modelo de probabilidad concreto.

El estadístico empleado es una medida de la discrepancia entre los datos, el histograma, y el modelo, su función de densidad. -2 1 4 7 10 13 0 10 20 30 40

(46)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

I Cuando la hipótesis nula es cierta, la variable sigue el

modelo previsto, el estadístico:

d = k X i=1 (Oi−Ei)2 Ei −→χ 2 k−r1, donde:

I k es el número de clases en que se divide a los datos. I Oi es la frecuencia observada en cada clase.

I Ei es la frecuencia esperada en cada clase.

I r es el número de parámetros estimados con la muestra. I El análisis del valor de d permite discutir el contraste.

(47)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I Contraste de Kolmogorov-Smirnov Dn=|Fn(x)−F(x)|

Sólo es válido para funciones continuas, pero funciona bien con muestras pequeñas.

I Contraste de Saro-Wilks

Dibuja los datos en papel probabilístico normal. La bondad de ajuste la da lo bien que se aproximan los datos a la recta.

Sólo funciona bien para normalidad, pero lo hace con muestras muy pequeñas.

(48)

Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste

Con la muestra generada en el ejemplo V ,

I Analice la normalidad de la población a la que

representa la muestra.

I Estudie la normalidad del tamaño de los élitros de los

machos y las hembras contenidos en el archivo coleop.

I Discuta si la realización de transformaciones mejora los

Figure

Actualización...

Referencias

Actualización...