Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Inferencia Estadística. Estimación
y Contrastes
M Dolores Redondas [email protected]
E.U. Arquitectura Técnica U.P.M.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Identicación del comportamiento de una variable El reconocimiento del comportamiento de una variable aleatoria se puede realizar:
I Por métodos deductivos. (Cálculo de probabilidades).
Ejemplos:
I Si z1, . . . ,zn son N(0,1)independientes, la variable:
z2
1 +· · ·+zn2=χ2n.
I Si z es una N(0,1)independiente de unaχ2n, resulta
que: z q 1 nχ2n =tn.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Con la información empírica de una muestra
{x1, . . . ,xn} de la variable.
I Se supondrá en general que la muestra ha sido obtenida
por m.a.s:
I Todos los individuos de la población tienen la misma
probabilidad de pertenecer a la muestra.
I Los elementos muestrales son independientes. (Supone
reemplazamiento de los individuos muestrales en poblaciones nitas.)
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Llamamos población a un conjunto homogéneo de elementos en los que se estudia una característica dada. ¾Por qué no estudiamos a todos los individuos?
I Ensayos destructivos
I Las muestras sólo existen conceptualmente.
I Es muy caro.
I Requiere mucho tiempo (y puede cambiar la
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Muestreo Aleatorio Simple m.a.s. Está caracterizado por
I Cada elemento tiene la misma probabilidad de salir.
I Es con reemplazamiento (la población es siempre la
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Muestreo Estraticado Se utiliza cuando se sospecha que la característica a estudiar no es homogénea en la muestra (por ejemplo en los sondeos de opinión respecto al sexo o la edad). En estos casos la muestra se toma proporcional a cada uno de los estratos en la pobalción.
Muestreo por Conglomerados Se utiliza cuando no se puede realizar un m.a.s. o por estratos porque no se dispone de una lista de la pobalción aunque si se sabe que existe una caracterización por estratos como regiones / provincias / municipios / barrios / etc...
Muestreo Sistemático Se utiliza cuando los elementos de la población están ordenados por lista. Si el orden de la lista es al azar, este procedimiento es equivalente al m.a.s. aunque es más fácil no cometer errores.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Obtenida la muestra {x1, . . . ,xn}de la variable aleatoria, X ,
ajustar un modelo que explique su comportamiento supone:
1. Identicar suforma: Normal, exponencial, binomial,. . .
2. Estimar los parámetros de la distribución, que dependen
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Para conjeturar la forma del modelo que explica el comportaniento de una variable aleatoria continua, se compara la forma de su histograma con la función de densidad del modelo teórico.
I Obsérvese que estos dos objetos son comparables.
I Ejemplo: Empleando las utilidades del programa
Statgraphics, discuta si el comportamiento del tamaño de los élitros de los machos y de las hembras contenidos en el archivo Coleop, se puede atribuir a distribuciones normales.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Una vez identicada la forma genérica de un modelo, que explica el comportamiento de la variable en estudio, es necesario concretar el valor de sus parámetros.
I Esta concreción (estimación) siempre será aproximada
puesto que:
1. Los elementos muestrales son variables aleatorias, con la misma distribución que la variable base.
2. Conjuntamente, la muestra es una variable aleatoria de dimensión n.
3. Los estadísticos extraídos de una muestra son variables aleatorias.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Existen diversos métodos para la estimación de los parámetros del modelo, a partir de los datos muestrales.
I El método de los momentos consiste en igualar los
momentos de la muestra con los poblacionales: ¯
x =µ, s2 =σ2, . . .
I Este método no emplea la información relativa a la
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I El método de máxima verosimilitud otorga a los
parámetros los valores que maximizan la función de densidad conjunta:
f(x1, . . . ,xn;λ),
siendo λel vector de parámetros del modelo.
I Este método sí emplea la información relativa a la
forma de la distribución.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Sea X una v.a. Poisson con λ=2.
Calcular la probabilidad de obtener la muestra X = (x1=3,x2 =1,x3 =0,x4 =2,x5=0) P(x) = e −22x 2! Entonces P(X) = e −223 3! e−221 1! e−220 0! e−222 2! e−220 0! y en general P(X) = e −22x1 x1! e−22x2 x2! e−22x3 x3! e−22x4 x4! e−22x5 x5!
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Lo podemos simplicar como P(X) =e−1026 1 2! 1 2! 1 0! 1 2! 1 0! y en general P(X) =e−nλPxiQ1 xi! A lo que llamamos función de densidad conjunta.
En general máxima varosimilitud encuentra el λpara el que
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Propiedades de los estimadores
Diremos que un estimador bθdeθ es centrado o insesgado
para θsi para cualquier tamaño muestra
Eθb
=θ
Se dene el sesgo como sesgoθb
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Por ejemplo (x1, . . . ,xn) m.a.s. con E(xi) =µy
Var(xi) =σ2
T(x1, . . . ,xn) =x
es un estimador centrado de µporque
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Por ejemplo (x1, . . . ,xn) m.a.s. con E(xi) =µy
Var(xi) =σ2
T(x1, . . . ,xn) =sx2 = 1
n(xi−x)2
no es un estimador centrado de σ2 porque
E s2
x= n
−1
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Propiedades de los estimadores
Llamaremos eciencia o precisión de un estimador a la inversa de la varianza presici´onθb = 1 Varθb b θ2 es más preciso que bθ1 si Varθb2 ≤Varθb1 o lo que es lo mismo presici´on b θ2 ≥presici´on b θ1
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Una buena medida de los bueno que es un estimador, que además tiene en cuenta el sesgo y la presisión es el Error Cuadrático Medio ECMθb =sesgo b θ 2 +var b θ
Diremos que un estimador es consistente si Eθbn −→ n→∞θ Varθbn −→ n→∞0
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Propiedades de los estimadores de Máxima Verosimilitud
I Son asintóticamente centrados.
I Tienen distribución asintóticamente normal.
I Tienen asintóticamente mínima varianza.
I Son invariantes: SiθbMV es el estimador M.V. de θ, y g
es una función cualquiera, entonces g(θbMV) es
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Distribución en el muestreo de una proporción Observamos la presencia o no de un determinado atributo.
Estimamosbp como el número de elemento r que hemos
observado con el atributo de una muestra de tamaño n.
b
p = r
n X ∼Bi(n,p)
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste Pbp= r n =P(X =r) = n r prqn−r E(bp) =E r n = 1 nE(r) = 1 nnp=p Var(bp) =Var r n = 1 n2Var(r) = 1 n2npq= pq n
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Estimación de los parámetros de una normal
En el caso de normalidad los métodos de los momentos y de máxima verosimilitud arrojan los mismos resultados.
Si una muestra {x1, . . . ,xn}permite conjeturar que una
variable aleatoria X se distribuye como una N(µ, σ), los
métodos de los momentos y de máxima verosimilitud toman
como estimadores deµ yσ, respectivamente:
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste Observaciones:
I Tantox como s¯ 2 son variables aleatorias.
I ¯x ≈N(µ,√σ
n).Consecuentemente:
I E(¯x) =µ
I La desviación típica dex disminuye con el tamaño¯
muestral
I ns2
σ2 −→χ2n−1
I E(s2)6=σ2 lo que justica que, con frecuencia, se
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Una estimación de un parámetro es un valor aproximado
del mismo, por lo que es necesario acotar el error, para
lo que se construyen losintervalos de conanza.
I Un intervalo de conanza para un parámetro es un
intervalo numérico, en el que se encuentra el valor verdadero del parámetro con un nivel de seguridad (conanza) conocido.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Construcción de intervalos de conanza para la media
de una normal con σ conocida
Sea X ≈N(µ, σ), conσ conocida, y ¯x la media muestral de
una muestra cualquiera de X de tamaño n. Como ¯ x ≈N µ,√σ n , resulta que ¯ x−µ σ/√n ≈N(0,1).
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Sea zα/2 el valor que en una N(0,1), Z, verica que:
P(−zα/2 ≤Z ≤zα/2) =1−α. Entonces, P −zα/2≤ x¯−µ σ/√n ≤zα/2 =1−α.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste De donde: P ¯ x −zα/2×√σ n ≤µ≤¯x −zα/2× σ √ n =1−α, y el intervalo ¯ x −zα/2×√σ n,x¯−zα/2× σ √ n
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Construcción de intervalos de conanza para la media
de una normal con σ desconocida
Si σ no es conocida no se puede emplear el hecho de que
¯
x−µ
σ/√n ≈N(0,1).
Sin embargo, se puede demostrar que ¯
x −µ
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
De donde, si tα/2 es el valor que en una tn−1:
P(−tα/2≤tn−1 ≤tα/2) =1−α,
operando como en el caso anterior se tiene que:
¯ x−tα/2×√ˆs n,x¯+tα/2× ˆ s √ n
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Construcción de intervalos de conanza para una proporción
Utilizando la misma idea y sabiendo que la proporción se aproxima a una normal, podemos obtener el intervalo de conanza para una proporción:
b p−zα/2 r b pbq n ≤p ≤bp+zα/2 r b pbq n
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Construcción de intervalos de conanza para la varianza de proporciones normales
Para construir el intervalo de conanza de la varianza de una normal, tenemos en cuenta que:
ns2 σ2 = (n−1)bs2 σ2 ∼X 2 n−1
Por lo que buscamos valores a y b que veriquen P X2 n−1,a ≤ ns2 σ2 ≤X 2 n−1,b =1−α
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Construcción de intervalos de conanza para la varianza de proporciones normales
O lo que es lo mismo P 1 X2 n−1,b ≤ σ2 ns2 ≤ 1 X2 n−1,a ! =1−α
de donde podemos obtener el intervalo ns2 X2 n−1,b , ns 2 X2 n−1,a !
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Empleando las utilidades del programa Statgraphics genere una muestra aleatoria de tamaño 100 procedente de una N(5,2).
I Emplee esta muestra para analizar el efecto del cambio
del nivel de conanza sobre la longitud del intervalo.
I Discuta qué relación existe entre la precisión de la
estimación y el nivel de conanza.
Suponiendo normalidad, calcule intervalos de conanza para la media y la varianza del tamaño de los élitros de los machos y las hembras contenidos en el archivo coleop.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Realizar un contraste con respecto a un parámetro,λ,
consiste en analizar si existe evidencia empírica suciente para admitir que este parámetro pueda cumplir alguna condición conocida.
I Contrastes habituales tienen por objeto asegurarse de si
I θ=θ0 I θ > θ0 I θ < θ0
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I En general, la realización de un contraste requiere
determinar con precisión:
I Lo que se quiere contrastar,hipótesis nula, representada
por H0.
I Aquello que se aceptaría si se rechaza la hipótesis nula hipótesis alternativa, representada por H1.
I Un estadístico de distribución conocida, que relacione el
parámetro con los datos muestrales.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
El contraste de la t para la media de una normal
Sea X una variable aleatoria N(µ, σ),conσ desconocida.
I Supóngase que se desea realizar el contraste:
H0 :µ=µ0, frente a H1 :µ6=µ0,
I Elegida una muestra {x1, . . . ,xn}se sabe que:
¯
x−µ
ˆ
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I De donde, si H0 es cierta: ¯ x −µ0 ˆ s/√n ≈tn−1.
I Por lo tanto, si tα/2 es el valor que en una tn−1:
P(−tα/2 ≤tn−1 ≤tα/2) =1−α. Es decir: P −tα/2≤ x¯−µ0 ˆ s/√n ≤tα/2 =1−α
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Una vez realizado el cálculo del estadístico t = ¯x−µ0
ˆs/√n ,
I Cuando ocurra que
−tα/2≤t≤tα/2,
no hay evidencia de la falsedad de H0, por lo que no se
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I Si por el contrario t∈/ (−tα/2,tα/2)
habrá evidencia de que la hipótesis nula es falsa y se
rechazará al(1−α)×100%de conanza.
I Al intervalo(−tα/2,tα/2) se le denomina región de aceptación del contraste, mientras que< −(−tα/2,tα/2)
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Todo contraste se resuelve creando, a través de un
estadístico apropiado, estadístico pivote, una zona de aceptación y otra de rechazo.
I Todo contraste lleva asociada una decisión, que puede
ser errónea.
I Error de tipo I : Rechazar H0cuando es cierta. I Error de tipo II : Aceptar H0 cuando es falsa.
I La metodología habitual construye contrastes en los que
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Todo contraste lleva asociado un p-valor, que es una
medida de la abilidad de la decisión tomada.
I Si el estadístico pivote, d, es una medida de
discrepancia entre la hipótesis nula y la muestra observada, se dene el p-valor del contraste como
P(d >dˆ|H0),
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Valores altos de p sugieren conanza en la decisión de
aceptación de la hipótesis.
I Valores bajos de p sugieren conanza en la decisión de
rechazo de la hipótetsis.
I Cuando se realiza un contraste al(1−α)×100%:
I p< α implica rechazar la hipótesis nula. I p> α supone aceptar la hipótesis nula.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Con la muestra generada en el ejemplo V ,
I Analice el efecto del cambio del nivel de conanza en la
realización del contraste:
H0 :µ=5, frente a H1 :µ6=5.
I Modique la hipótesis nula y discuta qué relación existe
entre la discrepancia entre la hipótesis nula con la muestra, y el p-valor obtenido en los distintos contrastes. Suponiendo normalidad, realice contrastes de hipótesis para la media y la varianza del tamaño de los élitros de los machos y las hembras contenidos en el archivo coleop.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I En ocasiones la hipótesis que se desea contrastar se
reere a si una muestra conrma el comportamiento de una variable, según un modelo de probabilidad
determinado:
Normal, Poisson, exponencial, . . .
I De estos contrastes (de ajuste), el más común es el test
de la Chi cuadrado, que analiza la concordancia entre el histograma de los datos y la función de densidad (o de probabilidad) del modelo.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
El test de la chi cuadrado contrasta la hipótesis de que la variable sigue un modelo de probabilidad concreto.
El estadístico empleado es una medida de la discrepancia entre los datos, el histograma, y el modelo, su función de densidad. -2 1 4 7 10 13 0 10 20 30 40
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
I Cuando la hipótesis nula es cierta, la variable sigue el
modelo previsto, el estadístico:
d = k X i=1 (Oi−Ei)2 Ei −→χ 2 k−r−1, donde:
I k es el número de clases en que se divide a los datos. I Oi es la frecuencia observada en cada clase.
I Ei es la frecuencia esperada en cada clase.
I r es el número de parámetros estimados con la muestra. I El análisis del valor de d permite discutir el contraste.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste I Contraste de Kolmogorov-Smirnov Dn=|Fn(x)−F(x)|
Sólo es válido para funciones continuas, pero funciona bien con muestras pequeñas.
I Contraste de Saro-Wilks
Dibuja los datos en papel probabilístico normal. La bondad de ajuste la da lo bien que se aproximan los datos a la recta.
Sólo funciona bien para normalidad, pero lo hace con muestras muy pequeñas.
Loly Redondas Introducción. Métodos de muestreo Estimación Puntual Intervalos de conanza Contrastes de Hipótesis Contrastes de Ajuste
Con la muestra generada en el ejemplo V ,
I Analice la normalidad de la población a la que
representa la muestra.
I Estudie la normalidad del tamaño de los élitros de los
machos y las hembras contenidos en el archivo coleop.
I Discuta si la realización de transformaciones mejora los