UNIDAD III
UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS Competencia:
-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de las
estimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,para poder realizar Inferencia Estadística
Objetivos.
-Utilizar correctamente el concepto de Estimación Puntual para la construcción eficiente de Intervalos de Confianza de cualquier parámetro sujeto de investigación ,para poder realizar generalizaciones respecto de la población en estudio y tomar decisiones coherentes Descripción general de la unidad:
-Esta unidad comprende el desarrollo de los siguientes conceptos:Estimación-Estimador , Tipos de estimación:Puntual ,las propiedades de un buen estimador puntual y por Intervalos de
Confianza,La construción de los Intervalos de confianza de: La media, diferencia de
medias,(muestras grandes y pequeñas),la proporción y la diferencia de proporciones,la varianza y la razón de varianzas ,utilizando las respectivas Distribuciones especiales muestrales.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.208 al 213
Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,333 al 375
Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia Estadística((2ª ed) Perú .Pags.627al 684
Referencia electrónica: http://e-stadistica.bio.ucm.es/mod_intervalos5.html
ESTIMACIÓN PUNTUAL Y por INTERVALOS DE CONFIANZA INTRODUCCIÓN
La teoría de la inferencia estadística se divide en 3 grandes áreas:
1. La estimación
2. Las pruebas de hipótesis 3. la teoría de la decisión ESTIMACIÓN ESTADÍSTICA
Estadísticamente la estimación es el proceso por el cual se aproxima el valor de cualquier parámetro desconocido de una población ( ,2,,) mediante los estadísticos (X,S2,S,v,etc.) etc. obtenidos de una m. a. tomados de la población.
PRUEBA DE HIPÓTESIS
La prueba de hipótesis o docimasia de hipótesis consiste en comprobar, verificar confirmar o rechazar si algún parámetro ó alguna función de es igual algún valor preconcebido de
TEORÍA DE LA DECISIÓN
La teoría de la decisión trata sobre las diferentes estrategias y diversos criterios de decisión, para la toma de decisión frente a la incertidumbre.
MÉTODOS DE ESTIMACIÓN
Para estimar parámetros en base a m.a. y sus estadísticos se tiene 2 métodos de estimación: 1) PUNTUAL 2) POR INTERVALOS DE CONFIANZA
ESTIMACIÓN PUNTUAL
Se dice que una estimación puntual cuando se obtiene un solo valor para cada estadístico que nos permite aproximarnos al valor del parámetro en cuestion.
ESTADÍGRAFO
Llamado también estadístico, es toda medida descriptiva que se obtiene de la m. a. y que sirve para estimar parámetros. Por lo tanto el estadígrafo esta en función de la m.a.
) ,...
,
(X1, X2 Xn G
Y cuyo valor ygx1,x2,...xn
PARÁMETRO
Es toda medida descriptiva que sintetiza alguna característica de la población cuyo valor se obtiene de toda la población
) ,...
,
(X1 X2 Xn
f
cuyo valor gx1,x2,...xn
ESTIMADOR ˆ
Se llama estimador de un parámetro a cualquier estadígrafo: yg(x1,x2,...xn) que nos permite aproximar al valor del parámetro.
- Un mismo parámetro puede tener varios estimadores puntuales, se elegirá aquel que se aproxime mas al valor del parámetro
- Para poder elegir el mejor estimador se debe recurrir a:
LAS PROPIEDADES DE UN BUEN ESTIMADOR
Se dice que un estimador es un buen estimador si cumple minimamente los siguientes requisitos o propiedades.
1. INSESGABILIDAD
Sea un estimador cualquiera ˆ del parámetro , entonces se dice que es INSESGADO sii
La E
ˆ ó E
ˆ
0 2. CONSISTENCIASe dice que un estimador insesgado es consistente sii a) Lim
n
Eˆ
b)
n
V
lím ˆ 0 3. EFICIENCIA
Considerando todos los posibles estimadores insesgados de un parámetro , será eficiente aquel que tiene mínima varianza, llamándose también estimadores de mínima varianza del parámetro .
Sean dos estimadores insesgados ˆ1 yˆ2de
si
1
ˆ ˆ ˆ
ˆ
2 1 2
1
V
ó V V
V el estimador ˆ1es mas eficiente que ˆ2 4. ERROR CUADRÁTICO MEDIO (MSE) ˆ
Sea un estimador ˆGx1,x2...xn un ˆ de
ˆ Eˆ 2 Var ˆ E ˆ 2
MSE
cuando el estimador es insesgado MSE ˆ Var ˆ
EFICIENCIA RELATIVA Sean dos estimadores ˆ1 yˆ2 con MSE ˆ1 y MSE ˆ2
la eficiencia relativa de ˆ2respecto de ˆ1se define como:
ˆˆ2 1 1 SI MSE MSE
ˆ2
es mas eficiente que ˆ1
Ejemplo
Se tienen 2 v.a o dos poblaciones X1 y X2 distribuidas independientemente X1
1 1 22 2 ;
,
2 E X V X I
X2
2 2 22 4 ;
,
4 E X V X
I
Donde es el parámetro poblacional en cuestión; para ello se proponen 2 estimadores:
5 10
;ˆ 8 4
ˆ1 X1 X2 2 X1 X2
Cual de los 2 estimadores es el mejor, elija de acuerdo alas propiedades de un buen estimador
SOLUCIÓN
1) INSESGABILIDAD sabemos queE ˆ
Para el 1er estimador ˆ1 Para el 2do estimador ˆ2
1 2
2 1 2
1 2
1
5 1 10
1 5
; 10 8
1 4
1 8
4 X X E X E X
E X
E X
X E
E X
1 esinsesgado 4 ˆ2esinsesgado 5
2 1 10
; 1 4 ˆ
8 2 1 4
1
EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza
1 1 2 2
1 1
64 1 16
ˆ 1
8 4 ˆ
X V X
V V
X V X
V
;
2 1 2 2
1 2
25 1 100
ˆ 1
5 10 ˆ
X V X
V V
X V X
V
2 2
2 2
2
1 100
ˆ 5 64
5 64
1 16
ˆ 1
V
V
1 2
2 2
ˆ 1 ˆ
5625 . 1 100
5 64
5
V V
como El estimador ˆ2es mas eficiente que ˆ1
2) CONSISTENCIA Deben satisfacer 2 requisitos
a) Lim
n n
V lím ó
Eˆ ˆ 0
n
n
límE ˆ1 lim ;
n
n
límE ˆ2 lim
ˆ1 lim 645 2 52 0
n n
límV ;
ˆ2 lim 1005 2 52 0
n n
límV significa que ambos estimadores son consistentes
MÉTODO DE ESTIMACIÓN PUNTUAL
La estimación puntual se lo puede realizar principalmente por 2 métodos:
1) mediante la máxima verosimilitud 2) mediante los momentos
3)
1) METODO DE LA MÁXIMA VEROSIMILITUD (M.V.)
Este método se fundamenta en el principio de elegir el valor del parámetro a estimarse para el cual f(X1,X2,...Xn;)es la probabilidad conjunta de obtener los valores muestrales es una función máxima.
De acuerdo a este método se obtiene estimadores a) suficientes
b) insesgados y de mínima varianza c)
DEFINICIÓN
Sea una v.a. X cuya función de probabilidad: f(X, ) depende del parámetro que se desconoce, para ello se toma una m.a. tamañon:X1,X2,...Xncuyos valores X1,X2,...Xn la función verosimilitud de la m.a. se define
, ,... , , , ... , ,
2 1 1
2
1 X X f X f X f X f Xi
X f V
n
n i
n
, si X es continuo
, ,... , , , ... , ,
2 1 1
2
1 X X p X p X p X p Xi
X p V
n
n i
n
, si X es discreta
El método de M.V. consistente en tomar como valor estimado , el valor que maximice la v ( ) para ello se debe logaritmizar
ln ,
lnV f x
L
luego se debe derivar e igualar a 0
0ln
S x f
L S i
Nota.- Cuando la distribución de probabilidad tiene varios parámetros desconocidos, se obtendrán tantas ecs. Como parámetros estimar
Así si se tiene K parámetros a estimar 1,2...k 0
...
: 0 0
2 1
k
L L
L
Ejemplo
Obtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a. x~Bernoulli, mediante el método de la M.V.
SOLUCIÓN
Sabemos que x~B(1,p) donde
P(x)=px(1 p)1x; x=0.1 donde 0<p<1
Sea una m.a. tamaño n:X1,X2,...Xncuyos valores x1,x2,...xndonde 1) x~B(1,p) p
xi,p
pxi(1p)1x1;i 1,2,...n2)
n xi xi xi xi
i i n
i p x p p p p p
p
V 1 1
1
1 , 1, 1
3) aplicando logaritmos L V
p x p n X
p
n
i i
i
1 ln ln
ln
1
4) derivando con respecto a p e igualando a cero 1 0
1
p x n p
x p
L i i
5) Resolviendo la ecuación
x n p
p x x n p
x n p
x x n p
p p
x n p
x
i
i
i i
i i
i
ˆ 1 ˆ
1 1 1
1 ; 1
2) MÉTODO DE LOS MOMENTOS
Este método consiste en igualar los primeros momentos muestrales originales con los primeros momentos poblacionales originales v' Mv'
Donde Mv' E
xr
xr
xrpxi,1,2...k:v1,2,...k
nx x E M
v r i
v
'
x dx
f
x i k
Rx v
v
'
, 1, 2...Ejemplo
Sea una m.a. tamaño n:X1,X2,...Xnde una población X con distribución POISSON con parámetro Se pide estimar .mediante el método de los momentos
SOLUCIÓN
Como solo se debe estimar un solo parámetro, solo debemos hallar los primeros momentos originales poblacionales y muestrales e igualarlos
Sabemos 1' E(X);M1'
Xn1 XIgualando 1' M1'ˆX
ESTIMACION POR INTERVALOS DE CONFIANZA INTRODUCCION
La estimación puntual aunque reúna todas las propiedades de una buena estimación (insesgamiento, consistencia, eficiencia) adolece de una desventaja y es que no nos proporciona ningún nivel de significación y/o de confianza. Por lo tanto es necesario recurrir a otro tipo de estimación que nos permite algún nivel de significación que es la estimación por intervalos de confianza.
INTERVALO ALEATORIO
Es aquel intervalo que tiene por lo menos uno de sus extremos una variable aleatoria.
INTERVALO DE CONFIANZA (IC)
Sea una v.a. o una población X cuya DISTRIBUCIÓN de probabilidad: f(X; ) donde el
se desconoce
Se toma una m. a. de tamaño n: X1, X2 ,....Xn cuyos valores : x1, x2 ,....xn del que se toman 2 estadísticas 1= G (X1, X2 ,....Xn); 2= G (X1, X2 ,....Xn) tal que1<2: para los cuales se cumple: P12100v%100(1)%
donde
v= nivel de confianza 100%
= nivel de significancia0%
1= limite inferior del IC para el parámetro
2=limite superior del IC para el parámetro
NIVEL DE CONFIANZA (r) Y NIVEL DE SIGNIFICACION
La elección de los niveles de confianza y/o de significación depende del investigador los que generalmente son:
r= 0.90 0.95 0.975 0.98 0.99
= 0.10 0.05 0.025 0.02 0.01
CLASES DE INTERVALOS DE CONFIANZA
De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. o una población X con DISTRIBUCIÓN de probabilidad fX;del que se toma una m.a.
tamaño n
1= G (X1, X2 ,....Xn); 2= G (X1, X2 ,....Xn) tal que1<2
tenemos:
1. BILATERAL 1;2 óP12=100v%
2. UNILATERAL INFERIOR1 óP1=100v%
3. UNILATERAL SUPERIOR;2 óP2=100v%
NOTA.- Para construir un IC para es necesario a) Elegir el nivel de confianza r1: (99%, 95%, 90%) ó
Elegir el nivel de significancia 0: (1%, 3%, 10%) b) Hallar 2 estadísticos 1y2tal que 1 2
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( ) CUANDO SE CONOCE LA VARIANZA POBLACIONAL
2 EN MUESTRAN GRANDES n30Sea una v.a. o una población X
,2
donde se desconoce , pero se conoce
2 , setoma una m. a. grande n30del que se estima la media X
El IC para con
2 (conocido) n30=
n X Z0
ERROR
donde
2 1
0
Z r Z P
Z
NOTA
1. Cuando no se conoce y la m.a. n30 se utiliza S
2. Cuando XN
,2
, aun cuando n<30, la definición del IC es valida3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe corregir el ERROR
El IC=
1
0
N n N n X Z
4. Cuando se quiere construir el IC para el total
,N;2N
ó P,N TOTAL2N
100v%Ejemplo
Un analista de mercado desea estimar el ingreso per cápita familiar mensuales de una determinada población. Para ello toma una m.a de tamaño 100 de esa población la cual determinó que el promedio del ingreso familiar es de $us. 500.-. Suponiendo que el ingreso familiar mensual sigue una distribución normal con desviación típica igual a
$us. 100.-
a) Construya un IC para la media del ingreso familiar de toda esa población
b) Construya un IC para la media del ingreso familiar de toda esa población si es de 2000
c) Construya un IC para el total de ingreso familiar de toda esa población, al nivel del 95%
SOLUCIÓN
a) Sabemos que el IC para , con 2(conocida) cuando n30=
n X Z0
Donde v=0.95 0.975 1.96
2 95 . 0 1
975 . 0 0
0
PZ Z Z
Z 100 100
500
S n
X
EL ERROR = 19.6
100 ) 96 . 1 (
0 100
0
n Z s n
Z
6 . 519 6 . 19 500
; 4 . 480 6 . 19
500 2 0
0
1
n Z X S n
Z
X S
El IC para al 95% =[480.4;519.6]óP480.4519.60.95
Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran un promedio comprendido en el intervalo y solo 10 m.a. no se están comprometido en el IC.
b) Como se conoce N=2000 IC para al 95%
1
0
N n N n X Z
ERROR=
11 . 1 19 2000
100 2000 100
96 . 1
100
11 . 519 11 . 19 500
; 89 . 480 11 . 19
500 2
1
El IC para al 95% =[480.89; 519.11]óP480.89519.110.95
c) El IC para el total al 95%=,N;2N 480.89(2000);519.11(2000) 961780;1038220
TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA
Para determinar el tamaño de la m.a cuando se quiere estimar la media poblacional mediante el IC, se presenta 2 situaciones
a) Cuando el muestreo se hace con reposición ó cuando no se conoce la población se toma su error
n E Z0
del cual se despeja n
2 0
E n Z
b) Cuando el muestreo se hace sin reposición, es decir cuando se conoce la población, se toma su error
1
0
N n N n
Z
del cual se despeja n
) 1
2(
2 2 0
2 2 0
N E Z
N n Z
Ejemplo
Un grupo de 50 animales experimentales reciben una cierta clase de raciones por un lapso de 2 semanas. Sus aumentos de pesos arrojan los valores X=420 grs. y S=60 grs.
a) ¿Que tamaño debe tomarse, si se desea que X difiera de por menos de 10 grs.
con 0.95 de probabilidad de ser correcto?
b) Encontrar el IC del 95% para ? SOLUCIÓN
a) Como el ERROR=10=
2 0
0
E
Z n S n
Z
además v=0.95 =Z0=1.96
138.30 138 10
96 . 1
60 2
n
b) Como n=138El IC para al 95% =
138 961 . 1 42060
420 10.0108 409.99;430.0108
7473 . 11
6 .
420 117
O =P( 409.99 ≤ ≤ 430.0108) = 0.95
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE 2 POBLACIONES CON DESVIACIONES TÍPICAS CONOCIDAS MUESTRALES GRANDES n,m30
Sean 2 v.a. independiente ó 2 poblaciones, de las cuales se desconocen sus media, pero se conocen sus varianzas o desviaciones típicas se quiere estimar, mediante un IC del 100v% la diferencia de sus medias
x y
; de las cuales se toman 2 m.a. ;grandes y luego se obtienen sus medias respectivasY m tamaño a
m Y
X n tamaño a
m
X x y y y
30 .
.
) .~(
30 .
.
)
.~( 2 2
El IC para
yal v x y Z nx my
x
2 2 0
% 100
Donde Z0 se obtiene mediante la
2 1
0
Z v Z
P
NOTA
1) Si XN
x2x
y YN
y2y
conocidos x2 yy2 aun cuando las muestras son pequeñas n. m <30 la definición anterior es válida2) Si no se conoce, 2x y2y, pero se tienen muestras grandes
El IC para
m
S n Z S y
x x y
v al y x
2 2 0
%
100
Ejemplo
Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida media de 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca “B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:
a) Un IC del 95% para la diferencia de la vida media de las poblaciones A y B b) Un IC del 99% para la diferencia de la vida media de ambas poblaciones SOLUCIÓN
Como x=140 : Sx=10 con n=200 de la marca “A”
y=125 : Sy=9 con m=120 de la marca “B”
a) r=0.95 =Z0=1.96 =El IC para
m
S n Z S y x
al x y
y x
2 2
% 0
95
1246 . 2 ) 08401 . 1 ( 120 196
9 200 96 10 . 1
2 2 2
2
0
m
S n Z S
E x y
14012515
y
x El IC para xyal95%152.1246
12.88xy 17.12
b) r=0.99 0.995 2.575 2
99 . 1
995 . 0
0
PZ Z Z
E=(2.575(1.0840)=2.7913
El para xyal 99%=[152.7913]=[12.2087;17.7913]=[12;18]
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, MUESTRA GRANDE n30 Sea una v.a ó una población Xb(n,p) donde se desconoce la proporción poblacional p, se toma una m.a tamaño grande n30: X1 ,X2 ,....Xn del cual se estima la proporción
n x n
pˆ x
iEl IC para “p” al 100v%=
n
q Z p
pˆ 0 ˆˆ donde
2 1
0 0
Z v Z P
Z
NOTA
Cuando el muestreo es SIN REPOSICIÓN de una población finita se debe corregir el modulo error con
1
N
n N
El IC para “p” al 100v%=
1 ˆ ˆ 0 ˆ
N n N n
q Z p
p
Ejemplo
Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieron su preferencia por una determinada marca de CPU
a) Hallar el IC del 95% para la proporción “p” de preferencia de dicha marca de CPU b) Si la proporción de preferencia se estima en 0.6 determine el error máximo de
estimación, si se quiere confianza del 98%