• No se han encontrado resultados

UNIDAD III UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS

N/A
N/A
Protected

Academic year: 2021

Share "UNIDAD III UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS"

Copied!
21
0
0

Texto completo

(1)
(2)

UNIDAD III

UNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS Competencia:

-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de las

estimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,para poder realizar Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de Estimación Puntual para la construcción eficiente de Intervalos de Confianza de cualquier parámetro sujeto de investigación ,para poder realizar generalizaciones respecto de la población en estudio y tomar decisiones coherentes Descripción general de la unidad:

-Esta unidad comprende el desarrollo de los siguientes conceptos:Estimación-Estimador , Tipos de estimación:Puntual ,las propiedades de un buen estimador puntual y por Intervalos de

Confianza,La construción de los Intervalos de confianza de: La media, diferencia de

medias,(muestras grandes y pequeñas),la proporción y la diferencia de proporciones,la varianza y la razón de varianzas ,utilizando las respectivas Distribuciones especiales muestrales.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística para Ingenieros”Edo.de México 1992 Pgs.208 al 213

Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996 Pags,333 al 375

Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e Inferencia Estadística((2ª ed) Perú .Pags.627al 684

Referencia electrónica: http://e-stadistica.bio.ucm.es/mod_intervalos5.html

(3)

ESTIMACIÓN PUNTUAL Y por INTERVALOS DE CONFIANZA INTRODUCCIÓN

La teoría de la inferencia estadística se divide en 3 grandes áreas:

1. La estimación

2. Las pruebas de hipótesis 3. la teoría de la decisión ESTIMACIÓN ESTADÍSTICA

Estadísticamente la estimación es el proceso por el cual se aproxima el valor de cualquier parámetro desconocido de una población ( ,2,,) mediante los estadísticos (X,S2,S,v,etc.) etc. obtenidos de una m. a. tomados de la población.

PRUEBA DE HIPÓTESIS

La prueba de hipótesis o docimasia de hipótesis consiste en comprobar, verificar confirmar o rechazar si algún parámetro ó alguna función de es igual algún valor preconcebido de

TEORÍA DE LA DECISIÓN

La teoría de la decisión trata sobre las diferentes estrategias y diversos criterios de decisión, para la toma de decisión frente a la incertidumbre.

MÉTODOS DE ESTIMACIÓN

Para estimar parámetros en base a m.a. y sus estadísticos se tiene 2 métodos de estimación: 1) PUNTUAL 2) POR INTERVALOS DE CONFIANZA

ESTIMACIÓN PUNTUAL

Se dice que una estimación puntual cuando se obtiene un solo valor para cada estadístico que nos permite aproximarnos al valor del parámetro en cuestion.

ESTADÍGRAFO

Llamado también estadístico, es toda medida descriptiva que se obtiene de la m. a. y que sirve para estimar parámetros. Por lo tanto el estadígrafo esta en función de la m.a.

) ,...

,

(X1, X2 Xn G

Y cuyo valor ygx1,x2,...xn

(4)

PARÁMETRO

Es toda medida descriptiva que sintetiza alguna característica de la población cuyo valor se obtiene de toda la población

) ,...

,

(X1 X2 Xn

f

cuyo valor gx1,x2,...xn

ESTIMADOR ˆ

Se llama estimador de un parámetro a cualquier estadígrafo: yg(x1,x2,...xn) que nos permite aproximar al valor del parámetro.

- Un mismo parámetro puede tener varios estimadores puntuales, se elegirá aquel que se aproxime mas al valor del parámetro

- Para poder elegir el mejor estimador se debe recurrir a:

LAS PROPIEDADES DE UN BUEN ESTIMADOR

Se dice que un estimador es un buen estimador si cumple minimamente los siguientes requisitos o propiedades.

1. INSESGABILIDAD

Sea un estimador cualquiera ˆ del parámetro , entonces se dice que es INSESGADO sii

La E

 

ˆ ó E

ˆ

0 2. CONSISTENCIA

Se dice que un estimador insesgado es consistente sii a) Lim

 

n

Eˆ

b)

 

n

V

límˆ 0 3. EFICIENCIA

Considerando todos los posibles estimadores insesgados de un parámetro , será eficiente aquel que tiene mínima varianza, llamándose también estimadores de mínima varianza del parámetro .

Sean dos estimadores insesgados ˆ1 yˆ2de

si      

 

1

ˆ ˆ ˆ

ˆ

2 1 2

1

V

ó V V

V el estimador ˆ1es mas eficiente que ˆ2 4. ERROR CUADRÁTICO MEDIO (MSE) ˆ

Sea un estimador ˆGx1,x2...xn un ˆ de

 ˆ Eˆ 2 Var ˆ E ˆ2

MSE

cuando el estimador es insesgado MSE ˆ Var ˆ

EFICIENCIA RELATIVA Sean dos estimadores ˆ1 yˆ2 con MSE ˆ1 y MSE ˆ2

la eficiencia relativa de ˆ2respecto de ˆ1se define como:

  ˆˆ2 1 1 SI MSE MSE

ˆ2

es mas eficiente que ˆ1

(5)

Ejemplo

Se tienen 2 v.a o dos poblaciones X1 y X2 distribuidas independientemente X1

 

 1  1 2

2 2 ;

,

2 E X V X I

X2

 

 2  2 2

2 4 ;

,

4 E X V X

I

Donde es el parámetro poblacional en cuestión; para ello se proponen 2 estimadores:

5 10

;ˆ 8 4

ˆ1 X1 X2 2 X1 X2

Cual de los 2 estimadores es el mejor, elija de acuerdo alas propiedades de un buen estimador

SOLUCIÓN

1) INSESGABILIDAD sabemos queE ˆ

Para el 1er estimador ˆ1 Para el 2do estimador ˆ2

     1  2

2 1 2

1 2

1

5 1 10

1 5

; 10 8

1 4

1 8

4 X X E X E X

E X

E X

X E

E X 







    1 esinsesgado    4 ˆ2esinsesgado 5

2 1 10

; 1 4 ˆ

8 2 1 4

1

EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza

 

 1  1  2 2

1 1

64 1 16

ˆ 1

8 4 ˆ

X V X

V V

X V X

V

;

 

 2  1  2 2

1 2

25 1 100

ˆ 1

5 10 ˆ

X V X

V V

X V X

V

   2 2

2 2

2

1 100

ˆ 5 64

5 64

1 16

ˆ 1

V

V

   

1 2

2 2

ˆ 1 ˆ

5625 . 1 100

5 64

5

V V

como El estimador ˆ2es mas eficiente que ˆ1

2) CONSISTENCIA Deben satisfacer 2 requisitos

a) Lim

   

n n

V lím ó

Eˆ ˆ 0

 

n

n

límE ˆ1 lim ;  

n

n

límE ˆ2 lim

 

ˆ1 lim 645 2 52 0

n n

límV ;

 

ˆ2 lim 1005 2 52 0

n n

límV significa que ambos estimadores son consistentes

(6)

MÉTODO DE ESTIMACIÓN PUNTUAL

La estimación puntual se lo puede realizar principalmente por 2 métodos:

1) mediante la máxima verosimilitud 2) mediante los momentos

3)

1) METODO DE LA MÁXIMA VEROSIMILITUD (M.V.)

Este método se fundamenta en el principio de elegir el valor del parámetro a estimarse para el cual f(X1,X2,...Xn;)es la probabilidad conjunta de obtener los valores muestrales es una función máxima.

De acuerdo a este método se obtiene estimadores a) suficientes

b) insesgados y de mínima varianza c)

DEFINICIÓN

Sea una v.a. X cuya función de probabilidad: f(X, ) depende del parámetro que se desconoce, para ello se toma una m.a. tamañon:X1,X2,...Xncuyos valores X1,X2,...Xn la función verosimilitud de la m.a. se define

   , ,... ,  ,  , ... ,,

2 1 1

2

1 X X f X f X f X f Xi

X f V

n

n i

n

, si X es continuo

   , ,... ,  ,  , ... ,,

2 1 1

2

1 X X p X p X p X p Xi

X p V

n

n i

n

, si X es discreta

El método de M.V. consistente en tomar como valor estimado , el valor que maximice la v ( ) para ello se debe logaritmizar

  ln  ,

lnV f x

L

luego se debe derivar e igualar a 0

 

0

ln



S x f

L S i

Nota.- Cuando la distribución de probabilidad tiene varios parámetros desconocidos, se obtendrán tantas ecs. Como parámetros estimar

Así si se tiene K parámetros a estimar 1,2...k 0

...

: 0 0

2 1

k

L L

L







Ejemplo

Obtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a. x~Bernoulli, mediante el método de la M.V.

SOLUCIÓN

Sabemos que x~B(1,p) donde

P(x)=px(1 p)1x; x=0.1 donde 0<p<1

(7)

Sea una m.a. tamaño n:X1,X2,...Xncuyos valores x1,x2,...xndonde 1) x~B(1,p) p

xi,p

pxi(1p)1x1;i 1,2,...n

2)        

n xi xi xi xi

i i n

i p x p p p p p

p

V 1 1

1

1 , 1, 1

3) aplicando logaritmos L V

 

p x p n X

p

n

i i

i

 

1 ln ln

ln

1

4) derivando con respecto a p e igualando a cero  1 0

1

 

p x n p

x p

L i i

5) Resolviendo la ecuación

x n p

p x x n p

x n p

x x n p

p p

x n p

x

i

i

i i

i i

i

 

 

ˆ 1 ˆ

1 1 1

1 ; 1

2) MÉTODO DE LOS MOMENTOS

Este método consiste en igualar los primeros momentos muestrales originales con los primeros momentos poblacionales originales v' Mv'

Donde Mv' E

 

xr

xr

xrpxi,1,2...k:v1,2,...k

 

n

x x E M

v r i

v

'

xdx

f

x i k

Rx v

v

'

, 1, 2...

Ejemplo

Sea una m.a. tamaño n:X1,X2,...Xnde una población X con distribución POISSON con parámetro Se pide estimar .mediante el método de los momentos

SOLUCIÓN

Como solo se debe estimar un solo parámetro, solo debemos hallar los primeros momentos originales poblacionales y muestrales e igualarlos

Sabemos 1' E(X);M1'

Xn1 X

Igualando 1' M1'ˆX

(8)

ESTIMACION POR INTERVALOS DE CONFIANZA INTRODUCCION

La estimación puntual aunque reúna todas las propiedades de una buena estimación (insesgamiento, consistencia, eficiencia) adolece de una desventaja y es que no nos proporciona ningún nivel de significación y/o de confianza. Por lo tanto es necesario recurrir a otro tipo de estimación que nos permite algún nivel de significación que es la estimación por intervalos de confianza.

INTERVALO ALEATORIO

Es aquel intervalo que tiene por lo menos uno de sus extremos una variable aleatoria.

INTERVALO DE CONFIANZA (IC)

Sea una v.a. o una población X cuya DISTRIBUCIÓN de probabilidad: f(X; ) donde el

se desconoce

Se toma una m. a. de tamaño n: X1, X2 ,....Xn cuyos valores : x1, x2 ,....xn del que se toman 2 estadísticas 1= G (X1, X2 ,....Xn); 2= G (X1, X2 ,....Xn) tal que1<2: para los cuales se cumple: P12100v%100(1)%

donde

v= nivel de confianza 100%

= nivel de significancia0%

1= limite inferior del IC para el parámetro

2=limite superior del IC para el parámetro

NIVEL DE CONFIANZA (r) Y NIVEL DE SIGNIFICACION

La elección de los niveles de confianza y/o de significación depende del investigador los que generalmente son:

r= 0.90 0.95 0.975 0.98 0.99

= 0.10 0.05 0.025 0.02 0.01

(9)

CLASES DE INTERVALOS DE CONFIANZA

De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. o una población X con DISTRIBUCIÓN de probabilidad fX;del que se toma una m.a.

tamaño n

1= G (X1, X2 ,....Xn); 2= G (X1, X2 ,....Xn) tal que1<2

tenemos:

1. BILATERAL 1;2 óP12=100v%

2. UNILATERAL INFERIOR1 óP1=100v%

3. UNILATERAL SUPERIOR;2 óP2=100v%

NOTA.- Para construir un IC para es necesario a) Elegir el nivel de confianza r1: (99%, 95%, 90%) ó

Elegir el nivel de significancia 0: (1%, 3%, 10%) b) Hallar 2 estadísticos 1y2tal que 1 2

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( ) CUANDO SE CONOCE LA VARIANZA POBLACIONAL

 

2 EN MUESTRAN GRANDES n30

Sea una v.a. o una población X

,2

donde se desconoce , pero se conoce

 

2 , se

toma una m. a. grande n30del que se estima la media X

El IC para  con

 

2 (conocido) n30=

n X Z0

ERROR

donde

 

2 1

0

Z r Z P

Z

NOTA

1. Cuando no se conoce y la m.a. n30 se utiliza S

2. Cuando XN

,2

, aun cuando n<30, la definición del IC es valida

3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe corregir el ERROR

El IC=

1

0

N n N n X Z

4. Cuando se quiere construir el IC para el total

,N;2N

 

ó P,N TOTAL2N

100v%

(10)

Ejemplo

Un analista de mercado desea estimar el ingreso per cápita familiar mensuales de una determinada población. Para ello toma una m.a de tamaño 100 de esa población la cual determinó que el promedio del ingreso familiar es de $us. 500.-. Suponiendo que el ingreso familiar mensual sigue una distribución normal con desviación típica igual a

$us. 100.-

a) Construya un IC para la media del ingreso familiar de toda esa población

b) Construya un IC para la media del ingreso familiar de toda esa población si es de 2000

c) Construya un IC para el total de ingreso familiar de toda esa población, al nivel del 95%

SOLUCIÓN

a) Sabemos que el IC para , con 2(conocida) cuando n30=

n X Z0

Donde v=0.95   0.975 1.96

2 95 . 0 1

975 . 0 0

0

PZ Z Z

Z 100 100

500

S n

X

EL ERROR = 19.6

100 ) 96 . 1 (

0 100

0

n Z s n

Z

6 . 519 6 . 19 500

; 4 . 480 6 . 19

500 2 0

0

1

n Z X S n

Z

X S

El IC para  al 95% =[480.4;519.6]óP480.4519.60.95

Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran un promedio comprendido en el intervalo y solo 10 m.a. no se están comprometido en el IC.

b) Como se conoce N=2000 IC para  al 95%

1

0

N n N n X Z

ERROR=  

11 . 1 19 2000

100 2000 100

96 . 1

100

11 . 519 11 . 19 500

; 89 . 480 11 . 19

500 2

1

El IC para  al 95% =[480.89; 519.11]óP480.89519.110.95

c) El IC para el total al 95%=,N;2N  480.89(2000);519.11(2000)  961780;1038220

(11)

TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA

Para determinar el tamaño de la m.a cuando se quiere estimar la media poblacional mediante el IC, se presenta 2 situaciones

a) Cuando el muestreo se hace con reposición ó cuando no se conoce la población se toma su error

n E Z0

del cual se despeja n

2 0



E n Z

b) Cuando el muestreo se hace sin reposición, es decir cuando se conoce la población, se toma su error

1

0

N n N n

Z

del cual se despeja n

) 1

2(

2 2 0

2 2 0

N E Z

N n Z

Ejemplo

Un grupo de 50 animales experimentales reciben una cierta clase de raciones por un lapso de 2 semanas. Sus aumentos de pesos arrojan los valores X=420 grs. y S=60 grs.

a) ¿Que tamaño debe tomarse, si se desea que X difiera de  por menos de 10 grs.

con 0.95 de probabilidad de ser correcto?

b) Encontrar el IC del 95% para  ? SOLUCIÓN

a) Como el ERROR=10=

2 0

0 



E

Z n S n

Z

además v=0.95 =Z0=1.96

  138.30 138 10

96 . 1

60 2

n

b) Como n=138El IC para  al 95% =  

138 961 . 1 42060

420 10.0108 409.99;430.0108

7473 . 11

6 .

420 117





O =P( 409.99 ≤ ≤ 430.0108) = 0.95

(12)

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE 2 POBLACIONES CON DESVIACIONES TÍPICAS CONOCIDAS MUESTRALES GRANDES n,m30

Sean 2 v.a. independiente ó 2 poblaciones, de las cuales se desconocen sus media, pero se conocen sus varianzas o desviaciones típicas se quiere estimar, mediante un IC del 100v% la diferencia de sus medias

 x y

; de las cuales se toman 2 m.a. ;grandes y luego se obtienen sus medias respectivas

Y m tamaño a

m Y

X n tamaño a

m

X x y y y

30 .

.

) .~(

30 .

.

)

.~( 2 2

El IC para  

yal v x y Z nx my

x

2 2 0

% 100

Donde Z0 se obtiene mediante la  

2 1

0

Z v Z

P

NOTA

1) Si XN

x2x

y YN

y2y

conocidos x2 yy2 aun cuando las muestras son pequeñas n. m <30 la definición anterior es válida

2) Si no se conoce, 2x y2y, pero se tienen muestras grandes

El IC para  

m

S n Z S y

x x y

v al y x

2 2 0

%

100

Ejemplo

Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida media de 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca “B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:

a) Un IC del 95% para la diferencia de la vida media de las poblaciones A y B b) Un IC del 99% para la diferencia de la vida media de ambas poblaciones SOLUCIÓN

Como x=140 : Sx=10 con n=200 de la marca “A”

y=125 : Sy=9 con m=120 de la marca “B”

(13)

a) r=0.95 =Z0=1.96 =El IC para  

m

S n Z S y x

al x y

y x

2 2

% 0

95

1246 . 2 ) 08401 . 1 ( 120 196

9 200 96 10 . 1

2 2 2

2

0

m

S n Z S

E x y

14012515

y

x El IC para xyal95%152.1246

12.88xy 17.12

b) r=0.99   0.995 2.575 2

99 . 1

995 . 0

0

PZ Z Z

E=(2.575(1.0840)=2.7913

El para xyal 99%=[152.7913]=[12.2087;17.7913]=[12;18]

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, MUESTRA GRANDE n30Sea una v.a ó una población Xb(n,p) donde se desconoce la proporción poblacional p, se toma una m.a tamaño grande n30: X1 ,X2 ,....Xn del cual se estima la proporción

n x n

pˆ x

i

El IC para “p” al 100v%=

n

q Z p

pˆ 0 ˆˆ donde  

2 1

0 0

Z v Z P

Z

NOTA

Cuando el muestreo es SIN REPOSICIÓN de una población finita se debe corregir el modulo error con

1

N

n N

El IC para “p” al 100v%=

1 ˆ ˆ 0 ˆ

N n N n

q Z p

p

Ejemplo

Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieron su preferencia por una determinada marca de CPU

a) Hallar el IC del 95% para la proporción “p” de preferencia de dicha marca de CPU b) Si la proporción de preferencia se estima en 0.6 determine el error máximo de

estimación, si se quiere confianza del 98%

Referencias

Documento similar

[r]

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

You may wish to take a note of your Organisation ID, which, in addition to the organisation name, can be used to search for an organisation you will need to affiliate with when you

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

mediante máquina herramienta) que consiste en deslizar una hoja de sierra hacia adelante y hacia abajo para realizar un corte en el material... Consiste en girar una herramienta

[r]

SECUNDARIA COMPRENDE LOS