• No se han encontrado resultados

ESTADÍSTICA 1 o CC. Ambientales Tema 3: Estimación puntual y por intervalos

N/A
N/A
Protected

Academic year: 2022

Share "ESTADÍSTICA 1 o CC. Ambientales Tema 3: Estimación puntual y por intervalos"

Copied!
43
0
0

Texto completo

(1)

ESTAD´ISTICA 1

o

CC. Ambientales Tema 3: Estimaci´ on puntual

y por intervalos

I Muestra aleatoria. Inferencia estad´ıstica param´etrica I Estimaci´on puntual

I Intervalos de confianza

I Distribuciones asociadas a la normal

I Intervalos de confianza en poblaciones normales I Intervalos de confianza para otras distribuciones

(2)

Muestra aleatoria Inferencia estad´ıstica param´ etrica

Inconveniente:La distribuci´on de probabilidad de la v.a. X de inter´es suele ser desconocida.

Objetivo:Estudiar una v.a. num´erica X en una poblaci´on a partir de la informaci´on contenida en una muestra aleatoria de individuos de esa poblaci´on.

Una muestra aleatoria (simple) de tama˜no n de X es una colecci´on X1, . . . , Xn tal que

• cada Xi tiene la misma distribuci´on de probabilidad que X ;

• las v.a. X1, . . . , Xn son independientes entre s´ı.

Extraeremos informaci´on acerca de la distribuci´on de probabilidad de X , que es desconocida, a partir de la muestra X1, . . . , Xn de X .

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 2

(3)

Simplificaci´on del problema → Estad´ıstica param´etrica:

Supondremos que la distribuci´on de probabilidad de X pertenece a una familia param´etrica de distribuciones concreta (Poisson, normal, . . . ). En este caso, para determinar totalmente la distribuci´on de X solo queda especificar el valor de uno o varios par´ametros (λ para la Poisson, µ y σ para la normal).

Los par´ametros que nos van a interesar en este curso son:

• Media y Varianza poblacional(µ y σ2) cuando X ∼ N(µ, σ).

• Proporci´on p de individuos de una poblaci´on que presentan cierta caracter´ıstica.

• Media poblacional(λ) cuando X ∼ Poisson(λ).

(4)

Notaci´on en inferencia param´etrica:

Par´ametro: θ

Espacio param´etrico: Θ, conjunto de posibles valores del par´ametro Si X es discreta: funci´on de masa Pθ.

Si X es continua: funci´on de densidad fθ.

Partes de la inferencia param´etrica:

• Estimaci´on puntual:Estimar los par´ametros desconocidos a partir de la informaci´on de la muestra aleatoria X1, . . . , Xn.

• Estimaci´on por intervalos de confianza

• Contrastes de hip´otesis param´etricas

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 4

(5)

Estimaci´ on puntual

Unestimador puntual, ˆθ, de un par´ametro θ es una funci´on real de la muestra, X1, . . . , Xn, que aproxima el valor de θ. Es aleatorio.

Unaestimaci´on (puntual) es el valor num´erico concreto que toma un estimador al ser aplicado a una realizaci´on muestral x1, . . . , xn concreta observada.

Tanto el estimador como la estimaci´on se denotan utilizando el s´ımbolo:b (p.e. ˆµ, ˆσ, ˆp, ˆλ) .

Estimadores naturales de la media y varianza poblacional (µ y σ2):

• Media muestral: ˆµ = ¯X = X1+· · · + Xn

n = 1

n

n

X

i =1

Xi

• Varianza muestral: ˆσ2 = S2= 1 n− 1

n

X

i =1

(Xi− ¯X)2

(6)

Determina en estos ejemplos el par´ametro poblacional de inter´es, su correspondiente estimador y la estimaci´on a partir de los datos.

Ejemplo 3.1: Se est´a estudiando la presencia de cierto microorganismo letal en el aire. En uno de los experimentos se analizaron 35 muestras aleatorias y se observ´o que 6 de ellas conten´ıan el germen.

Ejemplo 3.2: Un laboratorio examina el contenido de azufre en un yacimiento de carb´on en Texas. Debido a imprecisiones en los aparatos, las medidas tienen distribuci´on normal. Se toman 10 muestras aleatorias del yacimiento y se analizan. La media observada es 0.88.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 6

(7)

Un mismo estimador puede tomar diferentes valores num´ericos (diferentes estimaciones), ya que su valor depende totalmente de la muestra concreta observada.

Ejemplo 3.2 (cont.):Los valores observados de azufre fueron:

0.73 0.80 0.90 1.24 0.82 0.72 0.57 1.18 0.54 1.30

¯

x= s2 =

Se vuelve al mismo yacimiento y se recogen otras muestras diferentes, obteni´endose los siguientes contenidos en azufre:

1.56 1.22 1.32 1.39 1.33 1.54 1.04 2.25 1.49 1.28

¯

x= s2 =

(8)

Antes de la observaci´on:

X1, . . . , Xn−→

 X¯ S2

T = T (X1, . . . , Xn)

son v.a.’s

Si tomo observaciones concretas de la poblaci´on:

x1, . . . , xn−→

¯ x s2

t = T (x1, . . . , xn)

son n´umeros.

Si tomo nuevas observaciones de la poblaci´on:

˜

x1, . . . , ˜xn−→

¯˜x

˜ s2

t˜= T (˜x1, . . . , ˜xn)

son otros n´umeros.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 8

(9)

Sea X1, . . . , Xn una muestra aleatoria de una poblaci´on X cuya distribuci´on de probabilidad es conocida pero depende de un par´ametro desconocido θ = (θ1, . . . , θk).

Objetivos de la estimaci´on puntual:

• Aproximar/estimar el valor de θ mediante estimadores ˆθ.

• Estudiar m´etodos para hallar estimadores.

• Decidir qu´e estimadores son razonables.

Si X es una v.a. discreta, lafunci´on de masa de la muestraes:

P(x1, . . . , xn) = P{X1= x1, . . . , Xn= xn} = P(x1)· · · P(xn) Si X es continua con densidad f ,la funci´on de densidad de la muestraes:

f(x1, . . . , xn) = f (x1)· · · f (xn)

(10)

Construcci´on de estimadores puntuales 1. M´etodo de los momentos

El estimador por elm´etodo de los momentos, ˆθ= (ˆθ1, . . . , ˆθk), se obtiene al resolver el sistema













Eθ[X ] = n1Pn i =1Xi, Eθ[X2] = 1nPn

i =1Xi2,

· · ·

Eθ[Xk] = n1Pn i =1Xik

Observaci´on: Presenta el inconveniente de que la soluci´on puede no pertenecer al espacio param´etrico.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 10

(11)

2. M´etodo de m´axima verosimilitud (MV)

Dada la muestra x1, . . . , xn, la funci´on de verosimilitud es L(θ) = L(θ; x1, . . . , xn) =

 Pθ(x1)· · · Pθ(xn) si X es discreta fθ(x1)· · · fθ(xn) si X es continua Mide lo veros´ımil que es el valor de un par´ametro θ = (θ1, . . . , θk) teniendo en cuenta la muestra observada.

El estimador dem´axima verosimilitud (emv), ˆθ = ( ˆθ1, . . . , ˆθk), es el punto de m´aximo de la verosimilitud L(θ), que coincide con el punto de m´aximo de log(L(θ)).

En la pr´actica, para hallar el emv, resolvemos el sistema de ecuaciones

∂ ln(L(θ))

∂θ1

= 0 , . . . , ∂ ln(L(θ))

∂θk

= 0.

(12)

Ejemplo 3.3: Un m´etodo para estudiar las sustancias que causan mutaciones consiste en matar a ratones hembra 17 d´ıas despu´es de aparearse y examinar sus ´uteros en busca de embriones muertos.

La tabla que sigue proporciona datos de 309 hembras.

No embriones Recuento muertos de hembras

0 125

1 113

2 52

3 13

4 4

5 1

6 1

7 o m´as 0

Total 309

No embriones Frecuencia Probabilidad

muertos relativa Poisson

0 0.405 eλˆ

1 0.366 eλˆλˆ

2 0.168 eλˆλˆ2/2

3 0.042 eλˆλˆ3/3!

4 0.013 eλˆλˆ4/4!

5 0.003 eλˆλˆ5/5!

6 0.003 eλˆλˆ6/6!

7 o m´as 0 eλˆλˆ7/7!

0 1 2 3 4 5 6 7 8 9

0.00.10.20.30.4

Frecuencia relativa Distribución de Poisson

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 12

(13)

Ejemplos importantes:

Distribuci´on de X emv Bernoulli(p) pˆ= ¯x Poisson(λ) ˆλ = ¯x N(µ,σ) µ = ¯ˆ x

ˆ

σ2 = n− 1 n s2

Ejemplo 3.3 (cont.): ˆλ = ¯x = 0.91586

No embriones Frecuencia Probabilidad muertos relativa Poisson

0 0.405 0.400

1 0.366 0.367

2 0.168 0.169

3 0.042 0.051

4 0.013 0.012

5 0.003 0.002

6 0.003 0.000

7 o m´as 0 0.000

(14)

Sesgo y Error Cuadr´atico Medio

Una medida del comportamiento del estimador ˆθ es su error cuadr´atico medio(ECM)

Eh

(ˆθ− θ)2i

= Vθ(ˆθ) + (Sesgo(ˆθ))2, siendo Sesgo(ˆθ) = E (ˆθ)− θ.

Si E (ˆθ) = θ se dice que el estimador ˆθ es insesgado.

Sesgo

Sesgo(ˆθ) = E(ˆθ)− θ.

Un buen estimador debe ser insesgado o tener un sesgo peque˜no.

Estimador insesgado:

13.2. Insesgadez

Insesgadez

θ

5

θ θ Sesgo positivo:

13.2. Insesgadez

Insesgadez

θ

5

θ θ

Sesgo negativo:

13.2. Insesgadez

Insesgadez

θ

5

θ θ

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 14

(15)

Propiedades de la media muestral ¯X :

Sea X1, . . . , Xn una muestra aleatoria de una v.a. X con E (X ) = µ y varianza V (X ) = σ2.

• Si X tiene distribuci´on normal, entonces la distribuci´on de los valores que toma X¯ es tambi´en normal.

Si X ∼ N(µ, σ) =⇒ X¯ ∼ N

 µ, σ

√n

 .

• Teorema central del l´ımite (TCL): Si n es grande, la distribuci´on de ¯X esaproximadamente normal aunque X no sea normal.

Si n es grande =⇒ X¯ aprox∼ N

 µ, σ

√n

 .

(16)

Distribuci´on de la media muestral

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 16

(17)

Ejemplo 3.4: De acuerdo con la Organizaci´on Mundial de la Salud un individuo tiene sobrepeso si su ´ındice de masa corporal (IMC) es superior a 25. Se sabe que el IMC de una poblaci´on es una variable con distribuci´on normal de media µ = 26 y desviaci´on t´ıpica σ = 6. Si se seleccionan aleatoriamente 100 individuos y se calcula la media de sus IMC, ¿cu´al es la probabilidad de que esta media sea superior a 25.5?

Otras propiedades:Sea X1,· · · , Xn una muestra aleatoria de una v.a. X con media y varianza poblacional µ y σ2 respectivamente

• La media muestral ¯X es unestimador insesgado de la media de la poblaci´on: E ( ¯X) = µ.

• La varianza muestral SX2 es unestimador insesgado de la varianza de la poblaci´on: E (SX2) = σ2.

(18)

Error t´ıpico o relativo

Elerror t´ıpicode un estimador es su desviaci´on t´ıpica (o una estimaci´on de la misma).

El error t´ıpico de la media ¯X es su desviaci´on t´ıpica, se( ¯X) = σ

√n

pero en la pr´actica σ es un par´ametro poblacional desconocido.

Resulta natural estimar σ2 con la varianza muestral s2. Los programas inform´aticos proporcionan el siguiente error t´ıpico de la media muestral

se( ¯X) = s

√n.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 18

(19)

Ejemplo 1.2 (cont.): Contaminaci´on por Hg en el pescado

Estadísticos descriptivos

N Mínimo Máximo Media

Desviación estándar Estadístico Estadístico Estadístico Estadístico

Error

estándar Estadístico LONG

N válido (por lista)

171 25,2 65,0 39,971 ,6513 8,5172

171

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 19

(20)

Ejemplo 3.5: En SPSS se pueden generar observaciones aleatorias de algunas distribuciones, por ejemplo, generamos una muestra de tama˜no 20 de una N(2,1). Pinchamos en Transformar -> Calcular variable

Estadísticos descriptivos

N Media

Desviación estándar Estadístico Estadístico

Error estándar Estadístico X

N válido (por lista)

20 1,6618 ,22998 1,02850

20

Página 1

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 20

(21)

Intervalos de confianza

Sea X1, . . . , Xn una muestra aleatoria de una poblaci´on X con funci´on de distribuci´on Fθ, siendo θ un par´ametro desconocido.

Fijamos 0 < α < 1. Sea (T1, T2) un intervalo tal que Ti = Ti(X1, . . . , Xn) para i = 1, 2 y

1− α = Pθ{T1(X1, . . . , Xn) < θ < T2(X1, . . . , Xn)}

= Pθ{θ ∈ (T1, T2)}.

Entonces, para cada observaci´on (x1, . . . , xn) de la muestra, el intervalo IC0.95(θ) = (T1(x1, . . . , xn), T2(x1, . . . , xn)) es un intervalo de confianzapara θ al nivel de confianza 1− α.

Elnivel de significanciaα es la probabilidad de equivocarnos al afirmar que el par´ametro se encuentra en el IC obtenido:

α = Pθ{θ /∈ (T1, T2)}.

(22)

Construcci´on de un intervalo de confianza:

• Buscamos una cantidad pivotal para θ, que es una funci´on C(X1, . . . , Xn; θ) cuya distribuci´on no depende de θ.

Ejemplo 3.6: Sea (X1, . . . , X10) una muestra aleatoria de X ∼ N(µ, 1). Entonces una cantidad pivotal para µ es

• A continuaci´on buscamos dos valores c1 y c2 tales que Pθ{c1< C (X1, . . . , Xn; θ) < c2} = 1 − α.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 22

(23)

Ejemplo 3.6 (cont.):

• Finalmente se despeja θ de la desigualdad c1<C (X1, . . . , Xn; θ)<c2. Ejemplo 3.6 (cont.):

Para la muestra 1.7 2.1 2.3 2.4 1.9 1.6 2.0 2.1 2.1 1.8 tenemos ¯x = e IC0.95(µ) =

(24)

Habitualmente se trabaja con niveles de confianza del 90 % (α = 0.1),del 95 % (α = 0.05) y del 99 % (α = 0.01).

Si se observan 100 muestras de tama˜no n de X ∼ Fθ y se

construyen los correspondientes 100 intervalos de confianza para θ, IC1−α(θ), aproximadamente en (1− α)100 de ellos est´a el

par´ametro desconocido θ:

x1(1), . . . , xn(1) → IC(1)1−α(θ) x1(2), . . . , xn(2) → IC(2)1−α(θ) ...

x1(100), . . . , xn(100) → IC(100)1−α (θ)

Ver fichero Excel 100Ics.xlxs.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 24

(25)

Distribuciones asociadas a la normal

Son distribuciones de probabilidad de ciertos estad´ısticos construidos a partir de muestras de distribuciones normales.

La distribuci´on χ2 de Pearson

Sean X1, . . . , Xn v.a. independientes id´enticamente distribuidas (i.i.d.) con distribuci´on N(0, 1). La variable aleatoriaPn

i =1Xi2 sigue una distribuci´on χ2 de Pearson con n grados de libertad:

n

X

i =1

Xi2 ∼ χ2n

0 2 4 6 8

0 0.2 0.4 0.6 0.8 1

Densidad de la χ2n

χ21 χ22 χ23 χ24 χ25

(26)

La distribuci´on t de Student

Sean Y , X1, . . . , Xn v.a.i.i.d. con distribuci´on N(0, 1). La variable aleatoria Y

q1 n

Pn i =1Xi2

sigue una distribuci´on t de Student con n grados de libertad, tn.

−5 0 5

0 0.1 0.2 0.3 0.4

Densidad de la t

N(0,1) t5 t2

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 26

(27)

La distribuci´on F de Fisher

Sean X1, . . . , Xm, Y1, . . . , Ynv.a.i.i.d. con distribuci´on N(0, 1). La

v.a. 1

m

Pm i =1Xi2

1 n

Pn j =1Yj2

sigue una distribuci´on F de Fisher con m y n grados de libertad, Fm,n.

0 1 2 3 4 5 6

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7

Densidad de la F

F5,3

F4,6

(28)

Intervalos de confianza en poblaciones normales

Propiedad:Sea X1, . . . , Xn una muestra aleatoria de X ∼ N(µ, σ).

Entonces ¯X y S2 son v.a. independientes, X¯ ∼ N

 µ, σ

√n



, n− 1

σ2 S2 ∼ χ2n−1 y X¯− µ

S n

∼ tn−1

•Sea x1, . . . , xn una muestra de X ∼ N(µ, σ). Si σ es conocidoun intervalo de confianza para µ al nivel de confianza 1− α es

IC1−α(µ) =



¯ x− zα/2

√σ

n, ¯x+ zα/2 σ

√n



=



¯ x∓ zα/2

√σ n

 .

•Si σ es desconocido, IC1−α(µ) =



¯

x∓ tn−1;α/2

√s n

 y

IC1−α2) = (n− 1)s2

χ2n−1;α/2 , (n− 1)s2 χ2n−1;1−α/2,

! .

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 28

(29)

Ejemplo 3.7: El envenenamiento por DDT causa temblores y convulsiones. En un estudio se ha administrado una dosis de DDT a 4 ratones y se ha medido posteriormente en cada uno el periodo absolutamente refractario, es decir, el tiempo que tardan sus nervios en recuperarse tras un est´ımulo:

1.7 1.6 1.8 1.9 (en milisegundos) Asumiendo normalidad en los datos:

(a) Estima el periodo absolutamente refractario medio µ para toda la poblaci´on de ratones de la misma cepa sujeta al mismo tratamiento con DDT.

La estimaci´on de µ es la media muestral: µ≈ ˆµ = ¯x

¯

x= 1.7 + 1.6 + 1.8 + 1.9

4 = 1.75.

(30)

Ejemplo 3.7 (cont.)

(b) Halla el error t´ıpico de la estimaci´on anterior.

s2=(1.7− 1.75)2+ (1.6− 1.75)2+ (1.8− 1.75)2+ (1.9− 1.75)2

3 = 0.017

Por tanto s =

0.017≈ 0.13 y se(¯x)= sx

n = 0.13

2 = 0.065.

(c) Calcula un intervalo de confianza para µ al 90 %.

IC90 %(µ) = [1.75∓t3;0.05·0.065] = [1.75∓2.353·0.065] = [1.597 , 1.903]

es decir, 1.597≤ µ ≤ 1.903 con un nivel de confianza del 90 %.

(d) Calcula otro intervalo, pero ahora con un nivel del 95 %.

IC95 %(µ) = [1.75∓t3;0.025·0.065] = [1.75∓3.182·0.065] = [1.543 , 1.957]

es decir, 1.543≤ µ ≤ 1.957 con un nivel de confianza del 95 %.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 30

(31)

Ejemplo 3.8: Un aumento de la concentraci´on de colesterol en la sangre contribuye a dificultar su circulaci´on y, a la larga, producir enfermedades card´ıacas y circulatorias graves. Se ha recogido una muestra aleatoria de siete personas con niveles de Colesterol LDL

1.5 2.1 1.9 2.3 2.5 3.2 3.0 (dg /dl)

Utilizando estos datos, construye un intervalo de confianza al 90 % para la desviaci´on t´ıpica.

Nota:suponer normalidad en los datos.

(32)

Ejemplo 3.5 (cont.):Con SPSS calculamos un IC de la media para los datos generados de una normal

Descriptivos

Estadístico Error estándar

X Media

95% de intervalo de confianza para la media

Límite inferior Límite superior Media recortada al 5%

Mediana Varianza Desviación estándar Mínimo Máximo Rango Rango intercuartil Asimetría Curtosis

1,6618 ,22998

1,1805 2,1432 1,6366 1,6712 1,058 1,02850 ,14 3,63 3,49 1,53

,305 ,512

-,523 ,992

Página 1

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 32

(33)

•Sean x1, . . . , xm e y1, . . . , yn muestras independientes de X ∼ N(µ1, σ) e Y ∼ N(µ2, σ) respectivamente (σ desconocido).

Entonces

IC1−α1− µ2) = x¯− ¯y ∓ tm+n−2;α/2sp

r 1 m +1

n

! ,

donde la varianza combinada

sp2 = (m− 1)s12+ (n− 1)s22

m+ n− 2

es una media ponderada de las cuasivarianzas muestrales

s12= 1 m− 1

m

X

i =1

(xi − ¯x)2 y s22 = 1 n− 1

n

X

i =1

(yi− ¯y)2.

(34)

Ejemplo 3.9: Se quiere comparar la grasa corporal (en kg) entre nadadoras y corredoras ol´ımpicas. Se observan los siguientes datos:

Corredoras Nadadoras

11.2 7.6 8.2 9.2 14.1 12.7 9.2 10.7 10.1 7.3 3.7 5.5 15.1 13.7 8.7 14.3

9.4 6.9 8.3 5.0 11.4 11.9

Suponiendo que estas variables siguen distribuciones normales homoced´asticas, calcular un intervalo de confianza para la diferencia media de grasa entre ambos tipos de deportistas.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 34

(35)

•Sean x1, . . . , xm e y1, . . . , yn muestras aleatorias independientes de X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) respectivamente (σ1 y σ2

desconocidas). Entonces IC1−α

 σ12 σ22



=

 s12/s22 Fm−1;n−1;α/2

, s12/s22 Fm−1;n−1;1−α/2

 .

Observaci´on: Fm;n;1−α = 1 Fn;m;α

Ejemplo 3.9 (cont.):Suponiendo que la distribuci´on de la grasa corporal en nadadoras y corredoras es normal con distintas medias y distintas varianzas, calcular un intervalo de confianza al 90 % para el cociente de las varianzas.

(36)

•Datos emparejados:Sea (X1, Y1), . . . , (Xn, Yn) una muestra aleatoria de (X , Y ) donde X e Y no son independientes, pero los pares (Xi, Yi) son independientes entre s´ı.

Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos que D= X − Y ∼ N(µ = µ1− µ2, σ). Entonces

D1 = X1− Y1, . . . , Dn = Xn− Yn es una muestra aleatoria de D.

Podemos construir intervalos de confianza para µ = µ1− µ2 y para σ como se indic´o en la p´agina 28.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 36

(37)

Ejemplo 3.10: Ensayo cl´ınico cruzado.Se quiere comparar el efecto X de un nuevo medicamento con el efecto Y de otro ya comercializado. Se administran ambos a 14 personas con

insuficiencia respiratoria, asignando aleatoriamente a cada paciente un tratamiento, y manteni´endolo durante un mes. Luego se le da el tratamiento alternativo durante otro mes. En la cuarta semana de cada tratamiento se observa FEV1 (forced expiratory volume), el volumen de aire que un paciente expulsa en un segundo, tras una inhalaci´on profunda.

Paciente X Y D Paciente X Y D

1 2.9 3.9 -1.0 8 3.9 2.4 1.5

2 4.0 3.9 0.1 9 2.5 3.6 -1.1

3 3.4 3.3 0.1 10 6.5 2.1 4.4

4 3.2 4.3 -1.1 11 5.5 4.0 1.5

5 3.8 3.2 0.6 12 4.0 3.9 0.1

6 5.2 3.5 1.7 13 5.3 4.0 1.3

7 3.9 2.7 1.2 14 4.3 2.3 2.0

Calcular un intervalo de confianza al 90 % para la diferencia media de FEV1 con ambos medicamentos.

(38)

Intervalos de confianza para otras distribuciones

Intervalo de confianza para el par´ametro p de una Bernoulli Sea x1, . . . , xn una muestra de X∼Bernoulli(p). Entonces

IC1−α(p) = x¯∓ zα/2

rx(1¯ − ¯x) n

!

(para n grande)

Intervalo para diferencia de proporciones de Bernoullis Sean x1, . . . , xm e y1, . . . , yn muestras de X ∼ Bernoulli(p1) e Y ∼ Bernoulli(p2) respectivamente, tal que ˆp1 = ¯x y ˆp2 = ¯y.

Entonces, para m y n grandes, IC1−α(p1− p2) = x¯− ¯y ∓ zα/2

rx(1¯ − ¯x)

m +y¯(1− ¯y) n

!

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 38

(39)

Ejemplo 3.11: Koshy et al. (2010)1 estudian el efecto del tabaquismo de los padres sobre el ´ındice de masculinidad, tambi´en llamado raz´on de sexo, la raz´on de hombres por mujeres en un determinado territorio, expresada en tanto por ciento. Para ello toman una muestra de 363 nacimientos de padres fumadores cr´onicos (ambos) en la que 158 beb´es fueron varones y el resto ni˜nas. Calcular un intervalo de confianza para la proporci´on de varones nacidos de ambos padres fumadores cr´onicos.

1Koshy et al. (2010). Parental smoking and increased likelihood of female births. Annals of Human Biology.

(40)

Ejemplo 3.12: Un laboratorio farmac´eutico desarrolla un nuevo medicamento para prevenir los resfriados. La compa˜n´ıa afirma que el producto es igual de efectivo en hombres que en mujeres. Para comprobarlo observan una muestra de 100 mujeres y 200 hombres sobre los que prueban el medicamento. Al final del estudio un 38 % y un 51 % respectivamente de las mujeres y hombres de la muestra se hab´ıan resfriado.

Calcular un intervalo de confianza al 95 % para la diferencia entre la proporci´on de mujeres y la de hombres que se resfr´ıan a´un habiendo tomado el medicamento.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 40

(41)

Intervalo de confianza para el par´ametro λ de una Poisson Sea x1, . . . , xn una muestra de X ∼ Pois(λ). Recordemos que E(X ) = V (X ) = λ y ˆλ = ¯x. Entonces, para n grande,

IC1−α(λ) = x¯∓ zα/2

r ¯x n

! .

Ejemplo 3.3 (cont.):Calcular un intervalo de confianza al 95 % para el par´ametro λ.

(42)

M´ınimo tama˜ no muestral

El error cometido al estimar un par´ametro θ mediante un intervalo de confianza IC1−α(θ) es la semi-amplitud del intervalo.

Observaci´on: Esta definici´on tiene sentido principalmente en intervalos del tipo IC1−α(θ) = (ˆθ∓ semilongitud).

Objetivo:Determinar el m´ınimo tama˜no muestral n necesario para que el error cometido al estimar θ mediante un intervalo de

confianza sea menor que una cierta cantidad.

Motivaci´on: Queremos que la estimaci´on por intervalo de confianza tenga una determinada precisi´on.

El valor de n obtenido debe tomarse como orientativo,

especialmente cuando la semilongitud del intervalo dependa de la muestra observada.

Estad´ıstica (Ambientales). Profesora: Amparo Ba´ıllo Tema 3: Estimaci´on puntual y por intervalos 42

(43)

Ejemplo 3.13: Se quiere estimar la proporci´on de manat´ıes en el Caribe que han sido heridos por h´elices de barcos. ¿A cu´antos manat´ıes tendremos que examinar para asegurar que la estimaci´on tiene un error m´aximo del 10 % con un nivel de confianza del 95 %?

Referencias

Documento similar

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

You may wish to take a note of your Organisation ID, which, in addition to the organisation name, can be used to search for an organisation you will need to affiliate with when you

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)