Universidad Autónoma de Madrid Probabilidad y Estadística

Texto completo

(1)

Propuesta de Problemas 7 (Soluciones)

1. a) Y es el promedio al sacar dos boletos con reposici´on de Y y hacer su promedio. Por eso, puede tomar los valores 1, 1.5 y 2. Tenemos que,

P(Y = 1) = P( 1 1 ) = 654 2584 654 2584 = 427716 25842 ≈6.41 %, P(Y = 1.5) = 2 P( 1 2 ) = 2654 2584 1930 2584 = 2524440 25842 ≈37.81 %, P(Y = 2) = P( 2 2 ) = 1930 2584 1930 2584= 3724900 25842 ≈55.79 %,

luego su caja queda

Y = 427716 1 2524440 1.5 3724900 2 .

Para X hacemos lo mismo. Su rango ser´ıa 0, 1, 2, 3, 4, y calculado probabilidades vemos que X = 14615329 0 18732700 1 19620026 2 8726900 3 3171961 4 .

En el caso de 2 queda as´ı porque X = 2 ocurre si sale 2 2 de X, o si sale 0 4 o 4 0 . b) Podemos usar la caja de X para hacerlo. Como vemos, el ´unico boleto con menos unidades

que 3 es 4 . Por tanto, la probabilidad que nos piden ser´ıa 8726900 + 3171961

14615329 + 18732700 + 19620026 + 8726900 + 3171961 ≈18.34 %.

c) De nuevo se har´ıa calculando la funci´on de masa de X − Y . Podemos usar las cajas de X y Y . As´ı, ser´ıa como sacar un boleto de X y restarle otro sacado de Y . Su rango es

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 3. S´olo me falta el n´umero de boletos de cada uno. Por ejemplo, como

P(X − Y = −2) = P(X = 0 y Y = 2) =14615329 A 3724900 B = 54440638992100 AB con A y B los n´umeros totales de boletos en X e Y . De la misa forma,

P(X−Y = −1) = P(X = 0 y Y = 1)+P(X = 1 y Y = 2) = 14615329 ∗ 427716 + 18732700 ∗ 3724900 AB

que queda 76028644288564/AB. Continuando con esos c´alculos, la caja de X − Y tendr´a los siguientes boletos:

(2)

15547872289300 2 8007425226840 2.5 1356698471076 3 . Por supuesto, si hab´eis aproximado la caja os puede quedar con menos boletos. Por tanto, P(X−Y ≥ 1) = 40898628850616 + 22030535436000 + 15547872289300 + 8007425226840 + 1356698471076 AB que da aproximadamente 20.28 %. d ) Tenemos que SX= √ (X1−X)2+ (X2−X)2 2 − 1 = √ (X1− X1+X2 2 ) 2+ (X 2− X1+X2 2 ) 2= √ 2(X2−X1 2 ) 2

luego podemos escribirla sencillamente como SX=

∣X2−X1∣ √

2 ,

es decir, la diferencia entre los dos boletos sacados dividida por √

2. As´ı, el rango queda 0, 2/

√ 2 y 4/

2, que podemos escribir como 0 √ 2 = 1.4... √ 8 = 2.8... Tenemos que P(SX=0) = P( 0 0 ) + P( 2 2 ) + P( 4 4 ) = 38232 80542+ 24502 80542+ 17812 80542 = 23789790 80542 , P(SX= √ 2) = 2P( 2 0 ) + 2P( 4 2 ) =27459600 80542 , P(SX= √ 8) = 2P( 4 0 ) = 13617526 80542 , luego SX = 23789790 0 27459600 1.4.. 13617526 2.8.. . Por el c´alculo que hemos hecho para SX, tenemos que

CY = Y1+Y2 2 −µY ∣Y1−Y2∣ 2 / √ 2 = Y1+Y2−2 ∗ µY ∣Y1−Y2∣ = Y1+Y2−2 ∗4514 2584 ∣Y1−Y2∣ = Y1+Y2−3.49 . . . ∣Y1−Y2∣ .

Por tanto, su rango es

(3)

P(CY = −0.49 . . .) = 2 P( 1 2 ) = 2 654 2584 1930 2584= 2524440 25842 , P(CY = ∞) =P( 2 2 ) = 1930 2584 1930 2584= 3724900 25842 , luego CY = 427716 -Inf 2524440-0.4.. 3724900 Inf .

2. a) No, ya que cuando obtenemos que((no hay evidencia)) estamos diciendo que no podemos decir nada concluyente. Para ver si el medicamento no es efectivo deber´ıan hacer un test distinto y ver lo que sale.

b) En principio no tiene sentido, ya que no hay un proceso de azar controlado. La informaci´on sobre los 50 pacientes la vamos a saber completa, pero no podemos extrapolar esos resultados al conjunto de enfermos (a no ser que supongamos que los 50 enfermos del hospital es como si hubieran sido elegidos al azar de entre la poblaci´on de enfermos).

c) Podemos casi descartar que los resultados se hayan debido a la suerte, pero no podemos asegurar que el experimento est´e bien hecho (si lo estuviera, entonces s´ı podr´ıamos estar casi seguros de que ciertas part´ıculas alcanzan velocidades superiores a la de la luz), ya que eso no depende del azar.

d ) Primero vamos a calcular la t para la cu´al P(∣Td∣ ≤t) = 95 %. En este caso, usando la f´ormula queda d = 81, y como P(∣T81∣ ≤1.99) ≈ 95 %, tenemos que t ≈ 1.99. Por tanto, las µs que van a estar en el intervalo de confianza son

∣ 5.6 − 5.0 − µ √ 4.12/40 + 3.82/50∣ = ∣ x − y − µ √ s2 x/n + s2y/m ∣ <1.99

es decir, el intervalo para la media de la Facultad de Ciencias menos la de la de Letras queda 0.6 ± 1.99 ∗ 0.84 ≈ 0.6 ± 1.68 = (−1.08, 2.28).

Si lo hab´eis hecho con la Z queda esencialmente lo mismo.

Para comprobar la fiabilidad del intervalo calculado, deber´ıamos pintar histogramas para ambas muestras (para ver que queden m´as o menos centrados).

3. a) El modelo que asumen es que las temperaturas de las 10 bobinas que construyan es como si las sacasen al azar de entre la poblaci´on de temperaturas de las 1000 bobinas que construir´ıan posteriormente (al menos en cuanto a la temperatura que alcanzar´ıan en ese proceso); adem´as, asumen que dicha poblaci´on de temperaturas de las 1000 bobinas tendr´a un histograma aproximadamente centrado.

b) Por una parte, tenemos que P(T9 ≤ −2.82)) ≈ 1 %. Por otra, el cociente de los datos de la

(4)

c) Deber´ıan ver si los datos de la muestra son razonables para el modelo que se ha usado. Para ver si es razonable suponer que es como si se hubieran sacado al azar, pintamos un diagram de dispersi´on (con respecto a la posici´on en que fueron constru´ıdas), y queda

● ● ● ● ● ● ● ● ● ● 2 4 6 8 10 125 130 135 140 145 150 155 160 Index m uestr a1

Aunque haya un dato alejado de los dem´as, no se ven tendencias, as´ı que en principio no ver´ıamos problemas en esa hip´otesis.

Para ver si la poblaci´on de temperaturas de bobinas puede ser centrada, pintamos el histo-grama de los datos de la muestra:Histogram of muestra1

muestra1 Density 120 130 140 150 160 170 0.00 0.01 0.02 0.03 0.04 0.05

(5)

asumir que la poblaci´on es centrada.

El cliente no deber´ıa fiarse de las conclusiones de GE. Deber´ıa pedir a GE que revisara su proceso de construcci´on (o cambiar de proveedor).

d ) En este caso, el histograma queda razonableHistogram of muestra2

muestra2 Density 115 120 125 130 135 140 145 150 0.00 0.01 0.02 0.03 0.04

pero en el diagrama de dispersi´on

● ● ● ● ● ● ● ● ● ● 2 4 6 8 10 115 120 125 130 135 140 145 150 Index m uestr a2

vemos que hay una clara tendencia ascendente en los datos, por lo que no es razonable pensar que son datos sacados al azar.

(6)

as´ı las bobinas que construyan despu´es se van a calentar m´as que las de ahora. 4. a) Por una parte, tenemos que P(χ24≥9.49) = 5 %. Por otra,

( 23/40 − 136/200 √ 136 200 64 200/40 )2+ ( 30/40 − 136/200 √ 136 200 64 200/40 )2+ ( 18/40 − 136/200 √ 136 200 64 200/40 )2+ +( 28/40 − 136/200 √ 136 200 64 200/40 )2+ ( 37/40 − 136/200 √ 136 200 64 200/40 )2≈23.76.

Como 23.76 ≥ 9.49, la conclusi´on es que s´ı hay evidencia de que hay diferencia educativas entre las provincias.

b) Aunque dicho m´etodo usa azar, no es como sacar boletos de una caja donde estuviesen todos los ni˜nos (en particular, siempre van a salir al final ni˜nos de la misma escuela). Por tanto, dicho test no ser´ıa v´alido. Con ese m´etodo, habr´ıa que dise˜nar otro test diferente (nosotros s´olo hemos visto tests para cuando seleccionamos la muestra como sacando boletos al azar de una caja).

c) En ese caso, normalmente usar´ıan el test par ver si hay evidencia de que la diferencia de proporciones p = p1−p2 es distinta de cero. Como P(∣Z∣ ≥ 1.96) = 5 %, y

∣ 23/40 − 30/40 − 0 √ 23 40 17 40/40 + 30 40 10 40/40 ∣ ≈1.68.

Como 1.68 < 1.96 la conclusi´on ser´ıa que no hay evidencia de que haya diferencias entre esas dos provincias.

d ) Numeremos a las provincias como X1, X2, X3, X4 y X5. Como hemos visto en el apartado

anterior, al hacer el test para comparar X1y X2al 5 % de significaci´on, miramos si la variable

C12= ∣ X1−X2 √ X1(1 − X1)/40 + X2(1 − X2)/40 ∣ est´a en la regi´on C12≥1.96,

que tiene una probabilidad de 5 %. De la misma forma, si queremos comparar X2 con X5,

debesos ver si C25≥1.96. Lo que queremos es saber la probabilidad de que alguno de esos tests de((S´ı)), es decir

P(C12≥1.96 o C13≥1.96 o . . . o C45≥1.96).

El problema para calcular dicha probabilidad es que por ejemplo C12 no es independiente de

C13, ya que tienen la variable X1 en com´un. Pero, como s´olo necesitamos una cota inferior,

(7)

Pero

P(C12≥1.96 o C34≥1.96) = P(C12≥1.96) + P(C34≥1.96) − P(C12≥1.96 y C34≥1.96) que por independencia queda

5 % + 5 % − 5 % ∗ 5 % = 9.75 %.

As´ı, hemos visto que la significaci´on es mayor que 9.75 %, luego mayor que 8 %.

Figure

Actualización...

Referencias

Actualización...

Related subjects :