• No se han encontrado resultados

Análisis de Datos. 1 Probabilidades. 1.1 De nición y propiedades básicas

N/A
N/A
Protected

Academic year: 2021

Share "Análisis de Datos. 1 Probabilidades. 1.1 De nición y propiedades básicas"

Copied!
11
0
0

Texto completo

(1)

Análisis de Datos

1

Probabilidades

1.1

De…nición y propiedades básicas

Consideremos el experimento consistente en realizar un tiro de ruleta. El conjunto de todos los resultados posibles del mismo, que es (“ómega”) =f0; 1; 2; :::; 36ges llamado “espacio de probabilidad”o “espacio muestral”.

Se llaman eventos a los subconjuntos de . El conjunto A = f2; 4; 6; :::; 36g es “el evento que salga número par” ; el B = f1; 2; :::; 12g es “el evento que salga primera docena”.

Las operaciones habituales con conjuntos tienen una traducción intuitiva en términos probabilísticos: la intersección A\B es el evento “A y B ocurren simultáneamente”; la unión A [ B es “ocurre al menos uno de los dos”; el complemento A0 es el evento “no ocurre A”; la diferencia A B = A\ B0 es

“ocurre A pero no B”. Si A y C son disjuntos — o sea, A \C = ;— , entonces “A y C no pueden ocurrir simultáneamente”; si A C, “siempre que ocurre A, ocurre C”.

A cada evento A se le hace corresponder un número P (A); su “proba-bilidad”. Daremos sólo una de…nición intuitiva de la misma. En el caso de la ruleta, si A es el evento de obtener número par, la manera (ideal) de de-terminar su probabilidad es realizar un gran número N de tiros, registrar la cantidad fN que sale par, y calcular la proporción de veces que salió par: la

“frecuencia relativa” fN=N: Entonces P (A) es el límite de estas frecuencias

relativas cuando N ! 1:

La probabilidad tiene las siguientes propiedades básicas: P1 0 P (A) 1 para todo evento A

(2)

P3 [Ley aditiva] Si los eventos A; B son disjuntos: P (A[ B) = P (A) + P (B):

Dibujando los conjuntos, es fácil veri…car que para el complemento A’ vale

P (A0) = 1 P (A): En particular, como 0 =;;resulta

P (;) = 0:

Se puede probar a partir de las propiedades anteriores que si A y B son cualesquiera:

P (A[ B) = P (A) + P (B) P (A\ B):

La ley aditiva se puede extender a varios conjuntos. Si A; B; C son dis-juntos (o sea, A \ B = A \ C = B \ C = ;), entonces se puede veri…car que

P (A[ B [ C) = P (A) + P (B) + P (C): (1) Realice los ejercicios de 1 a 4

1.2

Espacios equiprobables

En el caso de la ruleta, si suponemos que es equilibrada, podemos traducir esta creencia en la suposición de que los 37 resultados tienen la misma pro-babilidad (son equiprobables). En tal caso, todos tendrán propro-babilidad 1/37 (por P2 y (1)). Pero esto no es obligatorio: dicha suposición es sólo un mo-delo de entre muchos posibles; y si la ruleta estuviera cargada, seria necesario asignar otras probabilidades.

En el caso de la ruleta equilibrada “el evento de que salga número par” A = f2; 4; 6; :::; 36g tiene probabilidad P (A) = 18=37; y “el evento de que salga primera docena” B = f1; 2; :::; 12g tiene probabilidad P (B) = 12=37: En ese caso A \ B = f2; 4; 6; 8; 10; 12g es “el evento sale un número par de la primera docena”, y tiene probabilidad P (A \ B) = 6=37: El “evento sale un número par o primera docena”es A [ B y se puede calcular su probabilidad como: P (A [ B) = 18=37 + 12=37 6=37 = 24=37:

En general en un espacio de probabilidades donde todos los resultados son equiprobables, la probabilidad de un evento se calcula como el número

(3)

de resultados que forman ese evento dividido por el número de resultados de todo el espacio muestral.

También se aplica esta idea al calcular la probabilidad de que un individuo elegido en una población tenga determinada característica. Supongamos que se conoce que el 46% de los individuos de una población tienen sangre del grupo O, el 43% del grupo A, el 8% del grupo B y el 3% del grupo AB. Se elige una persona al azar en dicha población, la probabilidad de que tenga sangre grupo A es 0.43; la probabilidad de que tenga sangre grupo A o grupo B, es 0.51 (dado que tener sangre grupo A o tener sangre grupo B son eventos incompatibles o disjuntos).

1.3

Eventos independientes

Consideremos ahora dos mesas de ruleta, atendidas por croupiers distintos, y sean respectivamente A y B los eventos de que salga número par en la primera mesa y “tercera docena” en la segunda. Intuitivamente, uno supondría que el resultado de una mesa no debiera in‡uir en la otra. Esto se formaliza con la siguiente de…nición: los eventos A; B son independientes si

P (A\ B) = P (A)P (B):

Pensando nuevamente en los grupos sanguineos, si se eligen aleatoria-mente tres personas (no familiares) en esa población, el grupo sanguineo de cada una es independiente del de las otras. Entonces, la probabilidad de que las tres tengan grupo O es 0:46 0:46 0:46 = 0:097:

Por supuesto si dos eventos no son independientes, la probabilidad de que ocurran simultáneamente no es el producto. Por ejemplo, si la probabilidad de que un hombre tenga talla superior a 1.80 es 0.2, la probabilidad de que un padre y un hijo tengan talla superior a 1.80 no es 0:2 0:2, ya que las tallas de los hijos tienden a estar relacionadas con las tallas de los padres.

Realice los ejercicios de 5 a 8

2

Probabilidad condicional

Ahora estudiaremos el concepto de probabilidad condicional. Consideremos el siguiente ejemplo, se selecciona al azar un recién nacido y se realiza un análisis para diagnosticar hipotiroidismo congénito (HC), sea A el evento el

(4)

recién nacido padece HC, la P (A) es igual a la proporción de recién nacidos con HC (o prevalencia de HC en la población); ahora bien, si observamos que el recién nacido es una niña (sea B el evento el recién nacido es de sexo femenino), queremos conocer la probabilidad de que padezca HC sabiendo que es una niña, esto es la proporción de recién nacidos de sexo femenino con HC. Utilizaremos la notación P (A j B) para designar la probabilidad condicional de A dado B, (en el ejemplo la probabilidad de que el recién nacido padezca HC, sabiendo que es de sexo femenino) que se de…ne cuando P (B) > 0 como:

P (Aj B) = P (A\ B)

P (B) (2)

En este ejemplo P (A j B) > P (A), pues es sabido que el HC es más frecuente en las niñas.

Es evidente que si dos eventos A y B son independientes y con probabi-lidades no nulas, entonces P (A j B) = P (A) y P (B j A) = P (B)

Ejemplo 2.1 Supongamos que la prevalencia de una enfermedad E1 es del

10% y la de otra enfermedad E2 es del 15%, además sabemos que la

pro-babilidad de que un individuo tenga ambas enfermedades es 0.05. Si se sabe que un individuo tiene la primera enfermedad, cuál es la probabilidad de que padezca la segunda?

Si llamamos A = tiene la enfermedad E1, y B = tiene la enfermedad E2,

el enunciado dice que:

P (A) = 0:10, P (B) = 0:15 y P (A \ B) = 0:05, entonces usando (2): P (B j A) = 0:05

0:10 = 0:50

Esto signi…ca que si sabemos que el individuo padece la primera enfer-medad, esto aumenta la probabilidad de que padezca la segunda.

A partir de (2) se deduce el siguiente resultado, llamado regla de la mul-tiplicación:

P (A\ B) = P (A j B) P (B) (3)

Esta regla es importante porque en muchas situaciones se desea conocer la P (A \ B), cuando P (A j B) y P (B) son conocidas.

(5)

Ejemplo 2.2 Cuatro individuos han respondido a la solicitud de un banco de sangre. Supongamos que se necesita sangre tipo A+ y sólo uno de ellos tiene ese tipo, pero no se sabe cuál. Si los donantes potenciales se seleccionan al azar para determinar su tipo sanguíneo. Cuál es la probabilidad de que haya que determinar el tipo sanguíneo en al menos tres individuos para obtener el tipo deseado?

Llamemos B = primer donante no es A+ y A = segundo donante no es A+, sabemos que P (B) = 34 y P (A j B) = 23. El evento A \ B es “ni el primero ni el segundo son tipo A+”= “se determina el tipo en al menos tres individuos”. Usando la regla de la multiplicación:

P (A\ B) = P (A j B) P (B) = 2 3 3 4 = 1 2 Realice los ejercicios de 9 a 11

3

Fórmula de la probabilidad total. Teorema

de Bayes.

Ejemplo 3.1 En cierta comunidad, el 8% de los adultos de más de 50 años de edad padece diabetes. Se conoce que la prueba para diagnosticar esa enfer-medad tiene una sensibilidad del 95% (esto signi…ca que la probabilidad de un resultado positivo dado que el individuo está enfermo es 0.95) y la especi-…cidad es del 98% ( la probabilidad de obtener un resultado negativo dado que el individuo es sano es 0.98). Si se realiza esa prueba en un individuo de más de 50 años elegido al azar en esa comunidad, cuál es la probabilidad de que el resultado sea positivo?

Llamemos R+al evento el resultado de la prueba es positivo, R el

resul-tado es negativo, D al evento el individuo tiene diabetes y N D el individuo no tiene diabetes. Conocemos lo siguiente: Prevalencia = P (D) = 0:08, y entonces P (N D) = 0:92, Sensibildad = P (R+ j D) = 0:95, entonces P (R j D) = 0:05 Especi…cidad = P (R j ND) = 0:98, entonces P (R+ j ND) = 0:02

(6)

y queremos calcular P (R+):

En este caso, D y N D son eventos disjuntos y también D [ ND = , entonces podemos escribir:

R+ = R+\ (D [ ND) = (R+\ D) [ (R+\ ND) y aplicando la ley aditiva y la ley de la multiplicación:

P (R+) = P (R+\ D) + P (R+\ ND) =

= P (R+j D) P (D) + P (R+ j ND) P (N D) y reemplazando por los valores, tenemos:

P (R+) = 0:95 0:08 + 0:02 0:92 = 0:0944

En este ejemplo hemos utilizado la fórmula de la probabilidad total que se generaliza como sigue:

Si A1; A2;: : : ; Anson n eventos mutuamente incompatibles con P (Ai)6= 0

y que cumplen: = A1[ A2[ : : : [ An, entonces para cualquier evento B,

se cumple: P (B) = n X i=1 P (Bj Ai) P (Ai) (4)

Para demostrar esta igualdad se siguen los mismos pasos que en el ejem-plo.

Volviendo al ejemplo anterior, supongamos que al individuo elegido al azar se le realizó la prueba diagnóstica, y esta dio un resultado positivo, ¿cuál es entonces la probabilidad de que dicho individuo tenga realmente diabetes?

Ahora lo que se desea es calcular P (D j R+), si aplicamos la de…nición

de probabilidad condicional:

P (D j R+) = P (D\ R

+)

P (R+)

calculamos P (D\R+)por la regla de la multiplicación y reemplazamos P (R+),

(7)

P (Dj R+) = P (R

+

j D) P (D)

P (R+j D) P (D) + P (R+ j ND) P (N D)

Esto se suele llamar valor predictivo positivo (VPP) de una prueba di-agnóstica, es la probabilidad de que el individuo este enfermo dado que la prueba dio un resultado positivo.

En nuestro caso:

P (D j R+) = 0:95 0:08

0:0944 = 0:8051

De la misma manera se de…ne el valor predictivo negativo (VPN) de una prueba diagnóstica, que es la probabilidad de que el individuo esté sano dado que el resultado de la prueba fue negativo:

P (N Dj R ) = P (R j ND) P (N D)

P (R j D) P (D) + P (R j ND) P (N D)

En estos ejemplos hemos usado el teorema de Bayes, que dice lo siguiente: Si A1; A2;: : : ; Anson n eventos mutuamente incompatibles con P (Ai)6= 0

y que cumplen: = A1 [ A2 [ : : : [ An, entonces para cualquier evento B

tal que P (B) 6= 0, se cumple: P (Ak j B) =

P (B j Ak) P (Ak)

Pn

i=1P (Bj Ai) P (Ai)

(5) La demostración es evidente a partir de la de…nición de probabilidad condicional, la regla de la multiplicación y la fórmula de la probabilidad total.

Realice los ejercicios de 12 a 14 Realice el resto de los ejercicios

(8)

Práctica 1

1. Sea = f1; 2; 3; 4; 5; 6; 7g, E = f1; 3; 5; 7g, F = f7; 4; 6g, G = f1; 4g. Describir:

a) E \ F c) E \ G0 e) E0 \ (F [ G)

b) E [ (F \ G) d) (E \ F0)[ G f) (E \ G) [ (F \ G) 2. Sean E, F y G tres eventos, encuentre expresiones (operaciones entre

conjuntos) para:

(a) Ocurre solamente E (b) Ocurren E y G pero no F

(c) Ocurre al menos uno de los eventos (d) Ocurren los tres eventos

(e) No ocurre ninguno de los eventos (f) Ocurre a lo sumo uno de los eventos 3. Encontrar expresiones simples para los eventos:

(a) E [ E0

(b) E \ E0

(c) (E [ F0)\ (E [ F0)

4. Sean A y B dos eventos tales que:

P (A) = 0:2, P (B) = 0:3 y P (A \ B) = 0:1 Calcular: P (A[ B), P (A0 [ B0), P (A \ B0)

5. Se arrojan dos dados equilibrados; conviene suponerlos de colores dis-tintos.

(a) describa el conjunto de todos los resultados posibles y asigne prob-abilidades a cada resultado, suponiendo que son equiprobables. (b) Sea A el evento: la suma de ambos resultados es 4, y B el evento: al

menos uno de los resultados es 3. Calcule: P (A); P (B); P (A\B); P (A[ B) y P (A0[ B):

(9)

6. Se arrojan dos dados equilibrados. Sea E el evento “la suma es 7 ”, F el evento “el primer dado es 4 ”y G el evento “el segundo dado es 3 ”

(a) Mostrar que E y F son independientes (b) Mostrar que E y G son independientes.

7. Se sabe que la probabilidad de que un paciente responda al tratamiento de una afección es igual a 0.9. Si se trata a tres pacientes en forma independiente

(a) encuentre la probabilidad de que todos respondan al tratamiento (b) encuentre la probabilidad de que ninguno responda al tratamiento

(c) encuentre la probabilidad de que al menos uno responda al tratamiento. 8. Supongamos que vuelo de Bs. As. a Córdoba en la aerolinea X, y

regreso en la aerolinea Y. Sea A = fX pierde mi equipajeg y sea B = fY pierde mi equipajeg: Si A y B son eventos independientes con P (A) > P (B), P (A \ B) = 0:0002 y P (A [ B) = 0:03, determine P (A) y P (B)

9. Para el caso de varones nacidos en el estado de Arizona, la probabilidad de que el período de gestación sea menor de 37 semanas es de 0:142 y la probabilidad de que su peso al nacer sea menor que 2500 gramos es de 0:051, además la probabilidad de que esos dos eventos ocurran simultaneamente es de 0:031

(a) En el caso de un recién nacido de sexo masculino elegido al azar, sea A el evento “el período de gestación del bebé es inferior a 37 semanas” y B el evento “el peso al nacer es menor de 2500 gramos”.¿Son A y B independientes?

(b) ¿Cuál es la probabilidad de que ocurran A o B?

(c) ¿Cuál es la probabilidad de que ocurra el evento A, en el caso de que ocurra el evento B? (la probabilidad de que el período de gestación haya sido inferior a las 37 semanas, sabiendo que su peso fue inferior a 2500 gramos )

(10)

(a) encuentre la probabilidad de que un individuo elegido al azar de esa población tenga al menos una de las dos enfermedades. (b) encuentre la probabilidad condicional de que tenga ambas

enfer-medades, dado que tiene al menos una de ellas.

11. La probabilidad de sobrevivir a cierta operación de trasplante es de 0:6. Si un paciente sobrevive a la operación, la probabilidad de que su cuerpo rechace el trasplante en un mes es de 0:2 ¿Cuál es la probabilidad de sobrevivir a estas fases críticas?

12. Un bolso contiene 3 monedas, una de las cuales ha sido acuñada con dos caras y las otras dos son normales. Se elige una moneda al azar y se lanza 4 veces. Si cada vez sale cara, ¿cuál es la probabilidad de haber elegido la moneda de dos caras?

13. La prevalencia de una enfermedad en la población adulta es de 1 en 1000. Se ha desarrollado una prueba diagnóstica para detectar esa enfermedad, dicha prueba tiene una sensibilidad del 99% y una especi-…cidad del 98%. Si se hace esta prueba a un individuo seleccionado al azar en la población:

(a) encuentre la probabilidad de que el resultado sea positivo.

(b) si el resultado es positivo, calcule la probabilidad de que el indi-viduo esté enfermo.

(c) si el resultado es negativo, calcule la probabilidad de que el indi-viduo esté sano.

(d) Los resultados anteriores le resultan sorprendentes? Qué ocurriría si la prevalencia fuera de 1 en 25?

14. Una compañía de seguros clasi…ca a las personas en tres clases: de mayor riesgo, riesgo medio y riesgo bajo. Entre los asegurados actual-mente en esa compañía, 20% son de riesgo alto, 50% son de riesgo medio y 30% son de riesgo bajo. De sus registros deduce que las pro-babilidades de que una persona sufra algún accidente en un año, para cada una de estas clases, es igual a: 0.30, 0.15 y 0.05 respectivamente. Si un cliente de esa compañía no ha tenido ningún accidente durante el año de cobertura del seguro, cuál es la probabilidad de que pertenezca a la clase de bajo riesgo?

(11)

15. Un experimento estudia los efectos de temperatura, presión y tipo de catalizador para cierta reacción química. Se desea probar tres dife-rentes temperaturas, cuatro difedife-rentes presiones y cinco difedife-rentes cata-lizadores. En cada corrida experimental interviene una sola tempe-ratura, presión y catalizador.

(a) ¿Cuántas diferentes corridas experimentales son posibles?

(b) Si se eligiera al azar una posible corrida experimental ¿Cuál es la probabilidad de que en ella se utilice la temperatura más baja y una de las dos presiones más bajas?

16. Un sistema para detectar humo utiliza dos dispositivos A y B. Si hay humo, la probabilidad de que sea detectado por el dispositivo A es de 0:95, por el dispositivo B es 0:98 y por ambos es 0:94.

(a) Si hay humo, encuentre la probabilidad de que sea detectado por cualquiera de los dos dispositivos.

(b) Encuentre la probabilidad de que no sea detectado el humo. 17. En un laberinto en T, a una rata se la alimenta si vira a la izquierda

y se le aplica un choque eléctrico si vira a la derecha.. En el primer intento la probabilidad de que vire a dercha o a izquierda es la misma. Después, si recibe el alimento en el primer intento, la probabilidad de que vire a la izquierda en el siguiente intento es 0.68; y si recibe un choque eléctrico en el primer intento, la probabilidad de que vire a la izquierda en el segundo es 0.84 ¿Cuál es la probabilidad de que una rata vire a la izquierda en el segundo intento?

18. Sean A y B dos eventos tales que P (A) = 0:4, P (A [ B) = 0:7. Si P (B) = p, para qué valores de p se cumple:

(a) ¿A y B son mutuamente excluyentes? (b) ¿A y B son eventos independientes?

19. Supongamos que se elige al azar un individuo entre toda la población de adultos de sexo masculino. Sea A el evento el individuo mide más de 1.80 m, y sea B el evento el individuo es jugador profesional de basquet. ¿Cuál considera que es mayor, P (A j B) o P (B j A), y por qué?

Referencias

Documento similar