• No se han encontrado resultados

Bioestadística Probabilidad 1. La población es el conjunto de elementos en los que se desea investigar la ocurrencia de una característica

N/A
N/A
Protected

Academic year: 2021

Share "Bioestadística Probabilidad 1. La población es el conjunto de elementos en los que se desea investigar la ocurrencia de una característica"

Copied!
11
0
0

Texto completo

(1)

Probabilidad

Introducci´

on a la probabilidad

La poblaci´on es el conjunto de elementos en los que se desea investigar la ocurrencia de una carac-ter´ıstica o propiedad.

Son experimentos aleatorios: “Lanzamiento de un dado y apuntar el resultad”. “N´umero de perros que visitan el Hospital al d´ıa”. “N´umero de gatos infectados en una granja”.

Por ejemplo analizar la velocidad con la que la moneda cae al suelo no es un experimento aleatorio. Unsuceso aleatorio es cada uno de los posibles resultados de un experimento aleatorio. Que “salga 3” al lanzar un dado, es un suceso aleatorio. Que “salga par” es otro suceso aleatorio.

El Espacio Muestral es el conjunto de todos los sucesos aleatorios.

Laprobabilidad es una medida de la incertidumbre de un suceso aleatorio. Ejemplo

Se vacunan 12 perros contra la rabia, y queremos analizar cu´antos perros podr´ıan tener una reacci´on a dicha vacuna.

La poblaci´on es el conjunto de los 12 perros. El experimento aleatorio el proceso de vacunar a dichos perros y analizar su reacci´on. Un suceso aleatorio es “que haya 3 perros con reacci´on”, otro por ejemplo es “que no haya ning´un perro con reacci´on”.

El espacio muestral es{0,1,2,3,4,5,6,7,8,9,10,11,12}.

Objetivo: una medida que nos de la posibilidad de que ocurra alguno de estos sucesos.

Definici´

on de probabilidad

“Definici´on Cl´asica” En una poblaci´on conN elementos, queremos analizar los que tienen una car-acter´ıstica A. Entonces la probabilidad de la caracter´ıstica A (o bien, probabilidad de que ocurra A) es:

p(A) = casos favorables aA casos posibles en total.

“Definici´on Frecuentista”: La probabilidad de que ocurraAes la frecuencia relativa de los elementos con la caracter´ısticaA.

“Definici´on Axiom´atica”: La probabilidad es una medida de la incertidumbre de los sucesos, y tiene las siguientes propiedades:

1. La probabilidad (frecuencia relativa) de un suceso es un valor entre 0 y 1 0≤p(A)1.

2. La probabilidad (frecuencia relativa) del suceso seguroE, que ocurre siempre, es 1

p(E) = 1.

3. SiA y B son caracter´ısticas mutuamente excluyentes (no pueden darse a la vez), la probabilidad de que ocurra o bienA, o bienB es la probabilidad de la suma deAyB y se verifica (es la uni´on de dos sucesos, que llamaremos suma):

p(A+B) =p(A) +p(B).

(2)

4. ABrepresenta la intersecci´on de los sucesosAyB(que ocurran a la vez). SiAyBson cualesquiera (no mutuamente excluyentes), se tiene

p(A+B) =p(A) +p(B)−p(AB).

5. SiAC es la caracter´ıstica contraria aA(se dice suceso complementario), se tiene

p(AC) = 1−p(A).

Ejemplo

Analizamos el experimento de lanzar un dado. Calculamos algunas probabilidades: Probabilidad de que salga el n´umero 2:p(2) = 1/6.

Probabilidad de que salga un n´umero par: p(par) = 1/2. Probabilidad de que salgan 2 ´o 3:p(2 + 3) = 1/3.

Probabilidad de que salga un n´umero de 1 a 6:p(1 + 2 + 3 + 4 + 5 + 6) = 1. Probabilidad que salga el contrario a 4:p(4C) = 5/6.

Estimaci´on de probabilidades en la pr´actica

No tiene sentido hablar de probabilidades sin definir previamente la poblaci´on a la que nos referimos y los sucesos que vamos a considerar. Estas probabilidades se determinan:

1. Estudiando la frecuencia relativa al repetir el experimento en las mismas condiciones.

2. Encontrando, a partir de la naturaleza del experimento, relaciones que liguen a sus probabilidades elementales. Como por ejemplo en el caso de equiprobabilidad.

3. Combinando la experimentaci´on con la teor´ıa sobre la naturaleza del experimento. Este es el m´ eto-do m´as frecuente en la pr´actica, y consiste en la utilizaci´on de los modelos de distribuci´on de probabilidad m´as importantes.

Ejemplo (equiprobabilidad)

En un hospital se estudian 40 perros con parvovirosis canina. De los cuales 25 presentan anorexia. ¿Cu´al es la probabilidad de que un perro presente anorexia? 25/40, un 62.5 % ¿Cu´al es la probabilidad de que un perro no presente anorexia? 125/40, un 37.5 %.

Definici´

on de variable aleatoria

Una variable aleatoria es una variable matem´atica (X) cuyos valores son los resultados de un experi-mento aleatorio, y por tanto vienen determinados por el azar. Los valores que toma una variable aleatoria son num´ericos:

Si el resultado del experimento es num´erico, por ejemplo, el peso de un gato, la variable aleatoria “peso” tomar´a los valores que coinciden con el experimento (es decir, el peso).

Si el resultado del experimento no es num´erico, por ejemplo, lanzar una moneda, entonces se asignan valores num´ericos: 0, si sale cara, y 1, si sale cruz.

El conjunto de todos los valores de una variable aleatoria con sus probabilidades constituye unmodelo de distribuci´on de probabilidad.

Veremos que las variables aleatorias pueden serdiscretas, si toman valores discretos (0,1,2,...) y con-tinuas, si toman valores en un intervalo real.

(3)

Caracter´ısticas que resumen una variable aleatoria

1. Medidas de centralizaci´on.

Media µovalor esperadode la variable aleatoria, que se obtiene promediando todos los valores con su probabilidad.

Mediana,M e, que es el valor que divide la probabilidad total en dos partes iguales. Deja el 50 % a cada lado.

Moda, que es el valor m´as probable. 2. Medida de dispersi´on.

Lavarianza σ2, y ladesviaci´on t´ıpica σ, que miden la dispersi´on con respecto a la media.

3. Percentiles.

El percentil p de una variable aleatoria es el valor deX que deja el p% por debajo de ´el () y el (100−p) % por encima. La Mediana es el percentil 50. Loscuartiles 1, 2 y 3, son los percentiles 25, 50, 75.

Por ejemplo, el percentil 64 si hablamos de peso, indica que el 64 % de la poblaci´on tiene un peso inferior o igual a ´este valor, y el 36 % un peso superior.

Variable aleatoria discreta

Una variable aleatoria es discreta cuando toma un conjunto de valores discretos (0,1,2,...). Puede ser finita o infinita:

- N´umero de perros infectados en un conjunto de N perros:X={0,1,2,3, ...N}. Es finita.

- N´umero de peque˜nos animales que visitan en un d´ıa al hospital: X={0,1,2,3,4, ...}. Es infinita. Funci´on de probabilidad

Lafunci´on de probabilidadnos da la probabilidad de todos los posibles valores de la variable aleatoria. Como es una variable discreta, podemos calcular la probabilidad de cada valor puntual posible de la variable aleatoria. Son probabilidades puntuales o masas.

p(X =xi).

Nota: La suma de todas las probabilidades tiene que ser 1. Distribuci´on acumulativa

La funci´on de distribuci´on acumulativa es importante. Nos da la probabilidad de que la variable aleatoria tome un valor menor o igual que uno dado.

F(x0) =P(X≤x0).

Nota: La distribuci´on acumulativa en el ´ultimo valor (el mayor). tiene que ser 1 Ejemplo

Analizar la distribuci´on de probabilidad de la variable aleatoria que describe los posibles resultados obtenidos al lanzar una moneda.

X={resultados de lanzar una moneda}={salir cara, salir cruz}={0,1} Espacio Muestral Funci´on de probabilidad:p(X= 0) = 1/2, p(X= 1) = 1/2.

Funci´on de distribuci´on acumulativa:F(0) =p(X 0) = 1/2, F(1) =p(X 1) = 1.

(4)

Distribuci´on Binomial B(n, p) Condiciones

Realizamos un n´umero finito de ensayos para analizar una propiedad dicot´omica (infectado-no infectado, sano-enfermo,...)

nes el n´umero de ensayos independientes

pes la probabilidad de ´exito en cada ensayo

Diremos queX es una variable aleatoria con distribuci´on BinomialB(n, p) siX representa el n´umero de ´exitos en losnensayos.

Ejemplos: n´umero de infectados, n´umero de piezas defectuosas,... - Valores que puede tomar la variableX.

L´ogicamente, el n´umero de ´exitos ennensayos estar´a en el conjunto:X ={0,1,2,3, ..., n}. - Funci´on de probabilidad

La probabilidad de tenerm´exitos ennensayos es:

p(X=m) = n!

m!(n−m)!p

m(1p)n−m.

Nota: La suma de todas las probabilidades tiene que ser 1. - Distribuci´on acumulativa

La probabilidad de tener hastam´exitos ennensayos es:

p(X≤m) = mk=0 n! k!(n−k)!p k(1p)n−k=p(0) +p(1) +· · ·+p(m).

Nota: La distribuci´on acumulativa enn(probabilidad de tener hastan´exitos) ser´a 1. - Caracter´ısticas

La media y desviaci´on para esta variable aleatoria son:

µ=np, σ=√np(1−p).

Ejemplo

Sabemos que la probabilidad de que un perro muera a causa de cierta vacuna contra la rabia es de 0.02. Si administramos la vacuna a 5 perros, ¿cu´al es la probabilidad de que no muera ninguno?, ¿cu´al es la probabilidad de que no mueran m´as de 2?

Se define la variableX= n´umero de perros que fallecen por la vacuna = B(5,0.02). Probabilidad de que no muera ninguno esp(X = 0) = 0!5!5! p0(10.02)5= 0.94 Probabilidad de que no mueran m´as de 2

esp(X≤2) =p(0) +p(1) +p(2) = 0.99. Distribuci´on de Poisson P(λ)

Condiciones:

Una serie de ocurrencias (eventos) independientes.

λes el n´umero promedio de ocurrencias por unidad de tiempo o de espacio.

(5)

Diremos queX es una variable aleatoria con distribuci´on PoissonP(λ) siX representa el n´umero de eventos independientes que ocurren de forma constante por unidad de tiempo o espacio.

Ejemplos: n´umero de bacterias en un cultivo, n´umero de visitas al hospital, n´umero de ventas en una terminal,...

- Valores que puede tomar la variableX

L´ogicamente, el n´umero de eventos independientes que ocurren de forma constante por unidad de tiempo o espacio puede llegar a ser infinito X={0,1,2,3,4, ...}.

- Funci´on de probabilidad

La probabilidad de que ocurranmeventos independientes de forma constante en tiempo o espacio es

p(X =m) =e−λλ m m!. Nota: La suma de todas las probabilidades tiene que ser 1. - Distribuci´on acumulativa

La probabilidad de que ocurran hasta m eventos independientes de forma constante en tiempo o espacio es: p(X ≤m) = mk=0 e−λλ k k! =p(0) +p(1) +· · ·+p(m). Nota: La distribuci´on acumulativa enser´a 1.

- Caracter´ısticas

La media y desviaci´on para esta variable aleatoria son:

µ=σ=λ.

Ejemplo

El promedio de visitas por hora al hospital es de 1.4 ¿Cu´al es la probabilidad de no haya ninguna visita a la hora?, ¿y de que haya m´as de 2 visitas?

Se define la variableX = n´umero de visitas por hora =P(1.4). Probabilidad de que no haya ninguna visita:

P(0) =e−1.41.4

0

0! = 0.25. Probabilidad de que haya m´as de dos visitas:

P(X≤2) =p(0) +p(1) +p(2) = 2 ∑ k=0 e−1.41.4 k k! = 0.83.

Variable aleatoria continua

Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo El peso de un animal es continua.

El tiempo de duraci´on de un anest´esico es continua.

Es importante entender que no es posible conocer el valor exacto de una variable continua, ya que medir su valor supone leerlo dentro de un intervalo. As´ı medir una estatura de 1.72cm no es exacto, sino que observaremos que est´a en el intervalo (1.71, 1.73). Este principio caracteriza a las variables aleatorias continuas. Y da lugar a la definici´on de funci´on de densidad.

(6)

Funci´on de densidad

Es una funci´on positiva f(x) 0, y no nos da la probabilidad, como en el caso discreto, sino un medio para obtener probabilidades. Las probabilidades se obtienen a trav´es de integrales de la funci´on de densidad (el ´area bajo la curva):

p(x0≤X ≤x1) = ´area bajo la curva densidad entrex0 yx1=

x1

x0

f(x)dx.

Nota: el ´area total bajo la curva densidad tiene que ser 1 (es la probabilidad total). Nota: la probabilidad de un valor puntual ser´a 0 (no hay ´area)

Funci´on de distribuci´on acumulativa

Nos da la probabilidad de que la variable aleatoria tome un valor menor o igual que uno dado.

F(x0) =P(X≤x0) = ´area que deja a la izquierda dex0bajo la curva densidad =

x0

−∞

f(x)dx.

Nota: La distribuci´on acumulativa en el ´ultimo valor () tiene que ser 1. Ejemplo

Supongamosf(x) la funci´on de densidad que describe el peso de reci´en nacidos. La probabilidad de que el peso est´e entre 2.5kg y 3kg nos la da:

p(2.5≤X 3) =F(3)−F(2.5) =

∫ 3 2.5

f(x)dx.

Y la probabilidad de tener un peso superior a 4kg:

p(X 4) = 1−p(X 4) = 1−F(4) =

4

f(x)dx.

Distribuci´on Normal N(µ, σ)

El la m´as importante de las variables aleatorias continuas. No s´olo porque representa la mayor´ıa de las distribuciones de variables f´ısicas, sino porque es la piedra angular en la inferencia estad´ıstica. Ejemplos: peso, volumen, tama˜no.

- La variableX toma valores en intervalos reales. - Funci´on de densidad

Ahora no tenemos probabilidades puntuales, sino densidad dada por:

f(x) = 1

σ√2πe

−(x−µ)2 2σ2 .

- Funci´on de distribuci´on

A trav´es de la que calcularemos probabilidades:

p(X ≤a)=´area bajo la curva densidad a la izda dea=∫−∞a f(x)dx.

p(a≤X ≤b)=´area bajo la curva densidad entre los puntosayb=∫abf(x)dx.

p(X ≥b)=´area bajo la curva densidad a la drcha deb=∫b∞f(x)dx.

(7)

- Caracter´ısticas

La distribuci´on es perfectamente sim´etrica, centrada en la media µ, que coincide con la mediana y la moda. Su desviaci´on esµy tiene puntos de inflexi´on enµ±σ. Se verifica que el 95.5 % de la distribuci´on se encuentra entreµ−2σyµ+ 2σ. El 99.7 % de la distribuci´on se encuentra entre y

µ−3σyµ+ 3σ.

- Distribuci´on Normal Est´andarZ ∼ N(0,1)

Es la distribuci´on normal con media 0 y desviaci´on 1. Toda distribuci´on normal puede transformarse en una est´andar, a trav´es de la siguiente transformaci´on:

Z= X−µ

σ .

DondeX es una distribuci´onN(µ, σ), yZ es una distribuci´onN(0,1). Ejemplo

Supongamos que la talla (cm) de una poblaci´on de arenques, sigue una distribuci´on normalN(21.5,6.5). Expresar la probabilidad de que un individuo de la poblaci´on sobrepase los 25cm. Y que su talla est´e com-prendida entre 15 y 30cm. Realizar la transformaci´on tambi´en a una normal est´andar.

p(X≥25) = 1−p(X≤25) =F(25) =p(Z 0.538) = 1−p(Z 0.538) =FZ(0.538).

p(15≤X 30) =F(30)−F(15) =p(1≤Z≤1.3) =FZ(1.3)−FZ(1). Relaci´on entre las distribuciones Normal, Binomial y Poisson

Analicemos tres relaciones interesantes: 1. Binomial-Poisson

Para valores grandes deny peque˜nos de la probabilidadp, la distribuci´on binomialB(n, p) se puede aproximar por una poissonP(λ), de la siguiente forma:

B(n, p)=P(λ=np).

En la pr´actica, esta aproximaci´on es buena cuandonp >1 yp <0.1. 2. Binomial-Normal

Para valores grandes deny con la probabilidadpno muy cercana a 0 ´o a 1, la distribuci´on binomial B(n, p) se puede aproximar por una normalN(µ, σ) como sigue:

B(n, p)=N(np,np(1−p)).

En la pr´actica, esta aproximaci´on se utiliza paranp(1−p)>5. 3. Poisson-Normal

Para valores grandes deλla distribuci´on poissonP(λ) se puede aproximar por una normalN(µ, σ): P(λ)=N(λ,√λ).

En la pr´actica, la aproximaci´on es buena cuandoλ >5.

(8)

Ejemplo

Supongamos que la probabilidad de que una persona desarrolle la gripe a causa de cierta vacuna contra esta enfermedad es de 0.01. Si administramos esta vacuna a 300 personas, ¿cu´al es la probabilidad de que no desarrollen la enfermedad m´as de 4 personas?

En este caso la variable que describe el n´umero de personas que desarrollan la enfermedad, es una distribuci´on binomialB(300,0.01). Como 300*0.01=3>1 podemos aproximar por una distribuci´on poisson P(3). Vamos a comparar resultados:

p(X 4) =p(0) +p(1) +p(2) +p(3) +p(4) = 4 ∑ k=0 300! k!(300−k)!0.01 k(10.01)300−k= 0.81611. p(X≤4) =p(0) +p(1) +p(2) +p(3) +p(4) = 4 ∑ k=0 e33 k k! = 0.81526. Otras distribuciones continuas

Hay una serie de variables aleatorias continuas, que tienen importancia a la hora de hacer inferencia estad´ıstica. Estas, son funciones de distribuciones normales estandarizadas:

Distribuci´on Chi Cuadrado La distribuci´on chi-cuadrado χ2

n con n grados de libertad es la suma de n normales est´andar al

cuadrado:

χ2n=Z12+· · ·+Zn2.

Es una distribuci´on asim´etrica con mediaµ=n, y varianzaσ2= 2n. Esta distribuci´on es adecuada

en test no param´etricos. Distribuci´onF de Fisher

La distribuci´onF de Fisher connymgrados de libertad es el cociente de dos chi-cuadrado:

Fn,m= χ2n n χ2 m m .

Esta distribuci´on es adecuada para realizar inferencias sobre la varianza.

Distribuci´ont de Student La distribuci´on t de Student conn grados de libertad es el cociente de una normal est´andar y una chi-cuadrado:

tn= √Z

χ2 n

n .

Esta distribuci´on es adecuada en comparaci´on de medias. Se aproxima a la normal est´andar para valores grandes de n.

(9)

Probabilidad condicional

Nuevo espacio de probabilidades

Supongamos que nos interesa analizar la ocurrencia de sucesos, pero bajo la condici´on de que ocurre (necesariamente) un suceso dado B, con probabilidad positiva. Definimos un nuevo espacio de probabili-dades, en el cu´al se consideran ´unicamente los casos en los que ocurre el suceso B.

Probabilidad de un suceso A condicionada a otro B:

p(A|B) = p(AB)

p(B)

Las tablas de contingencia, son ´utiles para el c´alculo de probabilidades condicionales. En ´estas se representan las observaciones para caracter´ısticas cruzadas:

se cumpleA no se cumpleA

se cumpleB x1 x2 totalB

no se cumpleB x3 x4 total noB

totalA total noA total

De este modo, tenemos las siguientes probabilidades:

p(A) =totalA total , p(B) = totalB total , p(A|B) = x1 total p(B), p(B|A) = x1 total p(A). Ejemplo

En la elaboraci´on de 1800 jamones, se han utilizado 800 piezas con grasa y 1000 con poca grasa. Adem´as, de los 1100 jamones con calificaci´on de ´optimo, 500 de ellos tienen poca grasa.

grasa no grasa ´

optimo 600 500 1100

no ´optimo 200 500 700

800 1000 1800

1. ¿Cu´al es la probabilidad de que un jam´on est´e elaborado con poca grasa? 1000

1800 = 0.5555, 55 %.

2. ¿Cu´al es la probabilidad de que un jam´on elaborado con grasa sea calificado de ´optimo? 600800 = 0.75, 75 %.

3. ¿Cu´al es la probabilidad de que un jam´on sea ´optimo y con grasa? 600

1800 = 0.333, 33 %.

Independencia de sucesos

Es un concepto muy importante. Dos sucesos van a ser independientes, cuando la ocurrencia de uno no est´a ligada en absoluto a la ocurrencia del otro.

Por tanto, A y B ser´an independientes si la probabilidad condicionada es la misma que sin condi-cionar:

p(A|B) = p(AB)

p(B) =p(A), p(B|A) =

p(BA)

p(A) =p(B)

De las igualdades anteriores se deduce un c´alculo de probabilidad muy importante. Si A y B son sucesos independientes, entonces

p(AB) =p(A)p(B) =p(BA)

Pero ¡mucho cuidado con esto!, la probabilidad conjunta es el producto de probabilidades si tenemos la seguridad de que son sucesos independientes.

(10)

Ejemplo

Siguiendo con el ejemplo de los jamones anterior, nos preguntamos si son independientes los sucesos tener calificaci´on de ´optimo y tener grasa.

Si son independientes, la probabilidad de tener calificaci´on de ´optimo ser´a la misma, sin depender de la grasa:

p(´optimo|grasa) = 0.75̸= 0.61 =p(´optimo)

Luego no son sucesos independientes. Adem´as, comprobamos que no se verifica el resultado te´orico ante-rior:

p(´optimocdotgrasa) = 0.333̸=p(´optimo)p(grasa) = 0.27

Teorema de Bayes

Introducci´

on al Teorema de Bayes. Inversi´

on de condiciones

Analizar los s´ıntomas asociados a una enfermedad, es relativamente f´acil, si se dispone de los medios claro. Se trata de hacer un estudio con pacientes con dicha enfermedad y apuntar los s´ıntomas. Si real-izamos el estudio un n´umero indefinido de veces, la frecuencia relativa de cada uno de los s´ıntomas es la probabilidad de cada s´ıntoma asociado a la enfermedad. Es una probabilidad condicionada:

p(s´ıntoma|enfermedad) = p(s´ıntoma·enfermedad)

p(enfermedad) O bien, dada una causa, analizamos la probabilidad del efecto que produce:

p(efecto|causa) = p(efecto·causa)

p(causa)

Sin embargo, nuestra informaci´on es el s´ıntoma, y no la causa. La fiebre puede estar causada por m´as enfermedades (causas) que la gripe, y es al m´edico a qui´en corresponde decidir cu´al es la causa m´as probable que la origine.

Esta va a ser la idea del teorema de Bayes, “darle la vuelta a la situaci´on”, y por tanto, decidir, cuando se tiene fiebre, cu´al es la probabilidad de que sea debido a gripe, a infecci´on, a un virus,...

La primera aproximaci´on al teorema es laF´ormula de inversi´on de condiciones. Supongamos conocida lap(A|B) (que es lap(efecto|causa)). Entonces, la f´ormula que invierte condiciones es:

p(B|A) =p(A|B)·p(B)

p(A) p(causa|efecto) =

p(efecto|causa)p(causa)

p(efecto)

L´ogicamente, aqu´ı necesitamos una informaci´on “extra”, que es la probabilidad del s´ıntoma, o efecto. Ejemplo

Tenemos 100 gatos, de los cuales 40 tienen hipertiroidismo felino (HF). Analizamos en ellos dos s´ıntomas: “alteraci´on en el pelo” (AP) que se da en 34 gatos, de los cu´ales 24 desarrollan la enfermedad y “p´erdida de peso” (P P) que la presentan 38 gatos, de los cuales 30 desarrollan la enfermedad. Analicemos la informaci´on:

Directa: dada la enfermedad, ¿cu´al es la probabilidad de los s´ıntomas?

p(AP|HF) = p(AP·HF) p(HF) = 24 40 = 0.6, p(P P|HF) = p(P P·HF) p(HF) = 30 40= 0.75 Inversa: dado el s´ıntoma, ¿cu´al es la probabilidad de enfermedad?

p(HF|AP) =p(AP|HF)·p(HF) p(AP) = 0.6·0.4 34 = 0.71, p(HF|P P) = p(P P|HF)·p(HF) p(P P) = 0.75·0.4 0.38 = 0.79 C. Ferreira

(11)

Teorema de Bayes

Situaci´on: tenemos un efecto (s´ıntoma). Y reunimos todas las posibles causas (enfermedades) que pueden originar dicho s´ıntoma. Las causas las suponemos excluyentes, es decir, no pueden ser dos a la vez. Queremos analizar la probabilidad de que, para ese s´ıntoma, se de una enfermedad determinada.

Informaci´on de la que disponemos: Un s´ıntomaS.

ncausas posibles excluyentes:C1, C2, . . . , Cn,Ci∩Cj=ϕ,=j.

Conocemos la probabilidad de cada causa:p(Ci),i= 1, . . . , n.

Las causas llenan el espacio de posibilidades de dicho s´ıntoma:∑ni=1p(Ci) = 1.

Conocemos tambi´en la probabilidad condicionada de que dada una causa se produzca el s´ıntoma:

p(S|Ci),i= 1, . . . , n.

El Teorema de Bayes, nos da la probabilidad de que, dado el s´ıntoma, la enfermedad sea una determinada:

p(Ck|S) = p(S|Ck)·p(Ck)

p(S|C1)·p(C1) +p(S|C2)·p(C2) +p(S|C3)·p(C3) +· · ·+p(S|Cn)·p(Cn) .

Observemos que el denominador es la probabilidad de que se produzca el s´ıntoma:

p(S|C1)·p(C1) +p(S|C2)·p(C2) +p(S|C3)·p(C3) +· · ·+p(S|Cn)·p(Cn).

Ejemplo

Los envases de tetrabrick son producidos en grandes bobinas. Una misma bobina contiene varios rollos con secuencias de envases, y cada rollo recibe una numeraci´on (1 a 5) que permite identificar en qu´e posici´on de la bobina fue producido un determinado envase. Cada rollo procesa el 20 % de los art´ıculos, y la probabilidad de que se produzca un envase defectuoso var´ıa seg´un el rollo: delr1, 0.005,

del r2, 0.002, delr3, 0.001, delr4, 0.002 y del r5, 0.005. ¿Cu´al es la probabilidad de que un envase sea

defectuoso?, si un envase es defectuoso ¿con qu´e probabilidad pertenece a alguno de los cinco rollos? Las causas son los rollos:p(ri) = 0.2, i= 1, . . . ,5

Las probabilidades condicionales, de que sea defectuoso debido a un rollo u otro:

p(defectuoso|r1) =p(defectuoso|r5) = 0.005, p(defectuoso|r2) =p(defectuoso|r4) = 0.002

p(defectuoso|r3) = 0.001. El Teorema de Bayes: p(rk|defectuoso) = p(defectuoso|rk)·p(rk) p(defectuoso|r1)·p(r1) +· · ·+p(defectuoso|rn)·p(rn) Por tanto:

p(r1|defectuoso) =p(r5|defectuoso) = 0.33,33 % p(r2|defectuoso) =p(r4|defectuoso) = 0.13,13 %

p(r3|defectuoso) = 0.06, 6 %

Referencias

Documento similar