Bioestadística Probabilidad 1. La población es el conjunto de elementos en los que se desea investigar la ocurrencia de una característica

(1)

Probabilidad

Introducci´

on a la probabilidad

La poblaci´on es el conjunto de elementos en los que se desea investigar la ocurrencia de una carac-ter´ıstica o propiedad.

Son experimentos aleatorios: “Lanzamiento de un dado y apuntar el resultad”. “N´umero de perros que visitan el Hospital al d´ıa”. “N´umero de gatos infectados en una granja”.

Por ejemplo analizar la velocidad con la que la moneda cae al suelo no es un experimento aleatorio. Unsuceso aleatorio es cada uno de los posibles resultados de un experimento aleatorio. Que “salga 3” al lanzar un dado, es un suceso aleatorio. Que “salga par” es otro suceso aleatorio.

El Espacio Muestral es el conjunto de todos los sucesos aleatorios.

Laprobabilidad es una medida de la incertidumbre de un suceso aleatorio. Ejemplo

Se vacunan 12 perros contra la rabia, y queremos analizar cu´antos perros podr´ıan tener una reacci´on a dicha vacuna.

La población es el conjunto de los 12 perros. El experimento aleatorio el proceso de vacunar a dichos perros y analizar su reacción. Un suceso aleatorio es “que haya 3 perros con reacción”, otro por ejemplo es “que no haya ningún perro con reacción”.

El espacio muestral es{0,1,2,3,4,5,6,7,8,9,10,11,12}.

Objetivo: una medida que nos de la posibilidad de que ocurra alguno de estos sucesos.

Definici´

on de probabilidad

“Definición Clásica” En una población conN elementos, queremos analizar los que tienen una car-acter´ıstica A. Entonces la probabilidad de la caracter´ıstica A (o bien, probabilidad de que ocurra A) es:

p(A) = casos favorables aA casos posibles en total.

“Definici´on Frecuentista”: La probabilidad de que ocurraAes la frecuencia relativa de los elementos con la caracter´ısticaA.

“Definici´on Axiom´atica”: La probabilidad es una medida de la incertidumbre de los sucesos, y tiene las siguientes propiedades:

1. La probabilidad (frecuencia relativa) de un suceso es un valor entre 0 y 1 0≤p(A)≤1.

2. La probabilidad (frecuencia relativa) del suceso seguroE, que ocurre siempre, es 1

p(E) = 1.

3. SiA y B son caracter´ısticas mutuamente excluyentes (no pueden darse a la vez), la probabilidad de que ocurra o bienA, o bienB es la probabilidad de la suma deAyB y se verifica (es la uni´on de dos sucesos, que llamaremos suma):

p(A+B) =p(A) +p(B).

(2)

4. ABrepresenta la intersecci´on de los sucesosAyB(que ocurran a la vez). SiAyBson cualesquiera (no mutuamente excluyentes), se tiene

p(A+B) =p(A) +p(B)−p(AB).

5. SiAC es la caracter´ıstica contraria aA(se dice suceso complementario), se tiene

p(AC) = 1−p(A).

Ejemplo

Analizamos el experimento de lanzar un dado. Calculamos algunas probabilidades: Probabilidad de que salga el n´umero 2:p(2) = 1/6.

Probabilidad de que salga un n´umero par: p(par) = 1/2. Probabilidad de que salgan 2 ´o 3:p(2 + 3) = 1/3.

Probabilidad de que salga un n´umero de 1 a 6:p(1 + 2 + 3 + 4 + 5 + 6) = 1. Probabilidad que salga el contrario a 4:p(4C) = 5/6.

Estimaci´on de probabilidades en la pr´actica

No tiene sentido hablar de probabilidades sin definir previamente la poblaci´on a la que nos referimos y los sucesos que vamos a considerar. Estas probabilidades se determinan:

1. Estudiando la frecuencia relativa al repetir el experimento en las mismas condiciones.

2. Encontrando, a partir de la naturaleza del experimento, relaciones que liguen a sus probabilidades elementales. Como por ejemplo en el caso de equiprobabilidad.

3. Combinando la experimentación con la teor´ıa sobre la naturaleza del experimento. Este es el m´ eto-do más frecuente en la práctica, y consiste en la utilización de los modelos de distribución de probabilidad más importantes.

Ejemplo (equiprobabilidad)

En un hospital se estudian 40 perros con parvovirosis canina. De los cuales 25 presentan anorexia. ¿Cu´al es la probabilidad de que un perro presente anorexia? 25/40, un 62.5 % ¿Cu´al es la probabilidad de que un perro no presente anorexia? 1−25/40, un 37.5 %.

Definici´

on de variable aleatoria

Una variable aleatoria es una variable matem´atica (X) cuyos valores son los resultados de un experi-mento aleatorio, y por tanto vienen determinados por el azar. Los valores que toma una variable aleatoria son num´ericos:

Si el resultado del experimento es num´erico, por ejemplo, el peso de un gato, la variable aleatoria “peso” tomar´a los valores que coinciden con el experimento (es decir, el peso).

Si el resultado del experimento no es num´erico, por ejemplo, lanzar una moneda, entonces se asignan valores num´ericos: 0, si sale cara, y 1, si sale cruz.

El conjunto de todos los valores de una variable aleatoria con sus probabilidades constituye unmodelo de distribuci´on de probabilidad.

Veremos que las variables aleatorias pueden serdiscretas, si toman valores discretos (0,1,2,...) y con-tinuas, si toman valores en un intervalo real.

(3)

Caracter´ısticas que resumen una variable aleatoria

1. Medidas de centralizaci´on.

Media µovalor esperadode la variable aleatoria, que se obtiene promediando todos los valores con su probabilidad.

Mediana,M e, que es el valor que divide la probabilidad total en dos partes iguales. Deja el 50 % a cada lado.

Moda, que es el valor m´as probable. 2. Medida de dispersi´on.

Lavarianza σ2_{, y la}_desviaci´_{on t´ıpica} _σ_{, que miden la dispersi´}_{on con respecto a la media.}

3. Percentiles.

El percentil p de una variable aleatoria es el valor deX que deja el p% por debajo de ´el (≤) y el (100−p) % por encima. La Mediana es el percentil 50. Loscuartiles 1, 2 y 3, son los percentiles 25, 50, 75.

Por ejemplo, el percentil 64 si hablamos de peso, indica que el 64 % de la poblaci´on tiene un peso inferior o igual a ´este valor, y el 36 % un peso superior.

Variable aleatoria discreta

Una variable aleatoria es discreta cuando toma un conjunto de valores discretos (0,1,2,...). Puede ser finita o infinita:

- N´umero de perros infectados en un conjunto de N perros:X={0,1,2,3, ...N}. Es finita.

- Número de pequeños animales que visitan en un d´ıa al hospital: X={0,1,2,3,4, ...}. Es infinita. Función de probabilidad

Lafunci´on de probabilidadnos da la probabilidad de todos los posibles valores de la variable aleatoria. Como es una variable discreta, podemos calcular la probabilidad de cada valor puntual posible de la variable aleatoria. Son probabilidades puntuales o masas.

p(X =xi).

Nota: La suma de todas las probabilidades tiene que ser 1. Distribuci´on acumulativa

La funci´on de distribuci´on acumulativa es importante. Nos da la probabilidad de que la variable aleatoria tome un valor menor o igual que uno dado.

F(x0) =P(X≤x0).

Nota: La distribuci´on acumulativa en el ´ultimo valor (el mayor). tiene que ser 1 Ejemplo

Analizar la distribuci´on de probabilidad de la variable aleatoria que describe los posibles resultados obtenidos al lanzar una moneda.

X={resultados de lanzar una moneda}={salir cara, salir cruz}={0,1} Espacio Muestral Funci´on de probabilidad:p(X= 0) = 1/2, p(X= 1) = 1/2.

Funci´on de distribuci´on acumulativa:F(0) =p(X ≤0) = 1/2, F(1) =p(X ≤1) = 1.

(4)

Distribuci´on Binomial B(n, p) Condiciones

Realizamos un n´umero finito de ensayos para analizar una propiedad dicot´omica (infectado-no infectado, sano-enfermo,...)

nes el n´umero de ensayos independientes

pes la probabilidad de ´exito en cada ensayo

Diremos queX es una variable aleatoria con distribución BinomialB(n, p) siX representa el número de éxitos en losnensayos.

Ejemplos: n´umero de infectados, n´umero de piezas defectuosas,... - Valores que puede tomar la variableX.

Lógicamente, el número de éxitos ennensayos estará en el conjunto:X ={0,1,2,3, ..., n}. - Función de probabilidad

La probabilidad de tenerm´exitos ennensayos es:

p(X=m) = n!

m!(n−m)!p

m₍₁₋_p₎n−m_.

Nota: La suma de todas las probabilidades tiene que ser 1. - Distribuci´on acumulativa

La probabilidad de tener hastam´exitos ennensayos es:

p(X≤m) = m ∑ k=0 n! k!(n−k)!p k₍₁₋_p₎n−k₌_p_{(0) +}_p_{(1) +}_{· · ·}₊_p₍_m₎_.

Nota: La distribución acumulativa enn(probabilidad de tener hastanéxitos) será 1. - Caracter´ısticas

La media y desviaci´on para esta variable aleatoria son:

µ=np, σ=√np(1−p).

Ejemplo

Sabemos que la probabilidad de que un perro muera a causa de cierta vacuna contra la rabia es de 0.02. Si administramos la vacuna a 5 perros, ¿cuál es la probabilidad de que no muera ninguno?, ¿cuál es la probabilidad de que no mueran más de 2?

Se define la variableX= n´umero de perros que fallecen por la vacuna = B(5,0.02). Probabilidad de que no muera ninguno esp(X = 0) = _0!5!5! p0₍₁₋₀_.₀₂₎5_{= 0}_._{94 Probabilidad de que no mueran m´}_{as de 2}

esp(X≤2) =p(0) +p(1) +p(2) = 0.99. Distribuci´on de Poisson P(λ)

Condiciones:

Una serie de ocurrencias (eventos) independientes.

λes el n´umero promedio de ocurrencias por unidad de tiempo o de espacio.

(5)

Diremos queX es una variable aleatoria con distribuci´on PoissonP(λ) siX representa el n´umero de eventos independientes que ocurren de forma constante por unidad de tiempo o espacio.

Ejemplos: número de bacterias en un cultivo, número de visitas al hospital, número de ventas en una terminal,...

- Valores que puede tomar la variableX

L´ogicamente, el n´umero de eventos independientes que ocurren de forma constante por unidad de tiempo o espacio puede llegar a ser infinito X={0,1,2,3,4, ...}.

- Funci´on de probabilidad

La probabilidad de que ocurranmeventos independientes de forma constante en tiempo o espacio es

p(X =m) =e−λλ m m!. Nota: La suma de todas las probabilidades tiene que ser 1. - Distribuci´on acumulativa

La probabilidad de que ocurran hasta m eventos independientes de forma constante en tiempo o espacio es: p(X ≤m) = m ∑ k=0 e−λλ k k! =p(0) +p(1) +· · ·+p(m). Nota: La distribuci´on acumulativa en∞ser´a 1.

- Caracter´ısticas

La media y desviaci´on para esta variable aleatoria son:

µ=σ=λ.

Ejemplo

El promedio de visitas por hora al hospital es de 1.4 ¿Cu´al es la probabilidad de no haya ninguna visita a la hora?, ¿y de que haya m´as de 2 visitas?

Se define la variableX = n´umero de visitas por hora =P(1.4). Probabilidad de que no haya ninguna visita:

P(0) =e−1.41.4

0

0! = 0.25. Probabilidad de que haya m´as de dos visitas:

P(X≤2) =p(0) +p(1) +p(2) = 2 ∑ k=0 e−1.41.4 k k! = 0.83.

Variable aleatoria continua

Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo El peso de un animal es continua.

El tiempo de duraci´on de un anest´esico es continua.

Es importante entender que no es posible conocer el valor exacto de una variable continua, ya que medir su valor supone leerlo dentro de un intervalo. As´ı medir una estatura de 1.72cm no es exacto, sino que observaremos que está en el intervalo (1.71, 1.73). Este principio caracteriza a las variables aleatorias continuas. Y da lugar a la definición de función de densidad.

(6)

Funci´on de densidad

Es una función positiva f(x) ≥ 0, y no nos da la probabilidad, como en el caso discreto, sino un medio para obtener probabilidades. Las probabilidades se obtienen a través de integrales de la función de densidad (el área bajo la curva):

p(x0≤X ≤x1) = ´area bajo la curva densidad entrex0 yx1=

∫ x1

x0

f(x)dx.

Nota: el área total bajo la curva densidad tiene que ser 1 (es la probabilidad total). Nota: la probabilidad de un valor puntual será 0 (no hay área)

Funci´on de distribuci´on acumulativa

Nos da la probabilidad de que la variable aleatoria tome un valor menor o igual que uno dado.

F(x0) =P(X≤x0) = ´area que deja a la izquierda dex0bajo la curva densidad =

∫ x0

−∞

f(x)dx.

Nota: La distribuci´on acumulativa en el ´ultimo valor (∞) tiene que ser 1. Ejemplo

Supongamosf(x) la función de densidad que describe el peso de recién nacidos. La probabilidad de que el peso esté entre 2.5kg y 3kg nos la da:

p(2.5≤X ≤3) =F(3)−F(2.5) =

∫ 3 2.5

f(x)dx.

Y la probabilidad de tener un peso superior a 4kg:

p(X ≥4) = 1−p(X ≤4) = 1−F(4) =

∫ _∞

4

f(x)dx.

Distribuci´on Normal N(µ, σ)

El la más importante de las variables aleatorias continuas. No sólo porque representa la mayor´ıa de las distribuciones de variables f´ısicas, sino porque es la piedra angular en la inferencia estad´ıstica. Ejemplos: peso, volumen, tamaño.

- La variableX toma valores en intervalos reales. - Funci´on de densidad

Ahora no tenemos probabilidades puntuales, sino densidad dada por:

f(x) = 1

σ√2πe

−(x−µ)2 2σ2 _.

- Funci´on de distribuci´on

A trav´es de la que calcularemos probabilidades:

p(X ≤a)=´area bajo la curva densidad a la izda dea=∫_−∞a f(x)dx.

p(a≤X ≤b)=´area bajo la curva densidad entre los puntosayb=∫_abf(x)dx.

p(X ≥b)=´area bajo la curva densidad a la drcha deb=∫_b∞f(x)dx.

(7)

- Caracter´ısticas

La distribución es perfectamente simétrica, centrada en la media µ, que coincide con la mediana y la moda. Su desviación esµy tiene puntos de inflexión enµ±σ. Se verifica que el 95.5 % de la distribución se encuentra entreµ−2σyµ+ 2σ. El 99.7 % de la distribución se encuentra entre y

µ−3σyµ+ 3σ.

- Distribuci´on Normal Est´andarZ ∼ N(0,1)

Es la distribución normal con media 0 y desviación 1. Toda distribución normal puede transformarse en una estándar, a través de la siguiente transformación:

Z= X−µ

σ .

DondeX es una distribuci´onN(µ, σ), yZ es una distribuci´onN(0,1). Ejemplo

Supongamos que la talla (cm) de una población de arenques, sigue una distribución normalN(21.5,6.5). Expresar la probabilidad de que un individuo de la población sobrepase los 25cm. Y que su talla esté com-prendida entre 15 y 30cm. Realizar la transformación también a una normal estándar.

p(X≥25) = 1−p(X≤25) =F(25) =p(Z ≥0.538) = 1−p(Z ≤0.538) =FZ(0.538).

p(15≤X ≤30) =F(30)−F(15) =p(−1≤Z≤1.3) =FZ(1.3)−FZ(−1). Relaci´on entre las distribuciones Normal, Binomial y Poisson

Analicemos tres relaciones interesantes: 1. Binomial-Poisson

Para valores grandes deny peque˜nos de la probabilidadp, la distribuci´on binomialB(n, p) se puede aproximar por una poissonP(λ), de la siguiente forma:

B(n, p)∼=P(λ=np).

En la pr´actica, esta aproximaci´on es buena cuandonp >1 yp <0.1. 2. Binomial-Normal

Para valores grandes deny con la probabilidadpno muy cercana a 0 ´o a 1, la distribuci´on binomial B(n, p) se puede aproximar por una normalN(µ, σ) como sigue:

B(n, p)∼=N(np,√np(1−p)).

En la pr´actica, esta aproximaci´on se utiliza paranp(1−p)>5. 3. Poisson-Normal

Para valores grandes deλla distribuci´on poissonP(λ) se puede aproximar por una normalN(µ, σ): P(λ)∼=N(λ,√λ).

En la pr´actica, la aproximaci´on es buena cuandoλ >5.

(8)

Ejemplo

Supongamos que la probabilidad de que una persona desarrolle la gripe a causa de cierta vacuna contra esta enfermedad es de 0.01. Si administramos esta vacuna a 300 personas, ¿cu´al es la probabilidad de que no desarrollen la enfermedad m´as de 4 personas?

En este caso la variable que describe el número de personas que desarrollan la enfermedad, es una distribución binomialB(300,0.01). Como 300*0.01=3>1 podemos aproximar por una distribución poisson P(3). Vamos a comparar resultados:

p(X ≤4) =p(0) +p(1) +p(2) +p(3) +p(4) = 4 ∑ k=0 300! k!(300−k)!0.01 k₍₁₋₀_.₀₁₎300−k_{= 0}_.₈₁₆₁₁_. p(X≤4) =p(0) +p(1) +p(2) +p(3) +p(4) = 4 ∑ k=0 e33 k k! = 0.81526. Otras distribuciones continuas

Hay una serie de variables aleatorias continuas, que tienen importancia a la hora de hacer inferencia estad´ıstica. Estas, son funciones de distribuciones normales estandarizadas:

Distribuci´on Chi Cuadrado La distribuci´on chi-cuadrado χ2

n con n grados de libertad es la suma de n normales est´andar al

cuadrado:

χ2_n=Z₁2+· · ·+Z_n2.

Es una distribuci´on asim´etrica con mediaµ=n, y varianzaσ2_{= 2}_n_{. Esta distribuci´}_{on es adecuada}

en test no param´etricos. Distribuci´onF de Fisher

La distribuci´onF de Fisher connymgrados de libertad es el cociente de dos chi-cuadrado:

Fn,m= χ2_n n χ2 m m .

Esta distribuci´on es adecuada para realizar inferencias sobre la varianza.

Distribuciónt de Student La distribución t de Student conn grados de libertad es el cociente de una normal estándar y una chi-cuadrado:

tn= √Z

χ2 n

n .

Esta distribución es adecuada en comparación de medias. Se aproxima a la normal estándar para valores grandes de n.

(9)

Probabilidad condicional

Nuevo espacio de probabilidades

Supongamos que nos interesa analizar la ocurrencia de sucesos, pero bajo la condición de que ocurre (necesariamente) un suceso dado B, con probabilidad positiva. Definimos un nuevo espacio de probabili-dades, en el cuál se consideran únicamente los casos en los que ocurre el suceso B.

Probabilidad de un suceso A condicionada a otro B:

p(A|B) = p(AB)

p(B)

Las tablas de contingencia, son útiles para el cálculo de probabilidades condicionales. En éstas se representan las observaciones para caracter´ısticas cruzadas:

se cumpleA no se cumpleA

se cumpleB x1 x2 totalB

no se cumpleB x3 x4 total noB

totalA total noA total

De este modo, tenemos las siguientes probabilidades:

p(A) =totalA total , p(B) = totalB total , p(A|B) = x1 total p(B), p(B|A) = x1 total p(A). Ejemplo

En la elaboración de 1800 jamones, se han utilizado 800 piezas con grasa y 1000 con poca grasa. Además, de los 1100 jamones con calificación de óptimo, 500 de ellos tienen poca grasa.

grasa no grasa ´

optimo 600 500 1100

no ´optimo 200 500 700

800 1000 1800

1. ¿Cuál es la probabilidad de que un jamón esté elaborado con poca grasa? 1000

1800 = 0.5555, 55 %.

2. ¿Cuál es la probabilidad de que un jamón elaborado con grasa sea calificado de óptimo? 600₈₀₀ = 0.75, 75 %.

3. ¿Cuál es la probabilidad de que un jamón sea óptimo y con grasa? 600

1800 = 0.333, 33 %.

Independencia de sucesos

Es un concepto muy importante. Dos sucesos van a ser independientes, cuando la ocurrencia de uno no est´a ligada en absoluto a la ocurrencia del otro.

Por tanto, A y B ser´an independientes si la probabilidad condicionada es la misma que sin condi-cionar:

p(A|B) = p(AB)

p(B) =p(A), p(B|A) =

p(BA)

p(A) =p(B)

De las igualdades anteriores se deduce un c´alculo de probabilidad muy importante. Si A y B son sucesos independientes, entonces

p(AB) =p(A)p(B) =p(BA)

Pero ¡mucho cuidado con esto!, la probabilidad conjunta es el producto de probabilidades si tenemos la seguridad de que son sucesos independientes.

(10)

Ejemplo

Siguiendo con el ejemplo de los jamones anterior, nos preguntamos si son independientes los sucesos tener calificaci´on de ´optimo y tener grasa.

Si son independientes, la probabilidad de tener calificación de óptimo será la misma, sin depender de la grasa:

p(´optimo|grasa) = 0.75̸= 0.61 =p(´optimo)

Luego no son sucesos independientes. Adem´as, comprobamos que no se verifica el resultado te´orico ante-rior:

p(´optimocdotgrasa) = 0.333̸=p(´optimo)p(grasa) = 0.27

Teorema de Bayes

Introducci´

on al Teorema de Bayes. Inversi´

on de condiciones

Analizar los s´ıntomas asociados a una enfermedad, es relativamente f´acil, si se dispone de los medios claro. Se trata de hacer un estudio con pacientes con dicha enfermedad y apuntar los s´ıntomas. Si real-izamos el estudio un n´umero indefinido de veces, la frecuencia relativa de cada uno de los s´ıntomas es la probabilidad de cada s´ıntoma asociado a la enfermedad. Es una probabilidad condicionada:

p(s´ıntoma|enfermedad) = p(s´ıntoma·enfermedad)

p(enfermedad) O bien, dada una causa, analizamos la probabilidad del efecto que produce:

p(efecto|causa) = p(efecto·causa)

p(causa)

Sin embargo, nuestra información es el s´ıntoma, y no la causa. La fiebre puede estar causada por más enfermedades (causas) que la gripe, y es al médico a quién corresponde decidir cuál es la causa más probable que la origine.

Esta va a ser la idea del teorema de Bayes, “darle la vuelta a la situación”, y por tanto, decidir, cuando se tiene fiebre, cuál es la probabilidad de que sea debido a gripe, a infección, a un virus,...

La primera aproximación al teorema es laFórmula de inversión de condiciones. Supongamos conocida lap(A|B) (que es lap(efecto|causa)). Entonces, la fórmula que invierte condiciones es:

p(B|A) =p(A|B)·p(B)

p(A) p(causa|efecto) =

p(efecto|causa)p(causa)

p(efecto)

L´ogicamente, aqu´ı necesitamos una informaci´on “extra”, que es la probabilidad del s´ıntoma, o efecto. Ejemplo

Tenemos 100 gatos, de los cuales 40 tienen hipertiroidismo felino (HF). Analizamos en ellos dos s´ıntomas: “alteración en el pelo” (AP) que se da en 34 gatos, de los cuáles 24 desarrollan la enfermedad y “pérdida de peso” (P P) que la presentan 38 gatos, de los cuales 30 desarrollan la enfermedad. Analicemos la información:

Directa: dada la enfermedad, ¿cu´al es la probabilidad de los s´ıntomas?

p(AP|HF) = p(AP·HF) p(HF) = 24 40 = 0.6, p(P P|HF) = p(P P·HF) p(HF) = 30 40= 0.75 Inversa: dado el s´ıntoma, ¿cu´al es la probabilidad de enfermedad?

p(HF|AP) =p(AP|HF)·p(HF) p(AP) = 0.6·0.4 34 = 0.71, p(HF|P P) = p(P P|HF)·p(HF) p(P P) = 0.75·0.4 0.38 = 0.79 C. Ferreira

(11)

Teorema de Bayes

Situaci´on: tenemos un efecto (s´ıntoma). Y reunimos todas las posibles causas (enfermedades) que pueden originar dicho s´ıntoma. Las causas las suponemos excluyentes, es decir, no pueden ser dos a la vez. Queremos analizar la probabilidad de que, para ese s´ıntoma, se de una enfermedad determinada.

Informaci´on de la que disponemos: Un s´ıntomaS.

ncausas posibles excluyentes:C1, C2, . . . , Cn,Ci∩Cj=ϕ,i̸=j.

Conocemos la probabilidad de cada causa:p(Ci),i= 1, . . . , n.

Las causas llenan el espacio de posibilidades de dicho s´ıntoma:∑n_i₌₁p(Ci) = 1.

Conocemos tambi´en la probabilidad condicionada de que dada una causa se produzca el s´ıntoma:

p(S|Ci),i= 1, . . . , n.

El Teorema de Bayes, nos da la probabilidad de que, dado el s´ıntoma, la enfermedad sea una determinada:

p(Ck|S) = p(S|Ck)·p(Ck)

p(S|C1)·p(C1) +p(S|C2)·p(C2) +p(S|C3)·p(C3) +· · ·+p(S|Cn)·p(Cn) .

Observemos que el denominador es la probabilidad de que se produzca el s´ıntoma:

p(S|C1)·p(C1) +p(S|C2)·p(C2) +p(S|C3)·p(C3) +· · ·+p(S|Cn)·p(Cn).

Ejemplo

Los envases de tetrabrick son producidos en grandes bobinas. Una misma bobina contiene varios rollos con secuencias de envases, y cada rollo recibe una numeración (1 a 5) que permite identificar en qué posición de la bobina fue producido un determinado envase. Cada rollo procesa el 20 % de los art´ıculos, y la probabilidad de que se produzca un envase defectuoso var´ıa según el rollo: delr1, 0.005,

del r2, 0.002, delr3, 0.001, delr4, 0.002 y del r5, 0.005. ¿Cu´al es la probabilidad de que un envase sea

defectuoso?, si un envase es defectuoso ¿con qu´e probabilidad pertenece a alguno de los cinco rollos? Las causas son los rollos:p(ri) = 0.2, i= 1, . . . ,5

Las probabilidades condicionales, de que sea defectuoso debido a un rollo u otro:

p(defectuoso|r1) =p(defectuoso|r5) = 0.005, p(defectuoso|r2) =p(defectuoso|r4) = 0.002

p(r1|defectuoso) =p(r5|defectuoso) = 0.33,33 % p(r2|defectuoso) =p(r4|defectuoso) = 0.13,13 %

p(r3|defectuoso) = 0.06, 6 %