TEMA 64. Probabilidad Compuesta. Probabilidad condicionada. Probabilidad total. Teorema de Bayes.

(1)

Jose Luis Lorente (preparador oposiciones secundaria www.joseluislorente.es) 1

TEMA 64. Probabilidad Compuesta. Probabilidad

condicionada.

Probabilidad total. Teorema de Bayes

.

1. Introducción.

1.1 Histórica.

Los conceptos de azar e incertidumbre son tan viejos como la propia civilización. La humanidad siempre ha debido soportar la incertidumbre del clima, de las cosechas y otros aspectos de medio que lo rodea, así como buscar los efectos que los regulan para tratar de reducir las probabilidades que generan efectos negativos.

El origen de la probabilidad desde un punto de vista matemático se cree que surge con los juegos de azar. Así en el Egipto antiguo ( 3500 aC) se tiene constancia de la existencia de juegos de azar practicado con objetos de hueso, siendo estos los predecesores de los dados actuales. También los egipcios construyeron dados con marcas como los actuales.

Se suele aceptar como el comienzo de la teoría matemática de la probabilidad con Fermat y Pascal, matemáticos franceses del siglo XVIII. Estos lograron calcular la probabilidad exacta para ciertos juegos de azar relacionados con los dados. Desde este momento la teoría de la probabilidad ha sido constantemente desarrollada y aplicada a más diversos campos de estudio.

1.2. Espacio de probabilidad.

En este tema se usará la concepción matemática de la Teoría de Probabilidad sin tener en cuenta las concepciones filosóficas que la soportan. Para usarla tenemos en cuenta los tres elementos fundamentales que forman un espacio de probabilidad:

• Ω el espacio muestral, que es conjunto de todos los resultado posibles distintos de un experimento aleatorio.

• S es el conjunto de todos los sucesos que se dan sobre Ω (técnicamente es un σ-álgebra de sucesos sobre Ω):

1) Ω∈S

2) Si A∈S Ac∈S 3) Si A y B∈S A∪B∈S

• ℘ es la función de probabilidad que refleja la regularidad estadística del experimento; es una función real definida sobre S, ℘: S → _ℝ, que satisface los siguientes axiomas:

1) ℘(A)≥0, ∀A∈C 2) ℘(Ω)=1 3)

( ) { }

1 1 1 , n n n n n n A A A ∞ ∞ ≥ = =   ℘_ _= ℘ ∀



U



∑

,An sucesos incompatibles dos a dos (Ai∩Aj=∅, ∀ i≠j) Notar que independientemente del concepto probabilístico a partir del cual se calcule la probabilidad (Laplace, experimental o subjetiva) han de cumplir estos requisitos.

Con estos elementos se trata el problema de formalizar la idea intuitiva de que la “información” aportada por el hecho de que haya ocurrido un suceso B, ha de ser recogida cambiando el espacio de probabilidad de partida.

(2)

2. Probabilidad condicionada.

Definición: Sea el espacio de probabilidad (Ω,S, ℘), con A∈S y ℘ (A) ≠ 0, Se llama probabilidad de un suceso B condicionada a que haya ocurrido el suceso A y se denota como ℘(B/A) a la probabilidad de que habiendo ocurrido el suceso A ocurra el suceso B.

Para ver la relación de al valor ℘(B/A) utilizaremos la teoría de la probabilidad Clásica. Si realizamos el experimento llamaremos N al número de sucesos elementales de Ω, y el número de sucesos que cumplen A, B y A∩B son NA, NB y NA∩B respectivamente. Si queremos ver la probabilidad de que ocurra A sabiendo que ha ocurrido B los casos favorables vendrán dado por los comunes a ambos, NA∩B, siendo los casos totales

(sabiendo que ha ocurrido B) NB. ℘

(

)

) ( B) (A / B N N N N N N B A B B A B B A ℘ ∩ ℘ = = = ∩ ∩ Conclusión:

(

)

) ( B) (A / B B A ℘ ∩ ℘ = ℘

Veamos un ejemplo de la definición anterior.

Ejemplo 1: Consideremos el experimento consistente en lanzar un dado. Calcular la probabilidad de que el resultado sea par, sabiendo que es mayor que tres.

Sea A el suceso correspondiente a que el resultado sea mayor que tres, A=(4,5,6) y B el suceso de que el resultado sea par B=(2,4,6).Entonces A∩B=(4,6) ⇒ P(A∩B) = 2/6. Por otra parte P(A)=3/6, y la probabilidad pedida es P(B/A)=P(A∩B)/P(A) =2/3.

Proposición 1: Sea (Ω,S,℘) un espacio de probabilidad y sea un suceso A∈S con ℘(A)≠0. Se considera la aplicación ℘A: S [0,1] definida como ℘A(B)= ℘(B/A)= ℘ (B)/ ℘(B∩A), entonces la terna (Ω,S,℘A) es un espacio de probabilidad.

Demostración:Partiremos de que ℘ es función de probabilidad, veamos que lo es ℘A

:

1. ∀ B ∈ S: ℘A(B)= ℘(A∩B) /℘ (A) ≥ 0 (al ser ℘ función de probabilidad). 2. ℘A(Ω) = ℘ (A∩Ω) / ℘ (A) = ℘ (A) / ℘ (A) = 1.

3. ∀ B,C∈ S, con B∩C = ∅: (B∩A)∩(C∩A) =(B∩C)∩A= ∅ ⇒

℘A(B∪C)= ( ) ( ) (A) A) (C A) (B ) ( ) / ) (( C B A A C B A A +℘ ℘ = ℘ ∩ ℘ + ∩ ℘ = ℘ ∪ ℘ Propiedades

1) Si Ω es espacio total se cumple que ℘(Ω/A)=1

2) Si B es el suceso complementario de B ⇒ ℘(B)= 1-℘(B)

3) Si B ⊂ C ⇒ ℘(B/A) ≤ ℘(C/A) 4) Si B ⊂ A ⇒ ℘(B/A) ≤ ℘(B)/ ℘(A)

(3)

Jose Luis Lorente (preparador oposiciones secundaria www.joseluislorente.es) 3 5) Si A ⊂ B, ⇒ ℘ (B/A) = 1. 6) Si A∩B = ∅, ⇒ ℘ (B/A) = 0 Demostración 1) ℘ (Ω/A) = ) ( ) ( A A ℘ ∩ Ω ℘ = ) ( ) ( A A ℘ ℘ = 1.

2) ℘(B/A)= ℘(Ω-B/A) = ℘(Ω/A)- ℘(B/A) = 1-℘(B/A). (Hemos usado la definición, la definición del complementario y la propiedad 1).

3) Si B ⊂ C ⇒ B∩A ⊂ C∩A ⇒ ℘(B∩A) ≤ ℘(C∩A) ⇒ ℘(B/A) ≤ ℘(C/A) 4) Si B ⊂ A, ⇒ ℘(B/A) = ) ( ) ( A B A ℘ ∩ ℘ = ) ( ) ( A B ℘

℘ _{. (Hemos usado la definición y que al ser B ⊂}

A se tiene que A∩B = B ). 5) Si A ⊂ B, ⇒ ℘(B/A) = ) ( ) ( A B A ℘ ∩ ℘ = ) ( ) ( A A ℘ ℘

= 1. (Hemos usado la definición y que al ser A ⊂ B se tiene que A∩B = A ).

6) Si A∩B =∅, ⇒ P(B/A) = ) ( ) ( A P B A P ∩ = ) ( ) ( A P P ∅ = ) ( 0 A ℘ =0.

3. Teorema de la probabilidad compuesta. Teorema del producto.

El teorema de la probabilidad compuesta se puede ver como un corolario de la probabilidad condicionada.

Teorema de la probabilidad compuesta: Sea (S,Ω, ℘) un espacio de probabilidad y sean

A, B ∈S siendo ℘(A)≠0. Entonces ℘(A∩B)= ℘(A)·℘(B/A). Este resultado se puede generalizar para n sucesos cualesquiera ℘(A1∩A2…∩An)= ℘(A1)·℘(A2/A1)·…· ℘(An/A1∩…An).

Demostración de ℘(A∩B)=℘(A)·℘(B/A) es un corolario de la definición de la probabilidad condicionada:

(

)

) ( B) (A / B B A ℘ ∩ ℘ =

℘ . La fórmula para n sucesos se demuestra por inducción sobre n, número de sucesos.

- Si n=1: ℘(A1∩A2)= ℘(A1)·℘(A2/A1)

- Hipótesis de inducción: ℘(A1∩A2…∩An-1)= ℘(A1)·℘(A2/A1)·…· ℘(An-1/A1∩…An-2)

- Para n+1: Si llamamos B= A1∩A2…∩An-1 tenemos que ℘( A1∩A2…∩An)= ℘(B∩A): ℘(A1∩A2…∩An)=℘(B∩An)=℘(B)·℘(B/An)=℘(A1∩A2…∩An-1)·℘(An/A1∩…An)=

℘(A1)·℘(A2/A1)·…· ℘(An/A1∩…An).

Ejemplo 2:Calcular la probabilidad de que al tirar un dado sea par, mayor que 2 y menor que 5. A1=”par”={2,4,6}, A2=”mayor que 2”={3,4,5,6}, A3=”menor que 5”={1,2,3,4}

℘(A1∩A2∩A3)= ℘(A1)· ℘(A2/A1)·℘(A3/A1∩A2)=

totales casos fav casos = = 6 1 2 1 · 3 2 · 2 1

(4)

4. Sucesos dependientes e independientes.

En general P(B/A) ≠ P(B) y decimos en tal caso que B depende de A. Si P(B/A)=P(B) diremos que B es independiente de A, es decir, la ocurrencia de A no modifica la probabilidad de B.

Definición0: Dado un espacio de probabilidad (Ω,S,℘) se dice que A y B∈S son independientes si la probabilidad de que ocurra uno no depende de que haya ocurrido antes el otro suceso, es decir ℘(B/A)= ℘(B). Los sucesos que no son independientes se llaman dependientes, es decir ℘(B/A)≠ ℘(B).

Proposición 1: Sean A y B sucesos independientes, se cumple la probabilidad de que ocurran los dos sucesos, es decir A∩B, es igual al producto de las dos probabilidades: ℘(A∩B) = ℘(A)·℘(B).

Demostración: es trivial por la definición de sucesos independientes ℘(A∩B) = ℘(A)·℘(B/A)=℘(A)·℘(B).

Obsérvese que no se ha hecho ninguna restricción sobre ℘(A) ó sobre ℘(B). Así pues, el concepto de independencia es válido aun cuando ℘(A) ó ℘(B) sea cero. De la definición se deduce que en la independencia de dos sucesos no influye el orden en que se den dichos sucesos.

Hay que hacer notar también el carácter recíproco de la definición de independencia. Es lo mismo decir A y B independientes, A es independiente de B, ó B es independiente de A, ya que cualquiera de las tres afirmaciones lleva implícita las otras dos.

Se da frecuentemente el caso de que se confunden sucesos incompatibles con sucesos independientes, observemos que los sucesos incompatibles son los más dependientes que existen, puesto que la ocurrencia de uno de ellos proporciona la máxima información: el otro suceso no va a ocurrir.

Proposición 2: Sea (Ω,S, ℘) un espacio de probabilidad y sea A,B∈S con ℘ (A) = 0 ó ℘(A) = 1. Entonces A y B son independientes.Demostración:

- Si ℘(A)=0℘(A∩B)≤ ℘(A)=0, como es definida positiva ℘(A∩B)=0=℘(A)·℘(B) - Si ℘(A)=1℘(Ω-A)=0 y ℘((Ω-A)∩B)=0. Calculemos ℘(B)=℘(A∩B)+℘((Ω-A)∩B)=

℘(A∩B)+0 ℘(A∩B)= ℘(B)=℘(B)·℘(A)= ℘(B)

Proposición 3: Sea (Ω,S,℘) un espacio de probabilidad y sean A,B∈ S. Entonces son equivalentes:

a) A y B son independientes. b) A y Ω-B son independientes. c) Ω-A y B son independientes. d) Ω-A y Ω-B son independientes.

(5)

Demostración

Si ℘(A)=0 ó ℘(A)=1 el resultado es trivial. Vamos a demostrarlo siguiendo las siguientes implicaciones a) ⇒ b) ⇒ d ⇒ c) ⇒ a)

a) ⇒ b) A y B son independientes ⇒℘(B/A)=P(B) ⇒

℘ (Ω-B/A)= ℘A(Ω-B)= 1-℘A(B) = 1-℘(B)= ℘(Ω-B) ⇒ A y Ω-B son independientes. b) ⇒ d) Es el resultado a) ⇒ b) aplicado a los sucesos Ω-B y A.

d) ⇒ c) Es el resultado a) ⇒ b) aplicado a los sucesos Ω-A y B. c) ⇒ a) Es el resultado a) ⇒ b) aplicado a los sucesos B y Ω-A.

Ejemplo 3: Se tienen los siguientes ejemplos intuitivos de sucesos independientes: a) El suceso de que un determinado día haga calor es independiente del día de la

semana.

b) El sexo de un recién nacido es independiente del color de los ojos de su madre. c) Si se extraen cartas de dos barajas, el resultado de una extracción es

independiente de la otra

Los siguientes casos son ejemplos de sucesos dependientes:

a) El color de los ojos de una persona no es independiente del color del cabello. b) El peso de una persona no es independiente de la altura.

c) La existencia de accidentes de tráfico depende del estado atmosférico.

Ejemplo 4: En los experimentos de extracciones sucesivas de objetos de un montón se suelen dar dos posibilidades:

a) Extracciones con reemplazamiento: Se dan este tipo de extracciones cuando el objeto extraído se devuelve al montón antes de hacer cada extracción. En este caso el resultado de cada experimento es independiente de los resultados anteriores.

b) Extracciones sin reemplazamiento: Se considera que las extracciones son sin reemplazamiento cuando el objeto extraído se mantiene fuera del montón al hacer las restantes extracciones. Según esto el espacio muestral del experimento depende de los resultados anteriores, por lo que los sucesos son dependientes.

Vamos a terminar este apartado con la extensión de la definición de independencia a un conjunto de sucesos.

Definición: Sea el espacio de probabilidad (Ω, S, ℘). Sean A1, A2, ..., Ak∈S. Se dice que los sucesos A1, A2, ..., Ak son mutua o completamente independientes si ℘(Ai/Aj)= ℘(Ai) con i≠j

Proposición 4: Si A1, A2, ..., Ak son completamente independientes se cumple la siguiente igualdad: ℘(A1,∩A2∩ ... ∩Ak) = ℘(A1)· ℘(A2) ... ·℘(Ak).

(6)

Jose Luis Lorente (preparador oposiciones secundaria www.joseluislorente.es) 6 Demostración: Se cumple ℘(A1,∩A2∩ ... ∩Ak) = ℘(A1)·℘(A2/A₁) ...℘(Ak /A₁∩…∩A_k-1) al ser independientes ℘(Ai/Aj)=℘(Ai) y ℘(Ai/Ak)=℘(Ai) y por tanto ℘(Ai/Aj∩Ak)=℘(Ai) e igual para todas las intersecciones. Luego se cumple que igualdad.

Ejemplo 5: Extraemos 3 bolas de una urna que contiene 2 blancas y 3 negras. Calcular la probabilidad de que saquemos todas blancas si cada vez que se saca se vuelve a introducir en la urna. B1=”1ª bola blanca”, B2=”2ª bola blanca”, B3=”3ª bola blanca”. Como se vuelven a introducir la bola son todos los sucesos independientes, cumpliendose ℘(Bi)=2/5. Al ser todos los sucesos independientes es fácil calcular lo pedido: ℘(A1∩A2∩A3)=ቀଶ_ହቁ

ଷ

5. Sistema completo de sucesos Probabilidad total.

Definición: Sea el espacio de probabilidad (Ω,S,℘). Se llama sistema completo de sucesos

a cualquier conjunto {A_n}_n_∈_F ⊂S, donde F es un conjunto numerable en el que se verifican: a) ∀ m,n ∈F con m≠n: ℘ (An∩Am)=0. b)

∑

℘( )=1 ∈F n n A

Nota: si los sucesos equiprobables (sistema Laplaciano) se cumple ℘(A1)=… ℘(An)=1/n

Proposición 5: Sea (Ω,S,℘) un espacio de probabilidad y {A_n}_n_∈_F es un conjunto numerable en el que se verifican:

a) ∀ m,n ∈F con m≠n: An ∩Am =∅ b)

U

F

n∈ An=Ω

Entonces {A_n}_n_∈_F es un sistema completo de sucesos.

Demostración: a) ∀ m,n ∈F con m≠n: ℘ (An∩Am)=0 (nota es trivial porque An ∩Am =∅)

b) ( ) ( .... ) 1 ( ) ( ) ( ) ... ( ) 0 , 2 1∪ ∪ = → Ω = − ∩ + = + ℘ = Ω ℘

∑

i i j i j i i i n p p A p A A p A A A A

Teorema de la probabilidad total: Sea (Ω,S,℘) un espacio de probabilidad y {A_n}_n_∈_F

un sistema completo de suceso. Sea B∈Ω. Entonces:

) / ( )· ( ) ( _n F n n B A A B = ℘ ℘ ℘

∑

∈ Demostración: Sea _n F n A

U

∈ =

Ω , entonces se cumple que ( ) _=1

     ℘ = Ω ℘ ∈

U

F n n A . Se

cumple también que

(

)

(

)

_

     ∩ ℘ = ∪ ∩ ℘ = ∩ Ω ℘ = ℘

U

n n n n A B A B B B) ( ) ( .

(7)

Jose Luis Lorente (preparador oposiciones secundaria www.joseluislorente.es) 7 Por otro lado se cumple que si n≠m ℘

(

A_n ∩A_m

)

=0

(

) (

)

(

∩ ∩ ∩

)

=℘

(

∩ ∩

)

≤

℘ B A_n B A_m B A_n A_m ℘

(

A_n ∩A_m

)

=0

(

) (

)

(

∩ ∩ ∩

)

=0

℘ B A_n B A_m

(

B∩A_i

)

y

(

B∩A_j

)

son sucesos incompatibles si i≠j. De esta

manera se cumple que ( )

(

)

( )· ( )· ( / _n)

F n n F n n n n B A A B A A B B _= ℘ ∩ = ℘ ℘      ∩ ℘ = ℘

∑

∈ ∈

U

Veamos un ejemplo para ilustrar este resultado.

Ejemplo 6: Tres máquinas A, B y C producen bombillas. A produce el 30%, B el 45% y C el 25% de la producción total. Si el 75% de las bombillas producidas por A son buenas, el 60% de las de B también y la proporción de bombillas buenas producidas por C es del 80%, hallar la probabilidad de que una bombilla extraída al azar sea buena

Solución: Llamando A, B y C a los sucesos de que la bombilla elegida haya sido producida por las máquinas A, B y C, respectivamente, se tiene que P(A) = 0.3, P(B) = 0.45, y P(C) = 0.25. Llamando H al suceso consistente en extraer una bombilla correcta, los datos sobre la calidad de la producción se expresan por:

P(H/A) = 0.75, P(H/B) = 0.6, P(H/C) = 0.8.

La probabilidad total buscada es la suma de los productos a lo largo de cada rama que conduce hacia el suceso H:

P(H) = 0.3·0.75 + 0.45·0.6 + 0.25·0.8 = 0.695

6. Teorema de Bayes.

Teorema de Bayes: Sea (Ω,S ,℘) un espacio de probabilidad y {A_n}_n_∈_Fun sistema completo de sucesos. Sea B∈S con P(B)≠ 0. Entonces:

) / ( )· ( ) / ( )· ( ) ( ) / ( )· ( ) / ( : n F n n k k k k k A B A A B A B A B A B A F k ℘ ℘ ℘ ℘ = ℘ ℘ ℘ = ℘ ∈ ∀

∑

∈ Demostración: ) / ( )· ( ) / ( )· ( ) / ( )· ( ) ( ) / ( )· ( ) ( B A B B A A Despejando B A B A B B A A B A ℘ ℘ = ℘ ℘ ℘ ℘ = ∩ ℘ ℘ ℘ = ∩ ℘ Notación:

Las probabilidades P(Ak/A) se denominan “probabilidades a posteriori”.

Las probabilidades P(A/Ak) se denominan “probabilidades a priori”.

(8)

Jose Luis Lorente (preparador oposiciones secundaria www.joseluislorente.es) 8 Acerca de la interpretación del teorema de Bayes si los A1, A2,...., son considerados como hipótesis sobre alguna cuestión en estudio y tenemos una cierta información, subjetiva o no, acerca de dichas hipótesis An, reflejada ésta por las P(An) ( >0 ), supongamos se produce un suceso B asociado a un experimento aleatorio (usualmente provocado por el experimentador para obtener la alteración, provocada por B, en nuestras hipótesis An, dándonos las probabilidades a posteriori P(An/B). Usualmente se continuará el proceso provocando otro sucesos C (es decir, obteniendo otro nuevo resultado de nuestro experimento aleatorio considerado) y utilizando ahora las P(An/B) antes calculadas como probabilidades a priori.

En resumen el teorema de Bayes consiste en calcular las probabilidades a posteriori conocidas las probabilidades a priori.

La gran dificultad que conlleva la aplicación del teorema de Bayes es la forma aleatoria con que suelen determinarse las probabilidades P(An).

Ejemplo 7: Consideremos la situación en la cual tenemos una urna con composición desconocida, aunque sabemos tiene que ser o bien la llamada urna I, con tres bolas rojas y dos bolas blancas, o bien la llamada urna II, con cuatro bolas blancas y una bola roja.

Si realizamos dos hipótesis: A1: “la urna que tengo delante es la I”, A2: “la urna que tengo delante es la II”, podemos considerar que P(A1) = P(A2) = 1/2; con objeto de obtener más información acerca de la urna desconocida extraigo una bola de ellas (podemos pensar en el coste por extracción como impedimento para extraerlas todas y eliminar así la incertidumbre acerca de la urna) y resulta ser blanca (suceso B). Por medio del teorema de Bayes tenemos que nuestra información a priori ha cambiado siendo ahora P(A1/B) = 1/3 y P(A2/B) = 2/3, pudiendo extraer otra bola caso de que se desease obtener más información, considerando ahora a 1/3 y 2/3 como probabilidades a priori de A1 y A2 respectivamente.

7. Conclusiones

La probabilidad se introduce en los cursos de 2º y 3º de la Eso teneindo un peso más fuerte en las dos ramas de las dos matemáticas del 4º curso, donde ya se habla de la probabilidad condicional y de la probabilidad total (no así del teorema de Bayes) .

La probabilidad cobra más importancia en el curriculum de bachillerato, en especial en el bachillerato de ciencias sociales. En el primer curso de bachillerato, tanto en ciencias sociales como en el bachillerato de ciencias está por primera vez el teorema de Bayes en el curriculo de matemáticas.

La probabilidad total y el teorema de Bayes es un ejercicio típico en el examen de selectividad de Matemáticas aplicadas a las ciencias sociales.