Probabilidad
Memo Garro
Agosto de 2004
Una ciencia, que en una independencia imaginaria, ve la formaci´on de la praxis, a la cual sirve y es inherente, como algo que est´a m´as all´a de ella, y que se satisface con la separaci´on del pensar y del actuar, ya ha renunciado a la humanidad. Marcuse.
Introducci´on
Es este art´ıculo el primero de una serie de trabajos que a lo largo del curso se entregar´an a ustedes. La finalidad no ser´a, de modo alguno, sustituir la exposici´on en clase. M´as bien se presenta como material de apoyo primario, desde un punto de vista pedag´ogico. Y tal vez su pretensi´on m´as alta es colaborar con su aprendizaje. Se pretende adem´as motivar el inter´es por la invesigaci´on propia, al presentarse breves bosquejos de la teor´ıa probabil´ıstica atual y cl´asica. La estructuraci´on de estas hojitas ser´a libre y sencilla, contendr´a siempre los elementos esenciales de los temas tratados, dejando algunas comprobaciones y demostraciones al ingenio suyo; por lo dem´as, es-pero que aqu´ı encuentren las ejemplificaciones suficientes que ayudan a comprender los conceptos estudiados.
Por otra parte, el autor de estos escritos estar´a siempre pendiente de cualquier comentario, correcci´on, censura o colaboraci´on que ustedes deseen hacer en los art´ıculos sucesivos. Sin m´as que decir, espero disfruten este primer apunte.
1
Aleatoriedad, experimento, evento y probabilidad
en tal caso, en rigor, la palabra aleatoriedad no dista mucho de su significaci´on que adquiere en la cotidianidad de la existencia.
Por otro lado, a´un ante la vivencia f´ısica de fen´omenos aleatorios solemos reconocer ciertas propiedades que caracterizan diferenteseventosrelacionados con el fen´omeno en cuesti´on los cuales pueden ocurrir o no. Por ejemplo, supongamos que sobre una pista hemos ordenado 9 pinos numerados y lanzamos una bola de boliche. En este caso, los eventos quedan definidos mediante una propiedad asociada al resultado de lanzar la bola sobre los pinos, como decir: ”el primer pino que cae es el que porta el n´umero 9”, o tambi´en ”el ´ultimo en caer es el 7”, etc. De manera que un evento caracteriza la naturaleza de nuestro experimento (o la de cualquier otra situaci´on sujeta a repetici´on o no) sin ser necesaria su ocurrencia. En la teor´ıa moderna de la probabilidad, los eventos no est´an necesariamente asociados a fen´omenos sujetos a comprobaci´on real, sino a ciertas especificaciones te´oricas. Fuera de las aplicaciones el vocablo ”evento” tiene un papel dentro de un esquema meramente de nomenclatura. En cualquier caso (sea en las aplicaciones o en campo te´orico) los eventos son especificados abstractamente mediante el uso de literales. Por ejemplo, el lanzar una moneda arroja dos posibles eventos: uno, que el resultado sea ´aguila, el cual podemos denotar simplemente con la letra A; el evento contrario, cuando el resultado es sol, puede ser simplemente denotado con la letra B.
Sin embargo, ciertas reglas de la l´ogica formal (mejor llamada sentido com´un) aplicadas a la experiencia de fen´omenos aleatorios reales son tambi´en extendidas de alg´un modo a las consideraciones te´oricas de la probabilidad. As´ı, por ejemplo, si ahora presenciamos (o realizamos) el experimento de lanzar un dado de seis caras numeradas, en primera instancia es necesario determinar todos los posibles resultados de modo que podamos definir eventos concretos los cuales est´en relacionados efectivamente con dicho experimento (un evento para este experimento es: el dado cae en el n´umero 5, el cual es posible; sin embrgo, el enunciado ”cae ´aguila”, carece de sentido en este caso, por ser imposible). La colecci´on de estos resul-tados es conocido como espacio muestral o total, y la notaci´on est´andar es la letra griega may´uscula Ω (omega). As´ı en el caso de los dados tenemos que
Ω = {1,2,3,4,5,6},
donde los n´umeros simplemente denotan el posible resultado de lanzar el dado. Ahora bien, si A denota el evento que consiste en que el resultado de lanzar el dado es par, entonces es natural considerar tal evento como un subconjunto de Ω con tan s´olo poner A = {2,4,6}. Del mismo modo, una expresi´on matem´atica para el evento consistente en que el dado caiga en un n´umero par mayor que tres es simplemente B = {4,6}. De esta forma, un evento es un subconjunto del espacio total Ω de todos los posibles resultados.
Del mismo modo, si A y B denotan dos eventos de un mismo experiemento, es l´ogico es-tablecer que la uni´onA∪B es tambi´en un evento relacionado con el mismo experimento, pues su interpretaci´on se enuncia como un evento compuesto, esto es: ocurre el evento A, o bien ocurre el eventoB. Lo mismo puede decirse de la operaci´on intersecci´on (A∩B), siendo su interpretaci´on enunciada como sigue: ocurre el eventoAyocurre el eventoB. Y de un modo similar podemos deducir interpretaciones para uniones e intersecciones de cualquier n´umero finito de eventos. En general, dentro de esta ´optica conjuntista, cualquier operaci´on finita entre eventos (diferencia, complementaci´on, etc.) de un experimento dado puede interpre-tarse como un nuevo evento tambi´en relacionado con el experimento en cuesti´on.
Ahora bien, en la realizaci´on de un experimento aleatorio espec´ıfico (cuyo resultado no est´a ´
unicamente determinado), los eventos en consideraci´on pueden ocurrir o no y en t´erminos generales no es posible asegurar c´uales lo har´an y cu´ales no. Sin embargo, si el experimento puede repetirse un n´umero fijo de veces, seguramente ser´a posible observar la frecuencia relativa con que cada evento ocurre, de modo tal que puedan ser ordenados seg´un la am-plitud de dicha frecuencia, desde los que ”casi no ocurren”, hasta los de mucha frecuencia (valga aqu´ı la redundancia). Por ejmeplo, si consideramos el experimento de lanzar 3 da-dos honestos varias veces nos daremos cuenta de que el evento ”sale 6 en los tres dada-dos” es muy poco frecuente, mientras que el evento ”la suma de los resultados de los tres dados es mayor a 3” es bastante frecuente. As´ı, esta diferencia en la amplitud de las frecuencias relativas al experimento habitualmente nos conduce a fijar con cierto grado de credibilidad qu´e eventos pueden ocurrir con ”m´as seguridad”, y la experiencia nos dar´a la raz´on. Esta situaci´on puede interpretarse como una ”medida” de certeza o seguridad con que esperamos que un evento ocurra. Esta medida es la que conocemos como probabilidad de un evento. Medida que en t´erminos num´ericos se encuentra en el intervalo [0,1] por tratarse de una raz´on de frecuencia relativa; o tambi´en es expresada como porcentaje. As´ı, al lanzar una moneda honesta decimos: hay un 50% de probabilidades de que el resultado sea ´aguila; o al lanzar un dado decimos: hay un 15% de probabilidades de que el resultado sea 1. Sin embargo en probabilidad, como diciplina matem´atica, la asignaci´on de probabilidades de determinados eventos puede resultar de una complejidad ajena a la realizaci´on de fen´omenos f´ısicos. Sin embargo, tanto en la modelaci´on pr´actica como en la teor´ıa, una probabilidad siempre puede ser interpretada como unafunci´onla cual est´a definida en la familia que re´une todos lo eventos relacionados con un determinado experimento, y que asigna a cada uno de ellos una medida de ”certeza” de su ocurrencia, de manera que muchas de sus propiedades elementales tambi´en responden a los aspectos l´ogicos que componen nuestra intuici´on acerca del comportamiento de los fen´omenos alaetorios. Entonces, una primera aproximaci´on al concepto de probabilidad la damos en la siguiente definici´on.
Definici´on 1.1 (Medida de Probabilidad). Dado un experimento aleatorio cualquiera, sea Ω el conjunto de todos los posibles resultados (espacio muestral) y tambi´en denotemos por
F la familia de eventos asociados a este experimento (llamada σ-´algebra). Decimos que una funci´on P:A →R es una funci´on (o medida) de probabilidad si se satisface
(i) P[A]≥0 para todo evento A (A ∈ F).
(ii) P[Ω] = 1.
Esta regla se desprende de interpretar el conjunto Ω (de posibles resultados) como el evento seguro, es decir cuya ocurrencia es siempre cierta. Por ejemplo, si lanzamos una moneda, tenemos queΩ = {aguila, sol}, y en t´erminos probabil´ısticos el enunciado que lo describe es: ”evento en que cae ´aguila o sol”, cuya certeza de ocurrencia es segura.
(iii) SiA y B son dos eventos mutuamente excluyentes, entonces
P[A∪B] =P[A] +P[B].
En esta regla eneuncia que la certeza con que ocurre un evento compuesto de dos eventos excluyentes, es la suma de las certezas con que cada uno de ellos ocurre.
Una propiedad de importancia central en probabilidad es la llamada regla de la aditividad finita, la cual es una generalizaci´on de la propiedad (iii) de la definici´on de medida de probabilidad.
Proposici´on 1.1 (Aditividad finita). Si A1,..., An son eventos mutuamente excluyentes entonces
P
" n [
i=1 Ai
#
= n
X
i=1
P[Ai]
Demostraci´on. La prueba es por inducci´on. Cuando n = 2, el resultado se sigue autom´aticamente. Ahora supongamos que el resultado es verdadero para cualesquieran−1 eventos mutuamente excluyentes, y sean A1,..., An eventos mutuamente excluyentes. Tenemos entonces que los eventos Sn−1
i=1 Ai y An son mutuamente excluyentes, luego de la propiedad (iii) de la medida de probabilidad resulta que
P
" n [
i=1 Ai
#
=P
" n−1 [
i=1 Ai
!
∪An
#
=P
"n−1 [
i=1 Ai
#
+P[An].
Ahora, los eventosA1,..., An−1 son tambi´en mutuamente excluyentes, entonces por hip´otesis de inducci´on tenemos que
P
" n [
i=1 Ai
#
= n−1
X
i=1
P[Ai] +P[An] = n
X
i=1
Ejemplo 1.1 (Probabilidad Cl´asica). En muchas ocasiones un experimento puede aceptar N posibles resultados distintos y todos ellos equiprobables, los cuales pueden ser denotados por literales. As´ı en estos casos Ω = {ω1, ..., ωN}, donde el s´ımbolo ωi denota el resultado i-´esimo del experimento en cuesti´on. De este modo tenemos que
P[{ω1}] =P[{ω2}] =· · ·=P[{ωN}].
Ahora bien, en base a la propiedad (ii) de la definici´on de medida de probabilidad sabemos que la probabilidad total es 1, y dado que Ω = SN
i=1{ωi} (esto es, el evento total es igual a la uni´on de todos los posibles resultados), y los eventos {ωi} son mutuamente excluyentes y equiprobables, entonces
1 =P[Ω] =P[{ω1}] +· · ·+P[{ωN}] =NP[{ωi}],
donde i puede ser cualquier n´umero entre 1 y N. De este razonamiento concluimos que
P[{ω1}] =P[{ω2}] =· · ·=P[{ωN}] =
1 N
Por otra parte, este mismo razonamiento puede resultar ´util cuando se trata de asignar probabilidades a eventos m´as complejos relacionados con este experimento. Por ejemplo, si consideramos el evento A := {ωj1, ..., ωj2}, donde n ≤ N, entonces de la propiedad de la
aditividad finita concluimos tambi´en que
P[A] =
n N.
Este m´etodo para asignar probabilidades es conocido como definci´on cl´asica de la probabilidad
Ejemplo 1.2. Consideremos 3 urnas numeradas. La primera contiene 2 bolas rojas y 4 blancas; la segunda urna contiene8bolas rojas y7blancas; finalmente, la tercera urna contine 6 bolas rojas y 4 blancas. Un experimento aleatorio consiste de dos partes. En primer lugar se selecciona una urna la azar. En segundo t´ermino, de la urna elegida se seleciona una bola igualmente al azar. Entonces, seg´un las reglas de aditividad finita y de la probabilidad cl´asica, tenemos que la probabilidad de obtener una bola roja en nuestra extracci´on es de 22/45.
Ejemplo 1.3 (Probabilidad Geom´etrica). Otro m´etodo para asignaci´on de probabilidades es el que se conoce como definici´on geom´etrica de la probabilidad, y refiere problemas tambi´en muy espec´ıficos. Sobre una regi´on (sobre Rk) de ´area finita, la cual llamaremos Ω, definimos
P[A] =
´
area de A ´
area de Ω,
2
Propiedades b´
asicas
Consideremos un modelo de probabilidad (Ω,F,P) de alg´un experimento determinado. De la definici´on para medida de probabilidad dada en la secci´on anterior se desprenden las siguientes propiedades b´asicas que caracterizan una medida de probabilidad.
Proposici´on 2.1. Si A es un evento entonces P[A]≤1 y P[Ac] = 1−P[A].
Demostraci´on. Los eventosA y Ac son mutuamente excluyentes, y su uni´on es Ω, entonces
1 =P[Ω] = P[A] +P[Ac], de donde se desprende queP[A]≤1 (dado que P[Ac]≥0) y que
P[Ac] = 1−P[A].
Proposici´on 2.2. P[∅] = 0.
Demostraci´on. Dado que ∅= Ωc, tenemos que, seg´un la proposici´on anterior,
P[∅] = 1−P[Ω] = 1−1 = 0.
Proposici´on 2.3. SiA yB son eventos tales queA⊂B, entonces P[A]≤P[B] yP[B\A] =
P[B]−P[A].
Demostraci´on. El truco est´a en notar que el eventoB es la uni´on de dos eventos mutuamente excluyentes, a saber, A y B\A. En efecto, no es dif´ıcil probar que B = A∪(B\A) y que A∩ (B\A). De modo que P[B] = P[A] +P[B\A]. De donde P[A] ≤ P[B] y P[B\A] =
P[B]−P[A].
Proposici´on 2.4 (Desigualdad de Boole). Si A1,..., An son eventos entonces
P
" n [
i=1 Ai
#
≤
n
X
i=1
P[Ai]
Demostraci´on. Definiremos una nueva colecci´on de eventos. Sea B1 := A1 y sea Bi := Ai\
Si−1
k=1Ak cuando i ∈ {2, ..., n}. No es dif´ıcil mostrar que los eventos B1,...,Bn son mu-tuamente excluyentes y que Sn
i=1Bi =
Sn
i=1Ai. Entonces, de la propiedad de la aditividad finita tenemos que
P
" n [
i=1 Ai
#
=P
" n [
i=1 Bi
#
= n
X
i=1
P[Bi].
Ahora, de la definici´on de los conjuntosBi se desprende queBi ⊂Ai, de dondeP[Bi]≤P[Ai] para i= 1, ..., n. De este modo
P
" n [
i=1 Ai
#
≤
n
X
i=1
3
Regla de la suma
De mismo modo que la propiedad de la aditividad finita, la regla de la suma es tambi´en de importancia fundamental en probabilidad, por ello merece un apartado.
Proposici´on 3.1. Si A y B son dos eventos cualesquiera entonces
P[A∪B] =P[A] +P[B]−P[A∩B].
Demostraci´on. Tenemos que A∪B =A∪ {B\(A∩B)} y los eventos A y B\(A∩B) son mutuamente excluyentes. De modo que
P[A∪B] =PA∪ {B\(A∩B)]}
=P[A] +P[B\(A∩B)] =P[A] +P[B]−P[A∩B].
Ejemplo 3.1. Dos eventosAyB son tales queP[A] = 3/10,P[B] = 4/10yP[A∩B] = 1/10. Entonces el evento ”ocurre exactamente uno de los dos eventos” est´a determindo por la expresi´on {A\(A∩B)} ∪ {B\(A∩B)}, de donde se sigue que la probabilidad de que ocurra un solo evento se calcula de la manera siguiente:
P{A\(A∩B)} ∪ {B\(A∩B)} =P[A\(A∩B)] +P[B\(A∩B)]
= 3 10−
1 10+
4 10−
1 10
= 5 10.
Por otra parte, la probabilidad de que no ocurra ninguno de los dos eventos est´a dada por la expresi´on
P(A∪B)c = 1−P[A∪B]
= 1− P[A] +P[B]−P[A∩B]
= 1−
3 10+
4 10−
1 10
= 4 10.
Teorema 3.1 (Regla de la suma). Sean A1,..., An eventos cualesquiera. Entonces
P[A1∪A2∪ · · · ∪An] = n
X
j=1
P[Aj]
−X X
i<j
P[Ai∩Aj]
+X X X i<j<k
P[Ai∩Aj∩Ak]
· · ·