• No se han encontrado resultados

MODULO I Probabilidad y Variable Aleatoria

N/A
N/A
Protected

Academic year: 2020

Share "MODULO I Probabilidad y Variable Aleatoria"

Copied!
26
0
0

Texto completo

(1)

Windows uE

PROBABILIDADES Y ESTADISTICA

Notas y guía de ejercicios

MODULO I

-1.10 8.62 18.33 28.05 37.77

4.30 9.03 13.75 18.48 23.20 C rS

0.00 3.75 7.50 11.25 15.00

Variable 0.00 0.10 0.20 0.30 0.40 D e n s id a d

Función de densidad

1.84 3.36 4.88 6.40 7.92 9.45 10.97 12.49 14.01 PbS 0.00 0.07 0.15 0.22 0.29 fre cu e n ci a re la ti va

-8.66 -4.33 0.00 4.33 8.66

Variable 0.00 0.09 0.18 0.28 0.37 D e n si d a d

Función de densidad

T Student(3): p(evento)=0.9500

(2)

UNIDAD I: PROBABILIDAD BASICA

I-

ALGUNAS DEFINICIONES

1.1 Antecedentes

La probabilidad estudia la incertidumbre de las variables definidas según experimentos aleatorios para asignar una medida del grado de certeza de que tales variables tomen un cierto valor. La teoría de la probabilidad se empezó a estudiar en el siglo XVII cuando los matemáticos franceses Pascal y Fermat intercambiaron correspondencia sobre una controversia surgida de observaciones sobre juegos de azar; se trataba de asignar el grado de certeza con que ocurrían determinados resultados en un juego de dados. En el siglo XIX, Laplace demostró que el cálculo de probabilidades podía aplicarse a una gran variedad de problemas científicos y prácticos; sin embargo, fue hasta la tercera década del siglo XX cuando la teoría de probabilidad se desarrolló sobre bases matemáticas sólidas. Desde entonces, esta disciplina se ha aplicado a muchos campos del conocimiento, especialmente a la ingeniería, en donde frecuentemente se utiliza para tomar decisiones bajo incertidumbre, tanto en aspectos de diseño, como de gestión y control.

1.2 Espacio muestral

Se dice que un fenómeno ó experimento es aleatorio si pueden asumirse válidas las siguientes hipótesis:

1. El experimento puede repetirse, y en las mismas condiciones cada vez 2. El conjunto de todos los resultados posibles del experimento es conocido 3. El resultado particular del experimento no puede predecirse (incerteza)

A la colección de todos los resultados posibles de un experimento o modelo aleatorio que caracteriza a un

fenómeno se le llama espacio muestral y a cada uno de esos resultados posibles se le llama punto o

elemento. Un evento es una colección de puntos contenidos en el espacio muestral. Los espacios muestrales son discretos cuando sus puntos son contables o numerables, o continuos cuando sus puntos son incontables o innumerables. Los espacios muestrales discretos pueden ser finitos o infinitos; los continuos son siempre infinitos. Por extensión, los adjetivos continuo y discreto se aplican también a los modelos y a las variables.

En un espacio muestral, dos eventos son mutuamente excluyentes si la ocurrencia de uno de ellos implica la imposibilidad de que ocurra el otro. Si la ocurrencia de dos o más eventos incluye a todo el espacio muestral, tales eventos son colectivamente exhaustivos.

Desde el punto de vista matemático, el espacio muestral es un conjunto; por lo tanto, conviene revisar algunas definiciones y notaciones elementales de la teoría de conjuntos.

Ejemplo 1:

a) supongamos que se considera el experimento de arrojar una moneda, existen dos resultados

posibles, que salga cara o seca, entonces el espacio muestral es Ω = {𝐶, 𝑆}.

b) Si el experimento consiste en arrojar dos monedas, todos los resultados posibles son las

combinaciones de C y S es decir:

Ω = {𝐶𝐶, 𝐶𝑆, 𝑆𝐶, 𝑆𝑆}

a) Ahora si contamos el número de caras en el resultado del caso (a) y (b), entonces Ω = {0,1} y Ω =

(3)

1.3 Elementos de teoría de conjuntos

Un conjunto es una colección bien definida de objetos, elementos, miembros o puntos, que se designa con alguna letra mayúscula. El contenido de los conjuntos se encierra entre llaves y se describe con la relación de sus elementos o con alguna propiedad que los caracteriza Si x es un elemento del conjunto A,

se escribe: x ∈ A. Al número de elementos del conjunto A se le designa con n(A). Si cada elemento de A

pertenece también al conjunto B, pero no todos los puntos de B pertenecen a A, se dice que A es

subconjunto de B (A⊂ B) o que está contenido en B (B⊃ A).

Dos conjuntos son iguales, A=B, si A⊆B y B⊆ A. Si dos conjuntos no tienen elementos comunes, se dice

que los conjuntos son disjuntos.

Un conjunto vacío (Φ) es el que no tiene elementos, por lo que corresponde al evento imposible; en cambio, el conjunto universal (Ω o S) contiene a todos los elementos posibles, por lo que corresponde al evento seguro.

Las operaciones de conjuntos básicas son la unión y la intersección y el complemento, definidas:

Unión: A∪B = {x: x ∈ A ó x ∈ B}

Intersección: A∩B = {x: x ∈ A y x ∈ B}

Complemento: AC = {x: x∈Ω , x ∉ A}

A la representación gráfica de las operaciones se les llama diagrama de Venn. En estos, el rectángulo representa al conjunto universal, las figuras cerradas en su interior representan a los conjuntos y lo sombreado a la operación. Así:

𝐴 ∪ 𝐵 𝐴 ∩ 𝐵 AC

Las principales leyes de conjuntos son:

Idempotencia: A∪A = A; AA = A

Asociativa: (A∪B) ∪ C = A∪ (B∪C)

Conmutativa: A∪B = B∪A

Distributiva: A ∪ (B∩C) = (A∪B) ∩ (A∪C)

Identidad: A∪Φ = A, A∪Ω= Ω ; A∩Φ = Φ , A∩Ω = A

Complemento: A∪A

c

=Ω, (A

c

)

c

= A; A∩A

c

=Φ, Ω

c

= Φ, Φ

c

= Ω

De Morgan: (A∪B)c = Ac ∩Bc ; (A∩B)c = Ac∪Bc

1.4 El diagrama de árbol

La técnica de contar más simple es el llamado diagrama de árbol, que es un dibujo en forma ramificada de la enumeración progresiva del conjunto producto. Por ejemplo, para los eventos representados por los

conjuntos A={a1,a2}, B={b1,b2}, C={c1,c2}, el espacio muestral que contiene las ternas ordenadas de los

(4)

A×B×C={x y z: xεA ,yεB ,zεC}, cuyos elementos son: {a1b1c1, a1b1c2, a1b2c1, a1b2c2, a2b1c1, a2b1c2, a2b2c1, a2b2c2}, que se obtienen fácilmente de un diagrama de árbol.

El diagrama de árbol justifica el principio fundamental de conteo, que establece que si un primer evento

ocurre de n maneras, un segundo de m maneras, un tercero de r maneras y así sucesivamente, entonces el número de maneras en que los eventos pueden realizarse, en el orden indicado, es de n·m·r

Plantear un diagrama de árbol para contar los elementos que forman el espacio muestral:

a) Un médico general clasifica a sus pacientes de acuerdo a: su sexo (masculino o femenino), tipo de

sangre (A, B, AB u O) y en cuanto a la presión sanguínea (Normal, Alta o Baja). Mediante un diagrama de árbol analizar en cuantas clasificaciones pueden estar los pacientes de este médico

(Al contar todas las ramas terminales, nos damos cuenta que el número de clasificaciones son 2 x 4 x 3 = 24 que se pueden enumerar; MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.)

b) Dos equipos denominados A y B se disputan la final de un partido de baloncesto, aquel equipo que

gane dos juegos seguidos o complete un total de tres juegos ganados será el que gane el torneo. Mediante un diagrama de árbol analizar de cuantas maneras puede ser ganado este torneo,

(Hay solo diez maneras de que se gane el torneo, que se obtienen contando las ramas terminales del diagrama de árbol, las que es posible enumerar; AA, ABB, ABAA, ABABA, ABABB, etc, etc.)

c)

Un hombre tiene tiempo de jugar ruleta cinco veces como máximo, él empieza a jugar con un dólar,

apuesta cada vez un dólar y puede ganar o perder en cada juego un dólar, él se va a retirar de jugar si pierde todo su dinero, si gana tres dólares (esto es si completa un total de cuatro dólares) o si completa los cinco juegos, mediante un diagrama de árbol, analizar cuántas maneras hay de que se

efectué el juego de este hombre.

(Hay 11 maneras de que este hombre lleve a cabo sus apuestas, hacer el diagrama hay que representar los cinco juegos o apuestas que este hombre tiene tiempo de jugar).

II. PROBABILIDADES

2.1 Determinación de probabilidad

La probabilidad de ocurrencia de un evento es la medida del grado de certeza con que pudiera ocurrir tal evento; para determinarla se recurre a dos enfoques: el clásico y el frecuentista.

(5)

𝑃(𝐴) = 𝑛(𝐴) 𝑛(Ω )

Entonces, la probabilidad queda definida al determinar n(A) y n(Ω), en el espacio muestral, usando técnicas de contar, y su valor queda comprendido entre cero y uno.

Sin embargo, como definición es débil, porque lo definido se emplea en la definición, ya que igualmente posible es equivalente a con igual probabilidad. Además en la realidad los eventos no siempre son igualmente posibles.

El enfoque frecuentista, introducido por Richard Von Mises en 1936, intenta superar las debilidades

anteriores y considera a la probabilidad de ocurrencia del evento A, P(A), como la relación del número de

veces en que el resultado de un experimento es favorable al evento A, nA, entre el número de veces n que se

realiza ese experimento, cuando tal número es grande; esto es:

𝑃(𝐴) = lim

𝑛→∞

𝑛(𝐴) 𝑛

La diferencia sustancial con el enfoque clásico es que el frecuentista se asocia a resultados de experimentos y no solo a conteos en espacios muestrales teóricos. De nuevo, se verifica que la probabilidad está entre cero y uno. Como definición, este enfoque tiene la debilidad de que supone que siempre se puede definir el experimento con precisión y que, además, se puede realizar infinidad de veces; lo cual no siempre es realista.

Los enfoques descriptos tienen debilidades importantes como definiciones, las que se pueden superar al establecer los axiomas que se enuncian a continuación.

2.2 Definición axiomática y teoremas asociados

Esta definición, basada en los trabajos de A. Kolmogorov en 1933, establece que la probabilidad es una

función de conjunto, P: ℜ→R, con dominio en un álgebra ℜ (todos los posibles subconjuntos del espacio

muestral) y codominio en la escala de los números reales; que satisface los siguientes axiomas:

 A1. Para cualquier eventoA⊂ℜ se cumple: P(A) 0

 A2. La probabilidad del evento seguro, Ω ⊂ℜ es: P (Ω) = 1

 A3. Si A y B son eventos mutuamente excluyentes de ℜ: P (A∪B) = P(A) + P(B)

Los principales teoremas asociados con esta definición, son:

 T1. P (Φ) = 0 (Como A = A∪Φ, de A3 se prueba el teorema)

 T2. P (AC)=1-P(A) (Como Ω = A∪AC de A3 y A2 se prueba el teorema)

(6)

Para demostrarlo vemos que el evento A∪B (área sombreada), se forma con los eventos mutuamente

excluyentes A∩BC, A∩B y B∩AC.

A su vez A está formado por los eventos mutuamente excluyentes A∩BC y A∩B; por lo que, del axioma A3,

P (A∩ BC)=P (A)-P(A∩B)

De la misma manera, P (B∩ AC)=P(B)-P(A∩B)

Aplicando otra vez el axioma A3 a la unión:

P(A∪B) = P(A∩ BC) + P(A∩B) + P( B∩ AC)

= P(A)-P(A∩B) +P(A∩B)+ P (B)-P(A∩B)

= P(A)+P(B)-P(A∩B)

Un corolario importante es:

.

P[A∪B∪C]=P[A]+P[B]+P[C]-P[A∩B]-P[A∩C]-P[B∩C]+P[A∩B∩C]

Ejemplo 2: Se extrae una carta al azar de un mazo español normal de 40 cartas. Supongamos que definimos los eventos A: "sale 3" y B: "sale par" y se nos pregunta por la probabilidad de que ocurra A ó B. Como estos eventos no pueden ocurrir simultáneamente, o sea, son mutuamente excluyentes, A B = y entonces

P(A ó B) = P(A B) = P(A) + P(B)

= P(sale 3) + P(sale par: 2-4-6-10-12) = 4/40 + 20/40 = 24/40=3/5.

En el mismo experimento sea el evento A: "no sale rey" tiene como complemento al evento "sale rey", entonces resulta más simple calcular la probabilidad de A como,

1 - P(Ac)=P(no sale rey) = 1 - P(sale rey) = 1 - 4/40 = 36/40=9/10

Ejemplo 3: En el lanzamiento de un dado, los eventos A: "sale par" y B: "sale primo" tienen intersección no vacía: A B = {2}, entonces la probabilidad del evento "sale par o primo" = A ó B es:

P(A o B) = P(A B) = P(A) + P(B) - P(A B) = 3/6 + 3/6 - 1/6 = 5/6

2.3 Condicionalidad e independencia

La probabilidad de ocurrencia del evento A puede depender de la ocurrencia de otro evento B. Si esa

dependencia existe, a la probabilidad asociada se le llama probabilidad condicional, se le representa por

(7)

Para definir la expresión que caracteriza una probabilidad condicional, supongamos la ocurrencia de dos eventos, A y B, representados con el diagrama de Venn de la izquierda.

Ahora supongamos que ocurre el evento B; por lo tanto, es irrelevante lo que ocurre fuera de él; entonces, para fines prácticos el evento B se vuelve el espacio muestral (figura de la derecha), dentro del cual hay una fracción del evento A, representado por la intersección (en símbolos AB).

Dada la reducción del espacio muestral, considerando el enfoque clásico de probabilidad, la probabilidad condicional queda definida como:

P(A/B)= 𝑃(𝐴∩𝐵)𝑃(𝐵)

Esta probabilidad condicional, es una generalización de la probabilidad de un evento, en donde implícitamente se ha considerado la ocurrencia del evento seguro,

𝑃(𝐴/Ω) =𝑃(𝐴 ∩ Ω)

𝑃(Ω) = 𝑃(𝐴) 𝑃(Ω/𝐴) =𝑃(𝐴 ∩ Ω)

𝑃(𝐴) = 1

La definición de probabilidad condicional determina la llamada regla de la multiplicación que dice que para dos eventos A y B:

P(A∩B) = P(A|B)·P(B) = P(B|A)·P(A) Y para tres eventos:

P(A∩B∩C) = P(A|B∩C)·P(B|C)·P(C)

Se dice que dos eventos A y B son independientes cuando la ocurrencia de uno no afecta a la ocurrencia del otro; en términos de probabilidades cuando

P(A|B)=P(A) y P(B|A)=P(B).

Utilizando entonces la regla de multiplicación resulta que si A y B son independientes entonces: P(A∩B)=P(A)·P(B)

Si los eventos A y B, son mutuamente excluyentes o disjuntos y no vacíos: A∩B=Φ, y por lo tanto P(A∩B)=0; entonces, como las probabilidades de A y B no son nulas, estos eventos no pueden ser independientes. Por otra parte, la independencia entre eventos se extiende a sus complementos (analizar esta propiedad).

(8)

tirada, no afecta el resultado de la segunda), entonces la probabilidad de que "salga par en el primero y un 3 en el segundo" es

P(A y B) = P(A B) = P(A)P(B) = (3/6)(1/6)= 1/12

2.4 Teorema de probabilidad total

Consideremos un espacio muestral formado por eventos colectivamente exhaustivos y mutuamente

excluyentes: {Ai,i=1,n}=Ω y sea B un evento que ocurre con cada Ai y por lo tanto contenido en es ese mismo

espacio, como en la siguiente figura, entonces:

𝑃(𝐵) = 𝑃(𝐵 ∩ Ω) = 𝑃(𝐵 ∩ (𝐴1∪ 𝐴2∪ … … ∪ 𝐴𝑛) = 𝑃(𝐵 ∩ 𝐴1) + ⋯ . +𝑃(𝐵 ∩ 𝐴𝑛) Luego,

𝑃(𝐵) = ∑𝑛𝑖=1𝑃(𝐴𝑖)𝑃(𝐵/𝐴𝑖)

Este resultado es importante porque permite determinar la probabilidad de un evento en términos de la probabilidad de eventos más simples y la probabilidad condicional del evento de interés cuando ocurren esos eventos más simples.

2.5 Teorema de Bayes

Este teorema es en realidad una manipulación de la definición de la probabilidad condicional y del teorema de la probabilidad total. En efecto, de la definición de probabilidad condicional se obtiene que: P (B∩Ai)=P(Ai|B)·P(B)=P(B|Ai)·P(Ai). Si se despeja a P(Ai|B) y se sustituye a P(B) por la expresión del teorema de probabilidad total, se llega al llamado teorema o regla de Bayes:

𝑃(𝐴𝑖/𝐵) =

𝑃(𝐴𝑖)𝑃(𝐵/𝐴𝑖)

∑𝑛𝑖=1𝑃(𝐴𝑖)𝑃(𝐵/𝐴𝑖)

No obstante su simplicidad, este teorema es muy importante pues ha sido la base de la llamada inferencia bayesiana tan útil en la toma de decisiones, porque permite afinar las probabilidades, que pueden ser subjetivas, a través de la incorporación de información que se ha observado en la realidad.

Ejemplo 5: Una persona puede viajar de 3 formas, bicicleta, auto y avión. Cada forma de transporte tiene

(9)

a u t o 0 . 3

b i c i c l e t a 0 . 5

a v i ó n 0 . 2

l l e g a 0 . 9 7

n o l l e g a 0 . 0 3

l l e g a 0 . 9 6

n o l l e g a 0 . 0 4

l l e g a 0 . 9 5

n o l l e g a 0 . 0 5

Sea Ael evento que no llegue a destino.

P(Bici/A)= 𝑃(𝐵𝑖𝑐𝑖)𝑃(𝐴/𝐵𝑖𝑐𝑖)

(𝐵𝑖𝑐𝑖)𝑃(𝐴 𝐵𝑖𝑐𝑖⁄ )+𝑃(𝑎𝑢𝑡𝑜)𝑃(𝐴 𝐴𝑢𝑡𝑜)+𝑃(𝐴𝑣𝑖𝑜𝑛)𝑃(𝐴 𝐴𝑣𝑖𝑜𝑛⁄ )=

0.50.03

0.50.03+0.30.04+0.20.05=0.4054

(10)

TRABAJO PRACTICO 1

1.1.Dos profesores y tres asistentes son responsables de la supervisión de un laboratorio de Física y al

menosunprofesor yunasistente debenestar presentesen todas lassesiones.Usandodoscoordenadasde

maneraquepor ejemplo(1,3)describa el sucesoaleatorio“unprofesor ytres asistentes estánpresentes”,

representarenejes cartesianos elespaciomuestralcorrespondiente.

a) Describirconpalabras los siguientes eventos: B={(1,3);(2,3)};C={(1,1);(2,2)}; D={(2,1);(1,2)}

b)Expresar𝐶∪𝐷listandosuselementos, y expresarlotambiénconpalabras.

c)¿SeexcluyenmutuamenteBy D?

1.2.En el experimento aleatorio de arrojar una moneda 4 veces, enumerar los elementos de los siguientes sucesos:

a)Caras ycecas sealternan

b)Elnúmerodecarases mayorqueeldececas (utilizarundiagramadeárbol)

1.3.Para c/u de los siguientes experimentos, indicar el espacio muestral:

a) Setiraunamoneda3veces y secuentaelnúmerodecaras.

b) Semidenlaedad(enaños),elpesoylaalturadeunindividuo.

c) Se lanza un dado y una moneda

d) Se extraen dos caramelos de un paquete que tiene 12 de leche, 2 de chocolate y uno de fruta.

1.4.Si un experimento arroja tres resultados posibles A, B y C que seexcluyen mutuamente, verificar en cada caso si la asignación de probabilidades es correcta:

a) P(A)=1/3 P(B)=1/3 P(C)=1/3

b) P(A)=1/2 P(B)=1/3 P(C)=1/4

c) P(A)=0.64 P(B)=0.38 P(C)=-0.02

d) P(A)=0.35 P(B)=0.52 P(C)=0.26

1.5.Considerar el problema de seleccionar dos aspirantes de un grupo de cinco para un empleo, sabiendo que los aspirantes difieren en su grado de preparación (1 es el mejor preparado, 2 es el que le sigue y así

hasta 5). El jefe de personal, naturalmente, no sabe nada de esta clasificación. Encontrar las

probabilidades de los siguientes eventos:

A: El jefe de personal selecciona el mejor y uno de los dos peores aspirantes B: El jefe de personal selecciona al menos uno de los dos mejores

1.6.Si se extrae una carta de un mazo bien mezclado de 52 naipes de póker, calcular la probabilidad de obtener:

a) Un rey rojoc) Una carta negra

b) Un 3, 4, 5 ó 6d) Un as rojo o una reina negra

1.7.Dos cartas de póker se extraen al azar de un paquete de 52 ¿Cuál es la probabilidad de obtener dos ases si:

a)La primeracartasereponeantesdeextraerlasegunda

b)Laprimeracartanoserepone

1.8.Un grupo de estadísticos de una universidad desea determinar si hay relación entre el interés de un

estudiante en la Estadística y su habilidad para la Computación. Se selecciona una muestra aleatoria de

(11)

Habilidad para la Computación

A M B Total

Interés en la Estadística

A 25 10 5 40

M 10 45 15 70

B 15 15 60 90

Total 50 70 80

Calcular la probabilidad de que un estudiante elegido al azar:

a)Tengaunaltointerés enlaEstadísticaounaaltahabilidadenComputación

b)Tengainterés medioohabilidadbaja

c)Tengainterés medioobajo. ¿Sonexcluyentes estoseventos?¿Sonexhaustivos?

d)Tenga habilidadbajaomediaoalta. ¿Sonestoseventosmutuamenteexcluyentes?

¿Por qué?¿Soncolectivamente exhaustivos?¿Porqué?

1.9.Explicar cuál es el error en c/u de las siguientes afirmaciones

a) La probabilidad de que una muestra de mineral contenga plata es 0.38 y la probabilidad de que no la contenga es 0.52

b)Laprobabilidaddequeunaoperacióntengaéxitoes 0.34yladequefracasees-0.66

c)Elserviciodereparacióndelaireacondicionadoaseguraquelaprobabilidaddeque elcompresorsehalle

enbuenestadoes0.82;ladequeelventiladordelmotorfuncione correctamente0.64, yladequeambos se

encuentrenenbuenestadoes0.41.

1.10.Suponiendoqueenunaclasede100estudiantes se elige al azar un estudiante, calcular la probabilidad de que:

a)estudieMatemáticas

b) curseGeometría

c)estudieMatemáticasócurseGeometría

d)estudieMatemáticas y curseGeometría

f)siestudiaMatemáticas, curseGeometría

g)¿sonindependientes los eventos “estudiarMatemáticas”y“cursarGeometría”?

Matem. Física

cursan Geometría 38 17

no cursan Geometría 22 23

1.11James y Joe participan en un duelo. James, cuya probabilidad de acertar es 0.2, dispara primero. El

segundo disparopuede ser hecho por cualquiera, con igual probabilidad. Finalmente puede haber un

tercer disparo hecho porJoe(si esqueaún sigue vivo). Joe tiene una probabilidad de acertar de 0.3

¿Cuál esla probabilidad de que:

a)JoemateaJames

b)Ambos salganilesos

c)James salgaileso, sabiendoquehubotresdisparos

1.12Cóctel

a) Con 6 balas, de las cuales sólo 3 son plateadas, se carga aleatoriamente una pistola con la cual se

intentará matarunhombre-lobo ¿Cuáles la probabilidaddequeel monstruosobrevivaalos primeros tres

balazos?

b) Enuna regiónencualquiermomentodel año,laprobabilidaddeque undía lluviososeaseguidoporotro

día también lluvioso esde 0.80y laprobabilidad deque undía soleado antecedaa undíalluvioso es0.60.

Suponiendo que cada día se clasifica como lluvioso o soleado, y que el clima de cualquier día depende

solamente del clima del día anterior, calcular la probabilidad de que en la citada región un día lluvioso

(12)

c)Unatiendacobrauna vezalmesa losclientesquegozandecréditoilimitado,yha descubiertoquesiun

cliente paga puntualmente un mes, la probabilidad es 0.90 de que también lo haga el próximo mes; sin

embargo,sinopaga puntualmenteunmes,la probabilidad de que tampoco lo haga el siguiente mes es

apenas 0.50 ¿Cuál es la probabilidadde que un cliente quehapagado puntualmente un mes no pague

puntualmenteenlos próximos tres meses?

d)En5delos12camionesderepartodeunacompañía, elcañodeescapenoreúnelos requisitosquefija la

ley,y4 delos12camionessonaleatoriamenteelegidosparala revisión. ¿Cuáles laprobabilidad dequeen

ningunodeelloselcañodeescapereúna losrequisitos?

1.13Existen dos métodos A y B para que les enseñemos a ganar el Loto. El porcentaje de fracasos es 20%

para A y 10% para B. Sin embargo, B es más caro (nos tendrían que pagar la mitad del pozo, por lo

menos) y por eso lo utilizamos sólo en el 30% de los casos.Seentrenóa unestudiantesegúnuno de

los dosmétodos pero nologró ganarel Loto.¿Cuáles laprobabilidaddequehayasidoentrenadocon

A?

1.14Una empresa de asesoría alquila autos de tres agencias: 20% de la agencia D, 20% de la agencia E y 60% de la agencia F. Si el 10% de los autos de la agencia D, el 12% de los provenientes de E y 4% de los autos de F tienen neumáticos en mal estado

a) ¿cuáles la probabilidad de que la empresa contrate un auto con neumáticos en mal estado?

b) En relación con el ejercicio anterior ¿cuál es la probabilidad de que un auto con neumáticos en mal estado rentado por la empresa provenga de la agencia F?

1.15El directorde una gran agencia de empleados desea estudiar varias características de los solicitantes

de trabajo. Para el análisis se ha seleccionado una muestra de 800 aspirantes. Setenta de ellos han

estado en sus trabajos actuales por lo menos durante 5 años; 80 de los solicitantes son graduados de

universidades; 25 de los graduados de universidades han mantenido sus empleos actuales por lo

menos durante 5 años.

a)¿Cuál es laprobabilidaddequeun solicitanteseleccionadoalazar:

1-Seaungraduadouniversitario?

2-seaungraduadouniversitarioyhayamantenidosutrabajoactualdurantemenosde

5años?

3-Seaungraduadouniversitarioohaya mantenidosu empleoactualdurante porlo menos 5años?

b) Sabiendo que un empleado en particular es graduado universitario, ¿cuál es la probabilidad de que

hayamantenidoeltrabajoactualmenos de5años?

c)Determinar sisergraduadouniversitarioymantener elempleoactualdurantepor lo menos5 añosson

eventosestadísticamente independientes(Sugerencia: preparar unatabla de2x2,undiagramadeVenno

un árboldedecisiónparaevaluarlas probabilidades)

1.16El 34% de los árboles de un bosque tienen más de 15 años. El 54% son de la variedad A. De los de la

variedad A, el 7% tiene más de 15 años. Si se elige un árbol al azar: a) ¿Cuál es la probabilidad de que

tenga más de 15 años y sea de la variedad A? b) ¿Cuál es la probabilidad de que teniendo menos de 15 años, sea de la variedad A?

1.17Se le da una hoja de papel a una persona A, quién marca en ella un signo (+) o un signo ( -). La

probabilidaddequeAescribaunsigno(+) es1/3.Luegodeescribir, A le pasa la hoja a B, quien puede

cambiar el signo o dejarlo como está antes de pasarle la hoja a C. Después de cambiarle el signo o

dejarlocomo está, Clepasa la hojaaD,yD luegodecambiarleel signoodejarlocomoestá,lepasalahoja

aunJuez. El Juez lee un signo (+) enla hoja. Se sabe que B, C yD cambianel signo con probabilidad2/3.

(13)

1.18 Ejerciciospararepasar

1.Ciertoartículoesinspeccionadovisualmentepordospersonas. Cuandoapareceun artículodefectuoso,la

probabilidaddequeno seadetectado por el primer inspectores igual a 0.1. De aquellos no detectados

por el primer inspector, el segundo inspector sólodetecta5 decada10.¿Quéfraccióndedefectuososno

sondetectadospor ninguno delosinspectores?

2.Unanalistaeconómicoestáinvestigandociertosindicadoresdebienestarreferidosa ungrupo depaís, que

hansidoclasificadoscomo "altamentedesarrollados", "medianamentedesarrollados"y"subdesarrollados".

El objetivodel trabajoeraanalizar ciertacantidaddehogaresurbanos,observando silosmismoscontabano

no conred cloacal.El 10%delos hogaresanalizados pertenecíanapaísescon altonivel de desarrollo,yel

50%de loshogares a países medianamente desarrollados.Se pudo determinarque el60% deloshogares

estudiadosposeían redcloacal, perodicha proporción era notoriamente más alta en los hogares que

provenían de países altamente desarrollados: el 90% poseía red cloacal. El 80% delos hogares sin red

cloacalprovenía depaíses subdesarrollados.Sobre labasede estainformación calcular: a) Laprobabilidad

dequeunhogar elegidoalazar pertenezcaaunpaísaltamente desarrollado,pero notengaredcloacal; b)

Laprobabilidaddequeunhogarconred cloacalpertenezcaaunpaíssubdesarrollado;c) Laprobabilidadde

queunhogarno pertenezcaaunpaís subdesarrolladoonotengaredcloacal.

3.Para volver a su casa 3 vecinos usan la misma línea de colectivos. Cada uno con independencia de los

demás toma el colectivo de las 17hs conuna probabilidad de ¼, el delas18hsconprobabilidadde½yel

delas19conunaprobabilidadde¼.Calcular laprobabilidaddequecoincidanenelmismocolectivo.

4.Un testrápido sobreel contenidoalcohólico enlasangre deun conductor,realizado porlapolicía enla

rutaesfiableenel 80%delas ocasiones.Losconductoresquedan positivosonsometidospor unmédico a

unsegundotestmuypreciso, quenuncafalla enunconductorsobrioperoquetieneun10%deerrorenlos

embriagados.

Sabiendoqueel5% delosconductoresdetenidosporlapolicíaestáembriagado:

a) ¿Quéporcentaje deconductoresdetenidos serásometidoaunsegundotest?

b) Un conductor fue sometido a un segundo test. ¿Cuál es la probabilidad de que condujese con un

contenidodealcoholensangremayordellegal?

5.Supongaquelas callesestántrazadas segúnunacuadrícula, conlascallesorientadas denorte asuryde

esteaoeste.Considereel siguienteesquemaparaunáreade4x4 manzanas:Unnene comienza aandar

en bicicleta en el cruce del centro del área.En cada esquina eligealazar siquiere ir al norte, sur, esteu

oeste.

a) ¿Cuál es la probabilidad de que llegue a la frontera del área después de haber pasado por las

primerasdosesquinas?

b) ¿Cuáles laprobabilidad de queregresea su punto de partidadespués depasar por exactamenteuna

(14)

UNIDAD II VARIABLES ALEATORIAS

2.1 Definición y caracterización

Para resolver diferentes problemas es conveniente traducir los resultados posibles de un experimento

aleatorio en números; es decir, definir una función que asigne un único número real a cada elemento del

espacio muestral. Esta correspondencia entre cada suceso o evento y el número real que lo representa es una variable aleatoria.

Para el ejemplo presentado en la unidad anterior de arrojar dos monedas y observar por ejemplo el número de caras obtenidas en el lanzamiento, recordamos que definimos el espacio muestral como S = {cc, cs, sc, ss}, la observación de interés es nuestra variable, la identificamos con letras mayúsculas de imprenta,

por ejemplo X, y la definimos como: X: Número de caras obtenidas en el lanzamiento. Entonces decimos

que Xpuede tomar los valores 0, 1 y 2, correspondientes a obtener ninguna, una o dos caras.

Un experimento aleatorio puede generar un espacio muestral discreto o continuo (de hecho por eso las

variables cuantitativas pueden ser discretas o continuas): un número finito o numerable de resultados posibles ó un continuo (intervalo) de resultados posibles, respectivamente. Esto permite distinguir:

Variable aleatoria discreta:Aquella con una cantidad finita ó numerable de valores posibles.

Variable aleatoria continua: Aquella cuyo conjunto de valores posibles es un intervalo a valores reales (podría definirse con extremos infinitos).

Dado un experimento aleatorio con su espacio muestral asociado, sabemos calcular probabilidades de

eventos aleatorios y de combinaciones entre ellos. Ahora debemos aprender a asignar probabilidades a las variables aleatorias que pueden definirse a partir de un experimento aleatorio dado.

Una manera de asignar probabilidades a una variable aleatoria es construyendo su distribución de

probabilidades. Esta representa unmodelo teóricoque describe la forma en que varían los resultados de un

experimento aleatorio. Y se construye a partir de una función que asigna un valor de probabilidad a cada

resultado posible.

Si la variable es discreta, la función que asigna probabilidades para cada valor de variables se denomina

función masa; si la variable es continuala denominamos función densidad. Retomando el ejemplo de X=

número de caras en el lanzamiento de dos monedas, ésta variable es discreta y la probabilidad de cada

elemento es:

P(X = 0) = P(SS) = ¼; P(X = 1) = P(SC o CS) = ½; P(X = 2) = P(CC) = ¼. Es decir la función masa para X es:

X: número de caras 0 1 2

P(X): función masa 1/4 1/2 1/4

(15)

2.2 Función masa (p(X)) y densidad de probabilidad (f(X))

Para cualquier distribución de probabilidad de una variable aleatoria discreta X, la función masa P(X) debe

cumplir:

 0 ≤ 𝑃(𝑋 = 𝑥𝑖) ≤ 1 , para cualquier valor xi que tome la v.a  ∑𝑛𝑖=1𝑃(𝑋 = 𝑥𝑖) = 1

Equivalentemente, si la variable aleatoria es continúa X, la función densidad f(x) debe cumplir:

 𝑓(𝑥) ≥ 0, para todo x en el dominio de f

 ∫−∞∞ 𝑓(𝑥)𝑑𝑥= 1

3.3 Función distribución o acumulada de probabilidad F(X)

Se denomina función distribución de probabilidades a la función acumulada de la función masa o de la

función densidad. La denotamos con F(.)(Misma notación que en la Unidad 1), esta función se define como:

𝐹(𝑥0) = 𝑃(𝑋 ≤ 𝑥0) = {

∑𝑥𝑖≤𝑥0𝑃(𝑥𝑖)

∫𝑥0 𝑓(𝑥)𝑑𝑥

−∞

Otra observación, para el caso de una v.a. continua es que de acuerdo a su definición, 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥0) =

∫𝑥0 𝑓(𝑥)𝑑𝑥

−∞ , luego por el Teorema Fundamental del Cálculo, sabemos que 𝐹´(𝑥) = 𝑓(𝑥)

Utilizando tanto f(x) como F(x) es posible calcular probabilidades como:

𝑃(𝑎 < 𝑋 ≤ 𝑏) = {

∑ 𝑝(𝑋 = 𝑥𝑖) = 𝐹(𝑏) − 𝐹(𝑎) 𝑏

𝑥𝑖>𝑎

∫ 𝑓(𝑥)𝑑𝑥 = 𝐹(𝑏) − 𝐹(𝑎)

𝑏

𝑎

según sea la v.a. discreta o continua.

Todas las funciones de distribución o acumuladas cumplen ciertas propiedades, algunas de las cuales son obvias, cuando se piensa que están definidas en términos de probabilidad.

 lim𝑥→−∞𝐹(𝑥) = 0

 lim𝑥→∞𝐹(𝑥) = 1

F(x) es no decreciente como función de x

F(x) es continua a la derecha, es decir: lim𝑥→𝑥

0+𝐹(𝑥) = 𝐹(𝑥𝑜)

En el caso de v.a. continuas no necesitamos ser cuidadosos en la especificación de incluir o no los extremos de los intervalos para el cálculo de probabilidades. Como P(X = x) = 0 si X es una v.a. continua,

(16)

31 En este punto, ya debe estar claro que la función masa o densidad de probabilidad contienen la misma información que su correspondiente función de distribución, según sea el caso se puede utilizar una u otra para resolver problemas, de acuerdo si facilita o no su resolución.

Veamos un ejemplo de cálculo:

a) Supongamos una v.a. discreta, que varía entre cero y cuatro y la función de masa es proporcional al valor

de la variable, hallar: P(X=2), P(X≤2) y P(X>2) Según los datos, la función masa y su acumulada, son:

X 0 1 2 3 4

P(X)=X/10 0 0.1 0.2 0.3 0.4 F(X) 0 0.1 0.3 0.6 1

P(X=2)=0.2

P(X≤2)=P(X=0 o X=1 o X=2)=P(X=0)+P(X=1)+P(X=2)=F(2)=0+0.1+0.2=0.3 P(X>2)=P(X=3 o X=4)=P(X=3)+P(X=4)=0.3+0.4=1-F(2)=0.7

b) Si la función densidad es f(x)=x/8, para x entre 0 y 4, hallar: P(X=2), P(X≤2) y P(X>2)

f(x) y F(x) son:

P(X=2)=0, toda probabilidad puntual, es cero, si la v.a. es continua (el área en un punto es cero)

P(X≤2)=∫−∞2 𝑥8 dx=F(2)=𝑥162|2

0=1/4=0.25

P(X>2)=1-P(X≤2)=0.75.

Siempre es útil y conveniente en el caso continuo acompañar el cálculo de probabilidades con un gráfico que identifique el área vinculada a la probabilidad pedida, mostramos a continuación cada situación posible en una función densidad hipotética:

P(X<11) P(3<X<11) P(X>11)

0.00 3.00 6.00 9.00 12.00

Variable 0.00 0.06 0.12 0.18 0.24 D e n si d a d

0.00 3.81 7.62 11.44 15.25

Variable 0.00 0.06 0.12 0.18 0.24 D e n si d a d

(17)

Para caracterizar una variable aleatoria discreta o continua es necesario conocer su función de distribución de probabilidades, y esta puede caracterizarse según los parámetros que las definen. Ahora, buscaremos para cada una de ellas medidas relativas a la posición y dispersión:

2.3 Esperanza de una variable aleatoria

La esperanza es una medida de tendencia central. Es un promedio ponderado de los valores que la variable

puede tomar, en el que los pesos son las respectivas probabilidades o valores de densidad.

 Si x es discreta: 𝐸(𝑋) = 𝜇 = ∑ 𝑥𝑖 𝑖𝑃(𝑋 = 𝑥𝑖)

 Si x es continua 𝐸(𝑋) = 𝜇 = ∫−∞∞ 𝑓(𝑥)𝑑𝑥

La esperanza E(X) no es un resultado que esperamos ocurra si X se observa sólo una vez. Pero si observáramos un gran número de repeticiones independientes de X, el promedio de esos resultados estaría

cerca de E(X). Así, E(X) es el valor de la variable por el que nos convendría apostar si el experimento

aleatorio asociado a X se repite.

Propiedades de la esperanza

Sean Xe Y variables aleatorias y c un número real

E (c ) = c

E (X+c ) = E(X) + c

E (cX) = c E(X)

E (X+Y) = E(X) + E(Y)

E (X-Y) = E(X) - E(Y)

Si X e Y son independientes E(XY) = E(X) * E(Y)

3.4 Varianza de una variable aleatoria

La variancia constituye una medida de dispersión de los valores de X alrededor de la esperanza matemática de X, y se define de manera general como:

Var(X) = σ² = E(X - μ)² =E(X2)-E(X)2

Para el cálculo de la varianza es necesario calcular previamente, la E(X2) que se define, según el caso, como:

 𝐸(𝑋2) = ∑ 𝑃(𝑋 = 𝑥𝑥𝑖 𝑖)𝑥𝑖2

 𝐸(𝑋2) = ∫𝑥2𝑓(𝑥)𝑑𝑥 −∞

Propiedades de la variancia

Sean X e Y variables aleatorias y c un número real (Cte):

V (c ) = 0

V (X + c ) = V(X)

V (cX) = c2 V(X)

Si X e Y son independientes V (X + Y) = V(X) + V(Y)

(18)

2.4 VARIABLE ALEATORIA CONJUNTA 2.4.1 Definición y caracterización

Describir un fenómeno puede requerir dos o más variables aleatorias relacionadas; en tal caso es

indispensable usar lo que se define como una variable aleatoria conjunta. La probabilidad de ocurrencia de

un evento así caracterizado requiere definir una función de probabilidad de la variable aleatoria conjunta

con dominio en Rny rango en R. Las variables aleatorias conjuntas se designan con mayúsculas, mientras que

los valores que toman con minúsculas. El siguiente esquema ilustra una variable aleatoria bi-dimensional

(n=2), con las que se ilustrarán los conceptos.

La función de probabilidad conjunta de una variable aleatoria conjunta corresponde a la probabilidad de que cada una de sus dimensiones sean menores o iguales a valores específicos de sus componentes, esto es: FXY(x,y)=P[X≤x, Y≤y]. Esta función, también llamada de distribución o distribución acumulativa conjunta, es

no decreciente y toma valores en el intervalo cerrado [0,1].

Para variables aleatorias conjuntas discretas (las que se pueden contar o enumerar en cada una de las

dimensiones), la probabilidad también puede definirse con la función de masa conjunta, que expresa la

probabilidad de que ambas dimensiones tomen valores específicos de X y de Y, esto es: pXY(x,y)= P[X=x,

Y=y].

Las propiedades de esta función son:

 𝑃(𝑋 = 𝑥𝑖, 𝑌 = 𝑦𝑗) ≥ 0 ∀𝑥𝑖, 𝑦𝑗

 ∑ ∑ 𝑃(𝑋 = 𝑥𝑥𝑖 𝑥𝑗 𝑖, 𝑌 = 𝑦𝑗) = 1

La función de probabilidad conjunta de una variable aleatoria conjunta corresponde a la probabilidad de que cada una de sus dimensiones sean menores o iguales a valores específicos de sus componentes, esto es:

𝐹𝑋𝑌= 𝑃(𝑋 ≤ 𝑥, 𝑌 ≤ 𝑦) = ∑ ∑ 𝑃(𝑋 = 𝑥𝑖, 𝑌 = 𝑦𝑗 𝑥𝑗≤𝑦

𝑥𝑖≤𝑥

)

(19)

Veamos un ejemplo para definir las distribuciones asociadas a una variable aleatoria conjunta:

Consideremos el experimento que consiste en arrojar dos dados, el espacio muestral para este experimento tiene 36 elementos igualmente probables. Por ejemplo el punto muestral (3; 3) denota el resultado para el cual ambos dados muestran un 3; el punto muestral (4; 1) denota el resultado para el cual el primer dado mostro un cuatro y el segundo dado un 1; etc. Ahora, con cada uno de los 36 puntos del muestral asociamos dos números, X e Y.

Sean X = Suma de los dos dados e Y el valor absoluto de la diferencia de los dados. Así, para el punto muestral (3; 3), X = 3+3=6 e Y = 0, para (4; 1), X = 5 e Y = 3.

Para cada uno de los 36 puntos muestrales podríamos calcular el valor de X e Y. De esta manera tenemos definido un vector aleatorio bivariado (X;Y), podremos ahora calcular las probabilidades de los eventos o pares (X; Y ). X es una v.a que toma valores entre 2 y 12, mientras que Y es otra v.a. que toma valore enteros entre 0 y 5, luego se construye una tabla asociada a la distribución conjunta, donde en cada lugar ij, contiene

P(X=xi, Y=yj). Vemos en las siguientes tablas la manera de hallar esta distribución:

Distribución Conjunta

x/Y 0 1 2 3 4 5 PX

2 1/36 0 0 0 0 0 1/36

3 0 2/36 0 0 0 0 2/36

4 1/36 0 2/36 0 0 0 3/36

5 0 2/36 0 2/36 0 0 4/36

6 1/36 0 2/36 0 2/36 0 5/36

7 0 2/36 0 2/36 0 2/36 6/36

8 1/36 0 2/36 0 2/36 0 5/36

9 0 2/36 0 2/36 0 0 4/36

10 1/36 0 2/36 0 0 0 3/36

11 0 2/36 0 0 0 0 2/36

12 1/36 0 0 0 0 0 1/36

PY 6/36 10/36 8/36 6/36 4/36 2/36 1

X=2 Y=0 X=3

Y=1 X=4 Y=2 X=5 Y=3 X=6 Y=4 X=7 Y=5

X=3 Y=1

X=4 Y=0 X=5 Y=1 X=6 Y=2 X=7 Y=3 X=8 Y=4

X=4 Y=2 X=5 Y=1 X=6 Y=0 X=7 Y=1 X=8 Y=2 X=9 Y=3

X=5 Y=3 X= 6 Y=2 X= 7 Y=1 X=8 Y=0 X=9 Y=1 X=10 Y=2

X=6 Y=4 X=7 Y=3 X=8 Y=2 X=9 Y=1 X=10 Y=0 X=11 Y=1

X=7 Y=5 X= 8 Y=4 X=9 Y=3 X=10 Y=2 X=11 Y=1 X=12 Y=0

Distribución marginal de X

(20)

Para cada dimensión de la variable aleatoria conjunta se definen funciones marginales de masa o de probabilidad, reciben este nombre justamente por ser las que se obtienen de los márgenes de la tabla de

distribución conjunta, tenemos una distribución marginal para X (PX) y otra para Y (PY), es decir:

𝑷𝑿(𝑿) = 𝑷(𝑿 = 𝒙𝒊) = ∑ 𝑷(𝑿 = 𝒙𝒚𝒋 𝒊, 𝒀 = 𝒚𝒋) y

𝑷𝒀(𝒀) = 𝑷(𝒀 = 𝒚𝒋) = ∑ 𝑷(𝑿 = 𝒙𝒊, 𝒀 = 𝒚𝒋) 𝒙𝒊

También definimos la función distribución de una variable condicionada a que la otra toma ciertos valores, a esa distribución la llamamos distribución marginal y se calcula a partir de la definición de probabilidad condicional entre eventos es decir se define como la probabilidad conjunta sobre la probabilidad marginal correspondiente a la condición,

𝑷(𝑿 /𝒀 = 𝒚𝒋) =

𝑷𝑿𝒀

𝑷𝒀

Por ejemplo para nuestro caso de los dados podríamos estar interesados en hallar la distribución de la suma condicionado a que la diferencia sea 2, entonces:

X/Y=2 2 3 4 5 6 7 8 9 10 11 12

P(X/Y=2) 0 0 0.25 0 0.25 0 0.25 0 0.25 0 0

𝑷(𝑿 = 𝟐 𝒀 = 𝟐) = 𝑷(𝟐, 𝟐) 𝑷(𝒀 = 𝟐)=

𝟎 𝟖/𝟑𝟔= 𝟎 ⁄

𝑷(𝑿 = 𝟒 𝒀 = 𝟐) = 𝑷(𝟒, 𝟐) 𝑷(𝒀 = 𝟐)=

𝟐/𝟑𝟔

𝟖/𝟑𝟔= 𝟎. 𝟐𝟓 ⁄

Obviamente dada esta nueva v. a con su distribución de probabilidad, es posible hallar su esperanza y varianza, que llamamos esperanza y varianza condicionada.

Al igual que en el cálculo de probabilidades para eventos, dos variables son independientes si la

probabilidad de ocurrencia por ejemplo de X condicionada a la ocurrencia de Y coincide con la probabilidad de que X tome cada valor, es decir:

𝑃 (𝑋 = 𝑥𝑖

𝑌 = 𝑦𝑗

⁄ ) = 𝑃(𝑋 = 𝑥𝑖) y 𝑃 (𝑌 = 𝑦𝑗 𝑋 = 𝑥

𝑖

⁄ ) = 𝑃(𝑌 = 𝑦𝑗)

Luego resulta que 𝑃(𝑋 = 𝑥𝑖, 𝑌 = 𝑦𝑗) = 𝑃𝑋(𝑋 = 𝑥𝑖)𝑃𝑌(𝑌 = 𝑦𝑗).

Es decir la probabilidad conjunta de X e Y es el producto de las correspondientes marginales. En nuestro ejemplo, ¿¿pueden considerarse X e Y independientes??

Vemos que por ejemplo P(X=2, Y=2)≠p(X=2)P(Y=2), y esto ocurre con más combinaciones de x,y, luego no se cumple la condición de independencia, es suficiente encontrar un par que no valide la ecuación anterior para decir que las variables no son estadísticamente independientes.

Todo lo desarrollado hasta aquí de variables aleatorias conjunta discretas puede extenderse de manera natural para el caso de variables continuas, llamamos entonces función densidad conjunta a la función cuya integral sobre una región definida por X e Y devuelve la probabilidad asociada.

(21)

2.4.2 Relación lineal entre dos variables aleatorias

Dadas dos o más variables aleatorias discretas o continuas es natural preguntarse si existe o no alguna

relación entre ellas, una opción para darrespuesta a esta pregunta consiste en calcular la covarianzaentre

ellas. La covarianza es una medida de la variación conjunta que hay entre las variables analizadas dos a dos. Esta medida no debe ser utilizada de modo exclusivo para medir la relación entre las dos variables, ya que es sensible al cambio de unidad de medida, además de que la información que proporciona es sobre relación lineal y no de otro tipo entre las variables en cuestión. Se define como:

𝐶𝑜𝑣(𝑋,𝑌)=𝐸(𝑋𝑌)−𝐸(𝑋)𝐸(𝑌)

 Si la covarianzaes positiva, indica que las dos variables crecen o decrecen a la vez (nube de puntos

creciente).

 Si la covarianza es negativa, indica que cuando una variable crece, la otra tiene tendencia a decrecer

(nube de puntos decreciente).

 Si los puntos se reparten con igual intensidad alrededor del 0 no hay relación lineal.

La gran desventaja de la covarianza es que depende de las unidades de las variables y que es una cantidad no acotada, por lo que resulta al menos cuestionable decir si la relación entre las variables es alta o no. Debido a estas características surge un coeficiente para cuantificar la relación lineal entre las variables: el coeficiente de correlación. Este coeficiente consiste en el cociente entre la covarianza y el producto de los desvios de ambas variables, es decir:

𝑟 =𝐶𝑜𝑣(𝑋,𝑌)

𝑆𝑥𝑆𝑌 o poblacionalmente, 𝜌 =

𝐶𝑜𝑣(𝑋,𝑌) 𝜎𝑥𝜎𝑌

Se utiliza r para el estadístico de correlación lineal calculado a partir de una muestra. En un diagrama de dispersión se toman dos variables y se representan en el plano cartesiano los pares. Si los puntos forman una nube más o menos amorfa, podemos suponer que ambas variables no se interrelacionan, o lo que es lo mismo, el conocimiento de una no aporta información sobre la otra.

Pero si ambas variables tienen un patrón de comportamiento conjunto, esto se verá en el diagrama de dispersión.

Este coeficiente toma siempre valores comprendidos entre -1 y 1 y ….

 Si r=1, existe dependencia funcional lineal directa, los puntos del diagrama de dispersión están

situados en una línea recta creciente.

 Si 0<r<1, la correlación es positiva y será más fuerte según se aproxime más a 1, donde las dos

variables se comportan en igual sentido

 Si r=0, no existe correlación lineal, pero puede existir alguna dependencia funcional entre ellas.

 Si -1<r<0, la correlación es negativa y será más fuerte según se aproxime más a -1, donde la relación

entre las variables es inversa si una crece la otra decrece.

 Si r=-1, existe dependencia funcional inversa, todos los puntos del diagrama de dispersión están

(22)

Los siguientes datos corresponden a una muestra simulada de tamaño 12 en la que a cada individuo se le midieron 3 variables.

Variable 1 Variable 2 Variable 3

102 32 5.0

220 75 5.8

300 115 5.3

210 81 5.8

180 60 5.8

260 83 5.2

117 40 5.4

200 49 5.9

143 60 5.6

97 39 5.2

261 99 5.4

220 60 5.5

Los gráficos de dispersión de a dos variables son:

El diagrama de dispersión de las dos primeras variables sugiere una relación lineal y positiva entre ambas; ya que al aumentar una lo hace también la otra y de forma proporcional (r=0.92). Tomando la primera y la tercera, parece que el comportamiento es del tipo cuadrático; la tercera variable va aumentando conforme lo hace la primera, pero luego disminuye mientras la otra sigue aumentando(r=0.19). Finalmente, la correlación entre X2 y X3 es 0.09, claramente no hay una dependencia lineal entre ellas.

4.96 5.20 5.45 5.70 5.95 Variable 3 27.85 50.68 73.50 96.33 119.15 Va ri a b le 2

27.85 50.68 73.50 96.33 119.15 Variable 2 86.85 142.67 198.50 254.32 310.15 Va ri a b le 1

4.96 5.20 5.45 5.70 5.95

Variable 3 86.85 142.67 198.50 254.32 310.15 Va ri a b le 1

r

1,2

=0.92

r

1,3

=0.19

(23)

TRABAJO PRACTICO 2

2.1Dadas las siguientes funciones, decidir si p(X) es una función masa de probabilidad. En caso afirmativo, calcular su función distribución acumulada.

X 0 1 2 3 4 5 6

P(X) 0.5 0.15 0.2 0.25 0.2 0.1 0.05

X -1 0 1

P(X) 2/5 3/10 1/2

𝑓(𝑋) = {

2

2.2Supongamos que el tiempo durante el cual se espera el colectivo en una esquina es una variable aleatoria continua a la que asociamos, en distintas esquinas, funciones f(x), definidas a trozos. Decidir si las funciones

dadas son funciones densidad de probabilidad:

1

𝑥2 0<𝑥<1 1

2(𝑥

2− 3(𝑥 − 1)2) 1 ≤ 𝑥 ≤ 2 1

2(𝑥

2− 3(𝑥 − 1)2+ 3(𝑥 − 2)2) 2 < 𝑥 < 3

𝑓(𝑥) = {4𝑥 − 2𝑥2 0 ≤ 𝑥 ≤ 2 0 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜

2.3 Si f(x) es la densidad de lavariable aleatoria X, hallar y representar la función de distribución F(X) en cada uno de los siguientes casos:

a) f ( x) = 1/3 con x= 0, 1, 2 b) f ( x ) = 3 ( 1 -x ) 2 con 0 < x < 1 c) f ( x ) =1/x 2 con x > 1

2.4Sea X una v.a.con distribución:

X -1 0 1

P(X) 0.2 0.3 0.5

Hallar a) E(X) , E(2X) , E(X+1) , E(X2) , E[(X -0.3)2]. B)V(2x), V(x/2) y V(3x+1)

2.5 a) Se lanza un par de dados. Se define la variable aleatoria X como la suma de las puntuaciones

obtenidas. Hallar la función de probabilidad, la esperanza matemática y la varianza.

b) Un jugador lanza un dado corriente. Si sale número primo, gana tantos cientos de pesos como marca el

dado, pero si no sale número primo, pierde tantos cientos de pesos como marca el dado. Determinar la

función de probabilidad y la esperanza matemática del juego

c) Si una persona compra una rifa, en la que puede ganar de $5.000 ó un segundo premio de $2000 con

probabilidades de: 0.001 y 0.003. ¿Cuál sería el precio justo a pagar por la rifa?

2.6Sea f(x) la función de densidad de la variable aleatoria X .

a) Hallar la distribución o función acumulada F(x). b) Calcular esperanza y varianza.

𝑓(𝑥)={ 0

1 𝑝𝑎𝑟𝑎 0 𝑜𝑡𝑟𝑜

<𝑥 𝑐𝑎𝑠𝑜

<1

2.7 Suponiendo que X tiene función densidad 𝑓(𝑥)={4 3

0

(1−𝑥2)

𝑒𝑛 −

𝑜𝑡𝑟𝑜 1<𝑥

𝑐𝑎𝑠𝑜 <1

a) Verificar que f(x) es función densidad y graficarla. b) Hallar la función de distribución de f (x).

c) Hallar la función de distribución, media y varianza de Y = 2 X -2.

(24)

e) Hallar moda, esperanza y mediana de Y = 3 X + 2.

2.8Si f (x) =1𝑒−1/2𝑥(x > 0),hallar un número x0tal que P [X > x0] = ½. Relacionar con las propiedades de los

2

indicadores de posición de un conjunto de datos y concluir que x0es…………. de la distribución.

2.9 Consideremos el fenómeno aleatorio que consiste el observar el tiempo total que funciona un tubo

fluorescente, a partir del momento en que se lo pone en servicio. La función de densidad correspondiente es:

𝑓(𝑥)={1000 1

0

𝑒−1/1000 𝑥

𝑥

< 𝑥

0 ≥0

Sean E el evento “la lámpara funciona de 100 a 1000 hs. inclusive” y F el evento “la lámpara funciona más de 1000 hs.”; hallar P[E ] y P[ F ] .

2.10 Un examen consta de 4 preguntas de elección múltiple, para c/u de las cuales hay 3 respuestas

posibles. Sea C el número de respuestas correctas cuando el estudiante tiene que recurrir a la “adivinación pura” para responder cada pregunta. Encontrar la distribución y la varianza de C.

2.11Un supermercado se abastece de azúcar una vez por semana. El volumen semanal de ventas, (en miles

de kg) se distribuye de acuerdo a la siguiente función de densidad de probabilidades: f (x ) =𝑓(𝑥)=

5(1−𝑥)4 para 0 < x < 1(es decir, se venden hasta 1000 kg. por semana )

Se desea averiguar ¿qué stock que debe adquirir el supermercado a principio de semana de modo que la

probabilidad de que dicho stock se agote sea a lo sumo 0,01?

2.12La probabilidad de que un hombre de 30 años de edad esté vivo al cabo del presente año es 0.99. Una

compañía de seguros ofrece vender aun hombre de esa edad una póliza de seguro de vida de $100.000 a un

año y con una prima de $1.100 ¿Cuál es la ganancia esperada por la compañía?

2.13Una venta involucra cuatro artículos seleccionados al azar de un gran lote que contiene un 10% de

defectuosos. Sea Y el número de defectuosos entre los cuatro artículos vendidos. El comprador de los

artículos regresará los defectuosos para ser reparados, y el costo de reparación está dado por C = 3Y2 + Y + 2. Encontrar el costo esperado de reparación.

2.14A y B juegan un juego consistente en lanzar una moneda 3 veces. El que obtenga la primera cara gana el

juego. Si A lanza primeramente la moneda y si el valor total de las apuestas es de $20.00, ¿con cuánto

deberá contribuir cada uno para que el juego se considere justo?

2.15 Una fábrica de automóviles tiene que enviar un equipo pesado a su planta de montaje en Perú. La

máquina puede ser trasladada por vía marítima o aérea. El costo por avión es mayor, pero existe la

probabilidad de que haya una huelga portuaria, la cual demoraría el arribo del equipo e incrementaría de

esa forma el costo. La estimación de los costos es la siguiente:

HAY HUELGA NO HAY HUELGA

Envío por mar ($) 5000 1000

Envío por aire ($) 2000 2000

a)Si la probabilidad de una huelga portuaria es de 0.4, ¿qué método de transporte minimizará los costos

esperados?

b)¿Qué valor puede alcanzar la probabilidad de una huelga portuaria antes de que resulte más caro el envío

(25)

2.16Para una familia con 4 hijos, sea Xla v. a. “cantidad de hijos varones” e Yla v. a. “cantidad de cambios

en la secuencia” (un cambio es que a un hijo varón le siga una mujer, o viceversa). Construir el espacio

muestral y luego obtener:

a) La distribución de probabilidades bivariada

b)La distribución marginal de X

c) La distribución condicional p(X/ Y = 2)

2.17

Sean X e Y v.a. independientes, con las siguientes distribuciones:

X 1 2

P(X) 0.6 0.4

Y 5 10 15

P(Y) 0.2 0.5 0.3

Hallar la distribución conjunta de X e Y.

2.18Sean Xe Y v.a.con la siguiente distribución conjunta de probabilidades:

X\Y 3 2 4

P(X)

1 0.1 0.2 0.2 0.5

3 0.3 0.1 0.1 0.5

P(Y) 0.4 0.3 0.3 1

a) Hallar la distribución marginal de X e Y

b) Hallar Cov(X ,Y)

c) Hallar rX,Y

d) ¿Son X e Y independientes?

2.19Supongamos que tenemos 21 bolillas en una urna, numeradas del 1 al 21. Sean:

𝑋 = {1 𝑠𝑖 𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑒𝑠 𝑝𝑎𝑟 0 𝑠𝑖 𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟 𝑌 = {0 𝑠𝑖 𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑛𝑜 𝑒𝑠 𝑑𝑖𝑣𝑖𝑑𝑖𝑏𝑙𝑒 𝑝𝑜𝑟 31 𝑠𝑖 𝑙𝑎 𝑏𝑜𝑙𝑖𝑙𝑙𝑎 𝑒𝑠 𝑑𝑖𝑣𝑖𝑠𝑖𝑏𝑙𝑒 𝑝𝑜𝑟 3

a) Encontrar la distribución conjunta de probabilidades de Xe Y

b) Encontrar la distribución marginal de X y la distribución marginal de Y

c) ¿Cuál es la Cov(X,Y)? ¿Xe Yson independientes? Justificar

d) ¿Cuál es la probabilidad de que el número de una bolilla elegida al azar sea divisible por 3 siendo par?

e) Calcular E(3X), E(Y + 2) y V(0.5Y), V(Y + 4)

2.20Una sierra es usada para cortar árboles por la mañana y por la tarde. Se ha comprobado que la sierra

falla. Sea Xel número de veces que la sierra falla a la mañana e Yel número de veces que la sierra falla a la

tarde. Luego de observar su funcionamiento durante el día se pudo construir la siguiente tabla de

probabilidades conjuntas:

X/Y 0 1 2

0 0.1 0.2 0.2

1 0.04 0.08 0.08

2 0.06 0.12 0.12

Cuál es la probabilidad de que:

a) la sierra no falle a la mañana?

(26)

c) se produzcan menos fallas a la tarde?

d) se produzca al menos una falla a la tarde sabiendo que se produjeron dos fallas a la mañana?

2.21

Las v. a. discretas Y1e Y2tienen la función de probabilidad conjunta

p(y1,y2) = 1/3 para (y1, y2) ∈{(-1, 0); (0, 1) ; (1, 0)}

Calcular Cov(Y1,Y2).

Notar que Y1e Y2son dependientes. Este es un ejemplo de variables aleatorias con correlación cero, que no

son independientes (Independencia implica correlación nula, pero no al revés)

2.22En la siguiente tabla se da la distribución conjunta de las variables aleatorias X e Y:

X/Y 1 2

0 0.05 0.15

1 0.3 0

2 0.05 0.45

a) Calcule las distribuciones marginales deXy de Y

b) Obtenga la distribución de Ycondicionada a los distintos valores de X.

c) Halle las siguientes probabilidades: P[Y =2 / X≤1] , P[X+Y>2],P[0< X ≤2]

d) ¿Son Xe Yindependientes?

2.23 En la tabla siguiente se muestra la distribución conjunta de las v.a discretas Xy X2. Calcular: X

X2

-1 0 1

0 0 1/3 0

1 1/3 0 1/3

a) Las distribuciones marginales de X y de X2respectivamente.

b) P(X / X 2 =1), c) P (X >-1/ X 2 =1)d) Son X2 y X v.a independientes?

2.24Una empresa publicitaria sospecha que la campaña llevada a cabo durante el último mes para promocionar una nueva bebida refrescante no ha sido efectiva. Con el fin de verificarlo, se encuestan 1084 personas y se les pide que respondan cuántas veces han visto el anuncio por televisión (Y) y cuántos litros del producto han consumido (X).

X/Y 0 1-3 4-6 7-10

0-1 314 230 104 77

2-4 75 35 84 12

5-7 45 21 35 2

8-10 16 14 11 9

a) Encontrar la distribución de probabilidad del número de litros consumidos b) ¿Presentan alguna relación la cantidad de litros consumidos y la cantidad de veces que se ha visto el anuncio? Justificar c) Encontrar la

distribución del consumo de lts. de bebida si el anuncio se vio entre una y tres veces d)¿Cuál es la

probabilidad de que se consuman entre 2 y 4 lts. si nunca se vio el aviso? e) Encontrar el consumo esperado si el anuncio fue visto entre una y tres veces.

2.25Una urna contiene 5 bolillas: dos con el número 1 y el resto con el número 2. Se extraen al azar dos bolillas de la urna, sin reposición. Sea X el número correspondiente al número de la primer bolilla e Y la suma de las dos.

a) Encontrar la distribución conjunta de probabilidades de Xe Y. b) Calcular P(X=1), P(X+Y=4).

Referencias

Documento similar

El contar con el financiamiento institucional a través de las cátedras ha significado para los grupos de profesores, el poder centrarse en estudios sobre áreas de interés

Se dice que una variables es aleatoria cuando no se sabe con certeza Se dice que una variables es aleatoria cuando no se sabe con certeza el valor que tomará, sino solo los valores

Ejemplo de variables aleatorias: Una variable aleatoria perfectamente puede ser la función de los resultados del lanzamiento de un dado.. Un par

1) Diseñar y desarrollar una metodología que permita aproximar la función de distribución de probabilidad conjunta P asociada a una red bayesiana cuando las variables

Distribución Hipergeométrica multivariada: Distribución de probabilidad de las variables aleatorias x 1 , x 2 ,…, x m ; que representan el número de elementos obtenidos

Puesto que la distribución binomial B (n,p) puede considerarse como la suma de variables aleatorias idénticamente distribuidas B (1, p) o variables de Bernoulli, la

El m´ aximo y el m´ınimo de variables aleatorias definidas sobre un mismo espacio de probabilidad son trans- formaciones medibles y, por tanto, cada una de ellas es variable

El ter- cer modelo incluye las variables fiabilidad y valencia, probabilidad estimada y decisión interactiva de refuerzo, en los Tiempos Uno y Dos (DR). Las rectas continuas que