• No se han encontrado resultados

Hasta este punto, el interés se ha centrado en una sola variable aleatoria de tipo discreto o continuo.

N/A
N/A
Protected

Academic year: 2021

Share "Hasta este punto, el interés se ha centrado en una sola variable aleatoria de tipo discreto o continuo."

Copied!
35
0
0

Texto completo

(1)

156

DISTRIBUCIONES

CONJUNTAS

CAPÍTULO

5

H

asta este punto, el interés se ha centrado en una sola variable aleatoria de tipo discreto o conti-nuo. En tales casos, se habla de una variable única. Existen problemas en los que deben estu-diarse simultáneamente dos variables aleatorias. Por ejemplo, podría interesar el estudio del rendimien-to de una reacción química y la temperatura a la cual tiene lugar. Entre las preguntas que podrían plantearse están: “¿Es el rendimiento independiente de la temperatura?” o “¿Cuál es el rendimiento promedio si la temperatura es de 40°C?” A fin de responder preguntas de este tipo, es necesario estudiar lo que se llama variables aleatorias bidimensionales o variables aleatorias bivariadas de los tipos discreto y continuo. En este capítulo, se presenta una breve introducción de los conceptos teóricos básicos subyacentes a esas variables. Tales conceptos son el fundamento del estudio del análisis de regresión y la correlación, temas de suma importancia en la estadística aplicada (véase capítulos 11 y 12).

5.1

DENSIDADES CONJUNTAS E INDEPENDENCIA

Se parte de considerar variables aleatorias bidimensionales y sus funciones de densidad. Las defini-ciones presentadas aquí son una extensión natural de las que se incluyen para una sola variable aleatoria en los capítulos 3 y 4 (véase definiciones 3.2.1 y 4.1.2).

Definición 5.1.1 (densidad discreta conjunta). Sean X y Y variables aleatorias discretas. El par ordenado (X, Y) se denomina variable aleatoria discreta bidimensional. La función fXY tal que:

fXY (x, y) = P[X = x Y = y] se llama densidad conjunta de (X, Y).

(2)

Una vez más, considere que en el caso discreto algunos estadísticos prefieren usar los términos “función de probabilidad” o “función masa de probabilidad”, no el de “densidad”. En el presente análisis, se utilizan “densidad” y la notación fXY en los casos discreto y continuo, en aras de la consis-tencia de notación y terminología.

Note que el propósito de la densidad en este caso es el mismo que en los ya analizados:permitir el cálculo de la probabilidad de que la variable aleatoria (X, Y) asuma valores específicos. Al igual que en el caso unidimensional, fXYes no negativa, puesto que representa una probabilidad. Además, si se suma la densidad en relación con todos los valores posibles de X y Y, la suma debe ser 1. En otras palabras, las condiciones necesarias y suficientes para que una función sea la densidad conjunta de una variable aleatoria discreta bidimensional son las siguientes:

Condiciones necesarias y suficientes para que una función sea una densidad discreta conjunta

1. fXY( , )x y ≥0 2. fXY x y y x ( , )= ∀ ∀

1

La densidad conjunta a veces se expresa de manera cerrada en el caso discreto. Sin embargo, es más frecuente presentarla en forma de tabla.

Ejemplo 5.1.1. En una planta automotriz, dos tareas estarán a cargo de robots. La primera consiste en soldar dos bisagras, y la segunda, en apretar tres tornillos. Sea X el número de soldaduras defectuosas, y Y, el número de tornillos apretados incorrectamente por automóvil producido. Puesto que X y Y son discretas, (X,

Y) es una variable aleatoria discreta bidimensional. Los datos indican que la densidad conjunta de (X, Y) en el pasado es la que se muestra en la tabla 5.1. Note que cada dato de la tabla es un número entre 0 y 1, por lo que puede interpretarse como probabilidad. Por añadidura:

fXY x y y x ( , )= . + . + . + +. . . . = = =

0 840 0 030 0 020 0 001 1 0 3 0 2

como se requiere. La probabilidad de que los robots no cometan errores está dada por:

P X[ = ∧ = =0 Y 0] fXY( , )0 0 =0 840.

La probabilidad de que se cometa exactamente un error es:

TABLA 5.1

x/y 0 1 2 3

0 0.840 0.030 0.020 0.010 1 0.060 0.010 0.008 0.002 2 0.010 0.005 0.004 0.001

(3)

P X[ = ∧ = +1 Y 0] P X[ = ∧ = =0 Y 1] fXY( , )1 0 +fXY( , )0 1 = + = 0 060 0 030 0 09 . . .

La probabilidad de que no haya tornillos apretados incorrectamente es P[Y = 0]. Note que esta probabili-dad, que concierne sólo a la variable aleatoria Y, puede obtenerse al sumar fXY (x, 0) en relación con todos los valores de X. En otras palabras:

P Y fXY x x [ = ]= ( , ) =

0 0 0 2 = = ∧ = + = ∧ = + = ∧ = = + + = P X Y P X Y P X Y [ ] [ ] [ ] . . . . 0 0 1 0 2 0 0 840 0 060 0 010 0 91

Distribuciones marginales: discretas

Dada la densidad conjunta de una variable aleatoria discreta bidimensional (X, Y ), es fácil obtener las densidades correspondientes a X y Y. La manera de hacerlo está indicada por el método que se usa para responder a la última pregunta planteada en el ejemplo 5.1.1. La densidad de Y se calcula al sumar todos los valores de X, y la densidad de esta última, al sumar todos los valores de Y. Si la densidad conjunta está dada en forma de tabla, es costumbre que se incluyan las densidades específi-cas de X y Y en los márgenes de la tabla de densidad conjunta. Es por ello que las densidades especí-ficas de X y Y se llaman densidades marginales. Esta idea se formaliza en la definición 5.1.2.

Definición 5.1.2 (densidades marginales discretas). Sea (X, Y) una variable aleatoria dis-creta bidimensional con densidad conjunta fXY . La densidad marginal de X, denotada como fX, está dada por:

fX x fXY x y y ( )= ( , ) ∀

La densidad marginal de Y, que se denota con fY , está dada por:

fY y fXY x y y ( )= ( , ) ∀

Ejemplo 5.1.2. La tabla 5.2 muestra la densidad conjunta de la variable aleatoria (X, Y) del ejemplo 5.1.1. También muestra las densidades marginales de X, el número de soldaduras defectuosas, y Y, el número de tornillos apretados incorrectamente, por automóvil. Note que la densidad marginal de X se obtiene al sumar las probabilidades de las celdas por filas, y las de Y, al sumar las probabilidades de las celdas por columnas.

Distribuciones conjuntas y marginales: continuas

La idea de una variable aleatoria continua bidimensional y de la densidad conjunta continua puede desarrollarse al ampliar la definición 4.1.1 a dos o más variables.

(4)

Definición 5.1.3 (densidad continua conjunta). Sean X y Y variables aleatorias continuas. El par ordenado (X, Y) se denomina variable aleatoria continua bidimensional. La función fXY tal que: 1. f x y x y XY( , )≥ − ∞ < < ∞ −∞ < < ∞ 0 2. −∞fXY( , )x y dy dx ∞ −∞ ∞

=1 3. P a X b c Y d c fXY x y dy dx d a b [ ≤ ≤ ∧ ≤ ≤ ]=

( , )

donde a, b, c, d son números reales, se llama densidad conjunta de (X, Y).

La densidad conjunta se define para todos los valores reales de x y y; pero aquí se sigue la convención de especificar su ecuación sólo en cuanto a las regiones en que sería diferente de cero. Recuerde que las probabilidades corresponden a áreas en el caso de una variable aleatoria continua. En el de una variable aleatoria continua bidimensional, las probabilidades guardan correspondencia con volúmenes. Estas ideas se ilustran en el ejemplo 5.1.3.

Ejemplo 5.1.3. En un individuo sano de 20 a 29 años, el valor de calcio en la sangre X usualmente se ubica entre 8.5 y 10.5 miligramos por decilitro (mg/dl), y el de colesterol, Y, entre 120 y 240 mg/dl. Suponga que en personas sanas de ese grupo de edad la variable aleatoria (X, Y) tiene distribución unifor-me en un rectángulo cuyos ángulos son (8.5, 120), (8.5, 240), (10.5, 120) y (10.5, 240). En otras palabras, suponga que la densidad conjunta de (X, Y) es:

f x y c x y XY( , )= . ≤ ≤ . ≤ ≤ 8 5 10 5 120 240

Que sea una densidad requiere seleccionar c de modo que:

120c dy dx=1 240 8 5 10 5 . .

Dicho de otra manera, debe elegirse c para que el volumen del sólido rectangular mostrado en la figura 5.1a

sea 1. A fin de calcular c, se usa la geometría o se completa la integración que se muestra a continuación:

TABLA 5.2 x/y 0 1 2 3 fX (x) 0 0.840 0.030 0.020 0.010 0.900 1 0.060 0.010 0.008 0.002 0.080 2 0.010 0.005 0.004 0.001 0.020 fY (y) 0.910 0.045 0.032 0.013 1.000

(5)

c dy dx c dx = − =

1 240 120 1 120 240 8 5 10 5 8 5 10 5 . . . . ( ) 120 10 5 8 5 1 240 1 1 240 c c c ( . . ) / − = = =

Ahora, se usa la densidad conjunta para calcular la probabilidad de que los valores de calcio de un indivi-duo se ubiquen entre 9 y 10 mg/dl, y los de colesterol, entre 125 y 140 mg/dl. Esta probabilidad corres-ponde al volumen del sólido que aparece en la figura 5.1b. La probabilidad es:

c z x y a) b) 120 240 8.5 10.5 = 1 240 c z x y 125 9 140 10 FIGURA 5.1

a) Volumen del sólido cuya base es un rectángulo con ángulos (8.5, 120), (8.5, 240), (10.5, 120) y (10.5, 240), con altura c = 1;

b) P[9 ≤X ≤ 10 ∧ 125 ≤Y ≤ 140] = volumen del sólido cuya base es un rectángulo con ángulos (9, 125), (9, 140), (10, 125) y (10, 140), con altura c = 1/240.

(6)

P[9 X 10 125 Y 140] 1251 240/ dy dx 140 9 10 ≤ ≤ ∧ ≤ ≤ =

= − =

1 240 140 125 15 240 9 10 / / ( )dx

La definición de las densidades “marginales” en el caso continuo precisa sustituir la suma con la integración. Eso lleva a la definición siguiente.

Definición 5.1.4 (densidades marginales continuas). Sea (X, Y) una variable aleatoria continua bidimensional con densidad conjunta fXY. La densidad marginal de X, que se denota con fX, está dada por:

fX( )x = −∞fXY( , )x y dy

La densidad marginal de Y, denotada con fY, está dada por:

f yY( )= −∞fXY( , )x y dx

La idea de las densidades marginales se ilustra en los ejemplos 5.1.4 y 5.1.5.

Ejemplo 5.1.4. Sea X los valores de calcio en sangre de un individuo, y Y, los de colesterol en su sangre. La densidad conjunta de (X, Y) es:

f x y x y XY( , )= / . ≤ ≤ . ≤ ≤ 1 240 8 5 10 5 120 240

Las densidades marginales de X y Y son:

f x dy x f y dx y X Y ( ) / . . ( ) / . . = = ≤ ≤ = = ≤ ≤

1 240 1 2 8 5 10 5 1 240 2 240 120 240 120 240 8 5 10 5 / /

El cálculo de la probabilidad de que un individuo sano tenga valores de colesterol de 150 a 200 mg/dl puede obtenerse con la densidad conjunta o con la densidad marginal de Y. Dicho de otro modo:

P[ Y ] . / dy dx / . 150 200 1 240 100 240 150 200 8 5 10 5 ≤ ≤ =

= o P[150 Y 200] 1502 240/ dy 100 240/ 200 ≤ ≤ =

=

(7)

Ejemplo 5.1.5. En el estudio del comportamiento de plafones de soporte de aire, se consideran las variables aleatorias X, que es la presión barométrica interna (en pulgadas de mercurio), y Y, la presión externa. Suponga que la densidad conjunta de (X, Y) está dada por:

f x y c x y x c XY( , ) / /( ln / ) . = ≤ ≤ ≤ = − 27 33 1 6 27 33 27 1 72

La región en el plano sobre la cual se define esta densidad conjunta se muestra en la figura 5.2a. Las densidades marginales de X y Y están dadas por:

f x c x dy c x y c x x f y c x dx c y y X x x Y y ( ) / ( ) ( / ) ( ) / (ln ln ) = = = − ≤ ≤ = = − ≤ ≤

27 27 33 1 27 27 33 33 27 33 /

Se calcula la probabilidad de que la presión interna sea cuando mucho de 30, y la externa, a lo sumo de 28. En otras palabras, se determina P[X ≤ 30 ∧Y ≤ 28]. La región sobre la cual se integra la densidad conjunta está ilustrada en la figura 5.2b. La integración puede efectuarse para y y luego para x, o viceversa. En el primer caso, el problema debe dividirse en dos partes, ya que los límites de y cambian en el punto (28, 28). La integración se logra más fácilmente en el segundo caso. Las integrales necesa-rias en ambos casos son:

a) b) x y y =x x 33 27 0 27 33 y R1 30 27 0 27 33 33 R2 (28,28) FIGURA 5.2

a) La densidad conjunta f (x, y) = c/x se define sobre la región triangular delimitada por y = 27, y = xx = 33.

b) P X[ ≤30∧ ≤Y 28]=∫∫R1c x dy dx/ +∫∫R2c x dy dx/ o =∫2728∫27xc x dy dx/ +∫2830∫2728c x dy dx/ P x[ ≤30∧ ≤Y 28]=

y c x dx dy/ . 30 27 28

(8)

Caso I: P X Y c x dy dx c x dy dx x [ ≤30∧ ≤28]=

+

27 27 28 28 30 27 28 / / Caso II: P X[ ≤30∧ ≤Y 28]=

y c x dx dy 30 27 28 /

Puesto que el caso II precisa menos esfuerzo, se calcula P[X ≤ 30∧Y ≤ 28] como sigue:

P X[ ≤30∧ ≤Y 28]=

y c x dx dy/ 30 27 28 =c

27[ln30−ln ]y dy 28 =  −  =

[

− −

]

= − + + = =

c y y dy c y y y c c ln ln ln ( ln ) [ln ln ln ] ( . ) . ( . ) . 30 30 30 28 28 27 27 1 0 09 1 72 0 09 0 15 27 28 27 28 27 28

Se deja como ejercicio demostrar que se obtiene el mismo resultado en el caso I (ejercicio 6).

Independencia

Existe un aspecto que debe destacarse en esta sección. Recuerde que dos eventos son independientes si el conocimiento de que ha ocurrido uno de ellos no aporta indicios sobre las probabilidades de que tenga lugar el otro. Suponga que X y Y son variables aleatorias discretas tales que el conocimiento del valor de una no brinda indicios sobre el valor de la otra. Podría pensarse que estas variables aleatorias son “independientes” y convendría tener una caracterización matemática de tal propiedad. Esa carac-terización se expresa en el argumento siguiente. Sean X y Y variables discretas. Sea también A1 el evento de que X = x, y A2, el evento de que Y = y. Si X y Y son independientes en forma intuitiva, A1 y A2 son eventos independientes. Según la definición 2.3.1:

P A[ 1∩A2]=P A P A[ 1] [ 2]

Al sustituir, se observa que:

P X[ = ∧ =x Y y]=P X[ =x P Y] [ =y]

o

fXY( , )x y = fX( )x fY( )y

Parecería que, por lo menos en el caso discreto, la independencia indica que la densidad conjunta puede expresarse como el producto de las densidades marginales. Esta idea es la base de la definición del término “variables aleatorias independientes” en los casos discreto y continuo.

(9)

Definición 5.1.5 (variables aleatorias independientes). Sean X y Y variables aleatorias con densidad conjunta fXYy densidades marginales fX y fY, respectivamente. X y Y son inde-pendientes si y sólo si:

fXY( , )x y = fX( )x fY( )y

para todos los valores de x y y.

Ejemplo 5.1.6.

a) No son independientes las variables aleatorias X, el número de soldaduras defectuosas, y Y, el núme-ro de tornillos atornillados incorrectamente por automóvil, de los ejemplos 5.1.1 y 5.1.2. A fin de verificarlo, note conforme a la tabla 5.2 que:

fXY( , )0 0 =0 84. ≠0 9 0 91. ( . )=0 819. = fX( ) ( )0 fY 0

b) Son independientes las variables aleatorias X, los valores de calcio en sangre de un individuo, y Y, sus concentraciones sanguíneas de colesterol, según se describen en los ejemplos 5.1.3 y 5.1.4. A efecto de comprobarlo, tome nota de que:

fXY( , )x y =1 240/ =1 2 2 240/ ⋅ / = fX( ) ( )x fY y

En este punto, debe hacerse un comentario importante. El supuesto de que (X, Y) tienen distribución uniforme lleva a la conclusión de que X y Y son independientes. Si esta conclusión es médicamente inadecuada, debe buscarse otra densidad más realista para describir el comportamiento de la varia-ble aleatoria bidimensional (X, Y).

c) No son independientes las variables aleatorias X y Y, las presiones interna y externa de un plafón de soporte de aire, respectivamente, del ejemplo 5.1.5. Ello se aprecia al observar que:

fXY( , )x y =c x/ ≠c(1 27− / ) (lnx c 33−ln )y = fX( )x fY( )y

El supuesto de que no hay independencia es realista aquí desde el punto de vista físico.

Los ejercicios de la sección 5.1 sirven de práctica de estas ideas teóricas. Su relación con el análisis de datos se estudia en capítulos subsiguientes.

5.2

ESPERANZA Y COVARIANZA

En esta sección, se presenta la idea de esperanza en el caso de una variable aleatoria bidimensional. También se estudia una esperanza específica, la covarianza, útil para describir el comportamiento de una variable en relación con otra.

(10)

Definición 5.2.1 (valor esperado). Sea (X, Y) una variable aleatoria bidimensional con densidad conjunta fXY. Sea también H(X, Y) una variable aleatoria. El valor esperado de H(X, Y), que se denota con E[H(X, Y)], está dado por:

1. E H X Y H x y f x y y x XY [ ( , )]= ( , ) ( , ) ∀ ∀

a condición de que H x y f x y y x XY ( , ) ( , ) ∀ ∀

existe para (X, Y) discreta; 2. E H X Y[ ( , )]= −∞H x y f( , ) XY( , )x y dy dx ∞ −∞ ∞

siempre y cuando −∞H x y( , ) fXY( , )x y dy dx ∞ −∞ ∞

para (X, Y) continua.

Al igual que en el caso de las variables aleatorias unidimensionales, algunas funciones de X y Y interesan más que otras. En particular, cuando se conoce la densidad conjunta de (X, Y), entonces puede calcularse fácilmente el valor promedio de X y Y. Dicho valor se calcula como sigue:

Promedios de variable única calculados mediante la densidad conjunta

E X x f x y E Y y f x y XY y x XY y x [ ] ( , ) [ ] ( , ) = = ∀ ∀ ∀ ∀

E X x f x y dx dy E Y y f x y dx dy XY XY [ ] ( , ) [ ] ( , ) = = −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞

Los ejemplos 5.2.1 y 5.2.2 ilustran el uso de esta definición.

Ejemplo 5.2.1. La densidad conjunta de la variable aleatoria (X, Y) del ejemplo 5.1.1 se proporciona en la tabla 5.3. X denota el número de soldaduras defectuosas, y Y, el de tornillos apretados incorrectamente, por automóvil, que producen los robots de la línea de montaje. Se usa la definición 5.2.1 para calcular E[X],

E[Y], E[X + Y] y E[XY]. E X xfXY x y y x [ ] ( , ) ( . ) ( . ) ( . ) ( . ) ( . ) . . . ( . ) . = = + + + + + + = = =

0 3 0 2 0 0 840 0 0 030 0 0 020 0 0 010 1 0 060 2 0 001 0 12 para (X, Y) discreta para (X, Y) continua

(11)

E Y yf x y E X Y x y f x y XY y x XY y x [ ] ( , ) ( . ) ( . ) ( . ) ( . ) ( . ) . . . ( . ) . [ ] ( ) ( , ) ( )( . ) ( = = + + + + + + = + = + = + + + = = = =

0 3 0 2 0 3 0 2 0 0 840 1 0 030 2 0 020 3 0 010 0 0 060 3 0 001 0 148 0 0 0 840 0 1)()( . ) ( )( . ) . . . ( )( . ) . [ ] ( , ) ( )( . ) ( )( . ) ( )( . ) . . . ( )( . ) . 0 030 0 2 0 020 2 3 0 001 0 268 0 0 0 840 0 1 0 030 0 2 0 020 2 3 0 001 0 064 0 3 0 2 + + + + + = = = ⋅ + ⋅ + ⋅ + + ⋅ = = =

E XY xyfXY x y y x

Dos aspectos deben resaltarse. Primero, que E[X] y E[Y] se determinan con base en la densidad conjunta y la definición 5.2.1. Estas esperanzas podrían haberse calculado con igual facilidad a partir de las densi-dades marginales y la definición 3.3.1 (ejercicio 18). Segundo, que E[X + Y] = E[X] + E[Y]. Este resul-tado es compatible con las reglas de la esperanza, dadas en el teorema 3.3.1.

Ejemplo 5.2.2. La densidad conjunta de la variable aleatoria (X, Y), donde X denota el valor de calcio, y Y, el valor de colesterol en la sangre de un individuo sano, está dada por:

f x y x y XY( , )= / . ≤ ≤ . ≤ ≤ 1 240 8 5 10 5 120 240

Para estas variables:

E X xf x y dy dx x dy dx x dx x XY [ ] ( , ) ( / ) ( / ) / . . . . . . = = = = = −∞ ∞ −∞ ∞

1 240 1 2 4 120 240 8 5 10 5 2 8 5 10 5 8 5 10 5 9.5 mg/dl TABLA 5.3 x/y 0 1 2 3 fX(x) 0 0.840 0.030 0.020 0.010 0.900 1 0.060 0.010 0.008 0.002 0.080 2 0.010 0.005 0.004 0.001 0.020 fY(y) 0.910 0.045 0.032 0.013 1.000

(12)

E Y yf x y dy dx x dy dx y dx dx E XY xyf x y dy dx xy dy dx XY XY [ ] ( , ) ( / ) / / / [ ] ( , ) ( ) . . . . . . . . = = = = = = = = −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞

1 240 1 240 2 1 240 21 600 180 1 240 120 240 8 5 10 5 2 8 5 10 5 120 240 8 5 10 5 120 240 8 5 10 5 mg/dl / 1 1 240 2 1 240 21 600 21 600 240 2 1 710 2 8 5 10 5 120 240 8 5 10 5 2 8 5 10 5 / / ( / ) ( / ) . . . . . . xy dx x dx x /

= = =

Covarianza

En ocasiones, el valor esperado de una función de X y Y es interesante en sí. De tal suerte, en el ejemplo 5.2.1, E[X + Y] es el número promedio teórico de errores que cometen en general los robots. Sin embargo, en esta sección interesan principalmente las esperanzas necesarias para calcular la covarianza de X y Y. Este término se define como sigue:

Definición 5.2.2 (covarianza). Sean X y Y variables aleatorias con medias µX y µY, respectivamente. La covarianza de X y Y, que se denota como Cov (X, Y) o σXY, está dada por:

Cov ( , )X Y =E X[( −µX)(Y−µY)]

Note que si los valores bajos de X tienden a relacionarse con valores igualmente bajos de Y, y los valores altos de una con los altos de la otra, entonces X – µX y Y – µY suelen tener el mismo signo algebraico. Ello implica que (X – µX)(Y – µY) es positivo, lo que genera una covarianza positiva. Cuando es válido lo opuesto y los valores bajos de X tienden a guardar relación con valores altos de Y, y a la inversa, X – µX y Y – µY usualmente tendrán signos algebraicos opuestos. Ello hace que sean negativos el valor de(X – µX)(Y – µY) y la covarianza. En ese sentido, la covarianza indica cómo varían X y Y,una en relación con la otra.

(13)

La covarianza pocas veces se calcula a partir de la definición 5.2.2. En vez de ello, se aplica la fórmula de cálculo siguiente, cuya derivación se deja como ejercicio (ejercicio 24).

Teorema 5.2.1 (fórmula de cálculo de la covarianza).

Cov ( , )X Y =E X Y[ ]−E X E Y[ ] [ ]

El teorema precedente se ilustra mediante la determinación de la covarianza de las variables aleatorias de los ejemplos 5.2.1 y 5.2.2.

Ejemplo 5.2.3.

a) La covarianza entre X, el número de soldaduras defectuosas, y Y, el de tornillos apretados incorrecta-mente, del ejemplo 5.2.1, está dada por:

Cov ( , ) [ ] [ ] [ ] . ( . )( . ) . X Y =E XYE X E Y =0 064− 0 12 0 148 =0 046

Puesto que Cov (X, Y) > 0, se tiende a que los valores altos de X se relacionen con valores igualmente altos de Y, y viceversa. En otras palabras, un vehículo con número de soldaduras defectuosas mayor que el promedio tendría número también alto de tornillos apretados incorrectamente, y a la inversa.

b) La covarianza entre X, el valor de calcio en sangre de un individuo, y Y, su valor sanguíneo de colesterol, está dada por:

Cov ( , ) [ ] [ ] [ ] ( . )( ) X Y =E XYE X E Y =1 710− 9 5 180 =0

Que la covarianza sea 0 implica que el conocimiento de que X asume un valor más alto que su media no indica algo sobre el valor de Y en relación con su media.

El hecho de que la covarianza entre X y Y sea 0 en el ejemplo 5.2.2 no es coincidencia. Por supuesto, se debe al hecho de que E[XY] = E[X]E[Y]. Puede demostrarse que esta propiedad es válida siempre que las variables aleatorias X y Y sean independientes, como en el ejemplo 5.2.2. Este resul-tado importante se formaliza en el teorema siguiente:

Teorema 5.2.2. Sea (X, Y) una variable aleatoria bidimensional con densidad conjunta fXY. Si X y Y

son independientes, entonces:

E[XY] = E[X]E[Y]

Demostración. El teorema se demuestra en el caso continuo. La demostración en el caso discreto es similar. Suponga que (X, Y) tiene densidad conjunta fXYy que X y Y son independientes. Sea que fX y fY

(14)

E XY xyf x y dy dx xyf x f y dy dx xf x yf y dy dx xf x E Y dx E Y xf x dx E Y E X XY X Y X Y X X [ ] ( , ) ( ) ( ) ( ) ( ) ( ) [ ] [ ] ( ) [ ] [ ] = = = = = = −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞ −∞ ∞

Una consecuencia inmediata de este teorema es el resultado ya señalado y observado en relación con el ejemplo 5.2.2. En particular, siX y Y son independientes, entonces Cov (X, Y) = 0. Desgraciadamente, la afirmación opuesta es inválida. Dicho de otra manera, resulta imposible lle-gar a la conclusión de que la covarianza cero entraña independencia. Ello se verifica con el ejemplo siguiente.

Ejemplo 5.2.4. La densidad conjunta de (X, Y) aparece en la tabla 5.4, donde puede apreciarse que E[X] = 5/2, E[Y] = 0 y E[XY] = 0, de modo que la covarianza es 0. También es fácil apreciar que X y Y no son independientes. El valor que asume Y sí tiene efecto en el que asume X. De hecho, X = Y2. ¡El valor de Y

determina por completo el de X!

La covarianza aporta una idea muy burda de la relación entre X y Y. Sólo interesa su signo algebraico, no su magnitud. Sin embargo, la covarianza se usa para definir otra medición de esa relación que es más fácil de interpretar. Esta medición, llamada correlación, es tema de la sección siguiente.

5.3

CORRELACIÓN

Recuerde que la covarianza entre X y Y sólo brinda una indicación burda de la relación de esas variables. No se pretende que describa el tipo o intensidad de tal relación. Es frecuente que interese conocer si dos variables aleatorias guardan relación lineal o no lo hacen. Una medida usada para determinarlo es el coeficiente de correlación de Pearson, ρ. En esta sección, se define esta medida teórica de la linealidad, mientras que en el capítulo 11 se analiza cómo calcular su valor a partir de un conjunto de datos. TABLA 5.4 x/y –2 –1 1 2 fX (x) 1 0 1/4 1/4 0 1/2 4 1/4 0 0 1/4 1/2 fY (y) 1/4 1/4 1/4 1/4 1 (X y Y son independientes).

(15)

Definición 5.3.1 (coeficiente de correlación de Pearson). Sean X y Y variables aleatorias con medias µX y µY , y varianzas

σX 2 y σY 2, respectivamente. La correlación ρ XY entre X y Y está dada por: ρXY X Y X Y = Cov Var Var ( , ) ( ) ( )

Puesto que el lector ya sabe calcular cada uno de los términos que aparecen en la definición precedente, es fácil determinar ρXY (o ρ) a partir de la densidad conjunta de (X, Y). La pregunta es: “¿Cómo interpretar ρ,una vez que se conoce su valor numérico?” La interpretación de ρrequiere conocer su rango de valores posibles. El teorema siguiente demuestra que, en contraste con la covarianza, que puede tener cualquier valor real, el coeficiente de correlación está delimitado.

Teorema 5.3.1. El coeficiente de correlación ρXY de dos variables aleatorias X y Y cualesquiera se sitúa entre –1 y 1, inclusive.

La demostración de este teorema es parte del apéndice C.

El teorema siguiente indica la forma en que ρ mide la linealidad. Su propósito es doble. Prime-ro, si existe relación lineal entre X y Y, tal hecho se refleja en que su coeficiente de correlación es 1 o –1. Segundo, cuando ρ= 1 o –1, entonces existe relación lineal de X con Y. La expresión formal de este resultado es el teorema 5.3.2.

Teorema 5.3.2. Sean X y Y variables aleatorias con coeficiente de correlación ρXY. Entonces, |ρXY | = 1 si y sólo si Y = β0 + β1 X para los números reales β0 y β1≠ 0.

Vea la demostración de este teorema en el apéndice C.

Si ρ = 1, entonces puede afirmarse que X y Y tienen correlación positiva perfecta. Esta última implica que Y = β0 + β1X, donde β1 > 0. A su vez, ello implica que los valores bajos de X se relacionan con sus similares de Y, y los valores altos de X, con valores altos de Y. Cuando existe correlación negativa perfecta, Y = β0 + β1X, donde β1 < 0. En términos prácticos, ello significa que los valores bajos de X guardan relación con valores altos de Y, y a la inversa. Desgraciadamente, las varia-bles aleatorias pocas veces asumen los valores 1 o –1, fáciles de interpretar. Sin embargo, los valores de ρcercanos a 1 o –1 sí llegan a ocurrir e indican una tendencia lineal. En otras palabras, reflejan que, si bien no existe una sola recta en la gráfica que pase por los puntos de probabilidad positiva, sí existe otra con la propiedad de que gran parte de la probabilidad se relaciona con puntos situados sobre esta segunda recta o cerca de ella. Es igualmente importante tomar en cuenta qué no se dice en el teorema 5.3.2. Si ρ = 0, se dice que X y Y no están correlacionadas, sin que se afirme que no están relacionadas. En realidad, se dice que si acaso existe una relación, no es lineal. Estas ideas se ilustran en la figura 5.3.

(16)

Ejemplo 5.3.1. A fin de calcular la correlación de X, el número de soldaduras defectuosas, con Y, el número de tornillos apretados incorrectamente, por automóvil, de los robots de la línea de montaje, se usa la tabla 5.3 para calcular E[X2] y E[Y2]. Para estas variables:

E[X2] = 02(0.90) + 12(0.08) + 22(0.02) = 0.16

E[Y2] = 02(0.910) + 12(0.045) + 22(0.032) + 32(0.013) = 0.29

En el ejemplo 5.2.1, se calculó que E[X] = 0.12 y E[Y] = 0.148. Por consiguiente: a) x y Y=␤0+␤1X b) x y Y=␤0+␤1X c) x y d) x y e) x y FIGURA 5.3

a) Correlación positiva perfecta: ρ= 1, β1> 0, con todos los puntos en una recta de pendiente positiva; b) correlación

negativa perfecta: ρ= –1, β1< 0, con todos los puntos en una recta de pendiente negativa; c) ρcercano a 1, con tendencia lineal de los puntos; d) ausencia de correlación: ρ= 0, con puntos que indican una relación de X con Y, si bien esa relación no es lineal; e) ausencia de correlación: ρ = 0, con dispersión aleatoria de los puntos.

(17)

Var X = E[X2] – (E[X])2 = 0.16 – (0.12)2 0.146

Var Y = E[Y2] – (E[Y])2 = 0.29 – (0.148)2 0.268

En el ejemplo 5.2.3, se calculó que Cov (X, Y) = 0.046. Según la definición 5.3.1:

ρXY X Y X Y = Cov = Var Var ( , ) . ( . ) ( . ) . 0 046 0 146 0 268 0 23

Puesto que este valor no parece cercano a 1, tampoco se esperaría que los valores observados de X y Y

presenten tendencia lineal de consideración.

La relación de la correlación con la independencia se resalta en el ejercicio 36.

5.4

DENSIDADES CONDICIONALES Y REGRESIÓN

En esta sección, se analizan dos temas relacionados estrechamente, las densidades condicionales y la regresión. A fin de apreciar qué se hará, reconsidere el ejemplo 5.1.5.

Ejemplo 5.4.1. El ejemplo 5.1.5 versa sobre la variable aleatoria (X, Y), donde X y Y son las presiones barométricas interna y externa, respectivamente, en un plafón de soporte de aire. Suponga que interesa el estudio de la presión interna cuando la externa está fija, con y = 30. Son tres los aspectos importantes que deben entenderse:

1. La presión interna varía inclusive cuando la externa es constante. Así pues, tiene sentido hablar de “la variable aleatoria X, dada y = 30”. Esta nueva variable aleatoria se denota como X|y = 30. 2. Puesto que X|y = 30 es una variable aleatoria en sí, tiene distribución de probabilidad. De tal suerte,

tendría sentido preguntarse: “¿Cuál es la densidad de X|y = 30?” Esta densidad se llama “densidad condicional de X, dada y = 30” y se denota como fX|y = 30.

3. La presión interna varía inclusive cuando la presión externa es constante, por lo que una vez más tiene sentido plantear: “¿Cuál es la presión media o promedio en el interior del techo cuando la presión externa es 30?” En otras palabras, es posible preguntarse: “¿Cuál es el valor medio de la varia-ble aleatoria X|y = 30?” Este valor medio se denota como E[X|y = 30] oµX|y = 30.

En general, la densidad condicional de X, dada Y = y, denotada con fX|y, es una función que permite calcular la probabilidad de que X tenga valores específicos, ello con base en el conocimiento del valor de la variable aleatoria Y. A fin de ver cómo se define fX|y, suponga que (X, Y) es discreta, con densidad conjunta fXYy densidades marginales fXy fY. Sea A1 el evento X = x, y A2 el evento Y = y. A partir de la definición 2.2.1, se tiene:

P A A P A A P A [ ] [ ] [ ] 1 2 1 2 2 = ∩

Al sustituir, se observa que:

P X x Y y P X x Y y P Y y f x y f y XY Y [ ] [ ] [ ] ( , ) ( ) = = = = ∧ = = =

(18)

En el caso discreto, la densidad condicional de X,dada Y = y,es la proporción de la densidad conjunta de (X, Y) sobre la densidad marginal de Y. Esta observación constituye el motivo para la definición del término “densidad condicional” en los casos discreto y continuo. En la definición formal, note que pueden invertirse los papeles que desempeñan X y Y.

Definición 5.4.1 (densidad condicional). Sea (X, Y) una variable aleatoria bidimensional con densidad conjunta fXY y densidades marginales fX y fY . Entonces:

1. La densidad condicional de X, dada Y = y, se denota con fX|yy está dada por:

f f x y f y f y X y XY Y Y = ( , ) > ( ) ( ) 0

2. La densidad condicional de Y, dada X = x, se denota con fY|xy está dada por:

f y f x y f x f x Y x XY X X ( ) ( , ) ( ) ( ) = >0

El uso de esta definición se ilustra en el ejemplo 5.4.2.

Ejemplo 5.4.2. La densidad de la variable aleatoria (X, Y), donde X y Y son las presiones interna y externa, respectivamente, sobre un plafón de soporte de aire, está dada por:

f x y c x y x c XY( , ) / /( ln / ) = ≤ ≤ ≤ = − 27 33 1 6 27 33 27

De conformidad con el ejemplo 5.1.5, las densidades marginales de X y Y son:

fX( )y =c(1 27− / )x 27≤ ≤x 33

y

fY( )y =c(ln33−ln )y 27≤ ≤y 33

La densidad condicional de X, dada Y = y, es:

f x f x y f y c x c y x y y x X y XY Y ( ) ( , ) ( ) / (ln ln ) (ln ln ) = = − = − ≤ ≤ 33 1 33 33

A efecto de calcular la probabilidad de que la presión interna sea mayor que 32, dada la presión externa de 30, sea y = 30 en la expresión precedente. Luego, se integra la densidad condicional sobre los valores de X que exceden de 32. En otras palabras:

P X y x dx [ ] (ln ln ) > = = −

32 30 1 33 30 32 33 | = − = − − ln ln ln ln ln ln ln . x 33 30 33 32 33 30 0 32 32 33

(19)

En el cálculo del valor esperado o medio de X, dada y = 30, se aplica la definición 4.2.1 a la variable aleatoria X|y = 30. Dicho de otra manera:

E X y[ | = ]= X y= = −∞xfX y= dx

30 µ 30 30 = − = − = −

x x dx dx 1 33 30 1 33 30 3 33 30 31 48 30 33 30 33 (ln ln ) ln ln ln ln .

El valor promedio de la presión interna es de 31.48 pulg de mercurio cuando la presión externa sobre el plafón es 30.

Curvas de regresión

En el ejemplo previo, tome nota de que no se calculó la media de X. Se determinó la media de X cuando y = 30. El valor medio obtenido dependió del valor elegido para Y. En general, la media de X, dada Y = yX | y, es una función de y. La representación gráfica de esta función hace que se obtenga la llamada curva de regresión de X sobre Y. Este término se define formalmente en la definición 5.4.2. Una vez más, advierta que pueden invertirse los papeles que desempeñan X y Y.

Definición 5.4.2 (curva de regresión). Sea (X, Y) una variable aleatoria bidimensional. 1. La gráfica del valor medio de X, dada Y = y, se denota conµX| yy se llama curva de

regre-sión de X sobre Y.

2. La gráfica del valor medio de Y, dada X = x, se denota conµY|xy se llama curva de regre-sión de Y sobre X.

La definición precedente se ilustra mediante el cálculo de la curva de regresión de X sobre Y y la de Y sobre X para la variable aleatoria (X, Y) del ejemplo 5.4.2.

Ejemplo 5.4.3. La densidad condicional de X, dada Y = y, donde X y Y son las presiones interna y externa sobre un plafón de soporte de aire, está dada por:

f x x y y x X y( ) (ln ln ) = − ≤ ≤ 1 33 33

La ecuación de la curva de regresión de X sobre Y está dada por:

µX y y y x x y dx y dx y y = − = − = − −

33 33 1 33 1 33 33 33 (ln ln ) ln ln ln ln

(20)

Note que se trata de una ecuación no lineal. Su gráfica no es una recta. Dicha gráfica se bosqueja al representarµX|yrespecto de valores selectos de y. La gráfica se ilustra en la figura 5.4a. La densidad condicional de Y, dada X = x, es:

f y f x y f x c x c x x y x Y x XY X | ( ) ( , ) ( ) / ( / ) = = − = − ≤ ≤ 1 27 1 27 27

La ecuación de la curva de regresión de Y sobre X está dada por: a) y 33 27 28 29 30 31 32 0 27 28 29 30 31 32 33 b) x 27 28 29 30 31 32 0 27 28 29 30 31 27 28 29 30 31 32 32.5 29.90 30.43 30.95 31.48 31.98 32.50 32.74 FIGURA 5.4

a) Curva de regresión no lineal:µX|y= (33 – y)/(ln 33 – ln y); b) curva de regresión lineal:µY|x= (1/2)(x + 27).

µX | y

µY | x

(21)

µY x x y x dy y x x x x = − = − = − − = +

1 27 2 27 27 2 27 1 2 27 27 2 2 2 ( ) ( ) ( / ) ( )

Note que esta ecuación es lineal. Su gráfica es la recta que se muestra en la figura 5.4b. Ahora, puede usar estas curvas para calcular la media de X con cualquier valor especificado de Y, o viceversa. Por ejemplo, el valor promedio de la presión externa Y, dada la presión interna de 29, es:

µY|x = 29 = (1/2)(x + 27) = (1/2)(56) = 28 pulgadas de mercurio

Se presentan únicamente las ideas básicas subyacentes al tema de la regresión. El cálculo de las curvas de regresión teóricas requiere conocer la densidad conjunta de (X, Y). En la práctica, pocas veces se conoce con certidumbre tal densidad. Así pues, en tal contexto por fuerza es necesario aproximar estas curvas teóricas a partir de un conjunto de datos: un conjunto de observaciones de la variable aleatoria (X,

Y). Los métodos para hacerlo se describen en los capítulos 11 y 12.

5.5

TRANSFORMACIÓN DE VARIABLES

En la sección 4.8, se considera el problema de transformar variables continuas en el caso de una sola variable. En otras palabras, dada una variable aleatoria continua X, cuya densidad se conoce, se estu-dia la forma de calcular la densidad de la variable aleatoria Y, que es función de X. En este punto, se reconsidera el problema en el caso de dos variables. A tal efecto, primero debe presentarse la notación de jacobianos.

Suponga que se trabaja en el plano xy y que u y v son variables, cada una a su vez una función de x y y. En otras palabras:

u = g1(x, y) y v = g2(x, y)

Esas dos ecuaciones definen una transformación T de alguna región del plano xy al plano uv, como se ilustra en la figura 5.5a. Suponga que g1 y g2 tienen derivadas parciales continuas respecto de x y y. El jacobiano de T se denota como JTy está dado por el determinante siguiente:

J u x u y v x v y T = ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ El ejemplo 5.5.1 ilustra esta idea.

x

(22)

Ejemplo 5.5.1. Considere la transformación T del plano xy al plano uv, definida por: u = g1(x, y) = (3yx)/6 v = g2(x, y) = x/3 El jacobiano de T es: J u x u y v x v y T= = − = − = − ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ 1 6 1 2 1 3 0 1 6 0 1 2 1 3 1 6 / / / ( / ) ( ) ( / ) ( / ) ( / )

Si la transformación T es uno a uno, entonces es susceptible de inversión. Suponga que la transformación inversa T –1 está definida por las ecuaciones

x = h1(u, v) y y = h2(u, v)

y que h1 y h2 tienen derivadas parciales continuas (figura 5.5b). El jacobiano de esta transformación inversa está dado por el determinante:

∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ x u x v y u y v

Éste es el tipo de jacobiano útil en el contexto estadístico.

Suponga que se tienen dos variables aleatorias continuas X y Y, de las que se conoce su densidad conjunta fXY. Sean U y V variables aleatorias, ambas funciones de X y Y. Se pretende determinar la forma de fUV, la densidad conjunta de (U, V), con base en el conocimiento de la forma de fXY. El método para hacerlo guarda paralelismo con el teorema 4.8.1 y se describe en el teorema 5.5.1.

(x, y) (x, y) (u, v) (u, v) T: u = g1(x, y) v = g2(x, y) a) T–1: T–1 x = h1(u, v) y = h2(u, v) b) T T FIGURA 5.5

(23)

Teorema 5.5.1. Sea (X, Y) una variable aleatoria continua con densidad conjunta fXY. Sean:

U = g1(X, Y) y V = g2(X, Y)

donde g1 y g2 definen una transformación uno a uno. Sea la transformación inversa definida por:

X = h1(U, V) y Y = h2(U, V)

donde h1 y h2 tienen primeras derivadas parciales continuas. Entonces, la densidad conjunta de (U, V) está dada por:

fUV( , )u v = fXY( ( , ),h u v h u v J1 2( , ))

donde J ≠ 0 es el jacobiano de la transformación inversa. Dicho de otra manera:

J x u x v y u y v = ∂ ∂ ∂∂ ∂ ∂ ∂ ∂

Es fácil apreciar que el teorema 4.8.1 es un caso especial de este teorema, con correspondencia de fXcon fXY, g–1(y) como función de transformación inversa y |dg–1(y)/dy| como el equivalente del valor absoluto del jacobiano de la transformación inversa.

Ejemplo 5.5.2. Suponga que X y Y son variables aleatorias independientes de distribución uniforme en los intervalos (0, 2) y (0, 3), respectivamente. La densidad conjunta de (X, Y) está dada por:

f x y x y XY( , )= / < < < < 1 6 0 2 0 3

Sean U = X Y y V = X + Y. ¿Cuál es la densidad conjunta de (U, V)? Para aplicar el teorema 5.5.1, primero tome nota de que la transformación:

T U X Y V X Y : = − = +    

es una transformación lineal del plano xy al plano uv. Un resultado de cálculo avanzado afirma que una transformación lineal de un espacio bidimensional a otro bidimensional es uno a uno, siempre que el determinante de su matriz de coeficientes difiera de cero. En este caso, el determinante es:

1 1

1 1 1 1 1 1 2

= − =

( ) ( ) ( ) ( )

de modo que T puede invertirse. La transformación inversa se determina al despejar X y Y en el sistema de ecuaciones precedente. En este caso, T–1 está dada por:

T X U V Y V U − = + = −     1 2 2 : ( )/ ( )/

(24)

El jacobiano de T–1 es: ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ x u x v y u y v =1 2 1 2 = − − = 1 2 1 2 1 2 1 2 1 2 1 2 1 2 / / / / ( / ) ( / ) ( / ) ( / ) / Según el teorema 5.5.1: fUV( , )u v fXY((v u) / , (v u) / ) J ( / )( / ) / = + − = = 2 2 1 6 1 2 1 12

En el cálculo del conjunto de valores con el que fUV> 0, advierta que 0 < x < 2 y 0 < y < 3, por lo que (X, Y) se ubica en el rectángulo de la figura 5.6a. Es fácil apreciar que U = X – Y debe situarse entre –3 y 2, y V = X + Y, entre 0 y 5. Por añadidura, U y V deben satisfacer las desigualdades:

0 2 2 0 2 3 < + < < − < ( )/ ( )/ v u v u o 0 4 0 6 < + < < − < v u v u

Resolver simultáneamente estas desigualdades permite obtener la región R que se muestra en la figura 5.6b. Así pues, la densidad de (U, V) está dada por:

fUV( , )u v =1 12/ ( , )u vR

Se deja como tarea al lector verificar que fUV es, en realidad, una densidad válida.

(0,0) (0,3) (2,3) (–3,3) (2,2) (–1,5) (2,0) a) b) y x v – u =6 v + u =4 v u = u = v R –3 0 2 FIGURA 5.6

(25)

Es posible obtener otros teoremas de transformación del teorema 5.5.1. Algunos se incluyen en los ejercicios 48, 50 y 51. Consulte un análisis más detallado del tema en [49].

RESUMEN DEL CAPÍTULO

En este capítulo, se consideran variables aleatorias de más de una dimensión. Se hace énfasis en las variables aleatorias de dos dimensiones. La densidad conjunta se define al ampliar en forma lógica el concepto de densidad de una sola variable. Esta función se usa para calcular probabilidades relaciona-das con variables aleatorias bidimensionales del tipo (X, Y). Se estudia la forma de obtener las densida-des marginales de X y Y a partir de su densidad conjunta. Esas densidades marginales son las usuales cuando estas dos variables se consideran por sí solas. El coeficiente de correlación ρ se presenta como una medición de linealidad de X con Y. El concepto de independencia entre X y Y se define formalmente, además de describir su relación con ρ. Se estudia cómo definir las densidades condicionales de X dada Y, y de Y dada X, a partir del conocimiento de la densidad conjunta de (X, Y) y las densidades marginales de X y Y. Las densidades condicionales se usan para determinar las ecuaciones de las curvas de regresión de Y sobre X y de X sobre Y. Éstas son las gráficas del valor medio de Y como función de X, o a la inversa. Se analiza que dichas curvas pueden ser lineales o no serlo.

En el capítulo, se mencionan y definen términos importantes, que el lector debe conocer. Son los siguientes:

Variable aleatoria discreta bidimensional

Variable aleatoria continua bidimensional

Densidad discreta conjunta Densidad marginal discreta Variables aleatorias independientes Covarianza Correlación positiva perfecta Ausencia de correlación

EJERCICIOS

Sección 5.1

1. Use la tabla 5.2 para calcular cada una de las probabilidades siguientes:

a) La probabilidad de que los robots produzcan exactamente dos soldaduras defectuosas y un tornillo apretado de manera incorrecta.

b) La probabilidad de que produzcan al menos una soldadura defectuosa y un tornillo apreta-do incorrectamente.

Curva de regresión

Variable aleatoria discreta de dimensión n

Variable aleatoria continua de dimensión n

Distribución normal bivariada Densidad continua conjunta Densidad marginal continua Valor esperado de H(X, Y) Coeficiente de correlación Correlación negativa perfecta Densidad condicional

(26)

c) La probabilidad de que produzcan al menos una soldadura defectuosa. d) La probabilidad de que atornillen incorrectamente por lo menos dos tornillos.

2. En la realización de un experimento de laboratorio, se usan termómetros en cuatro puntos de unión de la configuración del equipo. Estos cuatro termómetros se seleccionan aleatoriamente de un recipiente que contiene siete. Sin que lo sepa el científico, tres de los siete miden incorrectamente la temperatura. Sea X el número de termómetros defectuosos seleccionados, y Y, el de termómetros no defectuosos elegidos. La densidad conjunta de (X, Y) se presenta en la tabla 5.5.

a) Los valores de la tabla 5.5 pueden obtenerse al tomar en cuenta que la variable aleatoria X es hipergeométrica. Use los resultados de la sección 3.7 para verificar esos valores. b) Calcule las densidades marginales de X y Y. ¿Cuál tipo de variable aleatoria es Y? c) En forma intuitiva, ¿son independientes X y Y? Justifique matemáticamente su respuesta. 3. La densidad conjunta de (X, Y) está dada por:

fXY (x, y) = 1/n2 x = 1, 2, 3, . . . , n y = 1, 2, 3, . . . , n a) Verifique que fXY (x, y) satisface las condiciones necesarias para ser una densidad. b) Calcule las densidades marginales de X y Y.

c) ¿Son independientes X y Y?

4. La densidad conjunta de (X, Y) está dada por:

fXY (x, y) = 2/n(n + 1) 1 ≤y x n donde n es un entero positivo

a) Verifique que fXY (x, y) satisface las condiciones necesarias para ser una densidad. Sugeren-cia: La suma de los primeros n enteros está dada por n(n + 1)/2.

b) Calcule las densidades marginales de X y Y. Sugerencia: Trace una imagen de la región sobre la cual se define (X, Y).

c) ¿Son independientes X y Y?

d) Suponga que n = 5. Use la densidad conjunta para calcular P[X≤ 3 ∧ Y ≤ 2]. También calcule P[X≤ 3] y P[Y≤ 2)]. Sugerencia: Esboce la región sobre la cual se define (X, Y). 5. Los dos tipos más comunes de errores de los programadores son los de sintaxis y lógica. En el

caso de un lenguaje sencillo, como BASIC, suele ser bajo el número de dichos errores. Sea X el número de errores sintácticos, y Y, el de errores lógicos, en la primera ejecución de un progra-ma escrito en dicho lenguaje. Suponga que la densidad conjunta de (X, Y) es la que se indica en la tabla 5.6. TABLA 5.5 x/y 0 1 2 3 4 0 0 0 0 0 1/35 1 0 0 0 12/35 0 2 0 0 18/35 0 0 3 0 4/35 0 0 0

(27)

a) Calcule la probabilidad de que un programa seleccionado aleatoriamente no contenga algu-no de estos dos tipos de errores.

b) Calcule la probabilidad de que un programa seleccionado aleatoriamente contenga por lo menos un error sintáctico y a lo más un error lógico.

c) Calcule las densidades marginales de X y Y.

d) Calcule la probabilidad de que un programa seleccionado aleatoriamente incluya por lo menos dos errores sintácticos.

e) Calcule la probabilidad de que un programa seleccionado aleatoriamente contenga uno o dos errores lógicos.

f ) ¿Son independientes X y Y?

6. Considere el ejemplo 5.1.5. Verifique que P[X ≤ 30 ∧Y ≤ 28] 0.15 mediante la integración de la densidad conjunta, primero respecto a y y luego respecto a x.

7. a) Use la densidad conjunta del ejemplo 5.1.5 para calcular la probabilidad de que la presión interna y externa sobre el techo sea mayor de 30 y menor de 32, respectivamente.

b) Use la densidad marginal de X para calcular P[X≤ 28]. c) Use la densidad marginal de Y para calcular P[Y > 30].

8. Sea X la temperatura (en °C), y Y, el tiempo en minutos requeridos, para que el motor a diesel de un automóvil esté listo para ponerlo en movimiento. Suponga que la densidad conjunta de (X, Y) está dada por:

f x y c x y x y XY( , )= ( + + ) ≤ ≤ ≤ ≤ 4 2 1 0 40 0 2

a) Calcule el valor de c que la convierte en densidad.

b) Calcule la probabilidad de que en un día seleccionado aleatoriamente la temperatura at-mosférica sea mayor de 20°C y se requiera por lo menos 1 min para poner en movimiento el automóvil.

c) Calcule las densidades marginales de X y Y.

d) Calcule la probabilidad de que en un día seleccionado aleatoriamente se requiera al menos 1 min antes de que el automóvil esté listo para ponerlo en movimiento.

e) Calcule la probabilidad de que en un día seleccionado aleatoriamente la temperatura at-mosférica sea mayor de 20°C.

f ) ¿Son independientes X y Y? Explique su respuesta sobre bases matemáticas.

9. Un ingeniero estudia el tránsito vehicular a hora temprana de la mañana en una intersección dada. El periodo de observación se inicia a las 5:30 a.m. Sea X el momento de llegada del

TABLA 5.6 x/y 0 1 2 3 0 0.400 0.100 0.020 0.005 1 0.300 0.040 0.010 0.004 2 0.040 0.010 0.009 0.003 3 0.009 0.008 0.007 0.003 4 0.008 0.007 0.005 0.002 5 0.005 0.002 0.002 0.001

(28)

primer vehículo en la dirección de norte a sur, y Y, la del primer automóvil en la dirección de este a oeste. El tiempo se mide en fracciones de hora después de las 5:30 a.m. Suponga que la densidad de (X, Y) está dada por:

fXY (x, y) = 1/x 0 < y < x < 1

a) Verifique que se trata de la densidad conjunta de una variable aleatoria bidimensional. b) Calcule P[X≤ 0.5 ∧ Y ≤ 0.25].

c) Calcule P[X > 0.5 ∨Y > 0.25]. d) Calcule P[X≥ 0.5 ∧ Y ≥ 0.5].

e) Calcule las densidades marginales de X y Y. f ) Calcule P[X≤ 0.5].

g) Calcule P[Y ≤ 0.25].

h) ¿Son independientes X y Y? Explique su respuesta. 10. La densidad conjunta de (X, Y) está dada por:

fXY(x, y) = x3y3/16 0 x 2, 0 y 2 a) Calcule las densidades marginales de X y Y.

b) ¿Son independientes X y Y? c) Calcule P[X≤ 1].

d) Si se sabe que y = 1, ¿cuál es el valor de P[X≤ 1]? (¡No use cálculos para responder a esta pregunta!)

11. Las condiciones económicas originan fluctuaciones de precios en materias primas y productos terminados. Sea X el precio que el transportista inicial paga por un barril de petróleo crudo, y Y, el que paga la refinería que compra dicho producto al transportista. Suponga que la densidad conjunta de (X, Y) está dada por:

fXY (x, y) = c 20 < x < y < 40

a) Calcule el valor de c que hace de ésta la densidad conjunta de una variable aleatoria bidimensional.

b) Calcule la probabilidad de que el transportista pague al menos $25 por barril de crudo, y la refinería, cuando mucho $30 por barril.

c) Calcule la probabilidad de que el precio que paga la refinería exceda el pagado por el transportista al menos en $10 por barril.

d) Calcule las densidades marginales de X y Y.

e) Calcule la probabilidad de que el precio que paga el transportista sea por lo menos de $25. f ) Calcule la probabilidad de que el precio que paga la refinería sea cuando mucho de $30. g) ¿Son independientes X y Y? Explique su respuesta.

12. (Variables aleatorias discretas de dimensiónn.) Las variables aleatorias de dimensión n > 2 se pueden definir y estudiar mediante la ampliación lógica de las definiciones presentadas en el caso bidimensional. Por ejemplo, la variable (X1, X2, X3, . . . , Xn), en la que cada una de las variables X1, X2, X3, . . . , Xn es una variable aleatoria discreta, se llama variable aleatoria discreta de n-dimensional. La densidad de esa variable está dada por:

f (x1, x2, x3, . . . , xn) = P[X1 = x1, X2 = x2, X3 = x3, . . . , Xn = xn] Este problema implica el uso de una variable aleatoria tridimensional.

(29)

Los artículos producidos en una línea de montaje se clasifican como no defectuosos, defectuosos pero salvables, o defectuosos y no salvables. Las probabilidades de observar productos en cada una de estas categorías son 0.9, 0.08 y 0.02, respectivamente. Esas proba-bilidades no cambian de un intento a otro. Se seleccionan y clasifican aleatoriamente 20 artículos. Sean X1, X2 y X3 el número de productos obtenidos en cada una de las categorías, en el mismo orden.

a) Calcule P[X1 = 15, X2 = 3, X3 = 2]. Sugerencia: Use la fórmula del número de permutaciones de objetos que se diferencian, de la página 16 del capítulo 1, para contar el número de formas de obtener este tipo de división en una secuencia de 20 intentos.

b) Encuentre la fórmula general de la densidad de(X1, X2, X3).

13. (Variables aleatorias continuas de dimensiónn.) La variable (X1, X2, X3, . . . , Xn), donde cada una de las variables aleatorias X1, X2, X3, . . . , Xn es continua, se llama variable aleatoria continua de n-dimensional. La densidad de este tipo de variable se define al ampliar de manera natural la definición 5.1.3. Señale las tres propiedades que identifican a una función como densidad de (X1, X2, X3, . . . , Xn).

14. Sea f (x1, x2, x3) = c(x1 · x2 · x3) para 0 ≤x1≤ 1, 0 ≤x2≤ 1, 0 ≤x3≤ 1. Calcule el valor de c que hace de ésta en la densidad de la variable aleatoria tridimensional (X1, X2, X3).

Sección 5.2

15. Se seleccionan aleatoriamente cuatro termómetros de un recipiente que contiene tres defectuo-sos y cuatro que funcionan correctamente. Sea X el número de medidores defectuosos seleccio-nado, y Y, el de medidores no defectuosos elegido (véase ejercicio 2). La densidad conjunta de (X, Y) aparece en la tabla 5.5.

a) Con base en la descripción del problema, ¿debe ser negativa o positiva Cov (X, Y )? b) Calcule E[X], E[Y], E[XY] y Cov (X, Y).

16. Sea X el número de errores sintácticos, y Y, el de errores lógicos, en la primera ejecución de un programa escrito en BASIC (véase el ejercicio 5). La densidad conjunta de (X, Y ) se presenta en la tabla 5.6.

a) X y Y no son independientes. ¿Acaso ello brinda indicios sobre el valor de la covarianza? b) Calcule E[X], E[Y], E[XY] y Cov (X, Y ). Brinde una interpretación física aproximada de la

covarianza.

c) Calcule E[X + Y]. ¿Cuál es la interpretación práctica de esta esperanza?

17. Considere la variable aleatoria (X, Y ) del ejercicio 3. Sin realizar cálculos adicionales, determi-ne Cov (X, Y).

18. Use las densidades marginales que aparecen en la tabla 5.3 para calcular E[X] y E[Y]. Compare sus resultados con los obtenidos en el ejemplo 5.2.1.

19. La densidad conjunta de (X, Y), donde X y Y son las presiones barométricas interna y externa, respectivamente, sobre un plafón de soporte de aire (véase ejemplo 5.1.5), están dadas por:

fXY (x, y)= c/x 27 ≤ y x ≤33

c =1/(6–27 ln 33/27) 1.72 a) Calcule E[X], E[Y], E[XY] y Cov (X, Y).

Referencias

Documento similar