3.1.1 Variables aleatorias
En cualquier experimento aleatorio tenemos resultados cualitativos o cuantitativos. Con el objeto de facilitar el estudio matemático, a cada uno de estos resultados le hacemos corresponder un número real.
Por ejemplo, el resultado de tomar un español al azar y medir su estatura es un número; el resultado de tomar una familia al azar y anotar el número de hijos es un número; el resultado de aplicar un tratamiento a un enfermo y observar si se cura o no, es un dato cualitativo, que puede convertirse en cuantitativo asignando un "1" al enfermo que se cura y un "0" al enfermo que no se cura.
En realidad lo que estamos haciendo es asignar a cada suceso del espacio muestral un número, pero esta asignación no tiene por qué ser única.
Pongamos un ejemplo: lanzamos dos dados al aire y a cada suceso elemental le podemos asignar la suma, el producto, etc., de los números que aparecen en las caras superiores.
Al igual que los resultados de un fenómeno aleatorio no son predecibles, los resultados de una variable aleatoria tampoco lo son, pero podemos calcular la probabilidad de que ocurra un determinado suceso.
A veces puede ocurrir que los valores que toma la variable aleatoria son los mismos, pero no ocurre lo mismo con las probabilidades. Pongamos un ejemplo.
Se dispone de dos fármacos A y B distintos para curar una misma enfermedad; los resultados de la variable aleatoria solamente pueden ser 1 ó 0 y uno de ellos puede curar el 20% de los casos y el otro el 70%.
Para tener identificada una variable aleatoria no basta con indicar los valores que pueda tomar, hay que indicar también sus probabilidades.
Una variable aleatoria X es toda función que toma diversos valores numéricos (dependientes del resultado de un fenómeno aleatorio) con distintas probabilidades.
Cuando la variable aleatoria toma un número finito o infinito numerable* de
valores, diremos que es una "variable aleatoria discreta". Veamos ejemplos:
En el caso del lanzamiento de un dado perfecto, la variable aleatoria X= "número que sale en la cara superior" puede tomar los valores X={1, 2, 3, 4, 5, 6} con probabilidades P(X)={1/6, 1/6, 1/6, 1/6, 1/6, 1/6}.
Si consideramos la variable aleatoria X= "número de varones en una familia de dos hijos", X={0, 1, 2} y P(X)={1/4, 1/2, 1/4}.
(Observar el espacio muestral del experimento aleatorio).
En general diremos, que una variable aleatoria discreta estará identificada si conocemos sus posibles valores
X
= {x
1, x
2, ..., x
n} y sus respectivas
probabilidadesP(X
= x
i)
= P
iObservemos que la suma de las probabilidades es 1: Pi
i
!
= 1A toda regla que permita asociar a cada valor xi de la variable aleatoria su
probabilidad Pi, la llamaremos "función de probabilidad".
Tal función de probabilidad puede venir dada por una tabla:
X 0 1 2
P(X) 1/4 1/2 1/4
o bien por una fórmula matemática.
También podemos definir la variable aleatoria a través de la "función de
distribución".
F(X)= P(X ! x)
* Un conjunto infinito A se dice que es numerable si se puede establecer una aplicación
F(X) no es más que la probabilidad de que la variable X tome valores menores o iguales que x. En el ejemplo anterior: F(0)= P(X ! 0) = P(X = 0) F(1)= P(X !1) = P(X = 0) + P(X = 1) F(2)= P(X ! 2) = P(X = 0) + P(X = 1) + P(X = 2)
De un modo general, a toda tabla, gráfica o expresión matemática que indique los valores que puede tomar una variable aleatoria y las probabilidades con que los toma, se llamará "distribución de probabilidad de dicha variable aleatoria".
El concepto de variable aleatoria proporciona un medio para relacionar cualquier resultado con una medida cuantitativa.
3.1.2 Esperanza, varianza y desviación
típica de una variable aleatoria
Se llama esperanza de la variable aleatoria discreta X, al número:
E X
[ ]
= x
1p
1+ x
2p
2+...+x
np
nx1, x2,. .., xn son los valores de la variable aleatoria y p1, p2, ..., pn las probabilidades respectivas.
La esperanza de una variable aleatoria X también se representa por µ, y se llama
media de la distribución. Por tanto, "esperanza de la variable aleatoria" y "media de la
distribución" son expresiones equivalentes.
µ = pixi
i=1 n
!
= E X[ ]
El conocimiento de la media de la distribución no es suficiente para caracterizar la distribución, ya que hay distribuciones con la misma media y distintas unas de otras.
Para medir la dispersión de los valores de una variable aleatoria X respecto de su media
µ
, se define el siguiente estadístico llamado varianza:V X
[ ]
= E x ! µ[
(
)
2]
Es decir:V X
[ ]
= x(
1! µ)
2p1+ x(
2! µ)
2p2+...+ x(
n! µ)
2pnPuesto que la varianza no podría medirse en las mismas unidades que la variable, utilizamos la raíz cuadrada de la varianza y a este número la llamamos desviación
típica.
Desv X
[ ]
= V X[ ]
Desv X
[ ]
= x(
1! µ)
2p1+ x(
2 ! µ)
2p2+...+ x(
n ! µ)
2pnEJEMPLO 3.1:
Calcular la media y la varianza del número de hijos varones de una familia con dos hijos.
Solución:
E={VV, VH, HV, HH}
X={0, 1, 2}= "número de hijos varones de una familia con dos hijos" P1= P(X = 0) = 1/ 4 P2= P(X =1) = 2 / 4 =1 / 2 P3 = P(X = 2) = 1/ 4 ! " # $ # 1 / 4+1 / 2 + 1/ 4 =1
En promedio, una familia con dos hijos tiene un hijo varón con una varianza de 1/2.
EJEMPLO 3.2:
Tras una intervención quirúrgica de un tipo determinado, el equipo médico mantuvo en el hospital a unos pacientes cinco días y a otros ocho. De éstos últimos no regresó ninguno al hospital y el coste de cada uno ascendió a 90.000 pts., mientras que de los dados de alta a los cinco días, las dos terceras partes no regresaron al hospital y el coste por cada individuo fue de 50.000 pts. El otro tercio restante tuvo que regresar al hospital ocasionando unos gastos totales por individuo de 150.000 pts.
En términos puramente económicos, ¿es preferible dar de alta a los enfermos a los cinco o a los ocho días?.
Solución:
Se trata de calcular el coste promedio en ambos casos. En el supuesto de que los pacientes estén ingresados 8 días, el coste promedio es de 90.000 pts., y en el supuesto de que los pacientes estén 5 días, la variable aleatoria se distribuye de la siguiente forma:
X 50.000 150.000
P(X) 2/3 1/3
El coste promedio en este caso será:
E[X]= 50.0002
3 +150.000 1
3= 83.330pts.
Puesto que 83.333 < 90.000, esto indica que es preferible, desde el punto de vista económico, tener ingresados a los pacientes cinco días.
La varianza la calculamos de la siguiente forma:
V[X]= (50.000 ! 83.000)22
3+ (150.000 ! 83.330)
21
3 = 2, 2 10