La expresión de que X está normalmente distribuida con los parámetros

Texto completo

(1)

1. La Distribución Normal

Los espacios muestrales continuos y las variables aleatorias continuas se presentan siempre que se manejan cantidades que se miden en una escala continua; por ejemplo, cuando se mide la cantidad de alcohol en la sangre de una persona, el peso neto de un paquete de alimento congelado, la velocidad de un automóvil, etc.

En el caso continuo, el lugar de los histogramas lo toman curvas continuas donde podemos imaginar a los histogramas con clases cada vez más estrechas que se aproximan a la curva continua. Entre las muchas curvas de distribución continua que se emplean en estadística, la más importante es la curva normal.

Con frecuencia a la distribución normal se le identifica como la piedra angular de la estadística moderna, esto se debe en parte al papel que desempeña en el desarrollo de la teoría estadística y en parte al hecho de que es frecuente que distintas variables asociadas a fenómenos naturales y cotidianos siguen, aunque sea de manera aproximada, esta distribución. Por ejemplo, la medición en experimentos científicos, tiempos de reacción en experimentos psicológicos, medidas e indicadores económicos, etc., tienen el mismo patrón general que las distribuciones normales. Además, la normal se puede usar para aproximar varias distribuciones de probabilidad discretas y tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras.

Definición

Se dice que una variable aleatoria continua X tiene una distribución normal con parámetros

(donde -

ón de densidad de probabilidad de X es: ( )

∞ < < ∞ =

− −

x e

2 1

f(x) 2

2

2 x

La expresión de que X está normalmente distribuida con los parámetros e denota como: X ~ N ( , ).

La gráfica de la distribución normal es:

Características

1. La curva tiene un solo pico, por tanto es unimodal y tiene forma de campana.

2. La media de la población distribuida normalmente cae en el centro de su curva normal. 3. Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente

(2)

pierde mucha precisión al ignorar valores tan alejados de la media. Por lo tanto, a cambio de la conveniencia del uso de este modelo teórico, se debe aceptar el hecho de que puede asignar valores empíricos imposibles.

4. Debido a la simetría de la distribución normal, la mediana y la moda se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor.

5. Si la distribución de la población de una variable es aproximadamente normal, entonces: a) Alrededor del 68,27% de los valores están dentro de 1 desviación estándar de la media. b) Alrededor del 95,45% de los valores están dentro de 2 desviaciones estándar de la media.

c) Alrededor del 99,73% de los valores están dentro de 3 desviaciones estándar de la media.

La función de distribución acumulativa correspondiente está dada por: ( )

dt

e

2

1

F(x)

x 2 t

2 2

∞ −

− −

=

Gráficamente:

Observaciones:

(3)

- Cabe destacar que no hay una sola distribución normal, sino una familia de curvas normales por

, áficas.

De lo anterior, se puede apreciar que la curva normal puede describir un gran número de poblaciones, diferenciadas solamente por la media, por la desviación estándar o por ambas.

- Para calcular P(a X "! X es una variable aleatoria con distribución normal de parámetros y debemos evaluar:

( )

dx

e

2

1

b

2 x

2 2

− −

a

Sin embargo, ninguna de las técnicas de integración estándar se emplean para evaluar la expresión anterior. En lugar de esto se trabaja con una distribución normal con valores de parámetros #

#%$ & ' (!)* +,!-. distribución normal estándar (variable aleatoria Z) y cuya función de densidad de probabilidad viene dada por:

= e− -∞<z<∞ 2

1

f(z) 2

2

z

La función de distribución acumulativa correspondiente viene dada por:

dt

e

2

1

)

(

z 2 2

2

∞ −

=

Φ

t

z

La expresión para una distribución normal estándar es Z ~ N (0,1) y donde z es la variable estandarizada.

La función de distribución de esta v.a. se denota por Φ, con Φ(z) = P(Z ≤ z), y se utiliza para el cálculo de probabilidades con la tabla de la distribución normal estándar, pues las probabilidades acumuladas para la v.a. Z están tabuladas.

Por ser la distribución simétrica se cumple :

(4)

Para estandarizar la variable X utilizamos expresión:

x

z= − (1.2)

El valor de z simplemente nos dice cuántas desviaciones estándar está el valor de x correspondiente arriba o debajo de la media.

La tabla que se manejará está organizada en términos de unidades estándar, o valores de z. Da los valores de únicamente la mitad del área bajo la curva normal, empezando con 0,0 en la media.

A partir de esta tabla podemos entonces calcular probabilidades de la siguiente manera:

Ejemplo 1.1:

Sea Z → N(0,1). Calcular : P(Z ≤ 2), P(Z > 1.5), P(1≤ Z ≤ 2.1), P(Z ≤ -0.65) P(Z ≤ 2) = Φ(2) = 0.9773

P(Z > 1.5) = 1 - P(Z ≤ 1.5) = 1 - Φ(1.5) = 1 - 0.9332 = 0.0668 P(1≤ Z ≤ 2.1) = Φ(2.1) - Φ(1) = 0.9821 - 0.8413 = 0.1408 P(Z ≤ -0.65) = Φ(-0.65) = 1 - Φ(0.65) = 1 - 0.7422 = 0.2578

Áreas bajo la curva normal

En la práctica, se encuentran áreas debajo de curvas normales en tablas especiales, sin embargo, para cualquier distribución normal de probabilidad todos los intervalos que contienen el mismo número de desviaciones estándar a partir de la media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal.

Por lo tanto y puesto que resulta físicamente imposible (y también innecesario) construir tablas separadas de áreas de curvas normales para todas las parejas de valores de

estas áreas se tabulan sólo en relación con la distribución normal estándar, es decir para calcular probabilidades asociadas a variables cuya distribución es normal con media ón cualquiera primero debemos estandarizar la variable utilizando (1.2) y después emplear la tabla de la distribución normal estándar para el cálculo de las probabilidades. (Tabla 1 del Apéndice)

Ejemplo 1.2:

Supongamos que la nota que obtienen los estudiantes de administración en una materia sigue una distribución normal con una media de 10 puntos y una desviación de 5 puntos. Se desea calcular la probabilidad de que un estudiante de administración obtenga una nota:

(5)

Definamos la variable X como la nota que se obtiene en la materia en estudio. Entonces tenemos que: X ~ N (10,25).

Primero hay que estandarizar la v. a. X. Es decir, convertirla en una v.a. de media 0 y varianza 1 a) P(X > 15) = 1 - P(X ≤ 15) = 1 - P (Z≤ 15 - 10 )

5

=1 - P(Z ≤ 1) = 1 - Φ(1) = 1 - 0.8413 = 0.1587 Análogamente se obtiene:

b) P(10 < X ≤ 16) = 0.3849

c) El profesor de la materia ha expresado que va a exonerar del examen final al 5% de los estudiantes que mejor nota acumulada tengan durante el curso. ¿Qué nota tiene que obtener un estudiante como mínimo para que sea exonerado del examen final?

En este caso se nos plantea el problema desde otro punto de vista: Ahora conocemos que P(X >n) = 0.05, es decir que existe una nota (n), que sólo es superada por el 5% de los estudiantes, y ese valor es el que debemos averiguar.

P(X>n) = 1 – P(X<n) =

<

5

10

1

P

Z

n

=1 - Φ

 −

5

10

n

= 0.05.

Por lo que Φ

 −

5

10

n

= 0.95 y de la Tabla 1 tenemos que 5

10

n

= 1.65, así que

n= 1.65*5+10 = 18.25

Un estudiante debe obtener como mínimo 18.25 para ser exonerado del examen final.

La distribución normal como una aproximación

Aunque la distribución normal es continua, resulta interesante hacer notar que algunas veces puede utilizarse para aproximar distribuciones discretas.

Por ejemplo, los siguientes gráficos corresponden a distribuciones binomiales con p = 0,5 y distintos valores de tamaños de muestras:

(6)

La aproximación normal a la distribución binomial nos permite resolver problemas sin tener que

consultar grandes tablas de la distribución binomial tomando

npq, sin embargo, debemos notar que se necesita tener algo de cuidado al utilizar la aproximación ya que la misma es bastante buena siempre y cuando se cumpla:

np

Nota: al realizar la aproximación se hace un pequeño ajuste ya que debido a que la normal es una distribución continua, la probabilidad de que la variable aleatoria sea exactamente igual a un valor específico es cero. Este ajuste se denomina factor de corrección.

El factor de corrección de continuidad es el ajuste de media unidad de medida para mejorar la exactitud cuando a una distribución discreta se le aplica una distribución continua.

Casos que pueden surgir:

1) Para la probabilidad de que por lo menos X ocurran, use el área por encima de (X – 0,5). 2) Para la de que más de X sucedan, utilice el área por arriba de (X + 0,5).

3) Para la de que X o menos ocurran, aplique el área por debajo de (X + 0,5).

4) Para la de que menos de X sucedan, emplee el área situada por debajo de (X – 0,5).

Ejemplo 1.3:

Suponga que una moneda se lanza 10 veces y que deseamos calcular la probabilidad de obtener 5,6 7 u 8 caras.

Debemos calcular:

)

8

5

(

X

P

, al aplicar el factor de corrección y utilizando que

58 . 1 5 . 0 * 5 . 0 * 10 5 5 . 0 * 10 = = = = = = npq y np

σ

µ

calculamos entonces:

P

X

P

(

4

.

5

<

<

8

.

5

)

=

<

<

58

.

1

5

5

.

8

58

.

1

5

5

.

4

Z

=

Φ

(

2

.

2

)

Φ

(

0

.

32

)

=

0

.

6119

Si hubiésemos aplicado la fórmula de la distribución de la binomial hubiésemos obtenido que la probabilidad es de 0.6123, así que observamos que los resultados son muy parecidos, lo que refleja la bondad de la estimación en al cálculo de la probabilidad buscada.

Figure

Actualización...

Referencias

Actualización...