• No se han encontrado resultados

7_distribucion_normal.pdf

N/A
N/A
Protected

Academic year: 2020

Share "7_distribucion_normal.pdf"

Copied!
46
0
0

Texto completo

(1)

Sin duda, la distribución continua de

probabilidad más importante, por la

frecuencia con que se encuentra y

por sus aplicaciones teóricas, es la

distribución normal, gaussiana o

de Laplace-Gauss.

Fue descubierta y publicada por

primera vez en 1733 por De Moivre.

A la misma llegaron, de forma

independiente, Laplace (1812) y

Gauss (1809), en relación con la

teoría de los errores de observación

astronómica y física .

7. Distribución normal

1

(2)

Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco.

Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie (tallas, pesos, diámetros, perímetros,...).

Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen,...

Errores cometidos al medir ciertas magnitudes.

Valores estadísticos muestrales, por ejemplo: la media.

Y en general cualquier característica que se obtenga como suma de muchos factores.

Otras distribuciones como la binomial o la de Poisson se aproximan

a la normal. Distribuciones binomiales con n grande (n >30) y p ‘ni pequeño’ (np > 5)

(3)

Distribución normal o gaussiana

• Está caracterizada por

dos parámetros

: la

media

, μ y la

desviación típica

, σ.

• Su función de densidad es:

0)

(

σ

π

2

σ

1

)

(

σ)

μ,

(

2 2 σ 2 μ) (

>

=

=

− − x

e

x

P

N

La curva normal adopta un

número infinito de

formas

,

determinadas por sus parámetros

μ y σ.

(4)

− ∞ +

Características de la distribución Normal

µ, Mo, Mn

σ

σ

µ

-

σ

µ

+

σ

Tiene forma de campana, es asintótica al eje de las abscisas (para x = ±∞ )

Los puntos de inflexión tienen como abscisas los valores µ ± σ.

Simétrica con respecto a la media (µ) donde coinciden la mediana (Mn) y la moda (Mo).

Puntos de inflexión

(5)

Distribución normal con

µ

=0 para varios valores

σ

0

0.4

0.8

1.2

1.6

-2.50

-1.50

-0.50

0.50

1.50

2.50

x

σ=0.25 σ=0.5 σ=1

p(x)

(6)

20 30 40 50 60 70 80 90 100 110 120

σ

=

5

σ

=

5

10

=

σ

Curvas normales con distintas medias y desviaciones estándar.

(7)

N(μ, σ):

Interpretación geométrica

• Podemos interpretar la

media como un factor de

traslación.

• Y la desviación típica

como un factor de escala,

grado de dispersión,…

(8)

N(μ, σ):

Interpretación probabilista

• Entre la media y una

desviación típica

tenemos siempre

la

misma probabilidad

:

aproximadamente el

68%.

•Si tomamos intervalos centrados en μ, y cuyos extremos están…

–a distancia σ,  tenemos probabilidad 68% –a distancia 2 σ,  tenemos probabilidad 95% –a distancia 2’5 σ  tenemos probabilidad 99%

• Entre la media y

dos desviaciones

típicas aprox. 95%

(9)

Podemos obtener la función de

distribución

F

(

x

) integrando la

función de densidad de probabilidad:

π

2

σ

1

)

(

2 2 σ 2 μ) (

dv

e

x

F

x v

∞ − − −

=

De modo que la probabilidad de una

variable aleatoria normal

X

en un

intervalo

a

x

b

es:

π

2

σ

1

)

(

)

(

)

(

2 2 σ 2 μ) (

dv

e

a

F

b

F

b

X

a

P

b a v

− −

=

=

¡No podemos calcular analíticamente el valor de la integral!

Tabularemos sus valores numéricos...

(10)

¿Cómo calcular probabilidades asociadas

a una curva normal específica?

Dado que tanto

µ

como

σ

pueden asumir

infinitos valores,

es

impracticable tabular las probabilidades para todas las posibles

distribuciones normales. Para solucionarlo, se utiliza la

distribución normal reducida

o

tipificada.

Se define una variable

z

=

x

-

µ

σ

Es una traslación , y un cambio de escala de

la variable original.

(11)

La nueva variable

z

se distribuye como una

NORMAL

con media

µ

= 0

y desviación típica

σ

= 1

-3 -2 -1 0 1 2 3 z

68%

95%

99%

Recordemos de nuevo que en cualquier distribución normal las probabilidades delimitadas entre :

±

σ

=

68 %

±

2

σ

=

95 %

±

3

σ

=

99 %

68%

99% 95%

(12)

Tipificación

Dada una variable de media μ y desviación típica

σ, se denomina

valor tipificado

z, de una

observación x, a la

distancia (con signo) con

respecto a la media, medido en desviaciones

típicas

, es decir:

σ

µ

=

x

z

• En el caso de variable

X normal

, la interpretación es clara:

a

signa a todo valor de N(μ, σ), un valor de N(0,1) que deja

exáctamente

la misma probabilidad

por debajo.

• Nos permite así

comparar entre dos valores

de dos

distribuciones normales diferentes, para saber cuál de los

(13)
(14)

Se quiere dar una beca a uno de dos estudiantes de sistemas

educativos diferentes y se asignará al que tenga mejor expediente

académico:

– El estudiante A tiene una calificación de 8 en un sistema donde la

calificación de los alumnos se comporta como N(6,1).

– El estudiante

B

tiene una calificación de

80

en un sistema donde la

calificación de los alumnos se comporta como

N(70,10).

1 10 70 80 2 1 6 8 = − = − = = − = − = B B B B A A A A x z x z σ µ σ µ

–No podemos comparar directamente 8 puntos de A frente a los 80 de B, pero como ambas poblaciones se comportan de modo normal, podemos tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1).

–Como zA > zB, podemos decir que el

porcentaje de compañeros del mismo sistema de estudios que ha superado

en calificación al estudiante A es mayor

que el que ha superado B. En principio

A es mejor candidato para la beca.

(15)

Las probabilidades de la variable tipificada

(z)

están

tabuladas

para los diferentes valores de la variable.

Para calcular probabilidades, una vez transformada,

la variable a valores de z, se busca en una tabla el

área correspondiente.

Apliquemos el cambio de

variable tipificada a la función

de distribución

F

(

x

):

(16)

du

e

z

Z

p

z

F

z

e

z

p

∞ − − −

=

=

<

<

=

z 2 u 2 z 2 2

π

2

1

)

(

)

(

;

π

2

1

)

(

Característica de la distribución normal tipificada (reducida o

estándar):

No depende de ningún parámetro.

Su media es 0, su varianza es 1 y su desviación típica es 1.

La curva f(x) es simétrica respecto al eje de ordenadas y tiene un máximo en este eje.

Tiene dos puntos de inflexión en z =1 y z = -1.

(17)

Hay varios tipos de tablas de la distribución normal

La que se explica aquí representa las

áreas

para los

diferentes valores de

z

desde 0 hasta +

.

0

+

Los valores

negativos de z NO

están tabulados, ya que la distribución es simétrica

(18)
(19)

0.0

0.1

0.2

0.3

0.4

0.5

0 1 2 3 4 5 6 7 8 9

.0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359

.0398 .0438 .0478 .0517 .0557 .0596 .0363 .0675 .0675 .0754

.0793 .0832 .0871 .0910 .0948 .0987 .1026 .... ... ...

.1179 ... ... ... ...

.1554 .... ... ....

.1915 ....

La tabla consta de:

*Margen izquierdo : Los enteros de z y su primer decimal.

* Margen superior: segundo decimal

* Cuerpo de la tabla: áreas correspondientes, acumuladas, desde 0 hasta 3.99

(20)

EJEMPLOS:

1.-¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

2.-¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y +2.03?

3. Hallar P( z >1.25 ) 4. Hallar P ( -0.34 < z <

)

5. Hallar P ( 0.34 < z < 2.30 )

(21)

?

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

z Cómo la curva es simétrica

P (-2.03 < z < 0) = P (0 < z < 2.03)

-3 -2 -1 0 1 2 3

(22)

0

1

2

3

4

1.8

1.9

2.0

2.1

47. 88%

Ejemplo 1

¿Cuál es la probabilidad de que un valor de z esté entre 0 y -2.03?

-3 -2 -1 0 1 2 3 z

Se busca en la tabla el área correspondiente a z = 2.03

0.47882

(23)

?

47.88%

47.88%

Ejemplo 2

¿Cuál es la probabilidad de que un valor de z esté entre -2.03 y 2.03 ?

-3 -2 -1 0 1 2 3 z En el ejemplo 1, vimos que la probabilidad de que z estuviera entre 0 y 2.03 = 0.47882

La misma área hay entre 0 y -2.03 , por lo tanto

P ( -2.03< z< 2.03) = 0.95764

95.76%

(24)

Ejemplo 3

¿Cuál es la probabilidad de que un valor de z sea mayor a 1.25 ?

z -3 -2 -1 0 1 2 3

?

1.- La probabilidad de 0 < z < +

= 0.500 2.- La probabilidad de 0 < z < 1.25 = 0.39435

39.44%

3.- La probabilidad de z > 1.25 =

0.500 - 0.39435= 0.10565

10.56%

50%

(25)

Hallar P( -0.34 < z <

)

z P(0 < z <0.34) = 0.13307 =

P(-0.34 < z < 0)

13.31% 50%

63.31%

P( -0.34 < z < ∞) =

0.13307 + 0.50000 = 0.63307

-3 -2 -1 0 1 2 3

Ejemplo 4

P (0 < z <

) = 0.50000

(26)

Ejemplo 5

Hallar P( 0.34 < z < 2.30)

z -3 -2 -1 0 1 2 3

P(0< z <0.34) = 0.13307 P( 0 < z < 2.30) = 0.4893 P (0.34 < z < 2.30) = 0.48930 - 0.13307 = 0.35623

35.62%

(27)

EJEMPLO

Sea una variable distribuida normalmente con media

µ

= 4 y desviación típica

σ

= 1.5.

¿Cuál es la probabilidad de encontrar un valor x

6

(P(x

6 ))?

(28)

x

µ

= 4

σ

= 1.5

Hallar P ( x > 6 )

?

6

1.- transformar x en un valor de z

0.40824

0.09176

z = (6 - 4)/1.5 = 1.33

2.- Hallar P ( 0 < z < 1.33) =

3.- 0.5000 - 0.40824 =

σ

μ

x

z

=

0.5

-0.5 1 2.5 4 5.5 7 8.5

-3 -2 -1 0 1 1.33 2 3

z

(29)

Hasta ahora vimos como dado un valor x de la variable, hallar

probabilidades transformando (estandarización) la variable en

valores de

x -

µ

σ

¿Cómo hallar un valor de

x

, dada la probabilidad?

x

=

?

38.20%

Ejemplo: Sea una variable distribuida normalmente con

µ

=4

y

σ

= 2

. Hallar el valor de x que deja por encima de él un 38.20% (0.3820).

Se debe desestandarizar :

x = z

σ

+

µ

0.5000 - 0.382 = 0.118  Se busca en la

tabla el valor más aproximado:0.1179 corresponde a

z

=+ 0.30

4.60

Sustituyendo en la fórmula

0.30 ∙ 2 + 4 = 4.60

z =

(30)
(31)

31

• Nota: Cuando n > 20, np

5, y n(1-p)

5 la

distribución binomial puede aproximarse por una

normal con

(1

)

np

np

p

µ

σ

=

(32)
(33)
(34)

En una empresa se ha visto que en un 10% de sus facturas se

cometen errores y se desea calcular la probabilidad que de

100 facturas, 12 de ellas los contengan:

1

2

100(.10)

10

(1

)

3

12.5 10.0

0.83

0.2967

3

11.5 10

0.5

0.1915

3

(12)

0.2967

0.1915

0.1052

(35)
(36)
(37)
(38)
(39)
(40)
(41)
(42)
(43)

43

(44)
(45)
(46)

Referencias

Documento similar

La Luna es algo más pequeña que la Tierra y está mucho más lejos de la superficie de los mares que la Tierra, por eso su atracción sobre el agua es mucho menor que el peso de esta..

Por otro lado, el proyecto Open Cities, ideado para probar las metodologías de innovación abierta en los servicios de las Smart Cities, también ha experimentado

Conocido es el caso de Mortimer Ternaux, autor de una Historia de la Revolución, publicada en el siglo XIX, o el todavía más significativo de Edgar Quinet, quien hace «la crítica de

Forzando el símil para el tema que aquí nos ocupa, esa perspectiva supondría concebir la ciudad como un texto, la traza urbana como predicado de la misma y sus

Puedes presentar tu propuesta de forma presencial en el registro de la EMSHI (C/Moratín, 17-2 o 46002, Valencia) de lunes a viernes de 9:00 a 14:00 horas o a través de correo

Los cooperantes de Infantil y Audición y Lenguaje siguen en la línea de que los supervisores entusiasman a los alumnos para que comparen su pensamiento sobre la enseñanza con el

126 Teorema; Sea una sucesidn de distribuciones de probabilidad y la sucesidn de sus respectives caracterlsticas.Entonces,la sucesidn converge débilmente a una funcidn de

Esta corriente dentro de la arquitectura, registra al Diseño como herramienta fundamental para mejorar la sustentabilidad en el hábitat.. Es más abarcativa que la corriente