Rango o amplitud de la variable: La diferencia entre los valores extremos se

20  103 

Texto completo

(1)

Manual breve de Estadística y Probabilidad

Septiembre 2013.

Este manual tiene como finalidad introducir y reafirmar conceptos vinculados al estudio de la estadística, la probabilidad y su distribución.

Recomendado para los cursos de bachillerato que contengan dicha temática. El material resulta de una recopilación de temas tratados en textos

recomendados por la inspección de matemática; resume algunos libros de texto y contiene aportes del docente, con el objetivo de guiar al estudiante en el estudio y sin ningún fin lucrativo.

(2)

INTRODUCCIÓN:

Desde que los pueblos se organizaron como Estados, sus gobernantes necesitaron estar informados sobre aspectos relativos a la cantidad o

distribución de la población, nacimientos o defunciones, producción agrícola o ganadera, bienes producidos, condiciones de vida de la población, etc.

Desde ese entonces la estadística se convierte en un importante instrumento del Estado.

Se atribuye a un economista y profesor de la Universidad de Götingen, llamado Godofredo Achenwall (1719 – 1772), la introducción del nombre Estadística para designar a esta “ciencia de las cosas que pertenecen al Estado”.

Dice Achenwall: “la política enseña cómo deben ser los Estados, la Estadística explica cómo son realmente”

La Estadística estudia fenómenos de difícil cuantificación, ya sea porque están sujetos a procesos cambiantes, o porque se mueven en el terreno del azar. Además puede haber una gran cantidad de datos, lo que limita el trabajo a estudiar una muestra de la población.

Una vez realizado el estudio, la Estadística permite:

1- Describir: Contar mediante tablas, gráficos y algunos parámetros, lo que ocurre con dicha muestra.

2- Hacer inferencia: Sacar conclusiones que puedan servir para comprender lo que ocurre con toda la población. Para poder hacer inferencia, la muestra debe cumplir con determinadas características que la hagan representativa.

Para que una muestra sea representativa debe ser aleatoria (sus elementos deben ser escogidos al azar, mediante algún tipo de sorteo) y proporcional (cada parte de la población está representada de acuerdo a su importancia en ella)

El método estadístico:

Podemos identificar 4 etapas que permiten estudiar y clasificar datos para luego enunciar conclusiones.

1- Recuento, relevamiento o compilación de datos:

La primera etapa consiste en la recolección de datos, generalmente muy numerosos, referidos a la situación que se desea investigar. Estos datos brindan información sobre las características de los individuos que componen la población que es objeto de estudio.

2- Tabulación y agrupamiento de datos:

Los datos recogidos son ordenados, clasificados y tabulados, de forma conveniente para facilitar su lectura. Los gráficos permiten realizar una interpretación simple y rápida y facilitan la elección de los métodos más adecuados para el estudio.

3- Medición de datos:

En esta etapa se observa el comportamiento de los datos al compararlos con parámetros o medidas de posición (Media, Mediana, Moda, etc.). También es posible analizar la dispersión de los datos con respecto a los parámetros antes mencionados, con nuevos parámetros llamados medidas de dispersión

(3)

4- Inferencia:

Después de la medición de datos la Teoría de la Probabilidad acude en ayuda de la Estadística. Se deducen las llamadas leyes de inferencia que permiten predecir el comportamiento futuro de la población investigada.

De esta manera la Estadística contribuye al mejoramiento del estado de una población.

Primera etapa: Obtención de datos:

Los primeros estudios estadísticos se referían a relevamientos de poblaciones compuestas por individuos. Posteriormente se adoptaron los términos

población e individuo a todo objeto de estudio.

Desde el punto de vista estadístico sólo interesa la totalidad constituida por la población. Todos los individuos aportan de la misma manera al resultado final. Los atributos, respecto de los cuales se hace el relevamiento, se clasifican en dos tipos: cuantitativos y cualitativos.

Los cualitativos se refieren a propiedades o características propias de un objeto, lo que resulta difícil de medir, sobre todo si están cargadas de subjetividad donde la apreciación varía de persona a persona.

Los cuantitativos están expresados por cantidades (discretas o continuas) lo que facilita su medición

Las discretas están expresadas por números enteros ej.: población de una ciudad, un país etc.

Las continuas están representadas por números reales. Entre los valores de dos mediciones consecutivas existen siempre infinitos valores. Ejemplos: Peso, altura, tiempo, etc.

Segunda etapa: Tabulación y gráficos

Una vez obtenidos los datos podemos ordenarlos en una serie simple

Ejemplo: se han tomado las estaturas de 20 estudiantes de un grupo de bachillerato, ordenadas de menor a mayor y expresadas en centímetros.

Altura Altura Altura Altura Altura

1 150 5 153 9 160 13 162 17 168

2 150 6 157 10 160 14 163 18 169

3 152 7 157 11 160 15 167 19 169

4 153 8 159 12 162 16 167 20 171

Rango o amplitud de la variable: La diferencia entre los valores extremos se denomina rango o amplitud.

x

x

n Amplitud

1 

 En el ejemplo: Amplitud 17115021 Agrupamiento de datos: Serie de frecuencias:

Dado que generalmente el número de datos es muy grande, resulta conveniente agruparlos. La forma mas sencilla de hacerlo es teniendo en cuenta la cantidad de veces que se repite cada dato.

(4)

Tomando el ejemplo anterior:

X f X f X f

150 2 159 1 167 2

152 1 160 3 168 1

153 2 162 2 169 2

157 2 163 1 171 1

Intervalos de clase:

Las tablas se pueden reducir aún más si tenemos en cuenta intervalos para la variable.

Para confeccionar dichos intervalos, dividimos el rango entre el número de clases que deseamos tener. Este resultado nos dará el ancho de clase, es decir la longitud de cada intervalo.

Siguiendo con el mismo ejemplo: Tomaremos 5 clases, de esta manera:

    

 4.2

5 21 5

150 171 ºClases N

Rango

AdC 5 (tomaremos una aproximación

superior)

Clase Frecuencia f

1- [150 – 155) 5

2- [155 – 160) 3

3- [160 – 165) 6

4- [165 – 170) 5

5- [170 – 175) 1

TOTAL n 20

La frecuencia en un intervalo de clases indica el número de veces que la variable toma valores de dicho intervalo.

Frecuencia Relativa:

Se llama frecuencia relativa de la variable, al cociente entre la frecuencia absoluta de cada valor de la variable por el número total de individuos.

n f

f

r

Se llama frecuencia relativa de un intervalo de clases al cociente de la

frecuencia absoluta del intervalo dividida por el número total de observaciones.

Ejemplo:

Clase Frecuencia f Frec. Relativa fr.

1- [150 – 155) 5 0.25

2- [155 – 160) 3 0.15

3- [160 – 165) 6 0.3

4- [165 – 170) 5 0.25

5- [170 – 175) 1 0.05

TOTAL n 20 1

Marca de clase: A los efectos de poder realizar cálculos estadísticos

(5)

Frecuencia Acumulada:

Es la suma de todas las frecuencias absolutas, al acumular datos también se acumula su frecuencia.

Ejemplo:

152,5 5 5 (5)

157,5 3 8 (5+3)

162,5 6 14 (8+6)

167,5 5 19 (14+5)

172,5 1 20 (19+1)

Frecuencia relativa acumulada:

De igual manera podemos ver qué proporción ocupa la frecuencia acumulada en cada momento respecto del total.

Gráficos:

Los gráficos permiten visualizar e interpretar el fenómeno que se está

estudiando. Permiten hacer comparaciones y nuevas mediciones, siempre y cuando se elija el tipo de gráfico más acertado.

Estos son algunos de los tipos más utilizados. Gráfico de barras, Histograma, diagrama de sectores (grafico de torta o circular) y poligonales de frecuencia.

El gráfico de barras es ideal para ilustrar distribuciones de frecuencias absolutas, el gráfico de barras permite una mejor visualización de valores relativos, mientras que para datos agrupados en intervalos de clase, lo ideal es

el histograma 0

1 2 3 4 5 6

A B C D

Gráfico de barras.

Circular

1

2

3

4

(6)

Análisis y medición de datos:

Para poder realizar una medición y comparación de series de datos, es necesario el uso de algunos parámetros.

Comencemos estudiando las llamadas medidas de posición o de centralización:

Media Aritmética: (Promedio) Es el cociente que se obtiene de dividir la suma de todos los valores de las variables por el número de observaciones.

Debemos diferenciar dos casos, ya que los datos pueden estar agrupados o no, como vimos anteriormente.

Si los datos no están agrupados, es decir una serie simple, se calcula de esta forma:

n n

X

x

i

x

1

x

2

x

3....

x

n

Si los datos están agrupados, la media aritmética se obtiene sumando los productos de cada valor de la variable por su frecuencia y dividiendo la suma por el número de observaciones.

n n

X

x

i

f

i

x

f

x

f

x

f

x

n

f

n

  

 

. 1 1 2 2 3 3 ....

En una distribución de frecuencias en intervalos de clase, el promedio se calcula sumando los productos de las frecuencias por los valores medios de cada clase y dividiendo la suma por el número total de observaciones.

Media ponderada:

A veces sucede que los datos de una distribución no tienen la misma importancia o el mismo peso, para esos casos se debe calcular una media ponderada, que tenga en cuanta la relevancia de cada dato.

n

p

x

X

p i i

 .

La mediana:

Sin agrupamiento de datos: ordenadas todas las observaciones de menor a mayor, la mediana es el valor central, si el número de observaciones es impar, y es el promedio de los dos valores centrales si el numero de observaciones es par.

0 1 2 3 4 5 6

Clase 1

Clase 2

Clase 3

Clase 4

Clase 5

(7)

x

x

x

x

x

M

x

e 3 5 4 3 2

1, , , ,  

2 , , , ,

, 3 4

6 5 4 3 2 1

x

x

M

x

x

x

x

x

x

e   

Con agrupamiento de datos: si tenemos una serie de frecuencias, se consideran las frecuencias acumuladas

f

a. Cada frecuencia se obtiene sumando a la correspondiente las frecuencias anteriores. La mediana

corresponde a la observación cuya frecuencia acumulada contiene a 2

n es

decir el 50% de los datos.

En cambio si se trata de una distribución de frecuencias en intervalos de clase, debemos considerar los intervalos y las frecuencias acumuladas

correspondientes a dichos intervalos. La mediana estará contenida en el intervalo que corresponde a la frecuencia acumulada del 50%.

Moda o modo:

La moda de una distribución es el valor de la variable al que corresponde mayor frecuencia.

Ejemplo: En la serie de datos: 5; 8; 5; 9; 6 Media: X 6,60

Mediana:

M

e6 Moda:

M

o 5

Medidas de dispersión:

En muchas ocasiones las medidas de centralización no nos brindan una información determinante que permita una comparación cierta entre una serie de datos y otra.

Para eso veremos a continuación una nueva serie de parámetros:

Llamaremos desvío de un valor de la variable a la diferencia entre el valor y el promedio.

Desviación media: es el promedio de los valores absolutos de las desviaciones. n x x

d

m

 

Varianza: Se llama varianza al promedio de los cuadrados de los desvíos.

 

n x x

  2 2 

(8)

8 Desviación típica o estándar: Se llama desviación estándar a la raíz cuadrada de la varianza.

n x x

 

2 ) (

Ejemplo: Tomando la serie de datos del ejemplo anterior, calculamos los desvíos.

X X d XX X X 2

2

X X

d

5 6,60 -1,60 1,60 2,25

8 6,60 1,40 1,40 1,96

5 6,60 -1,60 1,60 2,56

9 6,60 2,40 2,40 5,76

6 6,60 -0,60 0,60 0,36

SUMA 0 7,60 13,20

Realizando las operaciones indicadas obtenemos que:

52 , 1 5

60 ,

7

d

m

64 , 2 5

2 , 13

2  

62 , 1 5

2 , 13

 

Ejercicio:

El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.

Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras. Determinar moda, media mediana, desviación típica y varianza.

Ejercicio:

Los siguientes datos corresponden a las pulsaciones por minuto de un grupo de personas.

77; 69; 78; 80; 85; 90; 86; 85; 72; 72; 81; 82; 79; 75; 77; 79; 83; 88; 92; 91 i) Determina: media, moda, mediana.

ii) Agrupa los datos en 5 clases. Realiza histograma para la frecuencia absoluta de cada clase y tablas de frecuencias para los datos

agrupados.

iii) Determina desviación típica y varianza

Coeficiente de Variación.

(9)

Ejercicio:

Los siguientes datos, agrupados en 5 clases, corresponden a las alturas de 30 personas.

CLASE FRECUENCIA

ABSOLUTA

FRECUENCIA RELATIVA EN %

[1,60 – 1,67) F

[1,67 – 1,74) 12

[1,74 – 1,81) F + 3

[1,81 – 1,88) 2

[1,88 – 1,95) 1

Determina la frecuencia F y completa la tabla. Determina la media. Realiza histograma.

Su importancia y aplicación

La desviación media no es muy usada en la práctica. Para el estudio de las distribuciones se utiliza fundamentalmente la desviación estándar.

Particularmente, la desviación estándar es muy útil en los casos de distribución normal de frecuencias.

El coeficiente de dispersión es el indicador de la forma en que los valores de la serie se agrupan respecto a la media aritmética. Por eso constituye una de las características sobresalientes de la serie. Una distribución normal está

representada mediante la curva de Gauss. La distribución queda determinada por la media aritmética y la desviación estándar.

Conocidos estos parámetros se puede calcular la frecuencia de cualquier valor de la variable o de un intervalo limitado por dos valores de la variable.

En una distribución normal se cumple la siguiente relación:

Si a partir del punto que corresponde al valor medio se llevan hacia ambos lados los valores quedan determinados los siguientes intervalos:

que contiene el 68% de las observaciones que contiene el 95% de las observaciones que contiene el 99% de las observaciones

Se puede observar fácilmente que si la desviación estándar es muy pequeña, los valores se concentran en torno del valor medio. Lógicamente, a mayor desvío los valores están más dispersos.

(10)

Probabilidad:

Podemos establecer que la probabilidad de que ocurra un suceso determinado, está dado por el cociente entre el número de casos favorables y el número de casos posibles. Este cociente asigna un número comprendido entre 0 y 1.

Espacio Muestral: (E) es el conjunto de sucesos elementales a que da lugar la realización de un experimento aleatorio.

Por ejemplo: al lanzar un dado con caras numeradas del 1 al 6. El espacio muestral es

E={1, 2, 3, 4, 5, 6}.

Si el experimento consiste en lanzar 2 dados y observar sus resultados, los sucesos elementales son

E={(1,1),(1,2)…(1,6),(2,1),(2,2),(2,3),…(6,1),(6,2),…,(6,6)} donde (1,3) significa que en el primer dado ha salido 1 y en el segundo ha salido 3.

Suceso: es todo subconjunto de E. si está determinado por un solo resultado se llama elemental; si está determinado por varios se llama compuesto. Los sucesos suelen denotarse por letras mayúsculas A, B, C,…

Suceso seguro (es el que ocurre siempre) Suele denotarse como E.

Suceso imposible (no ocurre nunca) se denota como Suceso contrario del suceso A, denotado , está compuesto por los

elementos de E que no pertenecen a A. estos conjuntos son disjuntos es decir

Regla de Laplace: Propiedades de la probabilidad:

La probabilidad de un suceso se calcula, siempre que los sucesos elementales sean equiprobables, mediante la llamada regla de Laplace:

1)

2)

(11)

Probabilidad condicionada:

La probabilidad de un suceso A puede verse modificada si ha ocurrido

previamente otro suceso B. Para recoger esta influencia entre los sucesos, se define la probabilidad de A condicionada por B, escribiéndose P(A/B). De este modo se calcula:

Sucesos independientes: dos sucesos A y B son independientes cuando la probabilidad de que suceda A no se ve afectada por la probabilidad de que haya sucedido B o no.

Se deduce por lo tanto que P(A B)=P(A).P(B)

Distribución de probabilidad discreta:

Cuando una variable estadística discreta X, toma un conjunto de valores aislados , con frecuencias absolutas y relativas = los resultados pueden representarse mediante una tabla, obteniendo una distribución de frecuencias de la variable X.

Al concepto de distribución de probabiolidad se llega mediante una idealización de las distribuciones de frecuencias de las variables estadísticas,

fundamentada en la ley de azar que asegura que en un experimento aleatorio, las frecuencias relativas de cada suceso tienden a su probabilidad cuando el número de observaciones es suficientemente grande.

Distribución de frecuencias Distribución de probabilidad

Muestra Población

Variable estadística Variable aleatoria

Frecuencia relativa de x, fr Probabilidad de x: P( )=

Ejemplo:

Se realiza el siguiente experimento: Se lanzan 2 dados y se suman los valores de sus caras; la variable X puede tomar cualquier valor entre 2 y 12.

Podemos calcular las probabilidades de estos valores mediante la regla de Laplace, teniendo en cuenta que 36 son los casos posibles y que los favorables se contabilizan son los que se muestran en el siguiente esquema: (La

istribución de probabilidad se muestra en la tabla adjunta)

12 11 10 9 8 7 6 11 10 9 8 7 6 5 10 9 8 7 6 5 4 9 8 7 6 5 4 3 8 7 6 5 4 3 2 7 6 5 4 3 2 1 6 5 4 3 2 1 X ) (suma

X 2 3 4 5 6 7 8 9 10 11 12

) (X i

(12)

Media y varianza de una distribución de probabilidad discreta. MEDIA: La media de una distribución es un valor central que nos indica la cantidad que correspondería a cada individuo en una repartición igualitaria. Muy comúnmente se le suele llamaresperanza, o valor esperado.

Suele denotarse con la letra griega  (mu), se calcula:

x

p

i i.

VARIANZA: Para Estimar la dispersión de valores de la variable aleatoria respecto de la media, la medida más importante es la varianza.

2 2 2

. )

( 

x



p

p

 i i i

i x

x V

Su raíz cuadrada positiva, que recibe el nombre de desviación típica, tiene la ventaja sobre la varianza de estar expresada en las mismas unidades que la variable X y no por los cuadrados, siendo por ello, más expresiva:

) (X V

Una medida de la dispersión que no tiene dimensiones y que por tanto es apropiada para comparar la variabilidad entre diferentes distribuciones, es el llamado coeficiente de variación y se calcula:

 

 ) ( .V X C

DISTRIBUCIÓN BINOMIAL:

Muchos experimentos aleatorios quedan determinados por dos sucesos

complementarios (blanco/negro, hombre/mujer, fumador/no fumador, etc) estos resultados sin tener en cuanta ninguna valoración, suelen llamarse éxito y fracaso.

La distribución de probabilidad discreta que estudia estos experimentos recibe el nombre de distribución binomial y sus rasgos característicos son:

1- El resultado de una prueba del experimento aleatorio debe concretarse en dos ínicas opciones, las que llamaremos éxito (E) y fracaso (F).

2- Se realizan n ensayos del experimento, independiente unos de otros 3- La probabilidad de éxito es constante a lo largo de las n pruebas y suele denotarse por p; es decir P(E)=p. Por lo tanto, la probabilidad de fracaso también es constante y vale 1 – p; es decir que: P(F)= 1 – p

4- La variable aleatoria X, cuenta el número r de éxitos en las n pruebas.

La variable binomial queda determinada por los parámetros n y p, indicándose simbólicamente por B(n, p).

Llamaremos X a la variable que mide la cantidad de éxitos obtenidos.

(13)

Se obtiene un Éxito

No se obtiene éxito (se obtiene un Fracaso)

En caso de repetir el experimento conviene ayudarse con alguna herramienta de conteo que permita visualizar todas las posibilidades:

Mediante un diagrama de árbol podemos ver todas las posibilidades para un determinado experimento aleatorio, que cuenta con dos resultados admisibles (ÉXITO y FRACASO).

Al realizar dos veces el experimento podemos ver en el esquema todas las posibilidades, teniendo los siguientes resultados:

Dos Éxitos:

Un Éxito:

Ningún Éxito:

Al realizar tres veces el experimento podemos observar los siguientes resultados:

En resumen:

Tres Éxitos:

Dos Éxitos:

Un Éxito:

Ningún Éxito:

Si se realiza cuatro veces el mismo experimento, el número de éxitos se distribuye de la siguiente manera:

Cuatro éxitos:

Tres éxitos:

Dos éxitos:

Un éxito:

Ningún éxito:

(14)

Se deduce entonces que

r n r

n

r

p

p

r

X

P

C

.

.(

1

)

Ejemplo: Se sabe que el 15% de los televisores producidos por una fábrica tienen algún tipo de defecto. Si se toma una muestra de 5 televisores; ¿cuál es la

probabilidad de que ninguno tenga defectos? ¿Cuál es la probabilidad de que 2 sean defectuosos? ¿Cuál es la probabilidad de que al menos uno sea defectuoso?

Comencemos por identificar la variable y los parámetros correspondientes. Al seleccionar al azar un televisor este puede estar sano o estar defectuoso.

Si tomamos como Éxito el hecho de que un televisor tenga algún defecto, el fracaso será que esté sano. Por lo tanto estamos ante una distribución binomial, debemos ahora identificar sus parámetros:

La muestra es de 5 televisores, es decir se examinaran los 5 televisores y ese será nuestro experimento aleatorio. Por lo tanto:

Se sabe que el 15% de la producción son defectuosos, por lo tanto nuestra

probabilidad de éxito es del 15% o 0.15. Por lo tanto y deducimos que la probabilidad de fracaso es

Ninguno defectuoso: deseamos tener ningún éxito Por lo tanto

Dos defectuosos: deseamos tener exactamente dos éxitos Es decir que:

Para el último caso, debemos tener bien claro los conceptos de al menos (o por lo menos) y de a lo sumo (o como máximo) en este caso se nos pide que al menos uno sea defectuoso. Es decir que puede haber uno defectuoso pero también pueden ser dos, tres, cuatro y cinco (todos) defectuosos.

Entonces lo que estamos buscando es

Calculando todas las probabilidades y sumando sus resultados obtenemos lo buscado. No se presenta mayor dificultad por ser una muestra relativamente pequeña, pero si n toma valores muy grandes, se puede volver un trabajo tedioso. Para ello veremos cómo poder simplificar nuestra tarea.

El experimento se realiza 5 veces por lo tanto:

Sustituyendo obtenemos que:

Para recordar:

(15)

Media y Varianza:

La media y la varianza de la distribución binomial B(n, p) se obtiene de manera inmediata a través de sus parámetros

p n X

E( ) . V(X)2 n.p.q

Ejemplo:

Un examen de múltiple opción cuenta con 8 preguntas de 4 opciones cada una. Si un estudiante respondiera al azar:

1) ¿Cuál es la probabilidad de que responda de forma correcta, exactamente 6?

2) ¿Cuál es el número medio de respuestas acertadas?

Solución:

Según el enunciado, la variable cuenta el número de respuestas correctas, es una binomial B(8,1 4)B(8,0.25) por lo tanto:

a) 0,0038

4 3 . 4 1 . ) 6 (

2 6 8

6  

           

C

X P

b) 8.0,252

Esto quiere decir que se espera que conteste correctamente 2 respuestas, si contesta al azar.

También se puede obtener el resultado de la parte a) consultando la tabla binomial, que se adjunta al final.

DISTRIBUCIONES DE PROBABILIDAD CONTINUAS Una variable estadística se llama continua cuando puede tomar todos los valores de un intervalo, valores tan próximos como se quiera.

Al trabajar con variables estadísticas continuas, como ya vimos antes, estas se agrupan en clases, y se representan mediante Histograma. Al dividir estos intervalos en otros más pequeños el histograma tiende a convertirse en una curva. Dicha curva se conoce como función densidad de la variable aleatoria continua.

Función densidad:

Para que f(x) sea una función de densidad, debe cumplir las siguientes condiciones:

1- f(x)>0, para todo valor x del intervalo [a; b] donde la variable aleatoria tiene su campo de definición.

2- El área limitada por la curva f(x), entre los extremos a y b y el eje de abscisas, es la unidad.

(16)

DISTRIBUCIÓN NORMAL.

La distribución normal es una ley que describe los fenómenos en los que intervienen un gran número de factores, mutuamente independientes y cuyas influencias se compensan entre sí haciendo prevalecer un tipo medio.

Es ideal para explicar fenómenos tales como: - Comportamientos sociales

- Actitudes económicas - Medidas antropométricas - Medias morfológicas

- Errores cometidos en las mediciones Función densidad:

La expresión analítica de la función densidad de la distribución normal fue expuesta por primera vez por Gauss (1809), expresión que está basada en la función exponencial y su representación gráfica se conoce como la campana de Gauss

e

x

x

f

2

2

2

.

2

.

1

)

(

DISTRIBUCIÓN NORMAL ESTÁNDAR

La distribución normal de media 0 y desviación típica 1, N(0, 1), se conoce como distribución normal estándar y la variable correspondiente normal tipificada, y se denota por la letra z.

Utilizando la tabla podemos obtener la probabilidad de un suceso deseado.

P(Z < K): se obtiene directamente de la tabla de la lectura L(k)

P(Z > K): es la probabilidad del suceso complementario del anterior, por lo tanto

P(Z>K)= 1 – P(Z<K)

) (

) (

)

(K1 Z K2 P Z K2 P Z K1

P      

(17)

Tipificación o estandarización

Las distribuciones normales que debemos manejar en la práctica no suelen ser estándar, por lo que sigue vigente el problema de calcular probabilidades de variables X,N(,).

Para solucionar dicho problema veremos ahora el proceso de tipificación de la variable X, que no es más que un cambio de variable.

 

  X

Z

Con esto, la probabilidad de que X<K con XN(,)se calcula así:

                        K Z P K X P K X

P( )

Ejemplo:

Se fabrican pilas alcalinas cuya duración en horas sigue una distribución normal de media 60hs y desviación típica de 5hs. Si se elige una pila al azar, ¿Qué probabilidad hay de que dure?:

a) Menos de 50hs b) Entre 52 y 65hs

Solución: La variable X mide las horas de funcionamiento de una pila, se distribuye N(60, 5).

a) la probabilidad de X<50 es

2

1 (2) 1 0,9772 0,0228

5 60 50 5 60 ) 50 (                

P X P Z L

X P

Siendo L(2) el valor correspondiente en la tabla para 2.

b) 

  

           

 1,6 1

5 60 65 5 60 5 60 52 ) 65 52

( X P X P Z

P 7865 . 0 0548 . 0 8413 . 0 ) 6 . 1 ( ) 1 ( ) 6 , 1 ( ) 1 (         

(18)

Calculo de probabilidad de una distribución normal estandarizada:

Realizamos directamente la lectura de la tabla para el valor de k.

Realizamos directamente la lectura de la tabla para el valor de k y se lo restamos a 1 para tener el resultado buscado.

Realizamos directamente la lectura de la tabla para el valor de k y se lo restamos a 1 para obtener el resultado buscado.

Realizamos directamente la lectura de la tabla para el valor de k.

Realizamos directamente la lectura de la tabla para los valores de

para luego restarlos y así obtener el resultado buscado.

(19)
(20)

Índice:

Página

2…….Introducción a la Estadística

3…….Análisis y medición de datos

5…….Aplicaciones

6…….Medidas de tendencia central.

8…….Medidas de Dispersión (Varianza, Desviación media, Desviación Típica)

10…….Probabilidad. Regla de Laplace

12…….Distribución de probabilidad Discreta. Distribución Binomial

13……Distribuciones de probabilidad continuas

14……Distribución Normal- Normal Estándar

17……Estandarización- Ejemplos

19……Tabla de distribución Normal

Bibliografía:

José Mª Martínez Mediano, Rafael Cuadra López. (2007). Matemática

aplicada a las Ciencias Sociales. España: Ardiles Servicios Editoriales, SL.

Matemática 4 TAPIA- Nelly Vázquez de Tapia, Alicia Tapia, Carlos A. Tapia

Figure

Actualización...

Referencias

Actualización...