PROBABILIDAD
Unidad I Ordenamiento de la Información
Captura de datos muestrales
Conceptos básicos de la estadística
Población (o universo): Totalidad de elementos o
cosas bajo consideración
Muestra: Es una parte de la población seleccionada
para el análisis.
Parámetro: Es una medida numérica que describe
una característica de la población
Estadístico: Es la medida numérica que describe
alguna característica de la muestra
Tipos de Muestras
Tipos de muestras usadas Muestras no probabilísticas Muestra dejuicio Muestra de cuota De parte Grande
Muestras de probabilidad Muestra Aleatoria simple Muestra
sistemática estratificadaMuestra Muestra de agrupación
Recolección de Datos
Proporcionados por una organización o un
individuo.
El diseño de un Experimento
Una encuesta
Un estudio observacional
Tipos de Datos
Tipo de Dato Tipo de Preguntas Respuestas
Categórico
Numérico
¿Posee actualmente algunas acciones o bonos? Si | No
Discreto
Continuo
¿A cuántas revistas está Suscrito actualmente?
¿Cuánto mide?
______ Número
______ Metros
Diseño del cuestionario
Propósito: Recabar información significativa que nos
ayude en el proceso de toma de decisiones.
Formular preguntas cortas, libres de
ambiguedades.
¿Fuma Usted? ____ Si ____No
¿Cuántos Años tiene? ____ (en años)
Pruebas piloto
Elección de la muestra
Para seleccionar la muestra pueden usarse 2
métodos básicos:
Con remplazo
Sin remplazo
Uso de tabla de números aleatorios
Organización de los datos numéricos
Arreglo Ordenado
Diagrama de tallo y hojas
Distribución de frecuencias
Es una tabla de resumen en la que los datos se
disponen en agrupamientos o categorías
convenientemente establecidas de clases ordenadas numéricamente.
Tipos de frecuencias
11
Frecuencia absoluta
La frecuencia absoluta es el número de veces que
aparece un determinado valor en un estudio estadístico.
Se representa por fi
La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la
Tipos de frecuencias
12
Frecuencia relativa
La frecuencia relativa es el cociente entre la
frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se
representa por ni.
Tipos de frecuencias
13
Frecuencia acumulada
La frecuencia acumulada es la suma de las
frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es
Ejemplo
14
Durante el mes de julio, en una ciudad se han
registrado las siguientes temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29
15
xi Recuento fi Fi ni Ni
27 I 1 1 0.032 0.032
28 II 2 3 0.065 0.097
29 IIIII I 6 9 0.194 0.290
30 IIIII II 7 16 0.226 0.0516
31 IIIII III 8 24 0.258 0.774
32 III 3 27 0.097 0.871
33 III 3 30 0.097 0.968
34 I 1 31 0.032 1
31 1
Distribución de frecuencias agrupadas
16
La distribución de frecuencias agrupadas o tabla
con datos agrupados se emplea si las variables
toman un número grande de valores o la variable
es continua.
Se agrupan los valores en intervalos que tengan
17
Límites de la clase
Cada clase está delimitada por el límite inferior de la
clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite
superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y
Construcción de una tabla de
frecuencias agrupadas
18
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre 5 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10 intervalos.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
19
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.2775
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 42.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1
Ejercicios
20
Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16,
20, 16, 15, 18, 16, 14, 13.
21
El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2,
22
Los pesos de 65 Empleados de una fabrica
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110)
[110, 120)
Definición de parámetro estadístico
23
Un parámetro estadístico es un número que se
obtiene a partir de los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar
Tipos de parámetros estadísticos
24
Hay tres tipos parámetros estadísticos:
De centralización.
De posición
Medidas de Centralización
25
Nos indican en torno a qué valor (centro) se distribuyen
los datos.
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la
mitad superior de la distribución y la inferior, es decir
divide la serie de datos en dos partes iguales.
Moda
Medidas de posición
26
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
La medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles
Los deciles dividen la serie de datos en diez partes iguales.
Percentiles
Medidas de dispersión
27
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de
los datos de una distribución estadística.
Desviación media
La desviación media es la media aritmética de los valores
absolutos de las desviaciones respecto a la media.
Varianza
La varianza es la media aritmética del cuadrado de las
desviaciones respecto a la media.
Desviación típica
Trabajo Parcial 1
28
Fecha de entrega: 07 Septiembre de 2011
Encuestar a 25 estudiantes de la escuela de sistemas
sobre Cultura y Deporte
Elaborar la Distribución de frecuencias para cada una
de las preguntas
Para Cada distribución calcular los parámetros
estadísticos de centralización y de dispersión
Graficar los resultados de las distribuciones.
Minimo de preguntas para la encuesta: 7
Moda
29
La moda es el valor que tiene mayor frecuencia
absoluta.
Se representa por Mo.
Se puede hallar la moda para variables
cualitativas y cuantitativas.
Hallar la moda de la distribución:
Moda
30
Si en un grupo hay dos o varias puntuaciones con
la misma frecuencia y esa frecuencia es la máxima,
la distribución esbimodal o multimodal, es decir,
tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen
la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia
máxima, la moda es el promedio de las dos
puntuaciones adyacentes.
Moda (datos agrupados)
31
Li es el límite inferior de la clase modal.
fi es la frecuencia absoluta de la clase modal.
fi-1 es la frecuencia absoluta inmediatamente
inferior a la clase modal.
fi+1 es la frecuencia absoluta inmediatamente
posterior a la clase modal.
Moda
32
También se utiliza otra fórmula de la moda que da
Ejemplo (Moda)
33
Calcular la moda de una distribución estadística
Ejemplo (Moda)
Mediana
35
Es el valor que ocupa el lugar central de todos
los datos cuando éstos están ordenados de menor a mayor.
La mediana se representa por Me.
La mediana se puede hallar sólo para variables
Calculo de la Mediana
36
1 Ordenamos los datos de menor a mayor.
2 Si la serie tiene un número impar de
medidas la mediana es la puntuación central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
3 Si la serie tiene un número par de puntuaciones
la mediana es la media entre las dos puntuaciones centrales.
Calculo para datos agrupados
37
La mediana se encuentra en el intervalo donde la frecuencia
acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre .
Li es el límite inferior de la clase donde se encuentra la mediana. fi es la frecuencia absoluta.
Ejemplo (Mediana)
Media aritmética
39
La media aritmética es el valor obtenido
al sumar todos los datos y dividir el resultado entre el número total de datos.
Media aritmética para datos
agrupados
40
Si los datos vienen agrupados en una tabla de
Ejercicio (Media Aritmética)
41
En un test realizado a un grupo de 42 personas se
43
Los pesos de 65 Empleados de una fabrica
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110)
[110, 120)
fi 8 10 16 14 10 5 2
Cuartiles
44
Los cuartiles son los tres valores de la variable
que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de
los datos.
Cálculo de los cuartiles
45
1 Ordenamos los datos de menor a mayor.
2 Buscamos el lugar que ocupa
Cálculo de Cuartiles
Cuartiles para datos agrupados
47
En primer lugar buscamos la clase donde se
encuentra , en la tabla de las frecuencias
acumuladas.
Li es el límite inferior de la clase donde se encuentra el
cuartil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del
cuartil.
Ejercicio
Percentiles
50
Los percentiles son los 99 valores que dividen la
serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al
1%, al 2%... y al 99% de los datos.
Cálculo de precentiles
51
Li es el límite inferior de la clase donde se encuentra el
percentil.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase del
percentil.
Ejercicio de percentiles
Resultado
Desviación Media
54
La desviación media es la media aritmética de
los valores absolutos de las desviaciones respecto a la media.
Desviación media para datos
Agrupados
56
Si los datos vienen agrupados en una tabla de
Ejemplo: calcular la desviación media
de la siguiente distribución:
Varianza
58
La varianza es la media aritmética del cuadrado
de las desviaciones respecto a la media de una distribución estadística.
Varianza para datos agrupados
Ejemplo: Calcular la varianza para la
siguiente distribución
Desviación estándar
61
La desviación estándar es la raiz cuadrada de la
varianza.