Universidad de Puerto Rico
Recinto de Aguadilla
Programa CeCiMat Elemental
Definición de conceptos fundamentales de la
Estadística y la Probabilidad y su aportación
al mundo moderno
Dr. Richard Mercado Rivera
18 de agosto de 2012
Matemática Elemental
Estadística
Definición: ciencia que colecta,
organiza, presenta e interpreta datos.
Se divide en dos ramas;
◦
Estadística Descriptiva: recopila,
organiza y presenta datos.
◦
Estadística Inferencial: se refiere a las
técnicas de interpretación de datos.
Términos Básicos
Población:
conjunto de individuos u
objetos cuyas características van a ser
estudiadas.
Muestra:
subconjunto de la población.
Variable (respuesta):
característica de
Dato:
valor numérico de la variable
respuesta asociado a un elemento de la
población o muestra.
Datos:
conjunto de valores colectados de
una variable respuesta de cada elemento de
la población o muestra.
Experimento (encuesta):
actividad
planificada cuyos resultados producen un
conjunto de datos.
Parámetro:
característica numérica de
toda la población.
Estadística:
característica numérica de la
muestra.
Censo:
estudio a toda la población.
Datos cualitativos:
es el resultado
del proceso de categorizar o
describir un elemento de la
población.
◦
Ejemplos:
El color de los carros en un
estacionamiento.
Color del cabello de las chicas en un grupo
de séptimo grado.
Datos cuantitativos:
es el resultado del
proceso de cuantificar, esto es, contar o
medir. Se divide en discreta y continua.
◦
Discreta:
resultado del proceso de contar.
Ejemplo: cantidad de maestros en el taller.
◦
Continua:
resultado del proceso de medir.
Ejemplo: edad promedio de los maestros en el
taller.
Tipos de Variables
Variable cualitativa, de atributos o categórica:
◦ Variable que clasifica o describe un elemento de la población.
Nominal: es imposible asignar un orden a las
categorías.
Ordinal: presenta una posición o clasificación
ordenada, pero no tiene diferencia numérica.
Tipos de Variables: ejemplos
Nominal:
◦ Números de seguro social.
◦ Números de identificación de los estudiantes universitarios.
Ordinal:
◦ Clasificación de excelente, bueno, regular o deficiente de una cita.
◦ Obtener A, B, C, D, o F en un curso.
Tipos de Variables
Variable cuantitativa o numérica:
◦ Variable que cuantifica un elemento de la población.
Discreta: puede asumir un número contable de
valores.
Continua: puede asumir un número incontable
de valores.
Tipos de Variables
Variable cuantitativa o numérica:
De intervalo: al igual que la ordinal, presenta
una posición o clasificación ordenada. Lo diferente es que sí establece una diferencia numérica. No tiene un cero natural.
De razón: similar a la de intervalo, con la
diferencia que posee un cero natural.
Tipos de Variables: ejemplos
Discreta:
◦ Cantidad de maestros tomando el taller.
Continua:
◦ Peso de una barra de chocolate.
Intervalo:
◦ Temperatura del salón.
Razón:
◦ Precio de los libros de textos.
Cuestionarios
¿A qué escuela asistió usted?
Características: de las preguntas
◦ Preguntas no pueden ser ambiguas.
◦ Fáciles de contestar.
◦ No preguntar sobre asuntos íntimos y/o personales.
◦ No deben permitir que el encuestado tenga que escribir mucho.
Características: del cuestionario
◦ Título claro y de fácil comprensión.
◦ Propósito fácil de entender.
Administración del cuestionario
◦ Por teléfono: poco aceptado.
◦ Por correo: no muchos contestan.
◦ De persona a persona: forma más eficiente.
Ejercicio de práctica
Se puede trabajar en forma individual o
en pareja:
◦ Escoger un tema.
◦ Determinar la población.
◦ Determinar la muestra.
◦ Identificar la o las variables.
◦ Redactar tres posibles preguntas sobre el tema.
Cada maestro o equipo presentará su
Medidas de Tendencia Central
Valores numéricos que localizan, de alguna
manera, el centro de un conjunto de datos.
Generalmente el término
promedio
se asocia
con todas las medidas de tendencia central.
◦ Media aritmética
◦ Mediana
◦ Moda
Medidas de Tendencia Central
Media aritmética:
promedio más conocido.
Se denota con . Se calcula sumando todos
los valores y dividiendo el resultado por el
total de valores.
sumatoria
Notación:
17
X
x
suma de los datos
X
Media Aritmética
En una clase de Estadística, un estudiante
obtuvo las siguientes notas en los primeros 5
exámenes:
Determine la nota del estudiante hasta el
momento.
¿Cuánto deberá obtener en un próximo examen
para mantener su promedio igual?
¿Qué nota debería obtener en un examen final
para finalizar con promedio de A?
18
Medidas de Tendencia Central
Mediana:
es el valor del dato que se encuentra
en el centro de una distribución. Se denota
por .
Para determinar la mediana se tienen que
colocar los datos en orden ascendente.
La posición de la mediana se determina por la
fórmula .
19X
1
2
n
Mediana
Ejemplo: determine la mediana de los
datos siguientes;
Mediana es 23
Si se le añade el valor 24 a los datos
anteriores, ¿cuál será la mediana ahora?
Mediana es 23.5
20
Medidas de Tendencia Central
Moda:
el valor que más se repite. La
distribución puede:
◦ No tener moda.
◦ Tener una moda.
◦ Ser bimodal (dos modas).
◦ Trimodal (tres modas).
◦ Multimodal (más de tres modas).
Moda
Dadas las siguientes distribuciones determine
la moda de cada una de ellas:
22
23, 33, 15, 56, 24, 87
23, 33, 15, 56, 24, 87, 15
23, 33, 15, 56, 24, 87, 15, 23
Medidas de Tendencia Central
Dada la siguiente tabla determine la media
aritmética, la mediana y la moda.
23
24
56
67
12
9
45
24
45
12
9
56
67
82
91
14
Gráficas
Es la forma más efectiva para ayudar en la
lectura de los datos.
Para cada tipo de variable se aplica un tipo
de gráfica.
Revelan, en forma visual, patrones y
comportamiento de la variable en estudio.
Variable Categórica
Diagrama de Pastel:
muestran la cantidad de
datos que pertenecen a cada categoría como
una parte proporcional de un círculo.
Gráfica de Barras:
muestran la cantidad de
datos que pertenecen a cada categoría como
áreas rectangulares de tamaño proporcional.
Operaciones en el Hospital
General el año pasado
Tipo de operación
Número de casos
Toráxica 20
Huesos y articulaciones 45
Ojos, oídos y garganta 58
General 98 Abdominal 115 Urológicas 74 Proctológicas 65 Neurológicas 23 Total 498 26
Operaciones en el Hospital
General el año pasado
27 Toráxica
Huesos y articulaciones Ojos, oídos y garganta General
Abdominal Urológicas Proctológicas Neurológicas
Operaciones en el Hospital
General el año pasado
28 0 20 40 60 80 100 120 140 Toráxica Huesos y
articulaciones Ojos, oídos ygarganta General Abdominal Urológicas Proctológicas Neurológicas
C a n t i d a d d e o p e r a c i o n e s
Variable Numérica
Diagrama de Tallo y Hoja:
presenta los
datos usando los dígitos que corresponden a
los valores de los datos.
Diagrama de Caja:
presenta el resumen de
5 números: valor mínimo, cuartil uno,
mediana, cuartil tres y el valor máximo.
Histograma:
gráfica de barras que
representa una distribución de frecuencias de
una variable.
Calificaciones de 19 estudiantes en
un examen
De un grupo se extrajo aleatoriamente una
muestra de 19 calificaciones de un examen:
76 74 82 96 66 76 78 72 52 68
86 84 62 76 78 92 82 74 88
Calificaciones de 19 estudiantes en
un examen
Tallo
Hojas
5
2
6
6 8 2
7
6 4 6 8 2 6 8 4
8
2 6 4 2 8
9
6 2
31Calificaciones de 19 estudiantes
en un examen
32Tallo
Hojas
(50 -54) 5 2 (55-59) 5 (60-64) 6 2 (65-69) 6 6 8 (70-74) 7 4 2 4 (75-79) 7 6 6 8 6 8 (80-84) 8 2 4 2 (85-89) 8 6 8 (90-94) 9 2 (95-99) 9 6Cuartiles: Q
k
Dividen los datos en cuatro partes iguales.
Cómo se obtienen:
◦ Se obtienen a través de los Percentiles.
◦ Colocar los datos en orden ascendente.
◦ Si k < 50 la posición se obtiene con .
◦ Si k > 50 la posición se obtiene con .
33 100 nk 100 100 n k
Cómo se obtienen:
◦ Si la posición da a un número entero se usa el promedio de esa posición y la siguiente.
◦ Si el resultado es un número decimal se usa la posición siguiente.
◦ Si k < 50: posiciones de menor a mayor.
◦ Si k > 50: posiciones de mayor a menor.
34
Diagrama de Caja
Valor Valor Mín Q1 Med. Q3 Máx 0 86.5 170 251.5 491 0 100 200 300 400 500 35Notas de un examen
Intervalos de Notas
Frecuencia
40 – 49
8
50 – 59
44
60 – 69
23
70 – 79
6
80 – 89
98
90 – 99
11
100 – 109
1
36Histograma:
notas de un examen
100 90 80 70 60 50 40 30 20 10 0 40-49 50-59 60-69 70-79 80-89 90-99 100-109 37 INTERVALOS F R E C U E N C I A SEjercicios de Práctica
Obtener cuartiles y percentiles.
Dibujar :
◦ Diagrama de pastel.
◦ Gráfica de barras.
◦ Diagrama de tallo y hoja.
◦ Diagrama de caja.
◦ Histograma.
Medidas de dispersión
Se utilizan para determinar cuánto se
alejan los valores del centro de la
distribución.
◦
Rango
◦
Varianza
Rango
Se obtiene restando el valor menor del
valor mayor de la distribución.
Indica cuantas unidades de diferencia se
pueden esperar, como máximo, entre dos
valores de la variable.
El rango estima el campo de variación de
Varianza:
Medida de dispersión que ostenta una variable
aleatoria respecto a su esperanza.
Pasos para calcular la varianza:
◦
Calcular la media aritmética.
◦
Restar la media aritmética a cada dato de la
distribución y elevar el resultado al
cuadrado.
◦
Sumar los resultados del paso dos y dividir
por el total de datos menos uno.
2
Fórmula para determinar la varianza;
Varianza:
2s
2
2
1
x
x
s
n
Ejemplo: determinar la varianza de las
edades de 5 niños.
Determinar la media aritmética.
Varianza:
2s
Edades 6 3 8 5 2x
x
x
x
2Edades 6 1.2 1.44 3 –1.8 3.24 8 3.2 10.24 5 0,2 0.04 2 –2.8 7.84
x
x
x
x
224
4.8
5
x
x
n
2 222.80
5.7
1
4
x
x
s
n
Desviación Estándar
Es la medida más útil de la variabilidad de
los resultados de una muestra.
Es una medida de la magnitud en que se
desvían los datos de su valor medio.