• No se han encontrado resultados

Captura de datos muestrales

N/A
N/A
Protected

Academic year: 2018

Share "Captura de datos muestrales"

Copied!
62
0
0

Texto completo

(1)

PROBABILIDAD

Unidad I Ordenamiento de la Información

(2)

Captura de datos muestrales

(3)

Conceptos básicos de la estadística

 Población (o universo): Totalidad de elementos o

cosas bajo consideración

 Muestra: Es una parte de la población seleccionada

para el análisis.

 Parámetro: Es una medida numérica que describe

una característica de la población

 Estadístico: Es la medida numérica que describe

alguna característica de la muestra

(4)

Tipos de Muestras

Tipos de muestras usadas Muestras no probabilísticas Muestra de

juicio Muestra de cuota De parte Grande

Muestras de probabilidad Muestra Aleatoria simple Muestra

sistemática estratificadaMuestra Muestra de agrupación

(5)

Recolección de Datos

 Proporcionados por una organización o un

individuo.

 El diseño de un Experimento

 Una encuesta

 Un estudio observacional

(6)

Tipos de Datos

Tipo de Dato Tipo de Preguntas Respuestas

Categórico

Numérico

¿Posee actualmente algunas acciones o bonos? Si | No

Discreto

Continuo

¿A cuántas revistas está Suscrito actualmente?

¿Cuánto mide?

______ Número

______ Metros

(7)

Diseño del cuestionario

 Propósito: Recabar información significativa que nos

ayude en el proceso de toma de decisiones.

 Formular preguntas cortas, libres de

ambiguedades.

 ¿Fuma Usted? ____ Si ____No

 ¿Cuántos Años tiene? ____ (en años)

 Pruebas piloto

(8)

Elección de la muestra

 Para seleccionar la muestra pueden usarse 2

métodos básicos:

 Con remplazo

 Sin remplazo

 Uso de tabla de números aleatorios

(9)

Organización de los datos numéricos

 Arreglo Ordenado

 Diagrama de tallo y hojas

(10)

Distribución de frecuencias

 Es una tabla de resumen en la que los datos se

disponen en agrupamientos o categorías

convenientemente establecidas de clases ordenadas numéricamente.

(11)

Tipos de frecuencias

11

Frecuencia absoluta

 La frecuencia absoluta es el número de veces que

aparece un determinado valor en un estudio estadístico.

 Se representa por fi

 La suma de las frecuencias absolutas es igual al

número total de datos, que se representa por N.

 Para indicar resumidamente estas sumas se utiliza la

(12)

Tipos de frecuencias

12

Frecuencia relativa

 La frecuencia relativa es el cociente entre la

frecuencia absoluta de un determinado valor y el número total de datos.

 Se puede expresar en tantos por ciento y se

representa por ni.

(13)

Tipos de frecuencias

13

Frecuencia acumulada

 La frecuencia acumulada es la suma de las

frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

 Se representa por Fi.

Frecuencia relativa acumulada

 La frecuencia relativa acumulada es

(14)

Ejemplo

14

 Durante el mes de julio, en una ciudad se han

registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

(15)

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29

15

xi Recuento fi Fi ni Ni

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 IIIII I 6 9 0.194 0.290

30 IIIII II 7 16 0.226 0.0516

31 IIIII III 8 24 0.258 0.774

32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1

31 1

(16)

Distribución de frecuencias agrupadas

16

 La distribución de frecuencias agrupadas o tabla

con datos agrupados se emplea si las variables

toman un número grande de valores o la variable

es continua.

 Se agrupan los valores en intervalos que tengan

(17)

17

Límites de la clase

 Cada clase está delimitada por el límite inferior de la

clase y el límite superior de la clase.

Amplitud de la clase

 La amplitud de la clase es la diferencia entre el límite

superior e inferior de la clase.

Marca de clase

 La marca de clase es el punto medio de cada intervalo y

(18)

Construcción de una tabla de

frecuencias agrupadas

18

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre 5 y 15.

En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10 intervalos.

(19)

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

19

ci fi Fi ni Ni

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.2775

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

(20)

Ejercicios

20

Las puntuaciones obtenidas por un grupo en una prueba han sido:

 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16,

20, 16, 15, 18, 16, 14, 13.

(21)

21

El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:

 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2,

(22)

22

 Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110)

[110, 120)

(23)

Definición de parámetro estadístico

23

 Un parámetro estadístico es un número que se

obtiene a partir de los datos de una distribución estadística.

 Los parámetros estadísticos sirven para sintetizar

(24)

Tipos de parámetros estadísticos

24

 Hay tres tipos parámetros estadísticos:

 De centralización.

 De posición

(25)

Medidas de Centralización

25

 Nos indican en torno a qué valor (centro) se distribuyen

los datos.

Media aritmética

 La media es el valor promedio de la distribución.

Mediana

 La mediana es la puntación de la escala que separa la

mitad superior de la distribución y la inferior, es decir

divide la serie de datos en dos partes iguales.

Moda

(26)

Medidas de posición

26

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

La medidas de posición son:

Cuartiles

 Los cuartiles dividen la serie de datos en cuatro partes iguales.

Deciles

 Los deciles dividen la serie de datos en diez partes iguales.

Percentiles

(27)

Medidas de dispersión

27

Rango o recorrido

 El rango es la diferencia entre el mayor y el menor de

los datos de una distribución estadística.

Desviación media

 La desviación media es la media aritmética de los valores

absolutos de las desviaciones respecto a la media.

Varianza

 La varianza es la media aritmética del cuadrado de las

desviaciones respecto a la media.

Desviación típica

(28)

Trabajo Parcial 1

28

 Fecha de entrega: 07 Septiembre de 2011

 Encuestar a 25 estudiantes de la escuela de sistemas

sobre Cultura y Deporte

 Elaborar la Distribución de frecuencias para cada una

de las preguntas

 Para Cada distribución calcular los parámetros

estadísticos de centralización y de dispersión

 Graficar los resultados de las distribuciones.

 Minimo de preguntas para la encuesta: 7

(29)

Moda

29

 La moda es el valor que tiene mayor frecuencia

absoluta.

 Se representa por Mo.

 Se puede hallar la moda para variables

cualitativas y cuantitativas.

Hallar la moda de la distribución:

(30)

Moda

30

 Si en un grupo hay dos o varias puntuaciones con

la misma frecuencia y esa frecuencia es la máxima,

la distribución esbimodal o multimodal, es decir,

tiene varias modas.

 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

 Cuando todas las puntuaciones de un grupo tienen

la misma frecuencia, no hay moda.

 2, 2, 3, 3, 6, 6, 9, 9

 Si dos puntuaciones adyacentes tienen la frecuencia

máxima, la moda es el promedio de las dos

puntuaciones adyacentes.

(31)

Moda (datos agrupados)

31

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi-1 es la frecuencia absoluta inmediatamente

inferior a la clase modal.

fi+1 es la frecuencia absoluta inmediatamente

posterior a la clase modal.

(32)

Moda

32

 También se utiliza otra fórmula de la moda que da

(33)

Ejemplo (Moda)

33

Calcular la moda de una distribución estadística

(34)

Ejemplo (Moda)

(35)

Mediana

35

 Es el valor que ocupa el lugar central de todos

los datos cuando éstos están ordenados de menor a mayor.

 La mediana se representa por Me.

 La mediana se puede hallar sólo para variables

(36)

Calculo de la Mediana

36

1 Ordenamos los datos de menor a mayor.

2 Si la serie tiene un número impar de

medidas la mediana es la puntuación central de la misma.

 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

3 Si la serie tiene un número par de puntuaciones

la mediana es la media entre las dos puntuaciones centrales.

(37)

Calculo para datos agrupados

37

 La mediana se encuentra en el intervalo donde la frecuencia

acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

 Es decir tenemos que buscar el intervalo en el que se encuentre .

Li es el límite inferior de la clase donde se encuentra la mediana.  fi es la frecuencia absoluta.

(38)

Ejemplo (Mediana)

(39)

Media aritmética

39

 La media aritmética es el valor obtenido

al sumar todos los datos y dividir el resultado entre el número total de datos.

(40)

Media aritmética para datos

agrupados

40

 Si los datos vienen agrupados en una tabla de

(41)

Ejercicio (Media Aritmética)

41

 En un test realizado a un grupo de 42 personas se

(42)
(43)

43

 Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110)

[110, 120)

fi 8 10 16 14 10 5 2

(44)

Cuartiles

44

 Los cuartiles son los tres valores de la variable

que dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores

correspondientes al 25%, al 50% y al 75% de

los datos.

(45)

Cálculo de los cuartiles

45

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa

(46)

Cálculo de Cuartiles

(47)

Cuartiles para datos agrupados

47

 En primer lugar buscamos la clase donde se

encuentra , en la tabla de las frecuencias

acumuladas.

Li es el límite inferior de la clase donde se encuentra el

cuartil.

 N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del

cuartil.

(48)

Ejercicio

(49)
(50)

Percentiles

50

 Los percentiles son los 99 valores que dividen la

serie de datos en 100 partes iguales.

 Los percentiles dan los valores correspondientes al

1%, al 2%... y al 99% de los datos.

(51)

Cálculo de precentiles

51

Li es el límite inferior de la clase donde se encuentra el

percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del

percentil.

(52)

Ejercicio de percentiles

(53)

Resultado

(54)

Desviación Media

54

 La desviación media es la media aritmética de

los valores absolutos de las desviaciones respecto a la media.

(55)
(56)

Desviación media para datos

Agrupados

56

 Si los datos vienen agrupados en una tabla de

(57)

Ejemplo: calcular la desviación media

de la siguiente distribución:

(58)

Varianza

58

 La varianza es la media aritmética del cuadrado

de las desviaciones respecto a la media de una distribución estadística.

(59)

Varianza para datos agrupados

(60)

Ejemplo: Calcular la varianza para la

siguiente distribución

(61)

Desviación estándar

61

 La desviación estándar es la raiz cuadrada de la

varianza.

(62)

Ejemplo: Calcular la desviación

estándar para la siguiente distribución

Referencias

Documento similar

[r]

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

De acuerdo con Harold Bloom en The Anxiety of Influence (1973), el Libro de buen amor reescribe (y modifica) el Pamphihis, pero el Pamphilus era también una reescritura y

Abstract: This paper reviews the dialogue and controversies between the paratexts of a corpus of collections of short novels –and romances– publi- shed from 1624 to 1637:

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,