• No se han encontrado resultados

Estadística Descriptiva

N/A
N/A
Protected

Academic year: 2022

Share "Estadística Descriptiva"

Copied!
14
0
0

Texto completo

(1)

Estadística Descriptiva

(2)

Índice

1 Introducción ... 3

2 Conceptos Básicos ... 3

3 Variables Estadística ... 4

4 Escalas de Medición ... 4

5 Organización de la Información ... 5

6 Tablas de Frecuencia ... 8

7 Ejemplos ... 9

8 Resumen ... 14

9 Referencias Bibliográficas ... 14

(3)

Objetivos

 Objetivo: Conocer y comprender los fundamentos básicos en los que se compone la estadística.

1 Introducción

Está unidad de aprendizaje está encaminada a orientar al alumno a través de los conceptos básicos y las herramientas descriptivas que ofrece la estadística como disciplina ligada a las ciencias básicas, es de notar que los conceptos aquí consignados permitirán al estudiante obtener el conocimiento necesario para la comprensión de fenómenos presentes en cualquier tipo de estudios científicos, esto a través de ejemplos léxico-gráficos , pero sin hacer énfasis en los detalles y rigurosidad matemáticas propias de la disciplina.

2 Conceptos Básicos

Estadística: Es la disciplina que se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos. Así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

Estadística Descriptiva: Comprende los procesos de consolidación, resumen y descripción de los datos recopilados. Tablas, gráficos o índices que permiten un análisis referido, exclusivamente, a los datos coleccionados. No se generaliza ni se extrapola a la totalidad de los elementos.

Estadística Inferencial: Incluye procedimientos que permiten la extrapolación y generalización sobre características que tipifican a todos los elementos de la población.

Puede decirse que, es el proceso de hacer afirmaciones o predicciones sobre toda la población, tomando como base, sólo a la información recolectada a través de una muestra.

Población: Conjunto de elementos que son de interés en un estudio (poseen características comunes acerca de los cuales se desea tener información). Usualmente a dichos elementos se les denomina individuos, observaciones o mediciones. La población puede ser finita o infinita.

“Población: individuos, observaciones, mediciones.

Muestra: parte de la población.

Censo: información de la población Muestreo: selección elementos de una población”

(4)

Muestra: Es una parte de la población. Para estudios estadísticos, se requieren muestras que nos den información real de la población.

Censo: Información de toda la población.

Muestreo: Proceso mediante el cual se seleccionan los elementos de una población.

3 Variables Estadística

Son características de los elementos poblacionales que se atribuyen al azar. Se clasifican en:

Cualitativas: Aquellas que describen cualidades de los elementos. Ejemplo: Tipo de sangre, cuyas modalidades o categorías son: O, A, B, AB. Otros ejemplos son: Estado civil, documento de identificación, filiación política, tipo de religión, etc.

Cuantitativas: Aquellas que generalmente resultan de un proceso de medición. Pueden ser:

 Discretas: Resultan de conteos, y el resultado es un número entero. Ejemplo:

Número de hermanos, cuyas modalidades o categorías son: 0,1,…, N. Otros ejemplos son: Número de pacientes que llegan a un centro de salud en un intervalo de tiempo dado, número de sillas en un salón de clases, número de horas que un estudiante dedica semanalmente a sus asignaturas.

 Continuas: El resultado es un subconjunto de los números reales. Ejemplo:

Tiempo de espera en una parada de bus, velocidad de un vehículo en una autopista, ingreso económico del jefe de hogar en una familia.

4 Escalas de Medición

La medición hace referencia a la asignación de números a las características objeto de estudio.

Escala nominal: Es la más baja de las escalas de medición. Identifica las categorías de la variable de interés, y se pueden diferenciar las categorías una de la otra haciendo uso de dígitos. Ejemplo: Estado civil (soltero, casado, viudo, unión libre, separado), cédula de ciudadanía, género musical, tipo de sangre, estado del paciente.

Escala ordinal: Identifica las categorías de la variable y pueden ser clasificadas por grados de acuerdo a algún criterio. La función de los dígitos asignados a datos ordinales

“Cualitativas: describen cualidades de los elementos.

Cuantitativas: resultan de un proceso de medición”

“Tipos de escala: nominal, ordinal, de intervalos y, de razón”

(5)

es la de ordenar. Ejemplo: Grado de escolaridad (ninguno, primaria, secundaria, profesional, postgrado), rangos militares, grados de desnutrición, tipo de quemadura.

Escala de intervalos: La escala de intervalos es una escala más especializada que la nominal y la ordinal, en el sentido de que no solo es posible ordenar las mediciones, sino que también se conoce la distancia entre las observaciones cualesquiera. Aquí no hay un punto cero único. Ejemplo: La escala en la que se mide la temperatura. No es posible decir que 30° es doble de frio que 60°, ya que depende de la escala (grados Celsius o Fahrenheit). Otros ejemplos son: Pérdida auditiva en decibeles y coeficiente intelectual en puntaje.

Escala de razón: Es el nivel más alto de las escalas de mediciones y se caracteriza por el hecho de que se puede determinar tanto la igualdad de razones como la de intervalos.

Existe un punto cero único. Por ejemplo: Altura, peso, longitud, velocidad, área, volumen.

5 Organización de la Información

Existen dos formas básicas para la representación de la información recolectada, a través de tablas o cuadros estadísticos, y a través de un gráfico.

Una tabla o cuadro estadístico es una representación en forma ordenada de la variación de un fenómeno, clasificado bajo uno o más variables. Puede ser simple (clasificación bajo una variable) o compuesto (clasificación bajo dos o más variables).

Términos relacionados para tablas estadísticas:

 Frecuencia absoluta (𝑛𝑖): Sea 𝑋 una variable estadística cuyos valores son 𝑋1, 𝑋2, … , 𝑋𝑘; de una muestra de tamaño 𝑛, con (𝑘 ≤ 𝑛). La frecuencia absoluta corresponde al número de veces que se repite cada valor de la variable.

Propiedades:

1. 0 ≤ 𝑛𝑖≤ 𝑛, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑘 2.𝑘𝑖=1𝑛𝑖= 𝑛1+ 𝑛2+ ⋯ + 𝑛𝑘= 𝑛

 Frecuencia relativa (ℎ𝑖): Sea 𝑋 una variable estadística cuyos valores son 𝑋1, 𝑋2, … , 𝑋𝑘; de una muestra de tamaño 𝑛, con

“Términos: frecuencia absoluta, relativa, absoluta acumulada, relativa acumulada”

(6)

(𝑘 ≤ 𝑛). La frecuencia relativa corresponde al cociente entre la frecuencia absoluta y el tamaño de muestra.

𝑖=𝑛𝑖 𝑛

Propiedades:

1. 0 ≤ ℎ𝑖≤ 1, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑘 2.𝑘𝑖=1𝑖= ℎ1+ ℎ2+ ⋯ + ℎ𝑘= 1

 Frecuencia absoluta acumulada ( 𝑁𝑖): Es la suma sucesiva de frecuencias absolutas.

Propiedades:

1. 𝑁𝑖= 𝑛1+ 𝑛2+ ⋯ + 𝑛𝑖= ∑𝑖𝑗=1𝑛𝑗, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑘 2. 𝑁1= 𝑛1

3. 𝑛𝑖= 𝑁𝑖− 𝑁𝑖−1

 Frecuencia Relativa acumulada (H𝑖): Es la suma sucesiva de frecuencias relativas.

Propiedades:

1. 𝐻𝑖= ℎ1+ ℎ2+ ⋯ + ℎ𝑖= ∑𝑖𝑗=1𝑗, 𝑝𝑎𝑟𝑎 𝑖 = 1, … , 𝑘 2. 𝐻1= ℎ1

3. ℎ𝑖= 𝐻𝑖− ℎ𝑖−1

Para algunos tipos de tablas, es necesario definir algunos términos adicionales.

 Clases: Intervalos de números reales que tienen las siguientes características:

- Son disjuntos, es decir, no comparten elementos.

- Son exhaustivas, es decir, no dejan elementos por fuera.

- El elemento de menor magnitud cae en la primera clase y el de mayor magnitud cae en la última clase.

Observaciones:

- Se recomienda construir entre 5 y 25 clases según el número de datos.

(7)

- Las clases que se construyen deben ser reales, esto es, sea [𝐿𝑖; 𝐿𝑖+1] la clase I-ésima (𝑖 = 1, … , 𝑘), donde 𝐿𝑖 es el límite inferior de la clase 𝑖, y 𝐿𝑖+1

es el límite superior de la clase 𝑖.

De acuerdo con la información contenida en la muestra, los límites reales de clase toman la siguiente forma.

Información 𝐿𝑖 𝐿𝑖+1

Enteros Décimas Centésimas

-0.5 -0.05 -0.05

+0.5 +0.05 +0.05

Tabla 1: Limites reales

 Marca de clase(𝑋𝑖): Es el punto medio de cada clase.

𝑋𝑖=𝐿𝑖+ 𝐿𝑖+1 2

Comúnmente representa a todos los elementos en la respectiva clase.

 Número de clases ( 𝐾): Es un indicador para obtener el número de clases. Regla de Stugers.

𝐾 = 1 + 3.33 log 𝑛

Donde 𝑛: es el tamaño de la muestra. Otro indicador muy usado es:

𝑘 ≈ √𝑛

 Rango ( 𝑅): Diferencia entre la observación de mayor magnitud y la de menor magnitud.

(8)

𝑅 = 𝑋(𝑚𝑎𝑥)− 𝑋(𝑚𝑖𝑛)

Se dice que el rango es la longitud total de los datos.

 Amplitud de Clase ( 𝐴𝑖): Es la diferencia entre el límite superior y el límite inferior de clase.

𝐴𝑖= 𝐿𝑖+1− 𝐿𝑖 ; 𝑖 = 1,2, … , 𝑘

Para efectos de interpretación, se recomienda que todas las clases tengan la misma amplitud. Esto se obtiene por medio de la siguiente expresión.

𝐴𝑖=𝑅

𝐾 ; 𝑖 = 1,2, … , 𝑘

6 Tablas de Frecuencia

La forma general de una tabla de frecuencias se presenta en el siguiente cuadro.

Modalidad 𝐶

Frec. Abs.

𝑛𝑖

Frec. Rel.

𝑖

Frec. Abs. Acu.

𝑁𝑖

Frec. Rel. Acu.

𝐻𝑖

𝒄𝟏

𝒄𝒋

… 𝒄𝒌

𝒏𝟏

𝒏𝒋

… 𝒏𝒌

𝒉𝟏=𝒏𝟏 𝒏

𝒉𝒋=𝒏𝒋 𝒏

… 𝒉𝒌=𝒏𝒌

𝒏

𝑵𝟏= 𝒏𝟏

𝑵𝒋= 𝒏𝟏+ ⋯ + 𝒏𝒋

𝑵𝒌= 𝒏𝒌

𝑯𝟏= 𝒉𝟏

𝑯𝒋=𝑵𝒋

𝒏 = 𝒉𝟏+ ⋯ + 𝒉𝒋

𝑯𝒌= 𝟏 Tabla 2: Tabla de frecuencias explicita.

(9)

Modalidad 𝐶

Frec. Abs.

𝑛𝑖

Frec. Rel.

𝑖

Frec. Abs. Acu.

𝑁𝑖

Frec. Rel. Acu.

𝐻𝑖 𝒄𝟏

𝒄𝒋

… 𝒄𝒌

𝒏𝟏

𝒏𝒋

… 𝒏𝒌

𝒉𝟏=𝒏𝟏

𝒏

𝒉𝒋=𝒏𝒋

𝒏

… 𝒉𝒌=𝒏𝒌

𝒏 𝑵𝟏

𝑵𝒋

𝑵𝒌

𝑯𝟏

𝑯𝒋

𝑯𝒌

Tabla 3: Tabla de frecuencias.

7 Ejemplos

Ejemplo 1:

El número de vehículos que llegan a un taller automotor en un díadado, es una variable de tipo estadístico que se observó durante un período de 25 días y se obtuvieron los siguientes datos:

8 6 7 9 8 7 8 10 4 10 8 7 9 8 7 6 6 10 7 8 5 5 8 10 11

Se puede describe la variable 𝑋 como: 𝑋: número de vehículos que llegan al taller. Tipo:

cuantitativa discreta. Escala: razón.

(10)

La distribución de frecuencias para el número de vehículos que llegan a un taller automotor en un día dado es:

Valor de 𝑋𝑖

Frec. Abs.

𝑛𝑖

Frec. Rel.

𝑖

Frec. Abs. Acu.

𝑁𝑖

Frec. Rel. Acu.

𝐻𝑖

4 5 6 7 8 9 10

11

1 2 3 5 7 2 4 1

0.4 0.08

0.12 0.12 0.28 0.08 0.16 0.04

1 3 6 11 18 20 24 25

0.04 0.12 0.24 0.44 0.72 0.80 0.96 1

Total 25 1 - -

Tabla 4: Ejemplo 1 Ejemplo 2:

Una encuesta realizada a 30 fumadores para determinar el número de cigarrillos que encienden (fuman) en un día corriente arrojó los siguientes resultados:

3 7 5 10 8 4 5 8 10 8 8 4 5 3 10 5 7 10 8 5 5 12 8 4 4 3 5 8 12 10

Se puede describir la variable 𝑋 como: 𝑋: Número de cigarros que enciende un fumador. Tipo: Cuantitativa discreta. Escala:razón.

La distribución de frecuencias para el número de cigarros que enciende un fumador en un día dado es:

(11)

Valor de 𝑋𝑖

Frec. Abs.

𝑛𝑖

Frec. Rel.

𝑖

Frec. Abs. Acu.

𝑁𝑖

Frec. Rel. Acu.

𝐻𝑖

3 4 5 7 8 10 12

3 4 7 2 7 5 2

0.100 0.133 0.233 0.067 0.233 0.167 0.067

3 7 14 16 23 28 30

0.100 0.233 0.467 0.533 0.767 0.933

1

Total 30 1 - -

Tabla 5: Ejemplo 2 Ejemplo 3:

A continuación se presentan los datos sobre el octanaje del combustible para motores de varias marcas de gasolina:

88.5 89.8 89.9 90.6 93.4 90.7 90.1 94.7 91.6 98.8 92.2 96.1 88.6 89.3

84.3 90.3 83.3 87.7 89.6 88.3 91.1 90.1 90.0 90.4 91.1 90.4 94.2 83.4

89.0 91.5 91.2 86.7 91.6 85.3 93.2

Se puede describir la variable 𝑋 como: 𝑋: Octanaje del combustible. Tipo: Cuantitativa continua. Escala:razón.

Datos necesarios:

Número de clases: K= 1 + 3.33𝑙𝑜𝑔35 = 6.095 ≈ 6 Rango: 𝑅 = 𝑋(𝑚𝑎𝑥)− 𝑋(𝑚𝑖𝑛)=98.8 − 83.4 = 15.4 Amplitud: 𝐴 =𝑅𝐾=15.46 = 2.5666 ≈ 2.6

(12)

La distribución de frecuencias para el Octanaje del combustible es:

𝐿𝑖 𝐿𝑠

Frec.

Abs.

𝑛𝑖

Frec.

Rel.

𝑖

Frec. Abs.

Acu.

𝑁𝑖

Frec. Rel.

Acu.

𝐻𝑖

Marca de clase

𝑋𝑖

83.4 86 88.6

91.2 93.8 96.4

86 88.6

91.2 93.8 96.4 99

5 4 15

7 3 1

0.143 0.114 0.429 0.200 0.086 0.029

5 9 24 31 34 35

0.143 0.257 0.685 0.885 0.971

1

84.7 87.3 89.9 92.5 95.1 97.7

Total 35 1 - -

Tabla 6: Ejemplo 3 Ejemplo 4 Resuelto:

Se ha preguntado a 40 personas el número de personas que forman el hogar familiar obteniéndose los siguientes resultados:

Número de personas en el hogar 2 3 4 5 6 7

Frecuencia 4 11 11 6 6 2

a) Calcula la media, la mediana, la moda y la desviación típica.

Para calcular la media, moda, mediana y varianza se tendrá que realizar la siguiente tabla:

(13)

Tabla para calcular la media y desviación típica

personas xi frecuencia fi Fi xi · fi xi2 · fi

2 4 4 8 16

3 11 15 33 99

4 11 26 44 176

5 6 32 30 150

6 6 38 36 216

7 2 40 14 98

∑ 40 165 755

Por lo que, ya tenemos todo lo suficiente para poder hayas las fórmulas.

(14)

8 Resumen

 Estadística: Es la disciplina que se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos.

 Cualitativas: Aquellas que describen cualidades de los elementos.

 Cuantitativas: Aquellas que generalmente resultan de un proceso de medición.

 Tipos de escala: Nominal, ordinal, de intervalos y, de razón.

9 Referencias Bibliográficas

 Montgomery, D. C y Runger, R. (2008). Probabilidad y Estadística Aplicadas a la Ingeniería. 2da. Edición. Limusa Wiley. Mexico.

 Rincón. L. (2010). Curso Elemental de Probabilidad y Estadística. 1ra Edición.

Circuito Exterior de CU. México D.F.

 Walpole, R. E., Myers, R. H., Myers,S. L. y Ye, K. (2007). Probabilidad y Estadística para Ingeniería y Ciencias. 8va. Edición. Pearson. Mexico

 I. Espejo Miranda, F. Fernández Palacín, M. A. López Sánchez, M. Muñoz Márquez, A. M. Rodríguez Chía, A. Sánchez Navas, C. Valero Franco. (2006). Estadística Descriptiva y Probabilidad. 3ra. Edición. Servicio de Publicaciones de la Universidad de Cádiz.

 Devore, J. (2008). Probabilidad y Estadística para Ingeniería y Ciencias. 7ma.

Edición. Cengace Learning Editores. México

 Canavos, G. Probabilidad y Estadística. Métodos y Aplicaciones.

 Daniel, W. (2009). Bioestadística. Base para el análisis de las ciencias de la salud.

Cuarta edición. Limusa Wiley. México.

 Mendenhall, W., Wackerly, D. y Scheaffer, R. (1994). Estadística Matemática con Aplicaciones. Grupo Editorial Iberoamericana. México.

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Tanto para la comparación de grupos mediante prueba t de Student como para la estimación del tamaño del efecto es necesario el cumplimiento del supuesto de normalidad de

Se llega así a una doctrina de la autonomía en el ejercicio de los derechos que es, en mi opinión, cuanto menos paradójica: el paternalismo sería siempre una discriminación cuando

GENERALIZACIONES estadísticas sobre un población determinada, a partir del estudio de las características extraídas de una muestra de dicha población o

Para tal fin, se desarrollan los siguientes puntos: conceptos básicos de las organizaciones, definiciones y tipologias organizacionales; estructura social, grupos

Supongamos que la variable X está normalmente distribuida con una media de 6 meses y una desviación típica de 2 meses. Consideramos

Por este motivo, modos de adquisición como la ocupación territorial - prácticamente obsoleto e inoperante hoy día por la inexistencia de terra nullius-, la conquista –hoy

No obstante, continuaba el vicesecretario nacional de Ordenación Social, la ambiciosa interpretación del Decreto de 29 de septiembre de 1945 hecha por el partido, que le llevó