ESTADÍSTICA SEMANA 1

(1)

ESTADÍSTICA

(2)

ÍNDICE

ESTADÍSTICA DESCRIPTIVA ... 3

APRENDIZAJES ESPERADOS ... 3

INTRODUCCIÓN ... 3

PASOS QUE DEBE SEGUIR UN ESTUDIO ESTADÍSTICO ... 4

POBLACIÓN Y MUESTRA ... 5

CONCEPTO DE POBLACIÓN Y MUESTRA ... 5

LAS ESCALAS DE ESCALAS DE MEDICIÓN ... 5

TABLAS O CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS ... 7

VARIABLES CONTINUAS DE INTERVALOS ... 9

FÓRMULA DE STURGES ... 11

COMENTARIO FINAL ... 13

(3)

ESTADÍSTICA DESCRIPTIVA

APRENDIZAJES ESPERADOS

Durante el desarrollo de esta semana, se espera que el alumno logre acercarse a los términos básicos utilizados en estadística, además se describe la definición y las principales diferencias entre población y muestra.

INTRODUCCIÓN

El término estadística proviene de la palabra Estado y se refiere al origen histórico de esta disciplina, relacionada con la descripción cuantitativa de asuntos del Estado. También se llamó

aritmética política. Según definición de William Petty a finales del 1600, su objetivo inicial era

describir cuantitativamente diversos hechos de interés. En tiempos de Julio César (100 a. C.), Augusto el estadístico era el recaudador de impuestos y en tiempos de Guillermo el Conquistador (1070 aproximadamente) se editó el primer registro o censo de Inglaterra (Libro Domesday, 1086). En el siglo XVII, John Graunt (1620-1674) y W. Petty (1623-1687) desarrollaron la estadística vital. En esta misma época, en forma independiente nació la rama matemática de las probabilidades, esto surge a raíz del interés en el juego de Antoine Gombaud (el caballero de Merè: 1610-1685) y de los matemáticos Blas Pascal (1623-1662) y Pierre de Fermat (1601-1665). Posteriormente, Jacob Bernouilli (1654-1705), Abraham de Moivre (1667-1754), Pierre Simon Laplace (1749-1827) y Karl Friedrich Gauss (1777-1855) contribuyeron a fortalecer las probabilidades, combinándola con los datos estadísticos. Adolphe Quetelet (1796-1874) y finalmente Francis Galton (1822-1911) aplicaron la estadística al análisis de la variabilidad biológica. El desarrollo definitivo de la

estadística, uniendo sus raíces descriptivas y matemáticas viene con Karl Pearson (1857-1936),

William Sealy Gosset, Student (el estudiante), (1876-1937), Jerzy Neyman (1894), Egon Sharp Pearson (1895), Abraham Wald (1902-1950) y Ronald Aylmer Fisher (1890-1962). Tal vez las figuras más destacadas que relacionaron la estadística y la biología, dando origen a la biometría, son K. Pearson, fundador de la revista Biometrika y R. A. Fisher autor de Statistical Methods for

Research Workers (1925).

En paralelo, la estadística matemática ha sido enriquecida con las contribuciones de James Clerk Maxwell, Ludwig Boltzman y Josiah Willard Gibbs (mecánica estadística) y por Andréi Kolmogórov (probabilidades axiomáticas) y Henri Lebesgue (Teoría de la Medida). La estadística ha tenido un desarrollo progresivo e intensivo a partir de los años 70 y esto se refleja en la diversidad de carreras profesionales que la utiliza, entre ellas, ingeniería, medicina, bioestadística, enfermería,

(4)

agronomía, economía, arquitectura, derecho, sicología, publicidad, relaciones públicas y comunicación social.

¿Qué es la estadística? Y ¿Para qué se usa la estadística?

En la vida cotidiana se aplican diferentes conceptos relacionados con estadística, esto de manera consciente o inconsciente. Por ejemplo, un profesor, con el fin de decidir el grado de dificultad al comienzo de una asignatura interroga a ocho alumnos aleatoriamente de un total de 32.

Algunas de las posibles situaciones que pueden ocurrir son: Los alumnos en promedio sacan baja calificación. Algunos alumnos sacan mediocres calificaciones.

Los alumnos en general sacan muy buenas calificaciones.

Frente a cada una de estas tres posibilidades, el profesor resuelve partir con un curso de nivel: bajo, medio o avanzado.

Observar una muestra (subconjunto de la totalidad) y suponer que las características se mantienen para toda la población (total fuente de información), claramente puede llevar a conclusiones erróneas, medir esta incertidumbre y/o minimizar este tipo de error es tarea de la

estadística.

PASOS QUE DEBE SEGUIR UN ESTUDIO ESTADÍSTICO

Un estudio estadístico, cualquiera que sea, debe seguir los siguientes pasos:

a) Elección de una muestra representativa: la muestra debe tener un tamaño apropiado en función de los objetivos (debe contener la información necesaria para responder a la hipótesis y a los objetivos del estudio). Debe representar las características del grupo en estudio (la muestra debe representar las características de la población). El área de la estadística que trata estos problemas es llamada Teoría de Muestreo.

b) Resumen de la información: implica sintetizar la información usando conteos, gráficos, tablas de frecuencias, etc. Esta es la tarea de la estadística descriptiva.

c) Generalización a partir de los resultados obtenidos en la muestra a la población: esta tarea pertenece a la inferencia estadística y para realizarla es imprescindible tener conocimientos de Teoría de Probabilidades.

(5)

POBLACIÓN Y MUESTRA

CONCEPTO DE POBLACIÓN Y MUESTRA

POBLACIÓN:

la población es el conjunto de elementos que están en estudio y puede ser infinito o finito (Anderson, Sweeney & Williams, 2008).

Ejemplos de población en un estudio estadístico:

a) El número de televisores por hogares de una cierta ciudad (finito numerable). b) El número de niños que murieron y nacerán en un hospital (infinito numerable). c) El resultado del lanzamiento de una moneda indefinidamente (infinito numerable). d) La duración de cierto artículo electrónico (infinito no numerable).

En la práctica observar a la población resulta antieconómico o poco práctico, esto debido a que realizar un censo de una determinada población tiene un costo importante, la otra razón es el tiempo que demora hacerlo, por lo tanto, es común llevar a cabo estudios por medio de una

muestra.

MUESTRA:

una muestra es una parte (subconjunto) de la población que trata de preservar la mayor parte de las características de ella (Anderson& otros, 2008).

Considerando los ejemplos anteriores:

a) Tomar al azar 1.000 encuestas del censo y buscar el número de televisores que posee cada hogar en la misma ciudad.

b) En un mes del año, se cuenta diariamente el número de niños nacidos. c) Se registran los primeros 100 lanzamientos de la moneda.

d) Medir el tiempo de duración de una partida de ampolletas.

La forma de tomar la muestra y el tamaño de ella, depende de algunos factores, tales como: a) Población objetivo.

b) Tamaño del error. c) Tiempo para el estudio.

d) Cantidad de recursos (como el dinero, entre otros).

Otro elemento de un estudio estadístico son las escalas de medición.

LAS ESCALAS DE ESCALAS DE MEDICIÓN

ESCALA NOMINAL:

solo las variables cualitativas se pueden medir con esta escala, una variable cualitativa está compuesta por diferentes categóricas.

(6)

Ejemplo: la variable sexo puede tomar dos valores que son: masculino y femenino, para que las categorías de clasificación sean útiles, deben ser mutuamente excluyentes, complementarias y exhaustivas. En cada una de ellas se puede obtener la frecuencia. (Anderson& otros, 2008).

ESCALA ORDINAL:

con esta escala se miden variables de tipo cuantitativo; estas pueden tomar diferentes valores, de tal manera que es posible ordenarlos en forma ascendente o descendente, pero se desconoce la distancia que existe entre las categorías de la variable. Se usa cuando se detectan diferentes grados del valor de una variable y cuando los datos recopilados a partir de ella, se pueden ordenar por rangos (Anderson & otros, 2008).

Ejemplo: Si se presentan tres refrescos diferentes a una persona y se le pide que exprese su

preferencia utilizando una escala del uno al tres, esto se evalúa en una escala ordinal, pues se puede suponer que hay un orden en los resultados, pero la diferencia en las puntuaciones no tiene importancia, pues no se puede saber si la diferencia entre un tres y un dos es la misma que entre un uno y un dos.

Observación: corresponde a los datos medidos a las variables en cada uno de los elementos del

conjunto de datos, una observación se designa con una letra minúscula.

Ejemplo aplicado:

Conjunto de datos: habitantes de la ciudad de Santiago. Variables:

X = Género Y = Edad

Conjunto de observaciones de una muestra tamaño 10: Observación Género Observación Edad

x1 Masculino y1 34 x2 Masculino y2 23 x3 Femenino y3 56 x4 Femenino y4 45 x5 Masculino y5 34 x6 Masculino y6 67 x7 Femenino y7 56 x8 Femenino y8 19 x9 Masculino y9 26 x10 Femenino y10 32 Fuente: http://observatorio.ministeriodesarrollosocial.gob.cl/casen_est_demografia.php

(7)

TABLAS O CUADROS DE DISTRIBUCIÓN DE FRECUENCIAS

Una tabla de frecuencia, es el resumen u ordenamiento de la información obtenida en la población o muestra, se expresa por medio de una tabla de doble entrada, con las siguientes características: siendo n el tamaño de la muestra y m el número de filas de la tabla (Anderson & otros, -2008).

Clases Frecuencias absolutas (n° de observaciones en cada clase) A1 n1 A2 n2 … … An-1 nn-1 Am nm

Se define: Ai = clase i = 1,… , m (intervalos u observaciones); ni = frecuencia absoluta del número

de observaciones que pertenecen a Ai.

Por lo tanto:

Al interior de cada clase, se definen las frecuencias absolutas acumuladas:

Frecuencias relativas:

Frecuencias relativas acumuladas:

Marca de clases (variables cuantitativas). En el caso que la clase sea un intervalo, se define como el valor central y es el representante de todas las observaciones en esa clase, se denotará por Xi.

(8)

Ejemplo de una tabla de distribución de frecuencias:

A continuación, otro ejemplo: Se desea estudiar la edad de ingreso de los alumnos de una universidad. Para esto se toma una muestra de 20 alumnos.

Observaciones:

17 22 21 23 18 19 19 18 20 21

18 19 21 23 22 18 24 22 23 20

Si se agrupan estos datos en una tabla o cuadro de distribución de frecuencias. Resultaría lo siguiente:

(9)

VARIABLES CONTINUAS DE INTERVALOS

En el caso de las variables continuas muchas veces es necesario agrupar datos (series agrupadas) por intervalos llamados intervalos de clase. Estos se anotan como , donde representa el límite inferior del intervalo e , el límite superior (Yule & Kendall, 1954). La amplitud de cada intervalo es:

En estas tablas de distribución de frecuencias se define marca de clase como el valor promedio entre los límites del intervalo su cálculo es:

Ejemplo (edades): En una universidad se desea estudiar la edad de los alumnos que ingresar a primer año. Para esto se toma una muestra de 20 alumnos.

Los datos que se tienen son:

17 22 21 23 18 19 19 18 20 21

(10)

Si se agrupan estos datos en una tabla o cuadro de distribución de frecuencias, resultaría lo siguiente:

Pero, también se puede agrupar de la siguiente forma (utilizando intervalos):

Nota: No debemos olvidar que a la hora de contar los datos que están en cada intervalo de la

forma [Y'i-1 , Y'i]. El límite superior no se considera, pues se cuenta en el siguiente intervalo.

Donde:

xi: Marca de clases del i-ésimo intervalo.

ni: Frecuencia absoluta del i-ésimo intervalo.

Ni: Frecuencia absoluta acumulada del i-ésimo intervalo.

fi: Frecuencia relativa del i-ésimo intervalo.

Fi: Frecuencia relativa acumulada del i-ésimo intervalo.

hi: Frecuencia porcentual del i-ésimo intervalo.

(11)

Frente a estas dos tablas surgen las siguientes interrogantes: ¿cuántos intervalos o clases se pueden considerar? ¿Qué tamaño deben tener los intervalos, si se consideran iguales?

Respuesta: no existen reglas fijas para determinar el número de clases y el ancho de cada uno de ellos. No obstante, existe una fórmula dada por Herbert Sturges (1926), la cual considera intervalos de igual tamaño.

FÓRMULA DE STURGES

Primero se debe determinar el número de intervalos por medio de la siguiente fórmula:

En donde n = tamaño de la muestra.

Luego, el ancho o amplitud de cada intervalo:

M = máximo y L= mínimo.

Ejemplo: La misma universidad, anteriormente citada, está interesada en la estatura de los 20 estudiantes. La información obtenida es la siguiente.

1,70 1,86 1,78 1,72 1,65 1,80 1,75 1,74 1,67 1,68 1,68 1,72 1,74 1,69 1,82 1,61 1,73 1,81 1,83 1,85

Para organizar esta información en un cuadro de distribución de frecuencias, se utilizará la

fórmula de Sturges. Primero, calcular el número de intervalos:

Segundo, determinar la amplitud o ancho de los intervalos:

(12)

Nota 1: El estudiante que mide 1,86 m fue contabilizado en el intervalo [1,81 , 1,86), pues no

existía otro intervalo posterior.

Nota 2: La construcción de una tabla de frecuencias es mecánica y solo se necesita saber la

definición de cada columna. La estadística va mucho más allá y es muy importante interpretar cada celda de esta tabla en términos de la variable.

Algunas preguntas y respuestas aclaratorias del cuadro anterior:

a) ¿Qué significa que el valor de n2 sea 5?

Respuesta: Que hay 5 personas que miden entre 1,66 m y 1,71 m.

b) ¿Qué significa que el valor de N5 sea 20?

Respuesta: Que las 20 personas no miden más de 1,86 m.

c) ¿Qué significa que el valor de f1 sea 0,10?

Respuesta: La proporción de personas que miden entre 1,61 m y 1,66 m es 0,1.

d) ¿Qué significa que el valor de F2 sea 0,35?

Respuesta: La proporción de personas que no superan el 1,71 m es 0,35.

e) ¿Qué significa que el valor de h4 sea 10%?

Respuesta: El 10 por ciento de los estudiantes mide entre 1,76 m y 1,81 m.

f) ¿Qué significa que el valor de H4 sea 75?

(13)

COMENTARIO FINAL

Una vez concluida esta semana, estamos en condiciones de entender parte de la historia de la Estadística y quienes fueron los principales investigadores que ayudaron a construir todos los teoremas que conocemos y estudiamos actualmente, los primeros conceptos que podemos aplicar son: población y muestra, esto nos servirá en los más variados aspectos cotidianos y en nuestra vida laboral, ya que entender la diferencia y aplicar un estudio donde se cumple con los elementos básicos para que una muestra sea representativa es fundamental. Otro de los aprendizajes que están en condiciones de aplicar es reconocer e identificar claramente el tipo de medida de las variables que se pueden encontrar en diferentes conjuntos de datos, esto es muy importante, ya que dependiendo de esa información se define el tipo de análisis o tabla que se construye, además también tienen todas las herramientas para agrupar variables continuas utilizando la fórmula de Sturger y construir tablas de distribución de frecuencia.

(14)

REFERENCIAS

Anderson David R., Sweeney Dennis J., Williams Thomas A. (2008). Estadística para

administración y economía (10ª edición). Cencage Learning

Canavos, George. (1988). Introducción y estadística descriptiva. Probabilidad y estadística. México: McGraw-Hill/Interamericana S. A.

Pagano, Robert R. (2011). Estadística para las ciencias del comportamiento (9ª edición). Cencage Learning.

Sir William Petty (1623- 1687) filósofo, médico, economista y estadístico inglés.

Estadísticas vitales publicadas por el INE (Instituto nacional de estadística) 2012:

http://www.ine.cl/canales/chile_estadistico/demografia_y_vitales/estadisticas_vitales/est adisticas_vitales.php

PARA REFERENCIAR ESTE DOCUMENTO, CONSIDERE: IACC (2012). Estadística. Semana 1.