EYGDD - Unidad No1 : Presentaci´on de Datos
Unidad N
o1
Presentaci´
on de Datos
Prof. Milton A. Ram´ırez Klapp
[email protected]
Instituto Profesional AIEP Escuela de Desarrollo Social
Trabajo Social
Marzo de 2008
EYGDD - Unidad No1 : Presentaci´on de Datos
Part I
Preliminar
EYGDD - Unidad No1 : Presentaci´on de Datos Estad´ıstica
Definici´on
Estad´ıstica
Caracter´ısticas Generales
La Estad´ıstica es una rama de la Matem´atica que se refiere a la
recolecci´on, agrupaci´on, clasificaci´on, estudio e interpretaci´on de los datos obtenidos en un estudio determinado.
La Estad´ıstica se subdivide en dos ramas que pasaremos a revisar a continuaci´on:
Estad´ıstica Descriptiva. Inferencia Estad´ıstica.
EYGDD - Unidad No1 : Presentaci´on de Datos Estad´ıstica Campo de Aplicaci´on
Campo de Aplicaci´
on
A ver
Ciencias de la Salud. Nutrici´on. Computaci´on. Meteorolog´ıa. Demograf´ıa. Deporte. Sociolog´ıa.Educaci´on del Tr´ansito. etc.
EYGDD - Unidad No1 : Presentaci´on de Datos Estad´ıstica
Estad´ıstica Descriptiva
Estad´ıstica Descriptiva
Qu´
e es
La Estad´ıstica Descriptiva se define como un conjunto de t´ecnicas y m´etodos cuyo prop´osito es describir alguna caracter´ıstica de inter´es en base a la informaci´on contenida en una muestra.
La metodolog´ıa que se emplea para recabar informaci´on de inter´es en nuestros estudios contempla las siguientes etapas:
1 Selecci´on y determinaci´on de la muestra (saber con certeza sobre qu´e tratar´a el estudio).
2 Obtenci´on de los datos.
3 Clasificaci´on y organizaci´on de los datos recogidos en la etapa anterior. 4 Estudio descriptivo de los datos a trav´es de tabulaciones y c´alculo de
estad´ıgrados tanto de tendencia central como de dispersi´on. 5 Representaci´on Gr´afica de los datos.
6 Conclusiones.
EYGDD - Unidad No1 : Presentaci´on de Datos Estad´ıstica
Inferencia Estad´ıstica
Inferencia Estad´ıstica
Nada m´
as que por cultura general
La Inferencia Estad´ıstica se dedica a la generaci´on de modelos matem´aticos que permitan hacer predicciones o inferencias respecto al comportamiento estad´ıstico de una poblaci´on a partir de los datos recogidos en una muestra.
En este ´ambito lo que se hace es tratar de deducir cu´ales ser´ıan los par´ametros estad´ısticos de una poblaci´on en base a una cierta probabilidad de ´exito o de fracaso (seg´un como se mire).
Otras aristas del estudio se refieren al establecimiento de ciertas hip´otesis, a partir de las cuales podemos obtener respuestas s´ı o no con un cierto margen de error prefijado.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Poblaci´on
Poblaci´
on
Qu´
e es
La poblaci´on estad´ıstica corresponde al conjunto de elementos de referencia sobre el cual se realizar´an las observaciones.
Tambi´en se le conoce como universo o colectivo.
El tama˜no de una poblaci´on corresponde a la cantidad de elementos que ´
esta posee, y su valor lo representaremos mediante el s´ımbolo N. Por lo general, N es un n´umero grande.
Por ejemplo
La poblaci´on de todas las mujeres chilenas nacidas a la fecha. La poblaci´on del parque automotriz en Sudam´erica.
La poblaci´on de todas las personas del mundo que sean mayores de 18 a˜nos.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Muestra
Muestra
Qu´
e es
Corresponde a una parte de la poblaci´on (subconjunto).
El tama˜no de la muestra se denota con el s´ımbolo n, y se cumple que n < N
Por ejemplo
Si la poblaci´on fuera igual a todas las mujeres chilenas nacidas a la fecha, una posible muestra ser´ıan las mujeres que est´an embarazadas
Si la poblaci´on fuera el parque automotriz en Sudam´erica, una muestra ser´ıa los veh´ıculos que tienen placa patente de la ciudad de Buenos Aires. Si la poblaci´on fuera igual a todas las personas del mundo que sean mayores de 18 a˜nos, una posible muestra ser´ıan todas las personas que tengan dos hijos y sean mayores de 50 a˜nos.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Variable
Variable
Veamos
Las variables representan las caracter´ısticas de los casos, entes u objetos que forman la poblaci´on.
Distinguiremos dos tipos de variables:
X Cualitativas (cualidades) X Cuantitativas (cantidades)
Se diferencian entre s´ı porque a una no se le puede atribuir valores num´ericos y a la otra s´ı.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Variable
Variables Cualitativas
Cualitativa, cualidad
Son aquellas que no toman valores num´ericos y s´olo describen cualidades.
Por ejemplo
Raza. Color de pelo. Estado civil. Sexo.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Variable
Variables Cuantitativas
Cuantitativa, cantidad
Son aquellas a las cuales podemos asignarles un valor num´erico. Se clasifican en:
Variables cuantitativas discretas. Variables cuantitativas continuas.
Ejemplos
Estatura. Edad.
Potencia del motor de un autom´ovil. Cantidad de DVDs que hay en un videoclub.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Variable
Variables Cuantitativas Discretas
Discreto, conteo
Son variables cuantitativas que suelen emplearse para hacer conteos o enumeraciones.
Toman valores enteros (sin decimales).
Ejemplos
Cantidad de alumnos presentes en una sala. Cantidad de alumnos ausentes en una sala. Cantidad de manzanas que caben en un kilo.
N´umero de clientes que espera ser atendido en la caja de un supermercado.
EYGDD - Unidad No1 : Presentaci´on de Datos Conceptos Fundamentales
Variable
Variables Cuantitativas Continuas
Continuo, medici´
on
Son aquellas variables cuantitativas que puede tomar cualquier valor en un intervalo dado.
Pensemos en cosas que puedan ser traducidas a n´umeros decimales.
Ejemplos
Peso corporal (es posible que uno pueda pesar 80.7 kilos) Estatura (se puede medir 1.82 metros)
Tiempo de espera (podr´ıa ser de 1 hora con 27 minutos, donde en este caso los minutos ser´ıan los decimales)
EYGDD - Unidad No1 : Presentaci´on de Datos
Part II
Frecuencia
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Introducci´
on al concepto de Frecuencia
La frecuencia es uno de los t´erminos m´as usados en estad´ıstica. ´
Esta constituye un elemento esencial a la hora de an´alisis datos muestrales.
Es un concepto relacionado con la cantidad de veces que se repite un determinado valor en una variable (cualitativa o cuantitativa). Existen diversos tipos de frecuencias:
X frecuencia absoluta X frecuencia relativa
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Frecuencia Absoluta
Frecuencia Absoluta
Es el n´umero de veces que se repite un valor particular de cierta variable. Si la variable en cuesti´on toma un n´umero k de valores, la frecuencia se denota con el s´ımbolo fi donde i es un ´ındice que puede tomar valores
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Frecuencia Absoluta
Frecuencia Relativa
Es denotada por fir y se define como el cuociente entre la frecuencia
absoluta y el n´umero de observaciones. Esto es:
fir =
fi
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Frecuencia Absoluta
Frecuencia Relativa Porcentual
Se denota por fir% y se define como:
fir% = fir× 100, i = 1, . . . , k.
Adem´as, como fr i =
fi
n la expresi´on anterior se puede escribir como
fir% =
fi
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´
alculo de Frecuencia seg´
un el tipo de Variable
Para calcular la frecuencia se debe tener presente el tipo de variable que se desea analizar, pues a partir de dicho an´alisis se realiza la agrupaci´on de datos respectivos.
Recordemos que los tipos de variable que existen son:
X cualitativa
X cuantitativa discreta X cuantitativa continua
Lo que veremos a continuaci´on es justamente c´omo hacer los c´alculos de cada tipo de frecuencia a trav´es de ejemplos que ayudar´an a clarificar los conceptos que vimos anteriormente.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
C´
alculo de Frecuencias para Variables Cualitativas
Vamos viendo
La presentaci´on de datos cualitativos suele hacerse indicando los atributos considerados y sus frecuencias de aparici´on.
Ejemplo
Sup´ongase que los datos siguientes representan las marcas extranjeras de autom´oviles preferidas en una muestra de 40 personas.
A C C J C F B F J A C C J F A B F F A C J J B F C J C J C B A F C J J C J A F C En donde A significa alem´an, C coreano, J japon´es, F franc´es y B brasile˜no.
Se pide representar los datos en una tabla que contenga las frecuencias absolutas y relativas e interpretar algunas de ellas.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Soluci´
on
En primer lugar, definamos la variable con la que estamos trabajando. Sea X :“Variable cualitativa o atributo que representa la marca extranjera de autom´ovil preferida.”
En este caso la muestra consta de n = 40 observaciones. Por lo tanto: la suma de las frecuencias debe ser igual a 40. Para tabular los datos en una tabla de frecuencias, se coloca en la primera columna los valores de i , donde i var´ıa entre 1 y k, donde k corresponde al n´umero de valores que toma la variable. En este caso k = 5 ya que tenemos los valores X = A, X = C , X = J, X = F y X = B.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Soluci´
on
En la columna siguiente se presentan los valores que toma la variable. Como se trata de una variable cualitativa, ella representa una cualidad y por lo tanto se denota con una letra en un orden arbitrario, como por ejemplo, A, C, J, F y B para mantener la notaci´on original del ejercicio. En la tercera columna se colocan las frecuencias absolutas de cada uno de los valores que toma la variable, la que se obtiene contando el n´umero de veces que aparece una respectiva cualidad en la muestra.
Finalmente en la ´ultima columna se presenta la frecuencia relativa la que se obtiene la dividir la frecuencia absoluta por el n´umero total de observaciones (n = 40), es decir: fir=
fi n.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Soluci´
on
Luego, la tabla de frecuencias queda de la siguiente manera:
i Marca Frecuencia(fi) Frec. Relativa(fir)
1 A 6 6/40 = 3/20 2 C 12 12/40 = 3/10 3 J 10 10/40 = 1/4 4 F 8 8/40 = 1/5 5 B 4 4/40 = 1/10 Total 40 1
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Soluci´
on
Interpretemos algunos valores particulares de la tabla:
X f1representa el total de veces que el valor A se repite en la muestra.
Como el valor X = A se repite 6 veces y como a la A le asignamos arbitrariamente el valor i = 1 se tiene que f1= 6. Lo mismo ocurre
con el resto de los valores.
X Veamos el caso de f4r, es decir la frecuencia relativa del cuarto valor
que toma la variable. Que f4r =103 significa que un quinto de las
preferencias de la gente se la lleva los veh´ıculos de nacionalidad francesa.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cualitativas
Ejemplo (Cont.)
Soluci´
on
X f2r = 101 significa que los tres d´ecimos de la gente prefiere los autom´oviles
coreanos. X fr
4% significa interpretar la frecuencia porcentual del cuarto valor que
tome la variable. La expresi´on para calcularlo es
f4r% = f r 4 × 100 = 1 5× 100 = 20
Esto significa que el 20% de las preferencias de la gente se las llevan los autom´oviles de origen franc´es. J
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Discretas
C´
alculo de Frecuencias para Variables Cuantitativas
Discretas
Veamos
Para presentar los datos cuantitativos discretos se indica el n´umero considerado y su frecuencia de aparici´on.
Es similar al caso cualitativo.
Ejemplo
Sup´ongase que los datos siguientes representan el n´umero de veh´ıculos que llega a una estaci´on de servicio en 30 per´ıodos de 5 minutos.
3 4 3 2 1 1 0 0 3 4 5 5 4 4 3 3 2 3 4 1 1 1 2 0 2 1 3 2 3 1
Agr´upense los datos en una tabla que contenga las frecuencias y las frecuencias relativas.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Soluci´
on
Sea X : “Variable que denota el n´umero de veh´ıculos que llega a una estaci´on de servicio”.
Al igual que en el problema anterior, la construcci´on de la tabla de frecuencias se realiza de la siguiente forma: La primera columna representa los valores de i , donde i = 1, . . . , k, con k = n´umero de valores que toma la variable. Para este ejemplo k = 6.
En la columna siguiente se colocan los valores que toma la variable (0, 1, 2, 3, 4 y 5). En la tercera columna las frecuencias absolutas para cada uno de los valores de la variable, la que se obtiene al contar el n´umero de veces que aparece cada valor en la muestra.
Finalmente en la ´ultima columna se presenta la frecuencia relativa la que se obtiene: fir =
fi
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Discretas
Ejemplo (Cont.)
Soluci´
on
La tabla de frecuencias queda de la siguiente manera:
i xi Frecuencia(fi) Frec. Relativa(fir)
1 0 3 3/30 = 1/10 2 1 7 7/30 3 2 5 5/30 = 1/6 4 3 8 8/30 = 4/15 5 4 5 5/30 = 1/6 6 5 2 2/30 = 1/15 Total 30 1
X f4= 8 significa que en 8 periodos de 5 minutos llegaron exactamente 3
veh´ıculos.
X f5r = 16 significa que en la sexta parte de los veh´ıculos que se consideraron
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
C´
alculo de Frecuencias para Variables Cuantitativas
Continuas
Veamos
En este caso cuando se dispone de cierto n´umero de valores referidos a una variable continua, es conveniente agruparlos en intervalos de clase o categor´ıas. Para seleccionar el n´umero k de intervalos de clases, o simplemente el n´umero k de clases, existen diversas formas.
1 Una de ellas es considerar tal n´umero k de clases no menor de 5 ni mayor de 15. No menor de 5 para evitar la p´erdida de informaci´on que se producir´ıa al reunir en una clase un grupo de datos muy diferentes; y, no mayor de 15 para de esta forma tener un f´acil manejo y con el prop´osito de asegurar una compactaci´on de la informaci´on.
2 Otra forma de seleccionar el n´umero de k de clases es empleando la Regla de Sturges, en donde k = 1 + 3.3 × log n, siendo n el tama˜no de la muestra.
En general, las clases se eligen de modo que la amplitud de cada una de ellas sea igual para todas las categor´ıas o intervalos de clases.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
C´
alculo de Frecuencias para Variables Cuantitativas
Continuas
Veamos
Antes de ver un ejemplo es necesario definir el concepto de Marca de Clase. Se denota por mi y corresponde al punto medio del intervalo de clase. Ella es la representante de la clase pues se atribuye el valor de la frecuencia
correspondiente a dicha clase.
Ejemplo
Sup´ongase que los datos a continuaci´on representan el precio aproximado de la libra de cobre, en centavos de d´olar para una muestra de 30 d´ıas, los que han sido ordenados convenientemente.
70 71 71 72 73 73 73 75 76 76 77 78 78 78 78 78 79 79 80 81 81 82 83 84 84 84 84 87 89 91 Se pide agrupar los datos en una tabla de frecuencias.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Soluci´
on
A continuaci´on se presenta paso a paso la forma de realizar una tabla de frecuencias para una variable cuantitativa continua:
1 Se determina el rango o recorrido r , el que se define como la diferencia entre los valores m´aximo y m´ınimo de la variable presentes en la muestra.
2 Se determina el n´umero k de clases o categor´ıas, empleando Regla de Sturges.
3 Se obtiene la amplitud o tama˜no a del intervalo, dividiendo el rango por el n´umero de clases.
4 Se seleccionan los l´ımites de clase que definen los intervalos, de manera que las clases sean de la misma magnitud y que cada observaci´on se clasifique sin ambig¨uedad en una sola clase.
5 Se cuenta el n´umero de observaciones en cada clase, es decir, se determinan las frecuencias absolutas de cada clase.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 1 - Valor del Rango
El rango o recorrido lo obtenemos de la siguiente manera: r = xmax− xmin= 91 − 70 = 21
xmaxcorresponde al m´aximo valor observable de la variable X (91) y xmin
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 2 - N´
umero de Clases
Como el valor de n = 30, aplicando la Regla de Sturges se llega a que
k = 1 + 3.3 × log n
= 1 + 3.3 × log 30
= 5.87 ≈ 6
Cabe destacar que el valor de k tiene que ser un n´umero entero (sin decimales).
El s´ımbolo ≈ significa aproximado o aproximadamente. Entonces 5.87 ≈ 6 se lee 5.87 es aproximadamente 6.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 3 - Amplitud o Tama˜
no del Intervalo
Se calcula dividiendo el rango por el n´umero de clases. Si a denota la amplitud del intervalo entonces
a = r
k
= 21
6
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
En primer lugar obtenemos el primer intervalo de clase, cuyo l´ımite aparente inferior es igual al m´ınimo valor que toma la variable en la muestra. En este caso este l´ımite inferior vale xmin= 70.
Para obtener el l´ımite aparente superior del primer intervalo de clase, sumamos al l´ımite aparente inferior la amplitud menos 1. En este caso ser´ıa xmin+ (a − 1) = 70 + 4 − 1 = 73.
Por lo tanto, nuestro primer intervalo (o clase) aparente es [70, 73[. Por notaci´on, [70, 73[ se interpreta como el intervalo que contiene a todos aquellos n´umeros que sean mayores o iguales que 70 y menores que 73. Esta explicaci´on es v´alida para todos los intervalos que construyamos, salvo que hay que reemplazar por los valores num´ericos que correspondan.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
En este caso restamos una unidad, pero si la amplitud del intervalo de clase se hubiese presentado con un decimal hubi´esemos tenido que restar 0.1.
Si se hubiese presentado con dos decimales tendr´ıamos que haber restado 0.01.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Tengamos presente que tenemos que construir un total de 6 intervalos, ya que k = 6 por la regla de Sturges.
Determinemos el l´ımite inferior del segundo intervalo. ´Este es igual al l´ımite aparente inferior del intervalo anterior m´as la amplitud. Es decir 70 + 4 = 74.
El l´ımite superior aparente del intervalo se obtiene sumando el l´ımite superior aparente del intervalo anterior con la amplitud. En este caso 73 + 4 = 77.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Determinemos el l´ımite inferior del tercer intervalo. ´Este es igual al l´ımite aparente inferior del intervalo anterior m´as la amplitud. Es decir
74 + 4 = 78.
El l´ımite superior aparente del intervalo se obtiene sumando el l´ımite superior aparente del intervalo anterior con la amplitud. En este caso 77 + 4 = 81.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Determinemos el l´ımite inferior del cuarto intervalo. ´Este es igual al l´ımite aparente inferior del intervalo anterior m´as la amplitud. Es decir
78 + 4 = 82.
El l´ımite superior aparente del intervalo se obtiene sumando el l´ımite superior aparente del intervalo anterior con la amplitud. En este caso 81 + 4 = 85.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Determinemos el l´ımite inferior del quinto intervalo. ´Este es igual al l´ımite aparente inferior del intervalo anterior m´as la amplitud. Es decir
82 + 4 = 86.
El l´ımite superior aparente del intervalo se obtiene sumando el l´ımite superior aparente del intervalo anterior con la amplitud. En este caso 85 + 4 = 89.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Determinemos el l´ımite inferior del sexto y ´ultimo intervalo. ´Este es igual al l´ımite aparente inferior del intervalo anterior m´as la amplitud. Es decir 86 + 4 = 90.
El l´ımite superior aparente del intervalo se obtiene sumando el l´ımite superior aparente del intervalo anterior con la amplitud. En este caso 89 + 4 = 93.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Una vez que se obtienen los intervalos o clases aparentes, se tienen que construir los intervalos o clases reales.
Esto se debe a que existe una diferencia num´erica entre el l´ımite inferior aparente de un intervalo con el l´ımite superior aparente de otro intervalo, lo que le quita el car´acter de continuo a la variable X :“Variable que describe el precio diario aproximado de la libra de cobre en centavos de d´olar”.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 4 - L´ımites de cada Clase o Intervalo
Para la formaci´on de los intervalos de clase real, a cada uno de los l´ımites inferiores de las clases aparentes se le debe restar 0.5, en caso que los datos est´an presentados sin decimales.
En nuestro caso, como los datos los tenemos sin decimales, tendremos que el l´ımite real inferior asociado con el primer intervalo ser´a igual a 70 − 0.5 = 69.5.
De igual forma, para obtener el l´ımite real superior de cada intervalo de clase se debe sumar 0.5, en caso que los datos vengan sin decimales. En este caso, el l´ımite real superior asociado con el primer intervalo es igual a 73 + 0.5 = 73.5.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Ojo
Si los datos se presentan con un decimal, para obtener el l´ımite real inferior de cada intervalo de clase se debe restar 0.05 al l´ımite aparente inferior.
Si est´an presentados con dos decimales se debe restar 0.005. Si est´an con 3 decimales, restaremos 0.0005 y as´ı sucesivamente. Para el caso de los l´ımites reales superiores en vez de restar, sumamos 0.5 o 0.05 o 0.005 seg´un como se presenten los datos.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Paso 5 - Conteo de la Frecuencia Absoluta de cada Clase
La tabla de frecuencias nos queda de la siguiente forma:
i Clase Aparente Clase Real fi fir mi
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5 2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5 3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5 4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5 5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5 6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5 Total 30 1
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Observaci´
on
Se entiende por l´ımite de clase a los n´umeros que aparecen en los extremos de cada clase, con lo cual los l´ımites de la izquierda y de la derecha corresponden a los l´ımites de clase inferior y superior respectivamente.
Al respecto tambi´en se definen los l´ımites de clase aparentes o aproximados y los l´ımites reales o verdaderos de clase.
En los l´ımites aparentes se consideran los valores tal como aparecen en la muestra, esto es, tal como fueron aproximados, ya sea al n´umero entero m´as pr´oximo.
En el caso de los l´ımites reales , estos se determinan de tal modo que reflejen la forma c´omo fueron redondeados los datos, por lo que ´estos siempre contienen como m´ınimo un decimal que termina en cinco.
EYGDD - Unidad No1 : Presentaci´on de Datos C´alculo de Frecuencia seg´un el tipo de Variable
C´alculo de Frecuencias para Variables Cuantitativas Continuas
Ejemplo (Cont.)
Algunas Interpretaciones
X f2= 4 significa que durante cuatro d´ıas el precio aproximado de la libra
de cobre fluctu´o entre los 74 y 77 centavos de d´olar. (Revisando las clases aparentes).
X Viendo las clases reales, podr´ıamos decir que f2= 4 durante 4 d´ıas la
libra de cobre tuvo un precio mayor o igual que los 73.5 centavos de d´olar y menor que 77.5 centavos de d´olar.
X f6r = 301 significa que en la treintava parte de las observaciones el valor
diario del precio de la libra de cobre vari´o entre los 90 y 93 centavos de d´olar.
X En t´erminos porcentuales, se ve que en el f6r% = 301 × 100 = 3.33 por
ciento de las observaciones, el valor diario del precio de la libra de cobre oscil´o entre los 90 y 93 centavos de d´olar. J
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Introducci´
on a los Gr´
aficos
La representaci´on gr´afica de los datos es un complemento que permite apreciar visualmente c´omo se presenta la informaci´on.
Existe una gran variedad de gr´aficos para representar los datos, lo que naturalmente depende del tipo de variable que se est´a estudiando.
EYGDD - Unidad No1 : Presentaci´on de Datos Introducci´on
Tipos de Gr´
afico seg´
un la clasificaci´
on de la variable en
estudio
Dependiendo si la variable que estamos analizando es cualitativa, cuantitativa discreta o cuantitativa continua, tendremos los siguientes tipos de gr´afico:
Tipo de Variable Gr´afico(s) Asociado(s)
Cualitativa Torta, Barra.
Cuantitativa Discreta Varas.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Torta (o Sectorial)
Gr´
afico de Torta
A cada frecuencia porcentual se le asocia un ´angulo de la circunferencia. Si fir% representa la frecuencia porcentual asociada con el i −´esimo valor
de la variable cualitativa, entonces los grados que le corresponden en el gr´afico quedan determinados por la expresi´on
αoi =
fir%
100%× 360
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Torta (o Sectorial)
Gr´
afico de Torta (Cont.)
Por ejemplo
Consideremos la tabla de frecuencias del ejemplo de la nacionalidad de auto extranjero preferido por la gente:
i Marca Frecuencia(fi) Frec. Relativa(fir) f
r i% 1 A 6 6/40 = 3/20 15 2 C 12 12/40 = 3/10 30 3 J 10 10/40 = 1/4 25 4 F 8 8/40 = 1/5 20 5 B 4 4/40 = 1/10 10 Total 40 1 100
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Torta (o Sectorial)
Gr´
afico de Torta (Cont.)
Por ejemplo, para i = 3 (es decir, X = J) le hacemos corresponder αo3= f3r% 100%× 360 o =10025 × 360o = 90o. Para i = 5 tendremos αo5 = f5r% 100%× 360 o = 10 100× 360 o = 36oy as´ı sucesivamente.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Torta (o Sectorial)
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Barras
Gr´
afico de Barras
Est´a formado por una serie de rect´angulos cuyas bases est´an sobre el eje horizontal y cuyas alturas son proporcionales a las frecuencias.
Las dimensiones de las bases de los rect´angulos son arbitrarias pero deben ser iguales.
Los rect´angulos no tienen frontera vertical com´un, pero por convenci´on tienen que estar a una misma distancia.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para variables Cualitativas
Gr´afico de Barras
Gr´
afico de Barras (Cont.)
Ejemplo
Consideremos nuevamente las preferencias por marcas extranjeras de veh´ıculos, de acuerdo a un sondeo realizado a 40 personas que participaron de una muestra.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´afico para Variable Cuantitativa Discreta
Gr´afico de Varas
Gr´
afico de Varas
Consiste en una serie de segmentos de recta situadas sobre el eje horizontal y cuyas longitudes son proporcionales a las frecuencias. Los segmentos de recta tienen forma de varas. De ah´ı el nombre.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´afico para Variable Cuantitativa Discreta
Gr´afico de Varas
Gr´
afico de Varas (Cont.)
Ejemplo
Consideremos la variable X :“N´umero de veh´ıculos que llega a una estaci´on de servicio en intervalos de 5 minutos” que est´a asociada con el ejemplo de construcci´on de tablas de frecuencia para variables cuantitativas discretas. Su gr´afico de varas es el siguiente:
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Histograma
Histograma
El Histograma representa datos que se encuentran agrupados en clases o categor´ıas.
Consiste en una serie de rect´angulos con fronteras verticales comunes, en donde las bases de los rect´angulos son iguales a las amplitudes o anchuras de clase y las alturas son proporcionales a las frecuencias.
Se “parece” a un gr´afico de barras con la diferencia que los rect´angulos van unidos entre s´ı.
Por ejemplo
Consideremos el ejemplo dado para el caso de creaci´on de tablas de frecuencias en variables cuantitativas continuas que estaba relacionado con la variaci´on del precio de la libra de cobre, expresada en centavos de d´olar.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Histograma
Histograma (Cont.)
El histograma asociado con el ejemplo anterior es el que se muestra a continuaci´on:
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Pol´ıgono de Frecuencias
Pol´ıgono de Frecuencias
Proporciona una representaci´on suavizada de un conjunto de valores. Para construir este gr´afico, hay que unir los puntos medios situados sobre los techos de rect´angulos del histograma, en donde tales puntos medios corresponden a las marcas de clase.
El pol´ıgono de frecuencias se completa agregando dos segmentos de recta: uno antes de la primera clase y el otro despu´es de la ´ultima clase asign´andoles artificialmente el valor cero en cada tipo de frecuencia. Esto debido a que “antes” y “despu´es” de recogidos los datos no se registraron observaciones con esos valores.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Pol´ıgono de Frecuencias
Pol´ıgono de Frecuencias
Ejemplo
Considerando el mismo ejemplo de la variaci´on del precio de la libra de cobre en centavos de d´olar, el pol´ıgono de frecuencias ser´ıa el siguiente:
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Ojiva
Ojiva
La Ojiva representa las frecuencias acumuladas y adem´as proporciona una descripci´on visual de c´omo se acumulan los valores de la variable. Los puntos que unen cada uno de los segmentos de recta que forman el pol´ıgono son aquellos que tienen como coordenadas el l´ımite real superior de clase en la abscisa y el valor de la frecuencia acumulada en la
ordenada (que tambi´en puede ser la frecuencia relativa acumulada o la frecuencia porcentual acumulada).
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)
Ejemplo
Construyamos una nueva columna a la tabla de frecuencias del ejemplo de la libra de cobre donde registremos los valores de la frecuencia acumulada:
i Clase Aparente Clase Real fi fir mi Frec. Acum.
1 [70, 73[ [69.5, 73.5[ 7 7/30 71.5 7 2 [74, 77[ [73.5, 77.5[ 4 4/30 = 2/15 75.5 11 3 [78, 81[ [77.5, 81.5[ 10 10/30 = 1/3 79.5 21 4 [82, 85[ [81.5, 85.5[ 6 6/30 = 1/5 83.5 27 5 [86, 89[ [85.5, 89.5[ 2 2/30 = 1/15 87.5 29 6 [90, 93[ [89.5, 93.5[ 1 1/30 91.5 30 Total 30 1
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Ojiva
Ojiva(Cont.)
Ejemplo (Cont.)
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Ojiva
Ojiva (Cont.)
Algunas observaciones
La gracia que tiene este tipo de gr´afico es que permite ver cu´antas observaciones son menores o iguales a un cierto valor especificado. Por ejemplo, a partir de la ojiva exhibida en la l´amina anterior que durante 21 d´ıas el valor del precio de la libra de cobre fue aumentando hasta alcanzar un valor aproximado de 81.5 centavos de d´olar.
EYGDD - Unidad No1 : Presentaci´on de Datos Gr´aficos para Variables Cuantitativas Continuas
Ojiva