Página 1
UNIVERSIDAD DE SAN CARLOS DE GUATEMALAFACULTAD DE CIENCIAS MÉDICAS ÁREA CURRICULAR: INVESTIGACIÓN PRIMER AÑO
U.D BIOESTADISTICA
VARIABLE CUANTITATIVA
La estadística es una herramienta indispensable para la investigación; sin embargo, según mencionan algunos autores, debe tenerse cuidado con su uso para no caer en “abuso” de la información.
A manera de ilustración:
“Según acaba de publicar una reciente estadística, más del 80% de los hombres
obesos del mundo están gordos”.
“Según las últimas estadísticas, de cada tres niños que nacen en el mundo dos
son chinos. Menos en China que son los tres”.
“Según recientes estadísticas, el 99% de los hombres le da una mala reputación
al resto..”
1INTRODUCCION
Antes de enfocarse en la variable cuantitativa, se considera pertinente dar inicio recordando algunas definiciones, como las siguientes:
Variable
Es toda aquella característica que puede ser observable y/o medible; y que toma diferentes valores en diferentes personas, lugares o cosas. Una misma característica puede tomar diferente valor o diferente aspecto al ser observada (o medida) en diferentes poseedores de la misma.
Variable Cualitativa
Son aquellas características que corresponden a cualidades, y por ende no pueden ser medidas, lo que significa que no existe un instrumento de medición que proporcione información sobre la magnitud de la presencia, de la cualidad o característica; ésta solamente puede observarse o ser indagada su presencia o ausencia.
Estas variables únicamente permiten clasificar a los sujetos de estudio, dependiendo de la existencia o ausencia del atributo o característica. También son denominadas categóricas.
Variable Cuantitativa
Son aquellas características factibles de medición, existe un instrumento o una forma establecida para registrar la información. Se clasifican en discreta y continua.
También son conocidas como variables numéricas
1 http://www.makmakmak.com/6-CURiOSiDADES/LiNK.php?Id=126
DOCUMENTO ELABORADO POR ARQ. SONIA NINETH LUARCA GIL
Página 2
Cuantitativa Discreta: Es aquella que toma un único valor dentro de dos valores dados permitiendo salto o interrupciones que indican ausencia de valores. Ejemplo: el numero de hijos, el numero de latidos del corazón (frecuencia cardiaca), etc. Ya que no se pude decir que una pareja tiene 2 ½ hijos, o que un paciente tiene 60.2 latidos por minuto.
Cuantitativa Continua: Es la que puede tomar cualquier valor dentro de dos valores dados: Ejemplo: estatura, edad, peso, glicemia, acido úrico, etc. Si se tomaran dos valores de estatura 156 cm a 157 cm y se contara con los recursos apropiados: tiempo, instrumentos precisos y disposición de los sujetos de estudio; sería factible encontrar todos los valores de estatura posibles entre ambos.
Es importante hacer notar que generalmente las variables de naturaleza continua por comodidad en su manejo suelen trabajarse en forma discreta, por ejemplo, si a una persona se le pregunta su edad responde que tiene 20 años, aunque en realidad puede tener 20 años con 6 meses, con 2 semanas, 5 días, 10 horas, 10 minutos, 10 segundos ….etc.
ESCALAS DE MEDICIÓN:
Las variables de naturaleza cuantitativa son medidas en escala de intervalo o de razón; aunque en algunos casos, por objetivos de la investigación, puede “bajarse” de nivel a la variable, y medirla en escala ordinal o nominal; por ejemplo la edad sabemos que por naturaleza es una variable cuantitativa continua, por lo que su escala de medición es la de razón porque el cero es absoluto, indica ausencia de valor, sin embargo, en una determinada investigación se podría plantear la edad de los sujetos de estudios de la siguiente forma:
(< de 5 años) (15 a 18 años) (19 a 40 años) (70 años y más)
En éste caso, se estaría utilizando una escala ordinal.
A continuación se presenta en síntesis, las escalas de medición y sus características:
Escala de Medición Características de la escala
NOMINAL Nombra, Clasifica, es exhaustiva y mutuamente excluyente.
ORDINAL Nombra, Ordena, Jerarquiza, Clasifica por rango de acuerdo a algún criterio establecido (por el investigador o ya existente)
DE INTERVALO Nombra, Ordena, Jerarquiza, Determina espaciamientos o intervalos entre un valor y otro, el cero es arbitrario o relativo (no indica ausencia de valor)
Página 3
Organización y presentación de datos
para la variable cuantitativa
Luego de recopilar la información es muy importante su ordenamiento y presentación. Para presentar la información en forma tabular, se trabajarán dos formas:
a) Arreglo ordenado ó serie simple.
b) Distribución en intervalos de clase, para presentarlos seguidamente en tablas y/o graficas.
ARREGLO ORDENADO Ó SERIE SIMPLE:
Es la manera más sencilla de ordenar la información y consiste en un ordenamiento de los datos, de menor a mayor (ascendente) ó de mayor a menor (descendente), presentado en tablas ó cuadros, disponiendo el número de columnas adecuado, según estética y simetría, para enlistar los datos. Al tratarse de una tabla de presentación, debe cumplir con todos los requisitos correspondientes.
Al presentar la información en una serie simple, los datos no pierden su individualidad, es decir, se cuenta con la información directa (tal como se obtuvo), para cálculos y análisis. Es aconsejable utilizar esta presentación cuando se tiene menos de 30 datos. Como toda presentación tabular debe incluir número, título y fuente. Ejemplo:
CUADRO No. 1
NOTAS DEL PRIMER PARCIAL DE ESTADISTICA, DE UN GRUPO DE ESTUDIANTES DE PRIMER AÑO DE LA FACULTAD DE CIENCIAS MEDICAS DE LA USAC.
GUATEMALA, MARZO DE 2012
Notas (puntos) 0.72
1.44 1.60 1.80 2.16 2.16 2.88 3.60
3.60 4.32 4.32 4.32 4.68 4.68 5.40 5.40
5.76 6.12 6.48 7.20 7.56 7.56 8.28 8.64
Fuente: notas proporcionadas por la unidad de evaluación. Nota: El 1er. La ponderación del 1er. parcial fue de 9 puntos.
DISTRIBUCIÓN EN CLASES O INTERVALOS DE CLASE:
Este tipo de presentación es aconsejable utilizarla a partir de 30 datos. La presentación consiste en agrupar los datos en clases o intervalos; acompañados de sus respectivas frecuencias.
Página 4
1º. Rango, Recorrido o Amplitud de la variable: es necesario escudriñar los datos porque se
requiere de la amplitud que exista entre ellos. La amplitud de la variable no es más que la diferencia existente entre el valor más bajo (XS) y el valor más alto (XL). Su símbolo es una “R”
R = XL- XS
2º. No. de clases o intervalos: El cálculo de la cantidad de intervalos a utilizar se realiza en función
del total de elementos o sujetos en la distribución, ya sea una población (N) o bien una muestra (n), apoyándose en la fórmula de Sturgess. Su símbolo es una “K”
K = 1 + 3.322 X (log N)
Los valores 1 y 3.322 son constantes en la fórmula.
3º. Amplitud de los intervalos o clases: Para calcular la amplitud que deberán tener los intervalos
se requiere de los resultados obtenidos en los dos pasos anteriores, utilizando la siguiente fórmula: (Su símbolo es una “i”)
i = R / K (Amplitud de la variable / No. de Clases)
Límites de clase:
Luego de haber calculado el No. de clases y la amplitud de las mismas, se procede a la elaboración de los intervalos (o clases). Es recomendable iniciar con el valor más bajo de los datos observados; para continuar se va sumando la amplitud de intervalo calculada ( i ) para ir formando las clases.
Límites aparentes:
Se dice que los límites de una clase son aparentes cuando éstos no permiten espacio entre un límite y otro; los intervalos han sido elaborados en forma continua. Ejemplo:
Estatura (cms) No. de Ptes.
150 – 155 5
155 – 160 3
160 – 165 6
165 – 170 7
Al colocar sobre una recta los valores de los límites de las clases, se puede evidenciar la continuidad de la variable.
1ª. Clase 2ª.Clase 3ª. Clase 4ª. Clase
150 155 160 165 170
Página 5
Cuando se elaboran los intervalos en forma continua y se procede a la tabulación de los datos, surge la duda de que, por ejemplo, si se tiene una estatura de 155 cm, ¿en dónde se colocará, si en la 1ª. o en la 2ª. Clase? En virtud de que los límites son aparentes, el valor 155 aparentemente es límite superior de la 1ª. Clase, sin embargo, la primera clase contendrá datos desde 150 hasta 154.9999…; por lo que el valor de 155 cm deberá ser tabulado en el 2º. Intervalo.
Límites absolutos:
Cuando los intervalos son elaborados en forma discreta, los límites permiten espacio entre una clase y otra, con ello se evidencia la discreción de la variable y los límites son denominados absolutos. Ejemplo:
Edad (años) No. de Ptes.
15 – 19 8
20 – 24 10
25 – 29 6
30 – 34 5
Nota: La variable edad es de naturaleza continua pero para el ejemplo y por lo general se trabaja en forma discreta.
Si también estos límites son colocamos sobre una recta tenemos:
15 19 20 24 25 29 30 34
Límites reales (LR):
Si los intervalos han sido elaborados en forma discreta y se requiere continuidad en los mismos, se procede entonces a calcular límites reales
Su cálculo es sencillo y consiste en aplicar la siguiente fórmula:
LR= LS ( i ) + L I (i + 1)
2
LS ( i ) : límite superior de la clase (i )
L I (i + 1) : límite inferior de la clase siguiente (i+1)
Ejemplo:
Edad (años) No. de Ptes.
15 – 19 8
20 – 24 10
25 – 29 6
30 – 34 5
Cálculo de límites reales:
L. R. = 19 + 20 = 19. 5 L. R. = 24 + 25 = 24.5 L. R. = 29 + 30 = 29.5
Página 6
Edad (años) f
14.5 – 19.5 8
19.5 – 24.5 10
24.5 – 29.5 6
29.5 – 34.5 5
Colocando los límites sobre la recta tenemos:
Límites absolutos
15 19 20 24 25 29 30 34
14.5 19.5 24.5 29.5 34.5
Límites reales
En cuanto a la amplitud de cada clase o intervalo, ésta puede ser constante o variable.
Intervalos de amplitud constantes:
Se llama así porque la separación o distancia entre límite inferior y superior de cada clase es siempre el mismo. Ejemplo:
Peso (lbs) f Limites Reales
10 – 19 5 9.5 – 19.5
20 – 29 6 19.5 – 29.5
30 – 39 10 29.5 – 39.5
40 – 49 6 39.5 – 49.5
Para comprobar si la amplitud es la misma, se pueden utilizar los límites reales los cuales se pueden restar en cualquier sentido, dando el mismo resultado.
Intervalos de amplitud variable:
Se dice que en una distribución los intervalos son de amplitud variable cuando la distancia entre límite inferior y límite superior varía de una clase a otra.
Este tipo de amplitud se utiliza cuando los valores de la distribución que se está estudiando están muy dispersos, por lo que al agruparlos con intervalos constantes, algunos quedarían con frecuencia de cero; si no es importante evidenciar esta ausencia de valores se opta por utilizar intervalos de diferente amplitud.
En los cálculos estadísticos es conveniente revisar, sobre todo, si habrá necesidad de utilizar las marcas de clase. Ejemplo:
Página 7
Edad (años) No. ptes. mc
5 - 9 10 7
10 - 14 5 12
15 - 19 0 17
20 - 24 0 22
25 - 29 8 27
30 - 34 15 32
35 - 39 0 37
40 - 44 12 42
Edad (años) No. Ptes. mc
5-9 10 7
10-14 5 12
15-29 8 22
30-34 15 32
35-44 12 39.5
Página 8
EJEMPLO:
Con los siguientes datos elaborar una distribución agrupada en intervalos de clase.
Se cuenta con el nivel de glucosa en sangre de 60 niños que asistieron a control de niño sano, durante el mes de enero, a la clínica familiar “Santa Marta” de la Universidad de San Carlos de Guatemala. (Los datos son hipotéticos, con fines de estudio).
56 61 55 62 55 64 73 68 71 72 79 81
60 57 61 67 67 68 66 65 60 65 55 66
65 72 65 68 62 75 75 72 73 73 68 73
66 61 69 72 68 81 69 74 74 68 65 67
69 64 66 65 58 65 65 67 56 67 63 63
1) La amplitud de la variable
R = XL – XS
R = 81 – 55
R = 26
2) No. de clases
K = 1 + 3.322 (log N)
K=1 + 3.322 X (log 60)
K = 1 + 3.322 X 1.77815125
K = 1 + 5.907018454 = 6.907018454 K≈ 7
K = 7 El número de clases se aproxima al entero siguiente (aunque no aplique la regla de aproximación) porque no se puede colocar 6 intervalos completos y 0.9 del siguiente intervalo.
3) La amplitud del intervalo
i = R
K
i = 26 = 3.714285714 ≈ 4 7
i = 4 Se deben aplicar las
reglas de aproximación.
La aproximación de la amplitud de clase quedará a criterio del investigador ya que será él quien decidirá si desea evidenciar la naturaleza de la variable (si es continua), trabajando con decimales o bien puede eliminarlos, para evitar la complejidad que los decimales pudieran causar.
Página 9
Frecuencia Absoluta:
Es el número de veces que aparece un determinado valor. Se simboliza con una f o fi. La suma de las frecuencias absolutas da como resultado el total de datos que corresponde al tamaño de la muestra (n) o de la población (N) que se estudia.
Frecuencia relativa:
Es el cociente entre una frecuencia absoluta y el número total de los datos. Se simboliza con una fr. Una frecuencia relativa es una proporción, porque expresa la relación que hay entre una parte y el todo. La frecuencia relativa también puede multiplicarse por 100 para expresarla en porcentaje.
Frecuencia acumulada:
Es la suma acumulativa, de las frecuencias absolutas . Se simboliza con una fa.
Marca de clase: Mc, Xi, Pm
Se conoce también como punto medio, es el valor que representa a cada clase y se localiza justo al centro del intervalo, de allí su nombre; su cálculo es muy sencillo ya que es igual a la suma de los límites ya sean reales o aparentes de cada clase, dividido dentro de 2.
Mc = LI (i) + LS (i) 2
Mc = marca de clase
LI (i) = límite inferior de la clase (i).
LS (i) = límite superior de la clase (i).
Tabla de trabajo
Nivel de glucosa Recuento,
conteo o
tabulación
f
fa
Límites Reales
m
Cfr
fra
55
-
58
IIII II
7
7
54.5 - 58.5 56.5 0.12
0.12
59
-
62
IIII II
7
14
58.5 - 62.5 60.5 0.12
0.24
63
-
66
IIII IIII IIII I 16
30
62.5 - 66.5 64.5 0.27
0.51
67
-
70
IIII IIII IIII
14
44
66.5 - 70.5 68.5 0.23
0.74
71
-
74
IIII IIII I
11
55
70.5 - 74.5 72.5 0.18
0.92
75
-
78
II
2
57
74.5 - 78.5 76.5 0.03
0.95
79
-
82
III
3
60
78.5 - 82.5 80.5 0.05
1.00
Página 10
CUADRO No. 3
NIVEL DE GLUCOSA DE 60 NIÑOS
DE LA CLÍNICA FAMILIAR “SANTA MARTA”, DE LA USAC. GUATEMALA FEBRERO, 2012
Nivel de Glucosa No. Niños
55 – 58 7
59 – 62 7
63 – 66 16
67 – 70 14
71 – 74 11
75 – 78 2
79 – 82 3
TOTAL 60
Fuente: Datos hipotéticos con fines de estudio
El cuadro No. 3 es el cuadro de presentación para los datos de glucosa de los 60 niños. Sin embargo, la tabulación de los datos debe hacerse en un cuadro separado, no debe incluirse en el cuadro de presentación. Al cuadro de presentación se le puede agregar en otra columna, los porcentajes o frecuencias relativas, según objetivos del investigador.
Presentación gráfica
para datos de la variable cuantitativa
Los cuadros o tablas proporcionan información importante; pero un análisis visual ayuda a comprender más fácilmente la información que desea transmitirse. Los tipos de gráfica más comunes para representar variable cuantitativa son tres:
1) Histograma.
2) Polígono de frecuencias.
3) Ojiva.
Histograma:
Es una gráfica que consiste en una serie de rectángulos unidos, que tienen su base sobre un eje horizontal (eje X), cuyo ancho está determinado por la amplitud del intervalo de clase (datos de la variable en estudio) y su altura dependerá de las frecuencias (absolutas, relativas, o porcentajes). Para construir un histograma es necesario utilizar los límites reales en el eje X, porque al dibujar los rectángulos, estos deben estar unidos uno junto al otro.
Si los datos de la variable que se va a graficar no inician en cero, deberá indicarse sobre el eje X, dibujando una línea de corte. En el eje Y, no se recomienda hacer lo mismo, porque distorsiona la magnitud de los rectángulos en la gráfica.
Página 11
CUADRO No. 4
EDAD DE PACIENTES DE LA CLÍNICA MÉDICA IXIMCHÉ GUATEMALA ENERO, 2012
Edad (años) No. Pacientes
10 – 19 10
20 – 29 18
30 – 39 10
40 – 49 13
50 – 59 4
60 – 69 5
70 – 79 2
TOTAL 62
Fuente: Datos hipotéticos
Para elaborar un histograma, se tomarán los datos del cuadro No. 4 como ejemplo.
Datos para dibujar la gráfica.
X Edad (años)
f Limites Reales
10 – 19 10 9.5 – 19.5
20 – 29 18 19.5 – 29.5
30 – 39 10 29.5 – 39.5
40 – 49 13 39.5 – 49.5
50 – 59 4 49.5 – 59.5
60 – 69 5 59.5 – 69.5
70 – 79 2 69.5 – 79.5
TOTAL 62
En el Eje “X” (abcisa), deberá colocarse los datos de la variable, representados por los límites reales.
Página 12
GRÁFICA No. 1 EDAD DE PACIENTES
CLÍNICA MÉDICA IXIMCHÉ, GUATEMALA ENERO, 2012
0 2 4 6 8 10 12 14 16 18 20
N
o
.
d
e
P
a
c
ie
n
te
s
Fuente: Datos del cuadro No. 4
Polígono de frecuencias:
Es una gráfica de línea. Para su construcción se utilizan las marcas de clase (datos de la variable en estudio) sobre el eje " X " (abcisa) y las frecuencias (absolutas, relativas o porcentajes) en el eje "Y " (ordenada), se localiza para cada marca de clase su respectiva frecuencia, señalándolo con un punto. Para cerrar el polígono se calculan las marcas de clase anterior y posterior de la distribución y se cierra con línea punteada, los puntos se unen con segmentos de línea recta continua.
Datos para la construcción del polígono:
Edad (años) f mc
10 – 19 10 14.5
20 – 29 18 24.5
30 – 39 10 34.5
40 – 49 13 44.5
50 – 59 4 54.5
60 – 69 5 64.5
70 – 79 2 74.5
TOTAL 62
9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5
Página 13
GRAFIACA NO. 2
EDAD DE PACIENTES, CLINICA MÉDICA IXIMCHÉ GUATEMALA ENERO, 2012
0 2 4 6 8 10 12 14 16 18 20
Edad en años
N
o.
de
pa
c
ie
nt
e
s
4.5 14.5 24.5 34.5 44.5 54.5 64.5 74.5 84.5
Fuente: Datos del cuadro No. 4
Ojiva de Galton:
Se le llama también polígono de frecuencias acumuladas y es una gráfica de línea que muestra las frecuencias acumuladas y es útil para analizar en un punto determinado cuantos elementos están arriba o debajo de un valor determinado.
Para su construcción se usan los limites reales (datos de la variable) sobre el eje “X” y las frecuencias acumuladas (pueden ser las absolutas, relativas o los porcentajes), en el eje “Y”. Como toda grafica debe cumplir con número, titulo y fuente.
Datos para la construcción de una ojiva:
Edad (años) f fa Limites Reales
10 – 19 10 10 9.5 -19.5
20 – 29 18 29 19.5 - 29.5
30 – 39 10 39 29.5 - 39.5
40 – 49 13 52 39.5 - 49.5
50 – 59 4 56 49.5 - 59.5
60 – 69 5 60 59.5 - 69.5
70 – 79 2 62 69.5 - 79.5
TOTAL 62
Página 14
GRÁFICA No. 3
EDAD DE PACIENTES CLÍNICA MÉDICA IXIMCHÉ GUATEMALA, FEBRERO DEL 2013
Fuente: Datos del cuadro No. 4
EJERCICIO:
A continuación encontrarás las notas obtenidas en el 1º. y 2º. Parciales de Estadística,
por un grupo de estudiantes de primer año de nuestra Facultad. Las notas son reales.
Se sugiere que una vez leído el documento, utilices estos datos para poner en práctica los
conocimientos adquiridos.
Notas obtenidas en el 1er. Parcial (9 ptos)
Ciclo 2013 Dra. Oly de Higueros
Notas obtenidas en el 2o. Parcial (12 ptos)
Ciclo 2013 Dra. Oly de Higueros
6.48 6.84 4.68 6.12 6.48
6.12 6.84 2.88 2.88 5.04
5.4 4.32 2.88 5.76 5.04
5.76 6.84 2.52 2.88 5.04
2.16 2.88 3.24 3.24 2.88
5.04 1.08 5.4 5.04 5.04
5.04 4.32 4.32 6.84 4.32
5.04 4.32 7.56 3.96 3.24
6.48 6.12 5.76 4.32 3.96
6.12 4.32 3.6 2.52 7.2
5.04 6.12 3.6 4.32 5.4
4.32 2.88 6.84 2.88 3.24
5.4 3.24 7.2 3.96 4.68
5.04 6.48 6.84 2.16 3.24
6.12 5.04 6.12 5.76 7.2
3.6 4.68 4.68 3.96 3.96
7.92 2.88 5.4 6.48 4.68
6.48 3.24 4.68 5.04 5.04
4.8 11.52 4.8 8.16 6.24
5.28 8.64 3.84 5.28 9.6
7.2 5.76 0.96 11.04 4.32
9.6 5.76 4.8 6.24 5.28
9.6 5.76 8.16 3.84 6.72
9.12 3.84 7.2 5.28 6.24
5.28 4.32 7.68 9.12 4.8
8.16 6.24 10.56 5.76 8.64
7.2 7.68 6.24 8.64 5.76
9.6 7.2 7.68 5.76 7.2
4.32 7.2 3.84 5.76 5.76
4.8 8.16 7.2 3.84 5.28
8.64 5.76 11.52 9.6 7.68
7.68 9.12 9.12 5.76 4.32
10.56 10.56 6.24 9.12 7.2
4.8 3.84 8.64 9.12 9.6
5.76 8.64 5.28 9.12 7.68
7.68 3.36 9.6 6.24 7.2
No. de pacientes