EXPRESIÓN Y ANÁLISIS DE
DATOS
Análisis de datos
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población
.Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
Vigilancia Epidemiológica
Recolección Expresión y Análisis Interpretación DiseminaciónConceptos básicos
Población:
Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta característica.
Al número de integrantes de la población se llama
tamaño de la población y se representa con la
Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al realizar la medición de una variable en los
elementos de una población.
Muestra:
Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible. El número de individuos que integran la muestra, llamado tamaño de la muestra se representa con la letra n.
Individuo:
Es el elemento de la población o de la muestra que aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos que se desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado, o cambia o varía de elemento a elemento.
Dato:
Valor que se obtiene al realizar la medición de la característica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados. La naturaleza de los datos pueden ser datos
Expresan distintas cualidades, características o
modalidad
Cada modalidad que se presenta se denomina atributo o categoría
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no,
hombre y mujer o ser politómicas cuando pueden adquirir
tres o más valores
Datos Cualitativos (categorías):
Se obtienen al calificar la característica en cuestión como el sexo, estado civil, grado máximo de
estudios.
Variable cualitativa nominal En esta variable los valores no pueden ser
sometidos a un criterio de orden, como por ejemplo los colores
Variable cualitativa ordinal o variable casi cuantitativa La variable puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el intervalo entre mediciones sea uniforme, por ejemplo:
Datos Cuantitativos (números):
Valores obtenidos al medir peso, estatura, temperatura, número de hijos.
Son las variables que toman como argumento
En la variable CUANTITATIVA se pueden distinguir dos tipos: continua y discreta.
Variable Continua:
Si la variable puede tomar cualquier número real entre dos valores dados (decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar números enteros.
Qué es la Expresión de Datos?
?
Expresión
Declaración con palabras u otros signos de algo para darlo a entenderDatos
Información amplia o concreta que permite una deducciónTipos de Expresión
•Tablas
De Frecuencia Absoluta De Frecuencia Acumulada•Gráficas
Gráfico de Barras Gráfico Circular Histograma y Polígono de frecuenciasOrden de datos
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se establece un orden (ascendente o descendente) entre ellos.
Hay dos métodos comunes:
• Listado en orden ascendente • Método de tallo y hojas
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg)
42 40 48 51 49 56 44 43 55 52 52 62 44 50 59 63 50 56 55 45 57 66 63 51 58
Peso de 25 estudiantes (en kg)
40 42 43 44 44 45 48 49 50 50 51 51 52 52 55 55 56 56 57 58 59 62 63 63 66
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.
Datos sin ordenar: Datos ordenados: 4 5 6 4 5 6 0,2,3,4,4,5,8,9 0,0,1,1,2,2,5,5,6,6,7,8,9 2,3,3,6
Peso de 25 estudiantes (en kg)
42 40 48 51 49 56 44 43 55 52 52 62 44 50 59 63 50 56 55 45 57 66 63 51 58 2,0,8,9,4,3,4,5 1,6,5,2,2,0,9,0,6,5,7,1,8 2,3,6,3
Medidas resumen
Cuando los datos son cuantitativos, las
observaciones individuales se corresponden con cantidades numéricas y resulta conveniente complementar la distribución de frecuencias con algunas medidas resumen:
Tendencia central o centralización (medias, mediana y
moda),que indican el valor medio de los datos.
Medidas de dispersión (desviación típica y coeficiente
Caso de variables cualitatitivas
El procedimiento es:
Se identifican todos los valores diferentes y se
acomodan en columna.
Se agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces que aparece el valor dado.
rosa azul blanco azul rosa gris blanco café negro blanco rosa azul café blanco blanco gris azul blanco rosa gris gris blanco café negro verde
Color Frecuencia Azul Blanco Café Gris Negro Rosa Verde I I I I I I I I I I I I I I I I I I I I I I I I
Considera que la variable de estudio es el color de playera de 25 estudiantes.
Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores
x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
La frecuencia es el número de veces que aparece
cada dato.
Hay dos clases de tablas de frecuencias:
Para datos NO agrupados. Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40 42 43 44 44 45 48 49 50 50 51 51 52 52 55 55 56 56 57 58 59 62 63 63 66 xi f 40 42 43 44 45 48 49 50 51 xi f 52 55 56 57 58 59 62 63 66 Total 1 1 1 2 1 1 1 2 2 2 2 2 1 1 1 1 2 1 25
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “fr” y la de la frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato dado.
Ejemplo
xi f fr fa 40 1 42 1 43 1 44 2 45 1 48 1 49 1 50 2 51 2 xi f fr fa 52 2 55 2 56 2 57 1 58 1 59 1 62 1 63 2 66 1 Total 25 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.04 0.08 0.08 0.08 0.08 0.08 0.08 0.08 1/25 2/25 1 2 3 5 6 7 8 10 12 14 16 18 19 20 21 22 24 25 1 Siempre es el número total Siempre es 1Intervalo de clase
En ocasiones es conveniente acomodar los
datos en pequeños grupos de igual tamaño,
llamados
intervalos de clase.
El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase = Límite inferior + límite superior
2
Ejemplo
Intervalo de clase Punto medio “xi”
38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 63 – 67 65
Límite inferior Límite superior Lím inf + Lim sup 2
Tabla de distribución de
frecuencias para datos agrupados
Se elabora con los intervalos de clase, sus puntos
medios y las frecuencias correspondientes para cada uno de los intervalos.
xi f 40 1 42 1 43 1 44 2 45 1 48 1 49 1 50 2 51 2 52 2 55 2 56 2 57 1 58 1 59 1 62 1 63 2 66 1 Total 25 Datos sin ag rupar Intervalo de clase Punto medio “xi” f 38 – 42 40 43 – 47 45 48 – 52 50 53 – 57 55 58 – 62 60 63 - 67 65 Total Datos agrupados 2 4 8 5 3 3 25
Se agregan las columnas de frecuencia relativa “fr”
y frecuencia acumulada “fa”:
Intervalo de clase Punto medio “xi” f fr Fa 38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 63- 67 65 3 Total 25 0.08 0.16 0.32 0.20 0.12 0.12 1 2 6 14 19 22 25 2/25 4/25 8/25
Por último se agregan las columnas:
Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales acumuladas a un dato dado.
Tablas de frecuencias absoluta,
relativa y acumulada
Intervalo de clase Punto medio “xi” f fr f% fa fra f%a 38 – 42 40 2 0.08 2 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 63- 67 65 3 0.12 25 Total 25 1 8 16 32 20 12 12 100 0.08 0.24 0.56 0.76 0.88 1 8 24 56 76 88 100 0.08 x 100 2/25 0.08 x 100Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
Polígono de Frecuencias
Histograma
Otros gráficos:
Gráfica de barras
Pictograma
Polígono de Frecuencias
Es la representación mediante un gráfico de
línea. En él se muestra la distribución de
frecuencias y está formado por segmentos de
línea que unen los puntos correspondientes a la
frecuencia de cada una de las clases.
El eje “x” representa el dato “xi”
Ejemplo
Intervalo de clase Punto medio “xi” f 38 – 42 40 2 43 – 47 45 4 48 – 52 50 8 53 – 57 55 5 58 – 62 60 3 63 - 67 65 3 Total 25 0 1 2 3 4 5 6 7 8 9 35 40 45 50 55 60 65 70 f xi Polígono de Frecuencias El eje “y” puede ser sustituido por las frecuencias relativas o porcentuales. 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 35 40 45 50 55 60 65 70 fr xi
Polígono de Frecuencia Relativa
0 5 10 15 20 25 30 35 35 40 45 50 55 60 65 % f xi
Histograma
Es la representación gráfica de
los datos mediante una sucesión
de rectángulos.
Está formado por rectángulos cuya anchura
representa a cada uno de los intervalos y la
altura corresponde a la frecuencia.
Pirámide Poblacional
Una variante en el histograma es colocar en el
eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
Es la representación gráfica de las frecuencias
acumuladas mediante un gráfico de línea. Se
muestra la distribución de frecuencias
acumuladas de los datos.
En el eje “x” estarán los puntos medios y en el
Ejemplo
0 2 6 14 19 22 25 0 5 10 15 20 25 30 35 40 45 50 55 60 65 fa xi Ojiva Interval o de clase Punto medio “xi” f fr fa 38 – 42 40 2 0.08 2 43 – 47 45 4 0.16 6 48 – 52 50 8 0.32 14 53 – 57 55 5 0.20 19 58 – 62 60 3 0.12 22 63- 67 65 3 0.12 25 Total 25 1Gráfico Circular
También es llamado gráfico de pastel.
Sólo se representan datos de frecuencias relativas
o frecuencias porcentuales.
Se debe dividir el área del círculo de manera
proporcional a las frecuencias.
13% 17% 57% 13% PERRO PAJARO HAMSTER GATO
Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados que
corresponde a cada intervalo.
Ejemplo 1
Intervalo de clase Punto medio “xi” f fr (fr ) (360°) 38 – 42 40 2 0.08 43 – 47 45 4 0.16 48 – 52 50 8 0.32 53 – 57 55 5 0.20 58 – 62 60 3 0.12 63- 67 65 3 0.12 Total 25 1 28.8° 0.08 x 360° 0.16 x 360° 57.6° 115.2° 72° 43.2° 43.2° 360°40 8% 45 16% 50 32% 55 20% 60 12% 65 12% Gráfico Circular
Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos.
8 11 8
3 3 6
11
Pictograma
Similar al de barras, sólo que se sustituyen por
figuras, generalmente relacionadas con la variable estudiada.
ANáLISIS
DE DATOS
¿Qué es análisis?
Distinción y separación de las partes de un todo hasta llegar a conocer
los principios o elementos de este.
¿Qué es el análisis de datos?
El análisis de datos es un proceso de
inspeccionar, limpiar y transformar datos con el objetivo de resaltar información útil, lo que
sugiere conclusiones, y apoyo a la toma de decisiones.
Tipos de análisis de datos
Metodología Cualitativas Metodología Cuantitativas
Metodología cualitativa
Tiene como objetivo la descripción de las cualidades de un fenómeno. Busca un concepto que pueda abarcar una parte de la realidad.
No se trata de probar o de medir en qué grado una cierta cualidad se encuentra en un cierto acontecimiento dado, sino de descubrir tantas cualidades como sea posible.
Características principales de la
metodología cualitativa
Es inductiva.
Tiene una perspectiva holística.
Se trata de estudios en pequeña escala.
Hace énfasis en la validez de las investigaciones a través de la proximidad a la realidad empírica que brinda esta metodología.
Características principales de la
metodología cualitativa
No tiene reglas de procedimiento. La base está en la intuición.
En general no permite un análisis estadístico.
Se pueden incorporar hallazgos que no se habían previsto.
Los investigadores cualitativos participan en la investigación a través de la interacción con los sujetos que estudian, es el
instrumento de medida.
Analizan y comprenden a los sujetos y fenómenos desde la
perspectiva de los dos últimos; debe eliminar o apartar sus prejuicios y creencias.
Metodología cuantitativa
La Metodología Cuantitativa es aquella que permite examinar los datos de manera numérica, especialmente en el campo de la estadística.
Características principales de la
metodología cuantitativo
La objetividad es la única forma de alcanzar el conocimiento. El objeto de estudio es el elemento singular Empírico.
La teoría es el elemento fundamental de la investigación social. Comprensión explicativa y predicativa de la realidad, bajo una concepción objetiva, unitaria, estática y reduccionista.
Concepción lineal de la investigación a través de una estrategia deductiva.
Diferencias entre investigación cualitativa y cuantitativa
Investigación cualitativa Investigación cuantitativa
Centrada en la fenomenología y comprensión
Basada en la inducción probabilística del positivismo lógico
Observación naturista sin control Medición penetrante y controlada
Subjetiva Objetiva
Inferencias de sus datos Inferencias más allá de los datos Exploratoria, inductiva y
descriptiva
Confirmatoria, inferencial, deductiva Orientada al proceso Orientada al resultado
Datos "ricos y profundos" Datos "sólidos y repetibles" No generalizable Generalizable
Holista Particularista
Ventajas e inconvenientes de los métodos cualitativos vs cuantitativos.
Métodos cualitativos Métodos cuantitativos
Propensión a "comunicarse con" los sujetos del estudio
Propensión a "servirse de" los sujetos del estudio
Se limita a preguntar Se limita a responder Comunicación más horizontal...
entre el investigador y los
investigados... mayor naturalidad y habilidad de estudiar los factores sociales en un escenario natural Son fuertes en términos de validez interna, pero son débiles en validez externa, lo que encuentran no es generalizable a la población
Son débiles en términos de validez interna -casi nunca sabemos si miden lo que quieren medir-, pero son
fuertes en validez externa, lo que encuentran es generalizable a la población
Preguntan a los cuantitativos: ¿Cuan particularizables son los hallazgos?
Preguntan a los cualitativos: ¿Son generalizables tus hallazgos?
Inferencia estadistica
Estadística Inferencial se refiere al proceso de
lograr generalizaciones acerca de las propiedades del todo, población, partiendo de lo específico,
muestra
la Inferencia distingue:
la Estimación
Hipótesis
Las pruebas de hipótesis son reglas objetivas que
nos permiten rechazar o no una hipótesis planteada de antemano sobre la población usando la
información contenida en la muestra.
Los componentes de una prueba de hipótesis son: la
hipótesis nula (H0), la hipótesis alternativa (H1), el error de tipo I o error α, el error de tipo II o error β, el grado de significación o valor p y la potencia de la prueba.
¿Qué análisis de los datos pueden
efectuarse?
Los análisis que vayamos a practicar a los datos dependen de tres factores:
a. El nivel de medición de las variables
b. La manera como se hayan formulado las hipótesis c. El interés del investigador.
Usualmente el investigador busca, en primer
término describir sus datos y posteriormente efectuar análisis estadístico para relacionar sus variables. Es decir, realiza análisis de estadística descriptiva para cada una de sus variables y luego describe la relación entre éstas.
Los tipos o métodos de análisis son variados
y pero cabe señalar que el análisis no es indiscriminado, cada método tiene su razón de ser y un propósito especifico, no deben hacerse más análisis de los necesarios.
La estadística no es un fin es sí misma, es
Los principales análisis que pueden efectuarse son:
• Estadísticas descriptivas para las variables,
tomadas individualmente
• Puntuaciones “Z” • Razones y tasas
• Cálculos y razonamientos de estadísticas
inferencia
• Pruebas paramétricas • Pruebas no paramétricas • Análisis multivariados
Cuando un determinado resultado es diferente del esperado, esto puede deberse a tres posibilidades:
1. Que sea debido a la existencia de fuente de
error al momento de la recolección o procesamiento de la información.
2. Hasta cierto limite, es posible explicar, la
diferencia obtenida por razones de azar. Para conocer si es explicable por el azar, se utilizan métodos estadísticos diseñados para tal fin.
3. Que la diferencia encontrada sea real. A esta
determinación se llega por exclusión de las otras dos posibilidades.
Por tanto, para aceptar la negación de las
hipótesis y considerar los resultados como reales, debemos descartar las posibles fuentes de error y el azar, esto nos permite poder identificar nuevas hipótesis que sean punto de partida para nuevos estudios.
Es importante tener presente que a partir
del momento en que obtenemos los
resultados, pasamos nuevamente a un
trabajo donde predominan los aspectos teóricos y metodológicos que conforman un solo momento que incluyen tres nuevas etapas que se explican a continuación.
1.Discusión de los resultados
Una vez obtenidos los resultados del trabajo, llegamos a una etapa de discusión.
Como se puede observar, en este momento recurrimos a la teoría para la interpretación de los resultados obtenidos encaminados a la obtención de las conclusiones.
Hacemos énfasis en que el abordaje teórico debe ser el mismo señalado al inicio (marco teórico) y que sirvió de base para determinar las unidades de análisis, las variables, sus respectivos valores y relaciones, las hipótesis y los principios o conceptos básicos que constituirán nuestros puntos de partida para la discusión de los resultados obtenidos.
La descripción de los resultados deberá agruparse en función de los objetivos específicos de la investigación, en cambio, para la discusión de los mismos, la teoría juega un papel fundamental abordándose en forma global.
De acuerdo a este esquema la Discusión de los resultados se ordena por EJES DE DISCUSION, cada eje conlleva a la interpretación de un grupo de resultados a partir de criterios teóricos de referencia, lo cual da lugar al establecimiento de valoraciones correspondientes orientadas al Objetivo General de la Investigación.
2. Conclusiones
Las conclusiones serán una síntesis obtenido de la discusión de los resultados a partir del abordaje teórico en que se basa el estudio y deberán encaminarse a dar respuesta al problema planteado de acuerdo a lo expresado en el objetivo general.
Deberá tenerse cuidado en que los argumentos que fundamentan las conclusiones están contenidos en la discusión de los resultados, éstos tienen una orientación vertical y se realiza por cada objetivo especifico y la discusión tiene una orientación horizontal en función de ejes de integración de los objetivos específicos con un carácter sintético y orientado al objetivo general (Ejes de Discusión).
3. Recomendaciones
Deberán expresar señalamientos concretos de posibles soluciones en relación a la justificación del estudio conteniendo elementos de juicio que contribuyan a la toma de decisiones dirigida a la aplicación práctica de dichas recomendaciones.
Hay autores que no consideran las recomendaciones como parte del proceso, consideramos realmente que el proceso investigativo en sí se inicia con la formulación del problema y finaliza en las conclusiones, sin embargo, incluimos la fase exploratoria del problema y las recomendaciones como primera y última etapa respectivamente, por razones didácticas.
El éxito no es que un vendedor
logre que alguien descalzo
compre un par de zapatos,
sino que alguien que se cree
coleccionista de ellos le
¿Qué tal si a Colón le hubiesen dicho, Cris, cariño, no vayas ahora, espera a que resolvamos
primero los problemas más importantes: la guerra, la pobreza y el crimen, la contaminación
y la enfermedad, el odio racial?