ESTADÍSTICA APLICADA A LAS CIENCIAS SOCIALES
Seminario
Facilitador: M.Sc. Jimmy Delgado Villca
OBJETIVOS
Introducir a los participantes en las nociones generales de la estadística y su utilidad en las Ciencias Sociales.
Demostrar mediante ejemplos
prácticos la aplicación y uso de la
estadística en el análisis de datos.
CONTENIDO
Nociones generales de la Estadística
Definición de la estadística y su utilidad
Población y muestra
Variables Cualitativa y Cuantitativa
División: estadística descriptiva e inferencial
Aplicación de la estadística en la actualidad con apoyo de programas informáticos.
Muestreo
Fórmulas de tamaño de muestra
Técnicas de muestreo probabilístico y no probabilístico Análisis Estadístico con apoyo de programas digitales (Excel, SPSS y Google Drive)
Técnicas descriptivas
Tablas y gráficos
Medidas descriptivas Contraste de hipótesis
Chi – cuadrado
Correlación lineal
T de Student
Análisis de varianza
Nociones
Básicas sobre Estadística
Facilitador: M.Sc. Jimmy Delgado Villca
La palabra "estadística" procede del latín statisticum collegium
("consejo de Estado")y de su
derivado italiano statista ("hombre de Estado" o "político"). El término alemán Statistik, introducido por Gottfried Achenwall (1749),
designaba originalmente el análisis de datos del Estado, es decir, "la ciencia del Estado". No fue hasta el siglo XIX cuando el término
estadística vino a designar la
colección y clasificación de datos.
En su origen, por tanto, la
estadística estuvo asociada al
control de datos poblacionales por parte de la administración pública.
1. Definición de Estadística
“Ciencia que se ocupa de un conjunto de métodos científicos, técnicas o
procedimientos para recopilar, organizar, presentar y analizar datos, con el propósito de sacar conclusiones válidas y tomar
decisiones más razonables y confiables cuando prevalecen condiciones de
incertidumbre.” (Spiegel, 1991:1)
“Es una ciencia pura y aplicada que se ocupa de recolectar, procesar, analizar e interpretar datos que sirven para la toma de decisiones en una investigación.”
(Gutierrez, 2004:7)
Ejemplos de aplicación de la Estadística en diferentes disciplinas
1) En Administración de Empresas: la estadística se utiliza para evaluar un producto antes de comercializarlo.
2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de los consumidores a través de encuestas de presupuestos familiares.
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por ejemplo los test que se aplican a los candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población
a) Población (N)
Es el conjunto de todas las unidades de observación o elementos (personas, instituciones, organizaciones, animales, objetos, sucesos, etc.) que tienen por lo menos una característica en común, la cual se desea estudiar. Dependiendo del número de elementos que la conforman, una población puede ser finita o infinita.
Ejemplos:
1.- Pobladores de la provincia Campero del Dpto. De Cochabamba.
2.- Estudiantes de la carrera de Cs. de la Ed.
3.- Las unidades educativas del municipio Cercado.abamba.
4.- Centros de salud de la municipio Quillacollo.
2. Población y Muestra
b) Muestra (n)
Cualquier subconjunto, parte, sector o segmento de unidades elementales, elegidas de una población; la cual debe ser representativa. Ejemplos:
150 familias de una ciudad.
20 Centros educativos elegidas de una región
Variable:
Propiedad o característica de alguna cosa que puede asumir más de un valor.
Es toda característica que puede tomar diferentes valores, o puede variar de un
sujeto a otro o de un momento a otro en el mismo sujeto. Ej. Talla, Religión, Estado Civil, Peso, etc.
Constante:
No asume diversos valores. Ej. π = 3,1416……...
Días de la semana, Horas del día, letras de alfabeto.
3. Variable
Llamadas también variables
categóricas. Su
expresión es literal, además expresa una cualidad o atributo, el número de
categorías que generalmente presentan es determinado.
¿Qué tipo de música escuchan?
Variable Cualitativa
Cualitativa Nominal
Ejemplos: Nacionalidad, Colores, Lugar de nacimiento, Deportes, programas de TV, Tipo de colegio, profesión, etc.
Ej: Tipo de Música:
a) Clásico b) Rock c) Regatón d) Cumbia e) Romántico f) Otros
Cualitativa Ordinal
Ejemplos: Nivel de ingresos, Tamaño, Rendimiento académico, Nivel de desnutrición, calidad del producto, etc.
Ej: Nivel de autoestima:
a) Alto b) Medio c) Bajo
Cualitativa Dicotómica (Binarias)
Ejemplos:
Gusto por las Música: Si No
Sexo: Masculino Femenino
Edad: Menor de 21 años Mayor a 21 años
Cualitativa Politómica
Ejemplos:
Nacionalidad: Ocupación:
- Boliviano - Profesor - Argentino - Albañil
- Brasilero - Carpintero - Peruano - Abogado
- Otros - Otros
Su expresión es numérica,
variables
susceptibles de medición, el
número de valores que asume es
indeterminado, de acuerdo a la
precisión de la
medición. Ej. 1 hr.
60 minutos, 60 segundos, etc.
¿Cuántos libros tienen
en casa?
Variable Cuantitativa
Cuantitativa Discreta (Valores enteros - CONTEO)
Ejemplos: # de alumnos por curso, # de cursos de
capacitación realizados, # de amigos, # de hermanos, # de docentes por carrera, etc.
Ej: Número de Hijos: 0 – 1 – 2 – 3 – 4 – 5 – 6 – 7 – 8, etc.
Cuantitativa Continua (Valores enteros y decimales - MEDICIÓN)
Ejemplos: Horas de estudio, temperatura, volumen, distancia, talla, edad, salario, cantidad de agua consumida por día, etc.
Ej: Peso: 50 Kg; 62,5 Kg; 72,234 kg, etc.
4.1. Estadística Descriptiva:
Reduce gran cantidad de datos a pocas medidas estadísticas. Explica o describe las características de la población que se esta estudiando, las mismas que son solo validas para esa población. No generaliza resultados.
POBLACION 1000 alumnos
Promedio = 21 años 1000 datos sobre edad
Llamada también DEDUCTIVA, se ocupa de la recopilación, procesamiento, presentación (mediante cuadros y gráficos), análisis e interpretación de un grupo de datos, sin ningún intento de hacer una predicción basada en los datos.
4. Clasificación de la Estadística
EJEMPLOS:
Contratación 79%
Sin Inserción 13%
Continuación de estudios superiores
6%
Auto-
emprendimiento 2%
DISTRIBUCIÓN DE JÓVENES EGRESADOS
Fuente: Centro de Formación Técnica Laboral para Jóvenes, Cbba.-Bolivia. 2011
Fuente: Centro de Formación Técnica Laboral para Jóvenes, Cbba.-Bolivia. 2011
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
35,00%
40,00%
45,00%
50,00%
Hombres Hombres con discapacidad
Mujeres Mujeres con hijos < a 7 años
Mujeres con discadacidad 46,88%
0,17%
40,21%
12,60%
0,13%
Porcentaje de participación según sexo
CENSO POBLACIÓN
1900 1’766.451
1950 3’018.031
1976 4’613.486
1992 6’420.792
2001 8’274.325
2012 10’389.913
BOLIVIA: CENSOS
Fuente: Instituto Nacional de Estadística, Bolivia
Técnicas de la Estadística Descriptiva
a) Tablas o Cuadros
b) Gráficos
0 50 100 150 200 250 300
46
145 146
26
96
124
269
19 19
131
112
26
285
9
33
UMSS: MATRICULA ESTUDIANTIL POR FACULTADES - GESTIÓN 2008
Fuente: Universidad en cifras, 2008
Diagrama de Barras Simple
c) Medidas Descriptivas
4.2. Estadística Inferencial:
Reduce una gran cantidad de datos a pocas medidas estadísticas a partir de una muestra representativa, la cual resume las características mas relevantes de la población. Generaliza resultados a poblaciones mayores.
POBLACIÓN 60.000 alumnos
De la UMSS
Promedio 21 años
500 datos sobre edad MUESTRA
500 alumnos
Proceso de Generalización de resultados
Llamada también INDUCTIVA, se ocupa de estudiar las inferencias hechas a partir de una información parcial, así como las condiciones que rigen su validez. Incluye los métodos de generalización, estimación o predicción de características de la población, basadas en una muestra.
AÑOS TOTAL
2000 8.427.789
2005 9.427.219
2010 10.426.154
2015 11.410.651
2020 12.362.780
2025 13.268.462
2030 14.114.508
BOLIVIA: POBLACIÓN TOTAL PROYECTADA
Fuente: Instituto Nacional de Estadística, Bolivia
Técnicas de la Estadística Inferencial
5. Programas Estadísticos
Un paquete estadístico es un conjunto de
programas informáticos específicamente
diseñados para el análisis estadístico de
datos con el objetivo de resolver problemas
de estadística descriptiva, inferencial o
ambos.
6. Muestreo
Procedimiento de gran validez con el cual se
seleccionan las unidades representativas, a
partir de las cuales obtendrá los datos que le
permitirán extraer inferencias acerca de una
población.
a) Fórmula para poblaciones finitas
Donde:
N = Tamaño de la población n = Tamaño de Muestra
Z = Puntuación tipificada del 95% de Nivel de Confianza p = Variabilidad positiva (probabilidad de éxito)
q = Variabilidad negativa (probabilidad de fracaso) e = Precisión o error
Esta fórmula se aplica cuando se conoce exactamente el tamaño de la población.
q p
Z e
N
q p
N n Z
2
2 2)
1 (
6.1. Tamaño de Muestra
Fuente:
http://ocw.innova.uned.es/ocwuniversia/psicologia/analisis-de- datos-en-Psico-
I/Ejercicios/ejercicios/aplicacionesDM/solucion_5.htm
La carrera de Psicología de la UMSS tiene 1792 estudiantes (Gestión II/2016). Considerando que se quiere realizar un estudio sobre uso de redes sociales, calcular una muestra para un
margen de error del 6% y una proporcionalidad del 85%.
Ejemplo:
127
52 ,
9374 126 ,
6
7288 ,
877 4898
, 0 4476
, 6
7288 ,
877
15 , 0 85
, 0 96
, 1 06
, 0 ) 1 1792
(
15 ,
0 85
, 0 1792
96 ,
1 ) 1 (
2 2
2
2 2
2
n n n
q p
Z e
N
q p
N
n Z
b) Fórmula para poblaciones infinitas
Donde:
n = Tamaño de Muestra Z = Nivel de Confianza
p = Variabilidad positiva (probabilidad de éxito)
q = Variabilidad negativa (probabilidad de fracaso) e = Precisión o error
Esta fórmula se aplica cuando no se sabe exactamente el tamaño de la población.
2 2
e
q p
n Z
Se busca realizar un estudio en la ciudad de Cochabamba entre personas que
viven en situación de calle, calcular un tamaño de muestra para un margen de error del 8%.
Ejemplo:
150
0625 ,
0064 150 ,
0
9604 ,
0
08 ,
0
5 , 0 5
, 0 96
, 1
2
2 2
2 2
n n
e
q p
n Z
Muestreos Probabilísticos (Cuantitativos)
Muestreos No Probabilísticos
(Cualitativos)
-Aleatorio simple
-Aleatorio sistemático -Estratificado
-Por conglomerados -Polietápico
-Por conveniencia o intencional
-Por cuotas -Secuencial -Bola de nieve
-Por criterios de exclusión
6.2. Selección de Técnicas de Muestreo
Muestreos Probabilísticos
Aquel en el que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una
muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma
probabilidad de ser elegidas.
Sólo este método de muestreo probabilístico nos asegura la representatividad de la
muestra extraída y es, por
tanto, el más recomendable
por ser riguroso y científico.
Muestreos No Probabilísticos
El investigador puede seleccionar los
elementos a estudiar
según su juicio personal, sin hacer usos de las
leyes del azar.
1) Muestreo Aleatorio Simple
El muestreo aleatorio simple se
puede aplicar en muchos métodos.
El más primitivo y mecánico sería el de la lotería. A cada miembro de la población se le asigna un
número. Todos los números se colocan en un recipiente o un sombrero y se mezclan. Con los ojos vendados, el investigador va sacando las etiquetas con
números. Todos los individuos que tengan los números sacados por el investigador son los sujetos del
estudio.
Otra forma sería que una
computadora haga la selección al azar de la población. En el caso de poblaciones con pocos
miembros, es aconsejable utilizar el primer método, pero si
la población tiene muchos
miembros, es preferible una selección aleatoria por
computadora
2) Muestreo Aleatorio Sistemático
Es una técnica de muestreo aleatorio que se utiliza con frecuencia por su sencillez y calidad regular. En este
muestreo el investigador
primero escoge aleatoriamente
la primera pieza o sujeto de la población. A
continuación, el investigador seleccionará a cada enésimo sujeto de la lista.
El procedimiento del muestreo aleatorio sistemático es muy fácil y se puede hacer manualmente. Los
resultados son representativos de la población a menos que se repitan ciertas características de la
población por cada enésimo individuo, lo que es muy
poco probable.
N = 1792 estudiantes de psicología.
n = 127
Paso 1: Calcular el coeficiente de elevación
Ejemplo:
127 14 . 1792
.
n E N
C
Paso 2: Determinar un número en el rango 1 – 14.
Ejemplo: 11
A partir de este número sumar sistemáticamente el valor del C.E.
39 14
25 14
11
1ra unidad
muestral 2da unidad muestral
3ra unidad muestral
25 165 305 445 585 725 865 1005 1145 1285 1425 1565 1705 39 179 319 459 599 739 879 1019 1159 1299 1439 1579 1719 53 193 333 473 613 753 893 1033 1173 1313 1453 1593 1733 67 207 347 487 627 767 907 1047 1187 1327 1467 1607 1747 81 221 361 501 641 781 921 1061 1201 1341 1481 1621 1761 95 235 375 515 655 795 935 1075 1215 1355 1495 1635 1775 109 249 389 529 669 809 949 1089 1229 1369 1509 1649 123 263 403 543 683 823 963 1103 1243 1383 1523 1663 137 277 417 557 697 837 977 1117 1257 1397 1537 1677 151 291 431 571 711 851 991 1131 1271 1411 1551 1691
3) Muestreo Estratificado
Se utiliza cuando se estudian poblaciones con
características diferentes, que forman estratos, y que
por tanto hay que evaluar de forma diferente; para luego los individuos de la muestra sean obtenidos de forma
aleatoria dentro de cada estrato.
El investigador puede dividir a toda la población en diferentes subgrupos o estratos. Luego,
selecciona aleatoriamente a los sujetos finales
de los diferentes estratos en forma proporcional.
El investigador debe utilizar un muestreo
probabilístico simple dentro de los diferentes
estratos. Los estratos más comunes utilizados en el muestreo aleatorio estratificado son la edad, el género, el nivel socioeconómico, la religión, la
nacionalidad y el nivel de estudios alcanzado.
Tipos:
Asignación simple: a cada estrato le corresponden el mismo número de unidades muestrales. Por ejemplo, una población dividida en dos estratos en función del sexo, la asignación simple sería: 50% hombres y 50% mujeres.
Asignación proporcional: el tamaño de la muestra de cada estrato es proporcional al tamaño del estrato
correspondiente con respecto a la población total. Así en un estrato dado, se tiende a tomar una muestra más
grande cuando el estrato es más grande Por ejemplo, una población divida en 2 estratos: 60% hombres y 40%
mujeres. Si obtenemos una muestra de 10 individuos, la asignación proporcional al tamaño del estrato hará que 6 sean hombres y 4 mujeres.
Asignación óptima: se asigna mayor tamaño muestral en el estrato que presenta mayor variablidad interna
(varianza) de la característica a estudiar. Es decir, el
estrato donde hay más heterogeneidad. Sin embargo, esto supone tener un conocimiento previo de la población
estratificada, cosa que raramente sucede.
N = 1480 estudiantes de nivel secundario n = 136
Ejemplo:
Total
Total Estrato
N
n P N
E . .
Curso Cantidad (NE)
Primero 360
Segundo 275
Tercero 225
Cuarto 190
Quinto 250
Sexto 180
Emplear la fórmula:
Procedimiento y resultados:
Curso Cantidad (NE) Sub-muestras
Primero 360 33
Segundo 275 25
Tercero 225 21
Cuarto 190 17
Quinto 250 23
Sexto 180 17
Total 1480 136
1480 33 136
1 360
muestra ro
Sub
4) Por Conglomerados
En el muestreo por conglomerados, en lugar de seleccionar a todos los sujetos de la población inmediatamente, el investigador realiza varios
pasos para reunir su muestra de la población. Los
conglomerados pueden ser empresas, instituciones,
comunas, ciudades, edificios, OTBs, etc.
El conglomerado más utilizado en la investigación es un conglomerado geográfico.
Por ejemplo, un investigador desea estudiar el rendimiento académico de los estudiantes secundarios en la ciudad de Cochabamba.
5) Por Polietapico
Muestreo en el que se procede por etapas: se obtiene una muestra de unidades primarias, más amplias que las siguientes;
de cada unidad primaria se toman, para una submuestra,
unidades secundarias, y así sucesivamente hasta llegar a las unidades últimas o más elementales.
Se le puede considerar como una modificación del muestreo por conglomerados cuando no forman parte de la muestra elementos o
unidades de todos los conglomerados, sino que, una vez seleccionados estos, se efectúan
submuestras dentro de cada uno de ellos.
Muestreo Por Cuotas
La población se divide en grupos o categorías de acuerdo a alguna característica y se toma un número de individuos de cada subgrupo, para completar el tamaño de la muestra.
El muestreo por cuotas es una técnica en donde la muestra reunida tiene la misma proporción de individuos que toda la población con respecto al fenómeno enfocado, las
características o los rasgos conocidos. Asimismo, el investigador debe asegurarse de que la composición de la muestra final que será utilizada en el estudio cumpla los criterios de cuota de la investigación.
Muestreo Por Conveniencia o Intencional
Es de tipo exploratorio, en donde se escogen los sujetos-tipo o informantes-clave que brindan información en profundidad. El informante clave es el que tiene la información, no
necesariamente el experto los sujetos son seleccionados dada la conveniente accesibilidad y proximidad de los sujetos para el
investigador.
Los sujetos de una investigación específica, son seleccionados para el estudio sólo porque son más fáciles de reclutar y el investigador no está considerando las características de
inclusión de los sujetos que los hace representativos de toda la población.
Muestreo Secuencial
El muestreo secuencial es una técnica de muestreo no
probabilístico en donde el investigador escoge un sujeto o un grupo de sujetos en un determinado intervalo de tiempo, lleva a cabo su estudio, analiza los resultados, luego escoge otro grupo de sujetos, si es necesario, y así sucesivamente.
Muestreo de Bola de Nieve
Llamado también muestreo en cadena, es una técnica de
muestreo no probabilístico utilizada por los investigadores para identificar a los sujetos potenciales en estudios en donde los sujetos son difíciles de encontrar.
Los investigadores utilizan este método de muestreo si la muestra para el estudio es muy rara o si está limitada a un
subgrupo muy pequeño de la población. Este tipo de técnica de muestreo funciona en cadena.
Por ejemplo, para obtener sujetos para un estudio que
quiere analizar una enfermedad rara, el investigador puede elegir utilizar el muestreo de bola de nieve, ya que será
difícil obtener sujetos. También es posible que los pacientes con la misma enfermedad tengan un grupo de apoyo, y si uno de sus miembros es tu primer sujeto, lo más probable es que allí encuentres más sujetos para el estudio.
Muestreo Por criterios de Inclusión y Exclusión
En esta técnica cualitativa de muestreo el investigador establece una serie de criterios tanto para incluir y delimitar la población como para excluir aquellos elementos que no cumplan con los criterios establecidos.
Ejemplo: la población esta constituida por el número total de docentes y alumnos del nivel de educación secundaria, de los colegios del Distrito Educativo Cercado I.
Criterios de inclusión:
• Docentes del nivel de educación secundaria.
• Alumnos matriculados en los años 1° al 5° en el nivel de educación secundaria regular.
• Alumnos con asistencia regular al centro educativo.
Criterios de exclusión:
• Docentes que conducen asignaturas que no necesitan el uso de
internet para la realización de trabajos de sus alumnos conforme a los programas de estudio.
• Alumnos con más del 30% de inasistencias a la actividad regular del centro educativo.
• Alumnos con limitaciones sensorio-perceptivas que les impiden utilizar computadora.
Aplicación de las técnicas de investigación según el método
de muestreo a utilizar