Estadística General - Mg. Rosa Padilla Castro
Capítulo
II
Conceptos generales
... ...
Objetivo
del
Capítulo
Estadística General - Mg. Rosa Padilla Castro
2.1 La estadística y su importancia en la investigación
La comprensión de la Estadística aumentará la capacidad de análisis en todo profesional, por lo cuál consideraremos lo siguiente:
Constituye uno de los idiomas esenciales para comunicarse en el mundo universal de la ciencia y la tecnología.
Permite comprender con mayor facilidad la bibliografía especializada. La mayoría de libros, artículos, estudios e investigaciones especializadas en Psicología, Salud, Ingeniería Ambiental, Administración, Nutrición, etc., contienen resultados basados en el análisis estadístico.
Los métodos estadísticos se utilizan ampliamente, tanto en el gobierno como en la empresa privada.
En muchas circunstancias, los profesionales requieren del conocimiento de la estadística para tomar decisiones acertadas y evitar ser “abrumados” por la presentación de datos estadísticos.
La Estadística constituyen una parte integral de las actividades investigativas, de las encuestas para recopilar datos y del diseño del plan de análisis estadístico que se originan en las actividades que desarrollan las instituciones y organizaciones, ayuda a conocer las características de la población, cuyos resultados orientan a la toma de decisiones.
Permite hacer inferencias acerca de una población a partir de datos obtenidos de una muestra representativa. Ayuda a poder predecir el comportamiento de los fenómenos en el futuro.
Por ejemplo los resultados que se obtienen en las investigaciones sobre fármacos para reducir los niveles de ansiedad se analizan por medio de métodos estadísticos. Los psicólogos investigadores se ayudan del análisis estadístico para evaluar la efectividad de diversos tratamientos.
2.2 Definición de Estadística
La Estadística es una ciencia, la cual nos proporciona un conjunto de métodos que se utilizan para recolectar, clasificar, analizar e interpretar el comportamiento de los datos, ya sea en una población o en una muestra con el objeto de interpretarlos, obtener leyes; las cuales nos ayudan tanto en el análisis de datos como en el proceso de la toma de decisiones.
La Estadística como ciencia cumple los aspectos principales del método científico, tales como: a) Realización de experimentos y observaciones
b) Obtención de conclusiones o proposiciones objetivas a partir de los resultados de dichos experimentos y observaciones
c) Formulación de leyes que simplifiquen la descripción de un gran número d) Experiencias u observaciones.
2.3 Clasificación de la Estadística
La Estadística se clasifica de acuerdo a las dos funciones que realiza:
Estadística Descriptiva.
Como su nombre lo dice, describe y analiza una población, sin pretender sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas sólo son válidas para dicha población.
Particularmente, podemos destacar la Estadística descriptiva en el siguiente diagrama:
Estadística Inferencial.
Es el conjunto de métodos, cuyo propósito es inferir o inducir leyes de comportamiento de una población, a partir del estudio de una muestra, las cuales nos ayudaran en la toma de decisiones bajo un cierto grado de confianza; este grado de confianza se mide por la “probabilidad”.
Recolec-ción de datos
Crítica de los datos
Presentación de los datos
Tablas y gráficas
Análisis descriptivo
Población
Estadística Inferencial
Probabilidad: Técnica demuestreo
Muestra
Estadística General - Mg. Rosa Padilla Castro
2.4 Variable estadística
Definición: Característica de la población o muestra que varia o difiere de una observación a otra, que a su vez interesa al investigador.
En general la estructura del proceso de medición, tiene 4 niveles: 1) La variable, o propiedad que se quiere medir (ejm: genero, inteligencia, memoria, temperatura, etc.), 2) El atributo, o grado (modalidad) en que se manifiesta la propiedad medida, 3) El valor, o forma de expresar de forma numérica el atributo, y 4) La relación aceptable entre los distintos valores de la variable.
Por ejemplo, en la variable "clase social", el proceso de medición quedaría representado como:
CLASIFICACIÓN DE LAS VARIABLES: Según la naturaleza de la variable:
Cuantitativas
Son aquellas que se obtienencomo resultados de conteos o mediciones. Ejemplo: resultados de análisis químicos de compuestos de cloruros (Cl-) expresados en unidades de mg/L procedentes de una muestra de aguas
residuales.
Estas variables se dividen en:
i) Discretas:
Toman valores numéricos enteros. Ejemplo: Nº de quejas que se reportan en Bienestar universitario por el mal servicio que prestan los agentes de seguridad de la UPeU.
Ejemplos:
Nº de precipitaciones pluviales durante el mes de marzo
ii) Continuas:
Toman valores numéricos decimales, en general, todas las magnitudes relacionadas con el tiempo (edad, duración de un fenómeno,...), el espacio (longitud, superficie,...), una combinación de estos (velocidad, densidad, capacidad,...).
Ejemplos:
Óxidos de nitrógeno (NO2), procedentes
de una planta de tratamiento de aguas residuales
Emisiones de óxidos de azufre (SO2 en toneladas métricas provenientes plantas siderúrgicas localizadas en cierta región industrial
Cualitativas o categóricas
Cuando expresan una cualidad, característica o atributo, sus datos se presentan mediante una palabra. Se dividen en:
0 días de lluvia 1 día
2 días 3 días, etc. Continuas
Discretas
Cuantitativa
s
Cualitativas
Nominales
Ordinales
Variabl
e
Atribut
o
Valor
Clase Social
Baja
Media
Alta
1
2
3
1.02 1.08 1.14 5.05
Estadística General - Mg. Rosa Padilla Castro
i) Cualitativa nominal.
Son aquellas que establecen la distinción de los elementos en las categorías sin implicar orden entre ellas.
Ejemplos:
Actividades que generan sustacias tóxicas
Sustancias tóxicas en el agua
ii) Cualitativa ordinal
Son aquellas que agrupan a los objetos, individuos, en categorías ordenadas para establecer relaciones comparativas es decir son susceptibles de ordenación pero no de medición cuantitativa.
Ejemplos:
Reacciones de toxicidad
Según escalas de medición
Conocer el tipo de escala con el cual se trabaja será muy importante, pues de ello dependerá la correcta utilización de los distintos de los distintos análisis que se realizan.
a) Escala Nominal
Es el nivel más simple de medición donde la variable establece categorías sin orden. El número asignado funciona sólo como etiqueta. Ejemplo:
Sexo Deportes que practica
b) Escala Ordinal
Es el segundo nivel de medición, son aquellas que implican orden en sus categorías, pero no grados de distancia iguales entre ellas. Ejemplo:
Grado de Instrucción
Un tipo importante de escalas ordinales lo constituyen las escalas de actitud, que ha continuación introducimos:
Escalas de actitud. En ciencias sociales es muy común tratar de medir el sentir que tienen los individuos acerca de productos o servicios. Las escalas que para ello se usan se llaman escalas de actitud; entre ellas tenemos las escalas de Likert y la escala de diferencial semántico.
Escala de Likert. Se usan frecuentemente para medir la actitud de los individuos utilizando frases que resaltan los aspectos positivos y negativos del producto o servicio. El entrevistado deberá indicar el grado de acuerdo o desacuerdo con las frases que se indican.
Ejemplo: Calidad del tramsporte de la UPeU
Para conocer la percepción de los alumnos frente al servicio que se brinda, se escribieron las siguientes frases.
Items 1 2 3 4 5
Los servicios de transporte son de mala calidad* Los servicios de transporte ofrecen seguridad** *(resalta el aspecto negativo)
**(resalta el aspecto positivo)
El entrevistado deberá indicar su grado de acuerdo o desacuerdo con cada una de las frases indicando, el número 1 si está en completo desacuerdo, el 2 si está en desacuerdo, … , y el 5 si está en completo acuerdo.
Industrial Minera Agrícola Agrícoloa
Severa Leve No presenta
Femenino
Masculino
Fútbol Tenis Gimnasia
Primaria Secundaria Superior
Desechos industriales Metales pesados Agroquímicas
Estadística General - Mg. Rosa Padilla Castro
Escala de diferencial semántico. Se usa generalmente para medir el sentir de los individuos frente a diferentes atributos de un producto o servicio, estableciendo comparaciones al utilizar una escala bipolar. Por ejemplo al estudiar la actitud de los individuos frente a los servicios que se prestan a los alumnos y padres de familia de la UPeU en la oficina financiera, se considera los siguientes atributos: amabilidad y ambiente, para lo cual se define el polo positivo y el polo negativo de cada atributo:
Nada amable Muy amable
Ambiente desagradable Ambiente agradable
Los individuos deberán evaluar los atributos dando una puntuación de 1 (para el polo negativo) y al 7 ( para el polo positivo).
1 2 3 4 5 6 7
Nada amable Muy amable
Ambiente desagradable Ambiente agradable
c) Escala de intervalo
Es el tercer nivel de medición, son aquellas que suponen a la vez orden y grados de distancia iguales entre ellas. Una característica importante de las escalas de intervalo es que el punto cero es arbitrario, lo que quiere decir que no podemos interpretar significativamente el tamaño de calificación de proporciones particulares. No podemos decir por ejemplo que 100 F es dos veces más caliente que 50 F. La mayoría de las pruebas psicológicas son calificadas por escalas de intervalos, particularmente las que están basadas en la actuación de grandes grupos normativos. Las medidas de CI son un ejemplo de esto; un CI de cero casi seguramente no representa una ausencia total de funcionamiento mental o de la pérdida total de la capacidad para aprender.
Ejemplos: Temperatura, Puntuación obtenida en una escala, Presión arterial, etc.
d) Escala de razón
Es el nivel más alto de medición. Estas variables comprenden a la vez todas las clases anteriores, distinción, orden, distancia y además origen único natural (la unidad de medida necesariamente tiene que partir de cero). Ejemplos: peso, ingreso, número de hijos, producción, accidentes de tránsito, tiempo de reacción mental.
En la tabla resumen que presentamos a continuación se describen los niveles de medida, junto con las operaciones básicas que se necesitan para crear una determinada escala.
Escalas Operaciones empíricas básicas Ejemplo
Nominal Relación de igualdades Genero
Ordinal Relación de mayor o menor Clase social
Intervalo Orden y grados de distancia iguales entre ellas (cero arbitrario) Temperatura de una persona
Razón Existencia de un cero real Nº de hijos
Transformación de escalas y variables.
En ciertas situaciones al investigador le interesa transformar el tipo de escala o variable, en este caso hay que tener en cuenta que este tipo de modificación plantea la siguiente restricción:
Una escala de medida o variable puede ser transformada en otro tipo de escala o variable siempre que sea de rango inferior a la utilizada inicialmente.
Así de una escala de razón podremos pasar a una escala de intervalo, ordinal o nominal. Pero nunca en sentido inverso, por ejemplo pasar en una propiedad medida a nivel de escala nominal a una escala de intervalo (Ej.: el genero).
Si estamos con variables clasificadas según su naturaleza, el proceso será el mismo, es decir se admite la posibilidad de transformar una variable cuantitativa continua en discreta, ordinal o categórica, pero no en sentido inverso.
Según la relación entre variables a) Variables dependientes
Generalmente se simbolizan estas variables con la letra “Y”; y son aquellas que dependen de otra u otras variables dentro de un contexto determinado. Indica: efecto, resultado, consecuente.
b) Variables Independientes
Estadística General - Mg. Rosa Padilla Castro
c) Variables intervinientes
Simbólicamente se representan con la letra “Z”, son aquellas que coparticipan con la variable independiente,
condicionando el comportamiento de la variable dependiente.
Ejemplo: “la escasa expresión afectiva en la niñez, genera un nivel bajo de autoestima en familias disfuncionales”.
Expresión afectiva (x) Variable independiente Autoestima (y) Variable dependiente Familias disfuncionales (z) Variable interviniente
2.5 Nomenclatura Estadística
Población
Conjunto de datos; ya sean individuos, elementos o unidades que presentan características comunes y observables de los cuales queremos obtener información. A cada elemento de la población se le denomina unidad estadística o unidad experimental. Dependiendo del número de sus elementos, una población puede ser finita o infinita.
En la práctica, consideraremos que una población es infinita si el número de sus elementos es mayor o igual que 100 000
Muestra
Subconjunto representativo y optimo de mediciones seleccionado de la población de interés. Cuando la población es pequeña, es razonable realizar un censo; esto significa, observar como es toda la población, respecto de la propiedad que se desea estudiar. Sin embargo, en muchos casos las poblaciones no son pequeñas y realizar un censo es casi imposible, ya sea por falta de tiempo, recursos económicos. En tales casos, se desarrollan procedimientos que permitan deducir el conocimiento de toda la población, a partir de un subconjunto de ella que para poder hacer la inferencia es necesario usar el tipo de muestreo probabilístico apropiado según las características de la población a estudiar y además tomar el tamaño adecuado de acuerdo a formulas estadísticas con niveles de precisión y confiabilidad.
Parámetro
Medida de resumen usada para describir alguna característica de la población. Las más usadas son: Media ( ), Varianza ( 2), Proporción poblacional ( ).
Estadígrafo o estadístico
Es una medida usada para describir alguna característica de la muestra y la toma de decisiones contiene algún grado de incertidumbre. Las más usadas son: media o promedio (
x
), varianza (s2), proporción (p). Ejemplo: el sueldo promedio de un grupo de trabajadores que constituyen una muestra de 200 personas tomadas de todas las empresas del país es un estadístico, mientras que el sueldo promedio de todos los trabajadores de todas las empresas en el país es un parámetro. Datos
Se obtiene al observar alguna característica o propiedad de los objetos de los cuales se tiene interés. Pueden ser del tipo cuantitativo o cualitativo.
Ejemplo
Un investigador, estudiando una enfermedad cardiaca en personas mayores de 18 años, ha identificado cuatro factores potencialmente asociados con el desarrollo de la misma: la edad, el peso, el nº de cigarrillos fumados por día y los antecedentes familiares de enfermedad cardiaca. El investigador quiere acumular pruebas que confirmen estos factores como contribuyentes al desarrollo de la enfermedad, o demuestren que no son importantes.
¿Cómo debe proceder?
1. El problema se asocia a un grupo grande de objetos (en este caso, personas) acerca de los cuales va hacerse inferencias. Este grupo de objetos se llama población.
2. Ciertas características de los miembros de la población son de particular interés. El valor de esas características puede cambiar de objeto a objeto dentro de la población. Estas características se llaman variables aleatorias: variables por que cambian de valor, aleatorias por que su comportamiento depende del azar y es impredecible.
Estadística General - Mg. Rosa Padilla Castro
En el estudio de factores que afectan a la enfermedad cardiaca, la población es el conjunto de todas las personas que padecen la enfermedad.
Las variables aleatorias de interés son la edad y el peso del paciente (variables cuantitativas continuas), el número de cigarrillos fumados por día (variable cuantitativa discreta) y la historia familiar (variable cualitativa nominal), si se estudia registrando el número de padres y abuelos que experimentaron dolencias cardíacas (variables cuantitativas discretas). Es imposible identificar y estudiar a cada persona con enfermedad cardiaca. De este modo cualesquiera que sean las conclusiones, deben basarse solamente en el estudio de una porción o muestra de esas personas.
Una medida descriptiva relacionada con una variable aleatoria, cuando la variable se considera sobre toda la población, se denomina parámetro. Los parámetros se indican generalmente con letras griegas, en nuestro ejemplo el investigador está interesado en determinar el valor promedio de cigarros fumados por día por los miembros de la población. No es posible obtener este parámetro salvo si se estudian todos los miembros de la población, la única solución es tomar una muestra representativa y de tamaño optimo a través de la cual obtendremos un estimador del parámetro, a estos estimadores se les denominan estadísticos o estadígrafos; los cuales tienen dos fines. Por un lado describen la muestra y, por otro, sirven como aproximación a los parámetros correspondientes a la población.
PROBLEMAS DE REPASO DEL CAPÍTULO
1. Escriba V o F dentro de cada paréntesis según considere que el enunciado respectivo es verdadero o falso. Justificar la respuesta que considere falsa.
( ) El nivel de conocimientos que presentan los alumnos de Ingenieria Ambiental 2do año es: alto, promedio y bajo; esta variable es cualitativa nominal
( ) Se presentan los datos recogidos por la Organización en Defensa del Consumidor el cual realizó un estudio sobre el contenido de monóxido de carbono emitido por el humo de los cigarrillos comercializados, se encontró que el contenido promedio es de 10.10 gr.; esto es un estadístico
( ) Los estudios exploratorios están dirigidos a lograr el esclarecimiento y delimitación de problemas no bien definidos
( ) Se desea estudiar el número de hijos que tienen las parturientas que son atendidas en el centro de salud “Grau” , la unidad de análisis será el número de hijos
( ) Un dato es un valor de la variable, pudiendo ser solamente numérico
2. Se indica que el porcentaje de personas mayores de 20 años que no tienen empleo en una ciudad de 6 millones de habitantes es 7%, los resultados fueron obtenidos a partir de un cuestionario aplicado a 1500 personas de la ciudad, elegidas de entre las personas mayores de 20 años.
a) ¿Sobre que población se ha realizado la encuesta?. b) ¿Cuál es la unidad estadística?
c) ¿Cuál ha sido la muestra utilizada?
2. Identifique el tipo de variable de acuerdo a su naturaleza (cuantitativa: discreta/continua, o cualitativa: nominal/ordinal), ¿cuál es su nivel de medición?
a) Temperatura de almacenamiento de leche fresca.……….
b) Número de accidentes registrados en el Instituto de medicina legal, según departamento………
c) Número de casos con enfermedades infecciosas y parasitarias atendidos en un día cualquiera en una posta médica de área rural………..
d) Se quiere contrastar la eficacia de un cierto tipo de catalizador (A. B. o C) ……….en una reacción quimica. midiendo la reducción de horas del tiempo de proceso……….. Se cree que la temperatura (baja. media. alta) ………..y la presión (baja. media. alta) influyen significativamente en la acción de los catalizadores.
3. Utilice sus conocimientos para completar las siguientes frases:
a) Si una respuesta se clasifica como buena o mala, es una variable... b) En una medición cualitativa, las variables resultan agrupadas en...
c) Si clasificamos los alumnos de un colegio por el grado que ocupan hacemos una medición...
d) En la escala de intervalo el cero es... En una escala de razón el cero es... e) Si se puede establecer distancias entre categorías se utilizan escalas de...o de... f) En muchas investigaciones de estadística se recolecta información de una ... y no de la población
Estadística General - Mg. Rosa Padilla Castro
g) Las muestras tomadas de una población deben ser muestras...y de tamaño………. h) Para obtener una...aleatoria de la población, cada elemento debe tener...
oportunidad de ser...
4. Escriba en los siguientes enunciados la expresión que le corresponde entre los siguientes: ESTADÍSTICO – PARÁMETRO – DATO – INFERENCIA.
a) Se toma una muestra de 450 profesionales de Ingenieros Ambientales y se obtiene un salario promedio de $1 200 mensuales.______________