• No se han encontrado resultados

TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados.

N/A
N/A
Protected

Academic year: 2021

Share "TEMA 8: ESTADÍSTICA. 8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos. 8.3 Parámetros de posición para datos aislados."

Copied!
5
0
0

Texto completo

(1)

1º de Bachillerato de C. Sociales 1 TEMA 8: ESTADÍSTICA

8.1 Elementos de la Estadística. 8.2 Parámetros estadísticos.

8.3 Parámetros de posición para datos aislados.

8.1 Elementos de la Estadística.

Es la parte de las Matemáticas que estudia los métodos de recogida, presentación, análisis e interpretación de datos. También se ocupa de hacer predicciones a la vista de éstos datos.

Los elementos de la Estadística que debemos conocer son: Población (perros, mijeños, españoles, el conjunto de los países que forman la ONU) que es el conjunto de todos los elementos del que se quiere estudiar unas características, a las que llamaremos variables (raza canica, estatura, peso, sistema de gobierno, nº de habitantes por km2, extensión en km2). Cada elemento de la población se llamará individuo (individuo no es una persona, cada perro, cada mijeño, cada español, cada país). En muchos casos resulta imposible estudiar una variable sobre la población completa, necesitaremos tomar una parte de la población (subconjunto) al que llamaremos muestra, de la cual intentaremos extraer conclusiones para toda la población. Para que una muestra sea representativa es necesario: a) la elección sea aleatoria de forma que todos los individuos tengan la misma probabilidad de ser elegidos. b) Conservar la proporción, por ejemplo, mantener el % de hombres y mujeres. El número de elementos de la muestra se llama tamaño y se denota por N.

Ejercicio 1: Busca en tu libro de texto: a) Tipos de muestreo.

b) Definición de estadística descriptiva y estadística inferencial.

La selección de la muestra en una población es un paso crítico ya que una elección no adecuada implica que los resultados no serán válidos para la población. Tipos de muestreo:

a) Muestreo aleatorio simple: Si la población es homogénea (mismo número de mujeres y hombres, de la misma edad, de la misma posición económica,…), se realiza una proceso de elección (al azar, como la lotería) en el que todas las posibles muestras tienen la misma posibilidad de ser elegida.

b) Muestreo aleatorio estratificado: Si la característica que se va a estudiar no es homogénea en toda la población, esta se divide en diferentes grupos o estratos lo más homogéneos posible. En cada estrato se realiza un proceso de muestreo aleatorio simple. c) Muestreo sistemático: Se numeran todos los elementos de la población de 1 a N y se toma

el entero k más próximo a N/n (N tamaño de la población y n el tamaño de la muestra). A continuación, se elige al azar un número del 1 al k, h. La muestra se forma con los n elementos que ocupan los lugares h, h+k, …, h + (n-1) k.

(2)

Atendiendo al contenido de las variables se pueden clasificar en: Variables cuantitativas: cuando las variables son números y medidas. Estas a su vez se pueden clasificar en: Variable Cuantitativa Discreta: cuando toma valores aislados (número de hijos en las familias, número de coches en una familia, edad de los alumnos de un instituto). Variable Cuantitativa Continua: cuando los valores varían en un intervalo (estatura, peso, sueldo de los empleados de una empresa). Variables Cualitativas: cuando las variables son cualidades, por ejemplo: color de ojos, profesión, sistema de gobierno, deporte favorito.

La estadística descriptiva analiza algunos caracteres de los individuos de un grupo dado sin extraer conclusiones para un grupo mayor. Para ello 1) Selecciona los caracteres dignos de estudio. 2) Análisis de cada carácter para conocer los valores que toman. 3) Completar la tabla estadística y, si fuera necesario, su representación gráfica. 4) Cálculo de de los parámetros estadísticos. La estadística inferencial trabaja con muestras y a partir de ella quiere predecir (inferir) características de toda la población. Tendremos que tener mucho cuidado para elegir la muestra, el grado de confianza del resultado obtenido.

Una vez recogida la información sobre una población o muestra, necesitamos organizarla para ello utilizamos las tablas de frecuencias. En ella mostramos en las filas las distintas variables o intervalos (xi). Y en las columnas distintos datos que nos ayudaran a estudiar la variable:

a) Frecuencia absoluta número de veces que una variable aparece en la muestra, se denota por fi. b) Si la frecuencia absoluta se divide entre el número total de elementos de la muestra se llama frecuencia relativa y se denota hi = fi/N.

c) La frecuencia acumulada de xi es el número de veces que aparece en la muestra dicha variable o variables de inferior valor. Se denota por Fi y se calcula de la siguiente forma Fk = f1 + f2 +…+ fk =

k 1

i i

f. Observa que Fp = 1, siendo p el número de variables del estudio.

d) Si la frecuencia acumulada se divide entre el número total de elementos de la muestra se llama frecuencia relativa acumulada y se denota hi = fi/N.

Para mostrar los resultados obtenidos utilizamos las representaciones gráficas:

a) Diagramas de barras: Se utilizan para comparar datos cualitativos o cuantitativos discretos. La altura de la barra indica la f. absoluta. Del diagrama de barras podemos obtener el Polígono de frecuencias que es una línea poligonal que une los extremos de las barras del diagrama de barras.

(3)

1º BCSociales 3

b) Histograma formado por rectángulos cuya base es la variable en forma de intervalo (variable cuantitativa continua) y la altura será la frecuencia absoluta, también aquí podemos trazar el polígono de frecuencias: añadimos dos rectángulos de altura cero al inicio y al final, marcamos el punto medio de la parte alta del rectángulo y unimos dichos puntos.

Edad de los habitantes de una comunidad.

c) Diagrama de sectores: se utilizan para comparar distintas modalidades de un carácter. El área del sector circular es proporcional a la frecuencia absoluta, fi.360/N.

Si la variable es cuantitativa continua (porque hay muchos valores que se diferencian en cantidades pequeñas) tendremos que organizarlos en intervalos para ello seguiremos los siguientes pasos:

1) El valor más pequeño y el mayor, a y b, calculamos b – a, llamado recorrido. 2) Se decide el número de intervalos (no debe ser menor de 6 ni mayor de 15). 3) Aumentamos b – a hasta un número que sea múltiplo del número de intervalos.

4) El extremo inferior del primer intervalo será menor que a y el extremo superior del último intervalo es mayor que b.

8.2 PARÁMETROS ESTADÍSTICOS.

Para caracterizar de forma inmediata una distribución o tabla se buscan una serie de valores que se llaman parámetros estadísticos. Hay dos tipos:

(4)

Parámetros de centralización nos indica en torno a qué valor (centro) se distribuyen los datos. Hay varios tipos:

1) Media aritmética, se denota por x, y se calcula mediante la siguiente fórmula

N n 1 i xiif x    .

2) Moda es el valor de la variable que presenta una mayor frecuencia. Se denota por Mo.

3) Mediana es el valor de la variable que cumple que la mitad de los valores están por debajo de él y la otra mitad por encima. Si el número de datos es par, a la mediana se le asigna el valor medio de los dos términos centrales. Se denota por Me.

La mediana se encuentra en la variable xk si Fk >

2 N. Si Fk = 2 N entonces Me = 2 x xkk1 .

Parámetros de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución, son necesarias para aquellas distribuciones en que la media no es el valor más representativo por ejemplo si hay sueldos bajos y uno muy alto. Para ello tenemos:

1) Recorrido es la diferencia entre el mayor y el menor de los valores de la variable. 2) Varianza 2 2 2 -x N n 1 i ifxi   

3) Desviación típica es la raíz cuadrada positiva de la varianza. Cuánto mayor sea, mayor es la dispersión. Entre el 50% y el 70% de los datos se encuentran en el intervalo (x -  x  ) y el 90% en el intervalo (x - 2 x 2)

4) Coeficiente de variación se denota por C.V. = x 

. Nos sirve para comparar dos o más distribuciones. Cuánto más cerca está del 0 menos dispersa es la distribución.

Si la variable es cuantitativa continua para hallar la media se tomarán los puntos medios de los intervalos, llamados marcas de clase. En vez de moda se hablará de intervalo modal. Para calcular la mediana se localizará el intervalo en el que cae la primera frecuencia acumulada que supere a la mitad de los datos, Fi, la mediana se calcula de la siguiente forma

ervalo int amplitud x f F 2 / N ervalo int erior inf extremo Me i 1 i  

 o mejor aún por la

semejanza de triángulos: Fk-1 Fk 1 2 N   Fk xk x xk + amplitud

Ejercicio 2: Calcular media, moda, mediana, varianza, desviación típica y coeficiente de variación de los ejemplos 1 al 6.

Ejercicio 3: Representa los ejemplos trabajados. Utiliza Histogramas, polígono de frecuencias y diagrama de sectores en los ejemplos de variable cuantitativa continua. Utiliza diagrama de

(5)

1º BCSociales 5 PARÁMETROS DE POSICIÓN PARA DATOS AISLADOS.

Colocamos los individuos de una población en orden creciente según la variable que se estudia y partimos la población en cuatro trozos con el mismo número de individuos, los puntos de separación son los cuartiles y la mediana, así podemos definir:

1) Q1 (primer cuartil) que es el valor de la variable que supera el 25% de la población. 2) Mediana es el valor que supera el 50% de los individuos.

3) Q3 (tercer cuartil) que es el valor de la variable que supera el 75% de la población.

Ejemplo 1: 0 1 2 2 3 4 5 5 5 6 6 7 7 8 8 9 10 10 10. Hay 19 valores, 19 : 4 = 4´75 4´75 x 2 = 9´5, 4´75 x 3 = 14´25, por tanto Q1 = 3, Me = 6 y Q3 = 8 Ejemplo 2: 0 1 2 2 4 5 5 5 6 7 7 8 8 9 10 10 . Hay 16 valores, 16 : 4 = 4, por tanto Q1 = (2 + 4)/2 = 3, Me = (5 + 6)/2 = 5´5 y Q3 = 8

Si partimos la población en 100 partes y señalamos el lugar que deja por debajo a k de ellas, el valor de la variable correspondiente a ese lugar se designa por pk y se denomina centil k o

percentil k. La mediana corresponde a un percentil 50, el primer cuartil a un percentil de 25 y el tercer cuartil a un percentil de 75.

Ejercicio 4: Halla Q1, Me, Q3 y p40 en la distribución: 2 3 3 3 5 6 6 7 7 8 8 9 10 10

Ejercicio 5: Calcula Q1, Me, Q3, p80 , p90 y p99 de la siguiente distribución:

Notas 1 2 3 4 5 6 7 8 9 10

Nº de alumnos 7 15 41 52 104 69 26 13 19 14

Si nuestra variable es cuantitativa continua para el cálculo de percentiles debemos considerar que los datos de cada intervalo se reparten uniformemente en él. Para calcular el percentil tendremos en cuenta la semejanza de triángulos al igual que en la mediana.

Referencias

Documento similar

Se sugiere una extensión de unas 400 palabras para las preguntas de interpretación (sección "Explore"), a fin de que el alumno se ejercite en la redacción concisa y se atenga

Por último, como ya se ha señalado, el alumno debe adquirir la Guía Didáctica Comentario de textos literarios ingleses, texto básico para afrontar esta asignatura.. Sin está GD

Asimismo, se aportan las herramientas necesarias que proporcionarán al alumno la posibilidad de realizar un análisis crítico de un informe de investigación, tanto a nivel

En cualquier caso, el trabajo deberá haber sido previamente acordado con el equipo docente de la asignatura, para lo cual el estudiante enviará un correo electrónico al equipo

Como indico en la sección de Contenidos de esta Guía de la Asignatura, aquellos alumnos que por distintas razones (conocerlo, haberlo manejado o estudiado con anterioridad, etc.)

Criterios específicos de admisión: Es conveniente para poder realizar el trabajo con nosotros tener cierto nivel de conocimientos de inglés escrito y de matemáticas, al nivel de

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

Vista parcial de bolosresultante de la disgregaci6n de las tonalitas,en las proximidades a Zarza