• No se han encontrado resultados

Estadística

N/A
N/A
Protected

Academic year: 2020

Share "Estadística"

Copied!
6
0
0

Texto completo

(1)

ESTADÍSTICA UNIDIMENSIONAL

La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérica de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas).

Conceptos básicos en la estadística:

Población. Es el conjunto de todos los elementos cuyo conocimiento nos interesa y que serán sujetos de nuestro estudio.

Muestra. Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población.

Individuo. Es cada uno de los elementos que forman la población o la muestra.

Caracteres y variables. Caracteres son los aspectos que deseamos estudiar en los individuos de un población. Cada carácter puede tomar distintos valores o modalidades. Una variable estadística recorre todos los valores de un cierto carácter.

Clasificación de las variables estadísticas: - Cualitativas. No toman valores numéricos

- Cuantitativas discretas. Toman valores numéricos aislados.

- Cuantitativas continuas. Pueden tomar todos los valores de un intervalo. Dos ramas de la estadística:

La estadística descriptiva trata de “describir” y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor. Para este estudio se siguen los siguientes pasos:

1º Selección caracteres dignos de estudio.

2º Análisis de cada carácter, anotando los valores que toman los individuos en ellos. 3º Clasificación y organización en tablas de los resultados obtenidos.

4º Cálculo de ciertos valores numéricos (los parámetros estadísticos) a partir de los datos obtenidos.

(2)

Gráficos estadísticos

1. Diagrama de barras. Un diagrama de barras es un gráfico que está formado por barras de altura proporcional a la frecuencia de cada valor. Se utiliza con datos cualitativos y cuantitativos discretos.

2. Polígono de frecuencias. Un polígono de frecuencias es una representación que se realiza uniendo con una línea poligonal los extremos superiores de las barras en un diagrama de barras.

3. Histograma. Un histograma es una representación gráfica mediante rectángulos adosados, de altura proporcional a la frecuencia. Cuando los intervalos no tienen la misma longitud lo que marca la frecuencia no es la altura de cada rectángulo, sino el área del mismo. Esta representación gráfica se utiliza cuando los datos son cuantitativos continuos, o cuantitativos discretos y toman muchos valores diferentes.

4. Diagrama de sectores. Un diagrama de sectores es una representación gráfica que consiste en un círculo que se divide en sectores de amplitud proporcional a la frecuencia del valor. El diagrama de sectores se puede utilizar con cualquier tipo de datos, pero se utiliza especialmente en datos cualitativos.

En las páginas: 228, 229 y 230 tenéis ejemplos de cada uno de ellos. Tablas de frecuencias

Las tablas de frecuencias sirven para ordenar y organizar los datos estadísticos. En las tablas de frecuencias aparecen los valores de la variable y las frecuencias de dichos valores.

Frecuencia absoluta, es el número de individuos de la población para los que la variable toma un valor determinado. Se representa por o , en el libro de texto se utiliza . La suma de todas las frecuencias absolutas, , es igual al total de los individuos, N.

Frecuencia relativa, es el cociente entre la frecuencia absoluta y el número total de individuos. Se representa por y se puede expresar en tanto por uno , o en

tanto por ciento .

Frecuencia acumulada de un valor, es la suma de las frecuencias de los valores menores o iguales a él. Las frecuencias acumuladas pueden ser:

 Absolutas que se representan por o , en el libro de texto se utiliza  Relativas que se representan por

Ejemplo:

Se le pregunta a 40 personas sobre el número de libros leídos en el último mes obteniéndose las siguientes respuestas:

(3)

La tabla de frecuencias asociada sería:

0 4 4 10 0,10 10 0,10

1 12 16 40 0,30 30 0,40

2 14 30 75 0,35 35 0,75

3 8 38 95 0,20 20 0,95

4 2 40 100 0,05 5 1,00

Total 40 1 100

Tabla con datos agrupados

Cuando en una distribución estadística el número de valores que toma la variable es muy grande, conviene elaborar una tabla de frecuencias agrupándolos en intervalos. Para ello:

 Se localizan los valores extremos a y b y se halla su diferencia r = a – b (a r se le llama rango)

 Se decide el número de intervalos que se quiere formar, teniendo en cuenta el número de datos que se poseen. Se suele tomar el número de intervalos redondeando la raíz cuadrada del número de datos, pero esto es sólo orientativo. Este número no debe ser inferior a 6 ni superior a 15.

 Se toma un intervalo, r’, de longitud algo mayor que el recorrido r y que sea múltiplo del número de datos, con objeto de que éstos tengan una longitud entera.

 Se forman los intervalos de modo que el extremo inferior del primero sea algo menor que a y el extremo superior del último sea algo superior a b. Es deseable que los extremos de los intervalos no coincidan con ninguno de los datos. Para ello, puede convenir que dichos extremos tengan valores no enteros.

Cuando se elabora una tabla con datos agrupados, se pierde algo de información (pues en ella se ignora cada valor concreto, que se difumina dentro de un intervalo). A cambio se gana en claridad y eficacia.

Ejemplo:

Vamos a elaborar una tabla de frecuencias con los siguientes datos que corresponden a la estatura de 40 adolescentes.

(4)

El número de valores distintos que hay es grande (mayor que 20). Por eso, lo adecuado es clasificarlos en intervalos. Para ello precedemos así:

- Localizamos los valores extremos: el menor (149) y el mayor (178). Hallamos su diferencia: r = 178 – 149 = 29

- Puesto que el número de datos es 40 redondeamos la raíz cuadrada del total de datos ( ) y tomamos 6 intervalos. Buscamos un número algo mayor que el recorrido (r = 29) y que sea múltiplo de 6. Por ejemplo, r’ = 30. de este modo, cada uno de los seis intervalos tendrá una longitud igual a 5.

- El extremo inferior del 1er intervalo se toma: (30 –29) : 2 = 0,5  149 – 0,5 = =148,5

- Repartimos los cuarenta datos en los seis intervalos.

Intervalos Frecuencias [148,5, 153,5) 2 [153,5, 158,5) 4 [158,5, 163,5) 11 [163,5, 168,5) 14 [168,5, 173,5) 5 [173,5, 178,5) 4

Parámetros estadísticos

Parámetros de centralización:

- Media: es el valor que tendría cada individuo si se repartiera por igual la totalidad de sus valores.

La media sólo se puede hacer cuando trabajamos con variables cuantitativas - La moda: la moda de un conjunto de datos es el valor que tiene mayor

frecuencia. La moda se puede calcular tanto en datos cualitativos como en datos cuantitativos.

- La mediana: la mediana de una distribución es el valor que está en el centro al ordenar los datos de menor a mayor, es decir el número de datos menores que él es igual al número de datos mayores que él. Si los datos estudiados son un número par, la mediana es la media de los dos valores centrales.

Parámetros de dispersión:

(5)

- Desviación Típica. Es la raíz cuadrada de la varianza.

La varianza tiene importancia en niveles superiores de estadística, pero aquí la utilizaremos, solamente, como paso previo para hallar la desviación típica, que es la medida de dispersión más importante.

- Coeficiente de variación: para poder comparar la dispersión de dos poblaciones muy distintas, no es buena la desviación típica. Por eso se define una nueva medida de dispersión, llamada coeficiente de variación:

Al dividir la desviación típica, entre la media, , se está relativizando la variación.

Así como la media y la desviación típica se dan en las unidades en que vienen dados los datos, el coeficiente de variación es un número abstracto (no tiene unidades)

Agrupación de datos en torno a la media

En distribuciones con una sola moda y bastante simétricas se verifica que:  En el intervalo se encuentra el 68% de los datos.

 En el intervalo se encuentra el 95% de los datos.  En el intervalo se encuentra el 99% de los datos

Ejemplo:

Los pesos de los toros de lidia de una ganadería se distribuyen con una media kg y una desviación típica kg.

Los peso de los perros de una exposición canina se distribuyen con una media kg y una desviación típica kg.

La desviación típica de los pesos de la manada de toros bravos es superior que la de los perros. Sin embargo, esos 25 kg son poca cosa para el enorme peso de los toros, mientras que 10 kg sen relación con el peso de un perro es mucho.

Los respectivos coeficientes de variación son:

A veces el coeficiente de variación se da en tantos por ciento. En este caso, sería:

Con este parámetro se ve claramente que el peso de los perros de la exposición canina es mucho más disperso que el de los toros de la manada.

(6)

Vamos a calcular estos parámetros en el ejemplo visto anteriormente sobre la altura de 40 personas, para ello nos construimos la siguiente tabla de frecuencias:

Intervalos

[148,5, 153,5) 151 2 302 45 602

[153,5, 158,5) 156 4 624 97 344

[158,5 163,5) 161 11 1771 285 131

[163,5, 168,5) 166 14 2 324 385 784

[168,5, 173,5) 171 5 855 146 205

[173,5, 178,5) 176 4 704 123 904

40 6 580 1 083 970

Media:

cm

Varianza:

Desviación típica:

cm.

Medidas de posición para datos aislados

Además de la mediana (valor central de la distribución) también se definen las siguientes medidas de posición:

- Cuartiles: si en lugar de partir la totalidad de los individuos den dos mitades, lo hacemos en cuatro partes iguales (todas ellas con el mismo número de individuos), los dos nuevos puntos de separación se llaman cuartiles.

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

"No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

El tercero tiene notas bajas pero la mayor es estadística, una de las temáticas trabajadas de forma más mecánica, asimismo el último arquetipo muestra que, aun con notas buenas,

A medida que las organizaciones evolucionan para responder a los cambios del ambiente tanto para sobrevivir como para crecer a partir de la innovación (Stacey, 1996), los

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación