REPORTE DE LECTURA
Elaborado por: Sabino Cortes Olmos Fecha: 18 de Abril 2013
Bibliografía: (documentada en estilo APA)
Jay L. Devore(2008)probabilidadyestadisticasparaingenierosycienciasSeptimaEdicionEDITEC, S.AdeC.V Murray R.Spiegel, Larry Stephens (2001) EstadisticaTerceraEdicionMCGRAWHILL.
Grado de confiabilidad (señalar el criterio):
Fuente: Libros.
Autor: Jay L. Devore, Murray r. Spiegel, Larry J. Stephens. Editorial: EDITEC, S.A de C.V, MCGRAWHILL.
Actualidad: Son recientes los libros y la información adquirida de ellos ya que fueron publicados en los años 2001 y 2008.
Glosario:
Parámetro: Parámetro estadístico; una función definida sobre valores numéricos que caracteriza una población o un modelo.
Distribución de frecuencia: Es el agrupamiento de datos en diversos semi-grupos dando a conocer también el número de veces que aparece en la muestra cada dato.
Preguntas que suscita el texto:
¿A qué se refiere la estadística descriptiva?
¿Por qué es necesario conocer el significado de los conceptos de estadística descriptiva? ¿Por qué debemos conocer el tipo de variables en estadística descriptiva?
¿Por qué es necesario conocer el límite de una población?
¿Qué tipo de poblaciones existen y cuál es la importancia de estos datos?
¿Por qué es importante la recopilación de datos ya sean datos agrupados o no agrupados? ¿Cuáles son las diferentes formas de sacar la media?
¿Cuáles son los métodos para describir la localización de un conjunto de datos? ¿Cuál es la diferencia de la frecuencia de clase y la frecuencia relativa?
Organizador gráfico:
Teoría de decisión Población
Conceptos de
estadística Muestra aleatoria Parámetros aleatorios
Datos agrupados Datos no agrupados
Frecuencia de clase Descripción
de datos Frecuencia relativa Punto medio
Limites
Media aritmética Estadística
Descriptiva
Geométrica Media Moda Medidas de
Tendencia Medidas de dispersión Varianza
Desviación estándar Desviación mediana Rango
Parámetros para datos agrupados
Frecuencia absoluta, relativa, acumulada, relativa acumulada, agrupadas.
Distribuciones de frecuencias
Teoría de decisión:
Se puede decir que la Teoría de decisión es una de las ramas que sirve para que al dar un paso, no se vaya a dar en falso, Porque si se conoce de esta no hay el porqué de equivocarse.
Población:
Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes. Es una colección bien definida de objetos.
Otra forma de clasificar a la población es en concreta; es decir aquella que denota una población existente y la población hipotética es decir que en realidad no existe.
Muestra aleatoria:
Una muestra aleatoria es aquella que se selecciona como un subconjunto de una población para ser analizada con mayor facilidad.
Es importante saber qué es lo que realmente nos importa conocer en una población ya que existen variables; es decir características cuyo valor pueden cambiar de un objeto a otro en una población.
Parámetros aleatorios:
Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población.
DESCRIPCION DE DATOS
Datos agrupados y no agrupados:
Cuando la muestra que se ha tomado de la población o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
Cuando la muestra consta de 20 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada
Frecuencia de clase:
Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.
Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra.
Donde N = Tamaño de la muestra
Punto medio:
Punto medio de clase o marca de clase: Para fines de análisis de datos, los valores de las clases se representan a través del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los límites de clase. El punto medio de clase se identifica como Xi, donde Xi = ½ (limite superior + límite inferior).
Límites:
Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
MEDIDAS DE TENDENCIA CENTRAL
Se enfoca en el número que, suele situarse en el centro de la distribución de datos al cual se denomina
medida o parámetro de tendencia central o de centralización.Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.
Media aritmética:
La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos.
La fórmula que se utiliza para sacar la media aritmética es:
Geométrica y ponderada:
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.
Si X1,X2,…Xn son nuestros datos y W1,W2,…Wn son sus "pesos" respectivos, la media ponderada se define de la siguiente forma:
Mediana:
La media geométrica (MG) de una de una cantidad arbitraria de números (n), es la raíz n-sima del producto de todos los números.
MG=
√
n∏
i=1 n
xi=
√
nx1∗x2∗x3… . xnModa:
La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. Clases de distribuciones de datos:
Modal. Bimodal. Multimodal.
Mediana:
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor.
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales.
Medidas de dispersión:
indicando por medio de un número las diferentes puntuaciones de una variable.
Varianza:
La varianza (S2) es una medida estadística que mide la dispersión de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones.
S2
= 1
N−1=
∑
i=1n
(
Xi−X)
2Desviación estándar:
Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por
√
S.σ=
√
∑
(
xi−x)
2
n
Desviación media:
Incluye todos los datos; es la desviación media a partir de algún valor central. • Y se utiliza para indicar la desviación media desde la media.
•
D . M=∑
i=1 n¿xi−x∨¿
n ¿
• xi−x significa que no se tienen en cuenta los signos menos (se toma el valor absoluto de las desviaciones).
Desviación mediana:
• Se puede decir, sin necesidad de demostración, que esta desviación es siempre igual o menor que la desviación media.
• Se ha de considerado este caso solo para datos sin agrupar (Aunque esta regla se utiliza en raras ocasiones).
•
D . m=∑
¿xi−m∨¿n ¿
Rango:
En estadística descriptiva se denomina rango estadístico (R) o recorrido estadístico al intervalo a la diferencia entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Por ejemplo, para una serie de datos de carácter cuantitativo, como lo es la estatura medida en centímetros, tendríamos:
PARAMETROS PARA DATOS AGRUPADOS
Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se agrupan los datos.
DISTRIBUCION DE FRECUENCIAS
Se llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase
Una distribución de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representar gráficamente en un histograma(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
TECNICAS DE AGRUPACION DE DATOS
Rango = Valor mayor – Valor menor
b.- Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente tabla
Tamaño de muestra o No. De datos Número de clases
Menos de 50 5 a 7
50 a 99 6 a 10
100 a 250 7 a 12
250 en adelante 10 a 20
El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo.
c.- Determinar la amplitud de clase para agrupar (C).
k
Rango
C
d.- Formar clases y agrupar datos.