REPORTE DE LECTURA U3

(1)

REPORTE DE LECTURA

Elaborado por: Adolfo Cruz Naranjo Fecha: 20/04/13

Bibliografía: (documentada en estilo APA)

I. B. Chístense Howard, Estadística paso a paso, tercera edición, Trillas, 1990 (reimpresión 2008),

II Spiegel Murray, Estadística, segunda edición, McGraw-Hill/Interamericana de España, S,A de C.V., Aravaca (Madrid), McGraw-Hill.

III Spiegel Murray, J. Sthephens Larry Estadística, tercera edición, McGraw-Hill/Interamericana de España, S,A de C.V., México DF, McGraw-Hill.

Grado de confiabilidad (señalar el criterio): Bueno

Fuente: Libro

Autor: B. Chístense Howard, (Estadística paso a paso) R. Spiegel Murray, (Estadística)

R. Spiegel Murray, J. Sthephens Larry (Estadística)

Editorial: McGraw-Hill, CENGAGE LEARNING.

Actualidad: Los autores han publicado más libros que tratan del área de

probabilidad y estadística para las ingenierías y las licenciaturas que servido de mucha ayuda.

Glosario:

Parámetro: Es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística.

Intervalo: Pequeña sección de la escala según la cual se agrupan las puntuaciones de una distribución de frecuencia. Tamaño o rango de la Clase.

Frecuencia: Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.

Preguntas que suscita el texto:

(2)

¿Por qué solo ciertos problemas solo se resuelven con la estadística? ¿Quiénes fueron los primeros en crear la estadística y por qué?

Organizador gráfico

Resumen:

(3)

Estadística (definición): La estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presumir y analizar datos, así como sacar conclusiones válidas y tomar decisiones con base en este análisis.

El término estadística se emplea para referirse a los datos mismos o a valores asociados a estos datos, como por ejemplo los promedios.

Teoría de decisión:

Población:

El termino población se refiere a una colección de medidas de todos los elementos de un universo acerca del que deseamos tener conclusiones o tomar decisiones.

Se obtiene al recolectar datos que determinan las características de un grupo de individuos u objetos, por ejemplo las alturas y lo pesos de los estudiantes de una universidad o la cantidad de piezas defectuosas de una fábrica en un día determinado.

Una empresa puede ser finita o infinita, por ejemplo la población que comprende todas las piezas producidas en un día determinado en una fábrica es finita, mientras la población que consta de todos los resultados posibles (cara o cruz) en lanzamientos sucesivos de una moneda es infinita,

Muestra aleatoria:

Es cualquier subconjunto de la población que estudiamos.

Una muestra aleatoria es una muestra sacada de una población de unidades, de manera que todo elemento de la población tenga la misma probabilidad de selección y que las unidades diferentes se seleccionen independientemente.

Parámetros aleatorios:

Es el número que describe algunas propiedades de una población, cuando una enumeración completa para medir la población total se les llama parámetros a los resúmenes de los datos resultantes. Cuando se mide una muestra de una población al resumen de los datos resultantes se le da el nombre de estadística. Resumiendo la estadística es para la muestra lo que el parámetro es para la población.

Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población.

(4)

Se enfoca en cálculo de la mediana y la moda a partir de datos agrupados y no agrupados. Cálculo de la mediana a partir de datos no agrupados:

Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana.

Si hay un número par de observaciones, la mediana es el promedio de los dos elementos de en medio.

Mediana = (n + 1) / 2

Cálculo de la mediana a partir de datos agrupados:

1. Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más central.

3. Determinar el número de elementos de la clase y la localización de la clase que contiene al elemento mediano.

4. Determinar el ancho de cada paso para pasar de una observación a otra en la clase mediana, dividiendo el intervalo de cada clase entre el número de elementos contenido en la clase.

5. Determinar el número de pasos que hay desde el límite inferior de la clase mediana hasta el elemento correspondiente a la mediana.

6. Calcular el valor estimado del elemento mediano multiplicando el número de pasos que se necesitan para llegar a la observación mediana por el ancho de cada paso. Al producto sumarle el valor del límite inferior de la clase mediana.

7. Si existe un número par de observaciones en la distribución, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso número 6.

Frecuencia de clase:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentra ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

(5)

los mismos.

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.

Frecuencia relativa:

La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

Punto medio:

El punto medio de un intervalo se puede obtener de varias formas. Posiblemente la más fácil consiste en sumar los límites inferiores de dos intervalos consecutivos y dividir entre dos.

Límites:

Límite finito: Se dice que la función y = f(x) tiene por límite l cuando x tiende hacia a, y se representa por lim 𝑥→𝑎 𝑓(𝑥) = 1 (Es decir, que si fijamos un entorno de l de radio E, podemos encontrar un entorno de a de radio 𝛿, que depende de E, de modo que para cualquier valor de x que esté en el entorno E(a, 𝛿) exceptuando el propio a, se tiene que su imagen f(a) está en el entorno E(l,E).)

A2) Límite infinito: (A partir de ahora usaremos la notación matemática para hacer más corta la definición).

Se dice que lim 𝑥→𝑎 (𝑥) = +∞𝑠𝑖𝑝𝑎𝑟𝑎𝑐𝑎𝑑𝑎𝑘𝑟𝑒𝑎𝑙∃𝛿 > 0 0< |𝑥−𝑎| < 𝛿 => 𝑓(𝑥) > 𝑘.

𝑆𝑒𝑑𝑖𝑐𝑒𝑞𝑢𝑒 lim 𝑥→𝑎(𝑥) = −∞𝑠𝑖𝑝𝑎𝑟𝑎𝑐𝑎𝑑𝑎𝑘𝑟𝑒𝑎𝑙∃𝛿 >0 0< |𝑥−𝑎| < 𝛿 => 𝑓(𝑥) < 𝑘.

Medidas de tendencia central o de posición:

Se enfoca en el número que, suele situarse en el centro de la distribución de datos al cual se denomina medida o parámetro de tendencia central o de centralización. En otras palabras cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.

Media aritmética:

(6)

número de sumandos.

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.

Media geométrica: (MG) de una de una cantidad arbitraria de números (n), es la raíz n-sima del producto de todos los números.

𝑴𝑮 = √∏𝒙𝒊𝒏𝒊=𝟏𝒏= √𝒙𝟏∗𝒙𝟐∗𝒙𝟑….𝒙𝒏𝒏

Media ponderada: A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.

Si X1, X2,…Xn son nuestros datos y W1, W2,…Wn son sus "pesos" respectivos, la media ponderada se define de la siguiente forma:

𝑿 =∑𝒙𝒊𝒏𝒊=𝟏∑𝒘𝒊𝒏𝒊=𝟏=𝒙𝟏𝒘𝟏∗𝒙𝟐𝒘𝟐∗ …∗𝒙𝒏𝒘𝒏𝒘𝟏 + 𝒘𝟐 + ⋯+ 𝒘𝒏

Mediana:

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor o viceversa. La media se puede calcular de dos formas según el número de datos (n).

El valor medio único si n es impar:

𝑥 = (𝑛+1 2 ) 𝑛−é𝑠𝑖𝑚𝑜 Valor ordenado.

El promedio de los dos valores medios si n es par:

𝑥 = 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜𝑑𝑒 (𝑛 2) 𝑛−é𝑠𝑖𝑚𝑜𝑦 (𝑛 2+ 1)−é𝑠𝑖𝑚𝑜 Valores ordenados.

Moda: La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta.

Clases de distribuciones de datos:

o Modal: cuando solamente un dato es el de mayor frecuencia.

(7)

Medidas de dispersión: Las medidas de dispersión o medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número las diferentes puntuaciones de una variable.

Varianza: La varianza (𝑆2) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.

𝑆² =1 𝑁− 1= ∑(𝑋𝑖−𝑋)2 𝑛𝑖=1

Desviación estándar: Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por √𝑆.

√𝑺 = √∑(𝒙𝒊−𝒙)𝟐 /𝒏

Desviación media: Incluye todos los datos; es la desviación media a partir de algún valor central.

Y se utiliza para indicar la desviación media desde la media.

𝐃.𝐌 =∑ |𝐱𝐢−𝒙|𝐧𝐢=𝟏 /𝐧

Desviación mediana: Se puede decir, sin necesidad de demostración, que esta desviación es siempre igual o menor que la desviación media.

Se ha de considerado este caso solo para datos sin agrupar (Aunque esta regla se utiliza en raras ocasiones).

𝐃.𝐦 =∑|𝐱𝐢−𝐦|/ 𝐧

Donde “m” representa la mediana de los datos.

Rango: El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios.

𝑅 = 𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛

Parámetros para datos agrupados.

(8)

Para calcular la media de un conjunto de datos agrupados se emplea la siguiente fórmula: Donde:

fi= es la frecuencia de la clase i.

Mi= es la marca de clase del intervalo i. K= número de intervalos.

Distribución de frecuencias:

Es la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.

Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

Características:

• Una distribución de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. • Ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada.

• La tabla de frecuencias puede representar gráficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores.

• La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

(9)

Frecuencia relativa acumulada.

Distribución de frecuencias agrupadas.

Técnicas de agrupación de datos: Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se agrupan los datos.

a.- Determinar el rango o recorrido de los datos.

b.- Establecer el número de clases (k) en que se van a agrupar los datos. c.- Determinar la amplitud de clase para agrupar (C).

C=Rango/K

d.- Formar clases y agrupar datos.

Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.

Técnicas de muestreo:

Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección).

Cuando este último cumple con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, recibe el nombre de muestreo probabilístico.

Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.

(10)

Algunos datos numéricos se obtienen contando para determinar el valor de una variable, mientras que otros datos se obtienen tomando mediciones. La prescripción para trazar un histograma es en general diferente en estos dos casos: