UNIDAD 3 PROBABILIDA Y ESTADISTICA

(1)

REPORTE DE LECTURA

Elaborado por: ROCIO PEREZ MEZA. Fecha: 18/ABRIL/2013

Bibliografía: (documentada en estilo APA)

B. Chístense Howard, Estadística paso a paso, tercera edición, Trillas, 1990 (reimpresión 2008), L. Devore Jay (2008), Probabilidad y estadística para ingeniería y ciencias, séptima edición, Cengage Learning editores S.A de C.V, México D.F, CENGAGE Learning.

R. Spiegel Murray, Estadística, segunda edición, McGraw-Hill/Interamericana de España, S, A de C.V., Aravaca (Madrid), McGraw-Hill.

R. Spiegel Murray, J. Sthephens Larry Estadística, tercera edición, McGraw-Hill/Interamericana de España, S.A de C.V., México DF, McGraw-Hill.

Grado de confiabilidad (señalar el criterio): Fuente: libros de texto.

Autor: B. Chístense Howard, (Estadística paso a paso) R. Spiegel Murray, (Estadística) Editorial: McGraw-Hill, CENGAGE LEARNING.

Glosario:

Valores adyacentes: Valores que están muy próximos o unidos a otra cosa

Intervalo: Es un conjunto comprendido entre dos valores. Específicamente, es una porción de recta entre dos valores dados.

Muestreo: la técnica para la selección de una muestra a partir de una población

Preguntas que suscita el texto:

¿Se podría decir que no hay moda cuando una gran cantidad de datos están repetidas la misma cantidad de veces?

¿Qué enfoque tienen las medidas de dispersión en la vida diaria? ¿Qué papel desenvuelven los límites en la estadística?

(2)

Organizador gráfico

Conceptos básicos de estadística.

Muestra y parametros aleatorios.

DATOS: Agrupados y no

agrupados

ESTADISTICA Poblacion

Conceptos basicos de estadistica

Poblacion

Muestra y parmetro aleatorio

DATOS: Agrupaos y no

Agrupados FRECUENCIA:

-De clase y Relativa Punto medio

(3)

MEDIDAS DE TENDECIA

CENTRAL

Media Mediana

Moda Media

Geometrica Medi

Ponderada

MEDIDAS DE DISPERSION

Desviacio Media

Desviacion

Estandar Varianza

Desviacion Mediana

Rango

PARAMETROS DE AGRUPACION DE

DATOS

Parametros paradatos agrupados

y no agrupados

Distribucion de

frecuecias Histogramas

(4)

RESUMEN

Conceptos básicos de estadística:

Estadística (definición): La estadística se ocupa de los métodos científicos para recolectar, organizar, resumir, presumir y analizar datos, así como sacar conclusiones válidas y tomar decisiones con base en este análisis.

E termino estadística se emplea para referirse a los datos mismos o a valores asociados a estos datos, como por ejemplo los promedios.

Teoría de decisión:

Población:

El termino población se refiere a una colección de medidas de todos los elementos de un universo acerca del que deseamos tener conclusiones o tomar decisiones.

Se obtiene al recolectar datos que determinan las características de un grupo de individuos u objetos, por ejemplo las alturas y lo pesos de los estudiantes de una universidad o la cantidad de piezas defectuosas de una fábrica en un día determinado.

Una empresa puede ser finita o infinita, por ejemplo la población que comprende todas las piezas producidas en un día determinado en una fábrica es finita, mientras la población que consta de todos los resultados posibles (cara o cruz) en lanzamientos sucesivos de una moneda es infinita,

Muestra aleatoria: Es cualquier subconjunto de la población que estudiamos.

Una muestra aleatoria es una muestra sacada de una población de unidades, de manera que todo elemento de la población tenga la misma probabilidad de selección y que las unidades diferentes se seleccionen independientemente.

Parámetros aleatorios:

Es el número que describe algunas propiedades de una población, cuando una enumeración completa para medir la población total se les llama parámetros a los resúmenes de los datos resultantes. Cuando se mide una muestra de una población al resumen de los datos resultantes se le da el nombre de estadística. Resumiendo la estadística es para la muestra lo que el parámetro es para la población.

(5)

Descripción de datos:

Se enfoca en cálculo de la mediana y la moda a partir de datos agrupados y no agrupados. Cálculo de la mediana a partir de datos no agrupados:

Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden

descendente o ascendente. Si el conjunto de datos contiene un número impar de elementos, el de en medio en el arreglo es la mediana.

Si hay un número par de observaciones, la mediana es el promedio de los dos elementos de en medio.

Mediana = (n + 1) / 2

Cálculo de la mediana a partir de datos agrupados:

1. Encontrar qué observación de la distribución está más al centro (Mediana = (n + 1) / 2). 2. Sumar las frecuencias de cada clase para encontrar la clase que contiene a ese elemento más central.

3. Determinar el número de elementos de la clase y la localización de la clase que contiene al elemento mediano.

4. Determinar el ancho de cada paso para pasar de una observación a otra en la clase mediana, dividiendo el intervalo de cada clase entre el número de elementos contenido en la clase. 5. Determinar el número de pasos que hay desde el límite inferior de la clase mediana hasta el elemento correspondiente a la mediana.

6. Calcular el valor estimado del elemento mediano multiplicando el número de pasos que se necesitan para llegar a la observación mediana por el ancho de cada paso. Al producto sumarle el valor del límite inferior de la clase mediana.

7. Si existe un número par de observaciones en la distribución, tomar el promedio de los valores obtenidos para el elemento mediano calculados en el paso número 6.

Frecuencia de clase:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentra ordenada en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.

Frecuencia relativa:

(6)

Punto medio:

El punto medio de un intervalo se puede obtener de varias formas. Posiblemente la más fácil consiste en sumar los límites inferiores de dos intervalos consecutivos y dividir entre dos.

Límites:

Límite finito: Se dice que la función y = f(x) tiene por límite l cuando x tiende hacia a, y se representa por lim → ( )=1 (Es decir, que si fijamos un entorno de l de radio E, podemos encontrar un entorno de a de radio , que depende de E, de modo que para cualquier valor de x que esté en el entorno E(a, ) exceptuando el propio a, se tiene que su imagen f(a) está en el entorno E(l,E).)

Medidas de tendencia central o de posición:

Se enfoca en el número que, suele situarse en el centro de la distribución de datos al cual se denomina medida o parámetro de tendencia central o de centralización. En otras palabras cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.

Media aritmética:

La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos.

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.

Media geométrica: (MG) de una de una cantidad arbitraria de números (n), es la raíz n-enésima del producto de todos los números.

Media ponderada

A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para determinado estudio. En esos casos se puede utilizar una media ponderada.

(7)

Mediana

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor o viceversa. La media se puede calcular de dos formas según el número de datos (n).

El valor medio único si n es impar: =( +12) −é Valor ordenado.

El promedio de los dos valores medios si n es par:

= ( 2)−é ( 2+1) −é Valores ordenados.

Moda:

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. Clases de distribuciones de datos:

Modal: cuando solamente un dato es el de mayor frecuencia.

Bimodal: cuando dos datos tienen el mismo número de apariciones en nuestra población. Multimodal: cuando existen tres o más repeticiones de datos con el mismo valor de frecuencia.

Medidas de dispersión:

Las medidas de dispersión o medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número las diferentes puntuaciones de una variable.

Varianza: La varianza ( 2) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.

Varianza:

La varianza ( 2) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.

Desviación estándar:

Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por √ .

Desviación media:

Incluye todos los datos; es la desviación media a partir de algún valor central. Y se utiliza para indicar la desviación media desde la media.

Desviación mediana:

Se puede decir, sin necesidad de demostración, que esta desviación es siempre igual o menor que la desviación media.

(8)

Rango:

El rango (R) o recorrido estadístico es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. = −

Parámetros para datos agrupados. Se enfoca en el cálculo de la media cuando los datos están agrupados.

Para calcular la media de un conjunto de datos agrupados se emplea la siguiente fórmula:

fi= es la frecuencia de la clase i.

Mi= es la marca de clase del intervalo i. K= número de intervalos.

Distribución de frecuencias:

Es la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.

Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

Características:

• Una distribución de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases.

Ayuda a agrupar cualquier tipo de dato numérico. En principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que

aparece, es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la denominada

frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia simple y la frecuencia acumulada.

• La tabla de frecuencias puede representar gráficamente en un histograma (Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los intervalos de valores. • La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencias: Frecuencia absoluta. Frecuencia relativa. Frecuencia acumulada.

Frecuencia relativa acumulada.

(9)

Técnicas de agrupación de datos:

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos cómo se agrupan los datos.

a.- Determinar el rango o recorrido de los datos.

b.- Establecer el número de clases (k) en que se van a agrupar los datos. c.- Determinar la amplitud de clase para agrupar (C).

Formar clases y agrupar datos.

Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.

Técnicas de muestreo:

Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección). Cuando este último cumple con la condición de que todos los elementos de la población tienen alguna oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la población es conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra seleccionada por muestreo de juicio puede basarse en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante.

Histogramas:

Algunos datos numéricos se obtienen contando para determinar el valor de una variable, mientras que otros datos se obtienen tomando mediciones. La prescripción para trazar un histograma es en general diferente en estos dos casos:

Una variable es discreta si un conjunto de valores posibles es finito o se puede enumerar en una sucesión infinita (una en la cual existe un primer número, un segundo número, y así