REPORTE DE LECTURA 3

(1)

REPORTE DE LECTURA

Elaborado por: Fecha: José Eduardo Guerrero Maldonado.

Bibliografía: (documentada en estilo APA)

Devore Jay L. (2008) Probabilidad y Estadística para Ingeniería y Ciencias. México Df. Cengage Learning Editores S.A de C.V.

Grado de confiabilidad (señalar el criterio): Fuente: Libros

Autor: Devore Jay L.

Editorial: Cengage Learning Editores S.A de C.V.

Actualidad: California Polytechnic State University, San Luis Obispo.

Glosario:

Parámetro: Parámetro estadístico; una función definida sobre valores numéricos que caracteriza una población o un modelo.

Frecuencia:Repetición mayor o menor de un acto o suceso: le veo con mucha frecuencia.

Número de veces que se repite un proceso periódico en un intervalo de tiempo determinado: pidió información sobre la frecuencia de paso de los autobuses.

1. Número de oscilaciones, vibraciones u ondas por unidad de tiempo en cualquier fenómeno periódico:

frecuencia modulada.

MODA: En estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.

Preguntas que suscita el texto:

¿Qué es la media? ¿Cómo se saca una muestra de población? ¿Qué es una muestra aleatoria? ¿Cuántas medidas de tendencia central hay?

(2)

Resumen:

 Media aritmética

 Geométrica y ponderada  Mediana

 Moda

 Medidas de dispersión  Varianza

 Desviación estándar  Desviación media  Rango

 Datos agrupados  Datos no agrupados  Frecuencia de clase  Frecuencia relativa  Punto medio  Limites  Definición

 Teoría de decisión  Población

 Muestra aleatoria  Parámetros aleatorios

ESTADISTICA DESCRIPTIVA

Conceptos básicos

Descripción de datos

Medidas de tendencia central

Parámetros para datos agrupados

Distribución de frecuencias

Técnicas de

agrupación de datos

(3)

CONCEPTOS BÁSICOS DE ESTADÍSTICA

Definición.

La estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.

Teoría de decisión.

Se puede decir que la teoría de decisión sirve para que al dar un paso, no se vaya a dar en falso, porque si se conoce de ella no hay porque equivocarse.

La teoría de decisión, no solamente se puede ver desde el punto de vista

de un sistema, sino en general, porque esta se utiliza a menudo para tomar decisiones de la vida cotidiana, ya que muchas personas piensan

que la vida es como una de las teorías; La teoría del juego, que para poder empezarlo y entenderlo hay que saber jugarlo y para eso se deben conocer las reglas de este, para que no surjan equivocaciones al empezar la partida.

Población muestra aleatoria.

Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.

El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística y en nuestro caso social, y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita.

Se llama muestra a una parte de la población a estudiar que sirve para representarla es decir una colección de algunos elementos pero no de todos.

Una muestra seleccionada por muestreo de juicio se basa en la experiencia de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra tentativa para decidir cómo tomar una muestra aleatoria más adelante. Las muestras de juicio evitan el análisis estadístico necesario para hacer muestras de probabilidad.

Parámetros aleatorios.

Valor numérico que describe una característica de la población. Los parámetros se estiman a partir de la información aportada por una muestra de población.

Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población.

DESCRIPCIÓN DE DATOS Datos agrupados.

Las características de los elementos de una población pueden ser de tipo cualitativo o de tipo cuantitativo. En el primer caso se trata de cualidades que distinguen un elemento de otro y lo ubican en clases independientes separadas. Las propiedades de tipo cuantitativo son aquellas que pueden medirse o contarse.

(4)

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase.

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total de valores de las variables que se encuentran presente en una clase determinada, de una distribución de frecuencia de clase.

Frecuencia relativa.

La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamaño de la muestra.

Donde N= tamaño de la muestra:𝑛_𝑖 = 𝑓𝑖

𝑁 Punto medio.

Punto medio de clase o marca de clase: Para fines de análisis de datos, los valores de las clases se representan a través del punto medio de clase o marca de clase. El punto medio de clase se define como la semi-suma de los límites de clase. El punto medio de clase se identifica como Xi, donde Xi = ½ (límite superior + límite inferior).

Limites.

Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.

MEDIDAS DE TENDENCIA CENTRAL.

Se enfoca en el número que, suele situarse en el centro de la distribución de datos al cual se denomina medida o parámetro de tendencia central o de centralización.

Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.

Media aritmética.

La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumandos.

La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.

La fórmula que se utiliza para sacar la media aritmética es:

Geométrica y ponderada.

(5)

Si X1,X2,…Xn son nuestros datos y W1,W2,…Wn son sus "pesos" respectivos, la media ponderada se define de la siguiente forma:

Mediana.

La media geométrica (MG) de una de una cantidad arbitraria de números (n), es la raíz n-sima del producto de todos los números.

𝑴𝑮 = √∏ 𝒙𝒊

𝒏

𝒊=𝟏

𝒏

= √𝒙𝟏 ∗ 𝒙𝟐 ∗ 𝒙𝟑 … . 𝒙𝒏𝒏

Moda.

La moda es el dato más repetido, el valor de la variable con mayor frecuencia absoluta. Clases de distribuciones de datos:

 Modal.

 Bimodal.

 Multimodal.

Mediana.

La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor.

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales.

Medidas de dispersión.

Las medidas de dispersión o medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número las diferentes puntuaciones de una variable.

Varianza.

La varianza (𝑆2) es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.

𝑺𝟐 = 𝟏

𝑵 − 𝟏= ∑(𝑿𝒊 − 𝑿̅)

𝟐 𝒏

(6)

Desviación estándar.

Se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Esta medida viene representada en la mayoría de los casos por √𝑆.

𝜎 = √∑(𝑥𝑖 − 𝑥̅)

2

𝑛

Desviación media.

Incluye todos los datos; es la desviación media a partir de algún valor central.

 Y se utiliza para indicar la desviación media desde la media.

 D. M =∑ |xi−𝑥̅|

n i=1

n

 xi − 𝑥̅ significa que no se tienen en cuenta los signos menos (se toma el valor absoluto de las desviaciones).

Desviación mediana.

 Se puede decir, sin necesidad de demostración, que esta desviación es siempre igual o menor que la desviación media.

 Se ha de considerado este caso solo para datos sin agrupar (Aunque esta regla se utiliza en raras ocasiones).

 D. m =∑ |xi−m|

n

 Donde “m” representa la mediana de los datos.

Rango.

En estadística descriptiva se denomina rango estadístico (R) o recorrido estadístico al intervalo a la diferencia entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.

Por ejemplo, para una serie de datos de carácter cuantitativo, como lo es la estatura medida en centímetros, tendríamos:

PARÁMETROS PARA DATOS AGRUPADOS.

(7)

Estos datos seleccionados se denominan características de la distribución o parámetros estadísticos.

DISTRIBUCION DE FRECUENCIAS.

En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas.

 Una distribución de frecuencias es un formato tabular en la que se organizan los datos en clases, es decir, en grupos de valores que describen una característica de los datos y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases.

 La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En

principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos junto con el número de veces que aparece, es decir,

su Frecuencia. Se puede complementar la frecuencia absoluta con la

denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la frecuencia

simple y la frecuencia acumulada.

 La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia

correspondiente.

Tipos de frecuencias.

 Frecuencia absoluta.

 Frecuencia relativa.

 Frecuencia acumulada.

 Frecuencia relativa acumulada.

 Distribución de frecuencias agrupadas.

Técnicas de agrupación de datos.

a.- Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor

b.- Establecer el número de clases (k)en que se van a agrupar los datos tomando como base para esto la siguiente tabla:

Tamaño de muestra o No. De datos Número de clases

(8)

50 a 99 6 a 10

100 a 250 7 a 12

250 en adelante 10 a 20

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de clases en las que se van a agrupar los datos, existen otros para hacerlo. c.- Determinar la amplitud de clase para agrupar (C).

𝐶 =𝑅𝑎𝑛𝑔𝑜

𝑘

d.- Formar clases y agrupar datos.

Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y así sucesivamente.

TÉCNICAS DE MUESTREO.

La teoría del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la distribución de un carácter en dicha población y las distribuciones de dicho carácter en todas sus muestras.

Las ventajas de estudiar una población a partir de sus muestras son principalmente:

Coste reducido:

Si los datos que buscamos los podemos obtener a partir de una pequeña parte del total de la población, los gastos de recogida y tratamiento de los datos serán menores. Por ejemplo, cuando se realizan encuestas previas a un referéndum, es más barato preguntar a 4.000 personas su intención de voto, que a 30.000.000;

Mayor rapidez:

Estamos acostumbrados a ver cómo con los resultados del escrutinio de las primeras mesas electorales, se obtiene una aproximación bastante buena del resultado final de unas elecciones, muchas horas antes de que el recuento final de votos haya finalizado;

Más posibilidades:

Para hacer cierto tipo de estudios, por ejemplo el de duración de cierto tipo de

bombillas, no es posible en la práctica destruirlas todas para conocer su vida media, ya que no quedaría nada que vender. Es mejor destruir sólo una pequeña parte de ellas y sacar conclusiones sobre las demás.

HISTOGRAMAS.

(9)

que otros datos se obtienen tomando mediciones (peso de un individuo). La prescripción para utilizar un histograma es en general diferente de estos casos.

Construcción de un histograma para datos discretos.

En primer lugar, se determina la frecuencia y la frecuencia relativa de cada valor x. Luego se marcan los valores x posibles en una escala horizontal. Sobre cada valor, se traza un rectángulo cuya altura es la frecuencia relativa (o alternativamente, la frecuencia) de dicho valor.