• No se han encontrado resultados

Clase1 Estadística Inferencial

N/A
N/A
Protected

Academic year: 2020

Share "Clase1 Estadística Inferencial"

Copied!
29
0
0

Texto completo

(1)

Estad

(2)

Una muestra tomada de una poblaci

Una muestra tomada de una poblaci

ó

ó

n s

n s

ó

ó

lo puede ser de valor mientras

lo puede ser de valor mientras

nos permita formar un juicio sobre las condiciones

nos permita formar un juicio sobre las condiciones

y caracter

y caracter

í

í

sticas de

sticas de

la poblaci

la poblaci

ó

ó

n a la que

n a la que

é

é

sta

sta

pertence

pertence

(Gosset, 1908).

(Gosset, 1908).

(3)

¿Le crees al

encabezado de

estas gráficas?

(4)

Introducci Introducciónón

Estad

Estadísticaística: En el lenguaje común (por ejemplo en las crónicas deportivas) es

conocida como un conjunto de datos. Se refiere a un conjunto de métodos para manejar la obtención, presentación y el análisis de observaciones numéricas. Sus fines son: Describir al conjunto de datos obtenidos y tomar decisiones, o bien, realizar generalizaciones acerca de las características de todas las posibles observaciones bajo consideración.

(5)

Existen muchas definiciones dependientes de sus aplicaciones, pero en el fondo todas ellas coinciden de una u otra forma en el que la estadística “es un método

científico de operar con los datos y de interpretarlos”.

De la definición anterior pueden percibirse dos grandes áreas de acción de la Estadística:

Si tenemos la posibilidad de conocer a todos y cada uno de los integrantes de una población a la cual queremos estudiar, entonces usaremos los métodos de la

Estad

Estadíística Descriptivastica Descriptiva, que incluye la obtención, organización, presentación y descripción de la información numérica.

Pero si no nos es posible conocer a toda la población entonces tomaremos una muestra de ella, la estudiaremos y se sacarán conclusiones que se extrapolarán a toda la población

,

para lo que se usarán los métodos de la EstadEstadíística stica Inferencial. Inferencial

Estad

Estad

í

í

stica Descriptiva

stica Descriptiva

(6)

Estadística Descriptiva. Se refiere a aquella parte del estudio que incluye la

obtención, organización, presentación y descripción de la información numérica.

Estadística Inferencial. Es una técnica de la cual se obtienen generalizaciones o se

(7)

Los conceptos básicos de Probabilidad y de distribuciones muestrales sirven como introducción al mal méétodo de Inferencia Estadtodo de Inferencia Estadíísticastica; esta se compone en dos áreas:

La estimación se encarga de buscar establecer los valores de los parámetros de la población.

Las pruebas de Hipótesis constituyen un proceso relacionado con aceptar o rechazar afirmaciones acerca de los parámetros de la población.

Los dos pasos anteriores se pueden resumir diciendo que el propósito es hacer

inferencias

inferencias sobre la población a partir de una muestra y estmar la confianza con la que estas inferencias pueden ser verdaderas.

Pruebas de Hip

Pruebas de Hip

ó

ó

tesis

tesis

(8)

Para poder entablar las bases de lo que conlleva un estudio estadístico necesitamos algunas definiciones:

Poblaci

Poblacióónn. Conjunto de todas las posibles observaciones. Sinónimo de Conjunto

Universal se le define como la totalidad de todas las posibles mediciones

observables, bajo consideración en una situación dada por determinado problema, circunstancias diferentes implican situaciones diferentes.

Las Poblaciones se clasifican en función a su cardinalidad (cuantificación).

Población Finita. Es aquella que incluye un número limitado de medidas y

observaciones.

Población Infinita. Es aquella que por incluir un gran número de medidas y

observaciones no es posible determinar la cantidad de éstas.

En lo general, las características medibles de una población son denominadas

Parámetros.

Muestra

Muestra. Es un conjunto de observaciones o medidas tomadas a partir de una

población dada, es decir, es un subconjunto de la población. Desde luego, la

(9)

A pesar de que puede existir una población de un tamaño específico (generalmente grande), lo que tenemos a la mano es una parte de dicha una parte de dicha poblaci

(10)

Cuando la estad

Cuando la estadíística causa problemas: stica causa problemas

Yule(1926) descubrió una relación positiva muy estrecha entre la tasa de matrimonios realizados por la iglesia de Inglaterra y la tasa de mortalidad en el país. En otro caso, se encontró una alta relación entre el número de ministros religiosos ordenados y el número de nacimientos.

Ambos casos son resultado de estudios estadísticos serios

(11)

Sumatoria

La sumatoria se denota con el símbolo

Se usa para indicar una suma de términos, por ejemplo:

=

+

+

+

+

=

n i n i

x

x

x

x

x

1 3 2 1

...

Ejemplo:

si queremos sumar los siguientes valores:

1

x x2 x3 x4 x5 x6

3 2 4 2 1 3

a)

= + = 3 2 3 2 i

i x x

x

= + = 3 2 4 2 i i

x

= = 3 2 6 i i x

b)

= + + + + + = 6 1 6 5 4 3 2 1 i

i x x x x x x

x

= + + + + + = n i i x 1 3 1 2 4 2 3

= = n i i x 1 15 Repaso de Conceptos B

(12)

Actividad 1 Calcular las siguientes sumatorias:

a)

=

=

7

1

i

i

x

b)

=

=

5

1

2

i

i

x

c)

=

4

1

)

4

(

3

i

i

x

1

x

x

2

x

3

x

4

x

5

x

6

x

7

(13)

Distribuci

Distribucióón de frecuencias.n de frecuencias.

Cuando los datos son numerosos, es conveniente agruparlos para que la información sea más fácil de interpretar. El primer tipo de agrupación se hace contando el número de veces que se repite cada valor, a lo que se le llama frecuencia.

Ejemplo: Se midieron las estaturas en cm de las alumnas de 1° de Secundaria y nos reportan los datos siguientes:

(14)

Actividad 2. Ordenar los datos anteriores y anotar sus frecuencias.

Con los datos anteriores se van a formar lo que se conoce como una Tabla de Tabla de Distribuci

(15)

Tabla de Distribución de Frecuencias de las estaturas de las niñas de 1° de

Secundaria

X Frecuencia

X Frecuencia

X Frecuencia

125 / 1

126 0

127 0

128 0

129 0

130 0

131 // 2

132 // 2

133 0

134 0

135 0

136 / 1

137 //// 5

138 /// 3

139 //// / 6

140 /// 3

141 // 2

142 //// 5

143 //// /// 8

144 //// // 7

145 //// /// 8

146 //// / 6

147 //// 4

148 //// 4

149 //// 5

150 /// 3

151 //// 4

152 //// / 6

153 //// 4

154 //// 5

155 // 2

156 0

157 /// 3

158 //// 4

159 /// 3

160 / 1

161 0

162 / 1

(16)

Tabla de Distribuci

Tabla de Distribucióón de Frecuencias de Datos Agrupadosn de Frecuencias de Datos Agrupados

Con una distribución de frecuencias podemos ya ver algunas características de los datos, pero no podemos tener una visión integral de su comportamiento.

Para ello vamos a construir lo que se conoce como una tabla de distribución de frecuencias de datos agrupados. Esto es agrupar datos en “clases”.

Un IntervaloIntervalo o claseo clase es un subconjunto de todos los datos enmarcado entre dos valores. La Marca de claseMarca de clase se llama al valor intermedio del intervalo, es el que va a representar a todos los valores que caigan en el intervalo.

Los datos anteriores pueden agruparse por intervalos de clases (pensemos en cajitas) e indicar el número de datos que contiene cada clase (frecuencia), de la forma similar a lo que hicimos en las gráficas de barras. A esta distribución se le llama distribucidistribucióón de n de frecuencias agrupadas

(17)

A continuación se dan algunas recomendaciones para construir este tipo de tabla

1. El número total de intervalos de clase no deberá ser menor que 6 ni mayor de 20 para no perder la ventaja de visualización de los datos.

2. El número de intervalos deberá aproximarse a la raíz cuadrada del número total de datos

3. Los puntos medios o marcas de clase deberán tener el mismo número de dígitos de los datos en bruto

4. La longitud del intervalo deberá ser impar para que los extremos del intervalo no incluyan datos observados

5. Las marcas de clase deberán ser fáciles de manejar

(18)

Ahora, para hacer la agrupación de los datos se siguen los siguientes pasos:

1° se calcula el rango (R) que es la diferencia entre los valores extremos de los datos

si éste no es entero se tiene que redondear al entero superior,

Ejemplo (las estaturas): Si y entonces R = 162 -125 = 37

2° Se elige el número de intervalos, debemos escoger el número de intervalos de clase entre 6 y 20, podemos tener una buena idea del número adecuado de intervalos

aplicando la recomendación de que

Ejemplo: Si N =108, entonces , con lo que el intervalo quedaría con la siguiente longitud

pero como no es impar se tiene que cambiar el número de intervalos

inf sup

X

X

R

=

162

sup =

X Xinf =125

(19)

Si usamos 9 intervalos, entonces por lo que estaríamos en la misma situación (no es impar), y tenemos que buscar otro número de intervalos.

Empleando 8 intervalos nos da y como es impar podemos usar éste número de intervalos.

3° Una vez que se decidió el número de intervalos y la longitud de éstos para empezar a formarlos vemos cuál es el nuevo rango que nos da el número de intervalos

multiplicado por la longitud, siendo en el caso del ejemplo

con lo que tenemos 4 elementos más de los que teníamos originalmente y debemos decidir cómo distribuirlos, preferiblemente de manera equilibrada, es decir, en el caso del ejemplo dos al principio y dos al final, lo que hace necesario iniciar el conteo en 123 y terminar en 164.

4° Para asegurarnos de que ningún dato queda en los extremos de los intervalos nos moveremos media unidad.

Para el ejemplo entonces vamos a empezar en 123.5 y terminaremos en 164.5 4 9 36 = = i 5 5 . 4 8

36 =

= i

40

8

5

=

=

=

i

n

(

)

(20)

Actividad 3. Construir una tabla con las características anteriores usando los datos de las estaturas de niñas de secundaria.

Intervalos de clase Estaturas en centímetros

Marca de clase Frecuencia Alumnos 123.5 -128.5

128.5 -133.5 133.5 -138.5 138.5 -143.5 143.5 -148.5 148.5 -153.5 153.5 -158.5 158.5 -163.5

126 131 136 141 146 151 156 161

1 4 9 24 29 22 14 5

(21)

Histograma de Frecuencias Histograma de Frecuencias

Se llama Histograma de frecuencias a la gráfica en la que en el eje de las abscisas se grafican los intervalos y en el de las ordenadas se grafican las frecuencias.

Para nuestro ejemplo:

Histograma de Frecuencias de las Estaturas de las Niñas de 1° de Secundaria

29

24

22

14

9

5 4

1

(22)

Pol

Políígono de Frecuenciasgono de Frecuencias

Se llama polígono de frecuencias a la poligonal que une los puntos medios de los

extremos superiores de las barras (marcas de clase) empezando en una marca de clase antes y terminando una después. Muchas veces se grafican el histograma y el polígono de frecuencia juntos, para lo cual se tiene que agregar a la tabla de distribución de frecuencias agrupada la columna con las marcas de clase.

Polígono de Frecuencias de las Estaturas de las Niñas de 1° de Secundaria

30

15

(23)

Medidas de tendencia central Medidas de tendencia central

Al ver las tablas de frecuencias se hizo evidente que algunos datos se repiten más que otros, al ver las gráficas de frecuencias se puede observar fácilmente la tendencia a repetirse los valores en vecindarios.

Por lo general la mayor densidad de datos se encuentra en la parte central de la gráfica y cada que nos alejemos del centro va disminuyendo la frecuencia en que aparecen los datos, de igualmente de ambos lados, formando una curva parecida a una campana, a lo que se llama comportamiento “normal”.

En el ejemplo anterior se tiene un ligero sesgo positivo ( hacia la izquierda), pero para dar más sentido a estas observaciones y poder hacer comparaciones con otras

poblaciones se ideó que se pueden medir el promedio de una población, o el valor que más se repite en ella, o el valor que queda al centro de nuestra población los que nos pueden ayudar a ver que tan “normal” es nuestra distribución.

Podemos pensar que si estas tres medidas son muy parecidas entre sí, entonces la

(24)

Ahora estudiaremos estas medidas que se conocen como medidas de tendencia central que son la media aritmética, la mediana y la moda, vamos a ver que se diferencian para datos agrupados o no. En datos no agrupados, las definiremos como:

Moda

Moda Es el valor del dato que más se repite Mediana

Mediana El valor que queda en la mitad de la muestra Media

Media Promedio aritmético de nuestros datos

Para el ejemplo:

Moda= en este caso son 143 y 145, es multimodal

Mediana. , por lo que la Mediana = 145 (se cuentan los datos hasta llegar al dato 54)

Media =

54

2

108

2

=

=

=

N

n

34

.

146

108

15805

=

=

N

x

(25)

Actividad 4. Calcular la moda, la mediana y la media de los datos que se presentan a continuación Dato Frecuencia Dato Frecuencia Dato Frecuencia Dato Frecuencia

1. 1

2. 1

3. 1

4. 2

5. 1

6. 5

7. 5

8. 4

9. 5

10. 6

11. 7

12. 7

13. 7

14. 4

15. 4

16. 4

17. 5

18. 5

19. 4

20. 2

21. 2

22. 1

23. 1

24. 1

25. 5

26. 1

27. 0

28. 1

29. 1

30. 2

31. 0

32. 1

33. 1

34. 1

35. 0

36. 0

37. 0

38. 1

39. 0

40. 1

Total 100

(26)

Moda: son 11, 12 y 13 por lo que se denomina multimodal

Mediana: 50 2

100

2 = =

= N

n

Mediana

=

13

Media:

100

=

=

N

x

(27)

Dato

Frecuencia

Dato

Frecuencia

Dato

Frecuencia

Dato

Frecuencia

223.7 1

224.4 1

226.9 1

232.3 1

232.7 1

233.5 1

237.4 1

239.9 1

243.6 1

247.2 1

248.3 1

249.2 1

252.8 1

253.6 1

256.3 1

256.5 1

258.8 1

260.4 1

264.3 1

265.1 1

267.5 1

269.6 1

271.4 1

278.7 1

294.1 1

Total 25

(28)

Moda: no hay moda

Mediana: 13

2 1 25 2

1 = + =

+ = N

n Mediana = 252.8

Media:

100

= =

N x

(29)

Tarea 1. Calcular la Moda, Mediana y Media de los siguientes datos y elaborar una tabla de distribución de frecuencias acumuladas, un histograma y

polígono de frecuencias y una ojiva de frecuencias relativas acumuladas.

Tabla de Distribución de Frecuencias de distancias alcanzadas por pelotas de golf nuevas

Dato Frecuencia Dato Frecuencia Dato Frecuencia Dato Frecuencia

223.7 1

224.4 1

226.9 1

232.3 1

232.7 1

233.5 1

237.4 1

239.9 1

243.6 1

247.2 1

248.3 1

249.2 1

252.8 1

253.6 1

256.3 1

256.5 1

258.8 1

260.4 1

264.3 1

265.1 1

267.5 1

269.6 1

271.4 1

278.7 1

294.1 1

Referencias

Documento similar

Tras establecer un programa de trabajo (en el que se fijaban pre- visiones para las reuniones que se pretendían celebrar los posteriores 10 de julio —actual papel de los

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Todo el material elaborado a lo largo de la investigación, es decir, la nueva cartografía y los textos escritos en diversas formas —la descripción de los condicionantes geográficos

Sin embargo, esta interpretación ecomorfológica cuenta con una evidencia en contra, ya que en venta Micena está presente una especie de Praeovibos que exhibe también una gran

SUPLEMENTO ALIMENTICIO The TEAX es un delicioso té sabor manzana canela, que contiene ingredientes que pue- den ayudar a eliminar los químicos y toxinas del cuerpo, acelerar

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o