• No se han encontrado resultados

Principios de Estadística

N/A
N/A
Protected

Academic year: 2021

Share "Principios de Estadística"

Copied!
49
0
0

Texto completo

(1)
(2)

Principios de Estadística

Docentes:

Edgardo Rodriguez

Juan Passucci

(3)

Principios de Estadística

Curso:

Teórico-práctico 8.30 hs

Parciales

Promoción

Área

Cartelera

(4)

Estadística

Conjunto de métodos científicos relacionados

con la recolección, presentación y análisis de

datos, para la deducción de conclusiones y la

toma de decisiones objetivas.

Es el arte de la decisión en presencia de

incertidumbre.

(5)

Estadística

Descriptiva

Inductiva o Inferencial

(6)

Estadística Descriptiva

Población:

Conjunto de individuos u objetos que presentan

una característica común observable. Ubicada

en tiempo y espacio

Muestra:

Parte de la población, que mantiene las

características de la misma. Solo debe diferir

en el tamaño. Subconjunto.

(7)

Estadística Descriptiva

Variable:

Característica o propiedad de los elementos de la

población, que podemos medir u observar y

que difieren entre sí.

Variable aleatoria

Característica de los elementos de la población, cuyo

valor no esta predeterminado, sino que es azarozo.

(8)

Estadística Descriptiva

Tipos de variables

Cuantitativas

Discretas: Número de animales, cantidad de huevos

Continuas: Peso corporal, altura, edad, presión

arterial.

Cualitativas o categóricas

Nominales: Sexo, raza, sanos y enfermos

Ordinales: Chico, mediano y grande

(9)

Estadística Descriptiva

Recolección de datos

Censo:

se recolecta la información de todos los individuos de

la población

Muestreo:

se mide una parte de la población (subconjunto)

Primaria o secundaria

(10)

Estadística descriptiva

Presentación de datos

Tablas

Simples (categorías o intervalos de clase)

Doble entrada

(11)

Ganancias de peso de 46 terneros:

39.6 44.4 43.9 42.9 47.9 46.9 48.3

40.4

45.8 44.2 39.1 46.3 41.9

51.2

50.2

47.7

43.9

47.0 42.6 46.6 44.8

43.7 47.2

41.3

37.4

43.1

43.9

48.9 41.5

42.5

48.2 40.7

41.8

46.7

42.3 43.3 44.1 49.8 40.6

44.0

44.0 44.5 45.1 45.4 45.2 45.7

Identificamos el valor mínimo y el máximo

Calculamos el rango

8

.

13

4

.

37

2

.

51

Ap

Ls

Li

rango

Dividimos por la cantidad de intervalos

76

.

2

5

8

.

13

5

Li

Ls

(12)

Intervalos

frec.

frec.rel.

(37.40-40.16)

38.78

(40.16-42.92)

41.54

(42.92-45.68)

44.30

(45.68-48.44)

47.06

(48.44-51.20)

49.82

(13)

Iintervalos

frec.

frec.rel.

(37.40-40.16)

38.78 3

0.07

(40.16-42.92)

41.54

11

0.24

(42.92-45.68)

44.30 16

0.35

(45.68-48.44)

47.06 12

0.26

(48.44-51.20)

49.82 4

0.09

(14)

35

38

41

44

47

50

53

pesos

0.00

0.09

0.18

0.28

0.37

fre

cu

e

n

ci

a

s

re

la

ti

va

s

(15)

fa

far

fa

far

Iintervalos

frec.

frec.rel.

(37.40-40.16)

38.78 3

0.07

3

0.07

46

1

(40.16-42.92)

41.54

11

0.24

14

0.30

43

0.93

(42.92-45.68)

44.30 16

0.35

30

0.65

32

0.70

(45.68-48.44)

47.06 12

0.26

42

0.91

16

0.35

(48.44-51.20)

49.82 4

0.09

46

1

4

0.09

(16)

Tabla Simple

año

Frec.

1

320

2

240

3

190

4

180

5

170

Total

1100

Tabla 1. Cantidad de alumnos en FCV, según año de la

carrera. Tandil. 2010

(17)

Tabla Doble Entrada

año

Mujeres

Varones

Total

1

120

200

320

2

100

140

240

3

90

100

190

4

70

110

180

5

50

120

170

Total

430

670

1100

Tabla 2. Cantidad de alumnos en FCV, por sexo, según año de

la carrera. Tandil. 2010

(18)

Tabla Maestra

Bs. As.

Resto del País

años

Mujeres

Varones

Mujeres

Varones

Total

1

80

120

40

80

320

2

60

90

40

50

240

3

60

60

30

40

190

4

50

80

20

30

180

5

35

80

15

40

170

Total

285

430

145

240

1100

Tabla 3. Cantidad de alumnos en FCV, por procedencia y sexo,

según año de la carrera. Tandil. 2010

(19)

Ejemplo

10

8

6

3

9

7

5

4

6

9

8

10

7

9

10

6

8

6

3

2

4

3

2

7

5

5

4

3

7

6

6

7

8

8

6

7

7

7

9

8

5

3

2

1

4

3

0

6

6

8

Un estudio consistió en contar el número de crías por

perra (n=50). Los valores resultantes del conteo fueron

los siguientes

:

(20)

Ejemplo

Tabla 4. Distribución de frecuencias para la variable número de crías

por perra, en el criadero “Mascotas.com”, en 2001.

Nº de crías

Frec.

Frec. rel.

Frec. acum.

Frec. acum. rel.

0

1

0.02

1

0.02

1

1

0.02

2

0.04

2

3

0.06

5

0.10

3

6

0.12

11

0.22

4

4

0.08

15

0.30

5

4

0.08

19

0.38

6

9

0.18

28

0.56

7

8

0.16

36

0.72

8

7

0.14

43

0.86

9

4

0.08

47

0.94

10

3

0.06

50

1

(21)

Estadística descriptiva

Representación de datos

Gráficos

Cuantitativas

Histograma

Grafico de tallos y hojas

Polígono de frecuencias

Grafico de cajas

Cualitativas

Gráfico de barras

Gráficos circulares

(22)

Histograma

0

1

2

3

4

5

6

7

8

9

10

0

1

2

3

4

5

6

7

8

9

10 11

F

re

cu

e

n

ci

a

(23)

Polígono de frecuencia

0

1

2

3

4

5

6

7

8

9

10

0

2

4

6

8

10

Años

F

re

cu

e

n

ci

a

(24)

Stem Leaf

#

9 0

1

8 0

1

7 000

3

6 000000

6

5 00000000000

11

4 000000000000000 15

3 0000000000

10

2 00000

5

1 000

3

----+----+----+----+---+

(25)

Gráfico de caja

0

1

2

3

4

6

7

8

9

10

N

º

crí

a

s

(26)

Gráfico de Barras

0

10

20

30

40

50

60

70

80

90

%

1er trim.

2do trim.

3er trim.

4to trim.

(27)

Gráfico de Circular

(28)

Estadística descriptiva

Resumen de la información

Cuantitativos

Medidas de Tendencia Central (o posición)

Medidas de Dispersión

Cualitativos

Razón

Proporción

Tasas

Indices

(29)

M.T.C

Las medidas de tendencia central son

valores numéricos localizados en el centro

del conjunto de datos y que los representan

adecuadamente a los fines de análisis.

Las medidas más utilizadas son la media, la

mediana y la moda

(30)

M.T.C.

0

25

50

75 100 125 150 175 200

Peso

0.00

0.04

0.09

0.13

0.17

fre

cu

e

n

ci

a

s

re

la

ti

va

s

Población= A

(31)

M.T.C.

0

25

50

75 100 125 150 175 200

Peso

0.00

0.04

0.09

0.13

0.17

fre

cu

e

n

ci

a

s

re

la

ti

va

s

Población= B

(32)

M.T.C.

0

25

50

75 100 125 150 175 200

Peso

0.00

0.04

0.09

0.13

0.17

fre

cu

e

n

ci

a

s

re

la

ti

va

s

Población= C

(33)

M.T.C.

Media Aritmética

: La media aritmética es el promedio

de todas las observaciones.

Ejemplo: Calcular la media aritmética para el siguiente conjunto de datos.

5

9

12

7

15

3

(5+9+12+7+15+3)/6 = 51/6 = 8.5

Por lo tanto: 8.5 es la media aritmética para este conjunto de datos.

n

i

i

n

x

x

1

n

x

f

x

n

i

i

i

1

(34)

M.T.C

Moda:

El valor que más se repite (puede no

existir y si existe puede no ser única).

Ejemplo: Se le preguntó a una muestra de 10

estudiantes por el número de hermanos que

tiene. Sus respuestas fueron: 2, 1, 2, 0, 0, 1, 4,

5, 2, 3.

La moda es 2 porque se repite tres veces.

Interpretación: La mayoría de estudiantes tienen

dos hermanos.

(35)

M.T.C

Mediana:

es el valor que se encuentra en el centro del

conjunto de datos “ordenados”. Por lo tanto, el 50% de los

datos son menores que la mediana.

La mediana se utiliza cuando los datos presentan valores

muy extremos. Cuando la media aritmética no es muy

representativa del conjunto.

(36)

M.T.C

Si n es impar la mediana es la observación que está en el lugar (n+1)/2:

Si n es par: la mediana es el promedio de las observaciones n/2 y (n/2)+1:

2

1

n

X

Md

2

1

2

2

n

n

X

X

Md

(37)

M.T.C

Ejemplo: Encontrar la mediana para el siguiente

conjunto de datos:

9

12

5

16

8

3

11

Primero se ordenan los datos:

3

5

8

9

11

12

16

Una vez ordenados, como el número de datos es

impar (7), se busca el que tiene la posición (n+1)/2, o

sea (7+1)/2 = 4. Este número es el 9 y representa la

mediana.

(38)

M.T.C

Ejemplo: Calcula la mediana para el siguiente conjunto de datos

8.3

5.7

9.2

3.9

7.4

11.8

10.6 4.3

Nuevamente se ordenan los datos

3.9

4.3

5.7

7.4

8.3

9.2

10.6 11.8

Una vez ordenados, como el número de datos es par (8), se

busca el número que tiene la posición n/2 y el que tiene la

posición (n/2)+1. En este caso 8/2 =4 y (8/2)+1 =5

Los números que tienen las posiciones cuarta y quinta son 7.4 y

8.3. Estos números se promedian y el resultado será la

(39)

M.T.C.

Media Armónica

Media Geométrica

n

i

Xi

n

Mh

1

1

k

i

Xi

fi

n

Mh

1

1

n

i

n

i

n

n

i

x

x

x

x

x

MG

.

.

...

.

1

3

2

(40)

Media Aritmética

Propiedades

La suma las desviaciones de cada valor de

la variable respecto al promedio es cero

suma de cuadrados mínima

n

i

i

x

x

1

0

)

(

n

i

i

n

i

i

x

x

A

x

1

2

1

2

)

(

)

(

(41)

Media Aritmética

Propiedades

Si a cada observación se le suma (o resta) un valor constante

c, el promedio de la nueva variable será igual al promedio

de los valores originales, más (o menos) la constante c.

Sea

x

1

, x

2

, x

3

, . . ., x

n

un conjunto de observaciones de la

variable X y c una constante, y la variable

Y

es tal que:

Luego:

c

x

y

i

i

c

X

n

y

Y

n

i

i

1

(42)

Media Aritmética

Propiedades

Si a cada observación x

i

se la multiplica (o divide) por una

constante k la media aritmética de la nueva variable será

igual al promedio original multiplicado (o dividido) por la

constante k

Sea

x

1

, x

2

, x

3

, . . ., x

n

un conjunto de observaciones de la

variable X y k una constante, y la variable

Y

es tal que:

Luego

:

i

i

k

x

y

*

X

k

n

x

k

n

kx

n

y

Y

n

i

i

n

i

i

n

i

i

1

1

1

(43)

Media Aritmética

Propiedades

Si

x

i

= k para todo

i

, donde k es constante

luego el promedio es k

Sean

X

1

y

X

2

dos variables

“aleatorias”

y

hacemos

y

i

=

x

1i

+

x

2i

luego

2

1

X

X

(44)
(45)

Medidas de Dispersión

Son medidas que nos dicen qué tan dispersos se encuentran los datos con

respecto a su media.

VARIANZA S

2

:La varianza (o variancia) es el promedio de las

desviaciones al cuadrado entre los datos y su media aritmética

1

)

(

ˆ

)

(

var

1

2

2

2

n

x

x

S

X

n

i

i

(46)

Medidas de dispersión

Desvio estandar

Amplitud ó Rango

Rango= x

máx

-x

mín

Desvio medio

2

S

S

1

.

.

1

n

x

x

M

D

n

i

(47)

Medidas de Dispersión

Coeficiente de Variabilidad

Covariancia

100

.

.

x

S

V

C



1

)

,

cov(

1

n

y

y

x

x

y

x

i

n

i

i

(48)

Error Estandar

n

S

n

S

e

e

2

.

.

(49)

Variancia

Propiedades

Var (x)

0

Si k es constante, luego Var(k)=0

Var(kx)=k

2

Var(x)

Var(k+x)=Var(x)

Sean X e Y dos variables “aleatorias”, luego

Var(x+y)=Var(x) + Var(y) + 2cov(x,y)

Var(x-y)=Var(x) + Var(y) - 2cov(x,y)

Referencias

Documento similar

El teorema anterior puede deducirse del Teorema Fundamental de la Aritm ´etica y de las definiciones de m ´aximo com ´un divisor y m´ınimo com ´un m ´ultiplo.. Ya tenemos

De non ser así, as facturas non poderán tramitarse para o pago, e a USC, a través do responsable de asuntos económicos do centro da USC que solicitou os seus servicios Rexeitará

[r]

Los métodos estadísticos de Inferencia paramétrica suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del conjunto de datos.

[r]

Del cual se obtiene la siguiente información, aplicando la estadística descriptiva: Análisis de frecuencia de datos a cada uno de los indicadores que integran las variables, tanto

[r]

SECUNDARIA COMPRENDE LOS