• No se han encontrado resultados

ESTADISTICADYA.pps

N/A
N/A
Protected

Academic year: 2020

Share "ESTADISTICADYA.pps"

Copied!
52
0
0

Texto completo

(1)
(2)

ESTADÍSTICA

ESTADÍSTICA

ESTADÍSTICA

ESTADÍSTICA

DESCRIPTIVA

DESCRIPTIVA

INFERENCIA

INFERENCIA

ESTADÍSTICA

ESTADÍSTICA

Ciencia que se encarga de la

recolección, estudio e

interpretación de los datos

obtenidos en un estudio

Se dedica a los métodos

de recolección,

descripción, visualización

y resumen de datos

originados a partir de los

fenómenos en estudio

Se dedica a la generación

de los modelos,

inferencias y

predicciones asociadas a

los fenómenos en

cuestión teniendo en

cuenta lo aleatorio e

incertidumbre en las

(3)

n

h

f

i

%

100

x

n

h

f

i

Población: conjunto de

personas, cosas o

situaciones, que tienen

alguna característica

común que las permite

agrupar.

Muestra:

subconjunto

representativo de

una población.

Variable: Es la

característica

observable de una

población.

Variable cualitativa:

Cuando es un

atributo o cualidad.

Deporte preferido,

sexo, lugar de

nacimiento, etc.

Variable Cuantitativa:

Son aquellas que pueden

medirse. Discretas: Nº

de estudiantes, nº de

personas, etc.

(cantidades enteras).

Continuas: Edad, peso,

talla, etc.(cantidades

racionales)

Frecuencia Absoluta (fi ):

nº de veces que se repite

un dato. La suma de

frecuencias es igual a

número de muestras

(n N)

Frecuencia relativa

(h): Se obtiene

dividiendo la

(4)

Medidas de estadística

Centralización

Indican valores con respecto a los que los datos

parecen agruparse.

Media, mediana y moda

Posición

Dividen un conjunto ordenado de datos en grupos

con la misma cantidad de individuos.

Cuartiles, deciles y percentiles

.

Dispersión

Indican la mayor o menor concentración de los

datos con respecto a las medidas de centralización.

Desviación típica o estándar, coeficiente de variación,

(5)

Es una de las medidas de tendencia central de mayor

uso. Es el valor que representa mejor el conjunto de

datos, es la medida de tendencia central mas estable y

confiable

La media muestral se simboliza por y la

media poblacional de denota por

.

X

(6)

MEDIA ARITMETICA PARA DATOS NO AGRUPADOS

Sea X una variable cuantitativa y x

1

, x

2

,…, x

n

una

muestra de tamaño "n" de valores de la variable, se

define la media aritmética de X como:

n

x

x

x

x

X

1

2

3

...

n

Esta expresión se puede escribir también , como

:

n

x

X

n

i

i

(7)

Ejemplo N°1

Consideremos la edad en años de ocho

personas

10

18

25

32

12

5

7

7

En este ejemplo el promedio , media o media

aritmética de la edad de estas personas está

dada por:

8

7

7

5

12

32

25

18

10

x

(8)

MEDIA ARITMETICA PARA DATOS AGRUPADOS

Sea X una variable cuantitativa y x

1

, x

2

,…, x

n

una muestra de

tamaño "n" de valores de la variable, y f

i

la frecuencia de cada

variable. Se define la media aritmética para datos tabulados

como:

n

f

x

f

x

f

x

f

x

X

1

1

2

2

3

3

...

n

n

Esta expresión se puede escribir también , como

:

n

f

x

X

i

n

i

i

1

f

i

= frecuencia

(9)

Ejemplo: Datos sobre los puntajes obtenidos en un concurso de

lógico matemática.

Peso

[40 ; 50[

[50 ; 60[

[ 60 ; 70[

[ 70 ; 80[

[ 80 ; 90[

[ 90 ; 100[

[100 ; 110[

58

79

,

68

58

3

105

10

55

5

45

N

f

x

x

i i

min

max

:

R

x

x

Rango

n

K

ervalos

de

Número

int

:

k

R

C

ervalo

del

Amplitud

int

:

40-46-49-42-40-50-54-55-52-53-55-54-54-56-57-60-65-66-

66-64-63-63-62-68-69-67-65-65-64-67-69-68-61-61-62-66-

76-78-78-75-71-71-75-74-78-78-79-80-82-82-85-85-90-99-91-100-109-110

70

40

110

:

R

Rango

616

,

7

58

:

int

ervalos

K

de

Número

19

,

9

616

,

7

70

:

(10)

Ejemplo: Datos sobre los puntajes obtenidos en un concurso de

lógico matemática.

Peso

[40 ; 50[

[50 ; 60[

[ 60 ; 70[

[ 70 ; 80[

[ 80 ; 90[

[ 90 ; 100[

[100 ; 110[

58

79

,

68

58

3

105

10

55

5

45

N

f

x

x

i

i

40-46-49-42-40-50-54-55-52-53-55-54-54-56-57-60-65-66-

66-64-63-63-62-68-69-67-65-65-64-67-69-68-61-61-62-66-

76-78-78-75-71-71-75-74-78-78-79-80-82-82-85-85-90-99-91-100-109-110

X

i

45

55

65

75

85

95

105

f

i

5

10

21

11

5

3

3

F

i

5

15

36

47

52

55

58

h

i

0,09

0,17

0,36

0,19

0,09

0,05

0,05

1

H

i

0,09

0,26

0,62

0,81

0,90

0,95

1,00

hi%

9

17

36

19

9

5

5

100

(11)
(12)

MEDIANA PARA DATOS NO

AGRUPADOS

Ejemplo 1:

Consideremos la edad en años de ocho personas

10

18

25

32

12

5

7

7

Para calcular la mediana , previamente se deben

ordenar las observaciones. En este caso lo haremos

en forma creciente:

5 7 7

10 12

18 25 32

(13)

Ejemplo N°2

Consideremos el peso en kilogramos de una muestra de

11 personas

65 76 48 48 68 78 90 87 67 72 78

Recordemos que para calcular la mediana debemos ordenar los

datos:

48 48 65 67 68

72

76 78 78 87 90

(14)

MEDIANA PARA DATOS AGRUPADOS

Si se tiene una distribución de frecuencias, la mediana es igualmente

ese valor que tiene 50% de las observaciones por debajo y 50 % por

encima. Geométricamente, la mediana es el valor de X sobre el eje de las

abscisas correspondiente a la ordenada que divide un histograma en

dos partes de igual área.

donde:

Li = límite inferior de la clase mediana.

N = frecuencia total o Σf

i

.

Faa = frecuencia absoluta acumulada hasta la clase

premediana

fm = frecuencia absoluta de la clase mediana

Ic= amplitud de la clase mediana.

(15)

Ejemplo

Peso

xi

fi

Fi

40 < 50

45

5

5

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

5

52

90 < 100

95

3

55

100 < 110

115

3

58

58

6

,

66

21

15

58

2

1

10

60

2

1

1









i i i

f

F

N

Ic

L

Mediana

(16)

Moda o Modo (Mo)

Como su nombre lo indica es aquel valor de la variable que tiene

una mayor frecuencia.

Si consideramos el ejemplo N°2 del peso de una

muestra de personas:

65 76

48 48

68

78

90 87

67 72

78

Mo = 48 kilos

Mo = 78 kilos.

Esto significa que la mayoría de estas personas

pesa 48 kilos y 78 kilos.

(17)

La Moda puede deducirse de una distribución de

frecuencia o de un histograma a partir de la fórmula.

Moda para datos agrupados

Ic

Li

Mo

.

2

1

1





Donde;

Li = límite inferior de la clase modal (clase

de mayor frecuencia absoluta (fa)

∆1 = diferencia de las frecuencias absolutas

de la clase modal y pre-modal.

∆2 = diferencia de las frecuencias absolutas

de la clase modal y post-modal

(18)

La moda: se define como el valor que tiene una mayor

frecuencia en un conjunto de datos (es decir, aquel que más se

repite).

Para datos agrupados en intervalos

Mo= Li + c. D1

D1+D2

D1: f

i

– f

i -1

D2: f

i

– f

i +1

Peso

M. Clase

f

i

F

i

.

40 < 50

45

5

5

50 < 60

55

10

15

60 < 70

65

21

36

70 < 80

75

11

47

80 < 90

85

5

52

90 < 100

95

3

55

100 < 110

115

3

58

58

Intervalo modal

24

,

65

10

11

11

10

60

(19)
(20)
(21)
(22)

Gráficas estadísticas

1. INTRODUCCION

Gráficas estadísticas, representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y

revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de

frecuencias son algunas de ellas

2. DIAGRAMA DE BARRAS

En este tipo de gráfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar variables cuantitativas discretas.

El diagrama de barras siguiente representa la distribución del número de hijos de 43 familias:

 

 

3. HISTOGRAMA Y POLÏGONO DE FRECUENCIAS  

Los histogramas se utilizan para representar tablas de frecuencias con datos agrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la base de un

(23)

Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.

4. HISTOGRAMA Y POLINOMIOS DE FRECUENCIAS ACUMULADAS

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polinomio. He aquí los que se obtienen de la tabla de 1.200 calificaciones:

5. DIAGRAMA DE SECTORES  

(24)

=Md=Mo

x

Simétrica

Mo Md

x

x

Md Mo

Asimétrica:

Sesgada a la

izquierda,

negativa

Asimétrica:

Sesgada a la

derecha,

(25)
(26)

Dividen un conjunto ordenado de datos en grupos con

la misma cantidad de individuos.

PERCENTILES

:

son

99 valores

que distribuyen la serie de

datos, ordenada de forma creciente o decreciente, en

cien

tramos iguales

, en los que cada uno de ellos concentra el 1%

de los resultados

CUARTILES

:son

3 valores

que distribuyen la serie de

datos, ordenada de forma creciente o decreciente, en

cuatro

tramos iguales, en los que cada uno de ellos concentra el 25%

de los resultados.

DECILES:

son

9 valores

que distribuyen la serie de datos,

ordenada de forma creciente o decreciente, en

diez tramos

iguales, en los que cada uno de ellos concentra el 10% de los

resultados.

(27)

Medida de localización que divide la población o

muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el

25% de la distribución.

Q2= Valor de la variable que deja a la izquierda el

50% de la distribución

= mediana

.

Q3= Valor de la variable que deja a la izquierda el

75% de la distribución.

CUARTILES

.

.

4

Ic

fm

Faa

aN

Li

Q

a

4

aN

(28)

Medida de localización que divide la población o

muestra en 10 partes iguales

No tiene mucho sentido calcularlas para variables

cualitativas discretas. Por lo que lo vamos a ver

sólo para las variables continuas

.

DECILES

10

aN

P

Da

fm

Ic

Faa

aN

Li

D

a

10

.

(29)

Medida de localización que divide la población o

muestra en 100 partes iguales

No tiene mucho sentido calcularlas para variables

cualitativas discretas. Por lo que lo vamos a ver sólo

para las variables continuas.

PERCENTILES

100

aN

P

Pa

Ic

fm

Faa

aN

Li

P

a

100

.

(30)

EJEMPLO

Los siguientes son los resultados de la prueba de aptitud

académica tomada a 50 alumnos de la Facultad de Educación,

con esos datos calcular Q1,Q3, D3, y P45

I

MC

FA

FAA

FR

FRA

FR%

45-55

06

55-65

10

65-75

19

75-85

11

85-95

04

(31)

EJEMPLO

Los siguientes son los resultados de la prueba de aptitud

académica tomada a 50 alumnos de la Facultad de Educación,

con esos datos calcular Q1,Q3, D3, y P45

I

MC

FA

FAA

FR

FRA

FR%

45-55

50

06

06

0,12

0,12

12

55-65

60

10

16

0,20

0,32

20

65-75

70

19

35

0,38

0,70

38

75-85

80

11

46

0,22

0,92

22

85-95

90

04

50

0,08

1,00

08

50

1,000

100

Cálculo de Q1

(32)

EJEMPLO

Los siguientes son los resultados de la prueba de aptitud

académica tomada a 50 alumnos de la Facultad de Educación,

con esos datos calcular Q1,Q3, D3, y P45

I

MC

FA

FAA

FR

FRA

FR%

45-55

50

06

06

0,12

0,12

12

55-65

60

10

16

0,20

0,32

20

65-75

70

19

35

0,38

0,70

38

75-85

80

11

46

0,22

0,92

22

85-95

90

04

50

0,08

1,00

08

50

1,000

100

Cálculo de Q3

Buscamos ahora en la misma columna el correspondiente al 75 %de N que en

este caso es el 4º intervalo (3.50/4=37.5)

(33)

EJEMPLO

Los siguientes son los resultados de la prueba de aptitud

académica tomada a 50 alumnos de la Facultad de Educación,

con esos datos calcular Q1,Q3, D3, y P45

I

MC

FA

FAA

FR

FRA

FR%

45-55

50

06

06

0,12

0,12

12

55-65

60

10

16

0,20

0,32

20

65-75

70

19

35

0,38

0,70

38

75-85

80

11

46

0,22

0,92

22

85-95

90

04

50

0,08

1,00

08

50

1,000

100

Cálculo de D3

(corresponde al 30 % 3 · 50 / 10 = 15) sería

el 2º intervalo.

10

aN

P

Da

Ic

fm

Faa

aN

Li

D

a

10

.

(34)

EJEMPLO

Los siguientes son los resultados de la prueba de aptitud

académica tomada a 50 alumnos de la Facultad de Educación,

con esos datos calcular Q1,Q3, D3, y P45

I

MC

FA

FAA

FR

FRA

FR%

45-55

50

06

06

0,12

0,12

12

55-65

60

10

16

0,20

0,32

20

65-75

70

19

35

0,38

0,70

38

75-85

80

11

46

0,22

0,92

22

85-95

90

04

50

0,08

1,00

08

50

1,000

100

Cálculo de P45

Ubicamos el percentil 45 (45·50/100 =

22.5) Corresponde al intervalo 3º

100

aN

P

Pa

Ic

fm

Faa

aN

Li

P

a

100

.

(35)
(36)

Las

MEDIDAS DE DISPERSIÓN

cuantifican la

separación, la dispersión, la variabilidad de los valores

de la distribución respecto al valor central.

Peso recién nacidos en partos gemelares

50

40

30

20

10

0

(37)

RANGO

DESVIACION MEDIA

VARIANZA

DESVIACIÓN TÍPICA (S) O ESTÁNDAR

COEFICIENTE DE VARIACIÓN

(38)

AMPLITUD O RANGO

Es la diferencia entre el valor de las observaciones mayor y

el menor. Re = xmax - xmin

2,

1

,4,3,

8

,

4.

El rango es 8-1=7

150 160 170 180 190

0

.0

0

0

.0

1

0

.0

2

0

.0

3

0

.0

4

0

.0

5

150 160 170 180 190

25% 25% 25% 25%

Mín. P25 P50 P75 Máx.

Rango intercuartílico

(39)

DESVIACIÓN MEDIA. DATOS NO AGRUPADOS:

(40)

Es el promedio del cuadrado de las distancias entre cada

observación y la media aritmética del conjunto de

observaciones.

VARIANZA

(

S

2

):

Es el cuadrado de la desviación estándar.

ianza

f

x

x

n

S

i

i

i

)

.

var

(

1

2

(41)

La varianza viene dada por las mismas unidades que

la variable pero al cuadrado, para evitar este problema

podemos usar como medida de dispersión la

desviación típica que se define como la raíz cuadrada

positiva de la varianza.

DESVIACIÓN TÍPICA / ESTÁNDAR (S)

:

estándar

desviación

f

x

x

n

S

i

i

i

)

.

(

1

2

(42)

Es la razón entre la desviación típica (estándar) y la

media. Mide la desviación típica en forma de

qué tamaño tiene con respecto a la media

COEFICIENTE DE VARIACIÓN

x

S

CV

También se la denomina

variabilidad

relativa.

Es frecuente mostrarla en porcentajes

Si la media es 80 y la desviación típica 20

entonces

CV=20/80=0,25=25% (variabilidad relativa)

. C.V. = S (100%)

(43)
(44)

EJEMPLO 1

(45)

SOLUCIÓN:

S

2

=

La varianza

La desviación típica S

:

S

= √ 427,61 =

20.67

El rango:

80 - 15 = 65 días

(46)

INTERPRETACIÓN DE LOS

RESULTADOS DE LAS

(47)

• Es la medida de dispersión más sencilla y

también, por tanto, la que proporciona menos

información. Además, esta información puede ser

errónea, pues el hecho de que no influyan más de

dos valores del total de la serie puede provocar

una deformación de la realidad.

• Comparemos, por ejemplo, estas dos series:

• Serie 1: 1 5 7 7 8 9 9 10 17

• Serie 2: 2 4 6 8 10 12 14 16 18

• Ambas series tienen rango 16, pero están

desigualmente agrupadas, pues mientras la

primera tiene una mayor concentración en el

centro, la segunda se distribuye uniformemente a

lo largo de todo el recorrido. El uso de esta

medida de dispersión, será pues, bastante

restringido.

(48)

En teoría, la desviación puede referirse a

cada una de las medidas de tendencia

central: media, mediana o moda; pero el

interés se suele centrar en la medida de la

desviación con respecto a la media, que

llamaremos desviación media

La desviación media viene a indicar el

grado de concentración o de dispersión de

los valores de la variable. Si es muy alta,

indica gran dispersión; si es muy baja

refleja un buen agrupamiento y que los

valores son parecidos entre sí.

(49)

Es otra de las variaciones

absolutas y la misma se define

como el cuadrado de la desviación

típica; viene expresada con las

mismas letras de la desviación

típica pero elevada al cuadrado.

(50)

La desviación típica como medida absoluta de

dispersión, es la que mejor nos proporciona la

variación de los datos con respecto a la media

aritmética, su valor se encuentra en relación directa

con la dispersión de los datos, a mayor dispersión

de ellos, mayor desviación típica, y a menor

dispersión, menor desviación típica.

Es sin duda la medida de dispersión más

importante, ya que además sirve como medida

previa al cálculo de otros valores estadísticos. Es la

medida de dispersión más utilizada en las

investigaciones por ser la más estable de todas, ya

que para su cálculo se utilizan todos los desvíos

con respecto a la media aritmética de las

observaciones.

(51)

Existen

varias

medidas

de

dispersión relativa, pero, la más

usada es el coeficiente de variación

de Pearson, este es un índice de

variabilidad sin dimensiones, lo que

permite la comparación entre

diferentes

distribuciones

de

frecuencias, medidas en diferentes

unidades.

(52)

Muchas Gracias

¿ Y Ahora ?

Referencias

Documento similar

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

Entre nosotros anda un escritor de cosas de filología, paisano de Costa, que no deja de tener ingenio y garbo; pero cuyas obras tienen de todo menos de ciencia, y aun

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)