• No se han encontrado resultados

Cruce de variables (1)

N/A
N/A
Protected

Academic year: 2020

Share "Cruce de variables (1)"

Copied!
42
0
0

Texto completo

(1)

1 Ejemplo

Consideremos los datos de un estudio donde se les mide la talla en centímetros a 20 jugadores del equipo Nacional de Handbol de EE. UU. seleccionados al azar.

La ley que asocia a cada hombre con su talla es una variable aleatoria (continua).

184.2

191.8 188.0

196.2 178.4 .... etc

A esta función que

asocia a cada deportista con su talla la

llamaremos variable aleatoria y la

denotaremos por X.

X: Talla

(2)

Ejemplo

184.2

191.8

188.0

196.2

178.4

184.2

195.4

189.2

186.0

194.3

190.5

190.5

198.1

188.0

184.2

176.5

184.2

193.5

195.6

186.3

(3)

3

Es un arreglo de los distintos valores que toma la variable con sus respectivas frecuencias (nº de veces que aparece cada valor de la variable en la muestra).

Cómo ordenamos los datos???????????

En una: Tabla de Distribución de Frecuencia

(4)

4

Distribución de frecuencia de ejemplo

(TALLA)

Talla

173.5-179.5

179.5-185.5

185.5-191.5

191.5-197.5

197.5-203.5

f

2

4

7

6

1

20

F

2

6

13

19

20

=

=

Tabla de frecuencias

(5)

5

1 7 3 . 5 1 7 9 . 5 1 8 5 . 5 1 9 1 . 5 1 9 7 . 5 2 0 3 . 5

T a l l a

0 1 2 3 4 5 6 7 8

f

Distribución de frecuencia de ejemplo (TALLA)

Histograma

(6)

Medidas de Resumen

Los fenómenos biológicos no suelen ser constantes

•La tendencia central de los datos

Necesitamos conocer:

• La dispersión o variación respecto de este centro

•Los datos que ocupan ciertas posiciones

•La simetría de los datos

(7)

7

(8)

Medidas de Tendencia Central

Son medidas alrededor de las cuales se concentran los datos

Las tres medidas más usuales de tendencia central son:

(9)

9

Es la suma de todos sus posibles valores dividida por el n° total de datos (n)

188.75 188.8

20 3 . 186 6 . 195 5 . 193 ... 0 . 188 8 . 191 2 . 184 _          X

(Ejemplo: TALLA)

1.-Media Aritmética (

X) de una variable

aleatoria (o Promedio)

Datos:

Datos:

(10)

a) n impar: mediana es el único valor central

b) n par: mediana es el promedio de los dos valores centrales

Primero !!!!! Ordenamos los valores de menor a mayor

Si n es el número de observaciones:

Es el primer valor de la variable que deja por debajo y por sobre de sí al 50 % de las observaciones.

(11)

11

(12)

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0, 188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6, 196.2, 198.1

(Ejemplo: TALLA)

datos

de

10

2

20

100

20

*

50

20

%

50

Datos ordenados:

Datos ordenados:

n= 20

n= 20 parpar MedianaMediana

Promedio de 2 valores Promedio de 2 valores centrales

centrales

Dejan aproximadamente Dejan aproximadamente 50% de los datos bajo y

50% de los datos bajo y

sobre sí (aprox. 10 datos)

sobre sí (aprox. 10 datos)

10 datos 10 datos

6

.

188

2

2

.

189

0

.

188

(13)

13

39, 40, 42, 49, 51, 54, 56, 57, 58, 58, 58, 59, 63, 64, 66, 68, 69, 70, 70, 71,72

(Ejemplo: PESO)

datos

de

10

.

5

10

2

21

100

21

*

50

21

%

50

Datos ordenados:

Datos ordenados:

n= 21

n= 21 imparimpar

Mediana

Mediana

valor central únicovalor central único

Deja aproximadamente Deja aproximadamente

50% de los datos bajo y

50% de los datos bajo y

sobre sí (aprox. 10 datos)

sobre sí (aprox. 10 datos)

(14)

14

Mediana=

Si cambiamos la última observación por otra

extrañamente grande

X: 2, 5, 7, 125

Sea

X

una variable discreta con los siguientes valores:

X: 2, 5, 7, 12

Media= (2+5+7+12)/4=6.5(2+5+7+12)/4=6.5 (5+7)/2= 6

Media=(2+5+7+125)/4=34.75(2+5+7+125)/4=34.75 Mediana=(5+7)/2= 6

Conclusión:

(15)

15

Cuál de los dos valores es más adecuado para la distribución de los datos, la Media o la Mediana???

(16)

16

La medida de tendencia central más adecuada para describir estos

La medida de tendencia central más adecuada para describir estos

datos es la MEDIANA

(17)

17

Es aquel valor de la variable con mayor frecuencia

absoluta.

3.- Moda de una variable aleatoria

(18)

(Ejemplo: TALLA)

Moda= 184.2

(19)

19

Medidas de Posición

Dividen el conjunto de datos ordenados en partes iguales

Las dos medidas de posición más usuales son:

(20)

Es la observación, Pk, que deja por debajo de sí el k% de la población.

1.-Percentiles

PERCENTIL DE ORDEN k:

Deja debajo de sí el 50% de los datos ordenados

Deja debajo de sí el 50% de los datos ordenados

P

P2525 Deja debajo de sí el 25% de los datos ordenadosDeja debajo de sí el 25% de los datos ordenados

P

P == Deja debajo de sí el 75% de los datos ordenadosDeja debajo de sí el 75% de los datos ordenados Son 99 valores que dividen en 100 partes iguales el conjunto de

datos ordenados. Ejemplo, el percentil de orden 67 deja por debajo de sí el 67% de las observaciones, y por encima queda el 33%

(21)

21

Si n es el número de observaciones:

1º) Primero ordenamos las observaciones de menor a mayor

1º) Primero ordenamos las observaciones de menor a mayor

2º) Calculamos el k% de n

2º) Calculamos el k% de n

100

*

%

de

n

k

n

k

3º)Contando los datos desde el valor menor al mayor,

3º)Contando los datos desde el valor menor al mayor, el percentil deel percentil de orden k será aquel valor de la variable ubicado en la posición número:

orden k será aquel valor de la variable ubicado en la posición número:

(22)

22

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0,

188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6,

196.2, 198.1

(Ejemplo: TALLA)

datos

de

13

.

4

13

100

20

*

67

20

%

67

Datos ordenados:

Datos ordenados:

n= 20

n= 20

P

P6767

Deja aproximadamente Deja aproximadamente

67% de los datos bajo de sí

67% de los datos bajo de sí

(aprox. 13 datos), y el 33%

(aprox. 13 datos), y el 33%

sobre sí

sobre sí

Calculemos el percentil de orden 67%

Calculemos el percentil de orden 67%

8

.

191

67

(23)

23

2.-Cuartiles

Segundo cuartil (Q2)

Segundo cuartil (Q2) PP5050=Mediana=Mediana

Son los 3 valores que dividen al conjunto de datos ordenados en cuatro partes iguales

Primer cuartil (Q1)

Primer cuartil (Q1) PP2525

Tercer cuartil (Q3)

(24)

Medidas de Dispersión

• Nos dicen hasta qué punto las medidas de tendencia central son representativas como síntesis de la información.

• Cuantifican la separación o la variabilidad de los valores de la distribución respecto al valor central.

Las más usadas son:

Las más usadas son:

Rango(Recorrido)

Rango(Recorrido)

Desviación Estándard

(25)

25

1.-Rango o Recorrido

RANGO (RECORRIDO) = Valor Máximo - Valor Mínimo.

Inconvenientes del RANGO (RECORRIDO):

• No utiliza todas las observaciones (sólo dos de ellas).

• Se puede ver muy afectado por alguna observación extrema.

(26)

(Ejemplo: TALLA)

Valor Máximo=

Valor Máximo=

Valor Mínimo=

Valor Mínimo= 176.5176.5 198.1198.1

Rango o Recorrido=

Rango o Recorrido= 198.1 – 176.5=198.1 – 176.5= 21.621.6

Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)

Sólo depende del valor máximo (198.1) y del valor Mínimo (176.5)

176.5, 178.4, 184.2, 184.2, 184.2, 184.2, 186.0, 186.3, 188.0,

188.0, 189.2, 190.5, 190.5, 191.8, 193.5, 194.3, 195.4, 195.6,

(27)

27

(Ejercicio: Concentración urinaria de plomo en niños

Concentración de

plomo (µmol/24hr)

0.2

1.5

0.6

2.0

0.8

2.1

2

.

1

x

(x-promedio)

0.2 - 1.2= -1

1.5 - 1.2=0.3

0.6 - 1.2= -0.6

2.0 - 1.2=0.8

0.8 - 1.2=-0.4

2.1 - 1.2=0.9

1

0

.

3

0

.

6

0

.

8

0

.

4

0

.

9

(28)

0

1

n i i

x

x

1

1 2

n

x

x

n i i

  n i i x x 1 2 S

S22=

solución

(29)

29

1

1

2 2

n

x

x

S

n

i

i

Es

la media de las diferencias cuadrática de

n

puntua-ciones con respecto a su media aritmética.

Desviación Estándar (S):

(30)

(Ejemplo: TALLA)

Datos:

Datos:

 

 

20 1

34.5

8 . 188 3 . 186 8 . 188 6 . 195 ... 8 . 188 0 . 188 8 . 188 8 . 191 ) 8 . 188 2 . 184

( 2 2 2 2 2

2             s

8

,

188

20

_

X

n

9

.

5

5

.

34

s

(31)

31

(32)

32

Medidas de Forma

1.- Asimetría

Coef. de Coef. de Asimetría <0 Asimetría <0

Coef. de Coef. de

Asimetría =0 Asimetría =0

Coef. de Coef. de

(33)

33

Ejemplo

(34)

34

En SPSS

Moda <Mediana

Moda <MedianaMediaMedia Si bien se nota una leve cola hacia laSi bien se nota una leve cola hacia la

izquierda, la asimetría es sutil por ello que izquierda, la asimetría es sutil por ello que

(35)

35

2.- Apuntamiento o curtosis

Curtosis >0

Curtosis >0 Curtosis =0Curtosis =0 Curtosis <0Curtosis <0

Distribución mesocúrtica : presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica : presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

(36)
(37)

37

(38)

38

Ejercicio

Datos I:

Datos I:

2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5

2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5

Datos II:

Datos II:

3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6

3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6

Datos III:

Datos III:

2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6

2, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 6

Datos IV:

Datos IV:

3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5

3, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 5

(39)

39

Datos x Med Moda Rango P25 P75 P75-P25 S

I 4 4 5 3 3 5 2 1

II 4 4 3 3 3 5 2 1

III 4 4 4 4 4 4 0 1

IV 4 4 3 y 5 2 3 5 2 1

D i s t r i b u c i ó n I

2 3 4 5

0 1 2 3 4 5 6 N o of o b s

D i s t r i b u c i ó n I I

3 4 5 6

0 1 2 3 4 5 6 N o of o b s

D i s t r i b u c i ó n I I I

2 3 4 5 6 0 1 2 3 4 5 6 7 8 N o o f ob s

D i s t r i b u c i ó n I V

3 4 5

(40)

40

Importante para describir los datos!!!!!!!!!!!!...

Importante para describir los datos!!!!!!!!!!!!...

Medidas de Dispersión

Medidas de Dispersión

Medidas de Tendencia Central

Medidas de Tendencia Central

Medidas de posición

Medidas de posición

+

+

+

+

Gráficos:Histograma, BoxPlot

Gráficos:Histograma, BoxPlot

+

(41)

41

RESUMEN : Medidas descriptivas

RESUMEN : Medidas descriptivas

PosiciónPosición

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos

Dividen un conjunto ordenado de datos en grupos con la misma cantidad de datos . Percentiles, cuartiles

. Percentiles, cuartiles

CentralizaciónCentralización

Indican valores respecto alos cuales los datos parecen agrupares

Indican valores respecto alos cuales los datos parecen agrupares . Media, mediana y moda

. Media, mediana y moda

DispersiónDispersión

Indican la mayor o menor concentración de los datos con respecto a las medidas de

Indican la mayor o menor concentración de los datos con respecto a las medidas de

centralización

centralización

. Varianza, desviación estándar, rango o recorrido

. Varianza, desviación estándar, rango o recorrido

FormaForma

Asimetría y apuntamiento

(42)

42

Elección de medidas de tendencia central y de

dispersión

Variable Nominal

Variable Ordinal

Moda

Mediana

Moda

Percentiles

Variable Contínua:

• ConCon distribución desconocida o asimétrica distribución desconocida o asimétrica

• ConCon distribución simétrica y unimodal (Ej: Normal) distribución simétrica y unimodal (Ej: Normal)

Mediana

Percentiles

Media

Referencias

Documento similar

You may wish to take a note of your Organisation ID, which, in addition to the organisation name, can be used to search for an organisation you will need to affiliate with when you

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)