• No se han encontrado resultados

Tema 6. Estadística descriptiva bivariable con variables numéricas

N/A
N/A
Protected

Academic year: 2021

Share "Tema 6. Estadística descriptiva bivariable con variables numéricas"

Copied!
11
0
0

Texto completo

(1)

Clase 6

Tema 6. Estadística descriptiva bivariable con variables numéricas

Estadística bivariable: tipos de relación

Relación entre variables cuantitativas

• Para identificar las características de una relación entre dos variables cuantitativas, lo más simple es representar esta relación de manera gráfica.

• Tipo de gráfico más común: diagrama de dispersión.

- Ejemplo: Relación entre el PIB y el nivel de corrupción.

(2)

• Diagrama de dispersión:

- Muestra la relación entre dos variables cuantitativas medidas en los mismos individuos.

- Cada individuo aparece como un punto del diagrama

- Un individuo puede ser: persona, Estado, ciudad, escuela…

- Los valores de una variable aparecen en el eje horizontal (abscisas) y los de la otra en el eje vertical (ordenadas).

- Por ejemplo, en estos datos España tiene un PIB de 21460 $ y un nivel de corrupción de 2.9 (0=no corrupción, 10=mucha corrupción).

- Cuando se construye un diagrama de dispersión, la convención es situar:

o Variable independiente (x): eje horizontal o Variable dependiente (y): eje vertical

- Esta convención se utiliza siempre. También si no hay una relación de causalidad muy clara.

- En este ejemplo, supongamos que el nivel de corrupción (Eje Y) depende del nivel de desarrollo económico (Eje X).

- Cuatro cosas se pueden ver en un diagrama de dispersión:

o La forma de la relación, o La dirección de la relación, o La fuerza de la relación,

o La presencia de observaciones atípicas.

• Forma de relación:

- La forma de la relación depende de cómo estas variables están relacionadas.

- La forma más intuitiva es una relación lineal: los puntos del diagrama de dispersión se sitúan aproximadamente a lo largo de una recta.

- Ejemplo de relación lineal: Corrupción y PIB.

(3)

• Dirección de la relación:

- Una relación lineal puede ser positiva o negativa.

- La asociación es positiva cuando los valores altos de las dos variables tienden a ocurrir simultáneamente.

- La asociación es negativa cuando los valores altos de una variable tienden a coincidir con los valores bajos de la otra.

- PIB y corrupción: asociación negativa. Un valor más alto del Producto Interno Bruto tiende a ir acompañado de un valor más bajo del índice de corrupción.

- Ejemplo relación positiva:

(4)

- Ejemplo relación negativa:

• Fuerza de la relación:

- La fuerza de una relación lineal entre variables es determinada por la proximidad de los puntos del diagrama a la recta que resume la relación.

- Si la dispersión de los valores de la variable dependiente para un valor dado de la variable independiente es más grande, la relación es más débil.

(5)

• Relaciones no lineales: Muchas otras formas de relaciones son posibles:

- Relación curvilínea

- Relación exponencial

- Relación logarítmica - Etc.

• Medir relaciones lineales:

- Con diagramas de dispersión, se pueden identificar las características más importantes de una relación.

- Para caracterizar de manera más exacta las propiedades de la relación (lineal) entre variables, es necesario resumirlas con estadísticos.

- El estadístico central para resumir la fuerza y la dirección de una relación:

coeficiente de correlación.

(6)

( X

i

X )( Y

i

Y )

• De un gráfico a un estadístico:

- Relación lineal positiva: Una relación lineal es positiva cuando valores altos de las dos variables tienden a ocurrir simultáneamente.

- Relación lineal negativa: Una relación lineal es negativa cuando valores altos de una variable tienden a coincidir con valores bajos de la otra.

• ¿Cómo es posible caracterizar esta propiedad de manera más exacta?

- Una posibilidad es comparar los valores de las diferentes observaciones con el valor medio de la variable. Da un criterio más preciso para determinar que valores de la variable son bajos o altos.

- Entonces: una relación es positiva si los valores de una variable superiores a su valor medio tienden a coincidir con valores de la otra variable superiores a su propia media.

- Las diferencias entre los valores de una variable y el valor medio se llaman desviaciones (𝑋" − 𝑋 ).

- Entonces: Hay una asociación positiva cuando desviaciones positivas de las dos variables tienden a ocurrir simultáneamente.

- De esta manera, hemos reemplazado una definición intuitiva con una definición más exacta, basada la en términos estadísticos.

- Para ver si el valor positivo o negativo de las desviaciones de una variable tienden a coincidir con desviaciones del mismo signo en la otra variable, podemos multiplicar las desviaciones de cada observación:

(7)

(

X Y

)

= N

N

(

Xi X

)(

Yi Y

)

1

, 1 cov

o Si = posiitu → Dirección de la relación positiva

o Si = negatiu → Dirección de la relación negativa

• Covarianza:

- La covarianza es el valor medio de los productos de las desviaciones:

- Una covarianza positiva indica una relación positiva.

- Una covarianza negativa indica una relación negativa.

- El signo de la covarianza se puede interpretar. Pero su valor no se puede interpretar fuera de contexto. Este depende de las unidades de medida de las variables.

- Ejemplo 1:

(

Xi X

)(

Yi Y

)

(

XiX

)(

YiY

)

(8)

( )

Y X

xy

s s

Y r cov X ,

=

- Ejemplo 2:

• Coeficiente de correlación:

- El coeficiente de correlación es una transformación de la covarianza.

- La correlación es igual a la covarianza dividida por el producto de las desviaciones estándares.

- Valor entre 0 y 1

o Cerca de 1→ alta correlación o Cerca de 0 → baja correlación

- La correlación es equivalente a la covarianza de las variables tipificadas.

(9)

• Interpretación de la correlación:

- La correlación exige que las dos variables sean cuantitativas.

- La correlación entre X y Y es la misma que entre Y y X.

- La correlación no varía cuando cambiamos las unidades de medida de las variables (toma valores entre -1 y 1)

- Una correlación positiva indica una asociación positiva entre las variables.

Una correlación negativa indica una asociación negativa.

- La correlación mide la fuerza, pero no la forma de una relación lineal entre dos variables.

- La correlación mide la dirección (signo) y la fuerza (valor). Pero una correlación de 0.8 no indica una relación “más positiva” que una correlación de 0.4.

• Correlación: muestra vs. población

- En una clase anterior, hemos visto que la dispersión de una variable se puede medir de maneras diferentes.

- Con datos de toda la población, se calcula la Desviación cuadrática media:

(10)

( )

=

N i

i

X

N

1

X 1

2

( )

=

− −

=

N i

i

X

N X s

1 2 2

1 1

( )

Y X

xy

s s

Y r cov X ,

=

- Con datos de una muestra, la desviación en la población se puede aproximar con la varianza:

- De manera semejante, la correlación no se calcula de la misma manera si trabajamos con datos de la población o con datos de una muestra.

- La formula general siempre es la misma:

- Pero, las desviaciones estándares y la covarianza se calculan de manera diferente a partir de una muestra.

• Observaciones atípicas:

- Las observaciones atípicas son valores individuales que quedan fuera del aspecto general de la relación.

- Las observaciones atípicas pueden tener una gran influencia sobre la correlación u otros estadísticos que se pueden calcular para resumir las características de la relación entre dos variables.

(11)

Fin clase 6

Referencias

Documento similar

Se realizó una regresión lineal para determinar la relación causa-efecto entre las dos variables de carga neuromuscular Player Load y AcelT en función de la ubicación

Podríamos apuntar dos definiciones opuestas sobre esas relaciones que llamamos internacionales: la primera sería muy restrictiva y señalaría que las relaciones

Para establecer la relación entre las variables se optó por el modelo lineal con correlación de Pearson; los puntajes obtenidos para la variable condiciones laborales son

Y pone de manifiesto que existe una relación negativa entre las variables, establecido esto podemos afirmar que existe suficiente condición para rechazar la

Se llega así a una doctrina de la autonomía en el ejercicio de los derechos que es, en mi opinión, cuanto menos paradójica: el paternalismo sería siempre una discriminación cuando

Por tanto, como vemos, de una posible reflexión ética colectiva, se podrán deducir normas de compor- tamiento para el profesional individual, para el trabajo en equipo y para el

p-valor >0,05 >0,05 >0,05 Se observa una correlación negativa de Pearson, aunque esta correlación lineal entre la edad de tratamiento quirúrgico y el volumen testicular en

¿Qué relación existe entre los valores personales y la dimensión estructura de la variable clima organizacional en los colaboradores de un Supermercado en San Juan