• No se han encontrado resultados

Estadística Aplicada. Modelos lineales - Regresión

N/A
N/A
Protected

Academic year: 2021

Share "Estadística Aplicada. Modelos lineales - Regresión"

Copied!
22
0
0

Texto completo

(1)

Modelos  lineales  

Regresión  simple  y  múl3ple  

Dept. of Marine Science and Applied Biology

Jose Jacobo Zubcoff

Estadística Aplicada: Modelos lineales - Regresión!

Modelos de Regresión Simple

Que tipo de relación existe entre 2 variables

Predicción de valores a partir de una de ellas

(2)

Estudio conjunto de dos variables

Datos de dos variables de una muestra.

En cada

fila

tenemos los datos de un individuo

Cada

columna

representa los valores que toma una

variable sobre los mismos.

Las individuos no se muestran en

ningún orden

particular.

Las observaciones pueden ser representadas en un

diagrama de dispersión

Nuestro objetivo será intentar

reconocer

a partir del

mismo si hay

relación

entre las variables, de qué

tipo

,

y si es posible

predecir

el valor de una de ellas en

función de la otra.

Altura

en cm.

Peso en

Kg.

162 61 154 60 180 78 158 62 171 66 169 60 166 54 176 84 163 68 ... ...

Estadística Aplicada: Modelos lineales - Regresión!

30

40

50

60

70

80

90

100

140

150

160

170

180

190

200

Diagramas de dispersión o nube de puntos

Mi

d

e

18

7

cm

.

Mide 161 cm.

Pesa 76 kg.

Pesa 50 kg.

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de

dispersión.

(3)

30

40

50

60

70

80

90

100

140

150

160

170

180

190

200

Relación entre variables

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de

dispersión.

Pare

ce

que

el

peso

aume

nta

co

n la

altu

ra

Estadística Aplicada: Modelos lineales - Regresión!

70

80

90

100

Predicción de una variable en función de la otra

Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... o sea,

el peso aumenta en una unidad por cada unidad de altura.

(4)

Incorrelación 30 80 130 180 230 280 330 140 150 160 170 180 190 200

Relación directa e inversa

Fuerte relación directa. 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 Cierta relación inversa 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200

Para valores de X por encima de la media

tenemos valores de Y por encima y por

debajo en proporciones similares.

Incorrelación

.

Para los valores de X mayores que la

media le corresponden valores de Y

menores. Esto es

relación inversa

o

decreciente.

Para los valores de X mayores que la media le

corresponden valores de Y mayores también.

Para los valores de X menores que la media le

corresponden valores de Y menores también.

Esto se llama

relación directa

.

Estadística Aplicada: Modelos lineales - Regresión!

¿Cuándo es bueno un modelo de regresión?

Lo adecuado del modelo depende de la

relación entre:

la dispersión marginal de Y

La dispersión de Y condicionada a X

Es decir, fijando valores de X, vemos cómo

se distribuye Y

La distribución de Y, para valores fijados de

X, se denomina distribución condicionada.

La distribución de Y, independientemente

del valor de X, se denomina distribución

marginal.

Si la dispersión se reduce notablemente, el

modelo de regresión será adecuado.

150 160 170 180 190 320 340 360 380 400 420 y 320 340 360 380 400 420 320 340 360 380 400 420 320 340 360 380 400 420 320 340 360 380 400 420 r= 0.415 r^2 = 0.172 350 360 370 380 390 y 350 360 370 380 390 350 360 370 380 390 350 360 370 380 390 350 360 370 380 390 r= 0.984 r^2 = 0.969

(5)

Interpretación de la variabilidad en Y

Y

En primer lugar olvidemos que existe la

variable X. Veamos cuál es la variabilidad

en el eje Y.

La franja sombreada indica la zona donde

varían los valores de Y.

Proyección sobre el eje Y = olvidar X

Estadística Aplicada: Modelos lineales - Regresión!

Interpretación del residuo

Y

Miremos ahora los errores de predicción (líneas

verticales). Los proyectamos sobre el eje Y.

Se observa que los errores de predicción,

residuos, están menos dispersos que la

variable Y original.

Cuanto menos dispersos sean los residuos,

mejor será la bondad del ajuste.

(6)

Ejemplos de correlaciones positivas

r=0,1 30 80 130 180 230 280 330 140 150 160 170 180 190 200 r=0,4 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 r=0,8 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 r=0,99 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200

Estadística Aplicada: Modelos lineales - Regresión!

Ejemplos de correlaciones negativas

r=-0,5 0 10 20 30 40 50 60 70 80 90 140 150 160 170 180 190 200 r=-0,7 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 r=-0,95 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 r=-0,999 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200

(7)

Regresion Lineal

Estadística Aplicada: Modelos lineales - Regresión!

(8)

Regresion Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Medidas de Bondad de ajuste

Coeficiente de correlación

El coeficiente de correlación (r) es una medida de la intensidad de la relación entre

dos variables

-1 <= r <= 1

Coeficiente de determinación

Es la proporción de la varianza de la variable dependiente que está explicada por

una variable independiente en un modelo estadístico.

0 <= r

2

<= 1

Pendiente y constante

(9)

Modelo de regresión lineal simple

• 

En el modelo de

regresión lineal simple

, dado dos variables

Y (dependiente)

X (independiente, explicativa, predictora)

• 

buscamos encontrar una función de X

muy simple (lineal)

que nos permita aproximar Y mediante

Ŷ = b

0

+ b

1

X

b

0

(ordenada en el origen, constante)

b

1

(pendiente de la recta)

• 

Y e

Ŷ

rara vez coincidirán por muy bueno que sea el modelo

de regresión. A la cantidad

e = (Y-Ŷ)

se le denomina

residuo

o

error residual

.

Estadística Aplicada: Modelos lineales - Regresión!

El modelo lineal de regresión se construye utilizando la técnica de

estimación mínimo cuadrática

:

Buscar b

0

, b

1

de tal manera que se minimice la cantidad

• 

Σ

i

e

i

2

Se comprueba que para lograr dicho resultado basta con elegir:

(10)

Modelos de Regresión Simple

Modelo Lineal o

Recta de Regresión

X

Y

=

γ

+

β

Método de Mínimos Cuadrados

X

X

Y

E

(

)

=

γ

+

β

2 1 1 2 n

(

Y

(

X

))

i i n i i

γ

β

ε

=

+

= =

Estadística Aplicada: Modelos lineales - Regresión!

Modelos de Regresión Simple

X

b

Y

a

=

2 1 2 1 1 2 2 1

)

(

)

)(

(

X XY n i i n i i i n i i n i i i

S

S

X

X

Y

Y

X

X

X

n

X

Y

X

n

Y

X

b

=

=

"

"

"

"

#

$

%

%

%

%

&

'

=

= = = =

Fórmula para la estimación por Mínimos Cuadrados

Varianza Residual de Y para cada valor de X

(

2 2 2

)

1 2 2 ..

2

1

))

(

(

2

1

X Y n i i i X Y

n

S

b

S

n

bX

a

Y

n

S

=

+

=

=

(11)

Regresion Lineal Múltiple

Supuestos de la Regresión Lineal

No debe existir

ninguna relación exacta entre

cualesquiera de las

variables independientes

.

Cuando el modelo tiene dos variables explicativas se habla de colinealidad,

si hay más de dos variables explicativas, entonces, hablamos de

multicolinealidad.

La multicolinealidad es una

cuestión de grado

no de existencia.

Se supone que es un

problema de la muestra

y no de la población.

Si en un modelo de RLM alguna variable independiente es combinación lineal

de otras, el modelo es irresoluble, debido a que, en ese caso, la matriz X'X es

singular, es decir, su determinante es cero y no se puede invertir.

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal

(12)

Regresion Lineal

Supuestos de la Regresión Lineal

Multicolinealidad

: Soluciones

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal

Variabilidad de los valores de

X

No todos los valores de

X

en una muestra dada

deben ser iguales.

La varianza de (X) debe ser un número positivo finito.

Gujarati (1997)

La variación en

Y

al igual que en

X

es esencial para utilizar el análisis de

regresión como herramienta de investigación.

(13)

Regresion Lineal

Supuestos de la Regresión Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal

(14)

Regresion Lineal

Supuestos de la Regresión Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Heterocedasticidad

(15)

Regresion Lineal

Supuestos de la Regresión Lineal

Heterocedasticidad

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal

(16)

Regresion Lineal

Supuestos de la Regresión Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal: AUTOCORRELACIÓN

(17)

Regresion Lineal

Supuestos de la Regresión Lineal

AUTOCORRELACIÓN

de  índices  

(18)

Regresion Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

OTROS Supuestos de la Regresión Lineal

(19)

Regresion Lineal

OTROS Supuestos de la Regresión Lineal

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

(20)

Regresion Lineal

OTROS Supuestos de la Regresión Lineal: Valores atípicos

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Puntos Influyentes

(21)

Regresion Lineal

Puntos Influyentes

Estadística Aplicada: Modelos lineales - Regresión!

Regresion Lineal

Supuestos de la Regresión Lineal: NORMALIDAD

Normalidad

(22)

Regresion Lineal Múltiple

RESUMEN

Supuestos de la Regresión Lineal

No debe existir

ninguna relación exacta entre

cualesquiera de las

variables independientes

. Multicolinealidad

Independencia de los Residuos (ausencia de autocorrelación)

Normalidad de los Residuos

Homocedasticidad de los Residuos

Otros requisitos

Las variables deben variar!!

Número suficiente de muestras

Variables NO incluidas en el modelo NO afectan sistemáticamente

Linealidad (en caso de NO linealidad es un error de especificación)

Referencias

Documento similar

A fin de investigar eficazmente las transacciones financieras delictivas, los servicios represivos y las autoridades judiciales recibirán equipamiento y formación para

La oferta existente en el Departamento de Santa Ana es variada, en esta zona pueden encontrarse diferentes hoteles, que pueden cubrir las necesidades básicas de un viajero que

Su adopción, prevista en 2013, ofrecerá a los Estados miembros y a las agencias de la UE un marco común para un intercambio de información casi en tiempo real y una cooperación

Los regímenes de certificación de la UE abarcan tanto el cumplimiento de las normas mínimas de producción obligatorias como los requisitos suplementarios relacionados con la

Este documento destaca nuestra visión colectiva sobre la Transición Energética Justa, tal como debatieron las/os participantes y se expresó en los seminarios virtuales de Amigos de

presupuestario específico para la igualdad de género. Según la evaluación, el primer programa de apoyo presupuestario relativo al género tuvo un efecto limitado sobre otros

En cumplimiento del Reglamento General de Protección de Datos, le informamos que sus datos serán incorporados al tratamiento denominado “homologación y convalidación de títulos

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en