• No se han encontrado resultados

TEMA 10 Correlaci´on y regresi´on. El modelo de regresi´on simple

N/A
N/A
Protected

Academic year: 2023

Share "TEMA 10 Correlaci´on y regresi´on. El modelo de regresi´on simple"

Copied!
11
0
0

Texto completo

(1)

TEMA 10

Correlaci ´on y regresi ´on.

El modelo de regresi ´on simple

Karl Pearson (1857-1936)

(2)

1. Introducci ´on. Modelos matem´aticos

2. M´etodos num´ericos. Resoluci ´on de sistemas lineales y ecuaciones no lineales 3. Aproximaci ´on de funciones: interpolaci ´on y ajuste

4. Modelos discretos elementales. Ecuaciones en diferencias 5. Estad´ıstica descriptiva. An´alisis de datos

6. Variable aleatoria. Distribuciones de probabilidad 7. Distribuciones de probabilidad importantes

8. Estimaci ´on de par´ametros por intervalos de confianza

9. Contraste de hip ´otesis. Introducci ´on al an´alisis de la varianza 10. Correlaci ´on y regresi ´on. El modelo de regresi ´on simple

(3)

• Introducci ´on. Modelos de regresi ´on y correlaci ´on

• El modelo de regresi ´on lineal simple

• An´alisis de la correlaci ´on

Clases estimadas para este tema: 3 clases

(4)

1.INTRODUCCION´ . MODELOS DE REGRESION Y CORRELACI´ ON´

Objetivo: T ´ecnicas estad´ısticas para analizar relaci ´on entre dos variables cuantitativas

Consideraciones:

- predecir una variable a partir de otra

- dos variables ¿aleatorias? modelos distintos - ¡no relaci ´on causa-efecto!

- relaci ´on lineal entre ambas

(5)

2.EL MODELO DE REGRESION LINEAL SIMPLE´

modelo de regresi ´on lineal simple

y = β0 + β1x + u

u son las perturbaciones hip ´otesis sobre u: y

- media nula ⇒ E(y) = β0 + β1x - varianza constante ⇒ V (y) = σ2

- distribuci ´on normal (TCL) ⇒ y ∼ N (β0 + β1x, σ2) - son independientes ⇒ y independientes

(6)

Objetivo: Estimar los par ´ametros β0, β1 y σ2 ˆ

y = ˆβ0 + ˆβ1x Metodolog´ıa:

· dibujar la nube de puntos ¿tendencia?

· modelo lineal estimar par ´ametros

· m ´etodo de m´ınimos cuadrados βˆ0, ˆβ1









n

X

i=1

yi = nb + a

n

X

i=1

xi

n

Xxiyi = b

n

Xxi + a

n

Xx2i

ecuaciones normales

(7)

Ejercicio: Se desea establecer una ecuaci ´on mediante la cual pue- da predecirse el tiempo de reproducci ´on en base al conocimiento del fotoperiodo bajo el que se inici ´o la reproducci ´on. Se tienen los siguientes datos en 11 patos buceadores (Aythya).

horas de luz 12.8 13.9 14.1 14.7 15 15.1 16 16.5 16.6 17.2 17.9 tiempo de reproducci ´on 110 54 98 50 67 58 52 50 43 15 28

Aspectos de las ecuaciones normales:

ecuaci ´on en t ´erminos de valores muestrales y − y =¯ Sxy

Sx2 (x − ¯x) ecuaciones para los residuos ⇒ varianza residual σ2 descomposici ´on de la variaci ´on total

n

X

i=1

(yi − ¯y)2 =

n

X

i=1

(yi − ˆyi)2 +

n

X

i=1

(ˆyi − ¯y)2

(8)

variaci ´on total = variaci ´on explicada + variaci ´on no explicada

coeficiente de determinaci ´on medida de precisi ´on o ajuste

r2 = variaci ´on explicada variaci ´on total

r2 = 0 ⇒ ajuste nulo r2 = 1 ⇒ ajuste perfecto

Ejercicio: ¿verdadero o falso?

1. r2 = 0 ⇒ no hay relaci ´on entre x e y.

2. Mayor pendiente en la recta de regresi ´on ⇒ mayor coeficiente de determinaci ´on.

3. Si la regresi ´on es exacta ⇒ |r| = 1.

(9)

3.ANALISIS DE LA CORRELACI´ ON´

Aspectos:

· x e y son dos variables aleatorias

· normales con f (x, y) normal

· grado de asociaci ´on lineal entre ambas

· coeficiente de correlaci ´on lineal ρ(x, y) = Cov(x, y) σxσy coeficiente de Pearson

rxy = Sxy

SxSy − 1 ≤ rxy ≤ 1

(10)

Rectas de regresi ´on

y − y =¯ Sxy

Sx2 (x − ¯x) x − ¯x = Sxy

Sy2 (y − ¯y)

? rxy relacionado con los coeficientes de regresi ´on Sxy

Sx2 = rxySy Sx

Sxy

Sy2 = rxySx Sy

? rxy relacionado con el coeficiente de determinaci ´on r2xy = r2

r →relaci ´on lineal

(11)

Ejercicio: Diez pacientes con insuficiencia renal cr ´onica:

caso 1 2 3 4 5 6 7 8 9 10

hemoglobina (g/dl) 9 9.5 8.4 11.7 10.8 8.2 9.2 8.9 10.1 11.5 creatinina (mg/dl) 4.3 2.8 6.5 2.4 3.7 8.0 5.3 7.9 4.3 3.2

BUN (mg/dl) 42.6 30.1 57.9 33.4 36.0 58.7 43.8 65.6 48.9 40.5

Hip ´otesis: el deterioro de la funci ´on renal (aumento de la creatinina o aumento del BUN), deber´ıa estar relacionado con una ca´ıda de la hemoglobina, puesto que la insuficiencia renal puede provocar anemia (¡pero la anemia no es s´ımbolo de insuficiencia renal!). Analizamos la hip ´otesis del investigador.

Ejercicio: ¿verdadero o falso?

El coeficiente de correlaci ´on es la media geom ´etrica de los coeficientes de regresi ´on lineal

Es invariante ante un cambio de coordenadas r = 0 ⇒ no hay relaci ´on entre x e y

Referencias

Documento similar

La importancia de esta nueva expresi ´on para la regi ´on de rechazo es que permite calcular una cota, sin m ´as que despejar R 2 , a partir de la cual el coeficiente de determinaci

sirven para describir la actitud paterna- lista de la sociedad estadounidense y la reacción de la personalidad femenina ante la imposición de un estereotipo. La tarea

En el Modelo Relacional se puede usar el c´ alculo de predicados de primer orden (CPPO) porque una BDR siempre puede verse como una interpretaci´ on (I) de un lenguaje de primer

Amplitud y secci´ on eficaz de dispersi´ on. Aproximaci´ on de Born. Dispersi´ on por ´ atomos con nube electr´ onica. Teor´ıa de la dispersi´ on por ondas parciales.

Como en el caso de los tipos enteros, los lenguajes suelen soportar varios tipos real, de modo que el programador pueda seleccionar aquel cuyo rango y precisi´on en el coeficiente

El inconveniente operativo que presenta el hecho de que la distribuci´ on de probabilidad de una variable aleatoria es una funci´ on de conjunto se resuelve mediante el uso de

Las reglas de dise˜ no de la arquitectura von Neuman contin´ uan vigentes hoy en d´ıa para la construcci´ on de ordenadores: la unidad de control y la unidad aritm´etico-l´

We have deliberately introduced single carbon vacancies on a graphene monolayer grown on a Pt(111) surface and investigated its impact in the electronic, structural, and