202 Regresión Lineal Simple

Texto completo

(1)

Regresión Lineal

Regresión Lineal

Simple

Simple

Modelos Empíricos

Modelos Empíricos

Muchos problemas en la ingeniería involucran Muchos problemas en la ingeniería involucran las relaciones entre dos o más

las relaciones entre dos o más variablesvariables Por ejemplo: temperatura y dureza

Por ejemplo: temperatura y dureza El análisis de regresión es una

El análisis de regresión es una técnicatécnica estadística muy útil para este tipo de estadística muy útil para este tipo de problemas.

problemas.

Se puede hacer un modelo para predecir la Se puede hacer un modelo para predecir la

(2)

Modelos Empíricos

(3)

Observaciones

No hay una curva simple que una todos los puntos

Existe una tendencia muy fuerte a que todos los puntos se encuentran dispersos

aleatoriamente alrededor de una línea recta

Regresión Lineal Simple

Es razonable asumir que el valor esperado de Y está relacionado a x por:

Donde la pendiente y la intersección con el eje Y se conocen como COEFICIENTES DE REGRESIÓN Debido a que estamos hablando de una

(4)

Regresión Lineal Simple

Donde

є

se le conoce como término aleatorio de error

A la ecuación anterior le llamamos

modelo

de regresión lineal

simple debido a que sólo tiene una variable independiente o

regresor

Importancia de la Varianza

La varianza determina la variabilidad en las observaciones

Entonces si σ2 es pequeña los valores de las

observaciones de Y caerán muy cerca de la línea, en cambio si σ2 es grande los valores de

las observaciones de Y se desviarán mucho de la línea.

Debido a que σ2 es constante, la variabilidad

(5)

Importancia de la Varianza

Regresión Lineal Simple

Suponemos que tenemos n pares de observaciones Utilizaremos un criterio para la estimación de los coeficientes de regresión llamado el método de los mínimos cuadrados

(6)

Generalizando tenemos:

La suma de los cuadrados de las desviaciones de las observaciones es:

Regresión Lineal Simple

Los estimadores mínimos cuadrados de y de , o dichos de otra manera y deben satisfacer:

Simplificando tenemos:

(7)

Definición

Los estimadores de mínimos cuadrados en la intercepción y en la pendiente en un modelo de regresión lineal simple son:

Observaciones

La regresión lineal estimada por lo tanto es: Para cada par de observaciones se debe satisfacer la siguiente relación

Donde es llamado residual y describe el error en ese punto

(8)

Observaciones

Es conveniente dar símbolos especiales al numerador y al denominador de la definición anterior

(9)

Ejemplo

(10)

Estimación de σ

2

Tenemos aún otro parámetro desconocido en nuestro modelo de regresión, σ2la varianza

del término de error aleatorio

є

Para esto definimos La suma de cuadrados de los residuales, mejor conocida como error de suma de cuadrados

Tenemos ahora que un estimador puntual de la varianza es igual a:

Donde SSE también puede ser presentado así:

(11)

Errores estándar

En la regresión lineal simple el error estándar estimado de la pendiente y de la intersección son:

Pruebas de hipótesis en regresión

lineal simple

Una parte importante para lograr un modelo adecuado de regresión lineal es evaluar hipótesis acerca de los parámetros de este mismo modelo y de esta manera construir

(12)

Usando las pruebas-t

Supongamos que deseamos evaluar la

hipótesis de que la pendiente es igual a una constante, por decir,

Las apropiadas hipótesis serían: Nuestro valor T es el siguiente, con distribución t y n-2 grados de libertad

Podemos rechazar cuando: Ahora para evaluar la intercepción

Se rechaza con la misma condición

Usando las pruebas-t

(13)

Casos especiales

Si aceptamos la hipótesis

Si Rechazamos la hipótesis

Ejemplo

Continuando con el ejemplo anterior, evaluemos las siguientes hipótesis

Usaremos α = 0.01 Tenemos lo siguiente

(14)

Análisis de la Varianza

El método de análisis de la varianza mide la significancia de la regresión

El método particiona la variabilidad total de la respuesta variable en componentes

significativos como la base para la prueba La igualdad para el análisis de la varianza es:

Análisis de la Varianza

Simbólicamente la ecuación puede escribirse así: Donde:

Es la suma total corregida de los cuadrados (k=n-1) Es el error de suma de los cuadrados (k=n-2) Es la suma de regresión de los cuadrados (k=1)

(15)

Análisis de la Varianza

Para rechazar o aceptar utilizaremos ahora la distribución F

Rechazaremos H0 si

MSR y MSE son los cuadrados significativos

Ejemplo

Utilizaremos el mismo ejemplo anterior,

Se cumple por lo tanto la hipótesis se rechaza

(16)

Intervalos de confianza

Ejemplo

Encontrar intervalo de confianza del 95% sobre la pendiente usando los datos

(17)

Ajuste de la recta de regresión

Debido a que para nuestro análisis requerimos varias suposiciones, es necesario verificar que nuestros resultados sean adecuados

Para esto utilizamos:

• Análisis de residuales

• Coeficiente de determinación

Análisis de residuales

Sabemos que un residual es:

Se podría utilizar un histograma de frecuencia de residuales, pero es mejor utilizar una

(18)

Gráfica de PROBABILIDAD NORMAL

176, 191, 214, 220, 205, 192, 201, 190, 183, 185

(19)

Coeficiente de determinación R

2

Se determina así:

Es utilizado para juzgar que tan adecuado fue el modelo de regresión

Figure

Actualización...

Referencias

Actualización...