Regresión Lineal
Regresión Lineal
Simple
Simple
Modelos Empíricos
Modelos Empíricos
Muchos problemas en la ingeniería involucran Muchos problemas en la ingeniería involucran las relaciones entre dos o más
las relaciones entre dos o más variablesvariables Por ejemplo: temperatura y dureza
Por ejemplo: temperatura y dureza El análisis de regresión es una
El análisis de regresión es una técnicatécnica estadística muy útil para este tipo de estadística muy útil para este tipo de problemas.
problemas.
Se puede hacer un modelo para predecir la Se puede hacer un modelo para predecir la
Modelos Empíricos
Observaciones
No hay una curva simple que una todos los puntos
Existe una tendencia muy fuerte a que todos los puntos se encuentran dispersos
aleatoriamente alrededor de una línea recta
Regresión Lineal Simple
Es razonable asumir que el valor esperado de Y está relacionado a x por:
Donde la pendiente y la intersección con el eje Y se conocen como COEFICIENTES DE REGRESIÓN Debido a que estamos hablando de una
Regresión Lineal Simple
Donde
є
se le conoce como término aleatorio de errorA la ecuación anterior le llamamos
modelo
de regresión lineal
simple debido a que sólo tiene una variable independiente oregresor
Importancia de la Varianza
La varianza determina la variabilidad en las observaciones
Entonces si σ2 es pequeña los valores de las
observaciones de Y caerán muy cerca de la línea, en cambio si σ2 es grande los valores de
las observaciones de Y se desviarán mucho de la línea.
Debido a que σ2 es constante, la variabilidad
Importancia de la Varianza
Regresión Lineal Simple
Suponemos que tenemos n pares de observaciones Utilizaremos un criterio para la estimación de los coeficientes de regresión llamado el método de los mínimos cuadrados
Generalizando tenemos:
La suma de los cuadrados de las desviaciones de las observaciones es:
Regresión Lineal Simple
Los estimadores mínimos cuadrados de y de , o dichos de otra manera y deben satisfacer:
Simplificando tenemos:
Definición
Los estimadores de mínimos cuadrados en la intercepción y en la pendiente en un modelo de regresión lineal simple son:
Observaciones
La regresión lineal estimada por lo tanto es: Para cada par de observaciones se debe satisfacer la siguiente relación
Donde es llamado residual y describe el error en ese punto
Observaciones
Es conveniente dar símbolos especiales al numerador y al denominador de la definición anterior
Ejemplo
Estimación de σ
2Tenemos aún otro parámetro desconocido en nuestro modelo de regresión, σ2la varianza
del término de error aleatorio
є
Para esto definimos La suma de cuadrados de los residuales, mejor conocida como error de suma de cuadrados
Tenemos ahora que un estimador puntual de la varianza es igual a:
Donde SSE también puede ser presentado así:
Errores estándar
En la regresión lineal simple el error estándar estimado de la pendiente y de la intersección son:
Pruebas de hipótesis en regresión
lineal simple
Una parte importante para lograr un modelo adecuado de regresión lineal es evaluar hipótesis acerca de los parámetros de este mismo modelo y de esta manera construir
Usando las pruebas-t
Supongamos que deseamos evaluar lahipótesis de que la pendiente es igual a una constante, por decir,
Las apropiadas hipótesis serían: Nuestro valor T es el siguiente, con distribución t y n-2 grados de libertad
Podemos rechazar cuando: Ahora para evaluar la intercepción
Se rechaza con la misma condición
Usando las pruebas-t
Casos especiales
Si aceptamos la hipótesisSi Rechazamos la hipótesis
Ejemplo
Continuando con el ejemplo anterior, evaluemos las siguientes hipótesis
Usaremos α = 0.01 Tenemos lo siguiente
Análisis de la Varianza
El método de análisis de la varianza mide la significancia de la regresión
El método particiona la variabilidad total de la respuesta variable en componentes
significativos como la base para la prueba La igualdad para el análisis de la varianza es:
Análisis de la Varianza
Simbólicamente la ecuación puede escribirse así: Donde:
Es la suma total corregida de los cuadrados (k=n-1) Es el error de suma de los cuadrados (k=n-2) Es la suma de regresión de los cuadrados (k=1)
Análisis de la Varianza
Para rechazar o aceptar utilizaremos ahora la distribución F
Rechazaremos H0 si
MSR y MSE son los cuadrados significativos
Ejemplo
Utilizaremos el mismo ejemplo anterior,
Se cumple por lo tanto la hipótesis se rechaza
Intervalos de confianza
Ejemplo
Encontrar intervalo de confianza del 95% sobre la pendiente usando los datos
Ajuste de la recta de regresión
Debido a que para nuestro análisis requerimos varias suposiciones, es necesario verificar que nuestros resultados sean adecuadosPara esto utilizamos:
• Análisis de residuales
• Coeficiente de determinación
Análisis de residuales
Sabemos que un residual es:Se podría utilizar un histograma de frecuencia de residuales, pero es mejor utilizar una
Gráfica de PROBABILIDAD NORMAL
176, 191, 214, 220, 205, 192, 201, 190, 183, 185
Coeficiente de determinación R
2Se determina así:
Es utilizado para juzgar que tan adecuado fue el modelo de regresión