Tarea 2 Unidad 2

(1)

Regresión Múltiple - calificacion en quimica

Variable dependiente: calificacion en quimica

Variables independientes: calificacion en examen clases perdidas

Error Estadístico

Parámetro Estimación Estándar T Valor-P

CONSTANTE 27.5467 12.4981 2.20407 0.0550

calificacion en examen 0.921678 0.185827 4.95988 0.0008

clases perdidas 0.28425 0.753597 0.377191 0.7148

Análisis de Varianza

Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P

Modelo 544.596 2 272.298 13.34 0.0020

Residuo 183.654 9 20.406

Total (Corr.) 728.25 11

R-cuadrada = 74.7815 porciento

R-cuadrado (ajustado para g.l.) = 69.1773 porciento Error estándar del est. = 4.5173

Error absoluto medio = 3.53843

Estadístico Durbin-Watson = 2.19547 (P=0.7074) Autocorrelación de residuos en retraso 1 = -0.196859 El StatAdvisor

La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para describir la relación entre calificacion en quimica y 2 variables independientes. La ecuación del modelo ajustado es

calificacion en quimica = 27.5467 + 0.921678*calificacion en examen + 0.28425*clases perdidas

Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una relación estadísticamente significativa entre las variables con un nivel de confianza del 95.0%.

El estadístico R-Cuadrada indica que el modelo así ajustado explica 74.7815% de la variabilidad en calificacion en quimica. El estadístico R-Cuadrada ajustada, que es más apropiada para comparar modelos con diferente número de variables independientes, es 69.1773%. El error estándar del estimado muestra que la desviación estándar de los residuos es 4.5173. Este valor puede usarse para construir límites para nuevas observaciones, seleccionando la opción de Reportes del menú de texto. El error absoluto medio (MAE) de 3.53843 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0.05, no hay indicación de una

autocorrelación serial en los residuos con un nivel de confianza del 95.0%.

Para determinar si el modelo puede simplificarse, note que el valor-P más alto de las variables independientes es 0.7148, que corresponde a clases perdidas. Puesto que el valor-P es mayor o igual que 0.05, ese término no es estadísticamente significativo con un nivel de confianza del 95.0% ó mayor. Consecuentemente, debería considerarse eliminar clases perdidas del modelo.

(2)

Regresión Múltiple - calificacion en quimica

Variable dependiente: calificacion en quimica

Variables independientes: calificacion en examen

Error Estadístico

Parámetro Estimación Estándar T Valor-P

CONSTANTE 30.0433 10.1366 2.96384 0.0142

calificacion en examen 0.897214 0.166504 5.38853 0.0003 Análisis de Varianza

Modelo 541.693 1 541.693 29.04 0.0003

Residuo 186.557 10 18.6557

Total (Corr.) 728.25 11

R-cuadrada = 74.3828 porciento

R-cuadrado (ajustado para g.l.) = 71.8211 porciento Error estándar del est. = 4.31923

Error absoluto medio = 3.45717

Estadístico Durbin-Watson = 2.10112 (P=0.6047) Autocorrelación de residuos en retraso 1 = -0.158722 El StatAdvisor

La salida muestra los resultados de ajustar un modelo de regresión lineal múltiple para describir la relación entre calificacion en quimica y 1 variables independientes. La ecuación del modelo ajustado es

calificacion en quimica = 30.0433 + 0.897214*calificacion en examen

Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una relación estadísticamente significativa entre las variables con un nivel de confianza del 95.0%.

El estadístico R-Cuadrada indica que el modelo así ajustado explica 74.3828% de la variabilidad en calificacion en quimica. El estadístico R-Cuadrada ajustada, que es más apropiada para comparar modelos con diferente número de variables independientes, es 71.8211%. El error estándar del estimado muestra que la desviación estándar de los residuos es 4.31923. Este valor puede usarse para construir límites para nuevas observaciones, seleccionando la opción de Reportes del menú de texto. El error absoluto medio (MAE) de 3.45717 es el valor promedio de los residuos. El estadístico de Durbin-Watson (DW) examina los residuos para determinar si hay alguna correlación significativa basada en el orden en el que se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0.05, no hay indicación de una autocorrelación serial en los residuos con un nivel de confianza del 95.0%.

Para determinar si el modelo puede simplificarse, note que el valor-P más alto de las variables independientes es 0.0003, que corresponde a calificacion en examen. Puesto que el valor-P es menor que 0.05, ese término es estadísticamente significativo con un nivel de confianza del 95.0%. Consecuentemente, probablemente no quisiera eliminar ninguna variable del modelo.

(3)

Gráfico del Modelo Ajustado 50 54 58 62 66 70 calificacion en examen 74 78 82 86 90 94 98 c a li fi c a c io n e n q u im ic a

ANOVA adicional para Variables en el Orden Ajustado

calificacion en examen 541.693 1 541.693 29.04 0.0003

Modelo 541.693 1

El StatAdvisor

Esta tabla muestra la significancia estadística de cada variable conforme fue agregada al modelo. Puede utilizar esta tabla para ayudarse a determinar si el modelo puede ser simplificado, especialmente si se está ajustando un polinomio.

Gráfico de calificacion en quimica

74 78 82 86 90 94 98 predicho 74 78 82 86 90 94 98 o b s e rv a d o

Intervalos de confianza del 95.0% para las estimaciones de los coeficientes

Error

Parámetro Estimación Estándar Límite Inferior Límite Superior

CONSTANTE 30.0433 10.1366 7.45751 52.6292

calificacion en examenn

0.897214 0.166504 0.526218 1.26821

(4)

Esta tabla muestra intervalos de confianza del 95.0% para los coeficientes en el modelo. Los intervalos de confianza muestran con qué precisión pueden estimarse los coeficientes dados la cantidad de datos disponibles, y el nivel de ruido que está presente.

Gráfico de Residuos 50 54 58 62 66 70 calificacion en examen -2 -1 0 1 2 R e d id u o E s tu d e n ti za d o

Matriz de Correlación para las estimaciones de los coeficientes CONSTANTE calificacion en examen

CONSTANTE 1.0000 -0.9924

calificacion en examen -0.9924 1.0000 El StatAdvisor

Esta tabla muestra las correlaciones estimadas entre los coeficientes en el modelo ajustado. Estas correlaciones pueden usarse para detectar la presencia de de multicolinearidad severa, es decir, correlación entre las variables predictoras. En este caso, no hay correlaciones con valores absolutos mayores que 0.5 (sin incluir el término constante).

Gráfico de Residuos

74 78 82 86 90 94 98

predicho calificacion en quimica -2 -1 0 1 2 R e d id u o E s tu d e n ti za d o

Resultados de la Regresión para calificacion en quimica

Ajustado Error Est. Inferior 95.0% Superior 95.0% Inferior 95.0% Fila LC para Pronóstico LC para Pronóstico LC para Pronóstico LC para la Media

(5)

Superior 95.0% Fila LC para la Media

El StatAdvisor

Esta tabla contiene información acerca de calificacion en quimica la cual fue generada usando el modelo ajustado. La tabla incluye:

(1) los valores predichos de calificacion en quimica usando el modelo ajustado (2) el error estándar para cada valor predicho

(3) intervalos de previsión del 95.0% para nuevas observaciones (4) intervalos de confianza del 95.0% para la respuesta media

Cada ítem corresponde a los valores de las variables independientes en una fila específica en el archivo de datos. Para generar pronósticos para combinaciones adicionales de las variables, agregue filas adicionales al final del archivo de datos. En cada nueva fila, introduzca los valores para las variables independientes pero deje vacía la celda de la variable dependiente. Cuando regrese a esta ventana, se habrán agregado los pronósticos a la tabla para las nuevas filas, pero el modelo no se verá afectado.

Gráfico de Residuos 0 2 4 6 8 10 12 número de fila -2 -1 0 1 2 R e d id u o E s tu d e n ti za d o Residuos Atípicos Y Residuo

Fila Y Predicha Residuo Estudentizado

El StatAdvisor

La tabla de residuos atípicos enlista todas las observaciones que tienen residuos Estudentizados mayores a 2, en valor absoluto. Los residuos Estudentizados miden cuántas desviaciones estándar se desvía cada valor observado de calificacion en quimica del modelo ajustado, utilizando todos los datos excepto esa observación. En este caso, no hay residuos Estudentizados mayores que 2.

(6)

Gráfico de calificacion en quimica con Valores Predichos 50 54 58 62 66 70 calificacion en examen 74 78 82 86 90 94 98 c a li fi c a c io n e n q u im ic a Puntos Influyentes Distancia de

Fila Influencia Mahalanobis DFITS

6 0.219814 1.90837 -0.882553

Influencia media de un solo punto = 0.166667 El StatAdvisor

La tabla de puntos influyentes enlista todas las observaciones que tienen valores de influencia mayores que 3 veces la de un punto promedio de los datos, ó que tienen un valor inusual de DFITS. Valor de Influencia es un estadístico que mide que tan influyente es cada observación en la determinación de los coeficientes del modelo estimado. DFITS es un estadístico que mide que tanto podrían cambiar los coeficientes estimados si la observación se eliminara del conjunto de datos. En este caso, un punto promedio de los datos tendría un valor de influencia igual a 0.166667. No hay puntos con más de 3 veces el valor de influencia promedio. Hay un dato con valor inusualmente grande de DFITS.

Tarea 2 Unidad 2

Regresión Múltiple - calificacion en quimica

Regresión Múltiple - calificacion en quimica

Reporte:

En este análisis tiene como objetivo de estudiar un modelo que nos permita

explicar el comportamiento de dos variables (Y) utilizando la información de

los valores (calificación de examen y clases perdidas) lo cual el programa

Statgraphics analiza ampliamente este tema aportando procedimientos para la

regresión simple múltiple tanto lineal como no lineal, incluyendo el posible

análisis de una amplia variedad de modelos de regresión con una sola variable

independiente.

Lo cual arrojó el programa que el primer análisis de la calificación de examen

y clases perdidas no era un modelo estadístico. En el segundo análisis nos dijo

que si era un modelo que consecuentemente, probablemente no quisiera

eliminar ninguna variable del modelo.