• No se han encontrado resultados

Ejercicios Propuestos Analisis de Regresion

N/A
N/A
Protected

Academic year: 2021

Share "Ejercicios Propuestos Analisis de Regresion"

Copied!
25
0
0

Texto completo

(1)

ANÁLISIS DE REGRESIÓN.

ANÁLISIS DE REGRESIÓN.

1.

1. Interprete cada uno de los siguientes coeficientes de correlación y use gráficos deInterprete cada uno de los siguientes coeficientes de correlación y use gráficos de dispersión para representar como se vería cada una de las relaciones entre dos dispersión para representar como se vería cada una de las relaciones entre dos variables (

variables (XX,, YY) cualesquiera:) cualesquiera:

a. a. r =r = -1,0-1,0.. b. b. r =r = 0,050,05.. c. c. r =r = 0,850,85.. 2.

2. Si el coeficiente de correlación para los datos de la tabla esSi el coeficiente de correlación para los datos de la tabla es 0,970,97, responda a las, responda a las

preguntas siguientes, primero sin realizar ningún cálculo y después, comprobar las preguntas siguientes, primero sin realizar ningún cálculo y después, comprobar las respuestas haciendo los cálculos necesarios con su calculadora ó el programa SPSS. respuestas haciendo los cálculos necesarios con su calculadora ó el programa SPSS.

X

X 2 2 3 3 4 5 4 5 66

YY 5 7 8 13 145 7 8 13 14

Revise los gráficos de dispersión correspondientes y responda cómo cambiaría este Revise los gráficos de dispersión correspondientes y responda cómo cambiaría este coeficiente si:

coeficiente si: a.

a. SumamosSumamos 33 a la variable a la variable XX..

b.

b. SumamosSumamos 33 en ambas variables. en ambas variables.

c.

c. Multiplicamos la variableMultiplicamos la variable XX por por 22..

d.

d. Intercambiamos todos los valores deIntercambiamos todos los valores de XX por los de por los de YY.. e.

e. Cambiamos el último valor deCambiamos el último valor de XX por el de por el de YY..

f.

f. SumamosSumamos 1010 a ambas variables pero sólo en el primer punto observado. a ambas variables pero sólo en el primer punto observado.

3.

3. La correlación lineal deLa correlación lineal de XX  con  con YY  es r=  es r=0,600,60; la correlación de; la correlación de XX  con  con WW  es de  es de

r=-r=-0,800,80. ¿Con cuál de las variables. ¿Con cuál de las variables YY ó ó WW, es mayor el grado de asociación lineal?, es mayor el grado de asociación lineal?

4.

4. Cada una de las frases siguientes contiene un error, explique en cada caso qué es loCada una de las frases siguientes contiene un error, explique en cada caso qué es lo que está mal.

que está mal. a.

a. "Existe una alta correlación entre el sexo de los trabajadores en Talca y su salario"."Existe una alta correlación entre el sexo de los trabajadores en Talca y su salario". b.

b. "Se encontró una alta correlación (r="Se encontró una alta correlación (r=1,091,09) entre las evaluaciones de los) entre las evaluaciones de los

estudiantes a los profesores y los salarios de los académicos". estudiantes a los profesores y los salarios de los académicos". c.

c. "La correlación entre el tamaño familiar y los metros cuadrados del hogar es"La correlación entre el tamaño familiar y los metros cuadrados del hogar es r=

r=0,650,65 metros cuadrados". metros cuadrados".

5.

5. La correlación entre la estatura del padre y la de su hijo hombre adulto es deLa correlación entre la estatura del padre y la de su hijo hombre adulto es de 0,520,52..

Esto nos dice que: Esto nos dice que: a.

a. Padres más altos que la media de estatura tienden a tener hijos que son más altosPadres más altos que la media de estatura tienden a tener hijos que son más altos que la media de estatura.

que la media de estatura. b.

b. Padres más altos que la media de estatura tienden a tener hijos que son más bajosPadres más altos que la media de estatura tienden a tener hijos que son más bajos que la media de estatura

que la media de estatura c.

c. Los hijos son, en promedio, más altos que sus padresLos hijos son, en promedio, más altos que sus padres d.

d. 5252% de todos los hijos son más altos que sus padres% de todos los hijos son más altos que sus padres

e.

(2)

6.

6. En un curso de introducción a la sociología, un profesor hace dos exámenes. ElEn un curso de introducción a la sociología, un profesor hace dos exámenes. El profesor quiere

profesor quiere determinar si determinar si las calificaciones de las calificaciones de los estudiantes los estudiantes en el en el segundosegundo examen están correlacionadas con las calificaciones del primero. Para facilitar los examen están correlacionadas con las calificaciones del primero. Para facilitar los cálculos, se elige una muestra de ocho estudiantes. Sus calificaciones aparecen en cálculos, se elige una muestra de ocho estudiantes. Sus calificaciones aparecen en la siguiente tabla. la siguiente tabla. Estudiante Estudiante 1 1 2 2 3 3 4 4 5 5 6 6 7 7 88 Examen 1 Examen 1 60 60 75 75 70 70 72 72 54 54 83 83 80 80 6565 Examen 2 Examen 2 60 100 80 68 73 97 85 9060 100 80 68 73 97 85 90 a.

a. Construya un gráfico de dispersión para estos datos, utilizando la calificación delConstruya un gráfico de dispersión para estos datos, utilizando la calificación del primer examen como la variable

primer examen como la variable XX. ¿Parece lineal la relación?. ¿Parece lineal la relación?

b.

b. Suponga que existe una relación lineal entre las calificaciones de los dos exámenes,Suponga que existe una relación lineal entre las calificaciones de los dos exámenes, calcule el valor r de Pearson.

calcule el valor r de Pearson. 7.

7. Con el fin de estudiar la relación que existe entre la concentración de oxígenoCon el fin de estudiar la relación que existe entre la concentración de oxígeno (volumen por ciento) de la sangre arterial y de la sangre venosa, se hicieron (volumen por ciento) de la sangre arterial y de la sangre venosa, se hicieron determinaciones simultáneas en

determinaciones simultáneas en 3030  individuos normales, con los siguientes  individuos normales, con los siguientes

resultados: resultados: Individuo

Individuo Sangre Sangre Individuo Individuo SangreSangre Nº

Nº Arterial Arterial (X) (X) Venosa Venosa (Y) (Y) Nº Nº Arterial Arterial (X) (X) Venosa Venosa (Y)(Y) 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 10 11 11 12 12 13 13 14 14 15 15 18,2 18,2 20,5 20,5 20,9 20,9 18,5 18,5 21,9 21,9 18,4 18,4 17,4 17,4 22,3 22,3 20,4 20,4 18,2 18,2 19,3 19,3 20,3 20,3 18,3 18,3 20,3 20,3 20,3 20,3 11,4 11,4 14,0 14,0 15,1 15,1 12,0 12,0 14,6 14,6 12,0 12,0 11,3 11,3 15,3 15,3 11,9 11,9 12,7 12,7 12,7 12,7 12,8 12,8 12,2 12,2 14,8 14,8 13,4 13,4 16 16 17 17 18 18 19 19 20 20 21 21 22 22 23 23 24 24 25 25 26 26 27 27 28 28 29 29 30 30 20,6 20,6 20,8 20,8 18,7 18,7 19,6 19,6 17,5 17,5 18,8 18,8 18,8 18,8 20,9 20,9 20,0 20,0 19,4 19,4 20,4 20,4 20,1 20,1 20,1 20,1 19,0 19,0 18,6 18,6 13,5 13,5 14,4 14,4 13,8 13,8 11,7 11,7 10,6 10,6 13,2 13,2 12,5 12,5 12,5 12,5 13,9 13,9 11,9 11,9 14,2 14,2 13,3 13,3 12,6 12,6 14,5 14,5 11,9 11,9 a.

a. Para estudiar la correlación que pueda existir entre las dos variables, analice elPara estudiar la correlación que pueda existir entre las dos variables, analice el gráfico de dispersión.

gráfico de dispersión. b.

b. ¿Cuál es la correlación entre las dos variables? Interprete su valor.¿Cuál es la correlación entre las dos variables? Interprete su valor. c.

c. Si todos los puntos observados coincidieran en una línea recta: ¿Cuál sería el gradoSi todos los puntos observados coincidieran en una línea recta: ¿Cuál sería el grado de correlación de ambas concentraciones de oxígeno en tal caso? ¿Qué significación de correlación de ambas concentraciones de oxígeno en tal caso? ¿Qué significación práctica tendría ese hecho? ¿Significaría esto que la concentración de oxígeno en práctica tendría ese hecho? ¿Significaría esto que la concentración de oxígeno en ambos tipos de sangre es la misma?

ambos tipos de sangre es la misma?

Salidas SPSS: Salidas SPSS: Estadísticos descriptivos Estadísticos descriptivos 3 300 1177,,4400 2222,,3300 1919,,66116677 11,,2222775588 Sangre Arterial Sangre Arterial N

(3)

Correlaciones 1 ,720** ,000 30 30 ,720** 1 ,000 30 30 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Sangre Arterial Sangre Venosa Sangre  Arterial Sangre Venosa

La correlación es significativa al nivel 0,01 (bilateral). **.

8. El crecimiento de los niños desde la infancia a la adolescencia generalmente sigue un patrón lineal. Se calculó una recta de regresión mediante el método de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a 9  años y el

resultado fue: Intercepto a=80  y pendiente b=6. La variable dependiente Y es la

altura en centímetros y X es la edad en años.

a. Interprete los valores estimados del intercepto y de la pendiente. b. ¿Cuál será la altura predicha de una niña de8 años?

c. ¿Cuál será la altura predicha de una mujer de 25 años? Comente el resultado.

9. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la revista Field Crops Research, los datos usados en la investigación son:

Duración 92 92 96 100 102 102 106 106 121 143

Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3

Con X=La duración de la cosecha de porotos de soya en días, Y=Rendimiento de la

(4)

Estadísticos descriptivos

10 92,00 143,00 106,0000 15,47040 10 ,30 2,30 1,5800 ,56332 DURACION

RENDIMIENTO

N Mínimo Máximo Media Desv. típ.

Correlaciones 1 -,940** ,000 -,940** 1 ,000 Correlación de Pearson Sig. (bilateral) Correlación de Pearson Sig. (bilateral) DURACION RENDIMIENTO DURACION RENDIMIENTO

La correlación es significativa al nivel 0,01 (bilateral). **. Coeficientesa 5,207 ,471 11,047 ,000 -,034 ,004 -7,768 ,000 (Constante) DURACION Modelo 1 B Error típ. Coeficientes no estandarizados t Sig.

Variable dependiente: RENDIMIENTO a. DURACION 150 140 130 120 110 100 90    R    E    N    D    I    M    I    E    N    T    O 2,5 2,0 1,5 1,0 0,5 0,0

(5)

DURACION 150 140 130 120 110 100 90    U  n   s    t  a  n    d  a   r    d    i  z  e    d    R  e   s    i    d  u   a    l 0,3 0,2 0,1 0,0 -0,1 -0,2 -0,3 -0,4

a. Estime la recta de regresión mediante el método de mínimos cuadrados. Interprete los estimadores en el contexto de la pregunta.

b. ¿Existe una relación lineal entre la duración y el rendimiento de la cosecha? c. Verifique los supuestos.

d. Estime el rendimiento si la duración de la cosecha fue de 104 días.

10. Un Psicólogo ha construido un cuestionario para medir depresión. Para comparar los datos del cuestionario con los datos de los expertos, 12  individuos con

"perturbaciones emocionales" completan el cuestionario. Los individuos son además calificados de manera independiente por dos siquiatras expertos, de acuerdo con el grado de depresión determinado por cada uno como resultado de entrevistas detalladas. Los valores mayores indican a una mayor depresión.

Individuo Cuestionario Siquiatra A Siquiatra B

1 48 12 9 2 37 11 12 3 30 4 5 4 45 7 8 5 31 10 11 6 24 8 7 7 28 3 4 8 18 1 1 9 35 9 6 10 15 2 2 11 42 6 10 12 22 5 3

Use las salidas de SPSS adjuntas, comente los gráficos de dispersión y conteste: a. ¿Cuál es la correlación entre los datos de los dos siquiatras?

(6)

b. ¿Cuál es la correlación entre las calificaciones cuestionario y los datos de cada siquiatra?

c. Informe de su análisis al Psicólogo.

Cuestionario

Siquiatra A

Siquiatra B

Gráficos de dispersión para depresión

Correlaciones 1 .697* .750** . .012 .005 12 12 12 .697* 1 .846** .012 . .001 12 12 12 .750** .846** 1 .005 .001 . 12 12 12 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Cuestionario Siquiatra A Siquiatra B

Cuestionario Siquiatra A Siquiatra B

La correlación es significante al nivel 0,05 (bilateral). *.

La correlación es significativa al nivel 0,01 (bilateral). **.

11. El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13  alumnos recién titulados,

obteniéndose los siguientes datos:

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13

Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3

(7)

A partir de las salidas de SPSS adjuntas:

a. Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. b. Encuentre la recta de regresión de mínimos cuadrados.

c. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión.

d. Calcule el residuo para la primera observación (x=6,1; y=4).

e. Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos).

f. Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría

recibir? Correlaciones 1 .962** .000 13 13 .962** 1 .000 13 13 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Nota de egreso Ofertas de trabajo Nota de egreso Ofertas de trabajo

La correlación es significativa al nivel 0,01 (bilateral). **. ANOVAb 33.037 1 33.037 136.842 .000a 2.656 11 .241 35.692 12 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), Nota a.

Variable dependiente: Ofertas b.

(8)

Coeficientesa -8.799 1.005 -8.757 .000 2.166 .185 .962 11.698 .000 (Constante) Nota Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Ofertas a.

12. Un Investigador cree que la inteligencia de los niños, medida a través del coeficiente intelectual (CI en puntos), depende del número de hermanos. Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple. Los resultados

aparecen en la salida adjunta:

CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90 Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6 Estadísticos descriptivos 15 90,00 120,00 103,8667 9,59067 15 ,00 6,00 2,9333 1,83095 CI HERMANOS

N Mínimo Máximo Media Desv. típ.

Correlaciones 1 -,904** ,000 -,904** 1 ,000 Correlación de Pearson Sig. (bilateral) Correlación de Pearson Sig. (bilateral) CI HERMANOS CI HERMANOS

La correlación es significativa al nivel 0,01 (bilateral). **. Coeficientesa 117,750 2,132 55,227 ,000 -4,733 ,622 -7,604 ,000 (Constante) HERMANOS Modelo 1 B Error típ. Coeficientes no estandarizados t Sig. Variable dependiente: CI a.

(9)

HERMANOS 6 5 4 3 2 1 0    C    I 120 110 100 90 HERMANOS 6 5 4 3 2 1 0    U  n   s    t  a  n    d  a   r    d    i  z  e    d    R  e   s    i    d  u   a    l 10 5 0 -5 -10

a. Encuentre e interprete el coeficiente de correlación r. b. Encuentre e interprete el coeficiente de determinación r2.

c. En este problema, ¿cuál de los dos coeficientes encontrados en (a) y (b) usaría? d. Dé la ecuación de la recta de regresión. Interprete los estimadores en el contexto

de la pregunta.

e. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%.

(10)

13. Se desea saber si existe alguna relación entre la ingestión y la absorción de grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión y absorción

cuyos resultados se muestran en la tabla que sigue:

INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES DESNUTRIDOS:

Caso Nº Ingestión

(X) Absorción(Y) Caso Nº Ingestión(X) Absorción(Y)

1 2 3 4 5 6 7 8 9 10 1,4 1,6 2,1 1,7 1,8 2,6 1,5 2,5 2,7 1,8 0,7 1,2 1,6 1,1 1,3 2,0 1,2 1,5 2,4 1,5 11 12 13 14 15 16 17 18 19 20 2,0 1,4 1,9 1,8 1,9 1,6 1,9 2,1 1,6 1,6 1,4 1,1 1,5 1,3 1,5 1,4 1,7 1,7 1,3 1,1 Estadísticos descriptivos 20 1,4 2,7 1,875 ,3740 20 ,7 2,4 1,425 ,3611 INGESTION  ABSORCION

N Mínimo Máximo Media Desv. típ.

Correlaciones 1 ,866** ,000 ,866** 1 ,000 Correlación de Pearson Sig. (bilateral) Correlación de Pearson Sig. (bilateral) INGESTION  ABSORCION INGESTION ABSORCION

La correlación es significativa al nivel 0,01 (bilateral). **. Coeficientesa -,143 ,217 -,659 ,518 ,836 ,114 7,353 ,000 (Constante) INGESTION Modelo 1 B Error típ. Coeficientes no estandarizados t Sig.

Variable dependiente: ABSORCION a.

(11)

INGESTION 2,8 2,6 2,4 2,2 2,0 1,8 1,6 1,4 1,2    A    B    S    O    R    C    I    O    N 2,5 2,0 1,5 1,0 0,5 INGESTION 2,8 2,6 2,4 2,2 2,0 1,8 1,6 1,4 1,2    U  n   s    t  a  n    d  a   r    d    i  z  e    d    R  e   s    i    d  u   a    l 0,4 0,2 0,0 -0,2 -0,4 -0,6

a. Estime a y b mediante el método de mínimos cuadrados. Interprete los coeficientes de regresión.

b. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%.

c. Encuentre e interprete el coeficiente de determinación r2. d. Verifique los supuestos de la regresión.

(12)

14. El Centro de Alumnos de la Escuela de Psicología de la Universidad de Talca, manifiestan su preocupación al momento de egresar de los estudios en las posibilidades de las ofertas laborales. Después de varias discusiones, se pidió realizar un estudio estadístico para determinar si las notas con que egresan los alumnos puede explicar el número de ofertas laborales que ellos reciben después de titularse. Para ello, se recopiló la información de 13  alumnos recién titulados,

obteniéndose los siguientes datos:

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13

Nota 6,1 5,3 4,6 4,2 6,4 5,7 5,4 4,8 6,5 6,2 4,4 5,0 5,3

Ofertas 4 3 1 0 5 4 2 2 6 4 1 2 3

A partir de las salidas de SPSS adjuntas:

a. Obtenga el coeficiente de correlación entre ambas variables. Interprete el resultado. b. Encuentre la recta de regresión de mínimos cuadrados.

c. Interprete los valores estimados del intercepto y la pendiente de la recta de regresión.

d. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%.

e. Encuentre e interprete el coeficiente de determinación r2. f. Calcule el residuo para la primera observación (x=6,1; y=4).

g. Bosqueje el gráfico de residuos que usted esperaría encontrar si este análisis de regresión lineal cumple el supuesto de linealidad (no es necesario hacer los cálculos).

h. Si un estudiante egresa con una nota 5,9, ¿Cuántas ofertas laborales esperaría

recibir? Correlaciones 1 .962** .000 13 13 .962** 1 .000 13 13 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Nota de egreso Ofertas de trabajo Nota de egreso Ofertas de trabajo **.

(13)

ANOVAb 33.037 1 33.037 136.842 .000a 2.656 11 .241 35.692 12 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), Nota a.

Variable dependiente: Ofertas b. Coeficientesa -8.799 1.005 -8.757 .000 2.166 .185 .962 11.698 .000 (Constante) Nota Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Ofertas a.

15.  “PÉRDIDA DE LA MEMORIA”.

Después de los 50 años de edad, algunas personas comienzan a tener dificultad para recordar fechas, nombres y otros datos. En algunos casos, haciendo un esfuerzo mental es posible recordar esa información, pero en otros el olvido es permanente. En un grupo de 20 sujetos, se les pidió que escribieran en una hoja el

nombre de 15 familiares ó de amistades, y luego realizaran el ejercicio de recordar

el nombre de las personas que había registrado en el papel. Considerando las siguientes salidas del SPSS:

Correlaciones 1 -.988** .000 24 24 -.988** 1 .000 24 24 Correlación de Pearson Sig. (bilateral) N Correlación de Pearson Sig. (bilateral) N Edad en años Cantidad de nombres que recuerda Edad en años Cantidad de nombres que recuerda

La correlación es significativa al nivel 0,01 (bilateral). **. Coeficientesa 32.794 .850 38.587 .000 -.370 .012 -.988 -30.023 .000 (Constante) Edad en años Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Cantidad de nombres que recuerda a.

(14)

a. Comente el Diagrama de Dispersión en conjunto con el coeficiente de correlación. b. Determine el modelo de regresión lineal, en que la cantidad de nombres que

recuerde el sujeto dependa de su edad.

c. Interprete ambos coeficientes del modelo de regresión lineal obtenidos en (b).

d. Si una persona tiene 61  años de edad, ¿Cuántas palabras estimamos que va a

recordar?

e. ¿Es significativo el modelo ajustado? Use un nivel de significación del 5%.

f. Encuentre e interprete el coeficiente de determinación r2.

g. Realice el análisis del supuesto de la linealidad del modelo ajustado. Comente. h. Si se tuviera una nueva observación de una persona de 80  años de edad que

recuerda 9 nombres, ¿qué efecto tendría este nuevo dato sobre la pendiente que se

(15)

16. En un estudio diseñado para analizar los efectos de añadir avena a la dieta estadounidense tradicional, se dividieron aleatoriamente los individuos en dos grupos diferentes. Dos veces al día, el primer grupo sustituyó con avena otros alimentos que contenían carbohidratos. Los miembros del segundo grupo no hicieron cambios en su dieta. Un resultado interesante es el nivel de colesterol en la sangre de cada individuo ocho semanas después de que comenzó el estudio. Las variables explicativas que podrían afectar esta respuesta incluyen el tipo de dieta, el grado de colesterol en la sangre al inicio del estudio, el índice de masa corporal y el sexo. Los coeficientes calculados y los errores estándares del modelo de regresión múltiple que contiene estas cuatro variables explicativas aparecen a continuación:

Variable Coeficiente Error estándar t Valor_p

Dietas -11,25 4,33 0,0126

Colesterol inicio 0,85 0,07 <0,001

Índice de masa corporal 0,23 0,65 0,724

Sexo -3,02 4,42 0,498

a. Si el estudio se llevó a cabo en 50 individuos, lleve a cabo pruebas de hipótesis nula

que indiquen que cada uno de los cuatro coeficientes en la ecuación de regresión de población es igual a 0. En el nivel de significancia 0,05, ¿Cuál de las variables

explicativas afecta el nivel de colesterol en la sangre ocho semanas después de que inició el estudio?

b. Si en índice de masa corporal de un individuo se incrementara en 1  kg/m2 y los

valores de las demás variables explicativas permanecen constantes, ¿Qué ocurriría con el nivel de colesterol en la sangre?

c. Si en índice de masa corporal de un individuo se incrementara en 10 kg/m2 y los

valores de las demás variables explicativas permanecen constantes, ¿Qué ocurriría con el nivel de colesterol en la sangre?

d. La variable indicadora de sexo se codifica de modo que el 1 represente un hombre y 0 una mujer. ¿Quién probablemente tendrá un nivel de colesterol en la sangre más

alto ocho semanas después de comenzado el estudio, un hombre ó una mujer? ¿Cuánto más alto sería en promedio?

17. En una investigación de niños con bajo peso al nacer se encontró una relación lineal significativa entre la presión arterial sistólica y las semanas de gestación. También se mide el índice apgar a los 5 minutos para cada niño (el índice del apgar es un indicador del estado general de salud de un niño 5 minutos después del nacimiento, aunque en realidad es una medición ordinal, a menudo se considera continua).

a. Interprete el gráfico de dispersión adjunto que relaciona la presión sistólica y el índice apgar. ¿Aparece alguna relación lineal entre estas dos variables?

(16)

 Apgar  10 8 6 4 2 0 -2    P  r  e   s    i    ó  n    S    i  s    t    ó    l    i  c  a 90 80 70 60 50 40 30 20 10

b. Con la presión arterial sistólica como respuesta, el periodo de gestación y el índice apgar como explicativas ajuste el modelo de mínimos cuadrados, interprete los coeficientes y haga un breve resumen de los significados de los resultados.

Resumen del modelob

.299a .089 .071 10.993 Modelo 1 R R cuadrado R cuadrado corregida Error típ. de la estimación

Variables predictoras: (Constante), Apgar, Edad Gestacional a.

Variable dependiente: Presión Sistólica b. ANOVAb 1151.364 2 575.682 4.764 .011a 11721.996 97 120.845 12873.360 99 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), Apgar, Edad Gestacional a.

Variable dependiente: Presión Sistólica b. Coeficientesa 9.803 12.663 .774 .441 -15.329 34.936 1.185 .442 .263 2.678 .009 .307 2.063 .488 .461 .104 1.057 .293 -.428 1.403 (Constante) Edad Gestacional  Apgar  Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os

t Sig. Límite inferior  

Límite superior  Intervalo de confianza para

B al 95%

Variable dependiente: Presión Sistólica a.

(17)

c. ¿Cuál es la presión arterial sistólica media de la población de niños con bajo peso al nacer cuyo periodo de gestación sea de 31 semanas y cuyo índice apgar de 7?

d. Haga comentarios sobre la magnitud de R cuadrado. ¿Mejora la inclusión del índice apgar de 5 minutos en el modelo que ya contiene el periodo de gestación, su capacidad para predecir la presión arterial sistólica?

e. Interprete el gráfico de residuos en función de los valores ajustados de presión arterial sistólica. ¿Qué le dice este gráfico sobre el ajuste del modelo a los datos observados?

Regresión Residuo tipificado

3    . 5   0    3    . 0   0    2    . 5   0    2    . 0   0    1    . 5   0    1    . 0   0    . 5   0    0    . 0   0    -  . 5   0    -  1    . 0   0    -  1    . 5   0    -  2    . 0   0    Histograma de residuos    F  r  e   c   u   e   n   c    i  a 16 14 12 10 8 6 4 2 0 Desv. típ. = .99 Media = 0.00 N = 100.00

Gráfico de residuos vs predichos

Unstandardized Predicted Value

60 50 40 30    U  n   s    t  a  n    d  a  r    d    i  z  e    d    R  e   s    i    d  u  a    l 40 30 20 10 0 -10 -20 -30

f. En el gráfico de residuos aparece un valor de residuo grande. ¿Qué debemos hacer? Diagnósticos por casoa

3.586 87 47.58 39.42 Número de caso 16 Residuo tip. Presión Sistólica Valor 

pronosticado Residuo bruto

Variable dependiente: Presión Sistólica a. ANOVAb 1113.143 2 556.571 5.264 .007a 10150.514 96 105.735 11263.657 98 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), Apgar, Edad Gestacional a.

Variable dependiente: Presión Sistólica b. Coeficientesa 9.683 11.845 .817 .416 1.186 .414 .282 2.867 .005 .436 .432 .099 1.010 .315 (Constante) Edad Gestacional  Apgar  Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig. a.

(18)

g. Se incluyó la variable sexo (donde 1  representa un hombre y 0  una mujer) en el

modelo que contiene sólo a las semanas de gestación. Dados dos niños con idéntico periodo de gestación, un hombre y una mujer, ¿Cuál de ellos tenderá a tener la presión arterial sistólica más alta? ¿Por cuánto en promedio?

ANOVAb 1061.735 2 530.867 4.360 .015a 11811.625 97 121.769 12873.360 99 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), SEXOIND, Edad Gestacional a.

Variable dependiente: Presión Sistólica b. Coeficientesa 10.007 12.723 .787 .433 1.263 .438 .281 2.885 .005 1.356 2.223 .059 .610 .543 (Constante) Edad Gestacional SEXOIND Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Presión Sistólica a.

h. Construya un gráfico de dispersión de la presión arterial sistólica en función del periodo de gestación. En el gráfico trace por separado dos rectas de regresión correspondientes a hombre y mujeres. ¿Es la diferencia de sexo en la presión arterial sistólica significativamente distinta de 0?

Edad Gestacional 36 34 32 30 28 26 24 22    P  r  e   s    i    ó  n    S    i  s    t    ó    l    i  c  a 90 80 70 60 50 40 30 20 10

(19)

i. Incluya en el modelo una tercera variable explicativa que constituya la interacción entre el periodo de gestación y el sexo. ¿Tiene el periodo de gestación un efecto distinto en la presión arterial sistólica según el sexo del niño?

Coeficientesa 14.981 15.242 .983 .328 1.090 .525 .242 2.075 .041 -15.157 27.743 -.663 -.546 .586 .571 .957 .726 .597 .552 (Constante) Edad Gestacional SEXOIND INTERAC Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Presión Sistólica a.

18. Prediciendo la Capacidad Mental.

¿Estarán el tamaño y peso de su cerebro relacionados con su capacidad mental? Se mide la escala global de CI basado en Wechsler como variable respuesta. Además se tienen tres variables explicativas, el peso corporal (en libras), la estatura (en pulgadas) y el MRI (resonancia magnética por imágenes). El modelo de regresión lineal múltiple es:

CI = β0 + β1(MRI) + β2(Peso) + β3(Estatura) +ξ

Se tiene una muestra de 20 mujeres y la salida de análisis con SPPS es:

Model Summaryb .360a .130 -.034 24.08 Model 1 R R Square  Adjusted R Square Std. Error of  the Estimate

Predictors: (Constant), MRICOUNT, HEIGHT, WEIGHT a. Dependent Variable: IQ b. ANOVAb 1382.376 3 460.792 .795 .515a 9277.424 16 579.839 10659.800 19 Regression Residual Total Model 1 Sum of 

Squares df Mean Square F Sig.

Predictors: (Constant), MRICOUNT, HEIGHT, WEIGHT a. Dependent Variable: IQ b. Coefficientsa 35.775 190.361 .188 .853 -.131 .432 -.094 -.303 .766 -.720 2.914 -.070 -.247 .808 1.638E-04 .000 .387 1.479 .159 (Constant) WEIGHT HEIGHT MRICOUNT Model 1 B Std. Error   Unstandardized Coefficients Beta Standardi zed Coefficien ts t Sig.

(20)

a. Escriba la recta de regresión múltiple estimada.

b. Dé el valor del R 2 e interprételo en términos del problema de regresión.

c. Dé un estimador de la desviación estándar poblacional de y/x.

d. Examine los tests t de los coeficientes de regresión. Para cada test formule la hipótesis, valor del test, valor_p, decisión y conclusión.

19. Prediciendo puntajes en examen final.

Se investiga la relación entre los puntajes de un examen final con el puntaje de una prueba parcial y el número de clases que faltó un alumno. Se tienen datos de 25

estudiantes, se adjunta análisis en SPSS.

Figura1: Gráfico de dispersión de puntaje en el examen e inasistencia a clases.

Number of Missed Classes 8 7 6 5 4 3 2 1 0 -1    F    i  n  a    l    E  x   a   m    S  c   o   r   e 100 90 80 70 60 50 40 30 20 10 0

a. Escriba el modelo de regresión lineal múltiple. b. Escriba la recta de regresión múltiple estimada.

c. Dé el valor del R 2 e interprételo en términos del problema de regresión.

d. Dé un estimador de la desviación estándar poblacional de y/x. e. Indique a qué hipótesis corresponde el test F.

f. Examine los tests t de los coeficientes de regresión. Para cada test formule la hipótesis, valor del test, valor_p, decisión y conclusión.

g. Qué supuestos se deben cumplir para la utilización de este modelo. Model Summaryb .857a .734 .710 10.2315 Model 1 R R Square  Adjusted R Square Std. Error of  the Estimate

Predictors: (Constant), MISSED, MIDTERM a.

Dependent Variable: FINAL b. ANOVAb 6352.682 2 3176.341 30.342 .000a 2303.058 22 104.684 8655.740 24 Regression Residual Total Model 1 Sum of 

Squares df Mean Square F Sig.

Predictors: (Constant), MISSED, MIDTERM a.

Dependent Variable: FINAL b.

(21)

Coefficientsa 51.949 14.179 3.664 .001 .977 .326 .385 2.994 .007 -4.839 1.051 -.592 -4.604 .000 (Constant) MIDTERM MISSED Model 1 B Std. Error   Unstandardized Coefficients Beta Standardi zed Coefficien ts t Sig.

Dependent Variable: FINAL a.

20. En general use un 5% como nivel de significación.

El programa de investigación de factores de riesgo de enfermedades cardiovasculares (PIFRECV) de la Universidad de Talca, realizó una encuesta en la ciudad de Talca a 1006 adultos entre 18 y 74 años de edad. Se desea analizar la

relación entre el Perímetro de cintura (en centímetros) y la edad (en años), glicemia (en mg/dl), presión arterial sistólica (en mmHg) y tabaquismo (codificado como

1=fuma y 0=no fuma).

Usando los resultados de SPSS adjuntos:

a. Escriba la recta de regresión múltiple estimada.

b. ¿Cuál sería el Perímetro de cintura estimado de un sujeto fumador de 19 años, con 120 ml de glicemia y 137 mmHg de presión arterial sistólica?

c. Interprete los coeficientes de regresión ajustados en relación con el problema.

d. A partir de la tabla de ANOVA adjunta calcule e interprete el coeficiente de determinación

e. Indique a qué hipótesis corresponde el test F de la tabla ANOVA. ¿Qué concluye? f. Analice la significancia de los coeficientes de regresión. Comente el resultado en

general. ANOVAb 33359.248 4 8339.812 59.826 .000a 139681.083 1002 139.402 173040.331 1006 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), Glicemia, Tabaquismo, Presión arterial sistólica, Edad en años

a.

Variable dependiente: Perímetro de cintura en cms b. Coeficientesa 53.997 2.552 21.162 .000 .083 .031 .089 2.677 .008 1.866 .792 .069 2.357 .019 .180 .020 .287 8.793 .000 .106 .015 .210 7.024 .000 (Constante) Edad en años Tabaquismo

Presión arterial sistólica Glicemia Modelo 1 B Error típ. Coeficientes no estandarizados Beta Coeficientes estandarizad os t Sig.

Variable dependiente: Perímetro de cintura en cms a.

(22)

21. Use un 10% como nivel de significación.

Sohil et al.  (2002) realizaron un estudio cuyo fin era determinar si la función neuropsicológica en las personas infectadas con VIH se correlaciona con la pérdida de volumen cerebral. El desempeño neuropsicológico se evaluó mediante la aplicación de una serie de pruebas del funcionamiento neuropsicológico (NPZ-8), en tanto que el volumen cerebral fue medido como el porcentaje del volumen parenquimatoso del cerebro obtenido mediante una resonancia magnética (PBV). La tabla adjunta muestra mediciones del volumen parenquimatoso del cerebro (PBV, Parenchymal Brain Volumen en inglés), del funcionamiento neuropsicológico (NPZ-8), del estado VIH (1: Positivo, 0: Negativo), de si el paciente ha manifestado

o no la etapa del complejo demencial del SIDA (ADC, AIDS Demetia Complex en inglés, 1: positivo y 0: negativo) y del estado del sistema inmunitario (CD4,

cantidad de linfocitos medido en cientos) de los sujetos que participaron en el estudio.

Los bajos valores PBV indican menos volumen cerebral, en tanto que puntuaciones NPZ-8 más bajas indican un mejor funcionamiento neuropsicológico. Un valor ADC positivo indica que se ha diagnosticado el complejo demencial del SIDA. Los conteos CD4 más altos se asocian con un mejor funcionamiento del sistema inmunitario.

Sujeto PBV NPZ-8 VIH ADC CD4 (x100)

1 0,776 12 1 1 0,16 2 0,792 5 1 1 3,24 3 0,76 3 1 1 2,56 4 0,76 5 1 1 5,63 5 0,804 2 1 1 3,21 6 0,808 6 1 1 1,9 7 0,854 8 1 1 8,5 8 0,803 0 1 0 3,55 9 0,831 3 1 0 4,65 10 0,826 0 1 0 5,19 11 0,786 0 1 0 0,87 12 0,882 7 1 0 1,08 13 0,889 3 1 0 1,9 14 0,817 0 1 0 5,73 15 0,805 0 1 0 10,32 16 0,886 0 0 0 13,11 17 0,833 0 0 0 12 18 0,851 1 0 0 14,89 19 0,897 0 0 0 12,18 20 0,901 0 0 0 13,89

Usando los resultados de SPSS adjuntos:

a. Escriba la ecuación de regresión múltiple estimada.

b. Interprete los coeficientes de regresión ajustados en relación con el problema. c. Interprete el coeficiente de determinación.

d. Indique a qué hipótesis corresponde el test F de la tabla ANOVA. ¿Qué concluye? e. Analice la significancia de los coeficientes de regresión. Comente el resultado en

general.

(23)

Resumen del modelob .765a .585 .475 .032664 Modelo 1 R R cuadrado R cuadrado corregida Error típ. de la estimación

Variables predictoras: (Constante), ADC, CD4 (x100), NPZ-8, VIH

a.

Variable dependiente: PBV b.

Coeficientes(a)

Modelo Coeficientes noestandarizados estandarizadosCoeficientes

t Sig. B Error típ. Beta 1 (Constante) .851 .044 19.249 .000 NPZ-8 -.006 .003 -.460 -1.888 .079 VIH -.038 .033 -.372 -1.137 .273 CD4 (x100) .002 .003 .172 .511 .617 ADC -.061 .021 -.663 -2.853 .012 a Variable dependiente: PBV ANOVAb .023 4 .006 5.294 .007a .016 15 .001 .039 19 Regresión Residual Total Modelo 1 Suma de cuadrados gl Media cuadrática F Sig.

Variables predictoras: (Constante), ADC, CD4 (x100), NPZ-8, VIH a.

Variable dependiente: PBV b.

(24)
(25)

Pruebas de normalidad

.105 20 .200* .970 20 .747

Residuos

Estadístico gl Sig. Estadístico gl Sig. Kolmogorov-Smirnova Shapiro-Wilk

Este es un límite inferior de la significación verdadera. *.

Corrección de la significación de Lilliefors a.

Referencias

Documento similar