• No se han encontrado resultados

EL COEFICIENTE DE CORRELACIÓN DE RANGO

In document Estadistica II Cibertec (página 175-185)

CORRELACIÓN ENTRE DOS VARIABLES

EL COEFICIENTE DE CORRELACIÓN DE RANGO

Con la noción del coeficiente de correlación, se concluyó una medida de la cercanía de asociación entre dos variables. Con frecuencia, en el análisis de correlación, la información no está siempre disponible en forma de valores numéricos. Pero si se puede asignar clasificaciones a los elementos de cada una de las dos variables que se están estudiando, entonces puede calcularse un coeficiente de correlación de rango. Ésta es una medida de la correlación que existe entre los dos conjuntos de rangos, una medida del grado de asociación entre las variables que no podríamos calcular de otra manera.

Una segunda razón para aprender el método de correlación de rango es la posibilidad de simplificar el proceso de cálculo de un coeficiente de correlación a partir de un conjunto de datos muy grande para cada una de las dos variables. Esta medición se le conoce como el coeficiente de correlación de rango de Spearman, en honor al estadístico que lo desarrolló a principios de siglo pasado.

(

1

)

6 1 2 2 − − =

n n d rs

rs = coeficiente de correlación de rango

n = número de observaciones apareadas

d = diferencia entre rangos para cada pareja de observaciones

Si el valor del coeficiente de rangos es +1 o -1, significa que existe una asociación perfecta entre las dos variables.

ACTIVIDADES

1. Los datos siguientes son los sueldos mensuales, y promedios de calificaciones x para estudiantes que obtuvieron su licenciatura en administración, con especialización en sistemas de información.

Calificación Sueldo mensual ( s/.)

2,6 2 800 3,4 3 100 3,6 3 500 3,2 3 000 3,5 3 400 2,9 3 100

1.1 Calcule el coeficiente de determinación r2.

1.2 ¿Cuál es el valor del coeficiente de correlación para la muestra?

2. En un laboratorio médico, se estima la cantidad de proteína en muestras de hígado empleando un modelo de regresión. En un espectrómetro se emite luz que pasa por una sustancia que contiene la muestra, y la cantidad de luz absorbida se emplea para estimar la cantidad de proteína. Diariamente, se forma una nueva ecuación de regresión, porque las cantidades de colorante son distintas. En un día, se obtuvieron las indicaciones de absorbencia de la tabla, usando concentraciones conocidas de proteína.

Absorbencia ( xi) Miligramos de proteína ( yi) 0,509 0 0,756 20 1,020 40 1,400 80 1,570 100 1,790 127

2.1 Con estos datos, forme una ecuación de regresión que relacione la indicación de absorbencia de luz con los miligramos de proteína de la muestra.

2.2 Calcule r2. ¿Se sentiría cómodo con este modelo de regresión, al estimar la cantidad de proteína de una muestra?

2.3 En una muestra que se acaba de recibir, la indicación de absorbencia fue de 0,941. Estime la cantidad de proteína en esa muestra.

3. Las siguientes son clasificaciones de acometividad (X) y cantidad de ventas en el último año (Y) de ocho vendedores. ¿Existe una correlación significativa entre las dos mediciones? Utilice el nivel de significancia de 0.10.

X 30 17 35 28 42 25 19 29

Y 35 31 43 46 50 32 33 42

4. Un supervisor de planta clasificó una muestra de ocho trabajadores según el número de horas extras trabajadas y la antigüedad en el empleo. ¿La correlación de rango entre las dos mediciones es significativa al nivel de 0.01?

Cantidad de horas extra

5.0 8.0 2.0 4.0 3.0 7.0 1.0 6.0 Años de empleo 1.0 6.0 4.5 2.0 7.0 8.0 4.5 3.0

5. La mayoría de las personas cree que la experiencia gerencia produce mejores relaciones interpersonales entre un gerente y sus empleados. La Corporación ATT tiene los siguientes datos que equiparan los años de experiencia por parte del gerente con el número de quejas archivados, el año pasado, por los empleados que reportaban con el gerente. Al nivel de significancia de 0.05, ¿la correlación de rango entre estos dos factores sugiere que la experiencia mejora las relaciones?

Edad del gerente 32 43 42 29 56 62 45 39 40 35 Número de quejas 5 2 2 4 3 2 4 5 4 6

6. Seguros Plan ha confinado sus estudios a la industria química sintética, por ello se desea realizar unos estudios de la relación de gastos para la seguridad en plantas y la tasa de accidentes en ellas. Para ajustar el tamaño diferencial que existía entre algunas de las plantas, Seguros Plan convirtió sus datos en gastos (en dólares) por empleado de producción. Los siguientes son los resultados:

Compañía A B C D E F G H I J K Gastos 60 37 30 20 24 42 39 54 48 58 26 Accidentes 5 7 6 9 7 4 8 2 4 3 8 ¿Existe una correlación significativa entre los gastos y los accidentes en las plantas de las compañías químicas? Use una correlación de rango (en la que 1 represente el mayor gasto y tasa de accidentes) para respaldar su conclusión. Pruebe al nivel de significancia de 1 %.

Autoevaluación

1. “El granjerito” trató de determinar la relación entre el porcentaje de metionina que se agrega al alimento y el peso corporal de pollos. Con los datos obtenidos se aplicó el análisis de regresión y se determinó la siguiente línea de regresión:

yˆ=0,21+0,42x

En donde:

= peso corporal estimado en kilogramos

X = porcentaje de metionina adicional en el alimento

El coeficiente de determinación, r2, fue 78, lo que indica que el ajuste fue razonablemente bueno para los datos. Suponga que se usó una muestra de tamaño 30 para el estudio, y

∑( )

yy 2 =45 . Calcule

2

     ∧ y y .

2. ¿A los directores y principales ejecutivos se les paga de acuerdo con las ganancias obtenidas por las empresas? La siguiente tabla muestra una lista de datos corporativos sobre el cambio porcentual en el rendimiento de las acciones durante un periodo de dos años, y el cambio porcentual en la paga a los directores y principales ejecutivos, inmediatamente después de 2 años.

Empresa Cambio bianual en el rendimiento (%) Cambio en el pago ejecutivo (%) ASAKA 201,3 18 WONG 146,5 28 MICMAS 76,7 10 TODOS 158,2 28 TECHO -34,9 15 PATIO 73,2 -9 PPKSA -7,9 -20

2.1 Forme la ecuación de regresión con el cambio porcentual bianual de rendimiento de las acciones como variable independiente.

2.2 Calcule r2. ¿Se sentirá cómodo al usar el cambio porcentual bianual de rendimiento de las acciones para predecir el cambio porcentual en el sueldo de los principales ejecutivos? Comente sus razones.

2.3 ¿Cuál es el coeficiente de correlación? ¿Refleja una relación intensa o débil entre el rendimiento y la compensación a ejecutivos?

3. La revista Etiqueta Negra informó que “la beta” de mercado para Backus es 1,25. Las betas de mercado para acciones individuales se determinan con regresión lineal simple. Para cada acción, la variable dependiente es el rendimiento trimestral porcentual (reevaluación del capital más dividendos) menos el rendimiento porcentual que se podría obtener con una inversión libre de riesgos (la tasa de Bonos de la Tesorería se usa como tasa libre de riesgo). La variable independiente es el rendimiento trimestral porcentual (reevaluación del capital más dividendos) para el mercado de acciones (S&P 500) menos el rendimiento porcentual de una inversión libre de riesgos. Con los datos trimestrales se determina una ecuación; la beta de mercado para la acción es la pendiente de la ecuación estimada de regresión (b1), y su valor se interpreta con frecuencia, como medida del

riesgo asociado con esas acciones. Las betas del mercado mayores que uno indican que la acción es más volátil que el promedio del mercado. En la tabla siguiente se presentan las diferencias entre el rendimiento porcentual y el rendimiento libre de riesgo de 10 trimestres de las empresas Backus y Brahama.

Backus 1,2 -2,5 -3,0 2,0 5,0 1,2 3,0 -1,0 0,5 2,5

Brahama -0,7 -2,0 -5,5 4,7 1,8 4,1 2,6 2,0 -1,3 5,5

3.1 Determine la ecuación de regresión para calcular la beta de mercado ¿Cuál es la beta de mercado de Brahama?

3.2 Calcule r2. ¿Se sentiría cómodo con este modelo de regresión.

3.3 ¿Tuvo buen ajuste la ecuación estimada de regresión? Explique su respuesta.

4. Un profesor de mercadotecnia se interesa en la relación entre las horas de estudio y los puntos totales obtenidos en su curso. A continuación, se observa los datos reunidos con 10 alumnos que acaban de tomar el curso.

Horas de estudio 45 30 90 60 105 65 90 80 55 75

Total de puntos

obtenidos

40 35 75 65 90 50 90 80 45 65

4.1 Forme una ecuación de regresión que muestre cómo se relaciona el total de puntos obtenidos con las horas de estudio.

4.2 ¿Cuál es el coeficiente de correlación?

4.3 Prediga los puntos totales que obtendrá Karina López. Pasó 95 horas estudiando.

5. Dos profesores de una escuela de comercio discutían sobre lo difícil que es predecir el éxito de los graduados basándose solamente en las calificaciones. Un profesor pensaba que el número de años de experiencia que los maestros en administración de empresas tuvieran antes de regresar por sus post grados era probablemente el mejor preeditor. Usando los siguientes datos, al nivel de significancia de 0.02, ¿qué correlación de rango es un mejor preeditor de éxito profesional?

Años de experiencia 4 3 4 6 7 5 5 2 1 3

Promedio de

calificaciones 3.4 3.2 3.5 2.9 3.4 3.9 3.6 3.0 2.5 3.0 Rango de éxito (10 =

tope) 4 2 6 7 9 8 10 3 1 5

6. La Empresa Carolina tiene dos encuestadores entrenados para reclutar aprendices gerenciales para nuevos mercados de ventas. Aunque cada uno de los encuestadores tiene su propio estilo, se considera que ambos son buenos jueces preliminares del potencial gerencial. La gerente de personal se preguntaba qué tanto coincidirían los encuestadores, así que hizo que ambos evaluaran independientemente a 14 solicitantes. Clasificaron a los solicitantes en términos de su grado de contribución potencial a la compañía. Los resultados se presentan en la tabla. Use la correlación de rango y un nivel de significancia de 2% para determinar si existe una correlación positiva significativa entre las dos clasificaciones de los encuestadores.

Solicitante 1 2 3 4 5 6 7 8 9 10 11 12 13 1.4 Encuestador 1 1 11 13 2 12 10 3 4 14 5 6 9 7 8 Encuestador 2 4 12 11 2 14 10 1 3 13 8 6 7 9 5 7. Una supervisora de un proceso de ensamblaje de cámaras litográficas,

siente que mientras más tiempo trabaja junto a un grupo de empleados, mayor es la tasa de producción diaria. Ha recibido los siguientes datos para un grupo de empleados que trabajan juntos durante 10 días.

Producción diaria 7.2 5.5 6.2 8.3 5.2 2.0 3.0 0.5 9.0 6.0 Días trabajados

¿Puede concluir Nancy a un nivel de significancia de 5%, que no existe correlación entre el número de días trabajados conjuntamente y la producción diaria?

9. Una compañía electrónica que recluta muchos ingenieros se pregunta si el costo de los esfuerzos extensivos de reclutamiento vale la pena. Si la compañía pudiera confiar (usando un nivel de significancia de 1 %) en que la correlación de rango de población entre el currículum individual de los solicitantes clasificados por el departamento de personal y las calificaciones de las entrevistas es positiva, se sentiría justificado en descontinuar las entrevistas y basarse en las calificaciones por currículum en la contratación. La compañía ha extraído una muestra de 35 solicitantes en los últimos dos años. Sobre la base de la muestra anterior, ¿debería la compañía descontinuar las entrevistas y usar las calificaciones del currículum individual para contratar? Individual Calificación de entrevista Calificación de currículum 1 81 113 2 88 88 3 55 76 4 83 111 5 78 121 6 93 83 7 65 129 8 87 99 9 95 142 10 76 93 11 60 136 12 85 82 13 93 91 14 66 83 15 90 96 16 69 126 17 87 108 18 68 95 19 81 65 20 84 96 21 82 101 22 90 79 23 63 71 24 78 108 25 73 68 26 79 11 27 72 109 28 95 121 29 81 140 30 87 132

31 93 135

32 85 143

33 91 118

34 94 147

35 94 138

10. Los siguientes son los salarios y datos de edad de los 10 candidatos a doctorado que se gradúan este año de la Escuela de Doctorado en Contabilidad de la Universidad Peruana de Ciencias. Al nivel de significancia de 0.05, ¿la correlación de rango de edad y salario sugiere que los candidatos de mayor edad obtienen salarios iniciales mayores?

Salario en dólares Edad 67,000 29 60,000 25 57,500 30 59,500 35 50,000 27 55,000 31 59,500 32 63,000 38 69,500 28 72,000 34

11. J.J. Pérez opera un taller de reparación de motores de aeronaves ligeras. Está interesado en mejorar sus estimaciones de tiempo de reparación requerido y cree que el mejor predictor es el número de horas de operación en el motor desde su última reparación importante. Más abajo se muestran los datos sobre diez motores que J.J. Pérez trabajó recientemente. Al nivel de significancia de 0.10, ¿la correlación de rango sugiere una fuerte relación?

Motor Horas desde la última

reparación importante Horas requeridas para reparación 1 1,000 40 2 1,200 54 3 900 41 4 1,450 60 5 2,000 65 6 1,300 50 7 1,650 42 8 1,700 65 9 500 43 10 2,100 66

P

P

P

Para recordarara recordarara recordarara recordar

 El coeficiente de Determinación define el modelo mas confiable para una acertada predicción

 Si el coeficiente de Spearman simplifica el proceso de cálculo de los coeficientes de correlación.

In document Estadistica II Cibertec (página 175-185)

Documento similar