Construcción de modelos de regresión lineal múltiple

7.3 Metodología estadística

7.3.2 Construcción de modelos de regresión lineal múltiple

En este estudio se pretende evaluar la influencia de un conjunto de variables

identificadas como potenciales JD, JR y PR en las tres dimensiones del engagement.

Más allá de las correlaciones que es esperable hallar entre las variables asociadas a

los recursos y sentimientos positivos en el puesto de trabajo y el engagement, los

datos recogidos permiten ahondar en estos fenómenos y caracterizar las variables

estudiadas en función del grado de influencia que ejercen sobre el engagement,

corrigiendo la esperable influencia de la multicolinealidad entre variables del mismo tipo, que generalmente guardan una fuerte correlación entre sí. La técnica usada en

este estudio para identificar los principales drivers que promueven el engagement es

la regresión lineal múltiple, que cuenta con sólidos antecedentes en el tratamiento de

datos de encuestados en varios estudios relacionados con el engagement y el burnout

en el entorno laboral (Andrew and Sofian, 2012; Lorente et al., 2008; Salanova et al., 2000).

La regresión lineal múltiple es la extensión del método de la regresión lineal a un

entorno de múltiples variables independientes x1, x2, …xn cuya influencia en la

variable dependiente y se desea analizar. De esta manera, si la ecuación de regresión

7. DISEÑO, EJECUCIÓN Y ANÁLISIS ESTADÍSTICO DEL EXPERIMENTO

173

𝑦̂ = β0+ β1x

Ecuación 3: Regresión lineal univariante.

Su equivalente multivariante presenta el siguiente aspecto:

𝑦̂ = 𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑛𝑥𝑛

Ecuación 4: Regresión lineal multivariante.

en el que el modelo comprende un número n de variables independientes k (también

llamadas variables predictoras) multiplicadas por sus respectivos coeficientes β. Estos coeficientes son reflejo de la relación lineal entre cada variable independiente y la dependiente, calculada eliminando la influencia del resto de variables según el método que se explica a continuación.

Gráfico 6: Regresión de dedicación con visión compartida como predictor.

1 2 3 4 5 6 7 1 2 3 4 5 6 7 DE DI C A C Ó N VISIÓN COMPARTIDA

174

Cuando se desea analizar la relación existente entre dos variables eliminando la influencia del resto de variables en un análisis multivariante, una forma de “aislar” una variable es realizando sucesivas regresiones lineales entre dicha variable y las demás, quedándonos en cada uno de los pasos con el residuo o “parte no explicada” de la variable cuyo efecto queremos analizar de forma aislada. El residuo puede también entenderse como el “error” que cometemos al regresar la variable dependiente usando un modelo lineal, tal y como puede apreciarse en el ejemplo del gráfico 6, en el que se presentan los resultados de regresar la variable dedicación usando la variable visión compartida como predictor y, en el gráfico 7, el residuo de tal regresión.

Gráfico 7: Residuo de la regresión de dedicación con visión compartida como predictor.

La supresión de la influencia del resto de variables en un modelo de regresión lineal múltiple puede hacerse usando los residuos. Por ejemplo, si se desea construir un

modelo formado por una variable dependiente y dos independientes como 𝑦̂ = 𝛽0+

-4 -3 -2 -1 0 1 2 1 2 3 4 5 6 7

7. DISEÑO, EJECUCIÓN Y ANÁLISIS ESTADÍSTICO DEL EXPERIMENTO

175

𝛽1𝑥1+ 𝛽2𝑥2 , el cálculo del coeficiente β1 se haría removiendo la influencia de la

variable x2 de y y de x1, usando los residuos de las regresiones lineales simples 𝑦̂ =

𝑛 + 𝑚𝑥2 (1) y 𝑥̂ = 𝑛′ + 𝑚′𝑥1 2 (2). El coeficiente de la regresión lineal simple entre

los residuos de las regresiones (1) y (2) será el coeficiente β1.

El objetivo de este estudio es construir un modelo de regresión para cada una de las

dimensiones del engagement usando las variables pertenecientes a los PR, JR y JD

como variables independientes. Los cálculos necesarios para la construcción de estos modelos se han realizado usando el comando lm presente en el software de análisis estadístico R. A continuación, se muestra un ejemplo de modelo, aplicado a la dimensión dedicación usando las 20 variables independientes contempladas en este estudio:

176

Los parámetros β1, β2… βn se presentan en la columna “Estimate”, seguidos de una

prueba de contraste estadístico usando una distribución t-Student de n-p grados de

libertad (siendo n el número de observaciones y p el número de variables que forman

el modelo) en la que se contrastan las hipótesis H0: βn = 0 y Ha: βn ≠ 0. El nivel de

significatividad estadística del contraste se muestra en los p-valores de la columna Pr(>|t|). Tal y como se aprecia en la tabla 24, la mayoría de las variables independientes superan con holgura el umbral de p-valor ≤ 0.05 tradicionalmente establecido para dar por significativo el parámetro obtenido, por lo que este modelo no es adecuado. A la no significatividad de sus parámetros cabe añadir la falta de parsimonia derivada de un número excesivo de variables independientes, que hace difícil extraer conclusiones sólidas sobre los fenómenos que influyen en la dedicación.

El método usado para eliminar variables de los modelos es el backward stepwise

(Diez et al., 2015; Hair et al., 2006), en el que se eliminan una por una las variables con mayor p-valor del modelo, volviendo a calcular los parámetros del modelo después de cada eliminación. El proceso finaliza una vez se obtiene un modelo suficientemente parsimonioso formado en su totalidad (deseablemente) por variables significativas. En este estudio no ha sido necesario eliminar variables significativas de ninguno de los modelos, el primer modelo con la totalidad de las

variables significativas obtenido siguiendo el método backward stepwise ha ofrecido

en todos los casos una interpretación inmediata.

In document Un modelo de predictores de engagement para equipos virtuales globales. (página 172-176)