7.3 Metodología estadística
7.3.2 Construcción de modelos de regresión lineal múltiple
En este estudio se pretende evaluar la influencia de un conjunto de variables
identificadas como potenciales JD, JR y PR en las tres dimensiones del engagement.
Más allá de las correlaciones que es esperable hallar entre las variables asociadas a
los recursos y sentimientos positivos en el puesto de trabajo y el engagement, los
datos recogidos permiten ahondar en estos fenómenos y caracterizar las variables
estudiadas en función del grado de influencia que ejercen sobre el engagement,
corrigiendo la esperable influencia de la multicolinealidad entre variables del mismo tipo, que generalmente guardan una fuerte correlación entre sí. La técnica usada en
este estudio para identificar los principales drivers que promueven el engagement es
la regresión lineal múltiple, que cuenta con sólidos antecedentes en el tratamiento de
datos de encuestados en varios estudios relacionados con el engagement y el burnout
en el entorno laboral (Andrew and Sofian, 2012; Lorente et al., 2008; Salanova et al., 2000).
La regresión lineal múltiple es la extensión del método de la regresión lineal a un
entorno de múltiples variables independientes x1, x2, …xn cuya influencia en la
variable dependiente y se desea analizar. De esta manera, si la ecuación de regresión
7. DISEÑO, EJECUCIÓN Y ANÁLISIS ESTADÍSTICO DEL EXPERIMENTO
173
𝑦̂ = β0+ β1x
Ecuación 3: Regresión lineal univariante.
Su equivalente multivariante presenta el siguiente aspecto:
𝑦̂ = 𝛽0+ 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑛𝑥𝑛
Ecuación 4: Regresión lineal multivariante.
en el que el modelo comprende un número n de variables independientes k (también
llamadas variables predictoras) multiplicadas por sus respectivos coeficientes β. Estos coeficientes son reflejo de la relación lineal entre cada variable independiente y la dependiente, calculada eliminando la influencia del resto de variables según el método que se explica a continuación.
Gráfico 6: Regresión de dedicación con visión compartida como predictor.
1 2 3 4 5 6 7 1 2 3 4 5 6 7 DE DI C A C Ó N VISIÓN COMPARTIDA
174
Cuando se desea analizar la relación existente entre dos variables eliminando la influencia del resto de variables en un análisis multivariante, una forma de “aislar” una variable es realizando sucesivas regresiones lineales entre dicha variable y las demás, quedándonos en cada uno de los pasos con el residuo o “parte no explicada” de la variable cuyo efecto queremos analizar de forma aislada. El residuo puede también entenderse como el “error” que cometemos al regresar la variable dependiente usando un modelo lineal, tal y como puede apreciarse en el ejemplo del gráfico 6, en el que se presentan los resultados de regresar la variable dedicación usando la variable visión compartida como predictor y, en el gráfico 7, el residuo de tal regresión.
Gráfico 7: Residuo de la regresión de dedicación con visión compartida como predictor.
La supresión de la influencia del resto de variables en un modelo de regresión lineal múltiple puede hacerse usando los residuos. Por ejemplo, si se desea construir un
modelo formado por una variable dependiente y dos independientes como 𝑦̂ = 𝛽0+
-4 -3 -2 -1 0 1 2 1 2 3 4 5 6 7
7. DISEÑO, EJECUCIÓN Y ANÁLISIS ESTADÍSTICO DEL EXPERIMENTO
175
𝛽1𝑥1+ 𝛽2𝑥2 , el cálculo del coeficiente β1 se haría removiendo la influencia de la
variable x2 de y y de x1, usando los residuos de las regresiones lineales simples 𝑦̂ =
𝑛 + 𝑚𝑥2 (1) y 𝑥̂ = 𝑛′ + 𝑚′𝑥1 2 (2). El coeficiente de la regresión lineal simple entre
los residuos de las regresiones (1) y (2) será el coeficiente β1.
El objetivo de este estudio es construir un modelo de regresión para cada una de las
dimensiones del engagement usando las variables pertenecientes a los PR, JR y JD
como variables independientes. Los cálculos necesarios para la construcción de estos modelos se han realizado usando el comando lm presente en el software de análisis estadístico R. A continuación, se muestra un ejemplo de modelo, aplicado a la dimensión dedicación usando las 20 variables independientes contempladas en este estudio:
176
Los parámetros β1, β2… βn se presentan en la columna “Estimate”, seguidos de una
prueba de contraste estadístico usando una distribución t-Student de n-p grados de
libertad (siendo n el número de observaciones y p el número de variables que forman
el modelo) en la que se contrastan las hipótesis H0: βn = 0 y Ha: βn ≠ 0. El nivel de
significatividad estadística del contraste se muestra en los p-valores de la columna Pr(>|t|). Tal y como se aprecia en la tabla 24, la mayoría de las variables independientes superan con holgura el umbral de p-valor ≤ 0.05 tradicionalmente establecido para dar por significativo el parámetro obtenido, por lo que este modelo no es adecuado. A la no significatividad de sus parámetros cabe añadir la falta de parsimonia derivada de un número excesivo de variables independientes, que hace difícil extraer conclusiones sólidas sobre los fenómenos que influyen en la dedicación.
El método usado para eliminar variables de los modelos es el backward stepwise
(Diez et al., 2015; Hair et al., 2006), en el que se eliminan una por una las variables con mayor p-valor del modelo, volviendo a calcular los parámetros del modelo después de cada eliminación. El proceso finaliza una vez se obtiene un modelo suficientemente parsimonioso formado en su totalidad (deseablemente) por variables significativas. En este estudio no ha sido necesario eliminar variables significativas de ninguno de los modelos, el primer modelo con la totalidad de las
variables significativas obtenido siguiendo el método backward stepwise ha ofrecido
en todos los casos una interpretación inmediata.