3. Metodología general
3.2. Análisis previo de los datos
La metodología empleada para contrastar las hipótesis planteadas fue mediante estadística descriptiva y diversas técnicas de análisis multivariante, con el fin de evaluar los efectos de las variaciones paramétricas ocurridas de forma natural en el contexto en que normalmente ocurren y, posibilitar que la investigación sea teóricamente significativas. Para estimar las distintas técnicas multivariantes se ha utilizado el programa estadístico SPSS v14.0 para Windows.
167
En primer lugar se realizó un análisis de frecuencias de todas las variables estructurales y de innovación según el tamaño de la empresa. Este análisis permitirá observar las diferencias entre las dos muestras tanto en sus particularidades internas como en su comportamiento innovador. Los resultados se recogen en las tablas 31 y 32 [4.1.].
Una vez realizado el examen de los datos para la preparación del análisis multivariante, se confeccionaron las matrices de correlaciones de cada modelo explicativo con el propósito de observar las intercorrelaciones entre todas las variables implicadas en el modelo [4.2.]. Al estudiar la matriz de correlaciones bivariadas se detectaron que varios de los grupos de variables eran significativamente elevadas entre sí, por lo que se procedió a realizar distintos análisis factoriales para los grupos de las variables implicadas.
Se han realizado análisis factoriales para estudiar la manera en que las variables que conforman un constructo se agrupan, y así depurar las que menos se ajusta al modelo teórico. Para comprobar la fiabilidad de los constructos se corroboraron por medio del alpha de Cronbach. El test de los constructos se ha realizado mediante el método estadístico multivariante del análisis factorial exploratorio tipo R. Una vez que se seleccionó el tipo de análisis se optó por el método de factores por varianza común por contener supuestos más restrictivos y el método de rotación varimax para alcanzar la máxima simplificación posible. Las tablas que recogen la información de los análisis factoriales no se exponen en la sección [4.] sino en la sección [3.4.], para poder justificar la selección de los constructos. Además, se aprovechó la tabla para indicar la fuente de medida de las variables, exponer algunos estadísticos descriptivos y los datos relevantes del análisis factorial (carga factorial, varianza explicada) y el alfa de Cronbach; que justificaran como un todo el por qué se decidió considerar cierto grupos de variables como un único constructo.
Por otra parte, se efectuaron análisis de comparación de medias para verificar si la variable categórica tamaño de la empresa, que es el centro de esta investigación, está asociada con el resto de variables cuantitativas del modelo. Se estimaron con un IC95%. Las pruebas de
contraste de normalidad se asumirán si estas son p˃0,05. Si lo que procede es una estimación de la t de Student se asumirán que las medias son iguales p<0,05. Si procede una prueba no paramétrica, dependiendo del cumplimiento de los requisitos de normalidad y homocedasticidad, se contrastará con U de Mann-Whitney al p<0,05. El test de Levene bajo
168
variables moderadoras tienen una influencia sobre algunas variables se prosiguió a la evaluación de las relaciones propuestas en el modelo [4.3]. Para realizar el análisis se centraron las variables en la media según el procedimiento seguido por Aiken y West (1991).
Para examinar las relaciones de las variables dependientes y las variables independientes seleccionadas en cada modelo explicativo teórico, se estimaron análisis de regresión múltiple paso a paso (stepwise), con el objetivo de explicar el problema de la investigación [4.4.]. Se indican solamente los coeficientes beta significativos hasta el 90%. Todos los valores del estadístico Durbin-Watson son significativos al 0,05%, para esta muestra y número de variables independientes.
En distintas regresiones se incorporan variables moderadoras. Hay que observar que cuando se mezclan dos situaciones (interacciones); por ejemplo, la variable tamaño de la empresa y la orientación al mercado; el efecto es mucho mayor del esperado como suma de los dos. El termino moderador es una variable compuesta por la multiplicación de la variable independiente por el moderador que entra en la ecuación de regresión. De hecho, el término no lineal puede ser considerado como una forma de interacción, donde la variable independiente se “modera” a sí misma, elevándose al cuadrado (XiXi) (Hair et al., 2002:164)
En todas las regresiones lineales el ANOVA F, sobre el resultado del análisis de la varianza de los modelos, resultan significativos al p˂0,001. Por tanto se rechaza la hipótesis nula de que la variabilidad observada en la variable dependiente sea explicable por el azar, y admitimos que se halla algún tipo de asociación entre la variable dependiente y las independientes.
El estadístico R2 indica la predicción del modelo al incluir las variables independientes en la ecuación de la regresión. Muchas veces, cuando existen varios modelos en una misma regresión se valora la capacidad explicativa, en este caso, solamente se valora el efecto del incremento, no las variables individuales (Hair et al., 2002: 165).
La mayoría de las regresiones de la sección [4.4.] se cumple que el R² es estadísticamente significativo para el tamaño muestral especificado, con una potencia 80%;
169
para este caso: tamaño muestral <500, dos variables independientes, α=0,01, valores R² del 3% -5% y superior (Hair et al. 2002: 159). La Tabla 20, muestra el mínimo R2 que se puede encontrar estadísticamente significativo con una potencia del 80% para diferentes variables independientes y tamaños muestrales.
Tabla 20
Mínimo R2 según el tamaño de la muestra y las variables utilizadas
Tamaño muestral
Nivel de significación (α) = 0,01 Nivel de significación (α) = 0,05 Número de variables independientes Número de variables independientes
2 5 10 20 2 5 10 20
100 13 16 20 26 10 12 15 22
250 5 7 8 11 4 5 6 8
500 3 3 4 6 3 4 5 9
Fuente: Hair et al. (202):159