• No se han encontrado resultados

10.1 Caracterización de las series temporales de patentes

10.1.6 Microsoft

Analizando los datos de la serie Microsoft, tanto para videojuegos (Tabla 9) como para patentes (Tabla 16), se observa que los datos son nulos para videojuegos hasta el año 2001 y nulos en patentes hasta el año 1994.

Por esta razón se considera el análisis tomando como periodo temporal 1994-2010

Ilustración 90: Serie MICROSOFT. Comparación de identificación de normalidad en la serie original y en la normalizada

> shapiro.test(sony.pt)

Shapiro-Wilk normality test data: sony.pt

W = 0.8918, p-value = 0.001755

Ricardo García Ruiz Investigación en gestión del conocimiento Página 150 de 217

Ilustración 91: Histogramas de Microsoft, serie completa y diferencias sobre serie completa, que muestran no normalidad en serie original

A fin de conseguir que la serie se ajuste al modelo de normalidad, y considerando que existe una elevada concentración y cola larga, se transforma la serie mediante la fórmula: log10(x + 1)

Ricardo García Ruiz Investigación en gestión del conocimiento Página 151 de 217 > shapiro.test(microsoft.pt)

Shapiro-Wilk normality test data: microsoft.pt

W = 0.9154, p-value = 0.1233

Tabla 50: Test de Shapiro-Wilk mostrando normalidad a 0.1 de confianza

Ilustración 93: Se muestra una mejor y mayor aproximación a la normalidad de la serie Microsoft modificada con la fórmula de ajuste a logaritmo en base 10.

Al igual que en el caso de Sega o Sony, de aquí en adelante, la serie de Microsoft será la serie normalizada calculada con el logaritmo en base 10, ya que muestra mejor juste a la normalidad y no se ha modificado sustancialmente la estructura de la serie, tal cual se observa en la Ilustración 92.

Ahora se procede a realizar el cálculo de los valores para ACF y PACF a fin de comenzar la caracterización de la serie de Microsoft.

Ricardo García Ruiz Investigación en gestión del conocimiento Página 152 de 217

Ilustración 94: Gráficos ACF y PACF de la serie MICROSOFT normalizada (log10)

Siendo este caso similar al de SEGA o SONY, y habiendo allí observado que la comparación entre la serie ajustada con log10 y la original establece diferencias que no se toman en cuenta para el cálculo de ACF y de PACF, así como para los análisis posteriores ARIMA, debido al supuesto vinculante de normalidad, que solo se alcanza con la serie modificada en log10, no se representan más que las gráficas ACF y PACF de la serie modificada.

La serie tiene 2 retrasos antes de entrar en la zona de confianza para ACF. En cualquiera de los casos lo que nos indica que puede tratarse de un proceso AR(). En cuanto a las graficas de autocorrelación parcial PACF, no muestran ningún ajuste de MA().

Como en el caso de Sega o Sony, para la serie de Microsoft de patentes, en comparaciones posteriores con videojuegos, solo se utilizará la serie modificada con logaritmos.

> arima(microsoft.pt, order=c(2,0,1), method = "ML")

Call:

arima(x = microsoft.pt, order = c(2, 0, 1), method = "ML") Coefficients:

ar1 ar2 ma1 intercept -0.0209 0.9712 0.9758 1.575

Ricardo García Ruiz Investigación en gestión del conocimiento Página 153 de 217 s.e. 0.0687 0.0681 0.1908 0.981

sigma^2 estimated as 0.05787: log likelihood = -1.63, aic = 13.26 > arima(microsoft.pt, order=c(3,0,0), method = "ML")

Call:

arima(x = microsoft.pt, order = c(3, 0, 0), method = "ML") Coefficients:

ar1 ar2 ar3 intercept 1.2301 0.1744 -0.4525 1.3565 s.e. 0.2676 0.4893 0.2739 0.8768

sigma^2 estimated as 0.04017: log likelihood = 1.04, aic = 7.93 > arima(diff(microsoft.pt), order=c(1,0,0), method = "ML")

Call:

arima(x = diff(microsoft.pt), order = c(1, 0, 0), method = "ML") Coefficients:

ar1 intercept 0.1649 0.1532 s.e. 0.3135 0.0589

sigma^2 estimated as 0.03847: log likelihood = 3.35, aic = -0.69 > arima(diff(microsoft.pt), order=c(2,0,0), method = "ML")

Call:

arima(x = diff(microsoft.pt), order = c(2, 0, 0), method = "ML") Coefficients:

ar1 ar2 intercept 0.0951 0.2763 0.1594 s.e. 0.3012 0.2943 0.0730

sigma^2 estimated as 0.03618: log likelihood = 3.76, aic = 0.47 > arima(diff(microsoft.pt), order=c(2,0,1), method = "ML")

Call:

arima(x = diff(microsoft.pt), order = c(2, 0, 1), method = "ML") Coefficients:

ar1 ar2 ma1 intercept -0.4977 0.4341 0.7301 0.1599 s.e. 0.3697 0.2856 0.4522 0.0698

sigma^2 estimated as 0.03091: log likelihood = 4.68, aic = 0.64 > arima(diff(microsoft.pt), order=c(3,0,0), method = "ML")

Call:

arima(x = diff(microsoft.pt), order = c(3, 0, 0), method = "ML") Coefficients:

ar1 ar2 ar3 intercept 0.1317 0.3619 -0.537 0.1451 s.e. 0.2236 0.2139 0.226 0.0417

sigma^2 estimated as 0.02650: log likelihood = 5.64, aic = -1.28

Tabla 51: Estimaciones del modelo para máxima verosimilitud de la serie recortada de MICROSOFT

Si se observan detenidamente los resultados de la Tabla 51 se puede verificar que los valores de máxima verosimilitud mayores se obtienen para ARIMA() con diferenciación uno.

Ricardo García Ruiz Investigación en gestión del conocimiento Página 154 de 217 Si se incluyen en el cálculo valores distintos de cero para las medias móviles, los resultados que se obtienen sí mejoran el valor de máxima verosimilitud, pero incrementan el coeficiente de Akaike (que indica la cantidad de información incorporada, y es preferible cuanto menor sea, ya que a menor información y mayor coeficiente de máxima verosimilitud se obtiene un mejor modelo). Es por ello que se decide no incorporar valor distinto de cero para medias móviles en este análisis ya que no mejora el coeficiente de Akaike para valores ARIMA semejantes.

En este punto, el modelo ARIMA(3,1,0), con coeficiente de máxima verosimilitud de 5.64 y el coeficiente de Akaike más pequeño, de -1.28, se considera el mejor modelo explicativo de la serie de patentes de Microsoft.

No obstante, al revisar en la diagnosis el modelo, ver Ilustración 95, se observa que alguno de los p- valores del estadístico de Ljung-Box tocan la zona de confianza, o están muy cercana ella. Esto lleva a considerar que el modelo es excesivamente ajustado. Si vemos la Ilustración 94, grafico para ACF, se comprueba que el modelo indicaba claramente solo 2 retardos, y el modelo propuesto tiene 3, por lo que es plausible que se encuentre sobreajustado.

En estas circunstancias, acudimos al modelo explicativo ARIMA(2,1,0). Verificamos en la Ilustración 96, los p-valores del estadístico de Ljung-Box, y se constata que se encuentran claramente por encima del valor de confianza (0.1), por lo que se puede afirmar que un modelo ARIMA(2,1,0) no muestra sobreajuste y explica la serie de MICROSOFT satisfactoriamente.

10.1.6.1 Verificación de la corrección del modelo ARIMA: Microsoft

Ricardo García Ruiz Investigación en gestión del conocimiento Página 155 de 217

Ricardo García Ruiz Investigación en gestión del conocimiento Página 156 de 217