DIFUSION DE INTERNET EN CHILE*
PABLO MARSHALL**
ABSTRACT
The Internet has changed the way companies and persons communicate.
This paper considers the diffusion of Internet in Chile. Using traditional methods in marketing, particularly the Bass model, the potential number of Internet users and the characteristics of the diffusion process are estimated, in terms of innovation and imitation factors, are estimated.
A new methodology, applied to the Bass model, where the coeficients of the model change over time according to a stochastic process, is also presented. The estimation process is carried out with a filter based on simulations.
The results show that the diffusion process of Internet in Chile is determined, almost completely, by imitation factors and that this characteristic has changed very little over the last years. On the other hand, the potential number of users has changed during the diffusion process. With data up to the end of 1999, the potential number of users is estimated to be 8 million.
Keywords: Bass Model, Montecarlo Simulation, Diffusion Models, Internet
JEL Classification: M31.
RESUMEN
La introducción de Internet está produciendo cambios importantes en la forma cómo se relacionan las empresas y las personas. En este ar- tículo se estudia el proceso de difusión de Internet en Chile. A partir de metodologías tradicionales en marketing, en particular el modelo de Bass, se estima el número potencial máximo de usuarios de Internet y las características del proceso de difusión en cuanto a la importan- cia de los factores de innovación e imitación. El trabajo presenta una
* El autor agradece los comentarios de tres árbitros anónimos y de los participantes del Seminario de Investigación de la Escuela de Administración, P.U.C. de Chile. Este trabajo fue financiado parcialmente por fondos de investigación de la V.R.A. de la P.U.C. de Chile.
** Profesor de la Escuela de Administración, Pontificia Universidad Católica de Chile.
E-mail [email protected]
nueva metodología, que es aplicada al modelo de Bass, en la cual los coeficientes del modelo varían de acuerdo a un proceso estocástico y la estimación se realiza mediante un filtro basado en simulaciones.
Los resultados muestran que la difusión de Internet en Chile está de- terminada casi completamente por factores de imitación y que esta ca- racterística ha variado muy poco durante el proceso. El número po- tencial de usuarios, en cambio, ha disminuido en el proceso de difu- sión y, con datos hasta fines de 1999, se estima que puede llegar a 8 millones.
La introducción de Internet está produciendo cambios sustanciales en la forma cómo se relacionan las empresas, en la forma cómo se organizan los mercados y en la forma cómo las personas trabajan, se educan, ahorran, consumen y se entretienen. Este proceso, que da origen a la llamada nueva economía, ha tenido un notable desarrollo en Chile así como en todo el mundo.
El desarrollo masivo de Internet en Chile se inicia en 1995 cuando las empresas de telecomunicaciones ofrecen por primera vez servicios de conexión a personas y empresas. Desde entonces el crecimiento, en térmi- nos del número de usuarios conectados a Internet, ha sido muy rápido. Se estima que a fines de 1999 el número de usuarios con acceso a Internet en Chile llegaba a 600.000, lo que representa un 4% de la población total.
El propósito de este estudio es analizar el desarrollo de Internet en Chile en términos del número de usuarios con el propósito de explicar las carac- terísticas del proceso de difusión de esta nueva tecnología y poder predecir el crecimiento en el número de nuevos usuarios. El estudio constituye un aporte, a nuestro juicio, al cuantificar el tamaño del mercado potencial para muchas empresas que están iniciando negocios a través de Internet. La proyección del mercado de usuarios de Internet constituye también un aporte para obtener estimaciones del alcance que podrían tener en el futuro las estrategias publicitarias por esta vía.
Una forma natural de estudiar este desarrollo es mediante los modelos de difusión de innovaciones utilizados en marketing. El propósito de estos modelos es explicar y predecir la difusión de innovaciones, nuevos produc- tos o servicios a través del tiempo. El modelo más utilizado en este contexto es el de Bass (1969), que integra los desarrollos previos de Fourt y Woodlock (1960) y Mansfield (1961). El modelo de Bass tiene la forma
(
( ))
(1) )) (
( N t m N t
m p q dt
t
dN −
+
=
Donde N(t) es el número acumulado de usuarios o adoptadores de la innovación al tiempo t, p es el coeficiente de innovación, q es el coeficiente de imitación y m es el máximo número de potenciales adoptadores. La ecuación diferencial (1) establece que el número de nuevos adoptadores en un instante de tiempo está determinado, en primer lugar, por la expresión p(m-N(t)) que representa a los innovadores que adoptan la innovación o el producto debido a fuerzas externas, como publicidad, precio o promociones y, en segundo lugar, por la expresión (qN(t)/m)(m-N(t)) que representa a los imitadores que adoptan la innovación por influencias internas, como la imi- tación de previos adoptadores. La solución de la ecuación (1), si N(0) = 0, está dada por
(2)
En esta expresión, el número total de adoptadores depende del tiempo y de los tres coeficientes que determinan el proceso de difusión. Se puede establecer que el momento peak, en el cual el número de nuevos adoptadores es máximo, se produce en el tiempo
y que el número acumulado de adoptadores, en el tiempo peak está dado por
Los coeficientes p, q y m son desconocidos y pueden ser estimados en base a información previa del proceso de difusión, o en base a información histórica del número de adoptadores.
t q p t q p
e p q m e t
N ( )
) (
) / ( 1 ) 1
( − +
+
−
+
= −
) / 1 log(
* p q
q t p
− +
=
−
= q
m p t
N 2 2
) 1 (*
En este trabajo se estima el proceso de difusión del número de usuarios de Internet en Chile. Además de obtener estimaciones de los coeficientes p, q y m, el trabajo presenta una innovación metodológica en la estimación del modelo de Bass, al permitir a los coeficientes que determinan el proceso de difusión evolucionar en el tiempo de acuerdo a un proceso estocástico.
Más aún, el proceso de estimación está basado en un filtro que no requiere aproximaciones lineales de la ecuación (2). Lo anterior adquiere importan- cia por cuanto en un proceso de difusión, como es el de Internet en Chile;
los coeficientes del modelo presumiblemente están sujetos a constantes cambios. La publicidad de las empresas, que ofrecen el servicio de co- nexión, los cambios en los precios de los servicios de conexión, los cambios culturales en la comunicación y el traspaso de información entre personas y entre empresas, hace que los coeficientes p, q y m evolucionen constan- temente.
La metodología presentada en este estudio se puede extender sin mayo- res complicaciones conceptuales al caso en que los coeficientes p, q y m dependen, parcialmente, de variables exógenas como en los desarrollos de Hernes (1976), Mahajan y Petterson (1979), Sharif y Ramanathan (1981), Easingwood, Mahajan y Müller (1983), Kalish (1985) y Kalish y Sen (1986).
Los principales resultados de este estudio muestran que el proceso de difusión de Internet en Chile está determinado casi completamente por la imitación de la conducta de previos adoptadores. Mientras el coeficiente q estimado para el final de la muestra disponible es 0,158, el coeficiente de innovación p, al final de la muestra, es igual a 0,880 X 10-6; prácticamente igual a cero. El coeficiente que evoluciona en mayor medida es m. Este parámetro cambia de 8,8 millones de personas a comienzos de 1998 hasta 8,0 millones de personas a fines de 1999. Si bien estos resultados muestran la conveniencia de estimar el modelo con coeficientes variables, el principal indicador de la bondad del ajuste con coeficientes variables, por sobre el modelo estimado con coeficientes fijos, está dado por los errores de predic- ción fuera de muestra. En el caso del modelo con coeficientes variables, la raíz del error cuadrático medio de las predicciones fuera de muestra en los últimos 12 meses es 16,36, mientras que en el caso del modelo de coefi- cientes constantes este valor llega a 23,16.
Además de esta introducción, el trabajo se organiza de la siguiente manera:
En la Sección 1 se presentan los datos históricos disponibles de distintas fuentes sobre el número de usuarios de Internet en Chile. En la Sección 2
se presenta la estimación del modelo de Bass en su forma tradicional, que supone que los coeficientes del modelo no cambian en el proceso de difu- sión. En la Sección 3 se flexibiliza el modelo de Bass para permitir que p, q y m evolucionen de acuerdo con el proceso de difusión. Finalmente, en la Sección 4 se presentan las conclusiones del trabajo. En un apéndice se muestran los principales aspectos de la metodología de estimación del modelo con coeficientes variables.
I. ESTADISTICAS DE USUARIOS DE INTERNET
No existe una gran cantidad de información histórica en relación al número de usuarios de Internet en Chile. Si bien se dispone de varias fuentes de información, éstas no son completas y contienen supuestos que hacen que deban ser consideradas más estimaciones que datos efectivos.
Este hecho está determinado, fundamentalmente, por la existencia de difi- cultades naturales para medir el número de usuarios de Internet. El servicio que proveen las empresas de telecomunicaciones es una conexión a un computador, la cual puede ser usada por varias personas. El número de personas que accede a una conexión o cuenta puede ser muy variable, según las características de los usuarios, y podría cambiar de manera im- portante a través del tiempo. Estas diferencias se podrían producir por cambios en la composición de las empresas y hogares, en el número de cuentas o conexiones y por cambios en el número de personas que acceden a Internet desde una empresa o un hogar. Desde esta perspectiva, una mejor cuantificación del número de usuarios se debiera poder obtener con información proporcionada directamente por personas y empresas. Pero, naturalmente, esta información se recibe a través de encuestas realizadas a una muestra de la población por lo que, nuevamente, se trata de valores estimados.
Una primera fuente de información está constituida por la encuesta de la Facultad de Economía de la Universidad de Chile, realizada a hogares a fines de 1999 para el Gran Santiago. Ella recoge información sobre el número de usuarios de Internet y sobre características de estos usuarios.
Una de las preguntas de esta encuesta se refiere al tiempo de adopción de Internet y, mediante las respuestas a esta pregunta, se pueden establecer algunos antecedentes históricos en relación al número de usuarios a través del tiempo. La encuesta de la Universidad de Chile no tiene cobertura nacional, sino sólo de Santiago.
Una segunda fuente de información es la Subsecretaría de Telecomuni- caciones del Ministerio de Transporte y Telecomunicaciones (Subtel), que dispone de datos históricos respecto del número de cuentas y del número de usuarios de Internet en los dos últimos años, al suponer una cantidad fija de usuarios por cuenta. Esta información esta disponible sólo para algunos meses en los últimos años. Otra fuente de información se refiere a la encuesta realizada por Internet Software Consortium en la cual se deter- mina, mediante un proceso de búsqueda automática, el número de hosts con terminación .cl. Aunque esta encuesta se realiza semestralmente desde 1995, contiene un cambio metodológico en 1998, lo cual hace imposible disponer de una serie homogénea para un período largo. Además, el número de hosts no es necesariamente un buen indicador del número de usuarios, por cuanto a través del tiempo puede haber variado de manera importante el número de usuarios por host.
Finalmente, el trabajo de Utreras (2000) estima el número de usuarios de Internet a partir del número de cuentas y haciendo una estimación diferen- ciada del número de usuarios por cuenta en empresas y hogares.
La Figura 1 muestra las observaciones del número de usuarios de Internet de acuerdo con la información de Utreras (2000) y el Cuadro 1 presenta indicadores descriptivos básicos para estas estadísticas. El número de usua- rios, según Utreras (2000), ha aumentado de 100.000 a comienzos de 1998 a 600.000 a fines de 1999. Estos datos son levemente menores a los reportados por la Subtel, que establece que a mediados de 1998 el número de usuarios era cercano a 200.000 y que a fines de 1999 el número era de aproximadamente 750.000. Tanto la información de la Subtel como la de Utreras (2000) está basada en información sobre cuentas. Los datos de la encuesta de la Universidad de Chile presentan ciertas diferencias con los datos de Utreras (2000) en 1998, pero son bastante coincidentes hacia fines de 1999. Por último, de acuerdo a la encuesta de Internet Software Consortium el número de hosts en Chile ha aumentado de 10.000 en el año 1996 a 40.000 a fines de 1999. Estos datos podrían ser consistentes con las otras fuentes de información a fines de 1999 si el número de usuarios por host es, aproximadamente, de 15.
FIGURA 1
USUARIOS DE INTERNET SEGUN UTRERAS (2000)
CUADRO 1
ESTADISTICAS BASICAS DE NUMERO DE USUARIOS INTERNET
Estadísticas básicas de número de usuarios. Número de observaciones, media, desviación estándar, mínimo y máximo. Observaciones mensuales del período 1998-1999.
Fuente: Utreras (2000)
II. COEFICIENTES FIJOS EN MODELO DE BASS
Los coeficientes p, q y m en el modelo de Bass con coeficientes cons- tantes, representado por (2), son usualmente desconocidos y deben ser estimados en base a información previa o datos históricos. En la literatura se ha propuesto una gran variedad de métodos para estimar estos coeficien- tes. Un estudio de Mahajan, Mason y Srinivasan (1986) muestra que el método de estimación que entrega mejores resultados, en términos de erro- res de predicción fuera de la muestra, es el método de mínimos cuadrados
0 200.000 400.000 600.000 800.000
1996 1997 1998 1999
n Media
Desviación
Estándar Mínimo Máximo Nuevos Usuarios 23 23.265 24.993 792 98.667 Usuarios Acumulados 24 -- -- 111.722 646.816 Fuente: Utreras (2000)
no lineales, que consiste en estimar los coeficientes p, q y m a partir de la ecuación de regresión no lineal1.
(3)
Aquí n (t) es el número de nuevos adoptadores al tiempo t y u (t) es un residuo aleatorio no correlacionado en el tiempo, con media cero y varianza σ2. El Cuadro 2 presenta la estimación del modelo de Bass para los datos de Utreras (2000) entre enero de 1998 y diciembre de 1999.
Entre paréntesis se presentan los errores estándar de los coeficientes. El modelo estimado muestra que el coeficiente de innovación p es práctica- mente igual a cero mientras que el coeficiente de imitación q es 0,157. Esto significa que el proceso de difusión de Internet está basado fundamental- mente en influencias internas. Los nuevos usuarios de Internet adoptan la innovación fundamentalmente por la comunicación con otros usuarios. Los factores externos, como la publicidad, el precio y las promociones, tienen, según los datos históricos, un efecto muy reducido en el número de usuarios que se incorpora al uso de Internet. Dos observaciones respecto de estos resultados son las siguientes: En primer lugar, esta conducta de los usuarios de adoptar Internet por medio de la imitación no pudo haberse dado desde el inicio del proceso de difusión por cuanto al tiempo t = 0 el efecto que da impulso a la difusión es el de innovación. Por otra parte, un valor pequeño de p no implica que algunas acciones de marketing, como la publicidad, no sea efectiva, sino más bien que ella está dirigida a los imitadores más que a los innovadores2. Los valores de p y q encontrados son usuales en otros procesos de difusión, fundamentalmente aplicados a bienes de consumo durable como electrodomésticos, considerados en la literatura (ver Mahajan, Mason y Srinivasan (1986)). Los errores estándar de los coefi- cientes muestran el grado de precisión de los coeficientes estimados. El estadígrafo t para el coeficiente p es igual a 0,22, mientras que el estadígrafo, t para el coeficiente q es 1,94. Aunque ninguno de los dos estadígrafos t es superior a 1,96 en valor absoluto como para ser considerado
) ) (
/ ( 1
1 )
/ ( 1 ) 1 ( ) 1 ( )
( ( )( 1)
) 1 )(
( )
( ) (
t e u
p q m e e
p q m e t n t
N t
N p q t
t q p t
q p t q
p +
+
− − +
= −
=
−
− − +− + − +− +− −
1 En principio, uno esperaría que los residuos del modelo sean heteroscedásticos. En los resultados de Mahajan, Mason y Srinivasan (1986), y en otras aplicaciones consideradas en el estudio mencionado, este efecto no es considerado.
2 Esta interpretación de los coeficientes fue hecha por un arbitro anónimo.
estadísticamente significativo con un nivel de significancia del 5%, el grado de precisión en la estimación de q podría ser aceptable. En parte, el bajo valor del estadígrafo t correspondiente a p se debe a que este coeficiente es muy pequeño, lo cual hace muy difícil estimarlo con precisión. El coefi- ciente m estimado muestra que 8,5 millones de personas adoptarían en algún momento Internet. El estadígrafo t correspondiente a este coeficiente es 0,12 con lo cual también se tiene un bajo nivel de precisión en la estimación del mercado potencial.
En la segunda parte del Cuadro 2 se presenta el momento en el cual se produce el máximo número de nuevos adoptadores y, por tanto, el momento en el cual el número de nuevos adoptadores comienza a disminuir. Este momento, conocido como el tiempo peak, corresponde a mayo del 2001.
Para ese momento, el número acumulado de adoptadores sería de 4,3 millones de personas.
CUADRO 2
ESTIMACION DEL MODELO DE BASS
Coeficientes estimados, errores estándar entre paréntesis y estadísticas del modelo estima- do: tiempo peak, número de usuarios al tiempo peak, número de observaciones, estadígrafo R2 y error estándar de la regresión. Estimaciones con datos mensuales en el período 1998-1999.
Coeficiente Estimación
p 0,868 x 10-6 (3,99 x 10-6)
q 0,157
(0,081)
m 8.529
(68.587) t* Mayo 2001 N(t*) 4.264
n 2 3
R2 0,766
s 12,67
En la parte inferior del Cuadro 2 se observa que el número de observa- ciones utilizadas en la estimación es 23, el estadígrafo R2 es 0,766 y la desviación estándar estimada del residuo en la ecuación (3) es igual a 12,67.
Los errores de predicción fuera de muestra, para el año 1999, en este modelo fluctúan entre -40 mil y 40 mil personas y la raíz del error cuadrático medio de los errores de predicción fuera de muestra en 1999 es 23,16 miles de personas.
Uno de los inconvenientes que han detectado estudios previos en la literatura en la estimación del modelo de Bass es que las estimaciones pueden ser muy poco confiables cuando las observaciones no han sobrepa- sado el tiempo peak en el cual se produce el mayor número de nuevos adoptadores. Este sería el caso de la adopción de Internet en Chile. En el proceso de estimación del modelo se observó que el proceso iterativo de estimación no lineal detectaba distintos mínimos locales según el punto de partida en el proceso iterativo. Esto no garantiza que la solución que mini- miza la suma de cuadrados de los residuos en el Cuadro 2 corresponda efectivamente a un mínimo global. La estimación del modelo se realizó con distintos programas de minimización obteniéndose, en todos los casos, los problemas mencionados. Más aún, también se intentó estimar el modelo minimizando la suma de los errores absolutos en lugar de la suma de errores al cuadrado, sin que cambiaran significativamente los problemas de estima- ción reportados.
III. COEFICIENTES VARIABLES EN MODELO DE BASS
Uno de los aspectos que en la literatura ha mostrado ser mas crítico en la aplicación del modelo de Bass (1969) es que los coeficientes de innova- ción p, imitación q y mercado potencial m, se suponen constantes en todo el proceso de difusión. Hay diversos desarrollos en la literatura que han generalizado este supuesto al hacer depender los coeficientes p, q y m de algunas variables exógenas o endógenas al proceso de difusión.
Hernes (1976) y Easingwood, Mahajan y Müller (1983) sugieren que el efecto de imitación no permanece constante en el proceso de difusión, como se establece en el modelo original de Bass. Este efecto puede dis- minuir, permanecer constante o aumentar según sean las características específicas de la innovación y del proceso de difusión. Por otra parte, el número potencial de adoptadores, m en el modelo de Bass es supuesto
constante a través del proceso de difusión y, por tanto, es determinado totalmente al momento de la introducción de la innovación. Kalish (1985), Mahajan y Peterson (1978) y Sharif y Ramanathan (1981) han desarrollado extensiones del modelo de Bass en los cuales el número potencial de adoptadores es una función de variables como las características de la innovación, el precio y el crecimiento de la población. Variables de marke- ting, como precio, gasto en publicidad y promociones también debieran tener efecto sobre los coeficientes del modelo de Bass, según Kalish y Sen (1986). Por último, Mahajan y Petterson (1979) argumentan que las inno- vaciones ocurren de manera conjunta y, por tanto, los coeficientes del modelo de una innovación dependen de otras innovaciones.
La disponibilidad de información exógena no es siempre posible. En la literatura se han considerado varias formulaciones de un modelo de Bass con coeficientes determinados por procesos estocásticos. Bretschneider y Mahajan (1980) estiman una versión lineal del modelo de Bass mediante el filtro de Kalman, permitiendo a los coeficientes del modelo evolucionar a través del tiempo mediante caminos aleatorios. Más recientemente, Xie, Song, Sirbu y Wang (1997) proponen una aproximación lineal de primer orden para ajustar el modelo de Bass en tiempo continuo mediante el filtro de Kalman. En cualquiera de los dos casos se trata de aproximaciones, por cuanto el modelo de Bass es altamente no-lineal y los modelos a los cuales se les puede aplicar el filtro de Kalman deben ser lineales para tener resultados exactos.
Por otra parte, en los últimos dos años han aparecido en la literatura estadística y econométrica nuevos desarrollos de filtros, similares al filtro de Kalman, que permiten trabajar con modelos lineales o no lineales mediante el uso de simulación (ver Tanizaki y Mariano (1998), Kitagawa (1998) y Carlin, Polson y Stoffer (1992)). Estos algoritmos pueden ser aplicados al modelo de Bass para (i) obtener mayor flexibilidad de los coeficientes al permitir que evolucionen en el tiempo; (ii) permitir nuevas especificaciones en las cuales los coeficientes dependan de ciertas variables exógenas, como variables de marketing, y (iii) no tener que trabajar con aproximaciones lineales del modelo, como es el caso de los estudios de Bretschneider y Mahajan (1980), y Xie, Song, Sirbu y Wang (1997). Adicionalmente, debido a que estos filtros se establecen en un contexto bayesiano, es posible incorporar información preliminar, proveniente de otros procesos de difusión similares o del conocimiento que se tenga del mercado en el cual se pro- duce la difusión, respecto de los coeficientes del modelo.
Para formular el modelo de Bass como un modelo en la forma de estado, al cual se le pueda aplicar un filtro, sea
el vector de coeficientes del modelo. Donde el logaritmo es considerado sólo para asegurar la no negatividad de los coeficientes en el proceso de estimación mediante simulaciones. Entonces, el modelo (3) se puede escri- bir, en forma más simplificada, como
(4a)
Para dar flexibilidad al vector θ (t) de coeficientes proponemos la especificación de un camino aleatorio mediante el cual este vector evolu- ciona de acuerdo con
(4b) Las componentes ε(t) y η(t) son errores aleatorios no correlacionados entre sí ni serialmente correlacionados, y tienen media cero y varianzas y respectivamente. El modelo en la forma de estado está compuesto por las ecuaciones (4a) y (4b). El proceso de estimación del vector de coefi- cientes θ (t) propuesto por Kitagawa (1998) y Tanizaki y Mariano (1998) consiste en un proceso iterativo basado en simulaciones y no requiere en ninguna parte que la especificación de las ecuaciones sea lineal. En térmi- nos muy generales, el proceso consiste en la siguiente secuencia:
• Se define la distribución de probabilidades de θ (0), en base a informa- ción preliminar del proceso de innovación, y se define la distribución de probabilidades de los errores aleatorios y .
• Se simula θ (0) y η (1) para obtener simulaciones de θ (1) mediante la ecuación (4b). Estas simulaciones constituyen la distribución de frecuen-
) ( )) ( ( )
(t f t t
n = θ +ε
) ( ) 1 ( )
(t θ t η t
θ = − +
2
σε 2
ση
=
)) ( ( log
)) ( ( log
)) ( ( log ) (
t m
t q
t p θ t
) ε(t η(t)
cias o probabilidad de θ (1) dada la información al tiempo t = 0. La media de estas simulaciones constituye una estimación de θ (1) dada la información al tiempo t = 0.
• Las simulaciones de θ (1) en conjunto con las simulaciones de ε (1) dan origen a la distribución de probabilidades de n (1) con información hasta el tiempo t = 0. Una predicción a un paso del valor n (1) es la media de estas simulaciones.
• Para cada simulación θ (1) se calcula la función densidad de n (1) dado θ (1). Sea esta densidad w (θ (1)).
• Se obtiene una muestra con reemplazo de los valores simulados θ (1) con probabilidad de selección proporcional a w (θ (1)). La muestra obtenida corresponde a una simulación de la distribución de frecuencias o probabilidad de θ (1) con información hasta el tiempo t = 1. La media de estas simulaciones es un estimador del valor de θ (1).
• Se repiten los pasos anteriores para obtener las estimaciones de θ (2), θ (3), etc. y las predicciones a un paso del número de nuevos usuarios en cada momento del tiempo.
Para mayores detalles véase el Apéndice. La estimación del modelo se realizó con N = 5.000 réplicas en las simulaciones y con las siguientes especificaciones para los parámetros del modelo,
ε(t) ~ Ν(0,43)
−
−
3 , 0 0 , 0 0 , 0
0 , 0 1 , 0 0 , 0
0 , 0 0 , 0 1 , 0 , 100 , 9
750 , 1
957 , 13
~ (0) N θ
002 , 0 0 0
0 00001 , 0 0
0 0
00001 , 0 , 0 0 0
~ ) (t N η
Estas especificaciones resultaron de minimizar los errores de predicción fuera de muestra. Esto quiere decir que la muestra completa es primero utilizada para la estimación de las condiciones iniciales y de las medias, y las varianzas de los errores aleatorios que intervienen en el modelo. Luego, con estos valores dados, se estiman los coeficientes p, q y m, agregando secuencialmente cada observación y se minimizan los errores de predicción a un paso. Al igual que en el modelo de coeficientes fijos, el período de estimación es enero de 1998 a diciembre de 1999. El Cuadro 3 presenta los resultados del proceso de estimación. Para tres meses en la muestra: enero de 1998, diciembre de 1998 y diciembre de 1999, se presentan en el Cuadro 3 las estimaciones de cada uno de los coeficientes del modelo en base a la media de las realizaciones correspondientes, y los percentiles al 2,5% y 97,5%. Estos percentiles corresponden a los límites inferior y superior de intervalos de 95% de confianza.
CUADRO 3
COEFICIENTES ESTIMADOS: MODELO DE COEFICIENTES VARIABLES Coeficientes estimados, percentiles del 2,5%, media y percentiles del 97,5% para las esti- maciones a enero de 1998, diciembre de 1998 y diciembre de 1999. Período peak y poten- cial de adoptadores.
Los coeficientes p y q varían muy poco en las estimaciones a distintos momentos del tiempo. Por su parte, estas estimaciones son similares a las obtenidas en la estimación del modelo con coeficientes fijos. La estimación del coeficiente m, que representa el mercado potencial, varía considerable-
Coeficiente Estadígrafo Enero 1998 Diciembre 1998 Diciembre 1999
Percentil 2,5% 0,727 0,723 0,721
p x 106 Media 0,879 0,879 0,880
Percentil 97,5% 1,150 1,160 1,164
Percentil 2,5% 0,148 0,145 0,142
q Media 0,159 0,159 0,158
Percentil 97,5% 0,173 0,173 0,171
Percentil 2,5% 5.158 4.597 3.880
m Media 8.778 8.757 8.025
Percentil 97,5% 14.351 15.847 14.787 t* Abril 2001 Abril 2001 Mayo 2001
N(t*) 4.389 4.378 4.012
mente en la estimación a través de la muestra. En los primeros meses de 1998 la estimación de m era 8,8 millones de personas, mientras que al final de la muestra la estimación disminuye a 8,0 millones de personas. Por su parte, la estimación con coeficientes constantes era 8,5 millones de perso- nas. La Figura 2 presenta la evolución de los coeficientes estimados. Los valores p y q permanecen prácticamente constantes en el proceso de difusión, mientras que m varía de manera importante.
FIGURA 2
ESTIMACIONES COEFICIENTES VARIABLES
Los intervalos de confianza reportados en el Cuadro 3 muestran el rango de variación posible para los coeficientes estimados con un nivel de confian- za del 95%. Para el coeficiente m, que es el que presenta mayor variabi- lidad, el intervalo de confianza del 95% al final de la muestra corresponde al intervalo desde 3.880 miles de personas y hasta 14.787 miles de perso- nas. La amplitud de este intervalo muestra el grado de incertidumbre en las predicciones, particularmente en las de largo plazo.
La Figura 3 presenta la estimación del modelo con coeficientes variables.
En esta figura aparecen las observaciones de nuevos usuarios, la curva de difusión de nuevos usuarios para los coeficientes estimados a enero de 1998 y a diciembre de 1999, y la curva de difusión para el número acumulado
0,0 0,2 0,4 0,6 0,8 1,0
1998 1999
7.600 7.800 8.000 8.200 8.400 8.600 8.800
Miles
q p 10^6 m
de usuarios con coeficientes estimados a enero de 1998 y a diciembre de 1999.
FIGURA 3
OBSERVACIONES, ESTIMACION DE NUEVOS USUARIOS Y ESTIMACION DE USUARIOS ACUMULADA
El Cuadro 4 presenta estadísticas de los errores de predicción fuera de muestra para los doce meses de 1999, tanto para el modelo con coeficientes fijos como para el modelo con coeficientes variables. Para la raíz del error cuadrático medio, el modelo de coeficientes variables logra una disminución de 23,16 a 16,36, lo que representa casi un 30%. Para la desviación media absoluta, la disminución lograda por el modelo con coeficientes variables es del 37%. La disminución de los errores de predicción en el caso de modelos con coeficientes variables también es reportada por Xie, Song, Sirbu y Wang (1997).
0 100.000 200.000 300.000 400.000
1998 1999 2000 2001 2002 2003
0 1.000.000 2.000.000 3.000.000 4.000.000 5.000.000 6.000.000 7.000.000 8.000.000 9.000.000 10.000.000
Observación Nuevos Enero 1998 Nuevos Diciembre 1999 Acumulado Enero 1998 Acumulado Diciembre 1999
CUADRO 4
ESTADISTICAS DE ERRORES DE PREDICCION FUERA DE MUESTRA Raíz error cuadrático medio y desviación media absoluta de los errores de predicción fuera de muestra para los modelos de coeficientes constantes y variables. Estadísticas basada en 12 predicciones
IV. CONCLUSIONES
En este trabajo se estudia la adopción de Internet en Chile. El estudio hace un aporte metodológico al flexibilizar el tradicional modelo de Bass para permitir que los coeficientes del modelo evolucionen a través del tiempo.
La metodología utilizada consiste en un filtro basado en simulaciones que tiene varias ventajas respecto a las metodologías más tradicionales: (i) permite cualquier especificación del modelo sin requerir de aproximaciones lineales para la estimación de los coeficientes como las utilizadas por Xie, Song, Sirbu y Wang (1997); (ii) permite que los coeficientes evolucionen a través del tiempo en función de variables exógenas o de acuerdo a un proceso estocástico, y (iii) permite, en un contexto bayesiano, incorporar información inicial respecto de los coeficientes.
Los resultados de las estimaciones muestran que el proceso de difusion de Internet en Chile está determinado casi completamente por un proceso de imitación. Mientras el coeficiente de imitación del modelo de Bass alcan- za un valor igual a 0,159, el coeficiente de innovación es prácticamente igual a cero. Estos dos coeficientes han variado muy poco en el proceso de difusión. Estos valores implican que el momento en que se alcanzará el máximo de nuevos adoptadores será en abril del 2001. El potencial de adoptadores de Internet sí que ha cambiado en el tiempo. Mientras a co- mienzos de 1998 este valor llegaba a 8.778 miles de personas, a fines de 1999 alcanzaba a 8.025 miles de personas.
Modelo con Coeficientes
Estadígrafo Constantes Variables
Raíz Error Cuadrático Medio 23,16 16,36
Desviación Media Absoluta 18,69 11,75
Los resultados de aplicar la metodología presentada también muestran que el modelo de Bass con coeficientes variables es más flexible que el modelo de coeficientes fijos y que las predicciones fuera de muestra dis- minuyen en un 30%.
Las bondades del modelo con coeficientes variables se muestran no sólo en los indicadores estadísticos. La estimación del modelo con coeficientes fijos proyecta un mercado potencial para Internet excesivamente alto, con- siderando la población que por edad e ingresos puede acceder a este ser- vicio. El modelo con coeficientes variables muestra una importante dismi- nución en el mercado potencial de Internet al incorporar nueva información a las proyecciones. Las proyecciones derivadas de este estudio pueden ser utilizadas para estimar mercados potenciales de negocios a través de Internet y el alcance de este medio en publicidad.
De acuerdo a datos de la Subsecretaría de Telecomunicaciones, el nú- mero de usuarios de Internet en Chile a marzo del 2000 era de 1.025.000, lo que constituye un punto fuera de muestra en el análisis realizado en este estudio. La proyección del modelo para ese mes es de 938.000 lo que constituye un error de predicción a tres meses igual a –8,5%.
APENDICE
Se considera el modelo en forma de estado
(a1)
(a2) Donde n (t) es la observación en t, θ (t) es el vector de estado en t, ε (t) y η (t) son errores aleatorios y t = 1, 2, ..., T. Sea H (t) = {H(0), n(1), ..., n(t)} la información disponible al tiempo t. Entonces, por el Teorema de Bayes,
(a3) El algoritmo que permite obtener estimaciones en línea del vector de estado θ (t) consiste en la siguiente secuencia de operaciones.
• Se obtienen N realizaciones del vector de estado al tiempo t = 0,
• Se obtienen N realizaciones del error aleatorio η(t) para obtener, me- diante (a2) realizaciones de θ (1). Estas realizaciones permiten estimar la densidad predictiva .
• Para obtener realizaciones de θ (1) con información hasta el tiempo t = 1, y poder estimar la densidad se utiliza muestreo de rechazo en la ecuación (a3) (véase Carlin, Polson y Stoffer (1992)). Para esto se definen las ponderaciones
y se obtiene una muestra con reemplazo y con probabilidades proporcio- nales a las ponderaciones wj, j = 1 ,…, N, las realizaciones θJ (1). Estas realizaciones permiten estimar la densidad .
• La secuencia de pasos anteriores se repite para t = 2, ...,T para obtener estimaciones de las densidades ..
) ( )) ( ( )
(t f t t
n = θ +ε
) ( )) 1 ( ( )
(t g θ t η t
θ = − +
)) 1 ( / ) ( ( )) ( / ) ( )) (
1 ( / ) ( (
)) 1 ( / ) ( ( )) ( / ) ( )) ( ( / ) (
( ∝ −
−
= − p n t t p t H t
t H t n p
t H t p t t n t p H t
pθ θ θ θ θ
) 0 ( ..., ), 0 ( ), 0
( 2
1 θ θN
θ
)) 0 ( / ) 1 (
( H
p θ
)) 1 ( / ) 1 (
( H
p θ N , 1, j ), 1 ( )) 1 ( / ) 1 (
( = = …
= j
j p n
w θ θ
)) ( / ) (
( t H t
pθ
)) 1 ( / ) 1 (
( H
p θ
Se demuestra en Kitagawa (1998) que si para t = 2, el muestreo en el paso 3 se aplica simultáneamente a θJ(1) y a θJ(0). Estas últimas corres- ponden a realizaciones de la densidad . Este mecanismo permite obtener estimaciones suavizadas del vector de estado. Para mayo- res detalles de la metodología, véanse Kitagawa (1998) y Tanizaqui y Mariano (1998).
)) 2 ( / ) 0 (
( H
pθ
REFERENCIAS
Bass, F.M. (1969). A New Product Growth Model for Consumer Durables. Management Science 15, 215-217.
Bretschneider, S.I. y V. Mahajan (1980). Adaptive Technological Substitutions Technologycal Forecasting and Social Change 18, 129-139.
Carlin, Polson y Stoffer (1992). A Monte Carlo Approach to Nonnormal and Nonlinear State- Space Modelling. Journal of The American Statistical Association 87, 493-500.
Cleveland, W.S., y Devlin, S.J. (1988). Locally-weighted Regression: An Approach to Regression Analysis by Local Fitting. Journal of The American Statistical Association, 83, 596-610.
Easingwood, C.J., V. Mahajan y E. Müller (1983). A Nonuniform Influence Innovation Diffusion Model of New Product Acceptance. Marketing Science 2, 273-296.
Fourt, L.A. y W. Woodlock (1960). Early Prediction of Market Success for Grocery Products.
Journal of Marketing 25, 31-38.
Hernes, G. (1976). Diffusion and Growth.-The Nonhomogeneous Case. Scandinavian Journal of Economics 78, 427-436.
Kalish, S. (1985). A New Product Adoption Model With Pricing, Advertising and Uncertainty.
Management Science 31, 1569-1585.
Kalish, S. y S.K. Sen (1986). Diffusion Models and The Marketing Mix for Single Products.
En Innovation Diffusion Models of New Product Acceptance. V. Mahajan y Y. Wind editores. Cambridge, MA: Ballinger Publishing Company.
Kitagawa, (1998). A Self-Organizing State-Space Model. Journal of The American Statistical Association 93, 1203-1215.
Mahajan, V. y R. Peterson (1978). Innovation Diffusion in a Dynamic Potential Adopter Population. Management Science 24, 1589-1597.
Mahajan, V. y R. Petterson (1979). Integrating Time and Space in Technological Substitution Models. Technological Forecasting and Social Change 14, 231-241.
Mahajan, V., H. Mason y V. Srinivasan (1986). An Evaluation of Estimation Procedures for new Product Diffusion Models. En Innovation Diffusion Models of New Product Acceptance. V. Mahajan y Y. Wind editores. Cambridge, MA: Ballinger Publishing Company.
Mansfield, E.(1961).Technical Change and The Rate of Imitation. Econométrica 29, 741- 766.
Sharif M. y K. Ramanathan (1981). Binomial Innovation Diffusion Models With Dynamic Potential Adopter Population. Technological Forecasting and Social Change 20, 63-87.
Tanizaki y Mariano (1998). Nonlinear and nonGaussian State-Space Modeling with Monte Carlo Simulations. Journal of Econometrics 83, 263-290.
Utreras, F. (2000). Au Chili le Réseau se Développe Sera-t-il Assez Vite et Pour Touts?.
Mimeo.
Xie, Song, Sirbu y Wang (1997). Kalman Filter Estimation of New Product Diffusion Models.
Journal of Marketing Research 34, 378-393.