2.5. Estudios emp´ıricos sobre la HME
2.5.3. Tests sobre la versi´ on d´ebil de eficiencia
2.5.3.9. Cuantificadores derivados de la Teor´ıa de la
Los mercados financieros pueden ser considerados como sistemas din´ami- cos, cuyo comportamiento se registra en las series temporales de precios, rendimientos, y otros datos financieros. Estas series temporales deben ser analizadas cuidadosamente para entender el fen´omeno subyacente.
Cuantificadores derivados de teor´ıa de la informaci´on pueden ser candi- datos ideales para esta tarea, ya que nos permiten extraer algunas propieda- des de las distribuciones de probabilidad estimada a partir de las observa- ciones. Una de las m´etricas clave es la entrop´ıa de informaci´on de Shannon y Weaver (1949).
Dada cualquier distribuci´on discreta de probabilidad P ={pi} con i=
{1, . . . , M}, la entrop´ıa de Shannon se define como S[P] =−
M
X
i=1
pilnpi (2.23)
Es igual a cero si la estructura subyacente es completamente determinista (pk = 1∧pi = 0,∀i 6= k ). En este caso estamos en condiciones de prede-
cir con absoluta certeza cu´al estado de la naturaleza tendr´a lugar. Asimimo, alcanza un valor m´aximo para un proceso estoc´astico no correlacionado (dis- tribuci´on uniforme, es decir,pi = 1/M,∀i= 1, . . . , M). En este caso nuestro
conocimiento es m´ınimo para esta distribuci´on.
Los art´ıculos pioneros en el uso de la entrop´ıa de informaci´on para es- tudiar los fen´omenos econ´omicos son los de Theil y Leenders (1965), Fama (1965b) y Dryden (1968), que utilizan la entrop´ıa de Shannon como m´etrica para predecir fluctuaciones en los precios de acciones en diversos mercados. La entrop´ıa dej´o de ser utilizada en la literatura econ´omica por varias d´eca- das, aunque s´ı se ha utilizado para el estudio de series temporales en otros campos cient´ıficos. En la literatura reciente encontramos los art´ıculos Risso (2008, 2009) donde se utiliza la entrop´ıa con el fin cuantificar la eficiencia informativa y la probabilidad de tener un colapso econ´omico. M´as tarde, Ris- so (2009) tambi´en utiliza la entrop´ıa de Shannon para clasificar u ordenar varios mercados de valores de todo el mundo mediante la eficiencia informa- tiva. Otros autores implementan un concepto de entrop´ıa multiescala para monitorear la evoluci´on de la eficiencia informativa sobre diferentes horizon- tes de tiempos. Esta metodolog´ıa se ha aplicado a los precios del petr´oleo crudo (Martina et al., 2011) y al ´ındice Dow Jones (Alvarez-Ramirez et al., 2012).
Sin embargo, el an´alisis de series temporales utilizando s´olo la estimaci´on de la entrop´ıa de Shannon podr´ıa ser insuficiente ya que, como ha recordado Feldman y Crutchfield (1998), una medida de la entrop´ıa no cuantifica el
grado de estructura presente en un proceso. De hecho, es necesario medir la complejidad estad´ıstica para caracterizar completamente la din´amica del sistema. Esta es la raz´on por la que se ha propuesto tener en cuenta junto a la entrop´ıa, la complejidad estad´ıstica para el an´alisis de series temporales fi- nancieras (Zunino et al., 2010a). La medida de complejidad estad´ıstica trata de cuantificar la estructura organizativa subyacente. En ese sentido, el orden y la m´axima aleatoriedad perfecta (por ejemplo, una secuencia peri´odica y el lanzamiento de una moneda32) se definen con cero complejidad, ya que son las m´as f´aciles de describir y comprender. A una distancia dada de estos extremos, existe una amplia gama de posibles grados de la estructura f´ısica. La medida de complejidad permite la cuantificaci´on de este comportamien- to (Feldman et al., 2008). Por supuesto, existen muchas otras medidas de complejidad. Para obtener una comparaci´on entre ellas, v´ease el art´ıculo de Wackerbauer et al. (1994).
La complejidad estad´ıstica se define a partir de la propuesta de L´opez- Ruiz et al. (1995), a trav´es del producto:
CJS =QJ[P, Pe]H[P] (2.24)
donde H[P] = S[P]/Sm´ax es la entrop´ıa de Shannon normalizada, con Smax = SPe = lnM y Pe es la distribuci´on uniforme. En consecuencia
0 ≤ H ≤ 1. El desequilibrio QJ se define en t´erminos de la divergencia
Jensen-Shannon. Es decir: QJ[P, Pe] =Q0· J[P, Pe], (2.25) donde, J[P, Pe] = S [(P+Pe)/2]−S[P]/2−S[Pe]/2. (2.26) es la divergencia de Jensen-Shannon y Q0 =−2 M+ 1 M ln(M+ 1)−2 ln(2M) + lnM −1 . (2.27)
Q0 es una constante de normalizaci´on, igual al rec´ıproco del valor m´aximo de J[P, Pe] . Este valor se obtiene cuando uno de los componentes de P,
digamos pm, es igual a uno y lospi restantes son iguales a cero.
Se debe destacar que la medida de complejidad estad´ısticaCJS depende
de dos diferentes distribuciones de probabilidad, la asociada con el sistema bajo an´alisis,P, y la distribuci´on uniforme,Pe. M´as a´un, Mart´ın et al. (2006)
han demostrado que para un valor dado deHS,CJS puede asumir un rango
de valores que var´ıa entre un m´ınimoCmin y un m´aximo Cmax.
32En el campo de la f´ısica los ejemplos cl´asicos de orden perfecto y aleatoriedad perfecta
son un cristal y un gas ideal. En ambos casos las estructuras no presentan complejidad de acuerdo a la definici´on que hemos adoptado.
El uso simult´aneo de cuantificadores de entrop´ıa y de complejidad es- tad´ıstica da una mejor descripci´on de sistemas din´amicos. As´ı, queda defi- nido el plano causal complejidad-entrop´ıa (PCCE), es decir, el espacio de representaci´on con la entrop´ıa de las permutaciones del sistema en el eje horizontal y una medida de complejidad estad´ıstica de la permutaci´on en el eje vertical.
La ubicaci´on en el PCCE permite la cuantificaci´on de la ineficiencia del sistema bajo an´alisis, medido como la desviaci´on de la posici´on ideal asocia- da a un proceso totalmente aleatorio. En este ´ultimo caso, la complejidad deber´ıa ser cero y la entrop´ıa uno. Por consiguiente, la distancia a este lugar ideal del plano se puede utilizar para definir un ranking de eficiencia.
Para el c´alculo de los dos cuantificadores antes mencionados, debe esti- marse una distribuci´on de probabilidad a partir de la serie temporal asociada al sistema bajo an´alisis. Se han propuesto muchos m´etodos para una estima- ci´on adecuada de la misma. Podemos mencionar, sin intentar ser exhaustivos: (i) la frecuencia de aparici´on (Rosso et al., 2009) , (ii) procedimientos basa- dos en amplitud (De Micco et al., 2008), (iii) la din´amica simb´olica binaria (Mischaikow et al., 1999), (iv) an´alisis de Fourier (Powell y Percival, 1979), y (v) la transformaci´on por medio de onduletas o wavelets (Rosso et al., 2001), entre otros. Su aplicabilidad depende de las caracter´ısticas particu- lares de los datos, tales como la estacionariedad, la longitud de las series, la variaci´on de los par´ametros, el nivel de contaminaci´on por ruido, etc. En todos estos casos aspectos globales de la din´amica pueden ser capturados de alguna manera, pero los diferentes enfoques no son equivalentes en su capacidad para discernir todos los detalles f´ısicos pertinentes.
Los m´etodos para el an´alisis simb´olico de series temporales discretizan la serie y la transforman en una secuencia de s´ımbolos. Estos m´etodos per- miten analizar eficazmente datos con din´amicas no lineales y presentan baja sensibilidad al ruido (Keller y Sinn, 2005). Una cuesti´on de cierta impor- tancia es la de determinar si el orden temporal en que aparecen los valores (s´ımbolos) de la serie temporal se considera o no. Si se tiene en cuenta el orden de aparici´on, se dice que la informaci´on causal se ha tenido en cuenta. Si se limita a asignar un s´ımbolo= del alfabeto finito Aa cada valor de la serie temporal, la serie simb´olica se considera no causal. Es decir la funci´on de densidad de probabilidad extra´ıda no tendr´a ninguna informaci´on causal. La t´ecnica habitual para este ´ultimo caso es el histograma de frecuencias. La informaci´on causal puede ser incorporada en el proceso de construcci´on que produceP si un s´ımbolo de un alfabeto finito Ase asigna a la porci´on en lugar de una trayectoria (phase-space), es decir, se le asignan “palabras” a cada porci´on de trayectoria. La metodolog´ıa Bandt y Pompe (2002), en adelante BP, para la extracci´on de una funci´on de densidad de probabilidad a partir de una serie temporal corresponde con el tipo causal de la asignaci´on
Las “Particiones” se conciben comparando el orden de los valores relativos vecinos en lugar de mediante el prorrateo de amplitudes de acuerdo a los diferentes niveles. La secuencia de s´ımbolo apropiado surge de forma natu- ral a partir de la serie temporal. No se necesitan suposiciones basadas en modelos econom´etricos.
Dada una serie de S(t) = {xt;t = 1, . . . , N} , una longitud del patr´on D >1 (D∈N), y una frecuencia de muestreoτ (τ ∈N), el patr´on de Bandt y Pompe considerado es aquel generado por:
s7→ xs, xs+τ, . . . , xs+(D−2)τ, xs+(D−1)τ
, (2.28)
A cada s, la metodolog´ıa de BP asigna un vector de dimensi´on D que resulta de la evaluaci´on de la serie temporal en los momentoss, s+τ, . . . , s+ (D−2)τ, s+ (D−1)τ. Es claro que cuanto mayor sea el valor de D, m´as informaci´on sobre “el pasado” se incorpora en el patr´on. BP construyen a partir del patr´on hallado en la serie temporal un patr´on ordinal, ordenando de forma creciente los valores hallados en cada patr´on. El vector s hallado se convierte entonces en un s´ımbolo. Dado que se trata de ordenar en forma crecienteDelementos, existen D! formas de disponerlos. La distribuci´on de probabilidad emerge naturalemente contando la frecuencia de aparici´on de dichos patrones ordinales.
A fin de ilustrar el m´etodo de BP, consideremos el siguiente ejemplo: sea una serie temporal con siete elementos (N = 7), cuyos valores son {4,7,9,10,6,11,3}. Evaluamos la serie de acuerdo al m´etodo BP paraD= 4 y τ = 1. La terna (4,7,9) y (7,9,10) representa el patr´on {012} porque los valores son crecientes. En cambio las ternas (9,10,6) y (6,11,3) corres- ponden a {201}, mientras que (10,6,11) es el patr´on {102}. Por tanto, la probabilidad asociada a los 6 patrones son: p({012}) = 2/5, p(201) = 2/5,
p({102}) = 1/5,p({021}) =p({120}) =p({210}) = 0.
Una revisi´on de las principales aplicaciones a los campos de las ciencias econ´omicas y las ciencias biom´edicas se puede ver en Zanin et al. (2012).
Una de las ventajas que ofrece esta t´ecnica es que permite generar una escala o r´anquing de eficiencia. Es decir, a diferencia de los m´etodos estudia- dos anteriormente, en las cuales se valida o invalida la HME, aqu´ı se puede generar un intervalo de eficiencia de diferentes instrumentso bajo estudio.
Una limitaci´on que tiene esta t´ecnica es que es muy intensiva en el uso de datos. Por tanto se necesita una serie suficientemente larga (al menos mil observaciones) para poder tener estimadores consistentes.
Rosso et al. (2007) mostraron que el PCCE es capaz de detectar los deta- lles esenciales de la din´amica y diferenciar diferentes grados de periodicidad y caos. As´ı, esta representaci´on cartesiana ha sido recientemente utilizada con ´exito y ha demostrado ser una pr´actica y robusta manera de discriminar
las correlaciones lineales y no lineales presentes en los mercados de accio- nes (Zunino et al., 2010b), productos b´asicos o commodities (Zunino et al., 2011), bonos soberanos (Zunino et al., 2012) y bonos corporativos (Bariviera et al., 2013b).
Utilizando esta t´ecnica Zunino et al. (2012) analizan la eficiencia informa- tiva de ´ındices de bonos soberanos mediante el PCCE. Dicha representaci´on permite discriminar gr´aficamente el comportamiento estoc´astico de ´ındices de pa´ıses emergentes y desarrollados, y dentro de estos ´ultimos, aquellos que corresponden a la Uni´on Europea. Adem´as este estudio encontr´o una correlaci´on significativa entre la entrop´ıa de las permutaciones, el nivel de desarrollo econ´omico (medido en t´erminos del PIB) y el tama˜no de mer- cado (medido por medio de la capitalizaci´on). En el art´ıculo de Bariviera et al. (2013a) se relacionan los niveles de eficiencia informativa reflejados en el PCCE con los ratings o calificaciones de crediticias asignadas por las calificadoras Moody’s y Standard & Poors. Los resultados apuntan a una correlaci´on positiva entre eficiencia y calificaci´on crediticia. En el caso de Bariviera et al. (2013b), el estudio de la eficiencia informativa mediante el PCCE est´a dirigido a detectar las alteraciones en la eficiencia de series temporales de bonos corporativos, producidos por fen´omenos como la cri- sis econ´omica del 2008 y el procesos de integraci´on econ´omico y monetario europeo.