3 METODOLOGÍA Y DATOS
3.3 EXPLORACIÓN DE DATOS Y ADECUACIÓN DE LA METODOLOGÍA
Además del análisis preliminar expuesto para decidir la elección óptima de las fuentes de datos es recomendable la realización de pruebas prácticas adicionales que validen la consistencia de los resultados (p.ej. cuando el volumen de los datos dificulta ver la tendencia general o la detección de anomalías) y la correspondiente adecuación de la metodología, si fuese necesaria.
En el caso de las fuentes de datos referentes a estadísticos generales a nivel de la UE, las que las que pone a disposición la UE a través de sus diferentes herramientas (EUROSTAT, GISCO, etc.), son la opción más idónea y homogénea. En el caso de la versión de las NUTS, se va a utilizar la de 2010 por considerarse más estable y consolidada. Es habitual utilizar una versión anterior de NUTS a la de los datos disponibles (ETIS utiliza la clasificación NUTS de 2006 con datos de 2010). En todo caso, la exploración de la combinación de NUTS‐2 y NUTS‐3 propuesta en la metodología, tiene dos consecuencias:
La selección de regiones concretas definidas a nivel NUTS‐3 para este estudio, siguiendo el proyecto EU‐LUPA (ESPON 2014a), tienen todas disponibles los datos de PIB (ver combinación en 3.2.1). Esto implica que la ponderación para la obtención de las distancias por el método de Chen (2004) puede hacerse con estos datos y no es necesario recurrir a la población, que hubiese sido la opción escogida en caso de no contar con todos los PIB de las regiones NUTS‐3 necesarias.
A la hora de obtener las distancias bilaterales, se deben considerar únicamente 24 países de la UE en vez de los 27 existentes en 2011. El reducido tamaño de Malta, Chipre y Luxemburgo desaconsejan su incorporación al estudio. Por este motivo, se
han eliminado los 3 países5 de la muestra de 27 de la UE en 2012, de forma que se garantice una medida homogénea de la distancia.
De la misma manera, la red de carreteras con serie histórica más completa encontrada de acceso libre y gratuito es la de Stelder. Como ya se ha precisado, la aplicación de modificaciones en las velocidades ajusta más a la realidad su uso (ver 3.2.2) y también se debe tener en cuenta la mejora ficticia de infraestructuras en 2012 respecto a 2001 como una salvedad menor, que se corrige con los tiempos de viaje. La obtención de los tiempos de viaje se realiza según esta red de carreteras para todos los orígenes y destinos de la combinación de NUTS‐2 y NUTS‐3 definida, aplicando la metodología que favorece la homogeneidad. Se debe señalar que esta red no cuenta con datos de Malta, por lo que, si su tamaño no fuese inconveniente para aplicar la metodología, habría que añadir manualmente sus tiempos de viaje y conexiones.
En el caso del flujo bilateral de comercio, además del conocimiento de las características generales y estructurales de las bases de datos, este trabajo requiere una exploración más pormenorizada de las mismas antes de decantarnos por una para la aplicación de la metodología. La valoración directa de los datos ya predice la falta de exhaustividad e integridad en algunos casos y por tanto, la información disponible de cada fuente debe cotejarse con los objetivos de la investigación para justificar la elección más adecuada. El análisis planteado es el siguiente:
a) Por un lado, se ha recalcado con insistencia la importancia del enfoque económico en la selección de variables a aplicar en la metodología. Desde la propia estructura de la formulación de la accesibilidad a través del potencial de mercado, a la caracterización del tamaño de los orígenes y destinos en función de su PIB o la ponderación en el método de obtención de las distancias también por el PIB, o incluso la introducción de la competencia, fortalecen este aspecto. Entre las opciones, la mejor elección pasa por una base de datos en valor monetario, como pueden ser COMEXT, ETIS o WIOD.
b) En esta línea, si el objetivo es conocer el comportamiento del potencial de mercado en la UE, el interés recae en los datos más actualizados posibles, y en todo caso, además, es básico a los efectos de la investigación una base de datos con evolución temporal que permita análisis comparativos con otros periodos relevantes (nuevas infraestructuras de transporte, inicio de la crisis, etc.). Según las series disponibles, COMEXT (último año disponible 2013) y WIOD (último año disponible 2011) son las que ofrecen datos más actuales. Teniendo en cuenta que la red de carreteras aportará el tiempo de viaje de 2012, cualquiera de las dos opciones sería válida.
c) La robustez de los datos también es fundamental. Por un lado, la existencia de un alto porcentaje de valores nulos, de simetría o la falta de datos en algunos países en la UE suponen condiciones de contorno poco fiables.
5 En la nueva versión de 2010 de NUTS, Malta pasa a tener 2 NUTS2, pero el tamaño se mantiene con lo que desvirtúa el proceso igualmente.
En este sentido, se realizan pruebas y verificaciones de datos con las fuentes disponibles, aplicando el modelo de calibración a cada una de ellas para los países de la UE. Con los resultados obtenidos, se llega a la conclusión de que la mayor parte de las bases de datos existentes no sustentan la realidad del flujo comercial en la Unión Europea, aportando sesgo de diferentes modos. Bien por la falta de participación de algunos países, bien por las diferentes metodologías para la recopilación de datos o bien por un proceso de estimación y agregación que no acaba de ser efectivo, las series de datos puestas a disposición, sobre todo las disponibles en toneladas no encajan con los resultados esperados.
Analizando TRANSTOOLS para el año 2005 (WORLDNET V.6), el primer problema llega al comprobar la simetría en el flujo bilateral total de toneladas transportadas entre las regiones. Este punto de partida parece no ajustarse a la realidad, ya que el comercio no es simétrico. Ante esta situación, la alternativa entonces es utilizar las matrices disponibles por modo, de forma independiente, y comprobar que no ocurre lo mismo. Sabiendo que la de mayor impacto es la de transporte por carretera, si bien no es simétrica, en su análisis se encuentra de nuevo otra limitación de gran alcance: la existencia de un alto porcentaje de valores nulos entre los países de la UE (superior al 30% a nivel NUTS‐2; este valor desciende al 13% al eliminar Reino Unido e Irlanda). La existencia de valores nulos puede ser en algunos casos real, o en algunos casos una infraestimación o en otros casos debida a la no disponibilidad de datos. La realidad es que no existe información que aclare este aspecto, siendo equivalente cualquiera de las tres situaciones, lo que implica un alto nivel de imprecisión en los valores. El tratamiento de estos problemas, por ejemplo con regresiones Tobit, tampoco genera resultados convincentes, por lo que se recomienda evaluar otras alternativas que no adolezcan de los mismos inconvenientes. Añadido a esta verificación práctica, sobre WORLDNET la literatura ya indica que tras cotejarla con COMEXT y otras bases de datos nacionales (Alemania, Bélgica, Francia...), se puede considerar una base de datos con múltiples problemas, inconsistencias y "aberraciones" (Chevalier & Limbourg 2010).
El problema de los valores nulos es recurrente al analizar ETIS‐PLUS 2010. El porcentaje de valores nulos está alrededor del 10% (p.ej. no hay constancia de comercio de Austria o Grecia con Portugal y así con más de 50 relaciones bilaterales). Para más desconcierto, países como España tienen 28 relaciones internas nulas, lo que no parece ser coherente con la realidad. Igualmente Francia tiene 55 relaciones bilaterales internas nulas y Alemania, 155. Referente a las matrices de las impedancias, se comprueba que faltan algunas NUTS‐3 de asignar valores de impedancia, como es el caso de Rosenheim, en Baviera, aunque este extremo no nos aplica ya que utilizaremos nuestra propia impedancia. Dado que ETIS‐PLUS tiene TRANS‐TOOLS como base era previsible un comportamiento mejorado, pero en la misma línea. Los cálculos se han realizado tanto con los datos armonizados como los modelizados y los resultados son similares. Aunque estas comprobaciones dirigen el análisis a otras alternativas, se ha procedido a realizar pruebas de calibración con ambas opciones. El resultado es que no parecen ajustarse a la realidad y se alejan de los resultados de otros estudios de la literatura. No aportan una tendencia coherente. El análisis de los datos de partida, número de valores nulos o ausencia de flujo
entre algunos países hacen que las calibraciones resulten en valores fuera de los rangos esperados.
Las matrices calculadas a partir de WIOD y COMEXT no contienen valores nulos (sin contar la diagonal de COMEXT), ni simetría ni otros signos que a simple vista puedan sesgar los resultados. Además, la información está disponible en valores monetarios lo que refuerza la metodología. Por lo tanto, con ambas se han ejecutado pruebas de calibración con los flujos de comercio directamente, obteniéndose resultados más realistas que con TRASN‐ TOOLS y ETIS‐PLUS.
d) En la misma línea del argumento del punto anterior, la falta del comercio interno en la base de datos o su estimación a partir de diferentes métodos confiere un alto nivel de inconsistencia de la información. Este es el caso de COMEXT. Tal y como se ha propuesto (ver 3.2.3), se exploran distintas metodologías para construir la diagonal de la matriz: restar al PIB de cada país, sus exportaciones, o hacer lo mismo con la producción nacional (agrícola, minera y manufacturas) o con el valor añadido bruto. Por tanto, las alternativas serían:
i. PIB menos las exportaciones de bienes y servicios (datos de Eustostat: COMEXT y
PIB a precios de mercado; año más reciente completo 2012). Mediante el uso de estos datos, se consigue suavizar el efecto Rotterdam y todos los países mostraron comercio interior por debajo de valor de las exportaciones.
ii. Producción nacional, menos las exportaciones (bienes) (datos de Eustostat:
COMEXT y Cuentas nacionales; año más reciente completo 2009). Aunque ambos conjuntos de datos son publicados por Eurostat, no son completamente consistentes, y esto afecta en particular a los países con grandes puertos en relación con su tamaño económico. En consecuencia, el efecto Rotterdam tiene un enorme impacto y el valor de las exportaciones excede el valor de la producción nacional en 5 de los países de la UE. Además, la producción nacional está infravalorada porque no se contabiliza la producción de las empresas de < 20 empleados. Por tanto, rechazamos este conjunto de datos que reduciría drásticamente nuestra muestra, justamente en contraposición a los resultados de otros estudios que consideran sólo con un conjunto seleccionado de países ad hoc El objetivo es proporcionar aportaciones para la Unión Europea en su conjunto.
iii. VAB menos las exportaciones (bienes) (datos de Eustostat: COMEXT y Cuentas
nacionales; año más reciente completo 2005). Otra vez el efecto Rotterdam es de gran magnitud: sólo 14 de los países de la UE muestran valores superiores de VAB que el valor de las exportaciones.
Por tanto, en estos dos últimos casos, aun consultando todos los datos en EUROSTAT, existen inconsistencias y en al menos un tercio de los países de la UE, las exportaciones superan a la producción nacional y al valor añadido bruto, debido entre otros factores, al
Efecto Rotterdam6. Esto significa que la diagonal de la matriz es especialmente imprecisa en países en los que las exportaciones incluyen una alta proporción de productos importados, en contraposición con los países que exportan fundamentalmente producción nacional. Los valores obtenidos se muestran a continuación:
Tabla 14. % de comercio doméstico según las distintas alternativas para completar la
diagonal de la matriz de comercio bilateral de COMEXT, tomando como año base las
exportaciones de 2012.
País PIB ‐EXPORTS (%) PROD‐EXPORTS (%) VAB ‐EXPORTS (%) AT 57,76 28,81 0,26 BE 7,66 ‐26,69 ‐164,11 BG 47,58 37,56 6,52 CZ 20,07 24,61 ‐11,15 DE 58,98 43,23 22,24 DK 66,53 29,03 ‐6,81 EE 28,12 ‐5,04 ‐43,01 ES 77,77 56,07 49,56 FI 70,46 53,10 26,65 FR 78,21 51,76 23,22 GB 80,93 45,74 40,67 GR 85,75 62,255 69,31 HU 16,61 15,22 ‐27,41 IE 44,56 15,54 ‐21,00 IT 75,10 63,02 44,24 LT 30,03 7,52 3,81 LV 50,63 ‐12,44 ‐8,71 NL 15,08 ‐44,85 ‐100,18 PL 62,15 52,15 31,64 PT 72,59 50,37 35,63 RO 65,83 45,81 50,05 SE 67,07 37,23 10,95 SI 29,12 ‐1,42 ‐10,08 SK 11,75 6,33 ‐28,53Fuente: Elaboración propia.
Nota de códigos de países: AT (Austria), BE (Bélgica), BG (Bulgaria), CZ (República Checa), DE (Alemania), DK (Dinamarca), EE (Estonia), ES (España), FI (Finlandia), FR (Francia), GB (Gran Bretaña), GR (Grecia), HU (Hungría), IE (Irlanda), IT (Italia), LT (Lituania), LV (Letonia), NL (Países Bajos), PL (Polonia), PT (Portugal), RO (Rumanía), SE (Suecia), SI (Eslovenia), SK (Eslovaquia).
6 El Efecto Rotterdam sobreestima las exportaciones e importaciones de los Estados miembros de la UE que están expuestos a este fenómeno, en particular los Países Bajos(vía Rotterdam) y Bélgica (vía Antwerp). Las exportaciones se atribuyen al país donde se descargan, pero posteriormente pueden ser exportadas a otro destino final.
Esta situación hace pensar que el resto de valores de la matriz de COMEXT también están afectados por el efecto Rotterdam. El comercio triangular y otras práctica similares, origen de este fenómeno, afectan especialmente a los Países Bajos, Bélgica y otros países con una infraestructura portuaria muy desarrollada y relativamente poca población. Para solucionar este aspecto, se propone la recomendación de ETIS ‐BASE (2004, p.45) que se basa en rellenar la matriz (excepto la diagonal) con la media entre las exportaciones del país i a un país j, y las importaciones de un país j desde un país i. En todo caso, estos últimos inconvenientes y la no disponibilidad del comercio interno, respaldan la consideración de otras bases de datos adicionales.
Tras completar la diagonal de COMEXT, una comprobación obligada entre las bases de datos es precisamente evaluar el grado de divergencia respecto al porcentaje de comercio doméstico en cada una. El resultado de la comparación se muestra en la siguiente tabla. Por ejemplo, para el caso de España tenemos la referencia de Myro Sánchez (2013, p.63) que lo sitúa en torno al 63%. Haciendo los correspondientes cálculos se puede apreciar que las tablas WIOD son las únicas que tienen un comportamiento cercano a este valor. El resto ofrece valores desproporcionados.
Tabla 15. Comparativa de % de comercio doméstico en las diferentes bases de datos
de flujo bilateral de comercio.
País COMEXT (2012) PIB ‐EXPORTS TRANS‐TOOLS (2005) ETIS‐PLUS (2010) ROAD/Harmonized WIOD (2011) AT 57,76 84,06 89,18 40,58 BE 7,66 58,09 73,10 19,84 BG 47,58 88,85 96,70 64,58 CZ 92,35 89,74 90,29 40,87 DE 20,07 89,19 92,98 45,43 DK 58,98 81,66 91,93 33,25 EE 66,52 64,56 90,29 33,25 ES 28,12 94,58 96,90 62,74 FI 77,76 90,83 98,80 54,59 FR 70,45 90,30 95,20 58,81 GB 78,21 90,20 98,51 49,11 GR 80,92 94,55 99,44 86,39 HU 85,74 90,02 91,53 40,20 IE 16,61 93,83 95,38 35,11 IT 44,55 90,13 96,26 62,96 LT 75,10 71,78 83,90 49,19 LV 30,03 74,35 89,97 55,62 NL 65,87 60,52 83,64 22,94 PL 50,62 91,44 94,89 54,70 PT 51,56 92,84 94,10 65,84 RO 15,08 91,84 96,27 74,96 SE 62,15 78,16 95,84 74,96
SI 72,58 88,32 85,75 34,61
SK 65,82 87,15 86,27 45,96
Fuente: Elaboración propia.
Nota: El código de países es el aplicado en la Tabla 14.
e) Dado que la red de transporte que está disponible para obtener el tiempo de viaje es de carretera y ferry, siendo estrictos, los cálculos podrían hacerse únicamente con el comercio por carretera ya que los tiempos de viaje para el resto de modos difieren. En todo caso, el tiempo de viaje se usa como un indicador generalizado de impedancia que aplica en el mayor porcentaje de las exportaciones por lo que el hecho de calibrar con las exportaciones totales no desvirtúa la investigación. Siendo conscientes de las aproximaciones asumidas, cualquiera de las bases de datos propuestas podrían utilizarse en este sentido.
f) Finalmente, la desagregación de la información de la base de datos a nivel NUTS‐3, aunque pudiera permitir un amplio campo de desarrollo admitiendo la calibración de las barreras al comercio, la competencia o el decaimiento con la distancia para cada país, el objetivo que se persigue es un estudio global de la UE por lo que es prescindible. Es cierto que la situación ideal sería una base de datos de comercio bilateral a nivel NUTS‐3 con todos los datos disponibles a cualquier nivel territorial, pero la realidad es que se debe escoger la mejor opción entre las existentes y las bases de datos que cubren este requisito (ETIS y TRANSTOOLS) tienen otras carencias que no justifican su uso basado únicamente en el nivel de desagregación territorial de los datos. COMEXT o WIOD son asumibles dentro de los objetivos de la investigación a este respecto.
De forma esquemática, los resultados presentados para cada objetivo, se muestran en la siguiente tabla:
Tabla 16. Objetivos vs. bases de datos analizadas.
ENFOQUE ECONÓMICO ÚLTIMO AÑO DISPONIBLE VALORACIÓN DE OBJETIVOS COMERCIO INTERNO VALORES NULOS MODOS DIFERENCIADOS NIVEL TERRITORIAL COMEXT SI 2013 NO NO NO PAÍS FUENTES TRANSTOOLS ETIS NO 2005 SI NO CONSISTENTE SI SI NUTS‐3 A NIVEL PAÍS 2010 SI NO CONSISTENTE SI SI NUTS‐3 WIOD SI 2011 SI EN RANGO NO NO PAÍS
Fuente: Elaboración propia.
Según los argumentos presentados, las tablas WIOD son las que menos problemas presentan y más se adecúan a los objetivos de la investigación. La diferencia fundamental con COMEXT es
que la matriz de flujo de comercio a partir de las tablas WIOD está completa (incluido comercio doméstico) y que su composición en porcentaje de comercio exterior e interior es más acorde a la realidad. Por tanto, son las seleccionadas para el resto del desarrollo de la metodología de calibración. El resumen final de la selección de fuentes de datos se muestra en las siguientes tablas:
Tabla 17. Selección de fuentes de datos.
COMERCIO PIB/POBLACIÓN RED DE
TRASNPORTE UNIDADES ESPACIALES
Unidades $ convertidos a € €/Habitantes Km NUTS 2010
Escala
espacial País NUT2 y NUT3 NUT2 y NUT3
Cobertura espacial UE UE UE (no Chipre y Malta) UE Cobertura temporal 2001 y 2011 PIB: 2000 al 2011 (NUTS3)
Hab.: 1990 al 2013 (NUTS3) 1957‐2012 A partir de 2010
Limitaciones No está desagregada
a escala espacial PIB hasta 2011 a nivel NUTS3
Modificación arbitraria categorías
Fuente WIOD Comisión Europea Stelder (2013) GISCO
URL http://www.wiod.org http://ec.europa.eu/eurostat N/A http://ec.europa.eu/eurostat/web/gisco
Fecha de
consulta 12/09/2014 12/09/2014 12/09/2014 12/09/2014
Fuente: Elaboración propia.
Como conclusión, se incide en las matizaciones que esta exploración de los datos ha provocado en la metodología. Por un lado, el número de países sobre los que recae la investigación pasan de 27 a 24, excluyendo Chipre, Malta y Luxemburgo. El cálculo de las distancias bilaterales e internas de estos países se realiza por agregación a partir de la combinación territorial de NUTS‐2 y NUTS‐3 y ponderadas por el PIB. Las tablas WIOD ofrecen datos a nivel de país por lo que la calibración de las variables de control no cuenta con una serie de datos suficientemente amplia para proceder a calibraciones a menor nivel territorial que el de la UE. En consecuencia, se obtendrán valores únicos para toda la UE del exponente de la distancia, del de la resistencia multilateral espacial, del efecto frontera o de cualquiera de las variables que resulten significativas. Asimismo, existirá un desfase de un año entre la temporalidad de la red de carreteras escogida (2012) y las tablas WIOD cuya última actualización es del año 2011. Se entiende que la red de infraestructuras no evidencia cambios significativos en un año por lo que este efecto es mínimo. Sentadas estas pautas motivadas por la particularidad de los datos, puede avanzarse en la investigación.