Medidas de centralidad en redes urbanas con datos
184
0
0
Texto completo
(2) Medidas de centralidad en redes urbanas con datos. Taras Agryzkov Denysyuk. Tesis presentada para aspirar al grado de. Doctor por la Universidad de Alicante Ingeniería de Materiales, Estructuras y Terreno: Construcción Sostenible. Dirigido por:. Dr. Leandro Tortosa Grau Dr. José Francisco Vicent Francés.
(3)
(4) A mi madre y Gemma A Leandro y José Francisco.
(5)
(6) Agradecimientos Esta tesis es la memoria del camino de investigación que comenzamos Leandro Tortosa Grau, José Francisco Vicent Francés y José Luis Oliver Ramírez, junto con otros profesionales con los que hemos tenido el placer de colaborar. El tema elegido es asimismo, el resultado de un interés enraizado en el año 2012 con el que descubrí una dirección de trabajo en la que encaminar mis inquietudes en las disciplinas de matemáticas, ciencias de la computación, arquitectura y urbanismo. En este dilatado estudio, me siento satisfecho y agradecido de forma personal y profesional a mis directores de tesis, Leandro y José Francisco y a mi tutor José Luis, por su apoyo incondicional, formar un equipo y proponernos nuevos retos. A mi madre Tamara y a la persona que siempre me acompaña en múltiples travesías, Gemma. Por siempre, gracias.. III.
(7)
(8) Justificación y objetivos Las ciudades tienen un gran impacto en el desarrollo económico y social de las naciones [122]. Constituyen extensas plataformas donde las personas viven y trabajan, las empresas desarrollan su actividad y en el marco de las cuales se prestan servicios de diversa índole. El crecimiento de las ciudades es una realidad, los procesos de urbanización y migración de personas del campo a la ciudad hacen que las ciudades reúnan mayores concentraciones de personas. El reflejo cuantitativo de esta realidad son los datos presentados en World Population Review en enero del año 2018, indicando que el 54 % de la población mundial vive y trabaja en las ciudades. Otras fuentes, como por ejemplo la base de datos del Banco Mundial, estiman que para el año 2050 este porcentaje excederá el 70 %. Así pues, podemos decir que las actividades humanas se agrupan mayoritariamente en las ciudades. Su estudio, por tanto, nos puede ayudar a entender mejor la forma en que piensa y se desarrolla el propio ser humano. La cantidad y diversidad de relaciones que se producen entre el espacio, la información y los procesos sociales hacen que la ciudad presente las características de un sistema complejo. Una forma de tratar la complejidad de la ciudad es mediante redes, dado que éstas capturan el patrón y dinámica de relaciones entre diversos objetos tomados como sus nodos. A día de hoy, cada vez más estudiosos de la ciudad prefieren el modelo de redes en lugar de los planos tradicionales para tratar de estudiar la complejidad de las relaciones producidas en la ciudad. El concepto de una red es muy intuitivo en la sociedad moderna. En cuanto pensamos en redes, imaginamos un grupo de elementos relacionados entre sí. Sin lugar a dudas, numerosos sistemas naturales y antropogénicos pueden describirse en términos de las componentes de las redes complejas: nodos y sus relaciones dadas por aristas [26]. El tejido urbano es una estructura de complejidad organizada que existe sobre todo en el espacio entre los edificios [96]. Un análisis cualitativo de la ciudad requiere de un modelo capaz de estructurar la multiplicidad de relaciones entre los objetos y agentes involucrados en las dinámicas producidas en las calles. Precisamente en este aspecto, la representación de las ciudades mediante redes tiene ventajas. A diferencia de los planos u otros modelos tradicionales, las representaciones de espacios urbanos basadas en redes V.
(9) codifican las relaciones explícitas entre los espacios, la información y diversos procesos que participan en la ciudad. Ahora bien, la pregunta que nos formulamos es: ¿Qué clase de red es una ciudad? Obviamente, tratar la ciudad como una única red es impreciso, dada la cantidad de variables y la complejidad de sus relaciones. Como define Rozenblat, la ciudad se compone de una multiplicidad de diversas capas de redes conectadas entre sí [186]. Estamos hablando de capas de redes peatonales, redes de diversos transportes, redes de servicios, redes de información, etc. En términos generales, cualquier conjunto de entidades urbanas puede ser objeto de una determinada red. En este trabajo nos centramos en la red de distribución, más concretamente, en la red de tránsito peatonal. Es decir, aquella red que describe el espacio resultante entre las edificaciones de una ciudad. La principal ventaja de esta red es su representatividad, dado que su topología guarda una estrecha relación con la geometría del trazado de las calles. La Teoría de la Red Urbana de Salingaros explica esta red a partir de tres ideas o principios estructurales: nodos, conexiones o vínculos y jerarquía [189]. Los nodos son los recipientes de información relativos a la actividad humana, las conexiones representan los trayectos cortos entre una pareja de nodos y la jerarquía, en este sentido, se refiere al orden y a la prioridad de las conexiones. Hasta aquí, como conclusión podemos afirmar que las redes están emergiendo como un nuevo modelo para conceptuar el mundo y parecen ser una aproximación adecuada al estudio del problema de complejidad organizada como es el caso de la ciudad. La cuestión que se abre ante nosotros es qué modelo matemático se ajusta de manera más precisa a la red que representa las relaciones entre las entidades y las actividades del contexto urbano. Se puede decir que los modelos más destacados para este propósito son el grafo primario [176], el grafo dual [175], y aquel que trata cada edificio de la ciudad como un nodo [193]. Por tratarse de unos modelos verificados y de fácil elaboración, todos ellos han tenido una amplia aceptación tanto en la teoría como en la práctica. En nuestro trabajo, hemos optado por la representación de la trama urbana mediante la idea del grafo primario, en el que los nodos de la red son las intersecciones de las calles y las aristas son las propias calles de la ciudad. La principal ventaja de este grafo es que la métrica de sus aristas se corresponde con la métrica de la geometría de las calles y esta cualidad le permite representar de forma directa el patrón geométrico del trazado urbano. Reflexionemos brevemente, sin entrar en detalles, sobre las características de sus nodos. Si observamos las intersecciones de calles en diversos mapas de ciudades, notamos que la mayoría de intersecciones involucran entre 2 y 5 calles, lo que significa que el grado de la mayoría de los nodos de la red se encuentra entre estos valores. Esta característica de las redes urbanas, dadas mediante el grafo primario, las diferencia claramente de otras redes complejas. Es importante destacar que este intervalo reducido de grado (entre 2 y 5) del grafo primario no permite identificar las propiedades relevantes de la red, sin embargo, sus cualidades geométricas hacen que los nodos sean precisos contenedores de datos. Y este es el aspecto que va a marcar de forma notable el planteamiento del trabajo que se va a desarrollar en esta memoria. Un aspecto esencial dentro de la sociedad de la información son los datos. Basta pensar en los datos que podemos encontrar a partir de una simple inspección visual de un entorno urbano, los datos que generamos a partir del uso de los dispositivos móviles de comunicación o aquellos que publicamos e intercambiamos en las redes sociales. La mayoría de.
(10) estos datos son espaciales y disponemos de su geolocalización precisa dentro de la trama urbana. Por tanto, se puede decir que disponemos de una información geolocalizada que refleja el uso real que se le da al espacio y, en general, cómo se vive y percibe la ciudad. A partir del hecho de la digitalización de la ciudad, existe un creciente interés de los estudios urbanos en la comprensión del papel desempeñado por los medios sociales basados en la geolocalización y en el impacto de la disponibilidad de datos digitales de diferentes fuentes, como por ejemplo Twitter, Facebook, Foursquare, Instagram, Google Maps, OSM y otras [1]. Esta proliferación de información generada por habitantes ofrece beneficios potenciales tanto para la comunidad investigadora como para las administraciones públicas, que pueden utilizar los datos para el planeamiento y las analíticas de los usos del espacio urbano. Podemos resumir lo expuesto hasta el momento en dos ideas básicas: por un lado, las redes complejas han emergido como un modelo para entender, analizar y visualizar las características de los sistemas complejos, como por ejemplo las ciudades. Por otro lado, las ciudades constituyen una fuente de datos, tanto físicos como virtuales, que constituyen una parte esencial de la misma. Dentro de la teoría de redes, uno de los problemas fundamentales y en el que más se ha investigado en las últimas décadas es en el concepto de centralidad, es decir, en la posibilidad de disponer de ciertas medidas cuantitativas que nos determinen los nodos de la red que son más centrales o importantes dentro de la misma. La cuestión fundamental de este concepto es qué entendemos por "nodos importantes" dentro de la red. Podemos entender que un nodo en la red es importante si está conectado con un número elevado de nodos; también podemos entender que un nodo es importante si los nodos con los que está comunicado son importantes, o si está situado cerca de todos los nodos de la red. Inclusive podemos considerar un nodo importante si está en el paso de los caminos que unen el resto de los nodos. Como podemos ver, el concepto de centralidad es muy relativo, ya que según la aplicación o red estudiada, podemos considerar diferentes términos en los cuales viene expresada la propia importancia de un nodo. La información sobre qué nodo es el más central de la red puede ser vital en numerosos problemas de la vida real. Por ejemplo, determinar qué persona es más influyente en una red social, qué espacio en la ciudad adquiere mayor relevancia, qué vías de tráfico rodado se encuentran más transitadas o qué equipo de una red de servidores resulta más sobrecargado. Todas estas cuestiones requieren la aplicación de alguna de las medidas de centralidad. Existe una extensa bibliografía respecto al diseño e implementación de las medidas de centralidad en redes complejas. Pese al amplio abanico de medidas propuestas en las últimas décadas, centramos nuestra atención en un conjunto de ellas que podemos denominar "clásicas" por su importancia y su utilización generalizada. Éstas son la centralidad de grado [92], de cercanía [92, 188, 215], de intermediación [22, 91, 92] y las basadas en el estudio del vector propio dominante [50]. Todas estas medidas se diferencian en lo que entendemos por la importancia de un nodo; sin embargo, tienen una característica común como es que todas ellas se basan en la topología de la red como principal elemento. Este hecho significativo constituye la principal motivación que nos ha llevado a desarrollar esta memoria..
(11) Como hemos comentado anteriormente, modelizamos una ciudad mediante una estructura topológica como es la red primaria que representa el trazado urbano y consideramos datos físicos y virtuales geolocalizados como características esenciales de la ciudad. Por esta razón, la aplicación de medidas de centralidad que solamente contemplen la influencia de la topología de la red y no los datos geolocalizados, nos lleva a un escenario en el que no se refleja la realidad de lo que representan las ciudades hoy en día. Esto nos conduce a la necesidad de diseñar, analizar y visualizar nuevas medidas de centralidad en redes urbanas que tengan en cuenta la influencia de dos factores: por un lado, la topología de la red urbana y, por otro lado, los datos presentes en la misma. Y éste es precisamente el objetivo principal que fundamenta este trabajo. Existen un buen número de centralidades que funcionan muy bien en redes sociales, de transporte, espaciales, biológicas y químicas; sin embargo, en redes urbanas, es necesario considerar otros factores esenciales en las ciudades y propios de la sociedad de la información en la que vivimos. Dividimos esta memoria en las siguientes partes: en el primer capítulo describimos el contexto en el que se desarrolla esta investigación. Asimismo, introducimos los conceptos y propiedades básicas tanto de los grafos como de las redes complejas. Estudiamos el caso de las redes urbanas, que constituyen un caso particular de redes espaciales y, por último, motivamos el estudio de la centralidad en las redes urbanas que es lo que da sentido al objetivo fundamental de este trabajo. En el segundo capítulo diseñamos e implementamos las medidas de centralidad aplicadas a las redes urbanas basadas en el concepto de vector PageRank. En el tercer capítulo proponemos dos nuevas medidas de centralidad en redes urbanas con datos construidas a partir de la centralidad de intermediación. En el cuarto capítulo analizamos la centralidad basada en el concepto de vector propio y presentamos su adaptación a las redes urbanas con datos. Realizamos una breve comparativa entre las centralidades propuestas basadas en el vector propio dominante, destacando sus similitudes y diferencias en el capítulo cinco. Por último, en el capítulo seis resumimos las conclusiones y las líneas de trabajo futuro..
(12) Índice. Justificación y objetivos. V. 1. Introducción. 1. 1.1. 1.2.. La ciudad objeto de estudio Conceptos básicos sobre los grafos y las redes complejas 1.2.1. Introducción a los grafos 1.2.2. Características básicas de los grafos 1.2.3. Matrices asociadas a un grafo 1.2.4. Introducción a las redes complejas 1.2.5. Características básicas de las redes complejas 1.2.6. Tipologías de las redes complejas. 1 4 4 5 6 8 10 12. 1.3.. Las redes espaciales 1.3.1. Redes de transporte aéreo 1.3.2. Redes de transporte terrestre 1.3.3. Redes de suministro eléctrico 1.3.4. Internet Las redes urbanas 1.4.1. Grafo primario 1.4.2. Grafo dual y sus variantes El problema de la centralidad 1.5.1. Medidas de centralidad. 16 17 18 20 22 22 23 25 32 33. 1.5.2. Medidas de centralidad en redes urbanas con datos 1.5.3. Tipos de datos y su asignación a los nodos de la red. 39 40. 1.4.. 1.5.. 2. Aplicación del algoritmo PageRank en las redes urbanas 2.1.. 2.2.. El Vector PageRank 2.1.1. El modelo de clasificación PageRank 2.1.2. Ejemplo de cálculo del vector PageRank El Algoritmo APA IX. 43 43 44 48 51.
(13) Índice. X. 2.3.. 2.4.. 2.2.1. El modelo APA 2.2.2. Ejemplos de aplicación del algoritmo APA El algoritmo APAM-I 2.3.1. El modelo APAM-I 2.3.2. Ejemplos de aplicación del algoritmo APAM-I El algoritmo APAM-II 2.4.1. El modelo APAM-II 2.4.2. Ejemplo de aplicación del algoritmo APAM-II. 3. La centralidad de intermediación en las redes urbanas 3.1.. 3.2.. Las centralidades de intermediación y sus variantes 3.1.1. La centralidad Current Flow Betweenness 3.1.2. La centralidad Current Flow Betweenness generalizada 3.1.3. La centralidad Random Walk Betweenness 3.1.4. Ejemplo de Random Walk Betweenness Las centralidades de intermediación modificadas 3.2.1. La centralidad APARWB 3.2.2. Ejemplo de la centralidad APARWB 3.2.3. La centralidad RCFB 3.2.4. Ejemplos de la centralidad RCFB. 4. Aplicación de la centralidad de vector propio en las redes urbanas 4.1. 4.2.. Los índices de importancia de nodos en la red 4.1.1. La centralidad de vector propio La centralidad de vector propio en las redes urbanas 4.2.1. El modelo de centralidad de vector propio modificado 4.2.2. Ejemplos de aplicación del modelo CVPM. 51 56 66 66 69 76 76 77. 85 85 86 89 92 96 104 104 106 111 118. 127 127 129 131 131 133. 5. Comparativa de las centralidades basadas en el cálculo de vector propio dominante. 141. 6. Conclusiones y líneas de trabajo futuro. 149. Apéndice A.Conjuntos de datos y redes urbanas. 153. A.1. A.2.. Datos del sector terciario de Murcia Las redes urbanas analizadas. Bibliografía. 153 154 161.
(14) 1 Introducción. 1.1 La ciudad objeto de estudio Como introducción, planteamos una aproximación de la definición de la ciudad como objeto de estudio y contexto donde cobra sentido esta memoria. Debido a la naturaleza cambiante y evolutiva de la ciudad, su definición e interpretación también cambia y evoluciona según el ámbito o época desde la que se produce el enfoque. Por lo que precisar una única definición taxonómica resulta una simplificación inapropiada. Sin embargo, apoyándonos en antecedentes históricos y hechos contemporáneos podemos asimilarla como el compendio de urbs, civitas y polis. Sin seguir un orden cronológico, tendremos en primer lugar la urbs, el espacio construido por el hombre en un contexto caracterizado por la densidad demográfica, la diversidad sociocultural y funcional vinculada a un territorio en un ámbito geográfico. En segundo lugar la civitas, heredada de los romanos como una realidad social construida a partir de la figura del ciudadano, formulando un lugar productor de ciudadanía y ámbito de ejercicio de la misma. Y en tercer lugar la polis, surgida en la antigua Grecia y entendida como el lugar magno de celebración de las políticas administrativas. La ciudad nos pertenece y a ella pertenecemos, nuestra forma de vida, nuestra forma de ciencia, nuestra forma de filosofía, están representadas en ella. En definitiva es un objeto de estudio porque es la consecuencia de aquello que los hombres somos y producimos en la ciencia, en el arte, en las relaciones comerciales, sociales, económicas, y que constituye en el amplio sentido de la palabra el espacio soporte en el que se van construyendo las facetas de nuestra cultura. Una mirada atenta al devenir de la ciudad a lo largo del tiempo, y a sus estudiosos, nos permite acceder a aquellos conceptos que se han ido formulando para explicar qué es la ciudad. La ciudad va a ser abordada en distintas escalas, en las diversas facetas que presenta. Desde las disciplinas sociológicas se ha llevado a estudio la ciudad como fortaleza y mercado en la obra de Weber [218], como fábrica y lugar de lucha entre clases sociales en la obra de Marx y Engels [83, 98], como "derecho a la vida urbana, transformada y renovada" en la obra Derecho a la Ciudad de Harvey [110,111], como fuerza productiva y elemento central en el modo de producción capitalista en la obra de Lefebvre [147], como 1.
(15) 2. Capítulo 1. Introducción una visión actualizada de Marx y Engels en los trabajos de Castells [65], y finalmente la ciudad como la expresión del espacio colectivo en la obra de Borja [55]. Entre estos autores que estudian diversas facetas propias de la ciudad, el denominador común a todas las interpretaciones es que la ciudad no es un objeto sino que es un proceso temporal [90]. Según Lefebvre: "City space is the product of a temporal process. Time is known and actualized in space, becoming a social reality by virtue of spatial practice" [148]. Como resumen, podemos decir que la ciudad es el producto más complejo fabricado por el hombre, una realidad dinámica que da forma a la sociedad, información, espacio y tiempo. Los datos presentados en World Population Review en enero del año 2018 indican que el 54 % de la población mundial vive y trabaja en las ciudades. Otras fuentes, como por ejemplo la base de datos del Banco Mundial, estiman que para el año 2050 este porcentaje excederá el 70 %. El crecimiento de las ciudades es una realidad. La Revolución Industrial en el siglo XIX desencadenó migraciones de la población del campo a la ciudad y un proceso acelerado de urbanización que ha ido transformando el territorio rural adyacente. En el curso de la evolución de los asentamientos humanos, la urbanización constituye una piedra angular para el desarrollo económico, que a su vez constituye un atractivo poderoso para la población que se ve seducida por la oferta de oportunidades de un trabajo mejor, garantías en la educación, y en general, una mejor calidad de vida. El crecimiento de la ciudad justifica el desarrollo del espacio en el que interactúan infraestructura y sociedad, donde se desarrollan de forma intensiva las actividades humanas, se concentran los poderes civiles y religiosos y los centros de producción, el punto de encuentro e intercambio del conocimiento y la cultura. La configuración espacial y los procesos sociales que tienen lugar en las ciudades son la prueba del tópico de la extraordinaria complejidad que promueve el atractivo para diversos ámbitos de la ciencia, humanidades, ingenierías y arquitectura. Citando a Jacobs, "las ciudades han llegado a ser problemas de complejidad organizada como la ciencia de la naturaleza", que no solo contienen una gran cantidad de variables, sino que también presentan innumerables interrelaciones entre las variables [121]. Jacobs también sugiere que cada interacción entre forma y uso probablemente no sea única ni tampoco determinista. Para analizar la ciudad y su pertinente información hemos de elaborar modelos discretos que permitan ordenar toda la información relacionada con el conjunto de acontecimientos seleccionados de acuerdo a un determinado tipo de análisis. El objetivo de los modelos discretos es simplificar la complejidad del sistema urbano haciendo incidir en aquellos aspectos más relevantes para el estudio en concreto. Probablemente, el modelo tradicionalmente más utilizado para el análisis de la ciudad es el plano bidimensional que describe la geometría y los atributos del espacio urbano. Los planos son herramientas muy versátiles, en el sentido de que proporcionan la información de tal forma que los profesionales de diferentes disciplinas son capaces de interpretar sin dificultad alguna. Sin embargo, para representar toda la complejidad urbana los planos no son suficientes puesto que omiten datos de carácter relacional y temporal [95]. Para organizar las relaciones del espacio y tiempo hemos de utilizar modelos alternativos al plano..
(16) 1.1 La ciudad objeto de estudio La forma de tratar la complejidad de la ciudad surge en la década de los años 60 del siglo pasado a raíz de los estudios realizados por Haken [105, 106] y Prigogine [179, 180] sobre los sistemas físicos que exhibían fenómenos de emergencia y auto-organización. Sus teorías se convirtieron en un paradigma general aplicado a una variedad de campos que abarcaban desde la física, las ciencias naturales, las ciencias sociales y el estudio de las ciudades entre otros [177, 178]. El vínculo entre las teorías de la complejidad y el estudio de las ciudades se estableció cuando Prigogine se refería a la ciudad como un ejemplo metafórico por el cual transmitir su noción de estructuras disipativas a sus colegas físicos. Más tarde, Allen [20] tomó en serio esta metáfora de la ciudad y reformuló la idea sobre el centro de la ciudad en términos de complejidad. Los estudios de las ciudades como sistemas complejos de auto-organización crecieron exponencialmente cuando los estudiosos de las ciudades y del urbanismo se sintieron atraídos por el nuevo paradigma de la complejidad y la auto-organización [178]. Como resultado de numerosas investigaciones surgieron diferentes modelos para tratar la complejidad urbana: modelos basados en autómatas (cellular automata), sistemas basados en agentes (agent based models) y mapas auto-organizativos (self-organizing maps). Cada uno de ellos tiene un propósito concreto y se centra en un aspecto específico de la complejidad de la ciudad. Por ejemplo, los modelos basados en los autómatas celulares, ampliamente estudiados por Batty [31, 32], y los mapas auto-organizativos [138, 150] que estiman la evolución de la ciudad, mientras que los sistemas basados en los agentes (véase [70, 114]) nos permiten interpretar el comportamiento temporal del sistema resultante a partir de la simulación de las acciones individuales de los agentes y, de esta manera, proporcionan un buen banco de pruebas para el desarrollo de modelos para las ciudades. Otro modelo analítico para tratar la complejidad de la ciudad es el modelo de las redes (o grafos, desde el punto de vista estrictamente matemático). Las redes discretizan el espacio urbano, estableciendo la relación material o inmaterial entre los objetos tomados como nodos de la red. Las posibilidades de las redes son muy amplias dado que permiten estudiar aspectos dinámicos y estáticos de la ciudad. Al mismo tiempo que se establecían las teorías de la complejidad, Alexander escribió el trabajo denominado La ciudad no es un árbol [18], donde trataba la complejidad de la ciudad mediante una red. Su trabajo sirvió como ejemplo e inspiración para la disciplina de arquitectura, y para otros estudiosos de la ciudad. El interés especial de la aplicación de la teoría de redes en las ciudades apareció a principios de los años 80 de la mano de Hiller y sus colegas del laboratorio Space Syntax [115, 116], realizando estudios de accesibilidad, proximidad, conectividad y centralidad de los espacios urbanos mediante los denominados mapas axiales. La consolidación de las redes como modelo de análisis de la ciudad se hizo a finales de la primera década de este siglo, mediante los trabajos realizados por Jiang [124, 126], donde se estudian los patrones topológicos de redes urbanas, Okabe [166] que estudia sus aspectos computacionales y Porta [72, 175, 176], que introduce las centralidades características en este contexto. A día de hoy los avances tecnológicos, Internet y la telefonía móvil, junto con nuevos descubrimientos científicos en la ciencia de las redes, son los proveedores de los fundamentos para nuevas aproximaciones innovadoras al estudio del fenómeno urbano y nos ayudan a entender la complejidad de una manera más efectiva [174].. 3.
(17) 4. Capítulo 1. Introducción. 1.2 Conceptos básicos sobre los grafos y las redes complejas El objetivo de esta sección consiste en introducir los conceptos básicos de las redes complejas necesarios para entender el contenido de la investigación presentada en esta memoria. 1.2.1. Introducción a los grafos. La teoría de grafos es la base matemática en la que se fundamenta la ciencia de las redes complejas; por tanto, antes de profundizar en este tema introducimos los aspectos esenciales de la teoría de grafos. El comienzo de la teoría de grafos se asocia con el artículo publicado por Euler en 1736, que se denominaba Solutio problematic as geometriam situs pertinentis (La solución del problema relacionado con la teoría de posición) [86]. En este artículo Euler proporcionaba la solución al conocido problema de los puentes de Königsberg (actual Kaliningrado), esquematizado en la figura 1.1 (a). El problema consistía en demostrar si era posible encontrar una ruta en la ciudad que recorriera los siete puentes, cruzando cada uno de ellos una única vez y regresando al punto de partida. Euler demostró que no era posible. c. C. d. g. C c. g. d A. e. D. e. A b. a. B. b (a). f. D f. a B (b). Figura 1.1 Esquema de los siete puentes de Königsberg (a) y su correspondiente grafo (b). Un aspecto destacable de este trabajo es, además de la propia solución del problema, el planteamiento y representación del problema de los siete puentes. La representación utilizada se corresponde con lo que ahora se conoce como grafo. En la figura 1.1 (b) puede verse el grafo resultante de los siete puentes de Königsberg. Otro aspecto a considerar es que Euler demostró que algunos problemas del mundo real pueden resolverse mediante herramientas distintas de las clásicas basadas en la geometría o el cálculo, atendiendo a las relaciones topológicas entre objetos. Como consecuencia de este trabajo nació una nueva rama de las matemáticas denominada teoría de grafos. Un siglo más tarde, en 1847, Kirchhoff utilizó la teoría de grafos para el análisis de redes eléctricas y el cálculo del voltaje y la corriente en los circuitos eléctricos, publicando sus leyes, conocidas como leyes de Kirchhoff [135]. Su trabajo puede estar considerado como la primera aplicación de la teoría de grafos a un problema de ingeniería. Un análisis más detallado de la teoría de grafos, desde 1736 hasta 1936, puede consultarse en el trabajo de Biggs [43]..
(18) 1.2 Conceptos básicos sobre los grafos y las redes complejas Un grafo es un par ordenado que está formado por un conjunto finito de entidades de dimensión cero denominados vértices o nodos y un conjunto finito de entidades de una dimensión denominadas arcos o aristas, cada una de las cuales conecta una pareja de nodos (no necesariamente distintos). Los grafos pueden ser dirigidos y no dirigidos. Los grafos dirigidos se denominan digrafos y son aquellos en los que aristas tienen un sentido definido. Los grafos también pueden ser ponderados o sin ponderar. Los grafos ponderados son aquellos en los que a cada arista se le asocia un peso. 1.2.2. Características básicas de los grafos. Para empezar, es importante señalar el siguiente criterio de notación que utilizaremos a lo largo de toda la memoria. Denotamos, en general, un grafo G por G = (V(G), E(G)) con n nodos dados por V (G) = {1,2,3, . . . ,n} y m aristas dadas por E(G) = ei j | i, j ∈ V (G) . En ocasiones, por simplificar la notación y siempre que no admita confusión, utilizaremos la notación E(G) = {e1 ,e2 ,e3 , . . . ,em } para referirnos al conjunto de aristas del grafo. Dentro del análisis de los grafos, numerosos estudios están relacionados con el análisis de sus caminos y ciclos. Un camino o una ruta es una sucesión de aristas que conectan una pareja de nodos, siendo la longitud del camino el número de aristas que contiene. Un ciclo es un camino que empieza y acaba en el mismo nodo. Los ciclos de longitud uno se denominan bucles. Entre los diversos tipos de caminos existentes en un grafo cabe destacar el camino simple y el camino geodésico. Un camino simple es aquel que no repite nodos en su recorrido y camino geodésico, denotado por li j , es el camino simple entre los nodos i y j de menor longitud. En la literatura los caminos geodésicos reciben también el nombre de caminos más cortos o caminos euclidianos. Entre las propiedades de grafos cabe destacar algunas de sus invariantes: número de componentes conexas, número de cliques, diámetro y densidad. Una componente conexa de un grafo es un subgrafo en el que cada pareja de nodos tiene al menos un camino simple entre ellos. Entendiendo por subgrafo de un grafo G como un grafo G0 tal que V (G0 ) ⊆ V (G) y E(G0 ) ⊆ E(G). Una clique en un grafo es un conjunto de nodos tal que para cada nodo existe una arista que los conecta. En otras palabras, es un subgrafo de G en el que cada nodo está conectado con los n − 1 nodos restantes. El diámetro de un grafo, que denotamos por d, es la longitud de un camino geodésico de mayor longitud. Finalmente la densidad de grafo, denotada por ρ, es la relación de número de aristas que tiene el grafo con respecto al numero de aristas de un grafo completo, se expresa como ρ=. 2m , n(n − 1). (1.1). donde n y m son el número de nodos y el número de aristas, respectivamente. Una de las propiedades más importantes de los nodos es su grado. Por grado de un nodo i, denotado por ki , se entiende el número de aristas incidentes al mismo. Para los digrafos se suele distinguir entre el grado de entrada ki+ , como el número de aristas que entran en i, y el grado de salida ki− , como el número de aristas que salen de i, de forma que ki = ki+ + ki− .. (1.2). 5.
(19) 6. Capítulo 1. Introducción Cabe destacar el lema probado por Euler en [86], cuyo resultado se conoce como el lema del apretón de manos. Para digrafos, el lema se expresa como n. n. i=1. i=1. ∑ ki+ = ∑ ki− = m,. (1.3). mientras que para grafos no dirigidos se expresa como n. ∑ ki = 2m,. (1.4). i=1. donde m es el número de aristas del grafo. Como consecuencia de este lema, el grado medio del grafo, denotado por hki, viene dado por la expresión hki =. 1.2.3. 1 n 2m ∑ ki = n . n i=1. (1.5). Matrices asociadas a un grafo. Además de la representación gráfica de los grafos, como por ejemplo la de la figura 1.1 (b), nos interesa especialmente su representación algebraica, ya que ésta nos permite llevar a cabo los cálculos necesarios para estudiar sus propiedades. Dicha representación algebraica se basa en un conjunto de matrices que analizamos brevemente a continuación. Entre los diversos tipos de matrices que podemos asociar a un grafo, se explican las más representativas y aquéllas que vamos a utilizar en esta memoria. La primera matriz que vamos a ver es una matriz binaria denominada matriz de adyacencia que representa la conectividad de los nodos del grafo. La matriz de adyacencia asociada al grafo G se denota por A = ai j ∈ Rn×n y viene dada por la expresión ai j =. 1 si existe ei j ∈ E(G), 0 caso contrario,. (1.6). donde 1 ≤ i, j ≤ n. En el caso de un grafo ponderado la matriz de adyacencia Aw = ai j ∈ Rn×n no es binaria y se expresa como w(ei j ) si existe ei j ∈ E(G), ai j = (1.7) 0 caso contrario, donde 1 ≤ i, j ≤ n y w(ei j ) ∈ R es el peso asociado a la arista ei j . A partir de la matriz A es fácil comprobar si se trata de un grafo o un digrafo, dado que para un grafo no dirigido la matriz de adyacencia es simétrica. Otra utilidad de esta matriz es que nos permite determinar de forma directa el grado que tiene cada nodo, ya que la suma de las componentes de la fila i-ésima de la matriz de adyacencia coincide con el.
(20) 1.2 Conceptos básicos sobre los grafos y las redes complejas grado del nodo i, es decir. n. ki = ∑ ai j .. (1.8). i=1. La segunda matriz binaria de tamaño n × m que podemos asociar al grafo es la matriz de incidencia denotada por B = bi j ∈ Rn×m . En esta matriz las filas representan a los nodos y, a diferencia de la matriz de adyacencia, las columnas representan a las aristas del grafo. La matriz B asociada al grafo no dirigido G se define como la matriz donde 1 si e j ∈ E(G) es incidente en i ∈ V (G), bi j = (1.9) 0 caso contrario, con 1 ≤ i ≤ n y 1 ≤ j ≤ m. Para el caso de digrafos la matriz B se define como si e j ∈ E(G) sale de i ∈ V (G), 1 −1 si e j ∈ E(G) entra en i ∈ V (G), bi j = 0 caso contrario,. (1.10). donde 1 ≤ i ≤ n y 1 ≤ j ≤ m. Una propiedad importante de esta matriz es su rango, que es igual a n − 1. Esto significa que solamente son necesarias n − 1 filas de vectores de esta matriz para definir el grafo correspondiente. Otra matriz de importancia que se utiliza con frecuencia en teoría de grafos es la matriz de grados, que se denota por ∆ = δi j ∈ Rn×n . Es una matriz diagonal de tamaño n, donde sus elementos son los grados de los nodos, es decir ki para i = j, δi j = (1.11) 0 para i 6= j. Si se trata de un grafo ponderado, la matriz de grado denotada por ∆w = δi j ∈ Rn×n , tiene en su diagonal los elementos que representan a la suma de los pesos de las aristas incidentes en los nodos. Los elementos de esta matriz vienen datos por ki ∑ j=1 w(ei j ) para i = j, (1.12) δi j = 0 para i 6= j. Las tres matrices de adyacencia, incidencia y la del grado guardan cierta relación entre ellas. Por ejemplo, para un grafo no ponderado, dada su matriz de incidencia y la del grado, podemos calcular su correspondiente matriz de adyacencia mediante la expresión A = BBT − ∆.. (1.13). En cambio, para el caso de un grafo ponderado la matriz de adyacencia Aw se calcula como Aw = BΩBT − ∆w , (1.14). 7.
(21) 8. Capítulo 1. Introducción donde Ω = (ωi j ) ∈ Rm×m es matriz diagonal cuyos elementos representan los pesos asociados a las arista, es decir w(ei ) para i = j, ωi j = (1.15) 0 para i 6= j. La matriz Laplaciana, es otra matriz de gran interés para la representación de grafos. De hecho, la teoría espectral de grafos está directamente relacionada con las propiedades espectrales de esta matriz. La matriz Laplaciana, también conocida como la matriz de Kirchhoff, se denota por L = (li j ) ∈ Rn×n y se define como L = ∆ − A = BBT − 2A,. (1.16). para grafos no dirigidos, mientras que para digrafos se define como L = BBT . Definida de esta forma, las componentes de esta matriz vienen dadas por para i = j, ki −1 para i 6= j y si existe ei j ∈ E(G), li j = 0 otro caso.. (1.17). (1.18). Cabe destacar las siguientes propiedades de esta matriz asociada a un grafo no dirigido. • La matriz L es simétrica y diagonal dominante. • La matriz L es singular y semidefinida positiva, es decir, existe un valor propio igual a 0 y el resto de valores propios son positivos. • La dimensión del espacio nulo (núcleo) de L y la multiplicad algebraica del valor propio λ = 0 indican el número de componentes conexas del grafo. • El primer valor propio mayor que 0 es el denominado spectral gap. El segundo valor propio mayor que 0 representa la conectividad algebraica del grafo. Su vector propio asociado es el denominado vector de Fiedler cuyas componentes nos permiten dividir el grafo en dos componentes conexas. Para un estudio más profundo sobre los grafos y las matrices asociadas a los mismos, véase [100, 210, 213]. Una vez introducidos los conceptos básicos y las matrices asociadas a los grafos, comentamos brevemente algunas características de interés de las redes complejas. 1.2.4. Introducción a las redes complejas. Para empezar, es importante destacar las diferencias que existen entre las redes y los grafos. Podemos decir que la ciencia de redes o teoría de redes complejas es la aplicación práctica de la teoría de grafos a los problemas físicos reales. En redes, los nodos abstractos del grafo adquieren un significado específico y las aristas representan las relaciones concretas que se establecen entre los objetos tomados como nodos..
(22) 1.2 Conceptos básicos sobre los grafos y las redes complejas El concepto de una red es muy intuitivo en la sociedad moderna. En cuanto vemos o pensamos en esta palabra, imaginamos un grupo de elementos relacionados entre sí. Sin duda alguna, numerosos sistemas identificados en la naturaleza pueden describirse en los términos de las redes complejas. Podemos decir que la red es una representación simplificada de un sistema complejo que captura el patrón y dinámica de relaciones entre unos objetos dados. Entre los numerosos ejemplos de redes cabe mencionar el cerebro que es una red de neuronas conectadas mediante las sinapsis, Internet como una red de enrutadores conectados entre sí, los actores, directores y productores de cine forman parte de una red, la economía mundial es una red de las economías nacionales, que a su vez son redes de mercados, las relaciones entre las palabras e incluso las estrategias adoptadas para resolver los problemas matemáticos también pueden estar interpretados en términos de las redes. Así, cuando hablamos de redes nos referimos a una amplia variedad de estructuras cuyas entidades están representadas por los nodos y las relaciones entre esos elementos se representan en la red mediante enlaces o aristas entre estas entidades. En consecuencia, las aristas admiten muy diversas representaciones. En la tabla 1.1 describimos algunas redes físicas o virtuales y cómo pueden ser representadas mediante grafos, especificando sus nodos y aristas. Tabla 1.1 Diversos ejemplos de redes. Red compleja Redes en bioquímica Redes epidemiológicas Redes eléctricas Redes colaborativas Redes Sociales Cerebro World Wide Web Internet. Nodos Moléculas Individuos infectados Subestaciones de distribución y transmisión Científicos, ingenieros Personas Neuronas Páginas o sitios web Enrutadores. Aristas Reacciones químicas Contactos infecciosos Líneas de tensión Colaboraciones entre individuos Amistad, relación social Conexiones sinápticas Hiperenlaces Líneas de comunicación. Éstos son solo algunos ejemplos de los muchos que existen, puesto que vivimos en un "mundo conectado", donde todo está relacionado con todo lo demás [26]. Caracterizar, describir y extraer información de un sistema complejo es un problema esencial en la teoría de redes, por lo que su estudio atrae la atención de científicos de campos tan diversos como las ingenierías y arquitectura, biología, química, economía, sociología. Uno de sus objetivos principales consiste en extraer las propiedades emergentes del sistema complejo con el fin de comprender su funcionalidad. Desde la aparición de la teoría de grafos en 1736 hasta los años 50 del siglo pasado, el modelado de muchos sistemas complejos se realizaba partiendo de la hipótesis de que los patrones de interacción entre los elementos del sistema podían ser definidos mediante los modelos primitivos, como por ejemplo los grafos simples o los grafos regulares. A finales de 1950, los matemáticos Erdös y Rényi contribuyeron de una forma significativa a la teoría clásica de grafos. Su contribución consistía en introducir el modelo de grafos aleatorios para abordar los sistemas complejos, estableciendo así, la base de la teoría de redes aleatorias [84]. Es indudable que los sistemas complejos en la naturaleza no. 9.
(23) 10. Capítulo 1. Introducción son íntegramente regulares, ni tampoco íntegramente aleatorios. Sin embargo, el modelo de redes aleatorias fue el único enfoque que por su rigor trazó una nueva dirección en el pensamiento científico de las redes complejas seguida durante varias décadas del siglo XX. El siguiente avance en la teoría de redes complejas sucede a finales de la década de 1960 y en la década de 1970 cuando los sociólogos utilizaron la teoría de grafos para modelar las redes sociales y estudiar el comportamiento de los grupos de individuos. El sociólogo Milgram realizó un experimento denominado el problema del mundo pequeño probando que existe una media de seis conexiones de amistad entre cualesquiera dos personas en el mundo, independientemente de lo lejanas que estén estas personas [206]. A partir de este experimento se introdujo el llamado principio de seis grados de separación que inspiró numerosos estudios realizados en el campo de las redes sociales. Casi tres décadas más tarde, en 1998, con el propósito de describir la transición de una red regular a una red aleatoria, Watts y Strogatz introdujeron el concepto de red de mundo pequeño [217]. Los autores probaron que el patrón del mundo pequeño está presente en muchas redes de la vida real. Sus trabajos permitieron comprender cómo y por qué ocurre la sincronización de redes en sistemas físicos y biológicos. Por ejemplo, explican las condiciones para llegar a un consenso por parte de un grupo de personas, la mejor forma de llevar a cabo campañas de mercado de productos y cómo las corporaciones se convierten en un monopolio. La última contribución significativa en el ámbito de las redes complejas se llevó a cabo con los trabajos realizados por Barabási [16, 17, 25]. El autor introdujo una nueva línea de investigación con la invención de las redes libres de escala: redes no aleatorias dotadas de concentradores (conocidos como hubs). En una serie de estudios sobre la estructura de Internet y la World Wide Web (WWW), Barabási y sus estudiantes descubrieron una propiedad emergente de estas redes. La propiedad descubierta consistía en que, sin planificación central o de forma deliberada, un número pequeño de sitios eran extremadamente populares denominados hubs, mientras que la mayoría de ellos apenas recibían enlaces desde otros sitios. En lugar de ser aleatoria, como por ejemplo la red de Erdös y Rényi, la topología de Internet no era nada aleatoria. Concretamente, la probabilidad de que una página Web tenga k enlaces obedece a ley de la potencia, es decir, decae de forma exponencial a medida que aumenta el valor de k. Barabási explicó este fenómeno mediante la regla que denominó enlace preferencial (preferential attachment). Esta regla establece que la probabilidad de que un sitio obtenga un nuevo enlace es directamente proporcional a la cantidad de enlaces que ya tiene. Por tanto, cuanto más popular sea el sitio, más enlaces nuevos obtendrá. 1.2.5. Características básicas de las redes complejas. Una vez introducido el concepto de las redes completas y los puntos claves de su evolución histórica, veamos algunas de sus características básicas. Cabe destacar que, debido a la alta complejidad de las redes reales, no se han encontrado todavía caracterizaciones completas de las mismas, es decir, en la actualidad todavía no disponemos de un conjunto de medidas que caractericen por completo a cada red (algo así como un código genético que nos permita con absoluta precisión establecer comparaciones entre ellas). Sin embargo, aunque no dispongamos de medidas absolutas que caractericen.
(24) 1.2 Conceptos básicos sobre los grafos y las redes complejas las redes, es necesario establecer una serie de medidas o conceptos que cumplan un papel importante en su estudio. Dichos conceptos y medidas cuantitativas básicas en las redes son: • Longitud característica. • Coeficiente de agrupamiento. • Distribución de grado. Longitud característica El estudio de la longitud de caminos en la red es similar al del estudio de los caminos de mínima distancia entre los nodos de un grafo. En este sentido, la longitud característica o también denominada longitud media de caminos en la red, denotado por hli, se define como la media aritmética de las longitudes de caminos geodésicos entre todos los pares de nodos, es decir, la distancia típica que separa cualquier pareja de nodos en la red. Se expresa como n n−1 2 (1.19) hli = ∑ ∑ li j , n(n − 1) i=1 j=1 donde n es el número total de nodos en la red. Coeficiente de agrupamiento En una red social es muy probable que amigos de algún individuo también tengan relación de amistad entre ellos. Esta propiedad se refiere a la agrupación de nodos en la red. Más precisamente, podemos definir el coeficiente de agrupamiento (mencionado en la literatura también como clustering coefficient) de un nodo i, denotado por Ci , como la proporción media de pares de vecinos de i que también son vecinos entre sí. Definido de esta forma, se expresa como 2gi Ci = , (1.20) ki (ki − 1) donde gi es el número de enlaces que existen entre los nodos adyacentes a i. Por ejemplo, en un grafo completo cualquier nodo tendría un valor máximo de 1, mientras que los nodos de un árbol (grafo sin ciclos) tendrían un valor mínimo igual a 0. También podemos definir el coeficiente de agrupamiento global de una red, denotado por hCi, que es la media aritmética de todos los coeficientes Ci de los nodos, es decir hCi =. 1 n ∑ Ci , n i=1. (1.21). donde n es el número total de nodos en la red. Este coeficiente mide el efecto de mundo pequeño en las redes y fue introducido originalmente a partir de los trabajos de Watts y Strogaltz publicados en 1998. Distribución de grado Una característica importante de las redes es su distribución de grado, que proporciona la información sobre la topología de las mismas. Si se calculara la frecuencia de nodos. 11.
(25) 12. Capítulo 1. Introducción que corresponden a cada grado se obtendría una distribución estadística de grado. Más concretamente, la distribución de grado de los nodos en una red viene dado por la función estadística de distribución P(k), que es la probabilidad de que un nodo seleccionado al azar tenga exactamente k enlaces. Si nk representa el número de nodos de grado k, entonces la distribución P(k) viene dada por la expresión P(k) =. nk , n. (1.22). donde n es el número total de nodos en la red. La expresión (1.22) suele utilizarse para construir gráficos para representar la frecuencia de grado, aunque en muchas ocasiones será más apropiado el uso de la escala logarítmica de esta función para incidir en los aspectos cualitativos de la distribución estadística. Es importante destacar que esta característica de las redes no nos proporciona la información total sobre la estructura de las mismas, sin embargo es de gran utilidad, sobre todo, para realizar sus clasificaciones tipológicas. 1.2.6. Tipologías de las redes complejas. Desde los años 50 del siglo pasado se han realizado numerosos trabajos tratando de identificar y clasificar estructuras en sistemas naturales. Entre ellos podemos destacar los llevados a cabo por Erdös, Rényi, Watts, Strogatz y Barabási, que han ayudado a identificar diferentes tipos de redes artificiales y las presentes en la naturaleza. Más concretamente, estamos hablando de redes regulares, aleatorias, de mundo pequeño y libres de escala. A continuación, se describe brevemente cada una de las tipologías. Redes regulares Entre todas, probablemente la tipología más intuitiva es la de una red regular. Podemos definir una red regular como la que presenta una estructura de grafo regular, es decir, un grafo cuyos nodos repiten el mismo patrón de enlaces. Dentro de esta tipología cabe destacar sus dos variantes: red completa y red regular de grado k. Una red completa de n nodos tiene exactamente n(n − 1)/2 aristas. Definida de esta forma, cualquier nodo de esta red está conectado con todos los demás. La topología de esta red exhibe una propiedad interesante, verificando que hCi = hli = d = 1. Las redes regulares de grado k son aquellas en las que todos los nodos tienen el mismo grado k, con 1 < k < n − 1. Por lo general, tienen un alto coeficiente de agrupamiento y longitud característica. Las redes regulares son de gran interés, dado que tienen muchas aplicaciones relacionadas con el estudio de las redes complejas. Sirven como referencia de contraste para las redes aleatorias, las redes regulares de grado k son la base de los procedimientos generadores del mundo pequeño. Además, las propiedades de las redes regulares son importantes en el estudio de la sincronización de redes arbitrarias [149]. Redes aleatorias Las redes aleatorias son de las más antiguas. Su estudio alcanzó gran prominencia gracias al trabajo fundamental de Erdös y Rényi. Escribieron diversos artículos entre 1959 y 1968 en los que combinaban la teoría de la probabilidad con la teoría de grafos. Esto dio origen a lo que llamamos teoría de redes aleatorias..
(26) 1.2 Conceptos básicos sobre los grafos y las redes complejas Esta tipología no es representativa para las redes presentes en la naturaleza. De hecho, en realidad sucede lo contrario; la mayoría de los sistemas físicos y biológicos no están organizados totalmente al azar, sino que, por lo general, se estructuran siguiendo un proceso determinista. Entonces, ¿cuál es el sentido de estas redes? Podemos decir que las redes aleatorias sirven de referencia básica para la comparación con redes estructuradas (redes de mundo pequeño y redes libres de escala). Por tanto, antes de preguntarnos en qué difiere una red natural de una red aleatoria, primero debemos comprender las propiedades de las redes aleatorias. Una red aleatoria consiste en una red de n nodos donde cada pareja de nodos se conecta con una probabilidad p. Según el modelo utilizado, existen básicamente dos definiciones. El primer modelo desarrollado por Erdös y Rényi, conocido en literatura como el modelo G(n,m), es aquel en el que se establece un número fijo para n nodos y otro número fijo m para aristas aleatoriamente distribuidas. El segundo modelo, denominado G(n,p), fue originalmente introducido por Solomonoff y Rapoport en [200], y ha sido ampliamente explotado en los trabajos de Erdös y Rényi. En el modelo G(n,p), en lugar de fijar el número de aristas m, se fija su probabilidad p. Podemos decir que este modelo es más utilizado en la comunidad científica, dado que proporciona una forma más sencilla para calcular las propiedades de los grafos generados. En una red aleatoria siguiendo el modelo G(n,p), la probabilidad de que un nodo i tenga exactamente k conexiones obedece a la distribución dada por n−1 k P(k) = p (1 − p)n−1−k , (1.23) k donde n−1 representa el número de formas en que podemos seleccionar k conexiones k de n − 1 posibles, pk representa la probabilidad de tener k aristas desde i y (1 − p)n−1−k representa la probabilidad de que las restantes (n − 1) − k aristas no se produzcan. Podemos ver que la distribución de grados P(k) en (1.23) sigue la distribución binomial. Sin embargo, para valores mayores que k, esta distribución binomial se aproxima mediante una distribución de Poisson, dada por la expresión P(k) = e−hki. hkik , k!. (1.24). donde hki representa el grado medio de la red. Entre las propiedades más representativas de este tipo de redes, cabe destacar su coeficiente de agrupamiento hCi, el grado medio hki, la longitud característica hli y el diámetro d. El coeficiente hCi se aproxima a la densidad dada por ρ = hki/n, el grado medio hki es similar a ρn, la longitud hli viene dada por ln(n)/hki y en cuanto al diámetro, podemos decir, que éste disminuye rápidamente con un pequeño aumento de la densidad ρ. Modelo de mundo pequeño Las redes de mundo pequeño están estrechamente relacionadas con el fenómeno previamente comentado de los seis grados de separación, conocido a partir de los trabajos de Milgram. La característica fundamental de estas redes es que todo nodo puede ser alcanzado desde un nodo cualquiera en un pequeño número de pasos. Esto implica que la longitud. 13.
(27) 14. Capítulo 1. Introducción media hli de estas redes es muy pequeña en relación al tamaño de la red. Concretamente, crece proporcionalmente al logaritmo del número de nodos, es decir hli ∝ log(n).. (1.25). Es importante destacar que estas redes guardan estrecha relación con las redes regulares donde la distancia característica también es muy baja. Sin embargo, las redes regulares no poseen el coeficiente de agrupamiento elevado, que es característico de las redes de mundo pequeño. Watts y Strogatz en su trabajo de transformación de una red regular en una aleatoria introdujeron un interesante modelo para generar las redes de mundo pequeño a partir de una red regular de grado k. Su modelo comprende dos pasos. El primero consiste en generar un retículo regular en forma de anillo en el que cada nodo está conectado con un número par de vecinos en sentido horario y luego repetir este procedimiento en sentido antihorario. De esta forma se obtiene una red homogénea (véase [85]) con un elevado valor de hCi y una elevada distancia entre cualquier pareja de nodos. Para resolver el problema de las elevadas distancias entre nodos, obteniendo así el efecto de mundo pequeño, Watts y Strogatz en el segundo paso del procedimiento reconectan con cierta probabilidad p los enlaces de los vecinos directos con los indirectos. Al seguir este procedimiento las propiedades de la red regular no se alteran significativamente; sin embargo, la distancia característica decrece de forma notable. La red aleatoria obtenida a partir de este procedimiento presenta las características de mundo pequeño. Además, sus nodos tienen un grado similar, es decir, presentan muy baja desviación típica de grado medio. Las redes de mundo pequeño tienen su origen en las redes sociales, donde la mayoría de los individuos comparten sus amistades. Estas redes tienden a contener camarillas y camarillas cercanas, es decir, subredes que tienen conexiones entre casi todos sus nodos dentro de ellas. Pensemos en una red con nuestros amigos, en la que podemos tener distintas camarillas o subgrupos como los amigos del trabajo, los amigos de la universidad, los amigos del colegio y la infancia, los padres y madres de nuestros hijos, etc. Entre estos grupos las asociaciones y conexiones son muy altas y se forman pequeños hubs que caracterizan la red. Esto se desprende de la propiedad definitoria de un alto coeficiente de agrupamiento presente en redes de mundo pequeño. Existe un índice para determinar si una red se encuentra dentro de la tipología de mundo pequeño. Dicho coeficiente, denotado por σ , se calcula comparando el coeficiente de agrupamiento hCi y la distancia característica hli de una red dada respecto de su equivalente red aleatoria con el mismo grado y distancia característica, es decir, σ=. hCihlr i . hCr ihli. (1.26). Si el valor de σ resultante es mayor que uno, entonces la red es de tipo de mundo pequeño. Redes libres de escala Una característica común de las redes regulares, aleatorias y de tipo de mundo pequeño es su homogénea distribución de grado. Sin embargo, se ha comprobado que un cierto número de sistemas complejos comparten una propiedad y es que algunos de sus nodos.
(28) 1.2 Conceptos básicos sobre los grafos y las redes complejas tienen un gran número de conexiones con otros nodos, mientras que el resto de los nodos tienen una conexión muy escasa con el resto. La enorme desproporcionalidad que hay entre los nodos populares (hubs con millones de conexiones) y el resto de los nodos hace que la red pierda la escala concreta. El conocimiento sobre este tipo de redes sin escala tiene implicaciones importantes en la comprensión del comportamiento de muchos sistemas complejos de gran tamaño. Por ejemplo, la expansión de los virus de ordenador o la transmisión de enfermedades y epidemias. A diferencia de las redes aleatorias y las de mundo pequeño que tienen una probabilidad uniforme de creación nuevos enlaces, muchas redes reales son abiertas y tienen una dinámica que añade constantemente nuevos nodos a la red de un modo no uniforme. Por ejemplo, en el momento de creación de un sitio Web es más probable que desde éste se agregue un enlace diseccionando a una página web popular (como la página de inicio de Google, Facebook, YouTube, etc.) que un enlace hacia una página poco conocida. Para tratar este tipo de redes Barabási propuso un modelo que contemplaba el concepto de enlace preferencial (conocido en literatura como preferential attachment). En este modelo se establece que la probabilidad de que un nodo obtenga un nuevo enlace es proporcional a la cantidad de enlaces que ya tiene, es decir P(ki ,t) =. ki , n(t) ∑ j=1 k j. (1.27). donde ki es el grado del nodo i y k j son los grados de todos los nodos de la red en el instante de tiempo t. Siguiendo este criterio, si empezamos con un número pequeño de nodos, después de t pasos obtenemos una red cuya distribución de grado sigue la ley de la potencia, P(k) = Ck−γ , (1.28) donde γ normalmente toma valores entre 2 ≤ γ ≤ 3 y C es una constante que depende del número máximo de enlaces que puede tener el nodo. Para verificar la pertenencia de redes a la tipología de redes libres de escala basta aplicar la conocida prueba estadística de Kolmogorov-Smirnov, que determina la bondad de ajuste de dos distribuciones de probabilidad entre sí. Los análisis realizados sobre este tipo de redes muestran que, en comparación con redes aleatorias con el mismo número de nodos y grado medio, la distancia característica hli es mayor, mientras que el coeficiente de agrupamiento medio hCi es mucho mayor. Esto implica que la existencia de hubs desempeña un papel clave en el acercamiento de los nodos entre sí. Las redes libres de escala son un modelo válido para representar las redes cuya distribución de grado sigue ley de la potencia; sin embargo, presentan algunas limitaciones relacionadas con las condiciones iniciales de la red. Dichas limitaciones han impulsado nuevas investigaciones en el campo de las redes evolutivas.. 15.
(29) 16. Capítulo 1. Introducción. 1.3 Las redes espaciales Una clase particular de redes complejas incluye aquellas ubicadas en un espacio dotado de una métrica. Concretamente, hablamos de las redes cuyos nodos ocupan una posición precisa en el espacio euclídeo bidimensional o tridimensional y cuyas aristas representan conexiones físicas entre los nodos [30, 44, 72, 175, 176]. La característica espacial de las redes apenas ha sido tratada, desde el punto de vista práctico, hasta la segunda mitad del siglo pasado. Con algunas excepciones (véase [61, 104, 116, 221]), la mayoría de los trabajos en la literatura se han centrado en el estudio de las propiedades topológicas de las redes espaciales sin prestar mucha atención al vínculo con el contexto físico de las mismas [72]. Sin embargo, la topología de las redes en la vida real está restringida por su condición geográfica. Por ejemplo, el número de aristas que podemos conectar a un nodo está limitado por el contexto en el que está embebido el propio nodo [61]. Esto es particularmente evidente en redes planas (redes que forman nodos en las intersecciones de las aristas), tales como redes urbanas o redes de transporte terrestre, donde la condición espacial caracteriza en gran medida la morfología de la red [124, 175, 176]. La condición espacial también es importante para otros tipos de redes no necesariamente planas. Consideremos algunas redes donde la distancia juega un papel importante: las personas que suelen entablar fácilmente amistad con otras personas que viven en el mismo barrio o el mismo lugar de trabajo, las redes de suministro eléctrico o las redes de agua potable. También las redes formadas por los dispositivos de telecomunicación, la longitud de los axones neuronales en el cerebro tiene un costo espacial y la propagación de enfermedades contagiosas no es uniforme en todos los territorios o contextos. En el caso particular del cerebro, las regiones que se encuentran distribuidas espacialmente más cerca tienen una mayor probabilidad de estar conectadas que las regiones remotas, ya que los axones más largos son más costosos en términos de materia y energía [62]. Otro ejemplo interesante de red espacial es Internet, que puede representarse como el conjunto de enrutadores conectados por cables físicos con diferentes longitudes y tiempos de latencia. Cabe destacar que la distancia podría ser otro parámetro, como una distancia social medida por el salario, diferencias socio-profesionales o cualquier cantidad que mida el costo asociado con la formación de un enlace [30]. Más ejemplos y, en general, el efecto del espacio en la topología de las redes pueden consultarse en los libros [29, 63, 78, 113, 160, 172] y en los artículos [16, 45, 79, 161]. Todos estos ejemplos muestran que estas redes tienen nodos y aristas que están restringidos por alguna geometría y que, generalmente, están contextualizados en dos o tres dimensiones, hecho que tiene efectos importantes en sus propiedades topológicas y, por consiguiente, en los procesos que tienen lugar en las redes [30]. Las redes espaciales no es un tema reciente, han sido estudiadas a lo largo de varias décadas, sobre todo, en el campo de la geografía cuantitativa y en algunas ramas de la planificación urbana. El objeto de estudio en la geografía cuantitativa suele ser los modelos explicativos de las estructuras urbanas, regionales y económicas, prescindiendo de los datos históricos sobre la génesis de los espacios. En la década de los años 70, los científicos que trabajaban en este campo se centraron en el estudio de la evolución de las redes en el tiempo y en el espacio. Como puede consultarse en [102, 103], se ha debatido bastante la importancia del espacio en la formación y evolución de las redes, así como se han elaborado.
(30) 1.3 Las redes espaciales interesantes modelos para caracterizar las redes espaciales. Algo más tarde, a principios de los años 80, los arquitectos del laboratorio Space Syntax desarrollaron modelos espaciales para representar y analizar el espacio cognitivo de las ciudades tomando como referencia la teoría de grafos y la geometría analítica [115, 116]. Como se ha especificado anteriormente, las redes espaciales son redes para las cuales los nodos representan algún objeto ubicado en un espacio dotado con una métrica. Para la mayoría de las aplicaciones prácticas en la vida real, el espacio utilizado es el espacio bidimensional con la métrica dada mediante la distancia euclídea. En consecuencia, estas redes pueden tratarse como planas, aunque existan intersecciones entre los elementos representados por aristas. En el caso de las redes de transporte, la planaridad es inevitable. Así mismo, las redes de carreteras, ferrocarril y otras redes de transporte terrestre están condicionadas por su soporte físico, a menudo tratado como bidimensional. Las redes espaciales planas son las más accesibles en cuanto a la disposición de datos y, consecuentemente, la mayoría de los estudios se han centrado en ellas. Las redes espaciales más estudiadas las podemos separar en dos grandes grupos. El primer grupo corresponde a las redes de transporte, mientras que el segundo grupo está constituido por las redes de infraestructuras. Dentro del primer grupo las más representativas son líneas aéreas, líneas de transporte marítimo (cargueros y graneleros), líneas de autobuses y metro. Dentro del segundo grupo cabe destacar Internet, las redes de suministro eléctrico, de agua y, finalmente, las redes urbanas de tráfico rodado o de tránsito peatonal. A continuación, se comentan brevemente las características de este tipo de redes. 1.3.1. Redes de transporte aéreo. La infraestructura de las líneas aéreas es un claro ejemplo de redes espaciales. En este caso los aeropuertos son los nodos que se ubican en un espacio bidimensional. La distribución de los nodos de esta red no es uniforme y obedece a los factores específicos de cada región o país. Las aristas de este tipo de red vienen dadas por los vuelos directos entre los aeropuertos. Es evidente que esta red, a pesar de tener sus nodos localizados sobre un plano, no es plana y, consecuentemente, no puede representarse mediante un grafo plano. En la figura 1.2 se representa un ejemplo de la red de tráfico aéreo del territorio nacional. En el mismo podemos observar que la red está formada por 27 nodos y 136 aristas, siendo su diámetro d = 3, su distancia característica hli = 1.630 y su coeficiente de agrupamiento medio hCi = 0.567. A partir de estos datos Podemos decir que, para conectar cualquier pareja de aeropuertos de la red nacional, por pequeños y poco activos que sean, necesitaremos como máximo dos escalas. Los estudios realizados por Barat y Barthelemy [27, 28, 68], muestran que la red de líneas aéreas presenta las propiedades tanto de las redes de mundo pequeño como de las redes libres de escala. Concretamente, en las redes analizadas por los autores, la distancia media que separaba cualquier pareja de nodos tenía el valor de hli ' 4.37. Esta distancia es muy pequeña teniendo en cuenta la escala de las mismas. Podemos decir que las redes que presentan semejantes características son de tipo de mundo pequeño. En cambio, la distribución de grado P(k) no sigue la distribución normal como en el caso de las redes de mundo pequeño, sino que presenta una distribución exponencial, que es característica de las redes libres de escala [30]. En la figura 1.3 (izquierda) mostramos el. 17.
(31) 18. Capítulo 1. Introducción. Grado k 25. 1. Figura 1.2 Vuelos ordinarios de la red de tráfico aéreo nacional. El tamaño de los nodos está en función de su grado. Fuente: base de datos de Aeropuertos Españoles y Navegación Aérea (AENA) . gráfico, expresado en escala logarítmica, de la distribución de grado para la red de líneas aéreas intercontinentales y en la figura 1.3 (derecha) mostramos el gráfico, en la misma escala, de la frecuencia de grado para la red de aeropuertos de los Estados Unidos de América (EUA) registrado en el año 2010. A partir de los gráficos de la figura 1.3 podemos observar la heterogeneidad de grado característica de las redes de tráfico aéreo. Por ejemplo, en el caso de las redes aéreas internacionales la distribución de grado sigue la ley de la potencia, con P(k) = Ck−γ , donde γ ≈ 2.0 y C es la constante de corte que controla el número máximo de conexiones admisibles por un aeropuerto según su escala (véase [21, 101]). Las redes aéreas de EUA siguen un modelo de distribución de grado similar, pero con el parámetro γ ≈ 1.9, calculado mediante el método propuesto por Barabási [25]. En cuanto al coeficiente de agrupamiento promedio hCi de este tipo de redes, podemos decir que es bastante elevado, ya que suele rondar el valor 0.4, aunque decrece al aumentar el grado de los nodos [30]. Para más información véase el enlace http://konect.uni-koblenz.de y los trabajos [28, 68, 101]. 1.3.2. Redes de transporte terrestre. Las redes de transporte terrestre cubren un amplio rango de redes espaciales, incluyen tanto el transporte urbano como interurbano. La topología de estas redes está fuertemente influenciada por las condiciones geográficas del contexto en el que se encuentran aquéllas. La mayoría de este tipo de redes puede tratarse como redes planas y consecuentemente pueden representarse mediante grafos en los que no existen las intersecciones entre las aristas, es decir, grafos planos. Como ejemplo ilustrativo, en la figura 1.4 mostramos la red.
(32) 1.3 Las redes espaciales P(k) 100. Frecuencia 103 de nodos. 10-2. 102. 10-4. 101. 10-6. 100. 101. 102. 103. 100. 100. 101. Grado k. 102. 103. Grado k. Figura 1.3 Distribución de grado de la red de líneas aéreas intercontinentales (izquierda), procedente de la base de datos de International Air Transportation Association (IATA). Frecuencia de grado de la red de líneas aéreas de los Estados Unidos de America (derecha), procedente de la base de datos de KONECT (the Koblenz Network Collection). ferroviaria nacional formada por 122 nodos (estaciones) y 163 aristas (líneas interurbanas).. F.E.V.E. Única sin electrificar Única electrificada Doble electrificada Ancho UIC. Figura 1.4 Red de ferrocarriles nacionales. Las redes de metro, tranvías y autobuses urbanos son un caso interesante de las redes de transporte, donde los nodos vienen dados por las estaciones de metro o paradas y las aristas son las conexiones directas entre los nodos. Entre los primeros trabajos realizados. 19.
Outline
Grafo dual y sus variantes
El Vector PageRank
El Algoritmo APA
La centralidad Current Flow Betweenness
La centralidad Random Walk Betweenness
La centralidad RCFB
La centralidad de vector propio en las redes urbanas
basadas en el cálculo de vector propio dominante
Medidas de centralidad basadas en el concepto de vector PageRank I Medida de centralidad basada en la centralidad betweenness.
Las redes urbanas analizadas
Documento similar