Escuela de Ingenierías Industriales
Departamento de Organización de Empresas y C.I.M
TESIS DOCTORAL
Emergencia de Normas Económicas
en Sociedades Artificiales de
Agentes. Contribuciones al Juego
de la Demanda de Nash.
Presentada por D. David J. Poza García
para optar al grado de doctor por la
Universidad de Valladolid
Dirigida por Dr. Adolfo López Paredes y Dr. José Manuel Galán Ordax
Quiero agradecer a mis seres queridos por ser, en todo momento, los principales pilares
de mis éxitos.
A mis directores de tesis, Dr. Adolfo López-Paredes y Dr. José Manuel Galán Ordax,
por su incondicional apoyo e importantes aportes durante estos años de trabajo.
A Nacho por las numerosas ocasiones en las que ha compartido sus conocimientos
conmigo. Sin duda, esta tesis no sería lo mismo sin su ayuda.
Un especial agradecimiento a Félix Villafáñez, cuya disposición para ayudar a sus
compañeros no conoce límites y con quien he tenido la suerte de estar acompañado desde
que inicié mi vida profesional.
Finalmente quiero agradecer a todos mis compañeros del grupo INSISOC que de alguna
Personal Investigador (2010BES-2009-016416) en el proyecto SiCoSSys
BLOQUE I ... 13
1. INTRODUCCIÓN ... 15
1.1. ASPECTOS GENERALES Y MOTIVACIÓN ... 15
1.2. EL GRUPO INSISOC ... 21
1.3. UBICACIÓN DE LA INVESTIGACIÓN DENTRO DE LAS CORRIENTES DE PENSAMIENTO ECONÓMICO ... 26
2. MARCO METODOLÓGICO ... 33
2.1. MODELADO BASADO EN AGENTES ... 33
2.1.1. INTRODUCCIÓN ... 33
2.1.2. DEFINICIÓN DE AGENTE Y MODELADO ... 34
2.1.3. CARACTERÍSTICAS DEL MODELADO BASADO EN AGENTES ... 36
2.1.4. MODELADO BASADO EN AGENTES Y COMPORTAMIENTO EMERGENTE ... 37
2.1.5. BUENAS PRÁCTICAS EN LA CONSTRUCCIÓN DE MODELOS BASADOS EN AGENTES ... 39
2.1.6. LA DIFICULTAD DE MODELAR EL COMPORTAMIENTO HUMANO ... 42
2.2. TEORÍA DE JUEGOS ... 44
2.2.1. INTRODUCCIÓN ... 44
2.2.2. LA MATRIZ DE PAGOS ... 45
2.2.3. EQUILIBRIO DE NASH Y ÓPTIMOS EN SENTIDO SOCIAL Y DE PARETO. CONCEPTOS RELACIONADOS. ... 47
2.2.4. ANTECEDENTES DEL EQUILIBRIO DE NASH Y TRABAJOS POSTERIORES ... 53
2.2.5. TEORÍA DE JUEGOS Y ECONOMÍA ... 54
2.2.6. CLASIFICACIÓN DE LOS JUEGOS ... 55
2.2.7. RAMAS DE LA TEORÍA DE JUEGOS ... 56
2.3. REDES COMPLEJAS ... 61
2.3.1. INTRODUCCIÓN ... 61
2.3.5. MODELOS TEÓRICOS DE REDES ... 78
3. EL JUEGO DE LA DEMANDA DE NASH ... 87
3.1. INTRODUCCIÓN ... 87
3.1.1. CONCEPTO DE EXCEDENTE ... 87
3.1.2. DESCRIPCIÓN ... 89
3.1.3. ANTECEDENTES ... 89
3.1.4. MODIFICACIONES EN EL JUEGO DE LA DEMANDA DE NASH ... 91
3.2. EL MODELO DE CLASES DE AXTELL, EPSTEIN Y YOUNG ... 95
3.2.1. DESCRIPCIÓN DEL MODELO ... 95
3.2.2. RESULTADOS ... 98
3.3. ANÁLISIS DE SENSIBILIDAD E INFLUENCIA DE CONDICIONES INICIALES. NUEVA REGLA DE DECISIÓN ... 106
3.3.1. ANÁLISIS DE SENSIBILIDAD ... 106
3.3.2. CONDICIONES INICIALES ... 109
3.3.3. NUEVA REGLA DE DECISIÓN ... 110
3.4. AGENTES SITUADOS EN UN GRID REGULAR ... 114
3.4.1. DISTRIBUCIÓN DE LA TAG EN DOS ZONAS ... 116
3.4.2. DISTRIBUCIÓN DE LA TAG EN CUATRO ZONAS ... 119
3.4.3. DISTRIBUCIÓN DE LA TAG DE MANERA ALEATORIA .... 121
3.5. INFLUENCIA DE LA RED SOCIAL ... 135
3.5.1. INTRODUCCIÓN ... 135
3.5.2. PROPIEDADES DE LAS REDES SOCIALES Y MODELO EMPLEADO ... 135
3.5.3. DISEÑO DE EXPERIMENTOS ... 136
3.5.4. INFLUENCIA DEL CLUSTERING EN LA EMERGENCIA DE LA NORMA PARITARIA ... 137
3.5.5. INFLUENCIA DEL CLUSTERING EN LA DIFUSIÓN DE LA NORMA PARITARIA ... 141
New Insights on the Emergence of Classes Model ... 173
Mesoscopic Effects in an Agent-Based Bargaining Model in Regular Lattices ... 193
Evolution of the Equity Norm in Small World Networks ... 207
Anexo: Evaluación de las revistas en las que han sido publicados los artículos presentados en esta tesis doctoral ... 231
Discrete Dynamics in Nature and Society ... 233
Presentación
El trabajo realizado en esta tesis doctoral se presenta estructurado en dos bloques:
El primero de ellos se desarrolla en tres capítulos en los que se comienza por presentar
una Introducción que recoge los antecedentes de esta tesis doctoral, su relación con otras
líneas de investigación en INSISOC y dentro del área de conocimiento de Organización
de Empresas. El segundo capítulo está dedicado a presentar el marco metodológico, en
concreto el Modelado Basado en Agentes y la Teoría de Juegos y las Redes Complejas.
El tercer capítulo presenta el problema de estudio en el que nos hemos centrado en la
investigación y sintetiza los principales resultados a los que ha dado lugar nuestro
trabajo. Concluimos este primer bloque con la identificación de las conclusiones más
relevantes de esta tesis doctoral.
El segundo bloque recoge las tres publicaciones principales, en revistas indizadas del
primer cuartil de los Journal Citation Reports (JCR) de ISI Thomson:
New Insights on the Emergence of Classes Model, publicado en 2011 en la
revista Discrete Dynamics in Nature and Society. (Poza et al., 2011).
Mesoscopic Effects in an Agent-based Bargaining Model in Regular Lattices,
publicado en 2011 en la revista PLoS ONE. (Poza et al., 2011).
Evolution of Equity Norms in Small-World Networks, publicado en 2012 en la
Universidad de Valladolid
1. INTRODUCCIÓN
1.1.
ASPECTOS GENERALES Y MOTIVACIÓN
La línea central de esta tesis es el problema del intercambio. Entendemos por
intercambio el problema que surge a la hora de repartir un excedente entre dos
individuos. El contexto de nuestro estudio son aquellas situaciones de negociación que
tienen lugar de manera repetitiva, de tal modo que, al cabo de cierto tiempo, acaba
emergiendo una norma que gobierna el intercambio, sin la necesidad de la existencia de
una autoridad central que se encargue de su cumplimiento.
En concreto, centraremos nuestro análisis en aquellas situaciones en las que el
intercambio es eficiente (es decir, aquellos casos en los que la totalidad del excedente es
repartida) y equitativo (el excedente es repartido a partes iguales entre los agentes que
reciben el excedente).
Veamos un ejemplo de reparto de un excedente. Sean dos individuos. Uno de ellos desea
vender un bien por el que no está dispuesto a aceptar una cantidad inferior a 1.000€. El
segundo individuo está interesado en adquirir dicho bien, pero no está dispuesto a gastar
más de 1.100€ en el mismo. Para que se produzca el intercambio, el precio de
compra-venta deberá estar comprendido entre 1.000€ y 1.100 €. Es decir, existe un excedente de
100€ que los dos individuos deberán negociar. El excedente del comprador se define
como la diferencia entre el precio máximo que ésta está dispuesto a pagar por el bien y
el precio de compra-venta; el excedente del vendedor es la diferencia entre el precio de
venta y el precio mínimo al que está dispuesto a vender. Así, por ejemplo, si finalmente
el precio de compra-venta es de 1.070€, el excedente del comprador será de 30€ y el
excedente del vendedor será de 70€. Es decir, como resultado de la negociación, al
vendedor le ha correspondido un 70% y al comprador un 30% del excedente. En este
caso, el reparto del excedente ha sido eficiente (el cien por cien del excedente ha sido
repartido entre los dos agentes) pero no ha sido equitativo (el excedente no se ha
que el intercambio, además de ser eficiente, también es equitativo y también otras
situaciones en las que el intercambio ni siquiera es eficiente.
En el ejemplo anterior tan sólo contábamos con dos individuos y la transacción tenía
lugar una única vez. Sin embargo, nuestro interés en esta investigación se centra en
aquellos escenarios en los que la negociación tiene lugar de manera repetitiva y con un
número elevado de individuos. En este tipo de escenarios, con el paso del tiempo, los
individuos van aprendiendo a partir de su experiencia en negociaciones pasadas y
adaptan su estrategia para tratar de maximizar su beneficio en futuras negociaciones.
Como resultado de este aprendizaje, puede ocurrir que emerjan ciertas normas en el
sistema, haciendo que ciertos grupos de individuos acaben actuando de una manera bien
diferenciada.
Algunos ejemplos de estas normas emergentes son el reparto del dinero entre el bufete de
abogados y su cliente tras ganar un juicio en EEUU (reparto 1/3 - 2/3) o el reparto del
beneficio de una tierra de cultivo entre el terrateniente y el arrendatario (generalmente
1/2 - 1/2) (Young, 1998). A pesar de que esta manera de repartir el excedente no se
encuentra regulada por una autoridad central, lo que ha ocurrido con estas fracciones de
reparto es que se han acabado convirtiendo en una norma con el paso del tiempo. Las
normas actúan como mecanismos reguladores del comportamiento de los individuos sin
que sea necesaria la existencia de una autoridad central que imponga su cumplimiento:
es la propia sociedad la que se encarga de hacerlas cumplir. Este mecanismo regulador
ha sido estudiado en profundidad en las ciencias sociales (Coleman, 1990; Kandori,
1992).
Precisamente, uno de los objetivos de esta tesis es analizar por qué surgen, se difunden y
persisten en la sociedad algunas normas que acaban institucionalizándose y, por tanto,
afectando a la manera en la que se produce el intercambio económico.
Concretamente, en el campo de la Economía, se ha llevado a cabo un esfuerzo
importante en el estudio de la emergencia y difusión de normas que regulan la
distribución de la propiedad dentro de una comunidad. Es más, existe evidencia de que
algunas interacciones se regulan más bien a través de hábitos, relaciones repetitivas
entre individuos, presión social, confianza o reputación que a través de contratos
(Kandori, 1992). Por un lado, existen normas paritarias que conducen a una “división
Universidad de Valladolid proporciones del recurso a repartir en función de alguna característica del individuo o
bien por la pertenencia de éste a algún grupo caracterizado por ciertos atributos (sexo,
raza, edad, etc.).
Normalmente, el resultado del reparto (e incluso la posibilidad de que el reparto llegue a
realizarse) no depende solamente de las decisiones individuales de cada individuo, sino
de la combinación de ambas decisiones. Es decir, nos encontramos ante una situación de
decisiones interdependientes, adentrándonos así en el ámbito de la Teoría de Juegos,
uno de los marcos metodológicos que hemos empleado en esta tesis. Concretamente, la
Teoría de Aprendizaje en Juegos1 constituye una potente herramienta para analizar
formalmente este tipo de normas (Izquierdo, Izquierdo & Vega-Redondo, 2012;
Fudenberg & Levine, 1998; Young, 2004; Vega-Redondo, 2003). Mediante esta
aproximación, las interacciones sociales pueden modelarse como juegos en los que
diversos jugadores utilizan su memoria sobre experiencias pasadas para formar
expectativas sobre el comportamiento de los otros jugadores, basando en ellas la
selección de su estrategia.
Nuestra línea de investigación sigue la propuesta de Vernon Smith (1989) en cuanto al
diseño de experimentos (institución, entorno y agentes). No obstante, nos distanciamos
de su metodología en tanto que nosotros sustituiremos la experimentación con humanos
por simulación con agentes software (López Paredes, 2001; López-Paredes,
Hernández-Iglesias & Gutiérrez Pajares, 2002). La cuestión es que estos agentes software deben
estar “programados” para interactuar de alguna manera con su entorno y con otros
agentes según unas normas de comportamiento. Para abordar este problema,
utilizaremos como herramienta el Modelado Basado en Agentes. Esta técnica nos
permite definir un (micro) comportamiento para cada uno de los agentes del sistema,
para después poder observar el (macro) comportamiento que surge a partir de la
interacción de los individuos del sistema.
En el caso concreto de normas de distribución de propiedad, las interacciones se modelan
a menudo como juegos de demanda de Nash (1950). En este juego, dos jugadores deben
repartirse cierta cantidad de un bien. Los jugadores reciben la cantidad del bien que
solicitaron siempre que la suma de ambas cantidades sea, como máximo, la totalidad del
bien a repartir; en caso contrario ninguno de ellos recibe nada. Basándose en este juego
y en su posterior versión evolutiva (Young, 1993), Axtell, Epstein y Young (2000)
diseñaron un modelo basado en agentes (en adelante, modelo de AEY) para estudiar la
dinámica transitoria y asintótica del juego de la demanda de Nash en una población
finita. En su modelo, se asumía que los jugadores podían escoger entre tres posibles
demandas: low, medium y high (30%, 50% y 70% del bien a repartir, respectivamente).
Los agentes elegían la estrategia que maximizaba su beneficio en función de sus
expectativas sobre la estrategia del oponente. Este modelo muestra que varios regímenes
persistentes diferentes a la norma paritaria pueden emerger y perpetuar bajo varias
reglas de aprendizaje y combinaciones de parámetros.
Como paso previo a la extensión del modelo de AEY, procedimos a la replicación del
mismo (Poza et al., 2011). Partimos del hecho de que el resultado de una simulación sólo
puede ser fiable si ésta puede ser reproducida por otra persona partiendo de cero, ya
que, de lo contrario, podría ocurrir que los resultados publicados estuvieran equivocados
debido a errores de programación, a una representación incorrecta de lo que realmente se
está simulando, etc. (Axelrod, 1997). La replicación de modelos de forma independiente
permite descubrir debilidades en el modelo original que de otra manera no habrían salido
a la luz (Edmonds & Hales, 2003). Además, durante la replicación del modelo, se prestó
una atención especial a las hipótesis que deben formularse durante el diseño del modelo,
buscando posibles artefactos (Galán et al., 2009; Kubera, Mathieu & Picault, 2009).
Los resultados que nos proporcionó nuestra réplica del modelo de AEY estaban en
consonancia con los trabajos de López-Paredes, Hernández y Pajares (2004) y de
Dessalles (2007), quienes habían llevado a cabo la replicación de este modelo con
anterioridad. Una vez replicado el modelo, se llevó a cabo un análisis de sensibilidad en
el que se estudió cómo afectan algunos elementos del sistema a los resultados de la
simulación. Concretamente, se analiza la influencia de la matriz de pagos y de la
configuración de la memoria en la que los agentes almacenan información para la toma
de decisiones. Posteriormente se dotó a los agentes de una nueva regla de decisión que
requería menos habilidades cognoscitivas que la regla de decisión original, concluyendo
que la introducción de esta nueva regla de decisión, si bien no producía variación en los
regímenes alcanzados por el sistema, la dinámica del mismo sí se veía afectada.
Posteriormente llevamos a cabo una extensión del modelo original con el fin de analizar
Universidad de Valladolid 2011). En particular, analizamos el modelo de AEY en grids regulares con una población
finita de agentes dotados de una tag (o etiqueta que los identifica dentro de un grupo),
descubriendo que las propiedades mesoscópicas de la red de interacción tienen un
impacto significativo en la difusión de las estrategias. En concreto, observamos que,
debido a la distribución aleatoria de la tag en la red, pueden surgir propiedades
topológicas (clústers aislados, estructuras de comunidad, etc.) que explican la difusión de
las estrategias de los agentes en el grid y la emergencia de nuevos regímenes estables que
no aparecían en el modelo original de AEY.
En cualquier caso, las redes de interacción reales normalmente difieren de la topología
regular de un grid bidimensional (Newman, 2003). Para profundizar en los efectos de la
estructura social en la difusión de las normas, analizamos el modelo de AEY en una
población de agentes localizados en una red social. Dos propiedades que caracterizan las
redes sociales humanas es el efecto de pequeño-mundo (esto es, el hecho de que dos
personas cualesquiera estén conectadas a través de un número pequeño de saltos) y el
alto clustering (alta probabilidad de tener amigos en común, o lo que es lo mismo, la
alta probabilidad de que un amigo de un amigo sea a la vez amigo nuestro). En
concreto, para modelar este efecto de forma simultánea, utilizamos un mecanismo de
generación de redes aleatorias basado en el algoritmo de Watts y Strogatz (1998).
En (Santos et al., 2012) situamos a los agentes en una red de Watts-Strogatz y
analizamos la influencia de la red en la evolución transitoria y asintótica del sistema. En
concreto, descubrimos que la presencia de mayor clustering en la red propicia la
aparición de equilibrios paritarios, mientras que en las redes de bajo clustering la
emergencia de la norma discriminatoria se hace más frecuente. Además, observamos que
en las redes que presentan alto clustering el tiempo necesario para que la norma
paritaria se difunda por todo el sistema es mayor que en los casos en los que la red
presenta bajo clustering.
No podemos olvidar que esta tesis doctoral queda enmarcada dentro del marco
conceptual de la Teoría de la Organización. Por ello, se ha llevado a cabo un análisis
de las distintas corrientes de pensamiento económico indicando los puntos en común y
los puntos enfrentados entre dichas corrientes y esta tesis.
La Figura 1 muestra el marco de esta tesis doctoral, sus puntos de partida y sus
Figura 1. Marco de esta tesis doctoral.
Universidad de Valladolid
1.2.
EL GRUPO INSISOC
INSISOC2 (INgeniería de los SIstemas SOCiales) es un Grupo de Investigación de
Excelencia de la Junta de Castilla y León compuesto por investigadores de la
Universidad de Valladolid y de la Universidad de Burgos. Su objetivo es promocionar la
investigación y el modelado del comportamiento de los sistemas sociales complejos desde
la conducta de los agentes que lo componen, explorar y desarrollar metodologías en el
campo del pensamiento sistémico y construir herramientas que faciliten su aplicación al
estudio de los problemas complejos.
INSISOC surge como resultado del trabajo desempeñado por el profesor Dr. Cesáreo
Hernández dirigiendo la tesis doctoral “Análisis e Ingeniería de las Instituciones
Económicas. Una metodología basada en agentes”, realizada por el Dr. Adolfo
López-Paredes. Se considera como hito inicial del grupo la presentación del artículo “The
Social Dimension of Economics and Multiagent Systems” por el Dr. López-Paredes y el
Dr. del Olmo (1998).
El apoyo y asistencia de los profesores del Centre for Policy Modelling de la Manchester
Metropolitan University, y, en particular, de su director, el profesor Scott Moss, fueron
claves en los primeros pasos de INSISOC. Los resultados del grupo dirigido por el
profesor Hernández se materializaron en las primeras tesis doctorales en nuestro país que
incluyen el modelado basado en agentes en las ciencias sociales en general, y en la
ciencia económica en particular, como una tercera vía en la investigación científica:
(López Paredes, 2001; Pajares, 2001; Posada Calvo, 2005; Pascual Ruano, 2006).
El grupo INSISOC fue pionero en la publicación de los primeros manuales sobre
modelado basado en agentes escritos en español. Entre ellos destaca el libro “Ingeniería
de Sistemas Sociales. Diseño, Modelado y Simulación de Sociedades Artificiales de
Agentes” (López-Paredes, 2004), que toma el nombre del grupo de investigación. Otros
volúmenes publicados en castellano que han contribuido a la difusión de las actividades
del grupo y a la internacionalización de sus actividades han sido: López Paredes (2001);
Aguilera Ontiveros y López Paredes (2001); Aguilera (2002); Aguilera y López-Paredes
(2004) o López Paredes y Hernández Iglesias (2008), en el que se recogen trabajos
diversos que van desde la metodología general de modelado basado en agentes a
aplicaciones en la gestión de recursos naturales en los más diversos ámbitos.
En la actualidad, INSISOC cuenta con más de 20 investigadores y es uno de los grupos
de investigación en el campo con más presencia en el panorama nacional. En la Figura 2
se muestra un esquema de los campos de investigación actuales de este grupo.
Figura 2. Líneas de investigación del grupo INSISOC.
En la actualidad, existen tres líneas de investigación dentro del grupo INSISOC:
Universidad de Valladolid Este trabajo de investigación se enmarca dentro del campo de los Sistemas Complejos.
Dentro de esta área de conocimiento, INSISOC aplica su conocimiento sobre modelado
basado en agentes a la simulación computacional, las redes complejas y el
data-driven research.
SIMULACIÓN COMPUTACIONAL
Se ha empleado simulación computacional en diversos campos, tales como la teoría de
juegos y la evolución de la cooperación (Galán & Izquierdo, 2005; Galán Ordax,
López Paredes & del Olmo Martínez, 2005; Izquierdo & Izquierdo, 2006; Izquierdo et al.,
2007, 2008; Izquierdo, Izquierdo & Gotts, 2008; Izquierdo & Izquierdo, 2008; Pascual et
al., 2009; Poza, Villafáñez & Pajares, 2009; Poza et al., 2010; Izquierdo & Izquierdo,
2011); el estudio de los mercados artificiales (Pascual Ruano et al., 2003; Pajares
et al., 2003; Pascual & Pajares, 2007; Pascual, Pajares & López-Paredes, 2006; Lavios et
al., 2006; López-Paredes et al., 2008; Hernández et al., 2008); imperfecciones de
mercado (Izquierdo et al., 2006; Izquierdo & Izquierdo, 2007). Dentro del ámbito
económico, se procedió al estudio del comportamiento y la reproducción de agentes
artificiales en los mercados regulados mediante subastas (Posada Calvo, Hernández
Iglesias & López Paredes, 2004; Posada Calvo, 2005; Posada Calvo, Hernández-Iglesias
& Lopez-Paredes, 2006; Posada, Hernández & López-Paredes, 2006; Posada, 2006;
Posada, Hernández & López-Paredes, 2007; Posada & López-Paredes, 2008; Posada,
Hernández & López, 2008; Villahoz, del Olmo Martínez & Arauzo, 2010;
Fuentes-Fernández et al., 2010; Villafáñez & Poza, 2010); la caracterización de los problemas
de negociación bilateral (Hernández Iglesias & López Paredes, 1999; López Paredes,
2001; López-Paredes, Hernández-Iglesias & Gutiérrez Pajares, 2002) y la caracterización
de comportamientos en dinámica industrial (Pajares, López & Hernández, 2003;
Pajares, Hernández-Iglesias & López-Paredes, 2004; López-Paredes et al., 2008).
REDES COMPLEJAS
Algunas publicaciones destacadas son las siguientes: Santos Martín, del Olmo
Izquierdo (2007); McAllister et al. (2009); Poza et al. (2010); Galán, Latek & Rizi
(2011); Poza et al. (2011); Santos, Olmo & Pajares (2007); Santos et al., 2012).
DATA-DRIVEN RESEARCH
Con la tesis del Dr. Galán (2007), el grupo INSISOC comenzó a aplicar el modelado
basado en agentes a la gestión de recursos naturales, concretamente para tratar la
complejidad de los de los múltiples factores que influyen en la gestión del agua
doméstica en zonas metropolitanas emergentes. Posteriores trabajos en esta línea de
investigación son: Galán, del Olmo & López-Paredes (2008); Galán, López-Paredes
& del Olmo (2009); Galán Ordax (2007); Izquierdo et al. (2008); Galán et al. (2009);
Izquierdo et al. (2009); Fuentes-Fernández et al. (2011).
En la Figura 3 se muestran los proyectos en los que ha participado y participa en la
Universidad de Valladolid
1.3.
UBICACIÓN DE LA INVESTIGACIÓN
DENTRO DE LAS CORRIENTES DE
PENSAMIENTO ECONÓMICO
A pesar de que existen varios enfoques que tratan de explicar el papel de la empresa en
la actividad económica, ninguna de estas teorías es excluyente. Estas teorías, por lo
general, actúan de manera complementaria, explicando diversos aspectos de la empresa
desde puntos de vista diferentes. Los límites que separan unas corrientes económicas de
otras no son estrictos, por lo que existen ideas que son compartidas por varias corrientes.
Como consecuencia, no resulta sencillo hacer una clasificación de estas corrientes de
pensamiento.
Un criterio interesante para clasificar los distintos tipos de corrientes económicas
consiste en distinguir si su enfoque es mecanicista o evolutivo (también llamado
evolucionista)3.
Según el enfoque mecanicista, se supone por hipótesis que los sistemas están en
equilibrio y que existen ciertas leyes que relacionan las principales variables del sistema.
Ante una perturbación, el sistema evoluciona hacia un equilibrio, ya sea éste el equilibrio
previo u otro de los posibles equilibrios del sistema. Desde el punto de vista mecanicista,
la labor del científico consiste, por tanto, en descubrir cuáles son estas leyes que dirigen
el sistema hacia el equilibrio.
Por el contrario, el enfoque evolutivo no "impone" la existencia de este equilibrio ni de
estas leyes inmutables. Según el razonamiento evolutivo (sea cual sea la ciencia a la que
se aplique), se parte de los conceptos de herencia y selección (que contribuyen a
mantener la homogeneidad del sistema) y de mutación (que contribuye a reducir la
homogeneidad del sistema).
La Economía es una ciencia relativamente reciente. Cuando surgió, lo hizo con un
enfoque mecanicista, “imitando” a otras ciencias existentes. La Economía Neoclásica
Universidad de Valladolid hereda esta visión mecanicista del Universo, en la que todo se encuentra regulado por
leyes matemáticas que empujan el sistema hacia puntos de equilibrio. Un ejemplo de
razonamiento mecanicista en Economía lo tenemos en el equilibrio de producción de las
empresas según la Economía Neoclásica: en un mercado de competencia perfecta, el
equilibrio se alcanza cuando el nivel de producción de las empresas hace que el coste
marginal de dicho nivel de producción sea igual al precio del bien en el mercado4.
Según el enfoque evolutivo, si bien existen factores que empujan a las empresas hacia la
homogeneidad, como por ejemplo, el hecho de que la manera de operar en las empresas
no cambia de un día para otro (concepto de herencia), también existen otros factores
que empujan a las empresas hacia la diversidad, como por ejemplo la innovación
(concepto de mutación). Además, en el mercado existen mecanismos que hacen que unas
empresas alcancen el éxito y otras no (concepto de selección). Ideas evolucionistas en
dinámica industrial son, por ejemplo, los fenómenos de path-dependence, o la concepción
de la tecnología como el resultado de los esfuerzos de I+D de la compañías (teoría del
crecimiento endógeno).
Mientras que la Teoría Neoclásica asume que los agentes económicos tienen racionalidad
ilimitada (poseen toda la información necesaria – y además saben utilizarla – para tomar
las decisiones que maximizan su utilidad), la aproximación evolutiva en Economía
supone la racionalidad limitada de los agentes económicos (lo que implica aprendizaje,
comportamiento adaptativo y la posesión de una serie de competencias y habilidades).
Además, la empresa es concebida como un agente procesador de conocimiento, en el que
se genera, se trasforma y se produce conocimiento.
El criterio que utilizan algunos autores para distinguir entre unas corrientes de
pensamiento y otras es el siguiente: ¿Cuáles son las fuentes de beneficio de las
empresas? Según este criterio, en primer lugar tendríamos la Teoría Económica,
dentro de la cual se integran la Economía Neoclásica, La Economía Industrial, la Nueva
Economía Institucional (con la Teoría de los Derechos de Propiedad, la Teoría de la
Agencia y la Teoría de los Costes de Transacción) y la Teoría Evolucionista. En segundo
lugar tendríamos las diversas teorías de la Administración (como, por ejemplo, el
Taylorismo), y, en tercer lugar, el Enfoque Estratégico (con la Teoría de las Fuerzas
Competitivas, el Conflicto Estratégico, la Teoría de Capacidades y Recursos, y la Teoría
de Capacidades Dinámicas). Ver esquema en la Figura 4.
Según la Teoría Económica, la Organización de Empresas no sólo debe proporcionar
normas que faciliten la asignación eficiente de los recursos dentro de la propia empresa,
sino que debe, además, justificar la existencia de empresas y de otras formas
organizativo-contractuales alternativas al mercado. A grandes rasgos, las principales
aportaciones de la Teoría Económica son el análisis del entorno económico en el que se
desenvuelven las empresas y el estudio de la naturaleza y la estructura básica de las
mismas (Vázquez Bustelo, 2011).
Como ya mencionamos anteriormente, según la Economía Neoclásica, se asume que el
ser humano posee racionalidad ilimitada. Además, según su punto de vista, todas las
empresas pertenecientes a un mismo sector tienen el mismo comportamiento y pueden
ser modeladas como una única empresa representativa. Es decir, la empresa es
considerada como una “caja negra” con “producción” a su salida y con “factores
productivos” (capital y trabajo) y “materias primas” a su entrada. Según esta teoría, el
funcionamiento interno de la empresa no importa. Además, el bien que comercializan
todas estas empresas es el mismo (hipótesis de bien homogéneo). En consecuencia, la
Teoría Neoclásica tiene muchas dificultades para explicar por qué unas empresas tienen
éxito y otras no.
La Economía Industrial, en cambio, con su paradigma ECR (estructura – conducta –
resultados), se aleja un poco de la Teoría Neoclásica y afirma que los mercados no son
perfectos, si bien sigue considerando que los agentes sí son perfectos (es decir, tienen
capacidad de razonamiento ilimitada). En otras palabras, la Economía Industrial estudia
el comportamiento de unos agentes (racionales) en unos mercados imperfectos.
La Nueva Economía Institucional se caracteriza por una visión contractual de las
relaciones internas en la organización y las existentes entre distintas empresas,
analizando sus costes. Las tres subcorrientes de la Nueva Economía Institucional (Teoría
de los Costes de Transacción, Teoría de la Agencia, Teoría de los Derechos de
Universidad de Valladolid Economía Neoclásica (Kim & Mahoney, 2005). La Teoría de los Costes de Transacción
analiza los costes que ocasionan las distintas formas de gobierno de los intercambios y el
predominio de unas formas organizativas sobre otras en determinados contextos
institucionales (Vázquez Bustelo, 2011). El desarrollo de esta teoría se debe
fundamentalmente a Oliver Williamson (2000), quien se basó en el trabajo seminal de
Ronald Coase. La Teoría de la Agencia se centra en un análisis de los contratos entre
agentes económicos y en el problema del control del comportamiento que surge en dichas
relaciones contractuales. La Teoría de los Derechos de Propiedad se encarga del estudio
del conjunto de normas costumbres y leyes que contribuyen a definir los modos de
apropiabilidad, las formas de utilización y las reglas de intercambio de los recursos.
La Teoría de la Administración analiza cómo distintas consideraciones de gestión
afectan a los resultados de la empresa.
El Enfoque Estratégico, como su nombre indica, se centra en encontrar qué
estrategias son las que llevan a ciertas empresas al éxito. Según la Teoría de las
Fuerzas Competitivas (Porter, 1980), los resultados de la empresa dependen
fundamentalmente de cinco factores (la rivalidad de los competidores, la amenaza de
nuevos competidores, la amenaza de productos sustitutivos, el poder negociador de los
proveedores y el poder negociador de los clientes) que pueden aportar a la empresa
ciertas ventajas competitivas. Para la Teoría de Recursos y Capacidades, cuyo
máxima representante es Penrose (1959), la empresa es considerada como un conjunto
de recursos y capacidades, tanto físicos (capital, máquinas, terrenos, etc.) como
intangibles (patentes, marcas, reputación, know-how, tecnología, etc.) que proporcionan
a cada empresa ciertas ventajas competitivas. Por otro lado, la Teoría de
Capacidades y Recursos, con David J. Teece como máximo representante, va más
allá y afirma que la posesión de recursos y capacidades estratégicas no garantiza el
mantenimiento de las ventajas competitivas a medio/largo plazo, sino que éstas deben
Figura 4. Una posible clasificación de las corrientes de pensamiento económico.
Existen otros criterios para clasificar las corrientes de pensamiento económico, aparte de
las expuestas anteriormente. Por ejemplo, Mahoney (2005), hace esta clasificación en
función de la estrategia, y distinguen cinco corrientes: Behavioral Theory of the Firm
(¿Cómo pueden las empresas operar de una manera eficiente?), Teoría de los Costes de
Transacción (¿Cómo pueden las empresas reducir sus costes?), Teoría de los Derechos de
Propiedad (¿Cómo pueden las empresas crear y distribuir riqueza?), Teoría de la
Agencia (¿Cómo pueden las empresas alinear los intereses individuales?) y Teorías
basadas en recursos / capacidades dinámicas: (¿Cómo pueden las empresas adquirir,
desarrollar y utilizar recursos para aumentar la probabilidad de supervivencia y de
crecimiento rentable?).
Como vemos, además de que los límites de las distintas corrientes no están
rigurosamente definidos, la clasificación de las distintas corrientes varía según los
criterios de cada autor. Nuestro trabajo no se situará inamoviblemente en una sola
corriente, sino que tomará ideas y conceptos de varias de ellas. Aun así, indicaremos a
continuación, cuáles de las distintas corrientes son más cercanas o más lejanas a nuestro
trabajo.
La corriente de pensamiento que queda más alejada de la filosofía de esta tesis doctoral
es la Teoría Neoclásica debido fundamentalmente a su hipótesis de racionalidad
ilimitada. Esta investigación, de hecho, se aleja de esta suposición. Si bien sí se asume
Universidad de Valladolid aunque lo intentan, muchas veces no saben cómo hacerlo, tomando elecciones que no
siempre son las óptimas. Además, en nuestros modelos, también hay cabida para la
exploración.
La corriente de pensamiento más acorde con esta investigación es la Teoría de los Costes
de Transacción, puesto que en ella se plantean cuáles son los mecanismos por los cuales
emergen ciertas normas que acaban institucionalizándose dando lugar a contratos
estándar (Young, 1998). De hecho, la emergencia de normas mitiga los costes de
transacción (información, negociación y garantía). Retomemos el ejemplo de la norma
establecida en cuanto al reparto de excedente entre bufete de abogados y cliente en
EEUU (reparto de excedente 2/3 - 1/3), comentado en la introducción a este
documento. Una vez la norma se ha difundido en la sociedad, no necesitamos
informarnos sobre qué reparto se hace en distintos bufetes, ya que todos ellos seguirán la
misma norma de reparto, lo cual supone una reducción de costes de información.
Además, no tiene sentido negociar otro reparto distinto al de la norma establecida, ya
que, si el reparto resultara menos favorable para nosotros, no tendríamos ningún
problema en encontrar otro bufete que siguiera la norma 2/3 - 1/3, lo cual implica una
reducción de costes de negociación. Finalmente, una vez establecida la norma, suelen
surgir contratos que dan soporte legal a la misma, lo cual se traduce en una reducción en
los costes de garantía.
2.
MARCO METODOLÓGICO
2.1.
MODELADO BASADO EN AGENTES
2.1.1.
INTRODUCCIÓN
El modelado basado en agentes (ABM5) ha cobrado gran importancia desde hace
algunas décadas en campos como la Sociología (Conte, 1997; Gilbert & Conte, 1995;
Gilbert & Troitzsch, 1999; Suleiman, Troitzsch & Gilbert, 2000; López-Paredes, 2004),
Ciencias Políticas (Axelrod, 1997; Johnson, 1999), la Economía (Arthur, Durlauf, &
Lane, 1997; Tesfatsion, 2002; López et al. 2004), la Biología (Resnick, 1997; Bauer,
Beauchemin & Perelson, 2009), la Antropología (Wolfe, 2003; Lansing, 2003) o la
gestión de recursos y la Ecología (Bousquet & Le Page, 2004; Hare & Deadman,
2004; Janssen, 2003; Galán et al. 2009).
Tanto es así que esta herramienta se ha posicionado entre los dos paradigmas
tradicionales de modelado científico, el que han seguido tradicionalmente las Ciencias
Naturales y el seguido tradicionalmente por las Ciencias Sociales, al combinar ventajas
de ambas aproximaciones (López-Paredes, 2004).
Por un lado, el modelado en las Ciencias Naturales ha estado basado en ecuaciones
matemáticas (que le confieren rigor formal), mientras que el modelado en las Ciencias
Sociales ha estado basado tradicionalmente en el lenguaje natural (que le aporta
realismo y expresividad) (Moss, 1999). El modelado basado en agentes combina
tanto formalidad como rigor, al mismo tiempo que minimiza las desventajas los
paradigmas de modelado tradicionales (fuertes hipótesis en caso de las Ciencias
Naturales y ambigüedad en el caso de las Ciencias Sociales).
Centrándonos en la Economía, ésta ha sido modelada tradicionalmente con ecuaciones
matemáticas. Para poder modelar una realidad tan compleja mediante expresiones
matemáticas relativamente sencillas, fue necesario hacer fuertes hipótesis sobre el
comportamiento del ser humano y de las empresas a la hora de tomar decisiones
económicas. Estas hipótesis se tradujeron en que, a la hora de tomar decisiones
económicas, todos los seres humanos y todas las empresas actúan siguiendo un mismo
comportamiento representativo. Esto introdujo una homogeneidad en el sistema que no
se observaba en el mundo real. Por otro lado, modelar el comportamiento humano con
lenguaje natural, al que tradicionalmente han recurrido la Sociología y la Psicología
introducía ambigüedad y dificultaba el análisis formal.
En términos generales, el modelado basado en agentes consiste en la construcción de un
modelo mediante un ordenador que permita observar el comportamiento emergente
resultado de la interacción entre agentes software que interactúan entre sí según unas
reglas de comportamiento. A los agentes software se les asignan los distintos
comportamientos observados en el ser humano por las Ciencias Sociales (realismo) pero
formalizados computacionalmente (rigor). Por consiguiente, el modelado basado en
agentes se posiciona en un punto intermedio entre el paradigma de modelado científico
tradicional de las Ciencias Naturales, basado en ecuaciones matemáticas (y, por tanto,
formal) y el enfoque de modelado tradicional de las Ciencias Sociales, típicamente
basados en el lenguaje natural (y, por tanto, realista).
En la siguiente sección daremos una descripción más formal del modelado basado en
agentes.
2.1.2.
DEFINICIÓN DE AGENTE Y MODELADO
En primer lugar, antes de definir formalmente el modelado basado en agentes,
comenzaremos definiendo qué es un agente y exponiendo en qué consiste, en general, el
modelado.
A pesar de no existir una definición universalmente aceptada, una definición de agente
Un agente es un hardware o (más frecuentemente) una entidad software que, situada en un entorno, es capaz de exhibir un comportamiento autónomo flexible, con el propósito de conseguir los objetivos para los que fue diseñado.
(Wooldridge & Jennings, 1995)
Un modelo es una abstracción de una realidad en la cual se seleccionan los elementos
de la misma que se consideran relevantes para la situación que se está estudiando. En
ocasiones se hacen hipótesis sobre elementos desconocidos, o bien se hacen
simplificaciones sobre ciertos aspectos (Galán et al., 2009).
Si bien el modelado posibilita el estudio de ciertos fenómenos de la naturaleza que no
podrían llevarse a cabo sin las aproximaciones y simplificaciones que se hacen en el
momento de modelar, se ha de ser consciente de las aproximaciones efectuadas y de su
posible influencia en las conclusiones que se extraigan del modelo.
El modelado basado en agentes puede definirse como:
“Un método computacional que permite al investigador crear, analizar y experimentar con modelos compuestos por agentes que interactúan con el entorno”.
(Gilbert, 2008)
En esencia, este enfoque consiste en crear un programa de ordenador en el que las
entidades identificadas en el sistema objetivo (y sus interacciones) son representadas por
objetos software (los agentes) que interactúan entre sí dentro de un entorno virtual
(Figura 5). La idea básica consiste en establecer una correspondencia directa entre los
actores y los agentes de tal manera que la observación de la evolución del programa en
el mundo virtual pueda ayudarnos a entender el sistema modelado (Galán,
Figura 5. Relación entre entidades en la realidad; relaciones correspondientes entre agentes en el modelo basado en agentes (Edmonds, 2001).
2.1.3.
CARACTERÍSTICAS DEL MODELADO BASADO
EN AGENTES
Lo que diferencia a unos paradigmas de modelado de otros es la manera de construir las
abstracciones de la realidad observada. Una de las principales ventajas del modelado
basado en agentes (y que le distingue del resto de paradigmas de modelado) es la
posibilidad de establecer una correspondencia más directa entre entidades (y sus
interacciones) del sistema a modelar y los agentes (y sus interacciones) en los modelos
Como ya se ha visto, el modelado basado en agentes combina las ventajas del paradigma
de modelado seguido tradicionalmente por las Ciencias Naturales (rigor) y del paradigma
de modelado seguido por las Ciencias Sociales (realismo). Esto permite una descripción
formal (y aun así natural) del sistema objetivo, posibilita el modelado de la
heterogeneidad, facilita la representación del entorno y la manera en la que los agentes
interactúan con él, permite estudiar las relaciones bidireccionales entre los individuos y
los grupos, y permite capturar el comportamiento emergente (Galán & Izquierdo, 2005;
Axtell, 2000; Bonabeau, 2002; Epstein, 1999).
Por otro lado, el modelado basado en agentes, como tercera vía de modelado, minimiza
las principales desventajas de los dos paradigmas tradicionales: hipótesis y
simplificaciones en la caso de las Ciencias Naturales y ambigüedad del lenguaje en el
caso de las Ciencias Sociales.
No obstante, el modelado basado en agentes presenta una desventaja: los modelos
resultantes son, en general, difícilmente tratables matemáticamente, por lo que debe
recurrirse a la simulación computacional para su análisis (Galán Ordax, 2007; Galán &
Izquierdo, 2005). De ahí que hoy en día se utilicen las expresiones “modelado basado en
agentes” y “simulación basada en agentes” como sinónimo (Galán et al., 2009).
Sin embargo, es precisamente la simulación computacional la que nos permite observar
fácilmente el comportamiento emergente fruto de la interacción entre los diversos
agentes que constituyen el modelo.
2.1.4.
MODELADO BASADO EN AGENTES Y
COMPORTAMIENTO EMERGENTE
A pesar de que en un modelo basado en agentes, a éstos les es asignado un patrón de
comportamiento a nivel individual, en muchas ocasiones el comportamiento social
resultante de la interacción entre los agentes tiene poco que ver con el comportamiento
Un claro ejemplo de este comportamiento emergente es el Modelo de Segregación Social
de Schelling6 (1978), considerado por muchos autores como el primer modelo basado en
agentes (López Paredes, 2011), a pesar de que, en su origen, no se trataba de un modelo
computacional, sino que fue desarrollado en un tablero de damas y monedas (Izquierdo
et al., 2009). En este modelo, se parte de una población de agentes artificiales, donde la
mitad corresponde a agentes de una raza y la otra mitad a agentes de otra raza.
Inicialmente, los individuos de ambas razas se encuentran mezclados y distribuidos
aleatoriamente. El patrón de comportamiento asignado a los agentes es el siguiente: cada
individuo está satisfecho con el lugar geográfico que ocupa siempre que el número de
vecinos de raza diferente a la suya no supere cierto umbral. En caso de que este umbral
se supere, los individuos se desplazan a una nueva posición geográfica. El proceso
continúa hasta que todos los agentes alcanzan una posición en la que el número de
vecinos de raza distinta a la suya sea inferior a este umbral. Mediante simulación,
Edmonds y Hales (2005) comprobaron que, incluso cuando los valores de este umbral
son grandes (es decir, cuando la población es tolerante y está satisfecha con una
proporción elevada de vecinos de raza distinta a la suya), la interacción de los agentes
da como resultado una segregación social, en la que los individuos de la misma raza
tienden a agruparse. La Figura 6 muestra esta situación. En la parte izquierda se
muestra la situación inicial, con una población de 2.000 agentes (1.000 de cada raza),
distribuidos aleatoriamente. La figura derecha muestra la situación final, donde los
agentes de distintas razas se han agrupado. El umbral empleado es 30% (es decir, para
que los agentes estén satisfechos basta con que 3 de cada 10 vecinos sean de su misma
raza). Como vemos, resulta destacable que el comportamiento individual de los agentes,
programados para ser, aparentemente, tolerantes, no hacía pensar la emergencia de
segregación en la población y aun así, la segregación se produce para niveles altos del
parámetro de tolerancia.
Thomas Schelling fue el primer economista que mostró explícitamente cómo las
decisiones tomadas a nivel microscópico evolucionan hasta alcanzar patrones
reconocibles a nivel macroscópico (Young, 1998).
Figura 6. ABM del Modelo de Segregación de Schelling programado en Netlogo (Wilensky, 1999). A la izquierda, situación inicial (distribución aleatoria de los agentes); a la derecha, situación de los agentes tras la interacción (segregados por raza). El color de los agentes indica la raza a la que
pertenecen.
Como conclusión, podemos decir que a partir de la micro-definición del
comportamiento de los agentes, el macro-comportamiento emergente no siempre
resulta evidente. Mediante simulación, el modelado basado en agentes permite observar
la aparición o ausencia de estos comportamientos emergentes, al mismo tiempo que
facilita el análisis de las razones que llevan a la emergencia de estos macro
comportamientos.
2.1.5.
BUENAS PRÁCTICAS EN LA CONSTRUCCIÓN
DE MODELOS BASADOS EN AGENTES
A pesar de las numerosas ventajas vistas hasta el momento, desafortunadamente, el
modelado basado en agentes también presenta algunos inconvenientes.
En primer lugar, a la hora de escribir el código sobre el que se apoyará el modelo,
resulta muy difícil no introducir bugs (Galán et al., 2009). Los bugs son fragmentos de
(y, por tanto, el modelo) funcione de una manera inadecuada. Por ejemplo, en la
replicación del Modelo de Clases que se ha llevado a cabo en esta investigación, los
agentes son emparejados al azar y juegan una única vez en cada ronda. Si, debido a un
fallo en el código del programa, ocurriera que en alguna ronda algún agente no jugara o
bien jugara más de una vez, el programador estaría introduciendo un bug en el código
del programa.
En segundo lugar, cuando la simulación muestra un resultado llamativo, no resulta
trivial averiguar si éste se debe a un fallo de programación o bien a que el modelo se
comporta realmente así. Retomando el ejemplo anterior, si nuestro código contuviera
este bug, esto podría originar que atribuyéramos erróneamente el resultado de la
simulación al comportamiento del modelo cuando probablemente el responsable sea este
error en el código que había pasado desapercibido.
En tercer lugar, aun cuando nuestro código no contenga errores, puede ocurrir que
nuestro modelo contenga artefactos. Los artefactos pueden aparecer en el diseño de un
modelo cuando las asunciones que se hacen de manera arbitraria porque se piensa que no
influyen en los resultados, finalmente sí lo hacen (Galán et al., 2009; Galán & Izquierdo,
2005). Si, por ejemplo, en un modelo se toma la decisión de no aleatorizar el orden en el
que los agentes toman decisiones porque se asume que este orden no influye estaríamos
introduciendo un artefacto si se introducen sesgos en favor de los que toman las
decisiones en primer lugar, lo cual invalidaría los resultados. Por tanto, cuando aparecen
artefactos, se corre el riesgo de malinterpretar los resultados de la simulación (Edmonds,
2009).
Ante la posibilidad de que se produzcan en nuestro modelo algunas de las tres
circunstancias descritas anteriormente, la replicación tiene una importancia
fundamental en el modelado basado en agentes (Axelrod, 1997; Edmonds & Hales, 2005;
Axtell et al., 1996; Edmonds & Hales, 2003). Mediante la replicación, se reconstruye un
modelo ya estudiado, utilizando para ello otro lenguaje de programación, de tal forma
que se pueda comprobar si las conclusiones extraídas a partir del modelo original son
consecuentes con las que se obtienen de la réplica del modelo. Por esta razón, nuestro
trabajo de investigación comenzó con la replicación del Modelo de Clases de Axtell,
Epstein y Young (2000) y no fue hasta cuando comprobamos que los resultados que
habíamos obtenido con nuestra réplica del modelo eran consecuentes con los obtenidos
En Galán et al. (2009) se describe una propuesta de elaboración de un modelo basado en
agentes, con una descripción de las distintas fases y los distintos roles implicados para
evitar, en la medida de lo posible, la introducción de errores y artefactos. Existen
algunos intentos muy interesantes con INGENIAS (Pavón & Gómez-Sanz, 2003) para
utilizar lenguajes visuales y de modelado como lenguajes de programación en lugar de
simplemente como lenguajes de modelado (Sansores & Pavon, 2005; Sansores, Pavón &
Gómez-Sanz, 2006). Estos esfuerzos ayudan a sistematizar el paso desde el modelo
ejecutable hacia la implementación (además en diferentes plataformas de simulación).
Otros dos conceptos asociados al modelado basado en agentes muy presentes en la
literatura son la validación y la verificación. La validación es un proceso mediante el
cual se evalúa cómo de útil es un modelo para la finalidad que llevó a su creación. Por
otro lado, el proceso de verificación7 consiste en comprobar si el modelo resultante se
comporta de la manera que tenían en mente sus diseñadores e implementadores (es
decir, la verificación es el proceso por el cual se buscan errores).
Por ejemplo, para validar nuestras extensiones del Modelo de Clases, deberíamos
plantearnos si este modelo es representativo del comportamiento social que estamos
planteando. En el modelo de partida se asumía que los agentes se emparejaban de
manera aleatoria, sin tener en cuenta ni su posición espacial ni las posibles relaciones
entre agentes. Sin embargo, en una situación real, las personas tienden a relacionarse
más frecuentemente con personas cercanas que con personas que se encuentran alejadas
físicamente. De ahí nuestra extensión del modelo en el que situamos a los agentes en un
grid regular de manera que éstos sólo pueden interactuar con sus vecinos (Poza et al.,
2011). Por otro lado, las personas mantienen relaciones constituyendo redes sociales. De
ahí nuestra siguiente extensión del modelo en la que hacemos que los agentes formen
parte de redes sociales (Santos et al., 2012).
2.1.6.
LA DIFICULTAD DE MODELAR EL
COMPORTAMIENTO HUMANO
En un modelo basado en agentes debe prestarse especial atención a cómo se define el
comportamiento de los agentes puesto que esto no es una tarea sencilla.
Tradicionalmente, la Teoría Económica ha considerado que los seres humanos poseen
racionalidad ilimitada. Esto implica asumir que, a la hora de tomar decisiones
económicas, los individuos disponen de toda la información necesaria, todas las
habilidades requeridas para procesar esta información y, además, sin restricciones
temporales. Por consiguiente, la hipótesis de racionalidad ilimitada implica que los
individuos no tienen problemas para tomar la decisión óptima (es decir, aquella decisión
que maximiza su utilidad).
Sin embargo, desde hace algunas décadas, la idea de la racionalidad limitada ha ido
cobrando fuerza, especialmente a partir de los trabajos de Herbert Simon y Daniel
Kahneman8. Según este punto de vista, la racionalidad del ser humano está limitada por
tres dimensiones: la información disponible, la limitación de la mente de cada individuo
(es decir, carencia de habilidad y recursos necesarios para tomar la decisión correcta) y
el tiempo disponible para tomar la decisión (Simon, 1957). Esto quiere decir que los
individuos no utilizan reglas de optimización estrictas para tomar decisiones, sino que
emplean heurísticas que pueden no llevar a resultados óptimos, sino que conducen a
resultados simplemente satisfactorios, debido a los costes de deliberación que el empleo
de reglas de optimización complejas podría acarrear.
Kahneman contribuyó a la Ciencia Económica con su Teoría de las Perspectivas (1979)
según la cual, cuando los seres humanos toman decisiones en entornos de incertidumbre,
se alejan de los principios básicos de probabilidad y recurren a heurísticos. Según esta
teoría, la aversión al riesgo de los individuos puede presentar asimetría en función de si
la decisión tiene por objetivo maximizar ganancias o minimizar pérdidas, siendo la
aversión al riesgo inferior en el segundo caso.
Posteriormente, Ariel Rubinstein (1998) propuso modelar la racionalidad limitada
especificando explícitamente los procedimientos de toma de decisión.
Dentro del campo del modelado basado en agentes, Young (1998) demuestra que las
dinámicas evolucionistas pueden conducir a un sistema en el que los agentes no tienen
racionalidad ilimitada a los mismos estados de equilibrio que se alcanzan cuando los
agentes sí disponen de ella. Young considera que los agentes no son completamente
‘irracionales’, sino que toman sus decisiones considerando cómo se comportan los otros
agentes del sistema. El comportamiento de los agentes se actualiza endógenamente a
partir de la información que van recibiendo del sistema. Young superaba de esta forma
las principales críticas de Simon a los trabajos de racionalidad limitada en Teoría de
Juegos de Rubinstein (Ariel Rubinstein, 1998: 187-190) recurriendo al uso de modelos
basados en agentes (Schelling 1971, 1978)9.
A pesar de que en el Modelo de Clases (Axtell, Epstein & Young, 2000), punto de
partida de esta tesis doctoral, se asume que los agentes toman decisiones según una regla
de comportamiento compleja, una de las contribuciones de nuestra investigación fue
comprobar que cuando a los agentes se les dota de reglas de comportamiento heurísticas,
los equilibrios que se alcanzan en el sistema son los mismos que cuando los agentes usan
la regla de decisión empleada en el modelo original (véase sección 3.3.3).
2.2.
TEORÍA DE JUEGOS
2.2.1.
INTRODUCCIÓN
La Teoría de Juegos es una rama de las Matemáticas que estudia la toma de
decisiones interdependientes. Es decir, aquellas situaciones en las que el resultado de
la interacción entre individuos no sólo depende de la decisión tomada por cada uno de
ellos individualmente, sino del par de estrategias tomadas por todos ellos en su conjunto.
Un ejemplo sencillo de situación que podría modelarse como un juego es la siguiente: dos
personas que se cruzan al mismo tiempo para atravesar una puerta. ¿Quién pasará
primero? Cada persona tiene dos posibles opciones de comportamiento (que llamaremos
estrategias): pasar primero o ceder el paso. Esta situación tiene tres posibles resultados,
en función del conjunto de las decisiones tomadas por los dos agentes implicados: el
primero, que una persona pase primero y otra después (como resultado de que una
persona decide pasar primero y la otra decide ceder el paso); el segundo, que las dos
personas choquen al tratar de pasar por la puerta al mismo tiempo (porque las dos
personas han decidido pasar primero); y tercero: ninguna de las dos personas pase (como
resultado de que ambas personas deciden ceder el paso).
De los tres resultados posibles que tiene la situación que hemos modelado como un
juego, ¿cuál sería el más deseable? Depende de a quién se lo preguntemos10. Si le
preguntamos a cada una de las personas por separado, probablemente nos dirían que,
para ellas, el mejor resultado sería que pasaran ellos mismos primero, ya que así la
persona que pasa primero estaría ahorrando tiempo a costa de hacérselo perder a la
segunda. Sin embargo, desde un punto de vista externo (suponemos que las dos personas
nos son indiferentes), podríamos opinar que el mejor resultado desde el punto de vista
social es aquél en el que una de las dos personas pasa y la otra cede el paso (sin
importar cuál de las dos personas toma una decisión y cuál toma la otra).
Aunque el ejemplo anterior resulte muy sencillo, recoge los tres elementos que forman
parte de un juego. Desde un punto de vista más formal, decimos que un juego es una
abstracción formal de una interacción social donde:
a) existen dos o más individuos (jugadores) que toman decisiones,
b) cada jugador tiene dos o más formas de actuar (llamadas acciones o estrategias), y
c) el resultado de la interacción depende de la decisión tomada por todos los jugadores
(Izquierdo, Izquierdo & Vega-Redondo, 2012).
El uso de la Teoría de Juegos no se limita a casos tan sencillos como el ejemplo anterior.
Es muy utilizada en las Ciencias Sociales en campos como las carreras armamentísticas,
posturas en política internacional, etc. Pero lo que a nosotros nos interesa realmente son
las aplicaciones de la Teoría de Juegos en Economía: precio de un nuevo producto
cuando otras empresas tienen productos similares, decidir si pujar o no en una subasta,
etc. En todas estas situaciones, el resultado final no dependerá solamente de nuestra
propia decisión, sino también de las decisiones adoptadas por los demás, razón por la
cual la Teoría de Juegos constituye una buena herramienta para poder analizar dichas
situaciones.
Muchos autores sitúan el origen de la Teoría de Juegos en 1944, con la publicación del
libro “The Theory of Games Behaviour” por John Von Neumann y Oskar Morgenstern
(Ross, 2011), aunque algunas de las ideas de la Teoría de Juegos ya habían sido
anticipadas en el siglo XIX, por los economistas Cournot y Edgeworth (Contreras et al.,
2002).
2.2.2.
LA MATRIZ DE PAGOS
Como hemos visto previamente, el resultado de un juego depende del conjunto de las
decisiones tomadas por los individuos participantes. Un elemento fundamental para
representar los posibles resultados del juego en función de las distintas combinaciones de
Ilustraremos el significado de la matriz de pagos con el dilema del prisionero, un juego
de cooperación bien conocido.
La filosofía de este juego es la siguiente: dos ladrones han sido capturados y la policía no
tiene evidencias suficientes para condenar o liberar a los detenidos, por lo que están
siendo interrogados. Los interrogatorios se están llevando a cabo de tal manera que no
existe ninguna posibilidad de comunicación entre los dos prisioneros. Los prisioneros
pueden elegir entre dos estrategias, cooperar (C) o no cooperar (D). En este juego
existen tres posibles resultados:
- Ambos prisioneros cooperan: los dos niegan haber cometido el crimen (C, C) y
son condenados únicamente a un mes de prisión.
- Ninguno de los dos prisioneros coopera: los dos se traicionan mutuamente (D,
D), y ambos son condenados a 3 meses de prisión.
- Un prisionero coopera negando haber cometido el crimen, y el otro no coopera
admitiendo haber cometido el crimen (C, D) ó (D, C). Al prisionero que ha
admitido cometer el crimen lo dejan libre y al que lo ha negado lo condenan a
12 meses de prisión.
Para representar los distintos resultados del juego, confeccionamos la siguiente matriz de
pagos (Tabla 1):
Jugador 2
Cooperar (C) No Cooperar (D)
Jugador 1 Cooperar (C) 1,1 12,0
No cooperar (D) 0,12 3,3
Tabla 1. Matriz de pagos del juego del dilema del prisionero.
La matriz de pagos recoge los posibles resultados del juego en función de cada
combinación de estrategias elegida por los agentes. El hecho de tener esta información
resumida en una tabla nos ayuda a analizar el resultado del juego.
Aunque en este caso concreto el valor de los pagos (payoffs) que introducimos en la
matriz de pagos tiene un significado real (meses de condena), en general, el valor
concreto del pago representa simplemente de forma ordinal las preferencias de los
jugadores por cada uno de los resultados. Salvo que se indique lo contrario, el hecho de
que los pagos asociados a una estrategia sean mayores que los pagos asociados a otra
ante la segunda, pero su valor concreto no suele ser representativo en términos
cardinales.
En realidad, la mayoría de los pagos en la Teoría de Juegos Clásica son interpretados
como utilidades de Neumann y Morgenstern, lo que significa que los pagos expresan la
actitud de los jugadores ante el riesgo, de tal manera que puede emplearse la teoría de la
utilidad esperada para evaluar las distribuciones de probabilidad de cada uno de los
posibles resultados del juego11 (Izquierdo, Izquierdo & Vega-Redondo, 2012).
¿Cuál será el resultado del juego? Por un lado, como observadores, nos damos cuenta de
que la mejor situación conjunta para los dos jugadores es que ambos cooperen (C, C),
pues, de esta manera, la suma de ambas penas es la menor de los cuatro posibles
resultados del juego. Pero, por otro lado, si nos ponemos en el papel de uno de los
prisioneros, sentiríamos una elevada tentación para traicionar a nuestro compañero (no
cooperar, D) para que nosotros fuéramos liberados a costa de que nuestro compañero
fuera condenado a una pena mayor (12 meses). Vemos, además, que la estrategia no
cooperar (D) permite minimizar daños ante una posible traición de nuestro compañero.
2.2.3.
EQUILIBRIO DE NASH Y ÓPTIMOS EN
SENTIDO SOCIAL Y DE PARETO. CONCEPTOS
RELACIONADOS.
Trataremos de entender la racionalidad del juego a partir de la información
proporcionada por la matriz de pagos. Para ello, resulta de vital importancia la
introducción de conceptos tan relevantes como el equilibrio de Nash, el óptimo de
Pareto, el óptimo en sentido social o las estrategias dominantes.
2.2.3.1.
EQUILIBRIO DE NASH
Un equilibrio de Nash es un conjunto de estrategias (una para cada uno de los n
jugadores participantes en el juego) que tiene la propiedad de que la decisión de cada
jugador es la mejor respuesta ante las elecciones de los otros n-1 jugadores (Holt &
Roth, 2004). Es decir, el Equilibrio de Nash describe una situación en la que
ningún jugador tiene ningún incentivo individual para cambiar la estrategia
que actualmente está siguiendo. O lo que es lo mismo, ningún jugador puede
obtener una recompensa mayor mediante un cambio de estrategia.
Retomando como ejemplo del dilema del prisionero, lo que cada prisionero desea es
maximizar su propio beneficio (es decir, reducir su estancia en la cárcel). Sin embargo, el
resultado final del juego no dependerá solamente de la decisión individual de cada
prisionero, sino de la combinación las decisiones de ambos prisioneros. De entre todas las
posibles estrategias, cada jugador escogerá aquella que maximice su beneficio teniendo
en cuenta su expectativa sobre la decisión del otro jugador. Pues bien, decimos
que una combinación de estrategias es un equilibrio de Nash si, aun cuando los
jugadores anunciaran simultáneamente la estrategia que van a seguir, a ninguno de ellos
le interesaría cambiar la estrategia que tenían pensado seguir antes de conocer la
estrategia anunciada por el otro jugador.
Analicemos ahora los posibles equilibrios de Nash en el dilema del prisionero a partir de
la matriz de pagos indicada en la Tabla 1.
Observemos que el par de estrategias (no cooperar, no cooperar) es el único equilibrio de
Nash posible en el dilema del prisionero. Puede comprobarse, a partir de la matriz de
pagos del juego, que cualquier otra combinación de estrategias haría que uno de los
jugadores (o los dos) desearan haber escogido una estrategia distinta al conocer la
estrategia que ha seguido el otro jugador. Sin embargo, cuando la combinación de
estrategias constituye un equilibrio de Nash, aun cuando un jugador anunciara cuál va a
ser su estrategia, el otro jugador no tendría incentivos para cambiar la estrategia que
tenía pensado seguir. Puede comprobarse que esto no ocurre con el resto de pares de las