Emergencia de normas económicas en sociedades artificiales de agentes: contribuciones al juego de la demanda de Nash

(1)

Escuela de Ingenierías Industriales

Departamento de Organización de Empresas y C.I.M

TESIS DOCTORAL

Emergencia de Normas Económicas

en Sociedades Artificiales de

Agentes. Contribuciones al Juego

de la Demanda de Nash.

Presentada por D. David J. Poza García

para optar al grado de doctor por la

Universidad de Valladolid

Dirigida por Dr. Adolfo López Paredes y Dr. José Manuel Galán Ordax

(2)

(3)

Quiero agradecer a mis seres queridos por ser, en todo momento, los principales pilares

de mis éxitos.

A mis directores de tesis, Dr. Adolfo López-Paredes y Dr. José Manuel Galán Ordax,

por su incondicional apoyo e importantes aportes durante estos años de trabajo.

A Nacho por las numerosas ocasiones en las que ha compartido sus conocimientos

conmigo. Sin duda, esta tesis no sería lo mismo sin su ayuda.

Un especial agradecimiento a Félix Villafáñez, cuya disposición para ayudar a sus

compañeros no conoce límites y con quien he tenido la suerte de estar acompañado desde

que inicié mi vida profesional.

Finalmente quiero agradecer a todos mis compañeros del grupo INSISOC que de alguna

(4)

(5)

Personal Investigador (2010BES-2009-016416) en el proyecto SiCoSSys

(6)

(7)

BLOQUE I ... 13

1. INTRODUCCIÓN ... 15

1.1. ASPECTOS GENERALES Y MOTIVACIÓN ... 15

1.2. EL GRUPO INSISOC ... 21

1.3. UBICACIÓN DE LA INVESTIGACIÓN DENTRO DE LAS CORRIENTES DE PENSAMIENTO ECONÓMICO ... 26

2. MARCO METODOLÓGICO ... 33

2.1. MODELADO BASADO EN AGENTES ... 33

2.1.1. INTRODUCCIÓN ... 33

2.1.2. DEFINICIÓN DE AGENTE Y MODELADO ... 34

2.1.3. CARACTERÍSTICAS DEL MODELADO BASADO EN AGENTES ... 36

2.1.4. MODELADO BASADO EN AGENTES Y COMPORTAMIENTO EMERGENTE ... 37

2.1.5. BUENAS PRÁCTICAS EN LA CONSTRUCCIÓN DE MODELOS BASADOS EN AGENTES ... 39

2.1.6. LA DIFICULTAD DE MODELAR EL COMPORTAMIENTO HUMANO ... 42

2.2. TEORÍA DE JUEGOS ... 44

2.2.2. LA MATRIZ DE PAGOS ... 45

2.2.3. EQUILIBRIO DE NASH Y ÓPTIMOS EN SENTIDO SOCIAL Y DE PARETO. CONCEPTOS RELACIONADOS. ... 47

2.2.4. ANTECEDENTES DEL EQUILIBRIO DE NASH Y TRABAJOS POSTERIORES ... 53

2.2.5. TEORÍA DE JUEGOS Y ECONOMÍA ... 54

2.2.6. CLASIFICACIÓN DE LOS JUEGOS ... 55

2.2.7. RAMAS DE LA TEORÍA DE JUEGOS ... 56

2.3. REDES COMPLEJAS ... 61

(8)

2.3.5. MODELOS TEÓRICOS DE REDES ... 78

3. EL JUEGO DE LA DEMANDA DE NASH ... 87

3.1. INTRODUCCIÓN ... 87

3.1.1. CONCEPTO DE EXCEDENTE ... 87

3.1.2. DESCRIPCIÓN ... 89

3.1.3. ANTECEDENTES ... 89

3.1.4. MODIFICACIONES EN EL JUEGO DE LA DEMANDA DE NASH ... 91

3.2. EL MODELO DE CLASES DE AXTELL, EPSTEIN Y YOUNG ... 95

3.2.1. DESCRIPCIÓN DEL MODELO ... 95

3.2.2. RESULTADOS ... 98

3.3. ANÁLISIS DE SENSIBILIDAD E INFLUENCIA DE CONDICIONES INICIALES. NUEVA REGLA DE DECISIÓN ... 106

3.3.1. ANÁLISIS DE SENSIBILIDAD ... 106

3.3.2. CONDICIONES INICIALES ... 109

3.3.3. NUEVA REGLA DE DECISIÓN ... 110

3.4. AGENTES SITUADOS EN UN GRID REGULAR ... 114

3.4.1. DISTRIBUCIÓN DE LA TAG EN DOS ZONAS ... 116

3.4.2. DISTRIBUCIÓN DE LA TAG EN CUATRO ZONAS ... 119

3.4.3. DISTRIBUCIÓN DE LA TAG DE MANERA ALEATORIA .... 121

3.5. INFLUENCIA DE LA RED SOCIAL ... 135

3.5.2. PROPIEDADES DE LAS REDES SOCIALES Y MODELO EMPLEADO ... 135

3.5.3. DISEÑO DE EXPERIMENTOS ... 136

3.5.4. INFLUENCIA DEL CLUSTERING EN LA EMERGENCIA DE LA NORMA PARITARIA ... 137

3.5.5. INFLUENCIA DEL CLUSTERING EN LA DIFUSIÓN DE LA NORMA PARITARIA ... 141

(9)

New Insights on the Emergence of Classes Model ... 173

Mesoscopic Effects in an Agent-Based Bargaining Model in Regular Lattices ... 193

Evolution of the Equity Norm in Small World Networks ... 207

Anexo: Evaluación de las revistas en las que han sido publicados los artículos presentados en esta tesis doctoral ... 231

Discrete Dynamics in Nature and Society ... 233

(10)

(11)

Presentación

El trabajo realizado en esta tesis doctoral se presenta estructurado en dos bloques:

El primero de ellos se desarrolla en tres capítulos en los que se comienza por presentar

una Introducción que recoge los antecedentes de esta tesis doctoral, su relación con otras

líneas de investigación en INSISOC y dentro del área de conocimiento de Organización

de Empresas. El segundo capítulo está dedicado a presentar el marco metodológico, en

concreto el Modelado Basado en Agentes y la Teoría de Juegos y las Redes Complejas.

El tercer capítulo presenta el problema de estudio en el que nos hemos centrado en la

investigación y sintetiza los principales resultados a los que ha dado lugar nuestro

trabajo. Concluimos este primer bloque con la identificación de las conclusiones más

relevantes de esta tesis doctoral.

El segundo bloque recoge las tres publicaciones principales, en revistas indizadas del

primer cuartil de los Journal Citation Reports (JCR) de ISI Thomson:

 New Insights on the Emergence of Classes Model, publicado en 2011 en la

revista Discrete Dynamics in Nature and Society. (Poza et al., 2011).

 Mesoscopic Effects in an Agent-based Bargaining Model in Regular Lattices,

publicado en 2011 en la revista PLoS ONE. (Poza et al., 2011).

 Evolution of Equity Norms in Small-World Networks, publicado en 2012 en la

(12)

(13)

(14)

(15)

Universidad de Valladolid

1. INTRODUCCIÓN

1.1. ASPECTOS GENERALES Y MOTIVACIÓN

La línea central de esta tesis es el problema del intercambio. Entendemos por

intercambio el problema que surge a la hora de repartir un excedente entre dos

individuos. El contexto de nuestro estudio son aquellas situaciones de negociación que

tienen lugar de manera repetitiva, de tal modo que, al cabo de cierto tiempo, acaba

emergiendo una norma que gobierna el intercambio, sin la necesidad de la existencia de

una autoridad central que se encargue de su cumplimiento.

En concreto, centraremos nuestro análisis en aquellas situaciones en las que el

intercambio es eficiente (es decir, aquellos casos en los que la totalidad del excedente es

repartida) y equitativo (el excedente es repartido a partes iguales entre los agentes que

reciben el excedente).

Veamos un ejemplo de reparto de un excedente. Sean dos individuos. Uno de ellos desea

vender un bien por el que no está dispuesto a aceptar una cantidad inferior a 1.000€. El

segundo individuo está interesado en adquirir dicho bien, pero no está dispuesto a gastar

más de 1.100€ en el mismo. Para que se produzca el intercambio, el precio de

compra-venta deberá estar comprendido entre 1.000€ y 1.100 €. Es decir, existe un excedente de

100€ que los dos individuos deberán negociar. El excedente del comprador se define

como la diferencia entre el precio máximo que ésta está dispuesto a pagar por el bien y

el precio de compra-venta; el excedente del vendedor es la diferencia entre el precio de

venta y el precio mínimo al que está dispuesto a vender. Así, por ejemplo, si finalmente

el precio de compra-venta es de 1.070€, el excedente del comprador será de 30€ y el

excedente del vendedor será de 70€. Es decir, como resultado de la negociación, al

vendedor le ha correspondido un 70% y al comprador un 30% del excedente. En este

caso, el reparto del excedente ha sido eficiente (el cien por cien del excedente ha sido

repartido entre los dos agentes) pero no ha sido equitativo (el excedente no se ha

(16)

que el intercambio, además de ser eficiente, también es equitativo y también otras

situaciones en las que el intercambio ni siquiera es eficiente.

En el ejemplo anterior tan sólo contábamos con dos individuos y la transacción tenía

lugar una única vez. Sin embargo, nuestro interés en esta investigación se centra en

aquellos escenarios en los que la negociación tiene lugar de manera repetitiva y con un

número elevado de individuos. En este tipo de escenarios, con el paso del tiempo, los

individuos van aprendiendo a partir de su experiencia en negociaciones pasadas y

adaptan su estrategia para tratar de maximizar su beneficio en futuras negociaciones.

Como resultado de este aprendizaje, puede ocurrir que emerjan ciertas normas en el

sistema, haciendo que ciertos grupos de individuos acaben actuando de una manera bien

diferenciada.

Algunos ejemplos de estas normas emergentes son el reparto del dinero entre el bufete de

abogados y su cliente tras ganar un juicio en EEUU (reparto 1/3 - 2/3) o el reparto del

beneficio de una tierra de cultivo entre el terrateniente y el arrendatario (generalmente

1/2 - 1/2) (Young, 1998). A pesar de que esta manera de repartir el excedente no se

encuentra regulada por una autoridad central, lo que ha ocurrido con estas fracciones de

reparto es que se han acabado convirtiendo en una norma con el paso del tiempo. Las

normas actúan como mecanismos reguladores del comportamiento de los individuos sin

que sea necesaria la existencia de una autoridad central que imponga su cumplimiento:

es la propia sociedad la que se encarga de hacerlas cumplir. Este mecanismo regulador

ha sido estudiado en profundidad en las ciencias sociales (Coleman, 1990; Kandori,

1992).

Precisamente, uno de los objetivos de esta tesis es analizar por qué surgen, se difunden y

persisten en la sociedad algunas normas que acaban institucionalizándose y, por tanto,

afectando a la manera en la que se produce el intercambio económico.

Concretamente, en el campo de la Economía, se ha llevado a cabo un esfuerzo

importante en el estudio de la emergencia y difusión de normas que regulan la

distribución de la propiedad dentro de una comunidad. Es más, existe evidencia de que

algunas interacciones se regulan más bien a través de hábitos, relaciones repetitivas

entre individuos, presión social, confianza o reputación que a través de contratos

(Kandori, 1992). Por un lado, existen normas paritarias que conducen a una “división

(17)

Universidad de Valladolid proporciones del recurso a repartir en función de alguna característica del individuo o

bien por la pertenencia de éste a algún grupo caracterizado por ciertos atributos (sexo,

raza, edad, etc.).

Normalmente, el resultado del reparto (e incluso la posibilidad de que el reparto llegue a

realizarse) no depende solamente de las decisiones individuales de cada individuo, sino

de la combinación de ambas decisiones. Es decir, nos encontramos ante una situación de

decisiones interdependientes, adentrándonos así en el ámbito de la Teoría de Juegos,

uno de los marcos metodológicos que hemos empleado en esta tesis. Concretamente, la

Teoría de Aprendizaje en Juegos1_{constituye una potente herramienta para analizar}

formalmente este tipo de normas (Izquierdo, Izquierdo & Vega-Redondo, 2012;

Fudenberg & Levine, 1998; Young, 2004; Vega-Redondo, 2003). Mediante esta

aproximación, las interacciones sociales pueden modelarse como juegos en los que

diversos jugadores utilizan su memoria sobre experiencias pasadas para formar

expectativas sobre el comportamiento de los otros jugadores, basando en ellas la

selección de su estrategia.

Nuestra línea de investigación sigue la propuesta de Vernon Smith (1989) en cuanto al

diseño de experimentos (institución, entorno y agentes). No obstante, nos distanciamos

de su metodología en tanto que nosotros sustituiremos la experimentación con humanos

por simulación con agentes software (López Paredes, 2001; López-Paredes,

Hernández-Iglesias & Gutiérrez Pajares, 2002). La cuestión es que estos agentes software deben

estar “programados” para interactuar de alguna manera con su entorno y con otros

agentes según unas normas de comportamiento. Para abordar este problema,

utilizaremos como herramienta el Modelado Basado en Agentes. Esta técnica nos

permite definir un (micro) comportamiento para cada uno de los agentes del sistema,

para después poder observar el (macro) comportamiento que surge a partir de la

interacción de los individuos del sistema.

En el caso concreto de normas de distribución de propiedad, las interacciones se modelan

a menudo como juegos de demanda de Nash (1950). En este juego, dos jugadores deben

repartirse cierta cantidad de un bien. Los jugadores reciben la cantidad del bien que

solicitaron siempre que la suma de ambas cantidades sea, como máximo, la totalidad del

(18)

bien a repartir; en caso contrario ninguno de ellos recibe nada. Basándose en este juego

y en su posterior versión evolutiva (Young, 1993), Axtell, Epstein y Young (2000)

diseñaron un modelo basado en agentes (en adelante, modelo de AEY) para estudiar la

dinámica transitoria y asintótica del juego de la demanda de Nash en una población

finita. En su modelo, se asumía que los jugadores podían escoger entre tres posibles

demandas: low, medium y high (30%, 50% y 70% del bien a repartir, respectivamente).

Los agentes elegían la estrategia que maximizaba su beneficio en función de sus

expectativas sobre la estrategia del oponente. Este modelo muestra que varios regímenes

persistentes diferentes a la norma paritaria pueden emerger y perpetuar bajo varias

reglas de aprendizaje y combinaciones de parámetros.

Como paso previo a la extensión del modelo de AEY, procedimos a la replicación del

mismo (Poza et al., 2011). Partimos del hecho de que el resultado de una simulación sólo

puede ser fiable si ésta puede ser reproducida por otra persona partiendo de cero, ya

que, de lo contrario, podría ocurrir que los resultados publicados estuvieran equivocados

debido a errores de programación, a una representación incorrecta de lo que realmente se

está simulando, etc. (Axelrod, 1997). La replicación de modelos de forma independiente

permite descubrir debilidades en el modelo original que de otra manera no habrían salido

a la luz (Edmonds & Hales, 2003). Además, durante la replicación del modelo, se prestó

una atención especial a las hipótesis que deben formularse durante el diseño del modelo,

buscando posibles artefactos (Galán et al., 2009; Kubera, Mathieu & Picault, 2009).

Los resultados que nos proporcionó nuestra réplica del modelo de AEY estaban en

consonancia con los trabajos de López-Paredes, Hernández y Pajares (2004) y de

Dessalles (2007), quienes habían llevado a cabo la replicación de este modelo con

anterioridad. Una vez replicado el modelo, se llevó a cabo un análisis de sensibilidad en

el que se estudió cómo afectan algunos elementos del sistema a los resultados de la

simulación. Concretamente, se analiza la influencia de la matriz de pagos y de la

configuración de la memoria en la que los agentes almacenan información para la toma

de decisiones. Posteriormente se dotó a los agentes de una nueva regla de decisión que

requería menos habilidades cognoscitivas que la regla de decisión original, concluyendo

que la introducción de esta nueva regla de decisión, si bien no producía variación en los

regímenes alcanzados por el sistema, la dinámica del mismo sí se veía afectada.

Posteriormente llevamos a cabo una extensión del modelo original con el fin de analizar

(19)

Universidad de Valladolid 2011). En particular, analizamos el modelo de AEY en grids regulares con una población

finita de agentes dotados de una tag (o etiqueta que los identifica dentro de un grupo),

descubriendo que las propiedades mesoscópicas de la red de interacción tienen un

impacto significativo en la difusión de las estrategias. En concreto, observamos que,

debido a la distribución aleatoria de la tag en la red, pueden surgir propiedades

topológicas (clústers aislados, estructuras de comunidad, etc.) que explican la difusión de

las estrategias de los agentes en el grid y la emergencia de nuevos regímenes estables que

no aparecían en el modelo original de AEY.

En cualquier caso, las redes de interacción reales normalmente difieren de la topología

regular de un grid bidimensional (Newman, 2003). Para profundizar en los efectos de la

estructura social en la difusión de las normas, analizamos el modelo de AEY en una

población de agentes localizados en una red social. Dos propiedades que caracterizan las

redes sociales humanas es el efecto de pequeño-mundo (esto es, el hecho de que dos

personas cualesquiera estén conectadas a través de un número pequeño de saltos) y el

alto clustering (alta probabilidad de tener amigos en común, o lo que es lo mismo, la

alta probabilidad de que un amigo de un amigo sea a la vez amigo nuestro). En

concreto, para modelar este efecto de forma simultánea, utilizamos un mecanismo de

generación de redes aleatorias basado en el algoritmo de Watts y Strogatz (1998).

En (Santos et al., 2012) situamos a los agentes en una red de Watts-Strogatz y

analizamos la influencia de la red en la evolución transitoria y asintótica del sistema. En

concreto, descubrimos que la presencia de mayor clustering en la red propicia la

aparición de equilibrios paritarios, mientras que en las redes de bajo clustering la

emergencia de la norma discriminatoria se hace más frecuente. Además, observamos que

en las redes que presentan alto clustering el tiempo necesario para que la norma

paritaria se difunda por todo el sistema es mayor que en los casos en los que la red

presenta bajo clustering.

No podemos olvidar que esta tesis doctoral queda enmarcada dentro del marco

conceptual de la Teoría de la Organización. Por ello, se ha llevado a cabo un análisis

de las distintas corrientes de pensamiento económico indicando los puntos en común y

los puntos enfrentados entre dichas corrientes y esta tesis.

La Figura 1 muestra el marco de esta tesis doctoral, sus puntos de partida y sus

(20)

Figura 1. Marco de esta tesis doctoral.

(21)

1.2. EL GRUPO INSISOC

INSISOC2₍_IN_{geniería de los}_SI_stemas_SOC_{iales) es un Grupo de Investigación de}

Excelencia de la Junta de Castilla y León compuesto por investigadores de la

Universidad de Valladolid y de la Universidad de Burgos. Su objetivo es promocionar la

investigación y el modelado del comportamiento de los sistemas sociales complejos desde

la conducta de los agentes que lo componen, explorar y desarrollar metodologías en el

campo del pensamiento sistémico y construir herramientas que faciliten su aplicación al

estudio de los problemas complejos.

INSISOC surge como resultado del trabajo desempeñado por el profesor Dr. Cesáreo

Hernández dirigiendo la tesis doctoral “Análisis e Ingeniería de las Instituciones

Económicas. Una metodología basada en agentes”, realizada por el Dr. Adolfo

López-Paredes. Se considera como hito inicial del grupo la presentación del artículo “The

Social Dimension of Economics and Multiagent Systems” por el Dr. López-Paredes y el

Dr. del Olmo (1998).

El apoyo y asistencia de los profesores del Centre for Policy Modelling de la Manchester

Metropolitan University, y, en particular, de su director, el profesor Scott Moss, fueron

claves en los primeros pasos de INSISOC. Los resultados del grupo dirigido por el

profesor Hernández se materializaron en las primeras tesis doctorales en nuestro país que

incluyen el modelado basado en agentes en las ciencias sociales en general, y en la

ciencia económica en particular, como una tercera vía en la investigación científica:

(López Paredes, 2001; Pajares, 2001; Posada Calvo, 2005; Pascual Ruano, 2006).

El grupo INSISOC fue pionero en la publicación de los primeros manuales sobre

modelado basado en agentes escritos en español. Entre ellos destaca el libro “Ingeniería

de Sistemas Sociales. Diseño, Modelado y Simulación de Sociedades Artificiales de

Agentes” (López-Paredes, 2004), que toma el nombre del grupo de investigación. Otros

volúmenes publicados en castellano que han contribuido a la difusión de las actividades

del grupo y a la internacionalización de sus actividades han sido: López Paredes (2001);

Aguilera Ontiveros y López Paredes (2001); Aguilera (2002); Aguilera y López-Paredes

(22)

(2004) o López Paredes y Hernández Iglesias (2008), en el que se recogen trabajos

diversos que van desde la metodología general de modelado basado en agentes a

aplicaciones en la gestión de recursos naturales en los más diversos ámbitos.

En la actualidad, INSISOC cuenta con más de 20 investigadores y es uno de los grupos

de investigación en el campo con más presencia en el panorama nacional. En la Figura 2

se muestra un esquema de los campos de investigación actuales de este grupo.

Figura 2. Líneas de investigación del grupo INSISOC.

En la actualidad, existen tres líneas de investigación dentro del grupo INSISOC:

(23)

Universidad de Valladolid Este trabajo de investigación se enmarca dentro del campo de los Sistemas Complejos.

Dentro de esta área de conocimiento, INSISOC aplica su conocimiento sobre modelado

basado en agentes a la simulación computacional, las redes complejas y el

data-driven research.

 SIMULACIÓN COMPUTACIONAL

Se ha empleado simulación computacional en diversos campos, tales como la teoría de

juegos y la evolución de la cooperación (Galán & Izquierdo, 2005; Galán Ordax,

López Paredes & del Olmo Martínez, 2005; Izquierdo & Izquierdo, 2006; Izquierdo et al.,

2007, 2008; Izquierdo, Izquierdo & Gotts, 2008; Izquierdo & Izquierdo, 2008; Pascual et

al., 2009; Poza, Villafáñez & Pajares, 2009; Poza et al., 2010; Izquierdo & Izquierdo,

2011); el estudio de los mercados artificiales (Pascual Ruano et al., 2003; Pajares

et al., 2003; Pascual & Pajares, 2007; Pascual, Pajares & López-Paredes, 2006; Lavios et

al., 2006; López-Paredes et al., 2008; Hernández et al., 2008); imperfecciones de

mercado (Izquierdo et al., 2006; Izquierdo & Izquierdo, 2007). Dentro del ámbito

económico, se procedió al estudio del comportamiento y la reproducción de agentes

artificiales en los mercados regulados mediante subastas (Posada Calvo, Hernández

Iglesias & López Paredes, 2004; Posada Calvo, 2005; Posada Calvo, Hernández-Iglesias

& Lopez-Paredes, 2006; Posada, Hernández & López-Paredes, 2006; Posada, 2006;

Posada, Hernández & López-Paredes, 2007; Posada & López-Paredes, 2008; Posada,

Hernández & López, 2008; Villahoz, del Olmo Martínez & Arauzo, 2010;

Fuentes-Fernández et al., 2010; Villafáñez & Poza, 2010); la caracterización de los problemas

de negociación bilateral (Hernández Iglesias & López Paredes, 1999; López Paredes,

2001; López-Paredes, Hernández-Iglesias & Gutiérrez Pajares, 2002) y la caracterización

de comportamientos en dinámica industrial (Pajares, López & Hernández, 2003;

Pajares, Hernández-Iglesias & López-Paredes, 2004; López-Paredes et al., 2008).

 REDES COMPLEJAS

Algunas publicaciones destacadas son las siguientes: Santos Martín, del Olmo

(24)

Izquierdo (2007); McAllister et al. (2009); Poza et al. (2010); Galán, Latek & Rizi

(2011); Poza et al. (2011); Santos, Olmo & Pajares (2007); Santos et al., 2012).

 DATA-DRIVEN RESEARCH

Con la tesis del Dr. Galán (2007), el grupo INSISOC comenzó a aplicar el modelado

basado en agentes a la gestión de recursos naturales, concretamente para tratar la

complejidad de los de los múltiples factores que influyen en la gestión del agua

doméstica en zonas metropolitanas emergentes. Posteriores trabajos en esta línea de

investigación son: Galán, del Olmo & López-Paredes (2008); Galán, López-Paredes

& del Olmo (2009); Galán Ordax (2007); Izquierdo et al. (2008); Galán et al. (2009);

Izquierdo et al. (2009); Fuentes-Fernández et al. (2011).

En la Figura 3 se muestran los proyectos en los que ha participado y participa en la

(25)

(26)

1.3. UBICACIÓN DE LA INVESTIGACIÓN

DENTRO DE LAS CORRIENTES DE

PENSAMIENTO ECONÓMICO

A pesar de que existen varios enfoques que tratan de explicar el papel de la empresa en

la actividad económica, ninguna de estas teorías es excluyente. Estas teorías, por lo

general, actúan de manera complementaria, explicando diversos aspectos de la empresa

desde puntos de vista diferentes. Los límites que separan unas corrientes económicas de

otras no son estrictos, por lo que existen ideas que son compartidas por varias corrientes.

Como consecuencia, no resulta sencillo hacer una clasificación de estas corrientes de

pensamiento.

Un criterio interesante para clasificar los distintos tipos de corrientes económicas

consiste en distinguir si su enfoque es mecanicista o evolutivo (también llamado

evolucionista)3_.

Según el enfoque mecanicista, se supone por hipótesis que los sistemas están en

equilibrio y que existen ciertas leyes que relacionan las principales variables del sistema.

Ante una perturbación, el sistema evoluciona hacia un equilibrio, ya sea éste el equilibrio

previo u otro de los posibles equilibrios del sistema. Desde el punto de vista mecanicista,

la labor del científico consiste, por tanto, en descubrir cuáles son estas leyes que dirigen

el sistema hacia el equilibrio.

Por el contrario, el enfoque evolutivo no "impone" la existencia de este equilibrio ni de

estas leyes inmutables. Según el razonamiento evolutivo (sea cual sea la ciencia a la que

se aplique), se parte de los conceptos de herencia y selección (que contribuyen a

mantener la homogeneidad del sistema) y de mutación (que contribuye a reducir la

homogeneidad del sistema).

La Economía es una ciencia relativamente reciente. Cuando surgió, lo hizo con un

enfoque mecanicista, “imitando” a otras ciencias existentes. La Economía Neoclásica

(27)

Universidad de Valladolid hereda esta visión mecanicista del Universo, en la que todo se encuentra regulado por

leyes matemáticas que empujan el sistema hacia puntos de equilibrio. Un ejemplo de

razonamiento mecanicista en Economía lo tenemos en el equilibrio de producción de las

empresas según la Economía Neoclásica: en un mercado de competencia perfecta, el

equilibrio se alcanza cuando el nivel de producción de las empresas hace que el coste

marginal de dicho nivel de producción sea igual al precio del bien en el mercado4_.

Según el enfoque evolutivo, si bien existen factores que empujan a las empresas hacia la

homogeneidad, como por ejemplo, el hecho de que la manera de operar en las empresas

no cambia de un día para otro (concepto de herencia), también existen otros factores

que empujan a las empresas hacia la diversidad, como por ejemplo la innovación

(concepto de mutación). Además, en el mercado existen mecanismos que hacen que unas

empresas alcancen el éxito y otras no (concepto de selección). Ideas evolucionistas en

dinámica industrial son, por ejemplo, los fenómenos de path-dependence, o la concepción

de la tecnología como el resultado de los esfuerzos de I+D de la compañías (teoría del

crecimiento endógeno).

Mientras que la Teoría Neoclásica asume que los agentes económicos tienen racionalidad

ilimitada (poseen toda la información necesaria – y además saben utilizarla – para tomar

las decisiones que maximizan su utilidad), la aproximación evolutiva en Economía

supone la racionalidad limitada de los agentes económicos (lo que implica aprendizaje,

comportamiento adaptativo y la posesión de una serie de competencias y habilidades).

Además, la empresa es concebida como un agente procesador de conocimiento, en el que

se genera, se trasforma y se produce conocimiento.

El criterio que utilizan algunos autores para distinguir entre unas corrientes de

pensamiento y otras es el siguiente: ¿Cuáles son las fuentes de beneficio de las

empresas? Según este criterio, en primer lugar tendríamos la Teoría Económica,

dentro de la cual se integran la Economía Neoclásica, La Economía Industrial, la Nueva

Economía Institucional (con la Teoría de los Derechos de Propiedad, la Teoría de la

(28)

Agencia y la Teoría de los Costes de Transacción) y la Teoría Evolucionista. En segundo

lugar tendríamos las diversas teorías de la Administración (como, por ejemplo, el

Taylorismo), y, en tercer lugar, el Enfoque Estratégico (con la Teoría de las Fuerzas

Competitivas, el Conflicto Estratégico, la Teoría de Capacidades y Recursos, y la Teoría

de Capacidades Dinámicas). Ver esquema en la Figura 4.

Según la Teoría Económica, la Organización de Empresas no sólo debe proporcionar

normas que faciliten la asignación eficiente de los recursos dentro de la propia empresa,

sino que debe, además, justificar la existencia de empresas y de otras formas

organizativo-contractuales alternativas al mercado. A grandes rasgos, las principales

aportaciones de la Teoría Económica son el análisis del entorno económico en el que se

desenvuelven las empresas y el estudio de la naturaleza y la estructura básica de las

mismas (Vázquez Bustelo, 2011).

Como ya mencionamos anteriormente, según la Economía Neoclásica, se asume que el

ser humano posee racionalidad ilimitada. Además, según su punto de vista, todas las

empresas pertenecientes a un mismo sector tienen el mismo comportamiento y pueden

ser modeladas como una única empresa representativa. Es decir, la empresa es

considerada como una “caja negra” con “producción” a su salida y con “factores

productivos” (capital y trabajo) y “materias primas” a su entrada. Según esta teoría, el

funcionamiento interno de la empresa no importa. Además, el bien que comercializan

todas estas empresas es el mismo (hipótesis de bien homogéneo). En consecuencia, la

Teoría Neoclásica tiene muchas dificultades para explicar por qué unas empresas tienen

éxito y otras no.

La Economía Industrial, en cambio, con su paradigma ECR (estructura – conducta –

resultados), se aleja un poco de la Teoría Neoclásica y afirma que los mercados no son

perfectos, si bien sigue considerando que los agentes sí son perfectos (es decir, tienen

capacidad de razonamiento ilimitada). En otras palabras, la Economía Industrial estudia

el comportamiento de unos agentes (racionales) en unos mercados imperfectos.

La Nueva Economía Institucional se caracteriza por una visión contractual de las

relaciones internas en la organización y las existentes entre distintas empresas,

analizando sus costes. Las tres subcorrientes de la Nueva Economía Institucional (Teoría

de los Costes de Transacción, Teoría de la Agencia, Teoría de los Derechos de

(29)

Universidad de Valladolid Economía Neoclásica (Kim & Mahoney, 2005). La Teoría de los Costes de Transacción

analiza los costes que ocasionan las distintas formas de gobierno de los intercambios y el

predominio de unas formas organizativas sobre otras en determinados contextos

institucionales (Vázquez Bustelo, 2011). El desarrollo de esta teoría se debe

fundamentalmente a Oliver Williamson (2000), quien se basó en el trabajo seminal de

Ronald Coase. La Teoría de la Agencia se centra en un análisis de los contratos entre

agentes económicos y en el problema del control del comportamiento que surge en dichas

relaciones contractuales. La Teoría de los Derechos de Propiedad se encarga del estudio

del conjunto de normas costumbres y leyes que contribuyen a definir los modos de

apropiabilidad, las formas de utilización y las reglas de intercambio de los recursos.

La Teoría de la Administración analiza cómo distintas consideraciones de gestión

afectan a los resultados de la empresa.

El Enfoque Estratégico, como su nombre indica, se centra en encontrar qué

estrategias son las que llevan a ciertas empresas al éxito. Según la Teoría de las

Fuerzas Competitivas (Porter, 1980), los resultados de la empresa dependen

fundamentalmente de cinco factores (la rivalidad de los competidores, la amenaza de

nuevos competidores, la amenaza de productos sustitutivos, el poder negociador de los

proveedores y el poder negociador de los clientes) que pueden aportar a la empresa

ciertas ventajas competitivas. Para la Teoría de Recursos y Capacidades, cuyo

máxima representante es Penrose (1959), la empresa es considerada como un conjunto

de recursos y capacidades, tanto físicos (capital, máquinas, terrenos, etc.) como

intangibles (patentes, marcas, reputación, know-how, tecnología, etc.) que proporcionan

a cada empresa ciertas ventajas competitivas. Por otro lado, la Teoría de

Capacidades y Recursos, con David J. Teece como máximo representante, va más

allá y afirma que la posesión de recursos y capacidades estratégicas no garantiza el

mantenimiento de las ventajas competitivas a medio/largo plazo, sino que éstas deben

(30)

Figura 4. Una posible clasificación de las corrientes de pensamiento económico.

Existen otros criterios para clasificar las corrientes de pensamiento económico, aparte de

las expuestas anteriormente. Por ejemplo, Mahoney (2005), hace esta clasificación en

función de la estrategia, y distinguen cinco corrientes: Behavioral Theory of the Firm

(¿Cómo pueden las empresas operar de una manera eficiente?), Teoría de los Costes de

Transacción (¿Cómo pueden las empresas reducir sus costes?), Teoría de los Derechos de

Propiedad (¿Cómo pueden las empresas crear y distribuir riqueza?), Teoría de la

Agencia (¿Cómo pueden las empresas alinear los intereses individuales?) y Teorías

basadas en recursos / capacidades dinámicas: (¿Cómo pueden las empresas adquirir,

desarrollar y utilizar recursos para aumentar la probabilidad de supervivencia y de

crecimiento rentable?).

Como vemos, además de que los límites de las distintas corrientes no están

rigurosamente definidos, la clasificación de las distintas corrientes varía según los

criterios de cada autor. Nuestro trabajo no se situará inamoviblemente en una sola

corriente, sino que tomará ideas y conceptos de varias de ellas. Aun así, indicaremos a

continuación, cuáles de las distintas corrientes son más cercanas o más lejanas a nuestro

trabajo.

La corriente de pensamiento que queda más alejada de la filosofía de esta tesis doctoral

es la Teoría Neoclásica debido fundamentalmente a su hipótesis de racionalidad

ilimitada. Esta investigación, de hecho, se aleja de esta suposición. Si bien sí se asume

(31)

Universidad de Valladolid aunque lo intentan, muchas veces no saben cómo hacerlo, tomando elecciones que no

siempre son las óptimas. Además, en nuestros modelos, también hay cabida para la

exploración.

La corriente de pensamiento más acorde con esta investigación es la Teoría de los Costes

de Transacción, puesto que en ella se plantean cuáles son los mecanismos por los cuales

emergen ciertas normas que acaban institucionalizándose dando lugar a contratos

estándar (Young, 1998). De hecho, la emergencia de normas mitiga los costes de

transacción (información, negociación y garantía). Retomemos el ejemplo de la norma

establecida en cuanto al reparto de excedente entre bufete de abogados y cliente en

EEUU (reparto de excedente 2/3 - 1/3), comentado en la introducción a este

documento. Una vez la norma se ha difundido en la sociedad, no necesitamos

informarnos sobre qué reparto se hace en distintos bufetes, ya que todos ellos seguirán la

misma norma de reparto, lo cual supone una reducción de costes de información.

Además, no tiene sentido negociar otro reparto distinto al de la norma establecida, ya

que, si el reparto resultara menos favorable para nosotros, no tendríamos ningún

problema en encontrar otro bufete que siguiera la norma 2/3 - 1/3, lo cual implica una

reducción de costes de negociación. Finalmente, una vez establecida la norma, suelen

surgir contratos que dan soporte legal a la misma, lo cual se traduce en una reducción en

los costes de garantía.

(32)

(33)

2. MARCO METODOLÓGICO

2.1. MODELADO BASADO EN AGENTES

2.1.1. INTRODUCCIÓN

El modelado basado en agentes (ABM5_{) ha cobrado gran importancia desde hace}

algunas décadas en campos como la Sociología (Conte, 1997; Gilbert & Conte, 1995;

Gilbert & Troitzsch, 1999; Suleiman, Troitzsch & Gilbert, 2000; López-Paredes, 2004),

Ciencias Políticas (Axelrod, 1997; Johnson, 1999), la Economía (Arthur, Durlauf, &

Lane, 1997; Tesfatsion, 2002; López et al. 2004), la Biología (Resnick, 1997; Bauer,

Beauchemin & Perelson, 2009), la Antropología (Wolfe, 2003; Lansing, 2003) o la

gestión de recursos y la Ecología (Bousquet & Le Page, 2004; Hare & Deadman,

2004; Janssen, 2003; Galán et al. 2009).

Tanto es así que esta herramienta se ha posicionado entre los dos paradigmas

tradicionales de modelado científico, el que han seguido tradicionalmente las Ciencias

Naturales y el seguido tradicionalmente por las Ciencias Sociales, al combinar ventajas

de ambas aproximaciones (López-Paredes, 2004).

Por un lado, el modelado en las Ciencias Naturales ha estado basado en ecuaciones

matemáticas (que le confieren rigor formal), mientras que el modelado en las Ciencias

Sociales ha estado basado tradicionalmente en el lenguaje natural (que le aporta

realismo y expresividad) (Moss, 1999). El modelado basado en agentes combina

tanto formalidad como rigor, al mismo tiempo que minimiza las desventajas los

paradigmas de modelado tradicionales (fuertes hipótesis en caso de las Ciencias

Naturales y ambigüedad en el caso de las Ciencias Sociales).

Centrándonos en la Economía, ésta ha sido modelada tradicionalmente con ecuaciones

matemáticas. Para poder modelar una realidad tan compleja mediante expresiones

(34)

matemáticas relativamente sencillas, fue necesario hacer fuertes hipótesis sobre el

comportamiento del ser humano y de las empresas a la hora de tomar decisiones

económicas. Estas hipótesis se tradujeron en que, a la hora de tomar decisiones

económicas, todos los seres humanos y todas las empresas actúan siguiendo un mismo

comportamiento representativo. Esto introdujo una homogeneidad en el sistema que no

se observaba en el mundo real. Por otro lado, modelar el comportamiento humano con

lenguaje natural, al que tradicionalmente han recurrido la Sociología y la Psicología

introducía ambigüedad y dificultaba el análisis formal.

En términos generales, el modelado basado en agentes consiste en la construcción de un

modelo mediante un ordenador que permita observar el comportamiento emergente

resultado de la interacción entre agentes software que interactúan entre sí según unas

reglas de comportamiento. A los agentes software se les asignan los distintos

comportamientos observados en el ser humano por las Ciencias Sociales (realismo) pero

formalizados computacionalmente (rigor). Por consiguiente, el modelado basado en

agentes se posiciona en un punto intermedio entre el paradigma de modelado científico

tradicional de las Ciencias Naturales, basado en ecuaciones matemáticas (y, por tanto,

formal) y el enfoque de modelado tradicional de las Ciencias Sociales, típicamente

basados en el lenguaje natural (y, por tanto, realista).

En la siguiente sección daremos una descripción más formal del modelado basado en

agentes.

2.1.2. DEFINICIÓN DE AGENTE Y MODELADO

En primer lugar, antes de definir formalmente el modelado basado en agentes,

comenzaremos definiendo qué es un agente y exponiendo en qué consiste, en general, el

modelado.

A pesar de no existir una definición universalmente aceptada, una definición de agente

(35)

Un agente es un hardware o (más frecuentemente) una entidad software que, situada en un entorno, es capaz de exhibir un comportamiento autónomo flexible, con el propósito de conseguir los objetivos para los que fue diseñado.

(Wooldridge & Jennings, 1995)

Un modelo es una abstracción de una realidad en la cual se seleccionan los elementos

de la misma que se consideran relevantes para la situación que se está estudiando. En

ocasiones se hacen hipótesis sobre elementos desconocidos, o bien se hacen

simplificaciones sobre ciertos aspectos (Galán et al., 2009).

Si bien el modelado posibilita el estudio de ciertos fenómenos de la naturaleza que no

podrían llevarse a cabo sin las aproximaciones y simplificaciones que se hacen en el

momento de modelar, se ha de ser consciente de las aproximaciones efectuadas y de su

posible influencia en las conclusiones que se extraigan del modelo.

El modelado basado en agentes puede definirse como:

“Un método computacional que permite al investigador crear, analizar y experimentar con modelos compuestos por agentes que interactúan con el entorno”.

(Gilbert, 2008)

En esencia, este enfoque consiste en crear un programa de ordenador en el que las

entidades identificadas en el sistema objetivo (y sus interacciones) son representadas por

objetos software (los agentes) que interactúan entre sí dentro de un entorno virtual

(Figura 5). La idea básica consiste en establecer una correspondencia directa entre los

actores y los agentes de tal manera que la observación de la evolución del programa en

el mundo virtual pueda ayudarnos a entender el sistema modelado (Galán,

(36)

Figura 5. Relación entre entidades en la realidad; relaciones correspondientes entre agentes en el modelo basado en agentes (Edmonds, 2001).

2.1.3. CARACTERÍSTICAS DEL MODELADO BASADO

EN AGENTES

Lo que diferencia a unos paradigmas de modelado de otros es la manera de construir las

abstracciones de la realidad observada. Una de las principales ventajas del modelado

basado en agentes (y que le distingue del resto de paradigmas de modelado) es la

posibilidad de establecer una correspondencia más directa entre entidades (y sus

interacciones) del sistema a modelar y los agentes (y sus interacciones) en los modelos

(37)

Como ya se ha visto, el modelado basado en agentes combina las ventajas del paradigma

de modelado seguido tradicionalmente por las Ciencias Naturales (rigor) y del paradigma

de modelado seguido por las Ciencias Sociales (realismo). Esto permite una descripción

formal (y aun así natural) del sistema objetivo, posibilita el modelado de la

heterogeneidad, facilita la representación del entorno y la manera en la que los agentes

interactúan con él, permite estudiar las relaciones bidireccionales entre los individuos y

los grupos, y permite capturar el comportamiento emergente (Galán & Izquierdo, 2005;

Axtell, 2000; Bonabeau, 2002; Epstein, 1999).

Por otro lado, el modelado basado en agentes, como tercera vía de modelado, minimiza

las principales desventajas de los dos paradigmas tradicionales: hipótesis y

simplificaciones en la caso de las Ciencias Naturales y ambigüedad del lenguaje en el

caso de las Ciencias Sociales.

No obstante, el modelado basado en agentes presenta una desventaja: los modelos

resultantes son, en general, difícilmente tratables matemáticamente, por lo que debe

recurrirse a la simulación computacional para su análisis (Galán Ordax, 2007; Galán &

Izquierdo, 2005). De ahí que hoy en día se utilicen las expresiones “modelado basado en

agentes” y “simulación basada en agentes” como sinónimo (Galán et al., 2009).

Sin embargo, es precisamente la simulación computacional la que nos permite observar

fácilmente el comportamiento emergente fruto de la interacción entre los diversos

agentes que constituyen el modelo.

2.1.4. MODELADO BASADO EN AGENTES Y

COMPORTAMIENTO EMERGENTE

A pesar de que en un modelo basado en agentes, a éstos les es asignado un patrón de

comportamiento a nivel individual, en muchas ocasiones el comportamiento social

resultante de la interacción entre los agentes tiene poco que ver con el comportamiento

(38)

Un claro ejemplo de este comportamiento emergente es el Modelo de Segregación Social

de Schelling6_{(1978), considerado por muchos autores como el primer modelo basado en}

agentes (López Paredes, 2011), a pesar de que, en su origen, no se trataba de un modelo

computacional, sino que fue desarrollado en un tablero de damas y monedas (Izquierdo

et al., 2009). En este modelo, se parte de una población de agentes artificiales, donde la

mitad corresponde a agentes de una raza y la otra mitad a agentes de otra raza.

Inicialmente, los individuos de ambas razas se encuentran mezclados y distribuidos

aleatoriamente. El patrón de comportamiento asignado a los agentes es el siguiente: cada

individuo está satisfecho con el lugar geográfico que ocupa siempre que el número de

vecinos de raza diferente a la suya no supere cierto umbral. En caso de que este umbral

se supere, los individuos se desplazan a una nueva posición geográfica. El proceso

continúa hasta que todos los agentes alcanzan una posición en la que el número de

vecinos de raza distinta a la suya sea inferior a este umbral. Mediante simulación,

Edmonds y Hales (2005) comprobaron que, incluso cuando los valores de este umbral

son grandes (es decir, cuando la población es tolerante y está satisfecha con una

proporción elevada de vecinos de raza distinta a la suya), la interacción de los agentes

da como resultado una segregación social, en la que los individuos de la misma raza

tienden a agruparse. La Figura 6 muestra esta situación. En la parte izquierda se

muestra la situación inicial, con una población de 2.000 agentes (1.000 de cada raza),

distribuidos aleatoriamente. La figura derecha muestra la situación final, donde los

agentes de distintas razas se han agrupado. El umbral empleado es 30% (es decir, para

que los agentes estén satisfechos basta con que 3 de cada 10 vecinos sean de su misma

raza). Como vemos, resulta destacable que el comportamiento individual de los agentes,

programados para ser, aparentemente, tolerantes, no hacía pensar la emergencia de

segregación en la población y aun así, la segregación se produce para niveles altos del

parámetro de tolerancia.

Thomas Schelling fue el primer economista que mostró explícitamente cómo las

decisiones tomadas a nivel microscópico evolucionan hasta alcanzar patrones

reconocibles a nivel macroscópico (Young, 1998).

(39)

Figura 6. ABM del Modelo de Segregación de Schelling programado en Netlogo (Wilensky, 1999). A la izquierda, situación inicial (distribución aleatoria de los agentes); a la derecha, situación de los agentes tras la interacción (segregados por raza). El color de los agentes indica la raza a la que

pertenecen.

Como conclusión, podemos decir que a partir de la micro-definición del

comportamiento de los agentes, el macro-comportamiento emergente no siempre

resulta evidente. Mediante simulación, el modelado basado en agentes permite observar

la aparición o ausencia de estos comportamientos emergentes, al mismo tiempo que

facilita el análisis de las razones que llevan a la emergencia de estos macro

comportamientos.

2.1.5. BUENAS PRÁCTICAS EN LA CONSTRUCCIÓN

DE MODELOS BASADOS EN AGENTES

A pesar de las numerosas ventajas vistas hasta el momento, desafortunadamente, el

modelado basado en agentes también presenta algunos inconvenientes.

En primer lugar, a la hora de escribir el código sobre el que se apoyará el modelo,

resulta muy difícil no introducir bugs (Galán et al., 2009). Los bugs son fragmentos de

(40)

(y, por tanto, el modelo) funcione de una manera inadecuada. Por ejemplo, en la

replicación del Modelo de Clases que se ha llevado a cabo en esta investigación, los

agentes son emparejados al azar y juegan una única vez en cada ronda. Si, debido a un

fallo en el código del programa, ocurriera que en alguna ronda algún agente no jugara o

bien jugara más de una vez, el programador estaría introduciendo un bug en el código

del programa.

En segundo lugar, cuando la simulación muestra un resultado llamativo, no resulta

trivial averiguar si éste se debe a un fallo de programación o bien a que el modelo se

comporta realmente así. Retomando el ejemplo anterior, si nuestro código contuviera

este bug, esto podría originar que atribuyéramos erróneamente el resultado de la

simulación al comportamiento del modelo cuando probablemente el responsable sea este

error en el código que había pasado desapercibido.

En tercer lugar, aun cuando nuestro código no contenga errores, puede ocurrir que

nuestro modelo contenga artefactos. Los artefactos pueden aparecer en el diseño de un

modelo cuando las asunciones que se hacen de manera arbitraria porque se piensa que no

influyen en los resultados, finalmente sí lo hacen (Galán et al., 2009; Galán & Izquierdo,

2005). Si, por ejemplo, en un modelo se toma la decisión de no aleatorizar el orden en el

que los agentes toman decisiones porque se asume que este orden no influye estaríamos

introduciendo un artefacto si se introducen sesgos en favor de los que toman las

decisiones en primer lugar, lo cual invalidaría los resultados. Por tanto, cuando aparecen

artefactos, se corre el riesgo de malinterpretar los resultados de la simulación (Edmonds,

2009).

Ante la posibilidad de que se produzcan en nuestro modelo algunas de las tres

circunstancias descritas anteriormente, la replicación tiene una importancia

fundamental en el modelado basado en agentes (Axelrod, 1997; Edmonds & Hales, 2005;

Axtell et al., 1996; Edmonds & Hales, 2003). Mediante la replicación, se reconstruye un

modelo ya estudiado, utilizando para ello otro lenguaje de programación, de tal forma

que se pueda comprobar si las conclusiones extraídas a partir del modelo original son

consecuentes con las que se obtienen de la réplica del modelo. Por esta razón, nuestro

trabajo de investigación comenzó con la replicación del Modelo de Clases de Axtell,

Epstein y Young (2000) y no fue hasta cuando comprobamos que los resultados que

habíamos obtenido con nuestra réplica del modelo eran consecuentes con los obtenidos

(41)

En Galán et al. (2009) se describe una propuesta de elaboración de un modelo basado en

agentes, con una descripción de las distintas fases y los distintos roles implicados para

evitar, en la medida de lo posible, la introducción de errores y artefactos. Existen

algunos intentos muy interesantes con INGENIAS (Pavón & Gómez-Sanz, 2003) para

utilizar lenguajes visuales y de modelado como lenguajes de programación en lugar de

simplemente como lenguajes de modelado (Sansores & Pavon, 2005; Sansores, Pavón &

Gómez-Sanz, 2006). Estos esfuerzos ayudan a sistematizar el paso desde el modelo

ejecutable hacia la implementación (además en diferentes plataformas de simulación).

Otros dos conceptos asociados al modelado basado en agentes muy presentes en la

literatura son la validación y la verificación. La validación es un proceso mediante el

cual se evalúa cómo de útil es un modelo para la finalidad que llevó a su creación. Por

otro lado, el proceso de verificación7_{consiste en comprobar si el modelo resultante se}

comporta de la manera que tenían en mente sus diseñadores e implementadores (es

decir, la verificación es el proceso por el cual se buscan errores).

Por ejemplo, para validar nuestras extensiones del Modelo de Clases, deberíamos

plantearnos si este modelo es representativo del comportamiento social que estamos

planteando. En el modelo de partida se asumía que los agentes se emparejaban de

manera aleatoria, sin tener en cuenta ni su posición espacial ni las posibles relaciones

entre agentes. Sin embargo, en una situación real, las personas tienden a relacionarse

más frecuentemente con personas cercanas que con personas que se encuentran alejadas

físicamente. De ahí nuestra extensión del modelo en el que situamos a los agentes en un

grid regular de manera que éstos sólo pueden interactuar con sus vecinos (Poza et al.,

2011). Por otro lado, las personas mantienen relaciones constituyendo redes sociales. De

ahí nuestra siguiente extensión del modelo en la que hacemos que los agentes formen

parte de redes sociales (Santos et al., 2012).

(42)

2.1.6. LA DIFICULTAD DE MODELAR EL

COMPORTAMIENTO HUMANO

En un modelo basado en agentes debe prestarse especial atención a cómo se define el

comportamiento de los agentes puesto que esto no es una tarea sencilla.

Tradicionalmente, la Teoría Económica ha considerado que los seres humanos poseen

racionalidad ilimitada. Esto implica asumir que, a la hora de tomar decisiones

económicas, los individuos disponen de toda la información necesaria, todas las

habilidades requeridas para procesar esta información y, además, sin restricciones

temporales. Por consiguiente, la hipótesis de racionalidad ilimitada implica que los

individuos no tienen problemas para tomar la decisión óptima (es decir, aquella decisión

que maximiza su utilidad).

Sin embargo, desde hace algunas décadas, la idea de la racionalidad limitada ha ido

cobrando fuerza, especialmente a partir de los trabajos de Herbert Simon y Daniel

Kahneman8_{. Según este punto de vista, la racionalidad del ser humano está limitada por}

tres dimensiones: la información disponible, la limitación de la mente de cada individuo

(es decir, carencia de habilidad y recursos necesarios para tomar la decisión correcta) y

el tiempo disponible para tomar la decisión (Simon, 1957). Esto quiere decir que los

individuos no utilizan reglas de optimización estrictas para tomar decisiones, sino que

emplean heurísticas que pueden no llevar a resultados óptimos, sino que conducen a

resultados simplemente satisfactorios, debido a los costes de deliberación que el empleo

de reglas de optimización complejas podría acarrear.

Kahneman contribuyó a la Ciencia Económica con su Teoría de las Perspectivas (1979)

según la cual, cuando los seres humanos toman decisiones en entornos de incertidumbre,

se alejan de los principios básicos de probabilidad y recurren a heurísticos. Según esta

teoría, la aversión al riesgo de los individuos puede presentar asimetría en función de si

la decisión tiene por objetivo maximizar ganancias o minimizar pérdidas, siendo la

aversión al riesgo inferior en el segundo caso.

(43)

Posteriormente, Ariel Rubinstein (1998) propuso modelar la racionalidad limitada

especificando explícitamente los procedimientos de toma de decisión.

Dentro del campo del modelado basado en agentes, Young (1998) demuestra que las

dinámicas evolucionistas pueden conducir a un sistema en el que los agentes no tienen

racionalidad ilimitada a los mismos estados de equilibrio que se alcanzan cuando los

agentes sí disponen de ella. Young considera que los agentes no son completamente

‘irracionales’, sino que toman sus decisiones considerando cómo se comportan los otros

agentes del sistema. El comportamiento de los agentes se actualiza endógenamente a

partir de la información que van recibiendo del sistema. Young superaba de esta forma

las principales críticas de Simon a los trabajos de racionalidad limitada en Teoría de

Juegos de Rubinstein (Ariel Rubinstein, 1998: 187-190) recurriendo al uso de modelos

basados en agentes (Schelling 1971, 1978)9_.

A pesar de que en el Modelo de Clases (Axtell, Epstein & Young, 2000), punto de

partida de esta tesis doctoral, se asume que los agentes toman decisiones según una regla

de comportamiento compleja, una de las contribuciones de nuestra investigación fue

comprobar que cuando a los agentes se les dota de reglas de comportamiento heurísticas,

los equilibrios que se alcanzan en el sistema son los mismos que cuando los agentes usan

la regla de decisión empleada en el modelo original (véase sección 3.3.3).

(44)

2.2. TEORÍA DE JUEGOS

2.2.1. INTRODUCCIÓN

La Teoría de Juegos es una rama de las Matemáticas que estudia la toma de

decisiones interdependientes. Es decir, aquellas situaciones en las que el resultado de

la interacción entre individuos no sólo depende de la decisión tomada por cada uno de

ellos individualmente, sino del par de estrategias tomadas por todos ellos en su conjunto.

Un ejemplo sencillo de situación que podría modelarse como un juego es la siguiente: dos

personas que se cruzan al mismo tiempo para atravesar una puerta. ¿Quién pasará

primero? Cada persona tiene dos posibles opciones de comportamiento (que llamaremos

estrategias): pasar primero o ceder el paso. Esta situación tiene tres posibles resultados,

en función del conjunto de las decisiones tomadas por los dos agentes implicados: el

primero, que una persona pase primero y otra después (como resultado de que una

persona decide pasar primero y la otra decide ceder el paso); el segundo, que las dos

personas choquen al tratar de pasar por la puerta al mismo tiempo (porque las dos

personas han decidido pasar primero); y tercero: ninguna de las dos personas pase (como

resultado de que ambas personas deciden ceder el paso).

De los tres resultados posibles que tiene la situación que hemos modelado como un

juego, ¿cuál sería el más deseable? Depende de a quién se lo preguntemos10_{. Si le}

preguntamos a cada una de las personas por separado, probablemente nos dirían que,

para ellas, el mejor resultado sería que pasaran ellos mismos primero, ya que así la

persona que pasa primero estaría ahorrando tiempo a costa de hacérselo perder a la

segunda. Sin embargo, desde un punto de vista externo (suponemos que las dos personas

nos son indiferentes), podríamos opinar que el mejor resultado desde el punto de vista

social es aquél en el que una de las dos personas pasa y la otra cede el paso (sin

importar cuál de las dos personas toma una decisión y cuál toma la otra).

(45)

Aunque el ejemplo anterior resulte muy sencillo, recoge los tres elementos que forman

parte de un juego. Desde un punto de vista más formal, decimos que un juego es una

abstracción formal de una interacción social donde:

a) existen dos o más individuos (jugadores) que toman decisiones,

b) cada jugador tiene dos o más formas de actuar (llamadas acciones o estrategias), y

c) el resultado de la interacción depende de la decisión tomada por todos los jugadores

(Izquierdo, Izquierdo & Vega-Redondo, 2012).

El uso de la Teoría de Juegos no se limita a casos tan sencillos como el ejemplo anterior.

Es muy utilizada en las Ciencias Sociales en campos como las carreras armamentísticas,

posturas en política internacional, etc. Pero lo que a nosotros nos interesa realmente son

las aplicaciones de la Teoría de Juegos en Economía: precio de un nuevo producto

cuando otras empresas tienen productos similares, decidir si pujar o no en una subasta,

etc. En todas estas situaciones, el resultado final no dependerá solamente de nuestra

propia decisión, sino también de las decisiones adoptadas por los demás, razón por la

cual la Teoría de Juegos constituye una buena herramienta para poder analizar dichas

situaciones.

Muchos autores sitúan el origen de la Teoría de Juegos en 1944, con la publicación del

libro “The Theory of Games Behaviour” por John Von Neumann y Oskar Morgenstern

(Ross, 2011), aunque algunas de las ideas de la Teoría de Juegos ya habían sido

anticipadas en el siglo XIX, por los economistas Cournot y Edgeworth (Contreras et al.,

2002).

2.2.2. LA MATRIZ DE PAGOS

Como hemos visto previamente, el resultado de un juego depende del conjunto de las

decisiones tomadas por los individuos participantes. Un elemento fundamental para

representar los posibles resultados del juego en función de las distintas combinaciones de

(46)

Ilustraremos el significado de la matriz de pagos con el dilema del prisionero, un juego

de cooperación bien conocido.

La filosofía de este juego es la siguiente: dos ladrones han sido capturados y la policía no

tiene evidencias suficientes para condenar o liberar a los detenidos, por lo que están

siendo interrogados. Los interrogatorios se están llevando a cabo de tal manera que no

existe ninguna posibilidad de comunicación entre los dos prisioneros. Los prisioneros

pueden elegir entre dos estrategias, cooperar (C) o no cooperar (D). En este juego

existen tres posibles resultados:

- Ambos prisioneros cooperan: los dos niegan haber cometido el crimen (C, C) y

son condenados únicamente a un mes de prisión.

- Ninguno de los dos prisioneros coopera: los dos se traicionan mutuamente (D,

D), y ambos son condenados a 3 meses de prisión.

- Un prisionero coopera negando haber cometido el crimen, y el otro no coopera

admitiendo haber cometido el crimen (C, D) ó (D, C). Al prisionero que ha

admitido cometer el crimen lo dejan libre y al que lo ha negado lo condenan a

12 meses de prisión.

Para representar los distintos resultados del juego, confeccionamos la siguiente matriz de

pagos (Tabla 1):

Jugador 2

Cooperar (C) No Cooperar (D)

Jugador 1 Cooperar (C) 1,1 12,0

No cooperar (D) 0,12 3,3

Tabla 1. Matriz de pagos del juego del dilema del prisionero.

La matriz de pagos recoge los posibles resultados del juego en función de cada

combinación de estrategias elegida por los agentes. El hecho de tener esta información

resumida en una tabla nos ayuda a analizar el resultado del juego.

Aunque en este caso concreto el valor de los pagos (payoffs) que introducimos en la

matriz de pagos tiene un significado real (meses de condena), en general, el valor

concreto del pago representa simplemente de forma ordinal las preferencias de los

jugadores por cada uno de los resultados. Salvo que se indique lo contrario, el hecho de

que los pagos asociados a una estrategia sean mayores que los pagos asociados a otra

(47)

ante la segunda, pero su valor concreto no suele ser representativo en términos

cardinales.

En realidad, la mayoría de los pagos en la Teoría de Juegos Clásica son interpretados

como utilidades de Neumann y Morgenstern, lo que significa que los pagos expresan la

actitud de los jugadores ante el riesgo, de tal manera que puede emplearse la teoría de la

utilidad esperada para evaluar las distribuciones de probabilidad de cada uno de los

posibles resultados del juego11_{(Izquierdo, Izquierdo & Vega-Redondo, 2012).}

¿Cuál será el resultado del juego? Por un lado, como observadores, nos damos cuenta de

que la mejor situación conjunta para los dos jugadores es que ambos cooperen (C, C),

pues, de esta manera, la suma de ambas penas es la menor de los cuatro posibles

resultados del juego. Pero, por otro lado, si nos ponemos en el papel de uno de los

prisioneros, sentiríamos una elevada tentación para traicionar a nuestro compañero (no

cooperar, D) para que nosotros fuéramos liberados a costa de que nuestro compañero

fuera condenado a una pena mayor (12 meses). Vemos, además, que la estrategia no

cooperar (D) permite minimizar daños ante una posible traición de nuestro compañero.

2.2.3. EQUILIBRIO DE NASH Y ÓPTIMOS EN

SENTIDO SOCIAL Y DE PARETO. CONCEPTOS

RELACIONADOS.

Trataremos de entender la racionalidad del juego a partir de la información

proporcionada por la matriz de pagos. Para ello, resulta de vital importancia la

introducción de conceptos tan relevantes como el equilibrio de Nash, el óptimo de

Pareto, el óptimo en sentido social o las estrategias dominantes.

(48)

2.2.3.1. EQUILIBRIO DE NASH

Un equilibrio de Nash es un conjunto de estrategias (una para cada uno de los n

jugadores participantes en el juego) que tiene la propiedad de que la decisión de cada

jugador es la mejor respuesta ante las elecciones de los otros n-1 jugadores (Holt &

Roth, 2004). Es decir, el Equilibrio de Nash describe una situación en la que

ningún jugador tiene ningún incentivo individual para cambiar la estrategia

que actualmente está siguiendo. O lo que es lo mismo, ningún jugador puede

obtener una recompensa mayor mediante un cambio de estrategia.

Retomando como ejemplo del dilema del prisionero, lo que cada prisionero desea es

maximizar su propio beneficio (es decir, reducir su estancia en la cárcel). Sin embargo, el

resultado final del juego no dependerá solamente de la decisión individual de cada

prisionero, sino de la combinación las decisiones de ambos prisioneros. De entre todas las

posibles estrategias, cada jugador escogerá aquella que maximice su beneficio teniendo

en cuenta su expectativa sobre la decisión del otro jugador. Pues bien, decimos

que una combinación de estrategias es un equilibrio de Nash si, aun cuando los

jugadores anunciaran simultáneamente la estrategia que van a seguir, a ninguno de ellos

le interesaría cambiar la estrategia que tenían pensado seguir antes de conocer la

estrategia anunciada por el otro jugador.

Analicemos ahora los posibles equilibrios de Nash en el dilema del prisionero a partir de

la matriz de pagos indicada en la Tabla 1.

Observemos que el par de estrategias (no cooperar, no cooperar) es el único equilibrio de

Nash posible en el dilema del prisionero. Puede comprobarse, a partir de la matriz de

pagos del juego, que cualquier otra combinación de estrategias haría que uno de los

jugadores (o los dos) desearan haber escogido una estrategia distinta al conocer la

estrategia que ha seguido el otro jugador. Sin embargo, cuando la combinación de

estrategias constituye un equilibrio de Nash, aun cuando un jugador anunciara cuál va a

ser su estrategia, el otro jugador no tendría incentivos para cambiar la estrategia que

tenía pensado seguir. Puede comprobarse que esto no ocurre con el resto de pares de las