Gauthier y Danielson: agentes transparentes y maximización restringida

1. Introducción histórica

1.3. Evolución y simulaciones

1.3.4. Gauthier y Danielson: agentes transparentes y maximización restringida

De cualquier manera, seguiré a P. Danielson49_{en su intento de guardar las distancias} oportunas respecto de la sociobiología, para mostrar que los eventuales beneficios que justificasen racionalmente la moralidad tienen que poder encontrarse en el individuo, y no en sus genes o en su especie. O dicho de otro modo, esta exigencia quedaría expresada en la conocida pregunta de Hume:

¿Qué teoría de la moral puede ser útil a cualquier propósito a menos que pueda demostrar que todos los deberes que recomienda representan también el verdadero interés de cada individuo?50

Frente a la influyente tesis de Dawkins y su célebre gen egoísta51_{, marcar esta diferencia} determina que esta investigación mantenga su relevancia para la filosofía moral, y no meramente para la biología o la economía. En cualquier caso, y al margen de que seamos robots programados por nuestros genes para su propio “beneficio”, permaneciendo al nivel del individuo, esta idea de más apto no debe hacer pensar como ocurre a menudo en el éxito inmediato logrado por un agente egoísta que sabe explotar a otros menos avispados. Al contrario, los estudios que vinculan moralidad y teoría de juegos evolutiva nos muestran que en muchos casos la dinámica darwinista selecciona como más aptos a aquellos individuos que muestran conductas altruistas, y es en este sentido que nos interesa destacar el valor adaptativo de las disposiciones morales. Como queda dicho, este valor adaptativo puede observarse sin duda en la especie, o a nivel de genes (según las diversas propuestas que sitúan en uno u otro nivel la unidad sobre la que opera la selección natural). El desafío está en mostrar que este valor adaptativo, este “beneficio de la racionalidad restringida”, se manifiesta también en el individuo

48_{Maynard Smith, 1977, p. 171}

49_{Entre los trabajos de Danielson, me centraré sobre todo en Artificial Morality. Se trata de su primer libro sobre}

simulaciones y “moralidad artificial”, y aunque algunas de sus ideas se encuentran en parte superadas (entre otros por él mismo, en posteriores ensayos) representa sin duda la exposición más clara y novedosa de las posibilidades que ofrece este método los experimentos virtuales para la filosofía moral.

50_{Hume, 1902, sección IX, parte II, p. 228. Evidentemente hay otros modos de entender la ética, que negarían}

rotundamente esta afirmación. Pero en el marco que nos hemos propuesto, la pregunta sobre si es racional actuar moralmente se funda como hemos visto en una idea de racionalidad como maximización del interés individual.

51_{La idea fundamental que Dawkins expone en The Selfish Gene es que el gen, y no el organismo, es la unidad}

última sobre la que opera la selección natural, es decir, la entidad que en último término resulta beneficiada o perjudicada por las conductas de los organismos individuales.

que la ejerce52_{. Y no meramente un individuo movido por impulsos puramente mecánicos, sino} en individuos los de nuestra especie por un lado completamente racionales, es decir, capaces de orientar la acción de acuerdo con las facultades mínimas de una racionalidad instrumental (seleccionar medios factibles para fines dados) y una racionalidad sustantiva (elegir justificadamente entre fines posibles, criticando o revisando eventualmente esa elección) y, por otro, capaces de representarse esta misma racionalidad en sus semejantes.

El punto central donde Danielson hace un esfuerzo por mantener las simulaciones dentro de un contexto relevante para la filosofía práctica es su renuncia a los juegos iterados. En

Artificial Morality emprende una discusión con otros autores53_{, acerca de si en juegos iterados,} ante la perspectiva de futuras interacciones, la cooperación no pasaría a ser una conducta puramente maximizadora, siendo la moralidad de la restricción puramente aparente54_{. Danielson,} junto con Gauthier, sostiene esta última conclusión; y en efecto, lo cierto es que entre las estrategias programadas para el concurso de Axelrod, las más exitosas resultaron ser aquellas que tenían en cuenta la llamada “sombra del futuro”55_{, lo cual les valía entre otras cosas para} cuidarse de futuras represalias (Tit for Tat entre ellas). En 3.5 mostraré que la irrelevancia moral de este interés a largo plazo es justificable sólo cuando suponemos como de hecho era el caso en el concurso de Axelrod la intencionalidad humana del programador que ha desarrollado el algoritmo con el explícito propósito de maximizar la utilidad en juegos iterados. En mi simulación crearé un contexto evolutivo donde los juegos iterados no suponen ningún tipo de intencionalidad en los agentes artificiales. Los experimentos llevados a cabo con simulaciones muestran que la iteración de jugadas es decisiva para fomentar conductas que calificaríamos de “morales”, pero mi idea es que esto no se debe a una expectativa de futuro, sino que puede ser compatible con los agentes racionales à la Gauthier, capaces de resolver el conflicto entre moralidad y racionalidad en situaciones que nunca se repetirán.

Danielson sigue de cerca a Gauthier, representante ya fuera de la metodología que se vale de simulaciones de uno de los esfuerzos más importantes por conciliar la moralidad con la racionalidad “maximizadora”. De Gauthier toma Danielson el concepto de “maximización restringida”, esto es, la capacidad de evitar los efectos perniciosos que en casos como el DP tiene la maximización directa. Y para modelar robots capaces de comportarse como maximizadores restringidos, también toma de Gauthier la noción de agentes “transparentes” o “translúcidos”:

52_{Cfr. Danielson, 1992, p. 42}

53_{Discusión ante todo en torno a las conclusiones de Axelrod, obviamente.} 54_{Cfr. Danielson, 1992, pp. 45 – 50}

éstos son capaces, por un lado, de dar a conocer sus intenciones o disposiciones, y por otro, de reconocer estas disposiciones en los demás. De esta manera Gauthier y Danielson presentan una propuesta para superar el conflicto entre racionalidad y moralidad sin tener que recurrir a la “amenaza” o al “interés” proyectados en futuras interacciones.

La idea es a grandes rasgos la siguiente. De acuerdo con la teoría heredada, en el DP es imposible evitar el resultado subóptimo del fraude mutuo, excepto si hay una expectativa de que el conflicto volverá a repetirse. En este caso, lo que todos los experimentos muestran (virtuales y reales) es que los agentes, ya sean bacterias o estudiantes de economía, tienden rápidamente hacia conductas cooperativas, pues la repetición de jugadas da oportunidades sucesivas tanto a la posibilidad de mostrar buena voluntad para iniciar una cooperación sostenida, como al procedimiento de “castigar” a quien no acepta entrar en una dinámica cooperativa, cosa que redunda en perjuicio de éste. No es difícil encontrar en esta dinámica temporal una posible explicación al hecho de que, pese a todo, no vivamos en un estado de naturaleza hobbesiano. Sin embargo, lo que Gauthier se pregunta es cómo poder conseguir el resultado cooperativo, mucho más beneficioso que la defección mutua prevista o incluso prescrita por la teoría, cuando se sabe

que no habrá futuras ocasiones para proseguir cooperando. Su respuesta es que de algún modo

tiene que ser posible reconocer a priori la disposición o “intención” del otro, de manera que sea factible cooperar con él, si anticipamos que él también cooperará, o defraudar para no dejarnos explotar si sabemos que él no cooperará. El otro punto clave es que no basta una depurada habilidad para adivinar las intenciones ajenas, sino que además debemos poseer nosotros una genuina disposición cooperativa cuando el caso lo requiera: debemos ser capaces de restringir en nosotros mismos el imperativo de la maximización, para no “caer en la tentación” de aprovecharnos de las disposiciones cooperativas que percibimos en los demás. A este tipo de disposición la denomina Gauthier “maximización restringida”56_{y Danielson, encarnando este} criterio en algoritmos que regulan agentes artificiales, lo llama “cooperación condicional”57_.

Los primeros experimentos virtuales de Danielson se fundan en el análisis detallado de unas pocas estrategias seleccionadas de antemano como relevantes para el estudio del conflicto entre moralidad y racionalidad. En este sentido padecen del mismo inconveniente que señalábamos anteriormente en relación con los primeros planteamientos de Axelrod: están demasiado orientados por ciertas nociones previas de racionalidad y moralidad, que deberían ser la conclusión de una prueba evolutiva, y no el punto de partida. Hay que decir en cualquier caso que Danielson tampoco pretendía que sus primeros tests fuesen evolutivos en un sentido estrictamente biológico:

56_{Cfr. Gauthier, 2000, cap. 6} 57_{Cfr. Danielson, 1992, cap. 4}

[...] while genetic reproduction leads to organisms with intrinsec reproductive interests, artificial justification need make no similar assumption. Our agents should care about scoring but scoring need not be connected to reproduction.58

[…] Morality even rational morality must admit the survival of the frustrated.59

Por tanto, el interés que presentan las primeras simulaciones de Danielson no está tanto en su carácter “darwinista”, sino en entablar un diálogo muy interesante con Gauthier, discutiendo las ideas de éste con la ayuda de agentes artificiales. Los detalles de la dinámica evolutiva son, pues, limitados: se consideran los resultados en una población muy reducida, y sin posibilidad de introducir azarosamente nuevas estrategias “mutantes”60_{. Las variaciones son introducidas por el} propio experimentador, y el orden en que éstas son incluidas en la población afectan al éxito instrumental de las diversas estrategias o disposiciones; en cualquier caso Danielson es claramente consciente de estos inconvenientes y consigue que el hilo central de su argumentación no dependa de estos pormenores61_{. Sin embargo estos primeros laboratorios} virtuales de Danielson no aprovechan todo el potencial que ofrecería un modelo informático, en la medida en que se queda anclado en un análisis demasiado deductivo lo cual, hay que repetir, no deja de ser el ideal de ciencia, sin experimentar lo que deviene a posteriori en una simulación ejecutada a lo largo de muchas generaciones. Para la filosofía moral, el interés de estos estudios que se valen de herramientas informáticas reside en que pueden ayudar a los intentos de justificación normativa que constituyen la historia de la ética. Que esta tarea es harto complicada queda evidenciado en la propia historia de la filosofía moral, que hasta el momento no ha proporcionado ninguna justificación indiscutible. En este sentido, el enfoque adoptado para esta investigación no tiene más pretensiones que la de intentar iluminar algunos aspectos relacionados con el origen de nuestras disposiciones morales. Una perspectiva evolutiva resulta mucho más efectiva a la hora de explicar la existencia de dichas disposiciones, que podemos considerar un hecho, por lo menos en cuanto que pese al fracaso en la búsqueda de una justificación última, nos movemos permanentemente en un mundo de valoraciones y normas. Pero si no nos conformamos con esta tarea más modesta, meramente explicativa, el otro punto de referencia para esta investigación está en la obra de David Gauthier, por ser probablemente el filósofo contemporáneo que con más claridad y ambición ha planteado la pregunta clásica de Trasímaco, en términos aceptables por científicos sociales. El pensamiento de Gauthier, cuya

58_{Danielson, 1992, p. 43} 59_{Danielson, 1992, p. 102}

60_{En Modelling Morality and Evolution (1998) Danielson sí se ocupa de modelos que simulan también mutaciones y}

“recombinaciones genéticas”.

exposición más completa se halla en Moral por acuerdo, intenta superar el conflicto entre moralidad y racionalidad desplazando la noción de racionalidad heredada de las acciones mismas a las disposiciones que tenemos para realizar condicionalmente ciertas acciones. Sin llegar a adoptar explícitamente un planteamiento evolutivo, su enfoque es un paso adelante respecto de la teoría heredada (la teoría de juegos que, en lo básico, quedó formalizada por von Neumann y Morgenstern) por cuanto que la elección racional no se aplica directamente a acciones, sino a ciertas reglas o criterios para escoger dichas acciones62_{. Con ello se flexibiliza lo que en la teoría} de juegos clásica es siempre una elección puntual: el resultado de un juego depende siempre solamente de la estructura de los pagos. En el enfoque de Gauthier, los resultados de un mismo juego pueden variar, dependiendo de las disposiciones de los agentes. Sin embargo, Gauthier insiste en que sus argumentos pueden ser válidos para una sola interacción, es decir, sin recurrir a la reiteración de jugadas (como Axelrod) que favorecen la cooperación gracias a la expectativa de futuras interacciones. Como dijimos anteriormente, Gauthier se vale para ello del artificio teórico de los agentes transparentes (o translúcidos) de los cuales podemos conocer su

disposición a obrar. En combinación con nuestra propia disposición, dentro de un mismo juego

pueden resultar diversas decisiones: la pregunta, pues, acerca de la racionalidad del agente recae no sobre su acción, sino sobre la regla o disposición de la que se deriva. Como argumento teórico el planteamiento es totalmente legítimo, y Gauthier no cree necesario concretar el modo en que, en la práctica, podríamos ser transparentes y podríamos ser capaces de mirar la translucidez ajena. Por mi parte construiré esta transparencia sobre la idea de que los diversos grados de translucidez que podemos encontrar en el comportamiento real se reducen en último término a un juego de reputaciones basado en la experiencia (por vaga e imprecisa que sea ésta). En mi modelo informático, los agentes artificiales tienen la posibilidad de observar las conductas de los demás e ir formándose “inductivamente” a partir de ellas una idea de las disposiciones ajenas.

Por el contrario, el modelo de Danielson trabaja directamente con agentes artificiales totalmente transparentes que pueden literalmente leer los algoritmos de los demás. Esto no quita validez a su modelo por “poco realista”, pues esta técnica empleada por Danielson es sólo un recurso de programación, y en mano del experimentador queda el interpretar de qué modo dichos agentes podrían ser transparentes fuera del modelo. Sin duda esto presenta la ventaja de la simplicidad, pero tiene ciertos inconvenientes relativos a la circularidad en la que se verían los individuos que conociesen las disposiciones ajenas (y las propias), quedándose encerrados en un circuito de expectativas mutuas, pero sin poder dar un primer paso hacia la acción. Muy resumidamente, el problema de los cooperadores condicionales (“maximizadores restringidos” en Gauthier) es el siguiente: si A conoce la disposición condicional de B, y B conoce la

disposición condicional de A, lo que ambos saben es que el otro estaría dispuesto a cooperar si uno mismo también está dispuesto a hacerlo. Pero fuera de esta condición, ninguno puede saber que, en efecto, el otro cooperará, con lo cual no pueden decidirse por una acción en concreto. En 3.7 descubriremos que este problema no es una mera dificultad de programación, sino que es inherente a la interacción entre seres que además de poseer sus propias intenciones, se representan las intenciones de los demás. En mi modelo el grado máximo de abstracción que caracteriza la transparencia total queda rebajado a mera translucidez, donde los agentes pueden equivocarse en su evaluación de las disposiciones ajenas, pero pueden siempre, en último término, realizar una acción, precisamente porque renuncian a hacerse una idea perfecta de lo que será la actitud del otro.

La estructura propia de las situaciones que en teoría de juegos se conocen como “estratégicas” conduce a una recursividad donde la decisión de un agente A depende de las expectativas sobre la acción del otro agente B, quien a su vez actúa en función de lo que espera que haga A, sabiendo ambos que se encuentran en este tipo de estructura indefinidamente circular. Cuando este tipo de regresión se origina por el imperativo de escoger una acción

óptima, tendremos ocasión de ver cómo la teoría de juegos permite romper esta circularidad

mediante el concepto de equilibrio (aunque hay juegos que no tienen un único equilibrio, ni siquiera empleando estrategias mixtas). Así, incluso en situaciones estratégicas es posible tomar una decisión óptima. Sin embargo, cuando la circularidad se debe al intento de descubrir cuál es la disposición ajena, es preciso poner un límite a esta búsqueda, aunque sea un límite arbitrario, renunciando al ideal optimizador.63

63 _{Ésta es precisamente la propuesta de Simon al introducir en su concepto de racionalidad limitada (bounded} rationality), en un intento de hacer la teoría de la elección en sus aspectos tanto descriptivo como normativo

más próxima a los comportamientos y limitaciones de los agentes reales, muy alejados en la práctica de los maximizadores omniscientes y perfectamente racionales del enfoque clásico. Dadas las limitaciones reales impuestas a la toma de decisiones (tiempo, coste del análisis de alternativas, capacidad de cálculo finita, etc.) en ocasiones puede resultar irracional alcanzar una decisión totalmente racional. También las investigaciones en IA corroboran las restricciones que sufren incluso agentes artificiales, con capacidades de cálculo muy superiores a los de un ser humano, ya que no se trata de una cuestión de “potencia” sino de la propia estructura recursiva de ciertos razonamientos. Los fundamentos de una teoría de la racionalidad limitada se encuentra en la obra Simon, Models of

Man (1957). La idea de Simon es ofrecer una alternativa al modelo tradicional de elección racional entendido como

maximización bayesiana. Sin renunciar a la maximización bayesiana para la toma de decisiones, lo que defenderé en las secciones 3.5 – 3.7 es la necesidad de imponer algún tipo de limitación al proceso de búsqueda orientado a hacerse una idea perfectamente acabada de cuáles son las disposiciones ajenas (transparencia). Para una introducción al tema, véase los dos primeros capítulos de Gigerenzer y Selten, Bounded Rationality: The Adaptative

1.3.5 Skyrms: evolución biológica y cultural. Una ampliación de las simulaciones

In document Juegos evolutivos y conducta moral un análisis mediante simulaciones informáticas del surgimiento y justificabilidad de conductas no maximizadoras en contextos estratégicos (página 34-40)