TEORIA DE JUEGOS OK.doc

(1)

TEORÍA DE JUEGOS Y ESTRATEGIAS

OBJETIVOS

 Introducir los principales conceptos y resultados matemáticos de la Teoría de Juegos.

 Analizar situaciones de conflicto y estudiar los diferentes tipos de modelos.

 Conocer los resultados básicos relativos a cada uno de estos tipos de modelos. El alumno debe ser capaz de construir un modelo matemático adecuado para poder analizar y resolver situaciones de conflicto en las que intervienen dos o más decidores que tienen diferentes intereses y cuyos resultados dependen, en general, de las acciones adoptadas por todos ellos.

SUMARIO

Juego.- Juegos de suma cero de dos personas.- Punto de silla de montar.-Dominancia.- Valor del juego.- Estrategia pura.- Estrategia mixta.- Criterio maximin.

La teoría de juegos es una teoría matemática que estudia de manera formal y abstracta las características generales de las situaciones competitivas que pueden ser: juegos de mesa, campañas militares, políticas publicitarias, comercialización del mismo producto por dos (o más) empresas, competencias por la misma cantidad de recursos; y en general, situaciones de conflicto entre dos (o más) adversarios.

En ésta teoría se identifica y hace énfasis en el proceso de toma de decisiones de los adversarios enfrentados, suponiendo que se llega a determinado resultado por la combinación de estrategias seleccionadas por cada opositor, que actúa aplicando su estrategia racionalmente, con una cierta lógica, y que solo actúa buscando su beneficio, sin consideración a su oponente.

Los criterios para la toma de decisiones bajo incertidumbre se han desarrollado bajo la

hipótesis de que la “naturaleza” es el oponente, en este aspecto la naturaleza no es

malévola. Este capítulo trata de las decisiones con incertidumbre comprendiendo dos o más oponentes inteligentes donde cada componente aspira a optimizar su propia decisión, pero a costa de los otros. Ejemplos típicos incluyen desarrollar campañas publicitarias para productos competitivos y planear tácticas destinadas a los bandos contendientes.

1.- JUEGO DE DOS PERSONAS CON SUMA CERO

En la teoría de juegos, existe un jugador y un oponente. Cada jugador tiene un número de elecciones finito o infinito, llamadas

estrategias

. Los

resultados o

pagos

de un juego se resumen como funciones de las diferentes estrategias para cada

jugador. Un juego con dos jugadores, donde la ganancia de un jugador es

igual a la perdida del otro

, se conoce como un

juego de dos personas

y suma cero

. En tal juego es suficiente expresar los resultados en términos de pago a

un jugador. En general se emplea una matriz para resumir los pagos al jugador cuyas estrategias están dadas por los renglones de la matriz.

(2)

 Ejemplo 1. Para ilustrar las definiciones de un juego de dos persona y suma

cero considere un juego de “igualar” monedas, en el cual cada uno de dos jugadores A y B elige Cara (C) o Sello (S). Si son iguales los dos resultados (esto es, C y C o S y S), el jugador A gana $1.00 al jugador B. De otra manera, A pierde $1.00 que paga a B.

 En este juego cada jugador tiene dos estrategias C o S. Esto proporciona la siguiente matriz de juegos 2X2 expresadas en términos del pago al jugador A.



 La solución “óptima” a tal juego puede necesitar que cada jugador emplee una sola estrategia denominada estrategia pura (por ejemplo C o S) o una mezcla de estrategias puras. El último caso se conoce como la selección de

estrategia mixta

.



 Solución Optima de Juego de Dos Personas y Suma Cero:



 La selección de un criterio para resolver un problema de decisión depende mucho de la información disponible. Los juegos representan el último caso de falta de información donde los oponentes inteligentes están trabajando en un medio circundante conflictivo. El resultado es que un criterio

muy conservador

generalmente esta propuesto para resolver juegos de dos personas y suma cero, llamado el criterio

maximin (jugador) – minimax (oponente)

. La principal diferencia es que la

"naturaleza” no esta considerada como un oponente activo, o (malévolo) en tanto que en la teoría de juegos cada jugador es inteligente y por tanto, activamente trata de derrotar a su oponente.



 Para adaptarse al hecho de que cada oponente esta trabajando en contra de los intereses del otro, el criterio minimax elige la estrategia (mixta o pura) de cada jugador que proporciona el mejor de los peores resultados posibles. Se dice que se alcanza una solución óptima si ningún jugador encuentra beneficioso alterar su estrategia. En este caso se dice que el juego es estable o se encuentra en estado de equilibrio.

 Ya que la matriz del juego generalmente se expresa en términos del pago al

jugador A

(cuyas estrategias están representadas por los renglones), el criterio

(conservador) requiere que A seleccione la estrategia (mixta o pura) que maximice su

ganancia mínima

; el mínimo se toma sobre todas las estrategias del jugador B. Por el

mismo razonamiento,

el jugador B (oponente)

elige su estrategia que

minimice sus máximas pérdidas. De nuevo el máximo se toma sobre todas las

estrategias de A.

(3)

 El siguiente ejemplo ilustra los cálculos de los valores minimax y maximin de un juego:



 Ejemplo 2. Considere la matriz de pagos siguiente que representa la ganancia

del jugador A. Los cálculos de los valores minimax y maximin se muestran en la matriz 



 Cuando el jugador A juega su primera estrategia, puede ganar 8, 2, 9 ó 5, dependiendo de la estrategia elegida por el jugador B. Puede garantizar, sin embargo, una ganancia de por lo menos mín{8, 2, 9, 5} = 2, independientemente de la estrategia elegida por B, de igual manera, si A juega su segunda estrategia, garantiza al menos un ingreso de al menos min{6, 5, 7, 18} = 5; si juega su tercera estrategia, garantiza un ingreso de por lo menos min{7, 3, -4, 10} = -4. Por consiguiente el valor mínimo en cada renglón representa la ganancia mínima garantizada a A si éste juega sus estrategias puras. Estas se indican en la matriz anterior como “mínimo de renglón”. Ahora, el jugador A, eligiendo su segunda

estrategia, esta maximizando su ganancia mínima. Esta ganancia esta dada por máx{2,5,-4} = 5. La selección del jugador A se llama estrategia maximin, y su ganancia correspondiente se conoce como valor maximin (o inferior) del juego.

 El jugador B por otra parte, quiere minimizar sus pérdidas. Observa que si juega su primera estrategia pura, puede perder no más que máx{8, 6, 7} = 8, independientemente de las selecciones de A. Un argumento similar puede también ser aplicado a las tres

estrategias restantes. Los resultados correspondientes por lo tanto se indicaron en la matriz anterior como ”máximo de columna”. El jugador B seleccionará entonces la estrategia que minimice sus pérdidas máximas. Esto lo toma en cuenta la segunda estrategia y su pérdida correspondiente está dada por mín{8, 5, 9, 18} = 5. La selección del jugador B se conoce como la estrategia minimax y su pérdida correspondiente se llama valor mimimax (o superior) del juego.

De las condiciones que gobiernan el criterio minimax, el valor minimax (superior) es mayor que o igual al valor máximo(inferior). En el caso donde ocurre la igualdad, esto es, valor mimimax = valor maximin, las estrategias puras correspondientes se conocen como estrategias “óptimas” y se dice que el juego tiene un punto de silla. El valor del juego, dado por la cantidad común de las estrategias puras óptimas, es igual a los valores maximin y minimax. La “Optimalidad” significa aquí que ningún jugador está tentado a cambiar su

(4)

estrategia, ya que su oponente puede contraatacar eligiendo otra estrategia que proporcione pagos menos atractivos. En general, el valor del juego debe satisfacer la desigualdad:

valor maximin (inferior)



valor del juego



valor mínimax (superior)

En el ejemplo anterior, el valor maximin = valor minimax = 5. Esto significa que el juego tiene un punto de silla en (2,2) en la matriz. El valor del juego, por consiguiente, es igual a 5. Observe que ningún jugador puede mejorar su posición seleccionando alguna otra estrategia.

2.- JUEGO ENTRE DOS PERSONAS: ESTRATEGIAS MIXTAS

La sección anterior muestra que la existencia de un punto de silla proporciona inmediatamente las estrategias puras óptimas para el juego. Sin embargo, algunos juegos no tienen punto de silla. Por ejemplo, considere el siguiente juego de suma cero:

El valor mimimax (= 4) es mayor que el valor maximin (= 2). Por consiguiente, el juego no tiene un punto de silla y las estrategias puras maximin- minimax no son óptimas. Esto es cierto ya que cada jugador puede mejorar su pago eligiendo una estrategia diferente. En este caso, se dice que el juego es inestable.

El fracaso de las estrategias mínimas - maximin (puras), en general, para dar una solución óptima al juego ha llevado a la idea de usar estrategias mixtas. Cada jugador en lugar de seleccionar una estrategia pura solamente, puede jugar todas sus estrategias de acuerdo con un conjunto predeterminado de probabilidades. Sean x1, x2,…, xm y y1, y2,…,yn las

probabilidades del renglón x y de columna y por las cuales A y B, respectivamente, seleccionarán sus estrategias puras. Entonces



    m i i x 1 n 1 j j 1 y xi, yj 0, para toda i y j

(5)

Por consiguiente, si aij representa el (i, j)-ésimo elemento de la matriz del juego, xi y yi

aparecerán como en la matriz siguiente:

La solución del problema de estrategias mixtas mediante la programación lineal está basada también en los criterios maximin (jugador A) y minimax (oponente B). La única diferencia es que A elige sus estrategias y probabilidades xi la cual maximiza el pago esperado más pequeño en una columna dado que el oponente usa una determinada estrategia, en tanto que B selecciona yj la cual minimiza el mayor pago esperado en un renglón dado que el jugador usa una determinada estrategia. Matemáticamente el criterio

maximin para una estrategia mixta está dado como sigue. El jugador A elige xi (xi0,



  m 1 i xi 1) lo cual proporcionará            

_

   m 1 i m 1 i m 1 i i in i i2 i 1 i x min a x , a x ,..., a x máx

i = max(min(I1, I2, …In)) = max v

y el jugador B selecciona yj ( yj  0,



_  n 1 j yj 1) lo cual proporcionará              



   n 1 j n 1 j n 1 j j mj j 2j j j 1 y máx a y, a y,..., a y min

j = min (max(P1, P2, ..Pm)) = min w

Estos valores se denominan pagos

maximin y minimax esperados

, respectivamente

Como en el caso de estrategias puras, se verifica la relación:

pago esperado minimax  pago esperado maximin

Cuando xi y yj corresponden a la solución óptima, se cumple la igualdad y los valores

resultantes llegan a ser iguales al valor esperado (óptimo) del juego.

Si xi* y yj* son dos soluciones óptimas para ambos jugadores cada elemento de pago aij

estará asociado a la probabilidad (xi*yj*). Por consiguiente, el valor esperado óptimo del

juego es v* =



  m 1 i n 1 j * j * i

y

x

aij = pAq

(6)

Ejemplo. ¿Cuál es la ganancia esperada para A en el juego de matriz 3x4 A =               3 3 4 1 2 1 2 3 0 3 1 2

a) Si A adopta la estrategia mixta [1/3 1/2 1/6] y B adopta la estrategia mixta

            2 / 1 8 / 1 8 / 1 4 / 1

b) Si A y B aplican estrategias puras escogiendo el segundo renglón y la tercera columna respectivamente?

Solución:

Para dar solución al problema aplicaremos la relación: v=pAq

Donde:

V es el valor del juego.

p es el vector de probabilidades que define la estrategia del jugador 1. q es el vector de probabilidades que define la estrategia del jugador 2. A es la matriz de resultados del juego

Entonces tenemos: a) v=pAq =[1/3 1/2 1/6]               3 3 4 1 2 1 2 3 0 3 1 2             2 / 1 8 / 1 8 / 1 4 / 1 =[1/3 1/2 1/6]           3/8 8 / 11 4 / 3 = 7/8 = 0,875

Lo cual significa que el jugador 1 gana al final del juego 0.875, y el jugador 2 pierde 0.875. b) Aquí p=[0 1 0] y q =             0 1 0 0 . Entonces v = [0 1 0]               3 3 4 1 2 1 2 3 0 3 1 2             0 1 0 0 .= [0 1 0]            3 1 3 = -1

Está claro que ésta es la componente 2,3 de la matriz A, lo cual significa que al aplicar cada jugador su estrategia pura, el resultado del juego es que el jugador 1 pierde 1 y el jugador 2 gana 1.

3.- JUEGOS DE MATRIZ Y PROGRAMACION LINEAL

 La teoría de juegos tiene relación estrecha con la programación lineal, ya que todo juego finito de dos personas y suma cero puede expresarse como un problema lineal y,

(7)

recíprocamente, todo problema lineal puede representarse como un juego. Aquí se pondrá énfasis al uso de la teoría dual de programación lineal.

Ejemplo 1. Considere el siguiente juego de matriz de 3x4; encuentre las estrategias

óptimas, así como el valor del juego.

Solución:

Sea xi la probabilidad que tiene A de escoger la acción i y yj la probabilidad que tiene B de escoger la acción j

Determinación del Modelo Matemático para el jugador A

(maximin):

Si el jugador B escoge la acción yj, el ingreso esperado (Ii) para el jugador A será:

Aplicando el criterio maximin, donde el jugador A espera el peor resultado Min{I1, I2, I3, I4}= v

pero como el jugador A debe maximizar su ingreso mínimo, se tiene Máx v

además, cualquier Ij v

Por lo tanto el modelo matemático para el jugador A será: Función Objetivo: Máx v

(8)

Sujeto a: 2x1 + 3x2 + 1x3 v -1x1 - 2x2 + 4x3 v 3x1 - 1x2 + 3x3 v 0x1 + 2x2 -3x3 v x1 + x2+ x3 = 1 xi  0 i=1,2,3

Determinación del Modelo Matemático para el

jugador B:

Si el jugador A escoge la acción ai, la pérdida esperada (Pj) para el jugador B será:

P1 = 2y1 - 1y2 + 3y3 + 0y4 , si A escoge a1

P2 = 3y1 - 2y2 - 1y3 + 2y4 , si A escoge a2

P3 = 1y1 +4y2 + 3y3 - 3y4 , si A escoge a3

Aplicando el criterio minimáx, donde el jugador A espera el peor resultado Máx{P1, P2, P3}= w

pero como el jugador B debe minimizar su pérdida máxima, se tiene Min w

además, cualquier Pj  w

Entonces: P1 = 2y1 - 1y2+ 3y3 + 0y4w

P2 = 3y1 - 2y2 -1y3 + 2y4 w

P3 = 1y1 + 4y2+ 3y3 - 3y4 w

Por otro lado: y1 + y2+ y3 + y4 =1

Por lo tanto el modelo matemático para el jugador B será: Función Objetivo: Min w

Sujeto a: 2y1 - 1y2+ 3y3 + 0y4w

3y1 - 2y2 -1y3 + 2y4 w

1y1 + 4y2+ 3y3 - 3y4 w

y1 + y2+ y3 + y4 = 1

(9)

En este caso v y w representan el valor del juego para el jugador A y B respectivamente, siendo v=w ya que el modelo matemático del jugador B es el Dual del modelo matemático del jugador A.

Aplicando el Software LINDO para resolver los modelos matemáticos tenemos: Salida del LINDO para el modelo del jugador A:

Máx v St 2x1 + 3x2 + 1x3 -v  0 -1x1 - 2x2 + 4x3 -v  0 3x1 - 1x2 + 3x3 -v  0 0x1 + 2x2 -3x3 -v  0 x1 + x2+ x3 = 1 End

LP OPTIMUM FOUND AT STEP 4 OBJECTIVE FUNCTION VALUE 1) 0.1818182

VARIABLE VALUE REDUCED COST V 0.181818 0.000000 X1 0.000000 0.636364 X2 0.636364 0.000000 X3 0.363636 0.000000

ROW SLACK OR SURPLUS DUAL PRICES 2) 2.090909 0.000000 3) 0.000000 -0.454545 4) 0.272727 0.000000 5) 0.000000 -0.545455 6) 0.000000 0.181818 NO. ITERATIONS= 4

En esta solución se tiene lo siguiente: Solución del modelo para el jugador A: El valor del juego, v = 0,1818182 y la estrategia óptima (po):

x1 = 0.000000 x2 = 0.636364 x3 = 0.363636

Solución del modelo para el jugador B (solución del Dual): El valor del juego, w = 0,1818182 y

la estrategia óptima (qo):

y1 = 0.00000 y2 = 0.454545 y3 = 0.000000 y4 = 0.545455

Por lo tanto las estrategias óptimas serían: Para A: po = [ 0.000000 0.636364 0.363636 ]

(10)

 Lo que implica que si ambos jugadores quieren optimizar sus resultados deberán realizar lo siguiente:

 El jugador A nunca deberá aplicar la estrategia 1, la estrategia 2 deberá aplicarla el 63.6364% de las veces y la estrategia 3 el 36.3636%. Al final del juego ganará 0.1818182, valor que representa su ganancia máxima.

 El jugador B nunca deberá aplicar las estrategias 1 y 3, la estrategia 2 deberá aplicarla el 45.4545% de las veces y la estrategia 4 el 54.5455%. Al final del juego perderá 0.1818182, valor que representa su pérdida mínima.

 Cabe señalar que si alguno de los jugadores cambia su estrategia, su resultado del juego empeorará, ya que el otro adversario (inteligente) modificará la suya sacando provecho del error cometido.

APLICACIONES

APLICACIÓN 1.- En el horario de 8 a 9 p.m., Panamericana (PANTEL) y América televisión

compiten por la audiencia de 10 millones de espectadores. Las cadenas televisivas deben anunciar en forma simultánea el espectáculo que emitirán en ese horario. Las elecciones posibles de cada cadena y el número de televidentes de Panamericana, en millones, aparecen en la tabla A, para cada elección. Por ejemplo, si ambas cadenas escogen una película de acción, la matriz indica que 3.5 millones escogerán Panamericana y 10 – 3.5 = 6.5 millones verán América. Así tenemos un juego de dos personas con juego constante, con c = 10 (millones). ¿Tiene este juego un punto de silla? ¿Cuál es el valor del juego para cada cadena?

Tabla A SOLUCIÓN

Aplicando los criterios maximin y minimáx para Pantel y América TV respectivamente, se tiene que este juego tiene un punto de silla en el punto (2,1), por lo que no se requiere de la aplicación de estrategias mixtas para la obtención de las estrategias correspondientes. En este caso se aplicarán estrategias puras.

Para Pantel su estrategia pura será Po = [0 1 0] Para América TV será Qo=

          0 0 1

(11)

Entonces aplicamos la relación V=Po*A*Qo, donde A es la matriz del juego. V=





                    0 0 1 7 4 . 1 8 . 3 5 8 . 5 5 . 4 6 5 . 1 5 . 3 0 1 0 V =





          0 0 1 5 5.8 4.5 V = 4.5

Esto quiere decir que Pantel en el horario de 8 a 9am deberá siempre ofrecer Telenovela, mientras que Panamericana deberá ofrecer siempre Película de acción, el resultado será que Pantel se queda con 4.5 millones de televidente (valor del juego V), mientras que Panamericana se quedará con el resto (10 - 4.5) 5.5 millones de televidentes.

APLICACIÓN 2.- Determínese las estrategias óptimas y el valor del juego para A y B en el

juego de matriz de 3x3, cuya matriz de pagos es:

SOLUCIÓN

Aplicando los criterios maximin y minimáx para el jugador A y B respectivamente, se tiene que este juego no tiene punto de silla, por lo que no es posible aplicar estrategias puras, hay que aplicar estrategias mixtas.

A continuación se plantean los modelos matemáticos respectivos para que cada jugador determine sus estrategias óptimas.

Modelo matemático para el jugador A: Función Objetivo: Máx V Sujeto a: 2X1 – 2X2 + 1X3 >= V 1X1 + 2X2 + 0X3 >= V 1X1 + 3X2 + 2X3 >= V X1 + X2 + X3 = 1 Xi >=0, i= 1, 2, 3 Modelo matemático para el jugador B: Función Objetivo: Min W

(12)

-2Y1 + 2Y2 + 3Y3 <= W

1Y1 + 0Y2 + 2Y3 <= W Y1 + Y2 + Y3 = 1

Yj >=0, j= 1, 2, 3

Aplicando el software Lindo para obtener la solución del modelo matemático del Jugador A, se tiene:

LP OPTIMUM FOUND AT STEP 4 OBJECTIVE FUNCTION VALUE 1) 1.200000

VARIABLE VALUE REDUCED COST V 1.200000 0.000000

X1 0.800000 0.000000 X2 0.200000 0.000000 X3 0.000000 1.000000

ROW SLACK OR SURPLUS DUAL PRICES 2) 0.000000 -0.200000

3) 0.000000 -0.800000 4) 0.200000 0.000000 5) 0.000000 1.200000 NO. ITERATIONS= 4

Aplicando el software WINQSB se tiene los siguientes resultados: Ingreso de datos:

Tabla de resultados:

Ambas herramientas de software dan los mismos resultados y estos son: Valor del juego V = 1.2

Estrategias óptimas: Po =



0.8 0.2 0



Qo =           0 8 . 0 2 . 0 Interpretación:

El Jugador A ganará 1.2, mientras que el jugador B perderá 1.2, siempre y cuando cada uno aplique sus estrategias óptimas.

El jugador A para maximizar su ganancia deberá aplicar la estrategia 1 el 80% de las veces y la 2 el 20% de las veces. La estrategia 3 no deberá aplicarla nunca.

(13)

El jugador B para minimizar su pérdida deberá aplicar la estrategia 1 el 20% de las veces, la 2 el 80% Y nunca la estrategia 3.

APLICACIÓN 3.- Pepsi Cola y Coca Cola, son dos firmas que dominan un mercado en

particular y, de hecho, forman un duopolio. A través de los años han aprendido a restringir la competencia en los precios y a competir sólo a través de la publicidad. Pepsi Cola determinó que si disminuye su tiempo diario de publicidad en TV, perderá el 4% del mercado si Coca Cola mantiene el suyo, y el 10% del mercado si Coca Cola aumenta su tiempo de publicidad. Si Pepsi Cola conserva su tiempo diario de publicidad en TV, gana el 3% si Coca Cola lo disminuye; y pierde el 5% si Coca Cola lo aumenta. Finalmente si Pepsi Cola aumenta su tiempo de publicidad en TV, gana el 8% si Coca Cola disminuye el suyo, y pierde el 1% si Coca Cola conserva el suyo.

a) Determine las estrategias óptimas para Pepsi Cola y Coca Cola.

b) Encuéntrese el porcentaje de mercado que cada empresa gana o pierde al aplicar su mejor estrategia.

SOLUCIÓN:

Las alternativas en estrategias para las empresas de bebidas son: 1. Disminuir el tiempo diario de publicidad en TV

2. Mantener el tiempo diario de publicidad en TV 3. Incrementar el tiempo diario de publicidad en TV La matriz del juego es la siguiente:

Aplicando los criterios maximin y minimáx para Pepsi Cola y Coca Cola respectivamente, se tiene que este juego no tiene punto de silla por lo que no es posible aplicar estrategias puras, hay que aplicar estrategias mixtas.

A continuación de plantean los modelos matemáticos respectivos para que cada jugador determine sus estrategias óptimas.

Modelo Matemático para Pepsi Cola:

Función Objetivo: Máx V Sujeto a: 0X1 + 3X2 + 8X3 >= V -4X1 + 0X2 - 1X3 >= V -10X1 - 5X2 + 0X3 >= V X1 + X2 + X3 = 1 Xi >=0, i= 1, 2, 3

Modelo Matemático para Coca Cola:

Función Objetivo: Min W

Sujeto a: 0Y1 - 4Y2 - 10Y3 <= W 3Y1 + 0Y2 - 5Y3 <= W 8Y1 - 1Y2 + 0Y3 <= W

(14)

Y1 + Y2 + Y3 = 1 Yj >=0, j= 1, 2, 3

Aplicando el software Lindo para obtener la solución del modelo matemático de Pepsi Cola, se tiene:

Da como resultado que no tiene solución, esto es por las características del modelo. Utilizando el WINQSB tenemos el siguiente reporte:

Por lo tanto el valor del juego es V = 0 y las estrategias óptimas para cada empresa competidora es:

Estrategia óptima para Pepsi Cola: PO =



0 0.17 0.83



Estrategia óptima para Coca Cola: QO =           17 . 0 83 . 0 0

Observe que el valor del juego es cero, esto debe siempre comprobarse aplicando la relación V=Po*A*Qo V=





                        17 . 0 83 . 0 0 0 1 8 5 0 3 10 4 0 83 . 0 17 . 0 0 _{= -0.8334}

Esto quiere decir que el valor de juego real es de -0.8334. Interpretación:

De acuerdo a los resultados, Pepsi Cola deberá aplicar las estrategias 2 y 3 y nunca la 1. Esto quiere decir que deberá mantener su tiempo de publicidad en TV con una frecuencia del 17%; deberá incrementar su tiempo de publicidad en TV con una frecuencia del 83%; nunca deberá aplicar la estrategia de disminuir su tiempo de publicidad en TV. Mediante este mix de estrategias logrará maximizar el número de televidentes.

Por su parte, Coca Cola, deberá aplicar las estrategias 2 y 3 y nunca la 1. Esto quiere decir que deberá mantener su tiempo de publicidad en TV con una frecuencia del 83%; deberá incrementar su tiempo de publicidad en TV con una frecuencia del 17%; nunca deberá aplicar la estrategia de disminuir su tiempo de publicidad en TV. Mediante este mix de estrategias logrará minimizar la pérdida de televidentes.

El valor del juego nos indica que Pepsi Cola perderá el 83.34% del mercado, mientras que Coca Cola ganará el 83.34%. La empresa que aplique una estrategia diferente, empeorará su resultado.

(15)

APLICACIÓN 4.- Un día antes de las elecciones, dos candidatos a alcalde de Arequipa

consideran a Paucarpata y Hunter como los distritos más importantes y merecedoras de una última visita. Paucarpata tiene 60000 votantes y Hunter tiene 40000 votantes. Quedan dos días de campaña y cada uno de los dos candidatos pueden gastar 0, 1 ó 2 días en cada distrito.

Los analistas de política estiman que si los candidatos dedican el mismo número de días a un distrito, cada uno obtendrá la mitad de los votos de ese. Pero si un candidato le dedica 1 ó 2 días más a un distrito que su oponente, obtendrá el 53% ó el 57% de los votos de ese distrito, respectivamente. Determine las estrategias óptimas de cada candidato.

SOLUCIÓN 

 Total de votantes: 60000 + 40000 = 100000

 De acuerdo a los datos del problema, la matriz de juego expresada en porcentajes de votantes que gana el Candidato 1 en el distrito de Paucarpata, dependiendo si le dedica 0, 1ó 2 días más que el otro candidato, será la siguiente: 

 

 Ahora calcularemos para cada celda de la matriz de juegos el total de votos que gana el candidato 1 en ambos distritos.



Celda 1,1: El candidato 1 le dedica 0 días a Paucarpata, por lo tanto tendrá 2 días para

dedicarlos a Hunter. El candidato 2 le dedica también 0 días a Paucarpata, por lo tanto también tendrá 2 días para dedicarlos a Hunter. En consecuencia ambos candidatos le dedican el mismo número de días a ambos distritos y el total de votantes ganados por el candidato 1 será de 50000, tal como se muestra en el cuadro siguiente:



Celda 1,2: El candidato 1 le dedica 0 días a Paucarpata, por lo tanto tendrá 2 días para

dedicarlos a Hunter. El candidato 2 le dedica también 1 día a Paucarpata, por lo tanto le quedará 1 día para dedicarlo a Hunter. En consecuencia el candidato 1 le dedica 1 día menos que el candidato 2 a Paucarpata y 1 día más que el candidato 2 a Hunter, entonces, el total de votantes ganados por el candidato 1 será de 49400, tal como se muestra en el cuadro siguiente:



 Y así sucesivamente determinamos para las otras celdas de la manera siguiente:

(16)



(17)



 Aplicando los criterios Maximin y Mínimax para los jugadores 1 y 2

respectivamente, tenemos que el valor del juego es 50000 y las estrategias óptimas para cada jugador es que cada uno deberá visitar 2 días a Paucarpata y 0 días a Hunter.

 Si cada jugador aplica sus estrategias óptimas se quedará cada uno con 50000 votantes.

APLICACIÓN 5.- Un total de 90000 clientes van a los supermercados “A” y “B”. Para

animar a los clientes a entrar, cada almacén regala un artículo.

Cada semana, el artículo de regalo se anuncia en el periódico del lunes. Naturalmente, ninguno de los almacenes conoce que articulo va a regalar el otro en esta semana. “A” esta pensando dar una caja de bebidas o medio galón de leche. “B” esta pensando regalar una libra de mantequilla o medio galón de jugo de naranja. Para cada elección de artículos, el número de clientes que entran al almacén “A” durante esta semana aparece en la tabla 1. Cada almacén desea elevar al máximo su número esperado de clientes durante esta semana.

Mediante la teoría de juegos determine una estrategia óptima para cada supermercado y el valor del juego. Interprete el valor del juego.

Tabla 1

SOLUCIÓN

Aplicando los criterios maximin y minimáx para los supermercados A y B respectivamente, se tiene que este juego no tiene punto de silla, por lo que no es posible aplicar estrategias puras, hay que aplicar estrategias mixtas.

A continuación de plantean los modelos matemáticos respectivos para que cada jugador determine sus estrategias óptimas.

Modelo Matemático el Supermercado A:

(18)

Sujeto a: 40000X1 + 60000X2 ≥ V 50000X1 + 30000X2 ≥ V X1 + X2 = 1 Xi ≥0, i= 1, 2

Modelo Matemático el Supermercado B

Función Objetivo: Min W

Sujeto a: 40000Y1 + 50000Y2 ≤W 60000Y1 + 30000Y2 ≤ W Y1 + Y2 = 1 Yj ≥0, j= 1, 2

Aplicando el software Lindo para resolver el modelo matemático del Supermercado A, se tiene la siguiente salida:

LP OPTIMUM FOUND AT STEP 2 OBJECTIVE FUNCTION VALU 1) 45000.00

VARIABLE VALUE REDUCED COST V 45000.000000 0.000000 X1 0.750000 0.000000 X2 0.250000 0.000000

ROW SLACK OR SURPLUS DUAL PRICES 2) 0.000000 -0.500000 3) 0.000000 -0.500000 4) 0.000000 45000.000000 NO. ITERATIONS= 2

Aplicando el software WINQSB, se tiene el siguiente reporte:

Por lo tanto se tiene que el valor del juego es V = 45000 y las estrategias óptimas son: Para el Supermercado A: PO =



0.75 0.25



y Para el Supermercado B: QO =       5 . 0 5 . 0 INTERPRETACIÓN

Este supermercado deberá aplicar el siguiente mix de estrategias: la estrategia de “regalar una caja de bebidas” deberá ser aplicada el 75% de las veces y la estrategia de “regalar medio galón de leche” deberá ser aplicada el 25% de las veces.

(19)

El Supermercado B deberá aplicar el siguiente mix de estrategias: la estrategia de “regalar una libra de mantequilla” deberá ser aplicada el 50% de las veces y la estrategia de “regalar medio galón de jugo de naranja” deberá ser aplicada también el 50% de las veces.

El valor del juego nos indica que el Supermercado A gana 45000 clientes, por lo tanto el Supermercado B se quedará con los otros 45000 clientes.

APLICACIÓN 6.- Dos cadenas de supermercados se proponen construir, cada una, una

tienda en una región rural en donde se encuentran cuatro pueblos. Las distancias entre los pueblos se muestra en la siguiente figura:

Aproximadamente 15% de la población vive cerca del pueblo A, 30% cerca del pueblo B, 20% cerca del pueblo C y 35% cerca del pueblo D, cada pueblo es lo suficientemente grande como para que ambas cadenas consideren ubicarse en él. Debido a que la cadena I es más grande y tiene más prestigio que la cadena II, la cadena I controlará la mayoría de los negocios, siempre que sus ubicaciones sean comparativas. Ambas cadenas conocen los intereses de la otra en la región y ambas han terminado estudios de mercado que dan proyecciones idénticas. Si ambas cadenas se sitúan en el mismo pueblo o equidistantes de un pueblo, la cadena I controlará el 65% de los negocios en ese pueblo. Si la cadena I está más cercana a un pueblo que la cadena II, la cadena I controlará 90% de los negocios en ese pueblo. Si la cadena I está más alejada de un pueblo que la cadena II, atraerá a 40% de los negocios de ese pueblo. El resto de las operaciones, bajo cualquier circunstancia, irán a la cadena II.

Cada firma planea construir sólo un supermercado en la región. ¿Qué pueblo debe seleccionar cada uno y cuáles serán los porcentajes del mercado?.

SOLUCIÓN

Las Cadenas I y II tienen las alternativas de ubicarse en los pueblos A, B, C y D, entonces estableceremos el porcentaje del mercado que gana la Cadena I, para cada par de decisiones.

Por ejemplo si ambas Cadenas eligen el pueblo A, entonces todos los clientes se encontrarán equidistantes de ambas Cadenas, por lo tanto la Cadena I ganará el 65% del mercado.

Si la Cadena I elige el pueblo A y la Cadena II elige el pueblo B, tal como se muestra en la figura siguiente:

Entonces se tiene que la Cadena I gana en total el 47.5% de los clientes, tal como se muestra en el siguiente cuadro:

A

A B_B C_C D_D

5 km 3 km 7 km

(20)

De esta manera se tendrá que calcular el total de clientes para el resto de alternativas de decisión de las Cadenas, llegando a obtener la siguiente matriz:

Aplicando los criterios maximin y minimáx para las Cadenas I y II respectivamente, se tiene que este juego tiene punto de silla.

El valor del juego es 65% y las estrategias para ambas Cadenas serían las siguientes: Estrategia óptima para la Cadena I:

PO =



0 0 1 0



Estrategia óptima para la Cadena II: QO =             0 1 0 0

Lo cual indica que ambas Cadenas deberá elegir el pueblo C, con lo cual la Cadena I se quedará con el 65% del mercado, mientras que la Cadena II se quedará con el resto (100-65) 35% del mercado. A A BB CC DD 5 km 3 km 7 km I II A A B_B C_C D_D 5 km 3 km 7 km I II

(21)

APLICACIÓN No 7.- El punto de silla consiste en localizar el mínimo valor de las filas y al

lado derecho de cada fila y el máximo de las columnas al pie de cada columna, luego se determina el máximo de los mínimos y el mínimo de los máximos. Si el máximo de los mínimos es igual al mínimo de los máximos entonces se ha encontrado el punto de silla que se convertirá automáticamente en el valor del juego

MAXMIN = MINMAX PUNTO DE SILLA = 5 VALOR DE JUEGO 5

NOTA: CUANDO UN PROBLEMA NO TIENE PUNTO DE SILLA, SE UTILIZA EL METODO SIMPLEX PARA DETERMINAR EL VALOR DE JUEGO.

APLICACIÓN No 8.- Dos bancos del sistema compiten por atraer el mayor número de

cuenta habientes en un poblado del sur del país: Banco "El mejor del Sur " el primero, y Banco "El más confiable " el segundo; para el logro de su objetivo cada uno aplica las estrategias siguientes:

1. Sorteo de electrodomésticos 2. Tasa de interés más alta 3. Sorteo de dinero en efectivo

Si el segundo banco ofrece sorteo de electrodomésticos atrae 200 cuenta habientes más que el primero, cuando este ofrece lo mismo, 1000 más cuando el primero ofrece tasa de interés mas alta y 800 menos cuando el primero ofrece sorteo de dinero en efectivo. Si el segundo banco ofrece una tasa de interés más alta atrae 1300 más cuando el primero ofrece sorteo de electrodomésticos, 700 más cuando el primero ofrece lo mismo y 900 menos cuando el primero ofrece sorteo de dinero en efectivo. Si el segundo banco ofrece sorteo de dinero en efectivo atrae 2000 menos cuando el primero ofrece sorteo de electrodomésticos, 1500 más cuando el primero ofrece tasa de interés más alta y 850 menos cuando el primero ofrece lo mismo.

1. ¿Que banco es el ganador del juego? 2. ¿Qué estrategia debe aplicar cada banco?

3. ¿En un año cuantos meses debe aplicar cada estrategia? 4. ¿Cuántos cuenta habientes atrae más el banco ganador?

5. Si el primer banco ofrece sorteo de dinero en efectivo y el segundo sorteo de electrodomésticos, el segundo atrae 800 cuenta habientes más que el primero. ¿Cuales serán las nuevas respuestas?

R = BCO. "El mejor del Sur" C = BCO. "El más confiable"

(22)

X1 Y1 – sorteo de electrodomésticos X2 Y2 – tasa de interés más alta X3 Y3 – sorteo de dinero en efectivo

SOLUCION:

CONSTRUIR MATRIZ DE JUEGO

MAXMIN = MINMAX 800 = 800

PUNTO DE SILLA = VALOR DE JUEGO = 800 RESPUESTAS:

1. Favorece al Bco. "El mejor del Sur ".

2. R = Utiliza estrategias X3 = sorteo de dinero en efectivo C = Utiliza estrategias Y1 = sorteo de electrodomésticos

3. R = 12 meses C = 12 meses 4. 800 Clientes 5. R => X3 C => Y1 MAXMIN ≠ MINMAX - 800 = - 200

PUNTO DE SILLA = no hay

VALOR DE JUEGO = si hay (Hay que aplicar SIMPLEX)

SIMPLEX

Sea: X1 la probabilidad de que R aplique la alternativa 1 X2 la probabilidad de que R aplique la alternativa 2 X3 la probabilidad de que R aplique la alternativa 3

(23)

V el valor del juego F.O. MAX V SUJETO A: (Restricciones) 1. –200X1 + (-1000) X2 +(-800) X3 ≥ V 2. –1300X1 - 700 X2 + 900 X3 ≥V 3. 2000 X1 - 1500 X2 + 850 X3≥V 4. X1 + X2 + X3 = 1 Restricciones lógicas: 5. X1, X2, X3≥ 0

Salida del WinQSB:

a) VALOR DE JUEGO = po*A*qo = - 435.71





435.71 00 . 0 21 . 0 79 . 0 850 900 800 1500 700 1000 2000 1300 200 39 . 0 00 . 0 61 . 0                             v

GANA EL BANCO C (El más confiable)

b) ¿QUÉ ESTRATEGIAS VAN APLICAR C/U DE LOS COMPETIDORES? El Banco R:

X1 = 0.61 sorteo electrodomésticos

X2 = 0

X3 = 0.39 sorteo de dinero en efectivo

El Banco C:

Y1 = 0.79 sorteo de electrodomésticos

Y2 = 0.21 tasa de interés más alta

Y3 = 0

EL BANCO R PARA MAXIMIZAR SUS MÍNIMAS GANANCIAS UTILIZARÁ LAS ESTRATEGIAS SORTEO DE ELECTRODOMÉSTICOS Y SORTEO DE DINERO EN EFECTIVO.

EL BANCO C PARA MINIMIZAR SUS MÁXIMAS PÉRDIDAS UTILIZARÁ LA ESTRATEGIA DE SORTEO DE ELECTRODOMÉSTICOS Y LA DE TASA DE INTERÉS MÁS ALTA.

d. CUANTOS CUENTA HABIENTES MÁS ATRAE EL BANCO GANADOR? 436 CUENTAHABIENTES MÁS (Es el valor de V)

APLICACIÓN No 9.- Los establecimientos de comida italiana más importantes de la ciudad

están compitiendo por atraer el mayor número de comensales. Pizza Hut y Presto, utilizando las siguientes estrategias piensan en lograr su objetivo.

1. 2 pizzas por el precio de una, en cualquier variedad los días martes en delivery. 2. 1 pizza familiar en cualquier variedad, 1 lasagna, 1 spaghetti, 1 porción de pan al ajo y 1 gaseosa de 2 litros por S/.30 todos los días.

3. Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días. El cuadro siguiente muestra los comensales que optarían por Presto y que Pizza Hut perdería en la realización de cada estrategia, teniendo como variable de tiempo 6 meses:

(24)

No hay punto de silla, por lo tanto hay que aplicar Programación Lineal para determinar la solución del problema.

De acuerdo al reporte del software WinQsb, se tiene que la ganadora del juego en este caso es Presto, atraerá 126 mil comensales más que Pizza Hut en el periodo de 6 meses.

Presto deberá aplicar las siguientes estrategias para maximizar sus mínimas ganancias:

 1 pizza familiar en cualquier variedad, 1 lasagna, 1 spaghetti, 1 porción de pan al ajo y 1 gaseosa de 2 litros por S/.30 todos los días.

 Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días.

Mientras que Pizza Hut para minimizar sus máximas pérdidas deberá aplicar las siguientes estrategias:

 2 pizzas por el precio de una, en cualquier variedad los días martes en delivery.

 Buffet de pastas y pizzas de 12:30 a 14:00 Hrs. por S/.15 todos los días.

En seis meses Presto deberá de aplicar la segunda estrategia en un periodo de 2 meses y la tercera estrategia en un periodo de 4 meses.

En cambio Pizza Hut deberá aplicar la primera estrategia en un periodo de 2 meses con 20 días y deberá aplicar la tercera estrategia en un periodo de 3 meses con 10 días.

APLICACIONES PROPUESTAS

01.- Un soldado puede escoger de entre cinco (1, 2, 3, 4 ó 5) una cueva para esconderse

(fig. siguiente). Un artillero sólo tiene una bala y puede disparar en cualquiera de los cuatro lugares A, B, C o D. Un disparo matará al soldado si está en una cueva junto al lugar donde pegó el proyectil. Por ejemplo, un proyectil disparado al lugar B matará al soldado si está en el agujero 2 ó 3, mientras que una bala disparada al lugar D matará a quien esté en los agujeros 4 ó 5. Suponga que el artillero recibe una recompensa de 1 día libre si mata al soldado, y una recompensa 0 si sobrevive el soldado.

1 A 2 B 3 C 4 D 5

Escriba los modelos matemáticos de PL para cada jugador que determine el valor del juego y las estrategias óptimas.

02.- Considere el juego que tiene la siguiente matriz de pagos

.

Utilice el método gráfico de PL para determinar el valor del juego y la estrategia óptima para cada jugador.

03.- Dos empresas competidoras han de decidir si ubican una tienda nueva en un punto A,

B o C. Hay 52 clientes posibles para las dos tiendas. 20 viven en el pueblo A, 20 en el pueblo B y 12 en el pueblo C (véase la figura). Cada cliente irá de compras a la tienda más

(25)

cercana. Si un cliente está equidistante de ambas tiendas, suponga que hay ½ de probabilidad que vaya de compras a cada una de ellas. Cada empresa desea maximizar el número esperado de clientes que hagan sus compras en su tienda. Dónde debe ubicar cada empresa su almacén? (AB = BC = 10 millas)

04.- Dada la siguiente tabla y salida del Lindo, determine: a) el valor del juego y la estrategia

óptima para cada jugador y b) Si el jugador A aplica la estrategia [0,5 0,5], entonces B aplicaría la estrategia [0 1]. ¿Cuál sería el resultado para ambos jugadores?

      3 6 5 4

Salida del Lindo:

V = 4,5 Precio Dual X1= 0.75 Restricción 1 -0.5 X2= 0.25 Restricción 2 -0.5

5.- Dado el juego bipersonal de suma nula con matriz de pagos:

                 1 0 3 4 3 1 3 0 1 2 0 1 2 1 2 6

a) Obtenga la estrategia óptima para ambos jugadores y el valor del juego, interpretando los resultados obtenidos.

b) ¿Es p = [11/30, 0, 19/30, 0] una estrategia óptima para A?

c) Construya el programa lineal que permita resolver el juego para el jugador A y para el jugador B.

d) Construya el programa lineal que permita determinar la estrategia de A, así como el valor del juego, si el jugador B adopta la estrategia q = [0.4, 0, 0.6, 0]. Interprete el resultado obtenido.

e) Obtenga el resultado esperado del juego si el jugador A opta por la estrategia p = [1/6, 0, 5/6, 0] y el jugador B adopta la estrategia q = [1/2, 0, ½, 0]. Interprete el resultado obtenido.

6.- Sea un juego de suma nula dado por la matriz de pagos:

Determine la solución del juego e interprétela. ¿Qué ocurriría si A eligiese su estrategia pura A3 tratando de obtener el resultado de 10 y B utilizase la estrategia q = [1/2, 1/2]?

7.- Dos empresas A y B que comercializan dos marcas de un mismo producto, en un

mercado en el que la demanda es estable, se plantean la posibilidad de hacer una campaña publicitaria en radio, televisión, prensa, etc. La empresa A tiene cuatro posibles programas

(26)

de publicidad distintos y B tiene tres. Dependiendo del ingenio e intensidad de la campaña, cada empresa puede captar una proporción de mercado captado o perdido por A es:

a) ¿Es razonable que B elija B1 porque es donde puede captar una mayor proporción de clientes de A?

b) ¿Cuáles son las estrategias óptimas para ambas empresas y el valor del juego? c) Si A decide jugar de acuerdo con la distribución de probabilidad

p = [1/2, 0, ½, 0] Y B jugase con

q = [3/5, 0, 2/5]

establezca cuáles serían las consecuencias.

8.- Dos grandes cadenas de supermercados, que llamaremos A y B respectivamente, van a

inaugurar, en las mismas fechas, un nuevo supermercado en un centro comercial de una ciudad en la que el número de clientes potenciales es de 100,000. El reparto del número de clientes potenciales entre las dos cadenas depende de la estrategia que cada una de las firmas adopte en cuanto a campañas de publicidad y productos en oferta. En función de la estrategia seguida por cada empresa, el número de clientes potenciales que se adjudica a la cadena A, en miles es el siguiente:

a) ¿Cuál es el número mínimo de clientes que aceptará tener A? ¿Y B?

b) ¿Cuál es la estrategia óptima de A y B? A la vista de este resultado, ¿podemos afirmar que A y B esperan repartirse por igual el número de clientes potenciales?

c) ¿Qué ocurrirá si B decide optar por una estrategia diferente a la óptima? d) Determine, el programa lineal para el jugador A.

9.- A y B son dos cadenas de hamburguesas competitivas. Cada una está expandiendo

hacia pueblos más pequeños conforme se saturan las grandes áreas urbanas. Un grupo de tres pueblos está bajo consideración como se muestra enseguida.

Los porcentajes muestran la población de cada pueblo relativa al total de la población para los tres pueblos. Como A es la cadena más grande, se concluye que puede capturar el 60%

(27)

del mercado cuando ambos restaurantes están equidistantes. No obstante, si B está más cerca, A obtendrá sólo el 30%. Si A está más cerca, capturará el 80% del mercado.

Cada firma planea construir sólo un restaurante en el área. ¿Qué pueblo debe seleccionar cada una y cuáles serán los porcentajes del mercado?

10.- Encuentre las estrategias óptimas y el valor del juego para cada uno de los juegos

siguientes. Los pagos son para el jugador A.

11.- Encuentre el intervalo de valores para “p” y “q” que harán el elemento (2,2) un punto de

silla en los juegos siguientes:

12.- Dados el juego bipersonal de suma nula con matriz de pagos:

                 1 0 3 4 3 1 3 0 1 2 0 1 2 1 2 6

y la salida con WinQSB:

a) Obtenga la estrategia óptima para ambos jugadores y el valor del juego, interpretando los resultados obtenidos.

b) ¿Es p = [11/30, 0, 19/30, 0] una estrategia óptima para A?

c) Construya el programa lineal que permita resolver el juego para el jugador A y para el jugador B.

(28)

d) Obtenga el resultado esperado del juego si el jugador A opta por la estrategia p = [1/6, 0, 5/6, 0] y el jugador B adopta la estrategia q = [1/2, 0, 1/2, 0]. Interprete el resultado obtenido.

TEOREMA DE VON NEWMANN

Llamaremos E x  _{a la esperanza matemática de la ganancia de P}₁_{. También llamada}

función de pago. El teorema dice:

"Existe para el maximizante una estrategia mixta óptima



x1 x2



*_, *

para la cual su ganancia media E x



1*,x2*



será superior o igual a una cantidad v llamada valor del juego y existe

para el minimizante una estrategia mixta óptima



y1 y2 y3



*_, *_, *

para la cual su pérdida me-dia E y



1*,y2*,y3*



será inferior o igual al valor del juego v."

Definición 3: La función de pago para P1, o sea la esperanza matemática de P1 se define por



  

E x y x A y x a yi ij j j n i m ,    



1 1

Donde: x e y son estrategias mixtas cualesquiera de P₁ y P₂ respectivamente.



 





1 2



1



1 2



2



1 2



3 3 2 1 2 1 5 3 2 4 1 3 1 5 2 4 , y x x y x x y x x y y y x x y x E                         

Definición 4: Una solución a un juego matricial son dos estrategias mixtas óptimas





                * * 2 * 1 * * * 2 * 1 * , , , n m y y y y x x x x  

y un número v tal que







,



para lasestrategiaspuras 1,2, , , , 2 , 1 puras s estrategia las para , * * m i v y i E n j v j x E      

Las x*_{e y}*_{se llaman estrategias mixtas óptimas.}

v puede ser negativa, positiva o cero.

En el juego de los disparejos cuya matriz era

1 1 1 1       

 el valor del juego es cero y las estrategias óptimas son x* _, _; y* / /  _ _       1 2 1 2 1 2 1 2 . Sin

demostrarlo aceptamos como axioma que un juego con v = 0 es justo. Todo nos permite decir ahora que













E x y, * _ E x*,y* _ E x*,y

(a) expresión escrita para el maximizante.

La expresión (a) es equivalente a:

 

x y mínmáxE

 

x y v E mín máx x y y x ,  , 

(29)

Definición 5: Un juego simétrico tiene una matriz de pago oblicua simétrica, esto es

a_ij  a_ji ; a_ij _{0 si i j} .

Se puede demostrar que el valor del juego es cero y que ambos jugadores tienen es-trategias óptimas simétricas.

Ejemplo

Dos jugadores hablan simultáneamente diciendo o piedra o papel o tijeras. La combinación de papel y piedra gana una unidad para el jugador que dijo papel (el papel envuelve a la piedra); para piedra y tijeras gana la piedra (la piedra rompe las tijeras) y para tijeras y papel ganan las tijeras (cortan al papel). Si los dos jugadores mencionan lo mismo no hay pago.

Plantear la matriz de pago y dar el valor del juego. La matriz de pago si P1 es el jugador maximizante es:

Piedra Papel Tijeras Piedra Papel Tijeras 0 1 1 1 0 1 1 1 0             

Por la definición 5 el valor del juego es cero pues la matriz es oblicua simétrica.

Propiedad: Para una nueva matriz de pago donde el valor de los elementos es aijw y

w es un número positivo, las estrategias óptimas son las mismas que para el juego original y el valor del nuevo juego es v w .

Teorema fundamental de los juegos matriciales Para todo juego matricial existen

 

má xmín E x y mínmá xE x y

x y , y y x , y son iguales. Esto es, todo juego matricial tiene una solución.

Ejemplo

Un jugador extiende alguno o algunos de sus dedos y al mismo tiempo supone (diciéndolo) cuántos dedos extiende el otro. El número de dedos que se puede extender es 1, 2 ó 3.

Si uno solo de los jugadores adivina, su pago es el total del número de dedos extendidos. De lo contrario su pago es cero.

Equivalencia del juego matricial y el problema de programación lineal Supondremos que se nos da un juego matricial arbitrario:

a a a a a a a a a n n m m mn 11 12 1 21 22 2 1 2                  

Por definiciones 3 y 4 el problema es encontrar para P1 un vector x



x x1, 2,, xm



y un

(30)























v

x

a

x

a

x

a

v

x

a

x

a

x

a

v

x

a

x

a

x

a

m mn n n m m m m







2 2 1 1 2 2 22 1 12 1 2 21 1 11 x₁  x₂  x_m1 ; x_i  0 _i En forma similar para P₂:

a y a y

a y v

a y a y

a y v

a y a y

a y v

n n n n m m mn n 11 1 12 2 1 21 1 22 2 2 1 1 2 2



 





 





 



















y₁  y₂  y_n 1 ; y_j  0 _i

Como cada elemento de (A) puede hacerse positivo mediante la suma de una constante apropiada a todas las aij podemos suponer que v  0.

Si hacemos x x v y y v i j j 1  ;   v y v y v x v x n j j n j j m i i m i 1 1 1 1 1 1 1 1 1    



      Al minimizar x_i P i m  



1 1

, maximizará el valor del juego v y al maximizar y_j P

j n  



1 2 , minimizará el valor del juego.

Entonces podemos redefinir el problema de programación lineal de la siguiente manera: Primal:

Encuentre un vector





x  x x1, 2,, xm

tal que minimice

x₁  x₂  x_m sujeto a:

a x a x

a x

a x a x

a x

a x a x

a x

m m m m n n mn m 11 1 21 2 1 12 1 22 2 2 1 1 2 2

1

        



 





 





 



















(31)

x_i  0 _i El problema dual: Encuentre un vector

y

    















1 2 3 4

tal que maximice

y

₁



  

y

₂





y

_n



sujeto a

a y a y

a y

a y a y

a y

a y a y

a y

n n n n m m mn n 11 1 12 2 1 12 1 22 2 2 1 1 2 2

1

        



 





 





 



















y_j  0 _j

Puesto que el juego tiene solución, existen soluciones óptimas a los problemas anteriores y mín x máx y v i j j n i m     







1 1 1 Ejemplo

Dada la matriz de pago

6 0 3 8 8 2 3 9 4 6 5 7         

Determinar, aplicando programación lineal, las estrategias óptimas para los dos jugadores.

6

8

4

2

6

3

5

8

9

7

1 2 3 2 3 1 2 3 1 2 3

x

x v

x

x v

x

x v

x

x v

 



 



 



 













x₁x₂x₃1 ; x_i  0 _i El dual será:

(32)

6

3

8

2

3

9

4

6

5

7

1 3 4 1 2 3 4 1 2 3 4

y

v

y

v

y

y v



 



  



  













y₁y₂y₃y₄1 ; y_j  0 _i

Si dividimos miembro a miembro por v:

6

3

8

1

8

2

3

9

1

4

6

5

7

1

1 3 4 1 2 3 4 1 2 3 4

y

          



 



  



  













y y y y v máx 1 2 3 4 1 _  _  _  _{ }

Sumamos un número w2 a la matriz original.

8 2 5 10 10 0 5 11 6 8 7 9         El dual será:

8

2

5

10

1

10

5

11

1

6

8

7

9

1

1 2 3 4 1 3 4 1 2 3 4

y

          



 



 



  













y y y y v max 1 2 3 4 1  _  _  _  _ _ *

Si agregamos las variables de holgura:























          

1

9

7

8

6

1

11

5

10

1

10

5

2

8

3 4 3 2 1 2 4 3 1 1 4 3 2 1



y

(33)

3 20 20 3 1 10 1 ; 20 1 * * 3 1 3 1            v v y y y y 3 2 3 20 10 1 3 1 3 20 20 1 * 3 3 * 3 3 * 1 1 * 1 1               v y y v y y v y y v y y 8 1 ; 40 1 ; 0 1 3 2 3 1 3 2 1 3 1           _x _x x y y 1 6 5 6 1 0 6 5 24 20 3 20 8 1 ; 6 1 3 20 40 1 3 2 1 3 2            x x x x x 3 14 2 3 20 2 2 ; 3 20 * * *         v v v v v

Aquí, si sobrare tiempo, se puede intercalar la resolución por programación lineal de papel, piedra y tijeras.

Principio de dominancia

Sea el juego definido por la siguiente matriz:

2 4 1 0 3 1 4 2     _

El valor del juego para A si juega a la primera fila con probabilidad p₁ y si B juega a la primera columna es:









V p BA 1, 1 2 p1 3 1 p1 2 p1 3 3 p1 3 p1

El valor calculado es la esperanza matemática de la ganancia para el jugador A si A juega a la primer fila con probabilidad p₁ y el jugador B juega a la primer columna.

Si B juega con estrategia B₁ y A juega a la primera fila pierde 2 y si juega a la segunda pierde 3.

Si B jugara a la cuarta columna y A a la primera fila, B pierde 0. Si A jugara a la segunda fila, B perdería 2.

Siempre convendrá a B jugar en la cuarta columna. B nunca jugará a la primera. Se dice que la primera columna es dominada. Entonces el juego se transforma es una matriz como: 4 1 0 1 4 2       

(34)

De la misma manera, toda fila dominada por otra puede ser suprimida en la matriz de un juego. Es importante porque permite reducir algunos juegos al tamaño 2 x 2 que se resuelven fácilmente en forma gráfica.

Ejemplo

Reducir el siguiente juego aplicando dominancias:

3 0 2 4 5 1 4 3 3        

La columna uno tiene valores superiores respecto a la tercera. Entonces se elimina la primera que es dominada

0 2 5 1 3 3        

Ahora todos los elementos de la primera fila son menores a los de la tercera. La tercera domina a la primera. Se anula la primera.

5 1 3 3    _ Ejemplo

Reducir el siguiente juego aplicando dominancias:

             3 8 2 4 5 3 16 10 3

Resolución analítica y gráfica de juegos.

Supongamos que se nos presenta el siguiente juego: B

y₁ y₂ x₁ 4 8 Jugador A

x₂ 6 2

No tiene punto de ensilladura. El jugador seleccionaría por minimax la peor situación de cada alternativa (4 para x₁ y 2 para x₂) para luego optar por la que asegura la mayor de dichas ganancias mínimas. El valor del juego para A es:

V_A 4

que es la retribución mínima que espera ganar jugando su estrategia x1.

De la misma manera el valor del juego para el jugador B es

V_B 6

pero esto es un círculo vicioso. Por ello deberían recurrir a estrategias mixtas. Supongamos que A juega a sus alternativas x1 y con probabilidades y x2 p1



1 p1



. Su

ganancia no depende de lo que él juega sino de la estrategia seguida por B. Por ejemplo si B juega su estrategia y1, la ganancia de A será:









V p y_A ₁, ₁ 4 p₁ 6 1p₁ 4 p₁ 6 6 p₁  6 2 p₁

Expresión que da la esperanza matemática de la ganancia del jugador A si él juega a la primer fila con frecuencia relativa x1 y el jugador B juega a la primera columna.

(35)









V p y_A ₁, ₂ 8 p₁2 1 p₁ 8 p₁ 2 2 p₁ 2 6 p₁

A tratará de hacer máxima la ganancia independientemente de la estrategia de B. Eso significa:









1 1 1 1 1 2 1 1 1 8 2 6 2 6 6 2 2 6 , , p p p p p y p V y p V_A _A         5 , 0 8 4 1 1   p p Haciendo el mismo razonamiento para B.











1 2



1



1



1 1 1 1 1 1 1 1 1 1 4 2 2 2 6 1 2 6 , 4 8 8 8 4 1 8 4 , q q q q q x q V q q q q q x q V B B                 1 1 1 8 2 8 4 2 4 8 q q q      75 , 0 8 6 8 6 1 1    q q

Hasta aquí ha sido una mera resolución con geometría analítica elemental.

MÉTODO GRÁFICO

La figura muestra la variación de la ganancia esperada por el jugador A para diversos valores de p1 cuando su adversario juega sus estrategias y1 e .y2







0,5;



80,5 20,5 5 5 5 , 0 6 5 , 0 4 ; 5 , 0 2 1 1 1         y p V y p V A A

Supongamos que A carga su bolillero con p₁* bolillas blancas. En ese caso su beneficio oscilaría entre SN y SM de acuerdo a las estrategias que adopte el jugador B. Con criterio conservador A esperaría ganar SN. Es decir, SN sería el

 

(36)

Para otros valores de p1 entre 0 y 1 el valor esperado será la quebrada PQR. Como A

pretende maximizar su ganancia mínima, es obvio que eligirá el valor p10 5, con lo que

se asegura un valor esperado de la ganancia de

 

VA p1 5

El punto Q es el mayor. Por un razonamiento análogo en la figura se ve que la estrategia óptima para B es con q10 75,

 

V q_B ₁ 5

Este método de resolución gráfica de juegos puede utilizarse también para aquellos juegos cuya matriz consta de 2 filas y más de 2 columnas o de 2 columnas y más de 2 filas. Sea por ejemplo el siguiente juego:

2 4 1 0 3 1 4 2     _ p₁p₂ 1 ; p₂ 1 p₁

Analíticamente puede hallarse:



















1 3



1



1



1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 5 4 4 4 1 4 , 3 1 1 4 1 4 , 3 3 3 2 1 3 2 , p p p p p y p V p p p p p y p V p p p p p y p V A A A                          



 



V p yA 1, 4 2 1 p1  2 2 p1