• No se han encontrado resultados

Acerca de la distribución comercial en una zona geográfica: Desde Hotelling hasta juegos diferenciales.

N/A
N/A
Protected

Academic year: 2022

Share "Acerca de la distribución comercial en una zona geográfica: Desde Hotelling hasta juegos diferenciales."

Copied!
46
0
0

Texto completo

(1)

Desde Hotelling hasta juegos diferenciales.

Juan Camilo Lesmes Vega.

Universidad Nacional de Colombia.

Departamento de Matem´aticas.

Bogot´a, Colombia.

Julio de 2019.

(2)

Desde Hotelling hasta juegos diferenciales.

Juan Camilo Lesmes Vega

Tesis de grado presentada como requisito parcial para optar al t´ıtulo de:

Maestr´ıa en Ciencias - Matem´atica Aplicada

Director:

Arsenio Pecha Castiblanco

Universidad Nacional de Colombia Departamento de Matem´aticas

Bogot´a, Colombia Julio de 2019

(3)

Agradecimientos

El agradecimiento m´as importante es para mis padres, quienes siempre me han apoyado en la con- secuci´on de mis metas y a los cuales nunca terminar´e de agradecer. Al profesor Arsenio Pecha, por su infinita paciencia y su gu´ıa a lo largo de estas p´aginas. A Ren´e Mauricio Ram´ırez, por sus valiosos aportes en forma de ideas e interpretaciones sobre lo hecho en este trabajo. A David Siervo, por las jornadas in- terminables de estudio, alternadas con jornadas interminables de desparpajo, gracias por este largo, muy largo camino, que no pod´ıa ser de otra manera dada nuestra personalidad. Un agradecimiento especial a Daniela Traslavi˜na, quien siempre ha cre´ıdo en mis capacidades a´un cuando yo no lo he hecho, y quien ha estado ah´ı para apoyarme en los momentos m´as dif´ıciles.

iii

(4)

Resumen

Este documento busca extender el an´alisis hecho en modelos de diferenciaci´on horizontal din´amicos, en particular los derivados del trabajo de Hotelling. Para esto, se hace una revisi´on de los modelos est´aticos que dieron origen a la teor´ıa, se analizan posteriormente las herramientas necesarias para llevar el an´alisis al escenario din´amico y se exponen los modelos din´amicos de diferenciaci´on horizontal en los cuales se enfoca el trabajo. Finalmente, se realizan dos extensiones, en las que se ampl´ıa el n´umero de agentes y se modifica la estructura de costos de las firmas.

Palabras clave: competencia monopol´ıstica, diferenciaci´on horizontal, equilibrio de Nash perfecto en subjuegos, control ´optimo, sistemas din´amicos.

iv

(5)

Abstract

This document seeks to extend the analisys made on dynamic horizontal differentiation models, in particular those derivated from Hotelling’s work. In order to do so, a review of the static models that gave rise to the theory is made, the tools required to take the analysis to the dynamic scenario are subsequently analyzed and the dynamic horizontal differentiation models in wich this work is focused on are exposed.

Finally, two extentions are made, in wich the number of agents is extended and the costs structure of the firms is modified.

Palabras clave: monopolistic competition, horizontal differentiation, subgame-perfect Nash’s equili- bria, optimal control, dynamic systems.

v

(6)

´ Indice general

Agradecimientos III

Introducci´on VII

1. El modelo de Hotelling 1

1.1. El caso de dos firmas y costos de desplazamiento lineales . . . 1 1.2. El caso de dos firmas y costos de desplazamiento cuadr´aticos . . . 7 1.3. Una generalizaci´on del modelo de Hotelling . . . 8

2. Control ´optimo 12

2.1. Programaci´on din´amica . . . 13 2.2. Principio del m´aximo de Pontryagin . . . 16

3. Juegos diferenciales 18

3.1. El caso din´amico de Hotelling con dos firmas y costos de desplazamiento lineales . . . 24 3.2. El caso din´amico de Hotelling con tres firmas y costos de desplazamiento lineales . . . 28 3.3. El caso din´amico de Hotelling con dos firmas y costos de desplazamiento cuadr´aticos . . . 33

4. Conclusiones y agenda investigativa 36

vi

(7)

Introducci´ on

En teor´ıa de organizaci´on industrial se estudian estructuras de mercado diferentes a las de compe- tencia perfecta en intentos por proponer modelaciones que se aproximen m´as a la realidad. Un primer hito en esta teor´ıa es el trabajo del duopolio de Cournot (1838), en el que dos firmas, que son las ´unicas oferentes en un mercado, deciden de manera simult´anea las cantidades que van a poner a disposici´on para la venta. En esta estructura, en comparaci´on con la situaci´on de competencia perfecta, las cantidades totales ofrecidas en el mercado son menores y los beneficios de las firmas son mayores. Dos de las princi- pales variaciones a partir de esta modelaci´on son los oligopolios de Stackelberg (1934) y Bertrand (1883).

En el oligopolio de Stackelberg la decisi´on no se da de manera simult´anea, lo que le otorga una ventaja, que se traduce en mayores beneficios, a la firma que decide primero. En el oligopolio de Bertrand, por su parte, la variaci´on consiste en que las decisiones de las firmas se toman sobre los precios en lugar de las cantidades a ofertar; aunque este enfoque resulta un poco m´as natural que los anteriores, lleva a una conclusi´on contraintuitiva: a pesar de que las firmas tienen un potencial poder de mercado, el resultado en t´erminos de los beneficios de las firmas es igual al de competencia perfecta. A este resultado se le conoce en la literatura de organizaci´on industrial como paradoja de Bertrand.

Como una posible soluci´on a la paradoja de Bertrand, surge el modelo de diferenciaci´on horizontal de Hotelling que incorpora la consideraci´on de bienes diferenciados a partir de un enfoque de la localiza- ci´on de las firmas. En este modelo, donde las firmas toman decisiones sobre los precios de la mercanc´ıa ofrecida, a la vez que deciden sobre el grado de diferenciaci´on, es posible obtener beneficios mayores que los de competencia perfecta. Aunque la principal conclusi´on del trabajo original se obtiene a partir de un supuesto que se demostr´o falso posteriormente, esta discusi´on abri´o el camino de una nueva rama en el an´alisis de la organizaci´on industrial.

A lo largo de este documento se describe el trabajo original de Hotelling y las principales variaciones que de all´ı se derivaron bajo el enfoque est´atico, se exponen las herramientas necesarias para abordar el modelo en tiempo continuo, y se presenta una extensi´on del modelo de dos firmas expuesto por Lambertini (2018). En el cap´ıtulo 1, se explica el modelo original de Hotelling, se evidencia la invalidez de su conclusi´on a partir del modelo expuesto por D’Aspremont et al. (1979), y se presentan variaciones est´aticas respecto al n´umero de agentes, la estructura de costos de las firmas, la disponibilidad a pagar de los consumidores y la forma del espacio de mercanc´ıas donde se realiza la diferenciaci´on. En el cap´ıtulo 2, se desarrollan los requisitos relacionados con la estructura de control ´optimo que permiten abordar el problema en su versi´on din´amica. En el cap´ıtulo 3, siguiendo a Lambertini (2018), se expone el modelo de Hotelling como un juego diferencial y se realizan dos contribuciones: se aumenta a tres el n´umero de firmas involucradas en el oligopolio din´amico con una estructura de costos lineal; y se modifica la estructura de costos para el duopolio inicialmente planteado, pasando de una estructura de costos lineal a una cuadr´atica. Finalmente, se rese˜nan las conclusiones y se presenta una discusi´on de la agenda investigativa, incluyendo prospectos de investigaciones futuras.

vii

(8)

El modelo de Hotelling

En este cap´ıtulo se explica el modelo que Harold Hotelling expuso en 1929, el cual dio origen a una amplia gama de desarrollos en torno a los modelos de diferenciaci´on horizontal de producto enmarcados en una competencia monopol´ıstica. Ac´a se hace un resumen del modelo y se rese˜nan las conclusiones que ´el deriv´o, principalmente su conocido “principio de m´ınima diferenciaci´on”; se presenta tambi´en la cr´ıtica que D’Aspremont et al. (1979) realizan en torno a este resultado, en la cual demuestran que el an´alisis de Hotelling, aunque intuitivo, resulta incorrecto al suponer erroneamente que el equilibrio de Nash perfecto en subjuegos existe. Adem´as, se ponen en consideraci´on los desarrollos de B¨ockem (1994), quien extiende el desarrollo de D’Aspremont et al. y analiza qu´e ocurre si los individuos tienen la opci´on de no comprar el bien diferenciado, asumiendo que tienen una utilidad de reserva proveniente de consumir un bien que se encuentra por fuera del mercado de competencia monopol´ıstica. Finalmente se referencian las extensiones hechas por Economides (1993) y Brenner (2005), para el caso con m´ultiples firmas con costos de desplazamiento lineales y con costos de desplazamiento cuadr´aticos respectivamente.

1.1. El caso de dos firmas y costos de desplazamiento lineales

Hotelling desarrolla su modelo en un escenario donde dos firmas compiten por la totalidad del mer- cado, y en el que los consumidores est´an distribuidos de manera uniforme sobre una recta. Todos los agentes del modelo se consideran maximizadores, ya sea de la utilidad si se trata de un consumidor, o de su beneficio si se refiere a una firma. Cada consumidor compra una unidad de producto de alguna de las dos firmas1, las cuales producen y venden un bien de caracter´ısticas id´enticas, salvo por la ubicaci´on donde se encuentran. Los consumidores incurren en un costo de transporte, que depende linealmente de la distancia, al trasladarse desde sus posiciones hasta la firma a la cual le compran el bien; dado que las firmas venden bienes diferenciados (por su ubicaci´on), el costo del que aqu´ı se habla representa una desutilidad que paga el consumidor por comprar un bien que no es exactamente el que se ajusta a su bien ideal, que no es otro que el que se halla en su misma posici´on. La finalidad del modelo es establecer las condiciones para que un equilibrio de Nash perfecto en subjuegos (ENPS ) de dos etapas exista2, en donde la primera etapa consiste en la elecci´on de la ubicaci´on por parte de las firmas, y la segunda etapa es la elecci´on del precio de venta de cada uno de sus bienes.

1En el marco del modelo de Hotelling los consumidores tienen una disponibilidad a pagar que tiende a infinito, lo que trae como consecuencia que siempre que dispongan de los recursos, consumir´an de alguno de los productos ofertados.

2Vale la pena recordar que un ENPS es un equilibrio de Nash secuencial, que satisface que la decisi´on elegida por el individuo es ´optima en cada nodo de decisi´on. Es com´un encontrar estos equilibrios mediante el proceso de inducci´on hacia atr´as, que consiste en analizar el ´ultimo nodo de decisi´on, encontrar la elecci´on ´optima del agente y, con esa informaci´on, regresar al nodo de informaci´on anterior y encontrar la decisi´on ´optima del otro agente ya conociendo el proceso realizado antes; el proceso se repite hasta llegar al nodo de decisi´on inicial y el ENPS resulta de la senda de decisiones que se encontraron en el proceso. Para una definci´on m´as formal del concepto, puede revisarse Osborne, M. (2004).

1

(9)

Figura 1.1: Esquema de ciudad lineal.

Las dos firmas 1 y 2, est´an ubicadas a lo largo del segmento de l´ınea recta (de longitud l), con la firma 1 a la izquierda de la firma 2, como se puede ver en la Figura 1.1; la distancia entre el inicio de la l´ınea y la firma 1 es a, mientras que la distancia de la firma 2 al final de la recta es b (a + b ≤ l, a ≥ 0, b ≥ 0).

Por simplicidad del modelo se asume que las firmas producen a costo cero, y que cada unidad produci- da se consume en cada punto de la l´ınea (esto es debido al supuesto de distribuci´on uniforme hecho antes).

Sean p1 y p2 los precios de venta de los bienes de las firmas 1 y 2 respectivamente, y sean q1 y q2 las cantidades producidas por cada una de ellas. Es claro que, dadas unas ubicaciones arbitrarias, la demanda de cada firma depende del precio de venta suyo y del precio de venta de su competidora; si el precio de una de las firmas es muy alto con respecto al precio de su rival, muchos consumidores, a´un estando m´as cerca de la primera, podr´ıan optar por comprarle a la segunda.

Al comprar alg´un producto, el consumidor incurre en un costo que es equivalente al precio cobrado por la firma, m´as el costo de traslado (c) multiplicado por la distancia recorrida desde su posici´on hasta la firma. La demanda de la firma 1 (por simetr´ıa para la firma 2 se obtiene un resultado equivalente) puede resumirse en tres casos:

q1(p1, p2) =





0, si p1> p2+ c(l − a − b), l, si p1< p2− c(l − a − b),

1

2(l − a − b + p2−pc 1) + a, si |p1− p2| ≤ c(l − a − b).

(1.1)

La primera condici´on, en la que la firma 1 obtiene una demanda nula, se obtiene analizando al consumidor localizado en la misma posici´on de la firma 1: si el precio de la firma 1 es mayor al precio de la firma 2 m´as el costo de transporte correspondiente, entonces este consumidor prefiere comprarle a la firma 2; dado que este es el consumidor al que le resulta m´as barato comprarle a la firma 1 y prefiere comprarle a su com- petidora, entonces todos los consumidores de la recta act´uan del mismo modo, haciendo que la demanda por la firma 1 sea nula. La segunda condici´on es el mismo caso, pero visto desde la perspectiva de la firma 2, por lo que es ahora la firma 1 la que se queda con todo el mercado. Finalmente, la condici´on restante, que se explica en detalle a continuaci´on, expresa la demanda que enfrenta la firma 1 cuando existe lo que Hotelling llama consumidor indiferente, situaci´on en la que ambas firmas enfrentan una demanda positiva.

Sea x la distancia desde un consumidor hasta la firma 1, y sea y la distancia desde el mismo consumidor hasta la firma 2. Se tiene entonces que

p1+ cx,

representa el costo pagado por un consumidor que compra el bien de la firma 1. Mientras que p2+ cy,

es el costo pagado por un agente que consume el bien de la firma 2.

El consumidor indiferente, denotado por θ en la Figura 1.2, es aquel al cual le resulta equivalente comprarle a cualquier firma; es decir, es un consumidor tal que:

p1+ cx = p2+ cy. (1.2)

(10)

Este consumidor indiferente divide el mercado en dos segmentos: todo consumidor a la izquierda de ´el

Figura 1.2: Ubicaci´on del consumidor indiferente

le compra a la firma 1, mientras que todos a su derecha le compran a la firma 2. De la manera en que se han definido a, b, x y y, se cumple que:

a + x + y + b = l. (1.3)

Resolviendo de forma conjunta (1.2) y (1.3) se tiene que x = 1

2(l − a − b +p2− p1 c ), y = 1

2(l − a − b +p1− p2 c ),

que dan lugar a la parte de la demanda de cada firma que a´un no hab´ıa sido analizada en (1.1). Hotelling considera la situaci´on en que ambas firmas enfrentan demandas positivas q1 = a + x y q2= b + y, por lo que expresa las funciones de beneficio de las firmas usando esta ´ultima condici´on de (1.1) as´ı:

π1= p1q1 = 1

2(l + a − b)p1− p12

2c + p1p2

2c , (1.4)

para la firma 1, y an´alogamente

π2= p2q2 = 1

2(l − a + b)p2− p22

2c + p1p2

2c , (1.5)

para la firma 2.

Ahora bien, cada firma trata de maximizar su beneficio asumiendo el precio puesto por la otra firma como constante, de manera que, dadas las caracter´ısticas de la funci´on de beneficios de ambos agentes, se pueden usar las condiciones de primer orden y encontrar los m´aximos como sigue. Derivando π1 con respecto a p1 e igualando a cero se tiene que

∂π1

∂p1

= 1 2



l + a − b + p2− p1

c +p1(−1) c



= 1 2



l + a − b + p2− 2p1 c



= 0,

de donde se encuentra el punto cr´ıtico

p1= c(l + a − b) + p2

2 .

Sabiendo que el problema es sim´etrico, se obtiene que

p2= c(l + b − a) + p1

2 ,

(11)

y al solucionar este par de ecuaciones simult´aneas, se llega a:

p1 = c(l + a − b)

2 +c(l + b − a) + p1

4

 , por lo que

p1 = 3cl 4 +ca

4 −cb 4 +p1

4, de donde, despejando p1, puede verse que

p1= c



l +a − b 3

 . As´ı mismo se puede obtener el resultado para p2:

p2= c



l −a − b 3

 .

Con estos resultados de p1 y p2 se obtienen las cantidades asociadas a estos precios as´ı:

q1 = a + x = 1 2



l +a − b 3

 ,

q2 = b + y = 1 2



l −a − b 3

 .

Se puede notar ahora f´acilmente que la funci´on de beneficios es c´oncava en los precios, puesto que para la firma 1 se tiene que

2π1

∂p21 = 1 2



−2 c



= −1 c < 0,

y dado que el problema es sim´etrico, lo mismo se tiene para la segunda derivada del beneficio de la firma 2, con lo que se garantiza que los beneficios obtenidos son m´aximos.

Al usar las cantidades y los precios hallados se pueden reescribir los beneficios (de equilibrio) como π1=

 c



l +a − b 3

  1 2



l +a − b 3



= c 2



l +a − b 3

2

, (1.6)

para la firma 1, y an´alogamente π2 =

 c



l −a − b 3

  1 2



l +b − a 3



= c 2



l +b − a 3

2

, (1.7)

para la firma 2.

El beneficio de las firmas depende directamente de c, el costo por unidad de distancia, y de l, la longitud de la ciudad lineal, a partir de lo cual se obtiene lo siguiente: en cuanto mayor sea el costo de transporte en el que incurren los consumidores por comprar alguno de los bienes, ceteris paribus, mayor es el beneficio que obtienen las firmas. Al respecto Hotelling (1929) expresa, parafraseando, que estos vende- dores prefieren evitar hacer mejoras en la hipot´etica carretera que pasa por la ciudad, y por el contrario tratan de obstaculizar cualquier progreso, haciendo que sus beneficios sean mayores a´un en detrimento del consumidor, dado que el costo de transporte les da poder de mercado3. Note que para la firma 1 el

3Siguiendo este resultado, algunas empresas en la actualidad “premian” la fidelidad de sus clientes con bonos, tarjetas y dem´as, haciendo que el costo de pasar de una empresa a su rival, sea m´as elevado para el consumidor, desincentivando as´ı la transici´on de una firma a otra.

(12)

beneficio crece en tanto a − b se hace m´as grande, mientras que para la firma 2 ocurre lo contrario (su beneficio crece conforme b − a aumenta). Cada una de las firmas controla su posici´on (que da lugar a la distancia a − b), de modo que si se supone, por ejemplo, que la posici´on de la firma 1 se ha fijado, la firma 2 elige una ubicaci´on que le permita hacer b − a lo m´as grande posible, y esto se logra ubic´andose tan cerca como le sea posible de la firma 1 (tanto as´ı que terminan ubic´andose en el mismo lugar). Usando el mismo argumento, pero intercambiando los roles de las firmas, se llega al mismo resultado: lo ideal para la firma 1 es ubicarse lo m´as cerca posible de la firma 2; de este modo, la mejor respuesta de ambos coincide en una estrategia de acercamiento mutuo que luego ser´ıa conocido como principio de m´ınima diferenciaci´on.

Pasados 50 a˜nos, en 1979, D’Aspremont et al. publican un documento revisando el modelo expuesto por Hotelling, donde se encuentran inconsistencias matem´aticas en su an´alisis; all´ı muestran que bajo la configuraci´on propuesta por Hotelling no necesariamente existe un equilibrio de Nash perfecto en sub- juegos. Para llegar a esta conclusi´on caracterizan las condiciones necesarias y suficientes para que un equilibrio de Nash exista, y se evidencia que existe un error en el argumento de Hotelling.

Para seguir el argumento vale recordar la siguiente definici´on:

Definici´on 1.1. Una configuraci´on (p1, p2) se denomina un equilibrio de Nash si se cumple que π1(p1, p2) ≥ π1(p1, p2),

y

π2(p1, p2) ≥ π2(p1, p2), para todo p1 y p2.

Con esto claro, D’Aspremont et al. (1979) plantean las caracter´ısticas que debe satisfacer un equilibrio en el modelo propuesto por Hotelling:

Proposici´on 1.1.1. Para a + b = l, el ´unico punto de equilibrio est´a dado por p1= p2= 0. Para a + b < l, existe un punto de equilibrio si, y s´olo si

1.



l +a − b 3

2

≥ 4

3l(a + 2b).

2.



l +b − a 3

2

≥ 4

3l(b + 2a).

Y en caso de existir un punto de equilibrio, este est´a ´unicamente determinado por:

3. p1 = c



l +a − b 3

 .

4. p2 = c



l −a − b 3

 .

Demostraci´on. El primer caso, con a + b = l es inmediato. En esta situaci´on las firmas se ubican en el mismo lugar, y al recordar la condici´on (1.1) se puede ver que para que exista competencia entre las firmas, estas deben cobrar el mismo precio (pues el diferencial producido por la ubicaci´on, que da origen a las distancias a y b es nulo); as´ı, todos los consumidores son consumidores indiferentes y compran el producto a cualquiera de las firmas. No obstante, desde la perspectiva de las firmas, el precio de venta

(13)

juega un rol fundamental al tratar de maximizar su beneficio: una disminuci´on del precio de venta produce el apropiarse de todo el mercado. La m´axima disminuci´on del precio puede hacerse hasta alcanzar el costo marginal, y esto termina generando que ambas firmas disminuyan su precio hasta p = 0. Este resultado se conoce en la literatura como la paradoja de Bertrand.

Con esto claro, se debe analizar qu´e ocurre en el caso en que a + b < l. Se prueba primero que cualquier equilibrio debe satisfacer que |p1− p2| < c(l − a − b).

Se usa un argumento por reducci´on al absurdo al suponer que (p1, p2) configura un equilibrio pero

|p1− p2| > c(l − a − b). En este caso, la firma que tiene el precio m´as alto est´a obteniendo un beneficio nulo y puede disminuir su precio, de tal forma que atraiga m´as consumidores y obtenga un beneficio positivo, pero esto contradice el hecho de que la configuraci´on (p1, p2) sea de equilibrio.

Se supone ahora que se tiene que |p1− p2| = c(l − a − b). Si p1 = 0 entonces el beneficio de la firma 1 es nulo y podr´ıa aumentar su precio, de forma que despu´es del aumento, fuera menor a p2+ c(l − a − b) y as´ı mejorar su situaci´on. Si p1 > 0 pueden surgir dos casos:

La firma 1 podr´ıa quedarse con todo el mercado, de manera que la firma 2 (que entonces obtiene beneficios nulos) podr´ıa disminuir su precio para mejorar su situaci´on.

La firma 1 podr´ıa tener solo una fracci´on del mercado, en cuyo caso podr´ıa disminuir ligeramente su precio y quedarse con todo el mercado y mejorar su situaci´on.

Sin importar cual sea el caso se obtiene una contradicci´on, de modo que una configuraci´on de equilibrio (p1, p2) debe satisfacer que |p1− p2| < c(l − a − b).

Para que p1 sea de equilibrio debe maximizar π1 = 12(l + a − b)p1p2c12 +p12cp2 que llega a partir de (1.4), en el intervalo de competencia, esto es en (p2− c(l − a − b), p2+ c(l − a − b)). De manera similar para p2. Tomando condiciones de primer orden sobre las funciones de beneficios de ambos agentes se obtienen las condiciones necesarias 3. y 4. D’Aspremont et al. muestran que estas condiciones son argumento maximizador no solo en el intervalo de competencia, sino en toda la ciudad lineal, configurando as´ı un equilibrio. Esto lo hacen mostrando que el beneficio ´optimo de cada firma es mayor o igual que el que obtendr´ıa en el caso de acaparar todo el mercado. As´ı, para todo  > 0 se debe tener que:

π1(p1, p2) = c 2



l +a − b 3

2

≥ l´ım

→0l [p2− c(l − a − b) − ] ,

y al recordar la condici´on 4 que caracteriza el precio de equilibrio de la firma 2, y al reemplazar se tiene que

π1(p1, p2) = c 2



l +a − b 3

2

≥ l´ım

→0 l

 c



l −a − b 3



− c(l − a − b) − 

 ,

≥ l´ım

→0 l

 cl −ac

3 +bc

3 − cl + ac + bc − 

 ,

≥ l´ım

→0 l 2ac 3 +4bc

3 − 

 ,

≥ l´ım

→0 2cl a + 2b 3



− l,

≥ 2cl a + 2b 3

 .

(14)

Note que la ´ultima desigualdad se alcanza al calcular el l´ımite. De ac´a, transponiendo t´erminos, se llega a la condici´on 1. De manera an´aloga se obtiene la condici´on 2. Esto muestra que las condiciones 3. y 4. caracterizar´ıan el equilibrio si se tienen las condiciones 1. y 2. y con esto, D’Aspremont et al. terminan su demostraci´on.

En ese caso, tal como lo se˜nalaba Hotelling, las derivadas parciales del beneficio de cada firma respecto a sus par´ametros de ubicaci´on (a, b) son positivas, es decir que las firmas tienen incentivos a desplazarse hacia el centro. Sin embargo, de no tenerse las condiciones 1. y 2. nada se puede decir del equilibrio, ni del comportamiento de los beneficios frente a cambios en las ubicaciones. Cabe notar en particular, que en el caso de posiciones sim´etricas, a = b, las condiciones 1 y 2 conducen a que a = b ≤ l

4, es decir, que las firmas deben estar ubicadas en el primer y cuarto cuartil respectivamente para que se tengan los incentivos a desplazarse hacia el centro; no obstante, nada puede decirse de su comportamiento una vez se encuentran en los cuartiles centrales. Este es el resultado principal del art´ıculo de D’Aspremont et al.:

mostrar que el equilibrio encontrado por Hotelling no es realmente un equilibrio. A continuaci´on exponen un ejemplo donde caracterizan un equilibrio con 2 firmas y costos cuadr´aticos.

1.2. El caso de dos firmas y costos de desplazamiento cuadr´ aticos

Nuevamente se debe encontrar aquel consumidor indiferente al consumo de cualquiera de las dos firmas. Para ello entonces se igualan los costos de comprarle a cada firma:

p1+ cx2 = p2+ cy2, al reorganizar y factorizar se llega a

x2− y2= p2− p1 c , que se puede reexpresar como

(x + y)(x − y) = p2− p1 c , al usar la condici´on de que y = l − a − b − x, se tiene que

(x − l + a + b + x)(x + l − a − b − x) = p2− p1 c , de donde puede despejarse la variable x y llegar a

x = p2− p1

2c(l − a − b)+l − a − b

2 .

De esta manera las cantidades demandadas a la firma 1 vienen dadas por

q1(p1, p2) =





a +2c(l−a−b)p2−p1 +l−a−b2 , si 0 ≤ a + 2c(l−a−b)p2−p1 +l−a−b2 ≤ l, l, si a + 2c(l−a−b)p2−p1 +l−a−b2 > l, 0, si a + 2c(l−a−b)p2−p1 +l−a−b2 < 0.

Con lo que para las funciones de beneficios πi = piqi, i = 1, 2, se tiene que los precios dados por p1 = c(l − a − b)



l +a − b 3



, (1.8)

p2 = c(l − a − b)



l +b − a 3



, (1.9)

(15)

caracterizan el ´unico equilibrio de Cournot-Nash de la competencia en precios para ubicaciones fijas (a, b).

Estos precios generan, para la firma 1, los beneficios dados por:

π1 =



c(l − a − b)



l +a − b 3

 

a + p2− p1

2c(l − a − b) +l − a − b 2

 ,

y al usar ac´a los precios de equilibrio se llega a π1 = c (l − a − b)



l +a − b 3

 

a + b − a

3 +l − a − b 2

 , de donde

π1 = c

2(l − a − b)



l +a − b 3

2

.

Al realizar el ´algebra correspondiente se puede mostrar que en esta situaci´on

∂π1

∂a = −c 6



l +a − b 3



(l + 3a + b) < 0, y an´alogamente para la firma 2

∂π2

∂b < 0,

lo que ilustra que dada una configuraci´on de ubicaciones cualquiera (a, b), las firmas en este ejemplo tienen incentivos a alejarse la una de la otra, contrario a la conclusi´on obtenida por Hotelling. Este ser´ıa conocido como el principio de m´axima diferenciaci´on.

1.3. Una generalizaci´ on del modelo de Hotelling

Economides (1993) expone un modelo en el que incorpora la valoraci´on dada por los individuos al bien diferenciado, la existencia de un mercado externo que les provee la posibilidad de comprar un bien sustituto, y la existencia de m´ultiples firmas (de manera precisa, se analiza el caso con n firmas, con n ≥ 3), pero manteniendo los costos de desplazamiento lineales, con lo cual se generalizan las diferentes valoraciones de los consumidores y el n´umero de firmas involucradas, pero se mantiene el mismo marco del modelo original de Hotelling. Aqu´ı se le atribuye una dotaci´on inicial R en dinero y una funci´on de utilidad separable 4 a cada uno de los individuos en la ciudad lineal dada por,

U (·) =

(U (I, z) = I + k − c|w − z|, si consume una unidad del producto tipo z, U (I, z) = R, si consume el bien sustituto,

donde, w es la posici´on del individuo medida como la distancia desde el extremo izquierdo de la ciu- dad lineal. Esta ciudad puede interpretarse como un espacio de medida de alguna caracter´ıstica sobre la cual se da la diferenciaci´on horizontal de producto. Por ejemplo, el nivel de concentraci´on de az´ucar en una bebida, el volumen de la m´usica en un bar, etc. As´ı, w puede representar la medida ideal de dicha propiedad para ese consumidor, es decir que w ser´ıa el “tipo” de consumidor. I = R − Pz, corresponde al remanente en dinero, despu´es de haber comprado una unidad del bien diferenciado, z es el tipo de producto diferenciado que consume, k es la m´axima disposici´on a pagar del consumidor por una unidad del producto diferenciado y c es el costo por unidad de diferencia entre el tipo de producto ideal y el que se consume.

4Una funci´on de utilidad U (x, y) se dice separable si se tiene que U (x, y) = f (x) + g(y).

(16)

Esta funci´on de utilidad presenta un pico cuando w = z, es decir, cuando el bien consumido coincide con el ideal de ese consumidor. El problema de los consumidores en este modelo consiste en elegir entre las variedades ofrecidas aquella que maximice su utilidad, teniendo la opci´on de no consumir dentro de este mercado y obteniendo una utilidad por ello.

Las firmas producen con una tecnolog´ıa de costos marginales constantes5 e iguales a m. Se asume que cada firma j ofrece su producto xj a un precio de Pj = pj+ m, donde pj es el incremento sobre el costo marginal. Nuevamente, el problema se modela como un juego de dos etapas, en el que la primera etapa consiste en la elecci´on de las ubicaciones de las firmas, y la segunda etapa consiste en la colocaci´on de sus respectivos precios de venta. Estas etapas son llamadas por Economides de largo plazo y de corto plazo, respectivamente. Sea x = (x1, x2, ..., xn), la funci´on objetivo de la firma j es Πj = Πj(p1, p2, ..., pn|x). Es evidente que el juego donde la firma j usa el precio Pj como estrategia, resulta equivalente al cual en el que la firma j elige el incremento sobre su costo marginal pj = Pj− m como su estrategia. Una n-tupla (p1, p2, ..., pn) ≡ p(x) es un equilibrio no-cooperativo del juego de corto plazo si

Πj(p|x) ≥ Πj(p1, p2, ..., pj−1, pj, pj+1, ..., pn), para todo j y todo pj.

Dado que interesa encontrar aquellos equilibrios que sean ENPS, se define un equilibrio de “largo plazo” como la configuraci´on de ubicaciones (o variedades), que produce un ´unico equilibrio de Nash en el juego de “corto plazo”. Sea Πuj(x) ≡ Πj(p(x), x) la funci´on de pagos del jugador j en el juego de “largo plazo”, donde pj ≡ pj(x) es el equilibrio de Nash en el juego de “corto plazo”, siendo la estrategia de cada firma el aumento de precio sobre el costo marginal (pj), y las ubicaciones siendo x = (x1, x2, ..., xn), todas distintas. Entonces un equilibrio de Nash perfecto en subjuegos (ENPS ) es un equilibrio no cooperativo de la etapa de ubicaciones (variedades) en el cual las firmas usan Πuj(x), j = (1, 2, ..., n), como funciones objetivo.

Una configuraci´on competitiva debe ser una en la que las firmas est´en en competencia directa. Para que esto ocurra deben tenerse dos condiciones: que todas las firmas enfrenten una demanda positiva, y que todos los consumidores de la ciudad lineal prefieran comprarle a alguna de estas firmas con producto diferenciado, en lugar de no hacerlo y comprar el bien “gen´erico”(externo). Dicho de otro modo, debe tenerse que, para toda firma j se tenga que:

pj > m´ax[pj−1− c(xj− xj−1), pj+1− c(xj+1− xj)],

pj < m´ın[2k − 2m − c(xj− xj−1) − pj−1, 2k − 2m − c(xj+1− xj) − pj+1].

Para deducir la primera condici´on puede notarse que, para cada firma j, se debe cumplir que: Uxj >

Uxj+1 y Uxj > Uxj−1. Esto significa que la utilidad que le reporta a cada individuo consumir su producto ideal, es mayor que consumir un producto cercano al ideal. Reescribiendo se tiene

I − Pj+ k − c|xj− xj| > I − Pj+1+ k − c|xj+1− xj|, y

I − Pj+ k − c|xj− xj| > I − Pj−1+ k − c|xj− xj−1|.

Usando el hecho de que Pj = pj+ m, se puede reescribir la primera desigualdad como

−pj > −pj+1− c(xj+1− xj),

5No necesariamente iguales a cero (0) como en el modelo de Hotelling.

(17)

de donde

pj+1+ c(xj+1− xj) > pj. (1.10)

Tambi´en se puede reescribir la segunda desigualdad como

pj−1+ c(xj− xj−1) > pj, (1.11) y al asociar (1.10) con (1.11) se tiene la condici´on que se quer´ıa mostrar.

Bajo estas condiciones de competencia directa, existen dos consumidores indiferentes por cada firma j (excepto las firmas de los extremos, i.e j 6= 1, j 6= n) as´ı:

zj = [xj+ xj−1+ (pj− pj−1)/c]

2 , zj+1 = [xj+ xj+1+ (pj+1− pj)/c]

2 .

Con esto, la funci´on de beneficios de la firma j es:

Πj = Z zj+1

zj

dz = pj(zj+1− zj).

Maximizando con respecto a pj se tiene que pmj = [pj+1+ pj−1+ c(xj+1− xj−1)]/4. Este resultado se mantiene si las firmas se encuentran en posiciones diferentes; si se encuentran ubicadas en el mismo lugar la competencia en precios se hace a la Bertrand, llevando a que los precios se igualen con el costo marginal.

Ahora bien, la primera y la ´ultima firma compiten ´unicamente con una firma vecina, de forma que para el caso de la primera firma tenemos que: Π1= p1z1 = p1[x1+ x2+ (p2− p1)/c]/2. Al maximizar se tiene que pm1 = [p2+c(x1+x2)]/2 y, similarmente para la firma n se tiene que pmn = [pn−1+c(2−(xn+xn−1))]/2.

Sea p = (p1, p2, ..., pn) el vector de incrementos en el precio sobre el costo marginal y sea A la matriz tal que ai,i = 1 para todo i; a1,2 = −12; ai,i+1 = −14 para todo i 6= 1; y an,n−1 = −12; ai,i−1 = −14 para todo i 6= 1, i 6= n; y sus dem´as entradas son iguales a 0 (A es tridiagonal). Entonces las condiciones de primer orden que dan lugar a los m´aximos hallados antes pueden expresarse como

Ap= y, o de forma extendida,

1 −12 0 0 . . . 0

14 1 −14 0 . . . 0 0 −14 1 −14 . . . 0 ... . .. ... ... ... ... 0 0 0 −14 1 −14

0 0 0 0 −12 1

 p1 p2 p3 ... pn−1

pn

=

 y1 y2

y3 ... yn−1

yn

 ,

donde y1 = c(x1+ x2)/2, yn = c[1 − (xn−1+ xn)/2] y yj = c(xj+1− xx−1)/4 para j = 2, 3, ..., n − 1. La inversa de A existe y por ello las condiciones de primer orden se pueden hallar mediante

p = A−1y.

Vale la pena destacar que, debido a que los costos de transporte son lineales, tanto la matriz A como su inversa, son independientes de las ubicaciones elegidas por las firmas. Economides (1989) expone un

(18)

caso en el que la matriz A depende de las ubicaciones dado que asume costos de transporte no lineales.

A partir de este marco, Economides menciona algunos resultados. En primer lugar muestra que bajo esta configuraci´on no es posible que exista un equilibrio en el cual todas las firmas hagan los mismos be- neficios, puesto que las firmas tienen incentivos a tratar de eliminar a sus vecinas mediante una reducci´on en el precio de venta (lo cual claramente va en contra de la definici´on de equilibrio); m´as a´un, muestra que el juego de dos etapas que se ha venido analizando no posee un equilibrio de Nash perfecto en subjuegos si el costo de relocalizaci´on de las firmas es gratuito (y el precio de reserva de los consumidores es alto):

todas las firmas tienen incentivos a re-ubicarse hacia la firma del centro (o firmas centrales, si el n´umero de firmas es par).

Economides entonces expone un ejemplo en el que todas las n firmas equidistan la una de la otra, en el que, dado un precio de reserva de los consumidores suficientemente alto, un equilibrio de Nash perfecto en subjuegos existe.6 En este ejemplo, las firmas establecen precios que terminan siendo en forma de U, donde las firmas de los extremos (la firma 1 y la firma n) cobran precios m´as altos, puesto que tienen un poder de mercado superior debido a la menor competencia, mientras que las firmas restantes cobran un precio cada vez menor conforme se aproximan a la firma central, que cobra el precio m´as bajo.

Para finalizar su an´alisis, se trata luego el caso en el que el precio de reserva de los consumidores es bajo. Aqu´ı pueden ocurrir dos cosas: que cada firma en equilibrio funcione como un monopolio local; o que las firmas se encuentren en la parte quebrada de la demanda. En el primer caso, debido al bajo precio de reserva, hay consumidores entre firmas que prefieren no comprar el bien diferenciado y, por el contrario, consumen del bien “gen´erico”(del mercado externo), confirgurando as´ı un equilibrio de Nash perfecto en subjuegos en el que no todos los consumidores compran a alguna de las firmas en cuesti´on. El caso en el que las firmas se ubican en la parte quebrada de la demanda tambi´en presenta una configuraci´on sim´etrica de ubicaciones que sustenta un equilibrio de Nash perfecto en subjuegos7.

Ahora bien, otros autores han trabajado en extender el modelo de Hotelling con costos de despla- zamientos cuadr´aticos (el propuesto inicialmente por D’Aspremont, Gabszewicz y Thisse en 1979), por ejemplo B¨ockem (1994) desarrolla un modelo en el que modifica la elasticidad de la demanda de los con- sumidores, y concluye que en un escenario m´as realista, en el que los consumidores tiene la posibilidad de consumir bienes por fuera del mercado diferenciado, el llamado principio de m´axima diferenciaci´on no es un resultado robusto; en efecto, B¨ockem da muestra del dilema que enfrentan las firmas cuando, por un lado, tratan de homogenizar sus productos para capturar la mayor cantidad de consumidores, y por el otro lado, compiten en precios de forma m´as o menos fuerte seg´un el grado de diferenciaci´on que alcancen. As´ı, si las firmas est´an lo suficientemente diferenciadas la competencia en precios se suaviza, y si por el contrario las firmas alcanzan una diferenciaci´on leve, la competencia en precios es mayor. Por su parte Brenner (2005) modifica ´unicamente el n´umero de firmas involucradas en el an´alisis, y muestra que de esta manera no se alcanza ni la m´ınima diferenciaci´on, como lo aseguraba Hotelling, ni la m´axima diferenciaci´on, como lo concluyeron D’Aspremont et al, y el resultado termina siendo uno en el que las firmas de los extremos poseen un poder de mercado mayor, mientras que las firmas interiores se enfrentan a una competencia en precios m´as fuerte. Este resultado es consistente con el encontrado por Economi- des (1993), pero con la diferencia de que esta configuraci´on s´ı sustenta un equilibrio de Nash perfecto en subjuegos: Brenner hace la demostraci´on para el caso de tres firmas y encuentra num´ericamente las soluciones para el caso de hasta nueve firmas. Jost (2018) hace una buena s´ıntesis de lo expresado ac´a.

6Ver el Teorema 2, Economides (1993).

7Ver el Teorema 4, Economides (1993).

(19)

Control ´ optimo

En este cap´ıtulo se desarrollan algunos conceptos fundamentales de la teor´ıa de control ´optimo, se describe el problema y se muestran los caminos usuales que se siguen para encontrar la(s) soluci´on(es): El principio de programaci´on din´amica y el principio del m´aximo de Pontryagin. Vale la pena resaltar que aunque ambos m´etodos arrojan el mismo valor ´optimo del funcional implicado en el problema, esto no significa que las funciones soluci´on sean iguales. Sobre esta diferencia, y sus implicaciones, se discute al final del cap´ıtulo.

En un problema de control ´optimo se desea optimizar un funcional a lo largo de un horizonte temporal, sujeto a que cierto conjunto de ecuaciones diferenciales se satisfaga. Para alcanzar el ´optimo requerido en el problema existe un conjunto de variables de control que afectan tanto el valor del funcional direc- tamente, como las ecuaciones de estado. El objetivo es encontrar el conjunto de variables de control que logren optimizar el problema.

Siguiendo lo anterior, sea A ⊆ Rn un conjunto, f : Rn× A → Rn una funci´on continua Lipschitz1, y x0 ∈ Rn una condici´on inicial del problema. El objetivo es solucionar un sistema din´amico descrito por

(˙x(t) = f (t, x(t), u(t)),

x(0) = x0, (2.1)

para todo t > 0. Note que la funci´on soluci´on x(t) depende de la funci´on u(t) y de la condici´on inicial x0. La funci´on u(t) se denomina un control para (2.1).

Sin embargo no es posible usar cualquier funci´on como control, por lo se debe tener una regla que permita determinar cu´ales funciones son permitidas. Por ello se hace la siguiente definici´on:

Definici´on 2.1. Se define la colecci´on de controles admisibles como el conjunto A = {u : [0, ∞) → A | u(·) sea medible}.

Con esto, el inter´es se centra en hallar el control adecuado para este sistema. Para ello se hace necesario definir alg´un critero que permita decidir cu´al, dentro de todos los posibles controles admisibles, es mejor.

Definici´on 2.2. Dado T > 0, denominado tiempo terminal, una funci´on r : Rn×A → R, llamada funci´on de pago variable y g : Rn→ R, llamada funci´on de pago terminal, se define el funcional de pago como

P [u(t)] = Z T

0

r(t, x(t), u(t))dt + g(x(T )).

1Una funci´on f : M → N , con M y N espacios m´etricos se dice continua Lipschitz si existe una constante K ≥ 0 tal que para todo x, y en M , se tiene que

dN(f (x), f (y)) ≤ KdM(x, y).

Esta condici´on es necesaria para probar la existencia y unicidad de la soluci´on de problemas de este tipo.

12

(20)

Con x(t) siendo la soluci´on de (2.1) para el control u(t).

De esta manera se busca encontrar aquel control u(t), tal que P [u(t)] ≥ P [u(t)],

para todo control admisible. Al control que cumpla esta condici´on se le denomina control ´optimo.

Para dar soluci´on al problema se analiza la siguiente familia de funciones:

(˙x(s) = f (x(s), u(s)), con s ∈ [t, T ],

x(t) = x0, (2.2)

cuyo funcional de pago es

P [u(s)] = Z T

t

r(x(s), u(s))ds + g(x(T )), (2.3)

para todo tiempo inicial t ∈ [0, T ] y condiciones iniciales x(t) ∈ Rn.

2.1. Programaci´ on din´ amica

La primera v´ıa que se analiza a continuaci´on sigue a Evans (1998), quien a su vez se basa en Bellman (1957), y transforma el problema en la b´usqueda de la soluci´on de una ecuaci´on en derivadas parciales: el m´etodo de programaci´on din´amica. Para esto se define la funci´on valor:

Definici´on 2.3. Para x ∈ Rn, 0 ≤ t ≤ T , se define la funci´on valor v(x, t) como el m´aximo posible si el problema en (2.3) da inicio en el tiempo t con x ∈ Rn. Esto es,

v(x, t) = sup

u∈A{P [u(t)], x ∈ Rn, t ∈ [0, T ]}.

En el caso en el que el tiempo de inicio coincida con el tiempo final, esto es t = T , la funci´on valor asigna el pago terminal, es decir

v(x, T ) = g(x), x ∈ Rn.

Ahora bien, esta funci´on valor es consistente con el principio de optimalidad de Bellman, que en palabras dice que una trayectoria ´optima debe ser ´optima en cada momento del tiempo; es decir, que para el caso particular de la funci´on valor, esta debe ser el supremo de todos los pagos posibles en cualquier intervalo de tiempo analizado, siempre que se encuentre en el horizonte temporal del problema. Esta caracter´ıstica se garantiza por el siguiente teorema, cuya demostraci´on puede verse en Chiappara (2011).

Teorema 2.1. Para cada h > 0 lo suficientemente peque˜no tal que t + h ≤ T , se tiene que v(x, t) = sup

u∈A

Z t+h t

r(x(s), u(s))ds + v(x(t + h), t + h), donde x(·) es la soluci´on de (2.2) para el control u(s).

Se debe encontrar una ecuaci´on diferencial para la funci´on v, por lo que se recurre al siguiente teorema.

(21)

Teorema 2.2. Suponga que v ∈ C1(Rn× (0, T )). Entonces, v es soluci´on de la ecuaci´on de Hamilton- Jacobi-Bellman2 (HJB) dada por

vt(x, t) + m´ax

a∈A{f (x, a) · ∇xv(x, t) + r(x, a)} = 0, (2.4) en Rn× (0, T ), con la condici´on final

v(x, T ) = g(x), x ∈ Rn.

A partir de lo anterior se construye el control ´optimo solucionando primero (2.4) para obtener la funci´on v. Una vez conocida v se define, para cada x ∈ Rn y para cada t ∈ [0, T ] un u(t) = a, con a ∈ A, de manera que a sea aquel donde se alcanza el m´aximo en (2.4) para los argumentos (t). Dicho de otro modo, se define un u(t) tal que

vt(x, t) + f (x, u(t)) · ∇xv(x, t) + r(x, u(t)) = 0. (2.5) Con esto se soluciona, suponiendo que la funci´on u(t) es suficientemente regular, el siguiente sistema:

(˙x(s) = f (x(s), u(x(s), s)), s ∈ [t, T ],

x(t) = x. (2.6)

Y finalmente se elige el control ´optimo u(s) = u(x(s), s). Esto significa que, si el estado del sistema din´amico en el tiempo t es x, se elige el control que en ese instante del tiempo t, tome el valor a ∈ A, donde a es aquel en el cual se alcanza el m´aximo de Hamilton-Jacobi-Bellman. Chiappara posteriormente demuestra que este control es efectivamente ´optimo, demostraci´on que se replica a continuaci´on a˜nadiendo algunos comentarios.

Teorema 2.3. El control u(s) que soluciona (2.6) es un control ´optimo.

Demostraci´on. De (2.3) se tiene que P [u(s)] =

Z T t

r(x(s), u(s))ds + g(x(T )).

Por la forma en que el control u(·) fue construido, puede despejarse la funci´on r de (2.5) y reemplazarse para obtener

P [u(s)] = Z T

t

[−vt(x(s), s) − f (x(s), u(s)) · ∇xv(x(s), s)]ds + g(x(T )).

Al factorizar y sacar la constante con signo negativo de la integral se obtiene P [u(s)] = −

Z T t

[vt(x(s), s) + f (x(s)), u(s) · ∇xv(x(s), s)]ds + g(x(T )), de lo cual, al usar la igualdad de ˙x(s) de la ecuaci´on (2.6), se llega a

P [u(s)] = − Z T

t

[vt(x(s), s) + ∇xv(x(s), s) · ˙x(s)]ds + g(x(T ).

2Una ecuaci´on de Hamilton-Jacobi-Bellman tiene la forma

vt+ H(x, ∇xv) = 0, donde

H(x, ∇xv) = m´ax

a∈A{f (x, a) · ∇xv(x, t) + r(x, a)} .

(22)

Esto ´ultimo puede expresarse como

P [u(s)] = − Z T

t

d

dsv(x(s), s)ds + g(x(T ).

Solucionando la integral y evaluando en los l´ımites de integraci´on P [u(s)] = −

Z T t

d

dsv(x(s), s)ds + g(x(T ))

= −v(x(T ), T ) + v(x(t), t) + g(x(T )).

Como v(x(T ), T ) = g(x(T )), entonces,

P [u(s)] = v(x, t).

Ahora, dado que se sabe que

v(x, t) = sup

u(·)∈A

P [u(s)], se puede concluir que

P [u(s)] = sup

u(·)∈A

P [u(s)], lo cual demuestra que u(s) es el control ´optimo.

No obstante, en esta demostraci´on se ha asumido que la soluci´on de la ecuaci´on de Hamilton-Jacobi- Bellman existe y es ´unica, lo cual no es necesariamente cierto. Para superar este impase se recurre primero a un concepto de soluci´on m´as d´ebil, que permita encontrar una soluci´on si es que no existe una en el sentido cl´asico, y posteriormente se demuestra que la funci´on valor que se dedujo es la ´unica soluci´on d´ebil de la ecuaci´on de Hamilton-Jacobi-Bellman analizada. Para finalizar se muestra que adem´as esta soluci´on es consistente con el concepto cl´asico de soluci´on, proceso que consiste en mostrar que la soluci´on d´ebil, si es suficientemente regular, es tambi´en una soluci´on cl´asica.

Para presentar la soluci´on d´ebil que se ha mencionado, se debe introducir el problema de Hamilton- Jacobi-Bellman con valor inicial, esto es

(zt+ H(x, ∇xz) = 0 definido en Rn× (0, ∞),

z(x, t) = g definido en Rn× {t = 0} , (2.7)

donde H(x, ∇xv) = m´axa∈A{f (x, a) · ∇xv(x, t) + r(x, a)} . A partir de esto se presenta lo que se conoce como una soluci´on viscosa.

Definici´on 2.4. Una funci´on z acotada y uniformemente continua se denomina soluci´on viscosa del problema con valor inicial en (2.7) si

1. z = g en Rn× {t = 0} ,

2. para cada v ∈ C(Rn× (0, ∞)) se tiene que

a) Si z − v tiene un m´aximo local en (x0, t0) ∈ Rn× (0, ∞), entonces vt(x0, t0) + H(∇xv(x0, t0), x0) ≤ 0.

b) Si z − v tiene un m´ınimo local en (x0, t0) ∈ Rn× (0, ∞), entonces vt(x0, t0) + H(∇xv(x0, t0), x0) ≥ 0.

(23)

Evans (1998) denomina subsoluci´on a aquella funci´on que solo verifique a), mientras que llama super- soluci´on a aquella que solo satisfaga b). As´ı el problema de encontrar un control ´optimo se convierte en encontrar la soluci´on viscosa de la ecuaci´on de Hamilton-Jacobi-Bellman asociada, con lo cual, haciendo uso del m´etodo de programaci´on din´amica es posible construir el control ´optimo deseado.

Estos desarrollos son suceptibles de ser “extendidos”a ecuaciones diferenciales estoc´asticas, de manera que den cuenta de factores externos que influyen en la decisi´on. Para un estudio utilizando estos enfoques se recomienda ver Chiappara (2011) y Evans (2013).

2.2. Principio del m´ aximo de Pontryagin

La segunda v´ıa por la cual t´ıpicamente se abordan los problemas de control se debe a Pontryagin et al (1962). A continuaci´on se expone el teorema que permite encontrarle soluci´on al problema, en una versi´on que se presenta en Yeung & Petrosyan (2006):

Teorema 2.4. Un conjunto de controles u(s) = ζ(x0, s) produce una soluci´on ´optima al problema de control en (2.2)-(2.3), y {x(s), t ≤ s ≤ T } es la trayectoria de estado correspondiente, si existen funciones de coestado µ(s) : [t, T ] → Rn tales que las siguientes relaciones se tengan:

ζ(x, s) ≡ u(s) = arg m´ax

u {[r, x(s), u(s)] + µ(s)f [s, x(s), u(s)]},

˙

x(s) = f [s, x(s), u(s)], x(t) = x0,

˙

µ(s) = − ∂

∂x{r[s, x(s), u(s)] + µ(s)f [s, x(s), u(s)]}, µ(T ) = ∂

∂xg(x(T )).

Demostraci´on. Se define primero la funci´on Hamiltoniana

H(t, x, u) = r(t, x, u) + vx(t, x)f (t, x, u).

De lo hecho con el principio de programaci´on din´amica se tiene que

−vt(t, x) = m´ax

u H(t, x, u).

Si se usa u para denotar el control que maximiza el pago se obtiene H(t, x, u) + vt(t, x) ≡ 0.

Al diferenciar parcialmente con respecto a x se tiene

vtx(t, x) + rx(t, x, u) + vx(t, x)fx(t, x, u) + vxx(t, x)f (t, x, u) + [ru(t, x, u) + vx(t, x)fu(t, x, u)]∂u

∂x = 0.

Si u es un punto interior, entonces [ru(t, x, u) + vx(t, x)fu(t, x, u)] = 0 como consecuencia de que

−vt(t, x) = m´axuH(t, x, u). Si u no es un punto interior puede mostrarse que [ru(t, x, u) + vx(t, x)fu(t, x, u)]∂u

∂x = 0, pues por ser ´optimos [ru(t, x, u) + vx(t, x)fu(t, x, u)] y ∂u

∂x son ortogonales, e incluso para algunos problemas particulares puede tenerse que ∂u

∂x = 0. La expresi´on vtx(t, x)+vxx(t, x)f (t, x, u) ≡ vtx(t, x)+

vxx(t, x) ˙x puede expresarse como dvx(t, x)

dt , de donde se llega a:

(24)

dvx(t, x)

dt + gx(t, x, u) + vx(t, x)fx(t, x, u) = 0.

Al incorporar el vector de coestados, µ(t) = vx(t, x), donde x corresponde a la trayectoria de estado de u, se tiene que

dvx(t, x)

dt = ˙µ(s) = − ∂

∂x{r[s, x(s), u(s)] + µ(s)f [s, x(s), u(s)]}.

Por ´ultimo, la condici´on terminal de µ(t) viene determinada a partir de la condici´on terminal del control

´

optimo como se vio en el Teorema (2.3), de forma que µ(T ) = ∂v(T, x)

∂x = ∂g(x)

∂x , lo cual termina la demostraci´on.

La manera usual de hacer uso del teorema anterior es construir la funci´on Hamiltoniana del problema de control (en muchas ocasiones llamada simplemente Hamiltoniano), que guarda un gran parecido con la funci´on Lagrangiana de los problemas de optimizaci´on est´atica restringida, y solucionar el sistema de ecuaciones que surge de igualar todas las derivadas parciales del Hamiltoniano con respecto a los controles, a cero (0), e igualar las derivadas parciales con respecto a las variables de estado, al negativo de la variable de coestado derivada respecto al tiempo (lo que en el teorema ser´ıa − ˙µ). Una revisi´on del problema puede revisarse en Kamien & Schwartz (1991).

Puede mostrarse tambi´en que es posible solucionar problemas de control con horizonte temporal infinito haciendo uso del Teorema (2.4). Considere el siguiente problema con descuento:

m´ax

u

Z t

r[x(s), u(s)]e−ρ(s−t)ds



, (2.8)

sujeto a la ecuaci´on diferencial:

˙

x(s) = f [x(s), u(s)]ds, x(t) = x. (2.9)

Se define la funci´on λ(s) = µ(s)eρ(s−t) y, con ello, la funci´on Hamiltoniana en valor corriente:

H(s, x, u) = H(s, x, u)eˆ ρ(s−t)

= r(x, u) + λ(s)f (x, u).

Al usar el Teorema (2.4) con el Hamiltoniano de valor corriente se llega a la soluci´on del problema con descuento.

La elecci´on del m´etodo para solucionar un problema de control var´ıa seg´un el caso: en algunas ocasiones es m´as f´acil usar uno u otro, pero en otras ocasiones es estrictamente necesario el uso de uno en particular para lograr dar cuenta de la cantidad de informaci´on que poseen los agentes al momento de decidir;

sin embargo, en problemas como los descritos en este cap´ıtulo, en los que un solo individuo toma la desici´on, la escogencia del m´etodo recae casi que exclusivamente en la dificultad. Adem´as, el m´etodo de programaci´on din´amica genera soluciones m´as robustas, en cuanto son funciones que maximizan el funcional del problema en todo momento del tiempo, mientras que las soluciones dadas por el principio del m´aximo de Pontryagin no necesariamente: si el tiempo final se acorta, por ejemplo, las funciones encontradas por el principio de programaci´on din´amica se mantienen como las ´optimas, mientras que las del m´aximo de Pontryagin podr´ıan ya no ser ´optimas y, por ende, el problema deber´ıa volver a ser resuelto con el nuevo tiempo final.

Referencias

Documento similar

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

We have created this abstract to give non-members access to the country and city rankings — by number of meetings in 2014 and by estimated total number of participants in 2014 —

Por PEDRO A. EUROPEIZACIÓN DEL DERECHO PRIVADO. Re- laciones entre el Derecho privado y el ordenamiento comunitario. Ca- racterización del Derecho privado comunitario. A) Mecanismos

Porcentaje de radiación solar interceptada (RSI; 0,35 - 2,5 µm) y de radiación fotosintéticamente activa interceptada (RFAI) a lo largo del ciclo de cultivo para las

“La unificación de la clasificación de empresas otorgada por las CC.AA.”, “La unificación de criterios en la acreditación de los servicios de prevención de riesgos

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

En el capítulo de desventajas o posibles inconvenientes que ofrece la forma del Organismo autónomo figura la rigidez de su régimen jurídico, absorbentemente de Derecho público por