You are on page 1of 214

Optimizacin dinmica y teora econmica

Serie: Apuntes de Estudio No. 33


Jos Luis Bonifaz F.
Ruy Lama C.

Optimizacin dinmica y teora econmica

UNIVERSIDAD

DEL PACFICO
CENTRO DE INVESTIGACIN
U n i v e r s id a d d e l P a c f ic o
C e n tr o d e I n v e s tig a c i n
A v e n id a S a la v e r r y 2 0 2 0
L im a 1 1 , P e r

OPTIMIZACIN DINMICA Y TEORA ECONMICA


J o s L u is B o n if a z F.
R uy L am a C.
la . e d ic i n : j u n i o 1 9 9 9 , n o v i e m b r e 1 9 9 9
l a . e d i c i n c o r r e g id a : j u n i o 2 0 0 2 , j u n i o 2 0 0 4 , d ic ie m b r e 2 0 0 9 , a b r il 2 0 1 0 , o c t u b r e 2 0 1 3
D is e o d e la c a r tu la : I c o n o C o m u n i c a d o r e s
IS B N : 9 7 8 - 9 9 7 2 -6 0 3 -7 9 -2
H e c h o el D e p s ito L e g a l e n la B i b l i o t e c a N a c io n a l d e l P e r : 2 0 1 3 - 1 5 4 8 8

B U P - CENDI

Bonifaz, Jos Luis


O p t i m i z a c i n d in m i c a y t e o r a e c o n m i c a / J o s L u is B o n if a z F . y R u y
L a m a C . - L im a : C e n tr o d e I n v e s t i g a c i n d e la U n i v e r s id a d d e l P a c f ic o ,
2 0 1 3 . - ( A p u n t e s d e E s tu d io ; 3 3 )

O P T IM IZ A C I N M A T E M T IC A /C L C U L O D E V A R 1 A C IO N E S /A N L IS IS
E C O N M IC O /T E O R A E C O N M IC A

5 1 2 .2 :3 3 (C D U )

M ie m b r o d e la A s o c i a c i n P e r u a n a d e E d it o r i a l e s U n i v e r s i t a r i a s y d e E s c u e l a s S u p e r i o
r e s ( A p e s u ) y m ie m b r o d e la A s o c ia c i n d e E d it o r i a l e s U n iv e r s i t a r i a s d e A m r ic a L a tin a
y e l C a r ib e ( E u la c ) .

E l C e n tr o d e I n v e s t i g a c i n d e la U n i v e r s i d a d d e l P a c f ic o n o se s o lid a r iz a n e c e s a r ia m e n te
c o n e l c o n t e n i d o d e lo s t r a b a j o s q u e p u b lic a . P r o h i b i d a la r e p r o d u c c i n to ta l o p a r c ia l d e
e s te d o c u m e n to p o r c u a l q u i e r m e d io s in p e r m is o d e la U n iv e r s id a d d e l P a c f ic o .

D e re c h o s re se rv a d o s c o n fo rm e a L ey.
A Giovanna, Camila y Ximena
J.L.B.

A Luis y Alicia
R.L.
Indice

P rlogo........................................................................................................... 11

I. Introduccin a la optimizacin d inm ica.................................. 14


A n ex o.................................................................................................. 28

II. Clculo de variacion es................................................................... 30


1. Condicin de primer orden: la ecuacin de Euler ............. 31
1.1 La ecuacin de E u le r ..................................................... 31
1.2 La ecuacin de Euler en casos especiales .................. 37
1.3 Aplicacin: extraccin ptima de recursos naturales 45
1.4 Aplicacin: poltica anti-inflacionaria p tim a ........... 48
2. Condicin de transversalidad ................................................ 52
2.1 Condicin de transversalidad ....................................... 53
2.2 Casos especiales de la condicin de transversalidad . 56
2.3 Aplicacin: minimizacin de costos ........................... 64
3. Condicin de segundo orden ................................................. 66
3.1 Condicin de segundo o rd e n ........................................ 66
3.2 Condiciones de concavidad........................................... 68
4. Horizonte de tiempo infinito ................................................. 70
4.1 Condiciones para la convergencia del funcional objetivo 71
4.2 Condiciones de primer y segundo orden .................... 73
4.3 Diagramas de fase .......................................................... 76
4.3.1 Diagramas de fase de una variable.................. 76
4.3.2 Diagramas de fase de dos variables ................ 80
4.3.3 Aplicacin: explotacin ptima de peces ..... 86
Anexos ................................................................................................ 96

III. Control ptimo ................................................................................ 98


1. Condicin de primer orden: principio del m xim o............ 101
1.1 El principio del m xim o................................................ 102
1.2 Aplicacin: nivel ptimo de contam inacin............... 114
2. Condicin de transversalidad ................................................ 117
2.1 Casos especiales de la condicin de transversalidad.. 118
2.2 Aplicacin: asignacin de consumo y a h o rro ............ 127
3. Condicin de segundo orden ................................................. 130
3.1 Condicin de segundo orden (teorema de suficiencia
de M angasarian)............................................................. 130
3.2 Condiciones de concavidad y convexidad ................. 131
4. Comparacin entre el clculo de variaciones y el control
ptimo ....................................................................................... 135
5. Control ptimo con factor de descu en to .............................. 139
6. Control ptimo con horizonte temporal infinito ................. 141
6.1 Condiciones de primer y segundo orden .................... 142
6.2 Aplicacin: modelo neoclsico de crecimiento.......... 146

IV. Programacin dinmica ................................................................ 162


1. Optimizacin dinmica empleando las condiciones de
Kuhn-Tucker ........................................................................... 163
1.1 Las condiciones de K uhn-Tucker................................ 163
1.2 La ecuacin de Euler: condicin de optimizacin
intertemporal ................................................................... 166
1.3 Condicin de segundo o rd e n ........................................ 168
2. Programacin dinmica con horizonte temporal finito ........... 179
2.1 El principio de optim alidad........................................... 180
2.2 La ecuacin de Bellman ................................................ 182
2.3 La ecuacin de Benveniste y Scheinkman ................. 182
2.4 La ecuacin de E u le r...................................................... 183
3. Programacin dinmica con horizonte temporal infinito........... 189
3.1 Mtodo de las aproximaciones sucesivas................... 190
3.2 Mtodo de "adivinar y verificar" ................................ 192
3.3 Condicin de transversalidad ....................................... 195
4. Programacin dinmica con incertidumbre ......................... 197
4.1 La ecuacin de Bellman ................................................ 198
4.2 La ecuacin de Euler estocstica................................. 208

Anexo................................................................................................... 208

Bibliografa 210
Prlogo

Optimizacin dinmica v Teora econmica es un Apuntes de Estudio que ha sido


desarrollado sobre la base de nuestra experiencia en el dictado del curso Mtodos
de Optimizacin Econmica de la Facultad de Economa de la Universidad del
Pacfico. Dicho curso tiene como finalidad introducir a los alumnos de pregrado en
las tcnicas matemticas de optimizacin aplicadas al anlisis econmico y cubre
los tpicos de programacin matemtica, optimizacin dinmica y teora de juegos.
De estos tres temas, el segundo ha presentado una mayor dificultad en el curso. El
problema radica en que no existe en el mercado bibliogrfico peruano un texto
universitario escrito en espaol que abarque dicho tema. En algunas bibliotecas
universitarias es posible encontrar muy buenos libros de optimizacin dinmica,
tanto en el nivel de pregrado como de posgrado, pero en la mayora de los casos las
ediciones se encuentran publicadas en ingls. Este hecho condujo a que buena
parte de nuestros alumnos tuvieran limitaciones cuando deseaban profundizar un
tema especfico del curso. Este problema fue el principal factor que motiv la
publicacin de esta suerte de manual de optimizacin. Hemos incluido en el texto
las tres tcnicas ms relevantes de optimizacin intertemporal: clculo de
variaciones, control ptimo y programacin dinmica. En el desarrollo de estos
temas hemos enfatizado los resultados de las aplicaciones econmicas, sin
descuidar el desarrollo formal de los problemas.

El presente texto no solo pretende ser un documento de referencia para el curso de


la Universidad del Pacfico, sino que constituye tambin un aporte tanto para los
estudiantes de economa de todas las universidades del pas, a quienes no les es
posible acceder a bibliografa en idiomas extranjeros, como para los profesionales
vinculados al mundo acadmico que deseen actualizar sus conocimientos en el
instrumental matemtico de la optimizacin dinmica. Asimismo, pensamos que
ser una herramienta importante de preparacin para aquellos estudiantes que
desean seguir estudios de posgrado en economa. Sin embargo, para que sea
posible la compresin del presente texto, es necesario contar con nociones previas
12 Apuntes de Estudio

en programacin matemtica, ecuaciones diferenciales y ecuaciones en diferencias.


Sobre la base de estos temas, se facilita en gran medida la comprensin de la teora
y las aplicaciones econmicas de las tcnicas de optimizacin intertemporal.

Es importante considerar que el Apuntes de Estudio ha sido elaborado pensando


fundamentalmente en un lector promedio, que se encuentra cursando el pregrado
de la carrera de economa. En este sentido, en la medida de lo posible, se ha
evitado tratar los temas ms complejos de las tcnicas de optimizacin dinmica.
Es el caso de la mayora de los ejemplos, en donde solamente hemos considerado
dos variables dinmicas, cuando en general se podran incluir n variables.
Asimismo, no se han incluido aspectos tericos que permiten resolver los
problemas de optimizacin para casos ms complicados. Por otra parte, una
limitacin del documento es que no se ha incluido, como parte de la teora, la
resolucin de problemas mediante mtodos computacionales, que constituye la
forma ms eficiente de enfrentar un problema de optimizacin intertemporal. No
obstante, en futuras ediciones podran cubrirse todos estos aspectos.

En esta primera edicin corregida presentamos algunas modificaciones, las que


fueron gentilmente sugeridas por los alumnos de la Facultad de Economa de la
Universidad del Pacfico y del curso de Extensin Universitaria del Banco Central
de Reserva. Agradecemos, en esta presentacin, la eficiente labor de Claudia
Delgado y Eduardo Mantilla en la incorporacin de dichos cambios.

Finalmente, quisiramos agradecer por la publicacin del presente documento a la


Universidad del Pacfico, por su apoyo a la difusin de los mtodos cuantitativos
aplicados a la economa; en particular, a Jorge Femndez-Baca, por el especial
inters mostrado en el desarrollo de este proyecto, y a Eduardo Morn, por sus
valiosos comentarios sobre el tratamiento general del tema. Cualquier error u
omisin queda enteramente bajo nuestra responsabilidad.

Los Autores
I

Introduccin a la
optimizacin dinmica
Conforme ha ido evolucionando la teora econmica, las tcnicas de optimiza
cin matemtica cada vez han cobrado una mayor relevancia. stas han permi
tido que la ciencia econmica formule y explique diversos problemas de una
manera ms rigurosa y precisa. En general, diversas variables econmicas como
el precio de un producto, los beneficios de una empresa o la produccin de un
pas pueden ser explicadas de una forma simple a travs de un problema de op
timizacin, en el cual se encuentra presente una funcin objetivo, que represen
ta de una u otra forma el bienestar del agente optimizador y un conjunto de res
tricciones, que constituyen las limitaciones a las cuales se encuentra sujeto el
individuo.

Gran parte de los problemas econmicos pueden modelarse mediante tcnicas


de optimizacin esttica. El clsico problema de maximizacin de la utilidad
del consumidor es un ejemplo de ello. En este caso, se plantea una situacin
en la cual un individuo desea maximizar su utilidad sujeto a una restriccin de
ingresos. A partir de este problema es posible obtener la funcin de demanda
por algn bien que sea de inters para el consumidor, pero slo para un pe
rodo de tiempo. En dicho caso, la variable temporal no es relevante.

Sin embargo, este enfoque del problema de eleccin del consumidor presenta
limitaciones. En general, cuando un agente toma una decisin, considera las
consecuencias sobre su bienestar futuro. Podemos pensar en las decisiones de
ahorro de las personas, en las decisiones de inversin de las empresas o en las
14 Apuntes de Estudio

decisiones de endeudamiento de un gobierno. En todos estos casos, el agente


optimizador toma en cuenta el efecto futuro de sus decisiones presentes.

Para introducirnos en la formulacin del problema de optimizacin dinmica,


desarrollaremos un problema simple de eleccin del consumo a lo largo del
tiempo. Supondremos que existen slo dos perodos: el presente, o perodo 1,
y el futuro, o perodo 2, y hay un solo bien de consumo (C) en la economa
que tiene un precio igual a l ' . Tambin asumiremos que existe un consumidor
con una cantidad de dinero equivalente a I unidades monetarias (u.m.) en el
presente, pero decide no trabajar en el futuro, por lo cual no recibir ingresos
en dicho perodo.

Adems, este individuo vive dos perodos y valora tanto el consumo presente
(C i) como el consumo futuro (C2). Sin embargo, el consumidor presenta cier
to grado de impaciencia, y tiene una mayor utilidad si consume en el presente
que si consume en el futuro. Una funcin de utilidad que refleje estas prefe
rencias es la siguiente:

U {Q Q = /(Q +j3/(Q (0<j8<D / ( Q > 0 / ( Q < 0 V / =U (1)

Esta funcin puede interpretarse como una suma ponderada de las utilidades
asociadas a cada perodo. Mientras que la utilidad proveniente del primer pe
rodo tiene una ponderacin igual a 1, la utilidad del segundo perodo tiene
una ponderacin igual a p. Al ser este coeficiente una fraccin entre cero y
uno, el consumidor le asigna un menor valor a la utilidad proveniente del fu
turo. Dicho factor de ponderacin se denomina factor de descuento, y refleja
el grado de impaciencia intertemporal del individuo. Si el factor tomara el va
lor de cero, nos encontraramos en un caso extremo en el cual el consumidor
es totalmente impaciente, y slo valora el consumo presente12. En cambio, si el
factor tomara un valor igual a uno, tendramos otro caso extremo, en el cual el
consumidor le dara el mismo grado de importancia al consumo presente y al
consumo futuro.

Una propiedad, en particular, de esta funcin de utilidad es que es aditiva


con respecto al tiempo. Ello implica que la funcin puede expresarse como la

1. E l c o n s u m o p u e d e i n t e r p r e t a r s e c o m o la c a n t i d a d d e d i n e r o d e s t i n a d a a b i e n e s d e c o n s u m o .

2. A las d e c is i o n e s q u e se t o m a n c o n s i d e r a n d o e x c l u s i v a m e n t e e l b i e n e s t a r p r e s e n t e s e les
d e n o m i n a n d e c is i o n e s m io p e s . E n g e n e ra l, los p r o b l e m a s d e o p t i m i z a c i n d i n m i c a n o c o n s i d e
ran a g en tes o c o n s u m id o re s m io p es".
Introduccin a la optimizacin dinmica 15

suma de las utilidades asociadas a cada perodo del tiempo (f(C) Vi = 1. 2).
Esta especificacin de la funcin de utilidad simplifica en gran medida la re
solucin de los problemas de optimizacin intertemporal.

La restriccin presupuestaria que enfrenta este consumidor abarca los dos pe


rodos. Al igual que la restriccin presupuestaria formulada en la teora del
consumidor, la restriccin intertemporal limita la decisin del agente a que no
consuma ms de lo que puede adquirir con sus recursos. Sin embargo, debido
a la existencia de la variable temporal, el ingreso y el consumo en cada perio
do no son comparables directamente en la restriccin presupuestaria. Esto se
debe al valor que posee el dinero en el tiempo.

Ello puede apreciarse al comparar 1 u.m. recibida en el presente con respecto


1 u.m. recibida en el futuro. Si a una persona le otorgaran 1 u.m. en el presen
te podra acudir a una entidad financiera, depositar dicha cantidad en una
cuenta de ahorros a una tasa positiva de r por ciento por perodo, y en el
futuro obtendra (1 + r) u.m. Al ser (1 + r) mayor que 1 en el perodo futuro,
resulta ms conveniente recibir el dinero en el presente. De esta manera, para
comparar flujos de dinero es necesario primero descontarlos por la tasa de
inters. En este sentido, (1 + r) u.m. en el futuro resultara equivalente a 1
u.m. en el presente; de igual forma, 1 u.m. en el futuro tendra el mismo valor
que 1/(1 + r) en el presente5.

En finanzas, a esta comparacin entre flujos de dinero provenientes del futuro con
respecto al tiempo presente se le denomina valor presente. Para este caso en par
ticular, 1 u.m. constituira el valor presente de 1 + r u.m. del futuro. En general,
dada una cantidad de dinero A en el futuro, su valor presente estara dado por
A/(l + r f u.m., que representa el valor del dinero futuro en el perodo actual.

La restriccin presupuestaria a la que est sujeta este consumidor establece


que el consumo en el primer perodo ms el valor presente del consumo en el
segundo perodo, debe ser equivalente a los ingresos en el primer perodo34:

3. U n i n d i v i d u o p o d r a d e p o s i t a r 1/ (1 + r ) u . m . e n u n a e n t i d a d f i n a n c i e r a , y o b t e n e r I u . m .
e n el fu tu ro .

4. La restricci n p r e s u p u e s ta ria e st p la n te a d a d e e sa f o rm a p o r q u e se a s u m e el sig u ie n te


p r o c e s o d e e l e c c i n . E l c o n s u m i d o r e n e l p e r o d o 1 c u e n t a c o n 1 u . rr :. , y d e c i d e e l c o n s u m o e n

d i c h o p e r o d o ( ( ) . E l i n g r e s o r e m a n e n t e (1 - C ) e s d e p o s i t a d o v a u n a e n t i d a d f i n a n c i e r a a u n a
l a s a d e " r " p o r c i e n t o . E n e l s i g u i e n t e p e r o d o d e s t i n a t o d o s s u s i n g r e s o s [ 1 + r J [ I - C \ ]) a l c o n
s u m o f u t u r o t C E ) . D e e s t a f o r m a s e c u m p l e la i g u a l d a d [1 + r j [ l - C i ] = C : , q u e n o e s o t r a c o s a
q u e la r e s t r i c c i n p r e s u p u e s t a r i a ( 2 ) .
16 Apuntes de Estudio

C2
C, + -= / (2)
1+ r

Con dicha restriccin se evita que el consumo a lo largo de los dos perodos ex
ceda a sus ingresos. Una vez definida la funcin objetivo y la restriccin inter
temporal. el problema de optimizacin que enfrenta el individuo es el siguiente:

Maxim izar U(Cr C2) (3 )


C, ,
suieto a L, H---- = I
1 l +r

La solucin al problema se presenta en el Grfico No. 1.1. La decisin ptima


del individuo consistira en destinar sus recursos tanto al consumo presente
(Ci ) como al consumo futuro (C2 ). Este ejemplo constituye una formulacin
sumamente sencilla de un problema de optimizacin dinmica. El objetivo del
problema consiste en determinar la decisin ptima del agente en cada pero
do del tiempo, tomando en cuenta que el individuo le asigna importancia, a
travs de la funcin de utilidad, a sus decisiones futuras.

El problema de eleccin intertemporal del consumo puede extenderse a un horizonte


de tiempo mayor. El consumidor podra tener utilidad por el consumo en los siguien
tes T perodos. De esta forma, la funcin de utilidad del consumidor sera la si
guiente:

U = / (C ,) + P f ( C 2) + P 2/ ( C 3) + ...+ 3 r f ( C T ) (4)

o expresada en una sumatoria:

(5)
/=i
Introduccin a la oplimi/acin dinmica 17

Grfico No. 1.1

En esta funcin de utilidad, el factor de descuento posibilita que conforme el


consumo sea de un perodo ms lejano con respecto al presente, el individuo
le asignar una menor importancia*5. Por otra parte, la restriccin intertempo
ral para T perodos sera similar a la restriccin (2). sta establece que la
suma del consumo en cada perodo, expresado en valor presente, debe ser
equivalente al ingreso:

C-,
-+ -
1+ r (I + r)~ (1 + r)

B.ulll
5. E n el lm ite , c u a n d o el p e r o d o tie n d a a in fin ito , el fa c to r d e d e s c u e n t o te n d e r a c e ro
(jm 11 = 0). E l l o i m p l i c a q u e el c o n s u m i d o r le a s i g n a r m u y p o c a i m p o r t a n c i a a l c o n s u m o
p ro v e n ie n te d e p e ro d o s m u y a le ja d o s c o n re s p e c to al p resen te.
18 Apuntes de Estudio

o en trminos de una sumatoria:

T
c.
I (1 + r ) M
=/ (7)

Finalmente, el problema de optimizacin dinmica para un horizonte de tiem


po T sera el siguiente:

\
Maximiz.ur

ii
( 8)

sujeto a Ci ,= /

Hasta el momento, la nica variable dinmica del problema (8) es el consu


mo. Sin embargo, el ingreso tambin puede convertirse en una variable que
dependa del tiempo. Para ello, en vez de emplear como restriccin el ingreso
total, puede utilizarse el ingreso disponible del individuo. Esta variable con
siste en la cantidad de dinero remanente con la que cuenta el agente, en un
perodo cualquiera, para gastos de consumo. La evolucin del ingreso dispo
nible estara dada por la siguiente ecuacin en diferencias:

>7+1 = g ( y t .Q ) = (1 + r) (y - C) (9)

Donde yt representa el ingreso disponible y r la tasa de inters. A la ecua


cin (9) se le denomina ecuacin de movimiento, ya que determina el com
portamiento del ingreso disponible en el tiempo. La lgica de la ecuacin de
movimiento es la siguiente. En un perodo determinado, el individuo posee
una cantidad de ingresos yt, y decide consumir por un monto equivalente a C,.
El dinero remanente (yt - C,) lo destina a una entidad financiera que otorga un
rendimiento igual a r . En el siguiente perodo, el ingreso con el que con
tara sera igual a (1 + r)(yt - C,). En dicho perodo, nuevamente este agente
decidir su nivel de consumo y as se determinar el ingreso disponible pa
ra el siguiente perodo. Este proceso se desarrolla sucesivamente hasta el
perodo T .6

6. Si n o s im a g in a m o s q u e el in g re s o to ta l d e un in d iv id u o e st en u n a c u e n ta d e a h o

rro s, el in g r e s o d i s p o n i b le e s ta r a d a d o p o r el s a ld o d e d i c h a c u e n ta .
20 Apuntes de Estudio

Cabe destacar que en la ecuacin de movimiento (9) se relacionan dos tipos


de variables: la variable de control y la variable de estado. La variable de
control es aquella que debe elegir un agente con el fin de optimizar la funcin
objetivo, mientras que la variable de estado no es directamente controlable
por el agente, y refleja el resultado del problema. Para el ejemplo detallado
anteriormente, el consumo sera la variable de control y el ingreso disponible
a variable de estado.

El problema bsico de optimizacin dinmica (8) podra tener algunas modi


ficaciones adicionales. Por ejemplo, si tenemos una situacin en la cual el ho
rizonte de tiempo es muy largo, podemos especificar la funcin de utilidad
con un horizonte infinito:

c = X ^ ' " / ( c , ) ( 12)


=\

Tambin podra modificarse la naturaleza del tiempo. En vez de definirse una


funcin de utilidad en tiempo discreto tal como (5), se podra establecer en
tiempo continuo. Es decir, el horizonte de tiempo en el cual se desarrolla el
proceso de optimizacin ya no estara compuesto por un conjunto de perodos
(t = 1, 2,..., T), tal como se establece en el problema (8), sino que estara de
terminado por un intervalo de tiempo (t e [0, T ]). Cuando el tiempo es conti
nuo, una sumatoria de variables puede expresarse mediante una integral8. De
esta forma, la funcin objetivo en tiempo continuo sera:

( / = J V 7 ( C ( ) ) r / (13)
0

En este caso, el factor de descuento estara dado por el trmino e"St y, al igual
que en el caso de tiempo discreto, este factor tiene la finalidad de asignarle
una menor ponderacin o una menor valoracin a las utilidades provenientes
de perodos ms alejados con respecto al presente9. Es importante tener en
cuenta que el consumo ya no constituira una variable discreta, sino continua.
Adicionalmente, as como la ecuacin de movimiento se expresa a travs de
---------------- %---------------------
8. M e d i a n t e la i n t e g r a l d e R i e m a n n , u n a s u m a t o r i a e n t i e m p o d i s c r e t o a p r o x i m a e l r e s u l t a
d o d e u n a in teg ral en tie m p o co n tin u o .

9. V e r el A n e x o al fin a l d e l c a p tu lo .
Introduccin a la optimizacin dinmica 21

una ecuacin en diferencias en tiempo discreto, en tiempo continuo dicha


ecuacin estara dada por una ecuacin diferencial:

=y=(y, C) (14)

Dado que en la funcin de utilidad (5) existen tantas decisiones de consumo


como perodos en el tiempo, es que no puede obtenerse una solucin grfica
al igual que en el problema (3). Para ello tendramos que graficar un espacio
de T dimensiones, lo cual sera imposible. En vez de ello, la solucin grfi
ca a la optimizacin de la funcin de utilidad (5) -o alternativamente (13)-
toma la forma de sendas o trayectorias. La idea bsica se refleja en el Grfi
co No. 1.2. De un conjunto amplio de trayectorias de consumo existentes (Si,
S;, Si), el objetivo es seleccionar la "mejor de todas. La "mejor senda est
definida como aquella que optimiza la funcin objetivo.

Grfico No. 1.2


22 Apuntes de Estudio

Cuando se considera a la solucin como una senda, a la funcin de utilidad se


le denomina funcional objetivo. Este concepto hace referencia a aquella fun
cin (en este caso, la funcin de utilidad) que depende de otra funcin (como,
por ejemplo, el consumo)10*12. Dicho concepto es similar al de funcin objetivo
empleado en los problemas de optimizacin esttica. Por otro lado, a la fun
cin instantnea de utilidad se le denomina funcin intermedia.

Existen diversas metodologas para determinar la senda ptima. En los si


guientes captulos se desarrollarn tres tcnicas para resolver problemas de
optimizacin dinmica: clculo de variaciones, control ptimo y programa
cin dinmica. Para los dos primeros casos se formular el problema en
tiem po continuo, y para el tercero en tiempo discreto. A continuacin se
explicar brevem ente las principales caractersticas de cada una de las
tcnicas.

Clculo de variaciones

El clculo de variaciones data del siglo XVII. Uno de los trabajos pioneros en
este campo fue el de John Bernoulli, realizado en 1696", quien resolvi el
problema de la braquistcrona. Dicho problema consiste en determinar la
trayectoria ms rpida de un pequeo objeto entre dos puntos, bajo la in
fluencia de la gravedad. El clculo de variaciones aplicado al anlisis econ
mico recin se inicia a partir de la dcada de los veinte con los trabajos de
Evans", Ramsey13 y Hotelling1415 El problema de clculo de variaciones, en
trminos generales, puede ser planteado de la siguiente forma:

10. U n a d e f i n i c i n m s p r e c i s a d e f u n c i o n a l e s la s i g u i e n t e : e l f u n c i o n a l v [y (t)]-Jt(y (t))d t es


u

u n a regla d e c o rre s p o n d e n c ia q u e asig n a a c a d a fu n ci n y(t) u n n i c o v a l o r r e a l P [>( / ) ] .

1I. P a ra m a y o r d e ta lle , v e r K lin e, M ., M a th e m a tic s : A C u ltu r a l A p p r o a c h , M a s s . : A d d i s o n -


W esley . 1962.

12. E vans, G .C , "T he D y n a m ic s o f M o n o p o ly ", en A m e r ic a n M a th e m a tic a l M o n th ly , f e b r e


ro 1924, pp. 77-83.

13. R a m s e y , F r a n k P., " A M a t h e m a t i c a l T h e o r y o f S a v i n g s " , e n E c o n o m ic J o u r n a l, O x f o r d :


B la c k w e ll P u b lish ers, d ic ie m b r e 1 928, pp. 5 4 3 -5 5 9 .

14. H o tellin g , H aro ld , "T h e E c o n o m ic s o f E x h a u s tib le R e so u rce s", e n J o u r n a l o f P o l itic a l


E conom y, C h ic a g o : T h e U n iv e rs ity o f C h i c a g o P ress, a b ril 1 9 3 1 , pp. 1 3 7 -1 7 5 .
15. U n a e x p lic a c i n d e ta lla d a d e e sto s trab ajo s p u e d e e n c o n tra rs e en C h ia n g , A lp h a, E le
m e n ts o f D y n a m ic O p tim iz a tio n , 3 a . e d i c i n , N u e v a Y o r k : M a c G r a w H i l l , 1 9 9 2 .
Introduccin a la optimizacin dinmica 23

Maximizar V{y\ = jf(t,y (t).y '( l))dt


(15)
o
sujeto a v(0 ) = Vq (y Q dado)
y(T) = y-;- ( y r ,T dado)

En este caso slo se ha tomado en cuenta una variable (y), y para que el pro
blema tenga solucin se asume que la funcin intermedia f() es integrable
con respecto al tiempo, y que "y es continua y diferenciable. Una aplicacin
clsica dei clculo de variaciones a la teora econmica la constituye el mode
lo de Evans10, que describe el comportamiento de una firma monopolstica.
En dicho modelo se asume que un monopolio posee una funcin de costos
cuadrtica, y a demanda depende ineaimente del precio (P(t)) y la tasa de
variacin del precio (P'(t)) de esta forma:

C(Q) = a Q 1 +PQ +Y ( ./),y >0) (1 6 )

Q = Al\t) + ipP'{t) + 1] ( A ,(/) .t)> 0 )

A partir de las funciones de demanda y costo se determina la funcin de bene


ficios, mediante la diferencia entre los ingresos y los costos:

n = P ( t )Q (P (t ), P'(t)) - C (Q(P(t), P \ t ) ) = n(P {t), P \ t ) ) (17)

El objetivo del monopolista es determinar la evolucin del precio que maxi-


mice los beneficios totales a lo largo del perodo de produccin (t e [0, T ]).
Los beneficios totales estn determinados por la suma de los beneficios en
cada instante del tiempo. Como el tiempo es continuo, dicha suma se expresa
a travs de una integral. De esta forma, el problema de optimizacin sera:

Maxim izar n [ P ] = j n ( P , P ') d t


o
sujeto a P ( 0 ) = P0 (P od ad o )
P ( T ) = PT (P ,T dado )6
1

16. Kvans. G.C.. op. cit.


Introduccin a la optimizacin dinmicu 25

croeconmico es simple. Por una parte, el funcional objetivo es la suma de las


utilidades futuras descontadas de la sociedad:

U = ^ e - s' f ( C ) d t (S > 0) (2 0 )
o

Por otro lado, en cada perodo, la economa est sujeta a una restriccin: la
produccin debe destinarse a consumo o a inversin bruta en capital. De esta
manera:

<p(k) = C + k ' + Ok (0 > 0) (21)

Donde la funcin de produccin (<j)(k)) depende del capital (k), k' representa
la variacin del stock de capital con respecto al tiempo o la inversin neta en
capital, 0 la tasa de depreciacin y Ok la depreciacin del capital. sta consti
tuye la ecuacin de movimiento, y relaciona el consumo (variable de control)
con el capital existente en la economa (variable de estado).

En este tipo de problema de optimizacin dinmica se asume que existe un


"dictador benevolente (denominado planificador social), a quien le interesa
maximizar el bienestar de la sociedad y decide las asignaciones de consumo y
capital en la economa. De este modo, el problema que enfrenta el planifica
dor social es el siguiente:

Maximizar U = \e ~ Sl f ( C ) d t (gO)
o
sujeto a k ' = (>(k)~ C - 9k
k(0) = k 0 (k0 dado)

A partir del problema (22) se obtiene la senda ptima de tres variables: el


consumo (C), el capital (k) y la produccin agregada ((>(k)).

Una revisin detallada de la teora de control ptimo se encuentra en el cap


tulo III. En el desarrollo de la teora y las aplicaciones se considerar el caso
de una sola variable de control (u) y estado (y).
26 Apuntes de Estudio

Programacin dinmica

La tcnica de programacin dinmica fue desarrollada a fines de la dcada de


los cincuenta, por el matemtico norteamericano Richard Bellmanl'). La pro
gramacin dinmica, al igual que cualquier problema de optimizacin din
mica, puede formularse tanto en tiempo discreto como en tiempo continuo.
Sin embargo, para resolver el problema en tiempo continuo, es necesario te
ner un conocimiento previo de ecuaciones diferenciales parciales. Por ello,
con el fin de brindar una explicacin clara y sencilla de esta metodologa, se
estudiar el problema en su versin discreta. El planteamiento del problema
en versin discreta sera:

Maximizar V[u, j = /,(>,, u, ) (23)


1=0

sajelo a y, = g, (y,at, )
>' = / o (Io dado)
yT = Ir (IjJdado)

Ntese que en el problema (23) se est brindando una especificacin general.


Tanto la funcin f, como la funcin gt pueden ser cambiantes en el tiempo.

Est tcnica se basa en el principio de optimalidad. En trminos generales, es


te principio establece que la trayectoria ptima de la variable de control debe
satisfacer la siguiente propiedad: en cualquier perodo t del tiempo, dado un
valor de la variable de estado yt que depende de las decisiones tomadas previa
mente, el resto de la secuencia de la variable de control (ut, ul+i, ut+2,... u-r) tam
bin debe ser ptimo. A partir de este principio se desarrolla toda la teora de
programacin dinmica. Una aplicacin a esta tcnica la constituye el modelo
de crecimiento ptimo de Koopmans y Cass. El problema a resolver por el pla
nificador social sera el siguiente:
M a x im iz a r U = ^ / L /(C ,) ( 0 < /3 < 1) (2 4 )
/-O
s u je to a k l+\ =(>(kl ) - C

kQ= lQ (/o d a d o ) 19

19. B ellm an . R ich ard . D y n a m ic P r o g r a m m in g , P r i n c e t o n : P r i n c e t o n U n i v e r s i t y P r e s s , 1 9 5 7 .


Introduccin a la optimizacin dinmica 27

Al igual que en el caso de control ptimo, el funcional objetivo a maximizar-


se constituye la suma de las utilidades futuras de la sociedad descontadas por
el factor (3. Por otro lado, en este modelo en particular, no se asume deprecia
cin y la produccin en un perodo determinado ((j>(kt)) se destina tanto a con
sumo (Ct) como al stock de capital del siguiente perodo (kl+i).

Una variacin al problema (24) consistira en introducir shocks estocsticos a


la funcin de produccin <J>(kt), tal como se establece en el modelo de creci
miento estocstico desarrollado por Brock y Mirman"0. En dicho caso, la va
riacin de la produccin no se encuentra asociada exclusivamente a cambios
en el stock de capital en la economa, sino que adems intervienen un conjun
to de elementos aleatorios o no anticipados'1 que pueden resumirse en una
variable estocstica g,. En este sentido, asumiendo la funcin de produccin
tj)(e.i, kt), el objetivo del planificador social vendra a ser la maximizacin del
valor esperado (o promedio) del funcional objetivo condicionado a la infor
macin del perodo inicial t = 0:

M in im iz a r
(=0
s u je to a k , +t =

ko = !o ( /0 dado)

El gran potencial de la programacin dinmica consiste en su aplicabilidad a


problemas numricos, mientras que su empleo en problemas analticos es un
poco ms limitado. De esta forma, en el captulo IV se brinda solamente una
introduccin a la programacin dinmica, y se desarrollan problemas tanto con
un horizonte de tiempo finito como infinito. En este caso, tambin se considera
bsicamente el caso de una variable de control (ut) y una de estado (y,).201

20. B rock, W illia m y L co n ard M irm an , "O p tim a l E c o n o m ic G ro w th a n d IJn ccrtain ty ". en
M c C a l l . J.J. ( e d .) , C h i c a g o : T h e U n i v e r s i t y o f C h i c a g o P r e s s , 1 9 7 2 , p p . 1 -4 3 .

21. U n o p u e d e im a g in a r s e el e fe c to d e u n d e s a s tre n a tu ra l o u n a c risis fin a n c ie r a in te r n a c io


nal, e v e n to s q u e a p riori n o p o d r a n a n tic ip a rse .
28 Apuntes de Estudio

Anexo

FACTOR DE DESCUENTO EN TIEMPO CONTINUO

En los problemas de optimizacin dinmica se suele descontar las variables provenientes


de perodos futuros. En el caso de la funcin de utilidad (5) se incluye un factor de
descuento ([3), el cual refleja la valoracin que le asigna el agente optimizador a la
utilidad proveniente de los perodos futuros. De igual forma, en la restriccin
presupuestaria (6) se descuenta el valor del consumo en cada instante del tiempo a la tasa
de inters (r). Para ambos casos, el descuento puede expresarse a travs de una tasa o un
factor. El factor de descuento ((3) puede determinarse a partir de una tasa de descuento
intertemporal (8)"', de esta forma:

3 = (0<<5 < 1,0< /l < i)


1 +8

Por otra parte, a partir de la tasa de inters puede construirse otro factor de descuento
(a), que pondera el consumo de cada perodo en la restriccin presupuestaria:

a= (0 < r< l, 0 < a < l)


1+ r

Como puede apreciarse, el descuento de las variables futuras puede realizarse tanto a
travs de una tasa (r o 8) o un factor (a o p). Cuando el tiempo es continuo, el factor de
descuento toma un valor distinto. A continuacin hallaremos dicho valor para el caso del
factor a-

Supongamos que cada perodo t del problema de optimizacin (8) dure doce meses,
y la tasa de inters en dicho lapso de tiempo es igual a r por ciento. Si un individuo
deposita A u.m. en una entidad financiera, al siguiente perodo obtendra (A + Ar)
u.m. o A(1 + r) u.m. Sin embargo, Qu sucedera si los perodos de eleccin se
acortan a seis meses, pero la tasa de inters anual sigue siendo r por ciento? En los
primeros seis meses, se obtendra (A + A(r/2)) u.m. o A(1 + (r/2)) u.m., podra
depositarse dicha cantidad nuevamente y obtener al final del ao A(1 + (r/2)). De
esta manera, la tasa de inters efectiva estara dada por (1 + (r/2))2- 1. Si el perodo se
acortara a la tercera parte (cuatro meses), la tasa de inters efectiva sera (1 + (r/3))3- 1.
En trminos generales, cuando el perodo se fracciona en m subperodos, la tasa de

22. El c o n c e p to d e tasa d e d e s c u e n to in te rte m p o ra l y fac to r d e d e s c u e n to so n e q u iv alen tes.

A m b o s c o n s ti tu y e n d o s f o rm a s a lte rn a tiv a s d e e x p r e s a r el d e s c u e n t o d e las u tilid a d e s fu tu ra s.


Introduccin a la optimizacin dinmica 29

inters efectiva estara dada por (I + (r/m))"1-!. Cuando el tiempo es continuo, "m"
tiende al infinito y la tasa de inters efectiva converge a la siguiente expresin:

-] m
L im 1+ e'

De esta forma, el factor de descuento u en tiempo continuo estara dado por:

L im \ ,
'"-*"=1 m

De manera similar, el factor de descuento p en tiempo continuo sera equivalente a:

l.im I+ r

Donde r y 5 son tasas de descuento intertemporalcs expresadas en trminos anuales.


II

Clculo de variaciones1

Como se mencion en el primer captulo, el problema bsico del clculo de


variaciones a resolver es el siguiente:

(1)
o
s u je to a y(0) = y 0 (y 0dado)

y (T ) = >Y ( y T d a d o )

Para que dicho problema tenga solucin es necesario que se cumplan dos
condiciones: (1) deben existir las derivadas parciales de primer y segundo
orden de la funcin intermedia f(*); y, (2) deben existir las derivadas de
primer y segundo orden de la funcin y(t), que depende del tiempo , El re
sultado del problema (1) consiste en una trayectoria y (t) que optimiza el
funcional objetivo V [y]. Sin prdida de generalidad, inicialmente supon
dremos que todos los problemas de clculo de variaciones consisten en
maximizar el funcional objetivo V[y]. Posteriormente, cuando se expli
quen las condiciones de segundo orden, se distinguirn entre problemas de
maximizacin y de minimizacin.12

1. P a ra c o m p r e n d e r e ste c a p tu lo y el s ig u ie n te , el lector d e b e te n e r u n m a n e jo a d e c u a d o d e
las e c u a c i o n e s d ife r e n c i a le s . Si n o e s a s, s e s u g ie r e c o n s u lta r: C h i a n g , A l p h a , M to d o s f u n d a
m e n ta le s d e e c o n o m a M a te m tic a , 3 a . e d i c i n , M a d r i d : M c G r a w H i i l , 1 9 9 6 y S y d s a e t e r , K n u t
y P e t e r J. H a m m o n d , M a th e m a tie s f o r E c o n o m a A n a ly s is , P r e n t i c e H a l l , 1 9 9 5 .
2. U n a f o r m a a lt e r n a t iv a d e d e f i n i r e s ta c o n d i c i n es q u e y (t) d e b e s e r u n a f u n c i n C ' . E n

g e n e r a l , u n a f u n c i n C,k i m p l i c a que to d as su s d e riv a d a s h a sta el o rd e n k so n c o n tin u a s.


Clculo de variaciones 31

Tiste captulo est compuesto por cuatro secciones. En la primera se explica la


condicin de primer orden del problema (1). que se denomina la ecuacin de
Euler. y se detalla cmo aplicarla a la resolucin de los problemas de clculo
de variaciones. En la segunda seccin se explican las condiciones de trans-
versalidad, que son empleadas en la resolucin del problema cuando la con
dicin terminal y(T) ya no constituye un slo punto (T, yr), sino un conjunto
de puntos. Iin la tercera seccin se explican las condiciones de segundo orden.
Por ltimo, se desarrolla el problema con un horizonte de tiempo infinito.

1. C on d ici n de p rim er orden: la ecu acin de E uler

Cuando se optimiza una funcin de una variable (h(x)), sin restricciones, un


determinado punto (x) constituye un candidato a mximo o mnimo cuando
la derivada de la funcin objetivo se iguala a cero (h'(x) = 0). lista condi
cin permite discriminar de un conjunto amplio de puntos, aquel que posi
blemente logre optimizar a la funcin objetivo. Hn el clculo de variaciones
se aplica el mismo concepto. De un extenso conjunto de curvas (y(t)). es
necesario escoger aquella que maximice o minimice el funcional objetivo.
A la condicin que permite seleccionar la curva ptima se le denomina
ecuacin de Euler.

1.1 La ecuacin de Euler

Dada la funcin y*(t) 6 Cd que resuelve el problema (1), es decir:

7 i
(2)
o 0

Para cualquier senda y(t) e C", dicha funcin debe satisfacer la siguiente
ecuacin:

<?/ = d df
(3)
dv dt c)\'
o de otra forma:

d
/ ./V (4 )
at
32 Apuntes de Estudio

A la ecuacin (4), se le denomina ecuacin de Euler. Si desarrollamos el lado


derecho de la ecuacin mediante la regla de la cadena, tendramos lo siguien
te:

df <?/)' <?/0 dy <?/v' dy'


dy di dy dt dy' di ^^

o expresado de otra manera:

f y = /v7 + /v'v.v' + / vy y " (6)

La ecuacin (6) constituye una ecuacin diferencial de segundo orden, que


nos dara la trayectoria ptima y (t). Para resolverla necesitamos dos constan
tes, las cuales se obtienen con la condicin inicial (yo) y terminal (y-r) del
problema.

Demostracin

Para comprobar que una trayectoria ptima y (t) satisface la ecuacin de Eu


ler, es necesario compararla con el resto de sendas y(t) factibles3. Para ello
empleamos una senda auxiliar x(t), que satisface la siguiente condicin inicial
y terminal:

,v(0) = ,v(r) = 0 (7)

A partir de esta curva auxiliar se puede construir una familia de curvas facti
bles cercanas a la senda ptima, dadas por la siguiente relacin:

y() = y (/) + f.v() (8)

Donde e es un nmero positivo arbitrariamente pequeo. Para distintos valo


res de e. las curvas factibles tendrn distintas trayectorias. La relacin entre la
senda ptima y una senda prxima puede observarse en el Grfico No. 2.1.
Como puede comprobarse, ambas trayectorias poseen una condicin inicial y
terminal comn.

3. P o r f a c t i b l e s s e e n t i e n d e a a q u e l l a s t r a y e c t o r i a s q u e s a t i s f a c e n la c o n d i c i n i n i c i a l y t e r
m in a l del p ro b le m a.
Clculo de variaciones 33

Grfico No. 2.1

Para comprobar que solamente la curva ptima y (t) satisface la ecuacin de


Huler, primero construimos una funcin D(g) que depende del valor ptimo
del funcional Vy ] y dei valor subptimo V(y|:
I I
l ) ( e) = f ( t , x ' y i ) + C.x(t), y'*(r) + 'x'(t))dt - f U , \ *(t). y'* (t))dt (9)
j v;______ _______ j <_______ ________ j J

Por la relacin (2), la funcin D(e ) es no positiva y alcanza el mximo cuando


e = 0 (para dicho valor, ambas integrales son iguales). De esta forma, la con
dicin de primer orden para maximizar la funcin D(e) es D'(0) = 0. La pri
mera derivada de la funcin con respecto a g sera igual a:

D'(e) = | l f yx(n + J\-x'(i)\di ( 10)

Evaluando esta derivada en e = 0 tendramos:


r
//(O) = J | / v(/, y*(i), y" (/))*(/) + y'(/), y " (t))x\t)}dt =0 (11)
o
r i
J I / , v ) ] < / / - - 1 1 f ,'x'n\di
0 I)
34 Apuntes de Estudio

La ecuacin (11) puede simplificarse an ms. Si integramos por partes el la


do derecho de la ecuacin, obtendramos lo siguiente:

\ \ f , .x'(t)\(li =(/,,.(/)]' - Jj'[.v(/) d U2 )


o t

Hn vista de que la curva auxiliar tiene un valor inicial y terminal igual a cero
(x(0) = x(T) = 0), el primer trmino del lado derecho de la ecuacin tambin
es igual a cero. Si reemplazamos la ecuacin (12) en la (11), se llegara a la
sieuiente condicin:

/ v - d f ; !-*(') di = 0 (13)
o Lv
dt

Para que se cumpla (13) para cualquier curva x(t), la senda ptima y (t) debe
satisfacer la condicin:

/ v - 4di/ v ' = (14)

que constituye la ecuacin de Euler planteada en (4). A continuacin se apli


car la ecuacin de Euler a tres ejemplos de clculo de variaciones.

Ejemplo 1.- Halle la senda ptima en el siguiente problema:


i
M a x in iiz a r V( v1= J ( y '2 - 2 yy' + 1 0 /y )d l
o
.s u je to a v(0) = 1
v(l) = 2

Primero identificamos la funcin intermedia f(*), que est dada por f(t, y, y')
= y ' - 2yy' + lOty, y luego obtenemos las derivadas que conforman la ecua
cin de Euler:

/ v = ~2 v' + lOf
/,, = 2 y - 2 y
Clculo de variaciones 35

Ntese que en las dos primeras lneas se obtienen derivadas parciales con
respecto a y e y', respectivamente; en cambio, en la tercera lnea se obtiene
una derivada total con respecto al tiempo. Reemplazando las derivadas en la
ecuacin (4), obtenemos la siguiente ecuacin diferencial:

- 2 y ' + 10/ = 2 v " - 2 y '

2v" = 10/

y" = 5r

Si integramos una vez la ecuacin diferencial anterior, se obtendra la expre


sin y ' = (5 /2 )r + Hi. Integrando una segunda vez, se llegara a la solucin
general del problema:

y (/) = 3 f' + Hy + H,
6

Para hallar las constantes de la senda ptima y (t), debemos evaluarla en el


punto inicial y terminal. Para t = 0 se cumple la igualdad y(0) = 112= 1; y para
t = 1, se cumple que y ( l ) = (5/6) + Hi + Hs = 2- A partir de ambas ecuaciones
obtenemos el valor de las constantes: I Ii = 1/6 y H2 = 1. La trayectoria ptima
estara dada por:

5 , 1
v (?) = r + r+1
6 6

Ejemplo 2.- Halle la senda ptima en el siguiente problema:

1
Maximizar tyy'dt

sujeto a y( 0) = 0
y(i) = 1
36 Apuntes de Estudio

Dada la (uncin t(t, y, y ) = t y y h a l l a mo s las derivadas que conforman la


ecuacin de Kuler:

/; = ix
f x = y
d <
IX = v + !Y
di'

Reemplazando las derivadas de la funcin intermedia !'() en la ecuacin (4),


obtendramos la siguiente ecuacin:

W = v + tx'

y(t) = 0

Si bien la funcin y (t) satisface la ecuacin de Euler. es necesario verificar si


cumple con la condicin inicial y terminal del problema. La condicin inicial
y(0) = 0 es consistente con la senda ptima, en cambio no lo es la condicin
final y( I ) = 1. De este modo, la respuesta obtenida no es factible y se conclu
ye que no existe una senda ptima que resuelva el problema.

Ejemplo 3.- Halle la senda ptima en el siguiente problema:

i
Maximizar V \ y ] = J " ( y 2 + 4 y y + 4 y '1)dt
o
sujeto a y(0) = 2-je
y(l) = 1+ e

Las derivadas de la funcin f(t, y, y') = (y" + 4yy' + 4 y ") estn compuestas
por:

/,. = 2 v + 4 v'
f x ~ 4 y + 8.\/

d / = 4 v , + 8v"
Clculo de variaciones 37

Aplicando la ecuacin de Euler:

2 y + 4 v 4 v + 8 v

8 y '- 2 y = 0

4y' - y = 0

Esta es una ecuacin diferencial lineal de segundo orden con coeficientes


constantes, cuya solucin est definida por las races de la siguiente ecuacin
caracterstica:

4r -1 = 0

y la integral particular:

k= 0

La solucin general estara dada por:

i i

Para hallar IL y IL, reemplazamos la senda y*(t) en la condicin inicial y


terminal. Para y(0) = II, + IL = 2 el/2, y para y(l) = H|CI/2 + ILe"1,2= 1+e. Re
solviendo este sistema de ecuaciones obtendramos el valor de las constantes:
Ib = e !/~ y IL = e 1^. La senda ptima sera:

, i(O/l i 11-/1
y { t ) = e i2 +e2

1.2 La ecuacin de Euler en casos especiales

Hasta el momento se han desarrollado los problemas de clculo de variacio


nes empleando la ecuacin de Euler propuesta en (4). Sin embargo, cuando la
funcin f() toma una forma determinada, la ecuacin de Euler se simplifica y
el problema de clculo de variaciones puede resolverse de una forma ms
sencilla. A continuacin se explicarn cuatro casos particulares de la ecuacin
de Euler, derivados a su vez de casos especficos de la funcin intermedia.
38 Apuntes de Estudio

Caso I.- f = f(t, y )

En este caso, la funcin ('() no depende de y. lo cual implica que fy = 0.


Reemplazando dicha igualdad en la ecuacin de Euler (4), se obtiene que
dy /dt = 0 o de manera equivalente:

f\- = constante (15)

sta constituye una ecuacin diferencial de primer orden. A continuacin se


resolver un ejemplo empleando esta condicin.

Ejemplo.- Halle la senda ptima en el siguiente problema:

1 v'2
Maximizar r[v | j \ dt
o
sujeto a y(0) = 2
17
v (1)

Aplicando la ecuacin de Euler simplificada (15), solamente tendramos que


calcular la derivada parcial fy e igualarla a una constante:

La solucin a la ecuacin diferencial de primer orden estara dada por:

, r4
y (t) = H, + H 2

A partir de la condicin inicial y(0) = IH = 2 y terminal y(l) = H78 + fE =


17/8, determinamos las constantes: Hi = 1, H2 = 2, y la senda ptima sera:
Clculo de variaciones 39

Caso 2.- f = f(y')

Si reemplazamos la funcin f(y') en la ecuacin de Euler (6), las derivadas fv.


fj -j, y fyy- se igualaran a cero y obtendramos la siguiente expresin:

/,.y .v '= 0 (16)

Para c|ue se cumpla la ecuacin (16) puede suceder que y " = 0 o que fyy = 0.
Bn el primer caso, la senda ptima se obtendra integrando dos veces la ecua
cin diferencial y " = 0, con lo cual se obtendra una recta y(t) = Hit + Hj. Bn
el segundo caso, f dependera linealmente de y' (f(y') = a + by') y la ecuacin
de Euler se convierte en una identidad4. De esta forma, cualquier senda que
cumpla con la condicin inicial y terminal resolvera el problema de clculo
de variaciones. Bn general, la respuesta a este tipo de problema depender de
la funcin !(). Si f depende de y' de manera no lineal, entonces se puede
concluir que la senda ptima estar dada por una recta.

Ejemplo.- Encuentre la curva que pase por los puntos (0,3) y (1,4), y que
presente una distancia mnima.

Intuitivamente la respuesta sera una lnea recta, ya que cualquier otra curva
incurrira en una mayor distancia entre ambos puntos. Para resolver este pro
blema a travs del clculo de variaciones, en primer lugar, debe definirse una
funcin que represente la distancia entre dos puntos. Esta funcin puede deri
varse a partir del Grfico No. 2.2.

Supongamos que en la curva ptima existan dos puntos muy cercanos uno de
otro (A y B), el tiempo existente entre ellos estar dado por dt, la diferencia
en y por dy, y la distancia por di. Por el teorema de Pitgoras, se cumple la
siguiente relacin entre la distancia (di), la variacin en el tiempo (dt) y la va
riacin en la variable y (dy):

( d l f = (dy)1 +(dt)1

4, A l a p l i c a r la e c u a c i n d e E u l e r a la f u n c i n ( y ' ) - a + b y ' , s e o b t i e n e la i g u a l d a d 0 - .
40 Apuntes de Estudio

Grfico No. 2.2

Tras algunas manipulaciones algebraicas tendramos la siguiente relacin:

'<//>' t./vr |
(dt)2 (dt)2

(di) (dy)2
+1 1+ v
(dt) \! (d t)2

Finalmente, la distancia (di) quedara definida del siguiente modo:

di = ,/l + 7 2 dt

La ecuacin anterior expresa la distancia entre dos puntos prximos en una


curva y(t). La distancia total de la curva (D) estara dada por la integral de di:i

i
D = J \ + y'- dt
o
Clculo de variaciones 41

De esta forma, el problema quedara definido del siguiente modo5:

Maximizar V{y\ = - j , j + 7 2dt


o
sujeto a v(0) = 3
y( l ) =4

La ecuacin de Euler del problema viene dada por: y " yy = 0. Como la fun
cin f(*) depende de manera no lineal de y', no puede darse el caso fyy = 0.
Por lo tanto, la respuesta debe ser y "= 0, cuya solucin es una lnea recta y(t)
= Hit + H 2. Las constantes se obtienen reemplazando la trayectoria ptima en
la condicin inicial y terminal: y(0) = H 2 = 3 e y(l) = Hi + H2 = 4. Las cons
tantes seran: Hi = 1 y H2 = 3. La respuesta final al problema corresponde a la
recta que une los puntos indicados:

y(t) = t +3

Caso 3.- f = f(t, y)

En este caso se cumple que fy-= 0. Si reemplazamos esta condicin en (4), la


ecuacin de Euler se simplifica del siguiente modo:

/y= (17)

La ecuacin (17) no constituye una ecuacin diferencial, lo cual implica que


el problema es degenerado6. En los problemas anteriores, la senda ptima
posea constantes arbitrarias que tomaban un valor en funcin de la condicin
inicial y terminal. En este caso, al no existir una ecuacin diferencial, la senda
obtenida no posee constantes, de tal forma que sta slo cumplira con la
condicin inicial y terminal de manera casual.

5. E n r e a l i d a d , e l p r o b l e m a d e c l c u l o d e v a r i a c i o n e s e s d e m i n i m i z a c i n d e la d i s t a n c i a D .
S i n e m b a r g o , a l m u l t i p l i c a r p o r ( - 1 ) a la f u n c i n o b je tiv o , c a m b i a m o s el p r o b le m a por uno de

m a x i m i z a c i n . E n v i s t a d e q u e - D s i e m p r e e s u n v a l o r n e g a t i v o , b u s c a r la d i s t a n c i a m s c o r t a e q u i

v ale a m a x i m iz a r -D . L as d ife re n c ia s e n tre u n p r o b le m a d e m a x i m iz a c i n y u n o d e m in i m i z a c i n en


el c l c u l o d e v a r i a c i o n e s s e v e r n c o n m a y o r d e t a l l e e n l a s s i g u i e n t e s s e c c i o n e s .

. L o c u a l q u ie re d e c ir q u e n o e x iste s e n d a q u e m a x im ic e el fu n c io n a l o b je tiv o V [y],


42 Apuntes de Estudio

Ejemplo.- Halle la senda ptima en el siguiente problema:

i
M a x im iza r V [_y] = j " ( y 1 - y t)d t
o
su jeto a y (0) = 0

y(l) = 1

Aplicando (17), igualamos la derivada fy a cero:

f x = 2y-t =0

t
y'U)
2

La trayectoria ptima estara definida por y (t). Si bien la condicin inicial se


cumple, y(0) = 0, no sucede lo mismo con la condicin terminal y(l) ^ 1, por
lo cual no existe solucin al problema.

Caso 4.- g = f(t, y, y') epl


-pt
En este caso, la funcin f(*) va acompaada del factor de descuento e . Las
derivadas parciales que conforman la ecuacin de Euler estn dadas por:

pt
Sy = fye
pt
Sy f v e '
d_
Sy' f y' e~P< - pe~P' f y
dt dt

Reemplazndolas en (4) obtenemos la siguiente expresin para la ecuacin de


Euler:
Clculo de variaciones 43

o de manera simplificada:

(18)

A partir de la ecuacin (18) es posible resolver los problemas de clculo de


variaciones con factor de descuento de una forma ms sencilla.

Ejemplo.- Los ingresos (I) y costos (C) de una firma dependen de la produc
cin (y) y de la tasa de variacin de la produccin (y'), de la siguiente forma:

/(.v,v') = y - V
2

C( v, v') = 2 v'~ + -'


9

Determine la trayectoria de la produccin a lo largo del presente ao, de tal


forma que se maximice el valor presente de los beneficios de la firma. Asuma
una tasa de descuento (p) igual a 0.5, y que la produccin al final del ao y(l)
ser igual a 1/2.

El problema de clculo de variaciones a resolver es el siguiente:

di
0 o
sujeto a y(0) = 0
v(l) = 1/2

En primer lugar se determinan las derivadas necesarias para la ecuacin de


Euler.
44 Apuntes de Estudio

Reemplazando estas derivadas en la ecuacin (18), se obtiene la siguiente


ecuacin diferencial de segundo orden:

1 - 2v = - 4 v " - - (~4v')
2
4 v '- 2 v '- 2 v = - l

La solucin a la ecuacin diferencial est determinada por las races del poli
nomio caracterstico:

4 r - 2r 2 = 0

y por la integral particular:

k = 1 /2

La trayectoria ptima de la produccin sera:

y (t) = H / + H ze 2 + - -

Evaluando la senda ptima en la condicin inicial y terminal, obtenemos las


constantes Hi y FE. Para y(0) = Hi + PE + 1/2 = 0, y para y(l) = Ppe + Pp2e"l/2
+ 1/2 = 1/2. La solucin al sistema de ecuaciones vendra dado por: PE =
(e/2)/(e l/2-e) y H, = (e l/2/2)/(e-e 1/2).

A continuacin se presentan dos aplicaciones del clculo de variaciones a la


teora econmica. En la primera aplicacin desarrollaremos una versin sim
plificada del modelo de Hotelling7, en el cual se determina el patrn ptimo
de extraccin de un recursa natural no renovable. En la segunda aplicacin se
resolver el modelo de Taylor8, en el cual se determina la poltica anti
inflacionaria ptima para una economa.

7. H o tellin g . H aro ld , "T h e E c o n o m ie s o f E x h a u s tib le R eso u rces", en J o u rn a l o f Political


Economy, C h ic a g o : T h e U n iv e rs ity o f C h ic a g o P ress, ab ril 1931. pp. 1 3 7 -1 7 5 .
8. T a y lo r. D e a n . S t o p p i n g In fla tio n in th e D o r n b u s c h M o d e l: O p t i m a l M o n e ta r y P o lic ie s

w ith A ltern ate P ric e -A d ju stm en t E q u a tio n s , en Journal o f M acro eco n o m ics, B ato n Rouge:
L o u is ia n a S tate U n iv e rsity Press, 1989, pp. 199 -2 1 6 .
Clculo de variaciones 45

1.3 Aplicacin: extraccin ptima de recursos naturales5

Supongamos que una firma es propietaria de una cantidad "A de un recurso


agotable, tal como petrleo, carbn o cobre. La funcin de beneficios de la
firma es logartmica, de tal forma que por extraer q unidades del recurso
obtiene beneficios iguales a Ln(q) . El objetivo de la firma es determinar el
patrn de extraccin de los recursos, de tal manera que maximice el valor
presente de los beneficios. En este problema se asume que la tasa de descuen
to es constante e igual a p, y que el recurso se agota en su totalidad en el
perodo "T.

Para resolver este problema, en primer lugar, debemos definir la variable a


optimizar. Para ello es necesario distinguir entre dos tipos de variables: la do
tacin de recursos que constituye un stock , y la extraccin del recurso agota-
ble que constituye un flujo. Una forma simple de relacionar estas dos varia
bles es definiendo a las ventas acumuladas del recurso natural como y. Las
ventas acumuladas constituyen una variable con un valor inicial igual a cero
(en el perodo inicial no se ha realizado ninguna venta previamente) y un va
lor terminal igual a A (todo el stock del recurso ha sido vendido previamente
en el ltimo perodo). Por otra parte, la extraccin del recurso equivale a la
variacin en el tiempo de las ventas acumuladas (y'). De esta manera, el pro
blema que debe resolver la firma es el siguiente:

su jeto a v(0) = 0

y(T ) = A

El problema puede ser resuelto de una forma rpida, empleando la ecuacin


de Euler (15) o (18). Para este caso en particular, resulta conveniente emplear
la ecuacin (15):

=H
v

9. E s ta a p lic a c i n e st b a s a d a e n el a rtc u lo e s c r ito p o r H o te llin g , H a r o ld , op . oil.


46 Apuntes de Estudio

Despejando la ecuacin diferencial e integrando una vez, obtenemos:

v erl>
H

1
v (/) = - e + H-,
()h\

Reemplazando la trayectoria ptima en la condicin inicial y terminal del pro


blema, obtenemos las constantes Hi y H2. En la condicin inicial se cumple que
y(0) = H2 - ( 1/pHi) = 0; y en la condicin terminal, y(T) = H2 - ( 1/pHi)epl = A.
Las constantes vienen dadas por Hi = A/(l-epl) y Hi = ( l - e pl)/Ap. Finalmente,
la evolucin ptima de la extraccin y las ventas acumuladas vienen dadas
por las siguientes ecuaciones:

A
y (/):
P-p (1-e '

Para T > 1 y p > 0, H| tomar un valor positivo (dado que 0 < e pT< 1) y, por
lo tanto, la trayectoria del patrn de extraccin de recursos disminuir expo
nencialmente a lo largo del tiempo a la tasa p .

El resultado anterior puede generalizarse para cualquier funcin de beneficios


que sea cncava y continua. Supongamos una funcin de beneficios B(y'),
que satisface las propiedades B'(y') > 0 y B "(y') < 0 (V y'). Dicha funcin
indica que los beneficios marginales de extraer una unidad son positivos,
aunque decrecientes conforme se incremente la extraccin. El problema a re
solver sera:

Maxhmzar V\ y] = J B(y)e p'dt


o
sujeto a v(0) = 0
y(T) = A
Clculo de variaciones 47

Aplicando la ecuacin de Euler (15) obtendramos la condicin de primer or


den del problema:

/V = ,

B \ v V = /A

B'(y') = H /

La solucin al problema general consiste en que el beneficio marginal de ex


traer el recurso crece exponencialmente a la tasa p. Como la tuncin de bene
ficios es cncava, beneficios marginales mayores se obtienen para valores ba
jos de la extraccin del recurso (y')- De esta forma, como los beneficios mar
ginales crecen a lo largo del tiempo, el patrn de extraccin ptimo debe ser
decreciente en el tiempo, al igual como se observa en el Grfico No. 2.3.

Grfico No. 2.3


48 Apuntes de Estudio

Este resultado es consistente con la formulacin del problema inicial. Debido


al factor de descuento e"(>t, los beneficios obtenidos de los perodos ms aleja
dos del presente tienen un menor impacto sobre el funcional objetivo V [y |
que los beneficios obtenidos en perodos cercanos al presente . De esta ma
nera, una estrategia racional de la firma es obtener mayores beneficios en el
presente con respecto al futuro, lo cual es posible extrayendo la mayor canti
dad de recursos en perodos cercanos al presente.

1.4 Aplicacin: poltica anti-inflacionaria ptima"

En este modelo se asume que una situacin econmica ptima para un pas es
aquella en la cual la produccin (Y) se acerque al nivel de pleno empleo1 1*02
(Yr), y que la inflacin (P) sea cercana a cero. Una funcin que represente el
costo social por desviarse de dicha situacin sera la siguiente:

( P , Y ) = {Yi - Y y + aP 2 (a > 0) (19)

La funcin /,() alcanza su nivel mnimo cuando Y = Ye y P = 0. Cualquier


otro valor del producto y la inflacin incrementa X(') o el costo social. La in
flacin se relaciona con la produccin y la inflacin esperada (n) de acuerdo
con la siguiente relacin:

P = -P(Yf - Y ) + n ( j 8 > 0) (20)

Esta ecuacin de comportamiento constituye una representacin de la curva


de Phillips. La inflacin se relaciona negativamente con la produccin a tra
vs del coeficiente p. Un menor producto implica un mayor desempleo, que
se traduce en menor inflacin. Por otro lado, dado un nivel de produccin,
mayores expectativas inflacionarias incrementan la inflacin efectiva. La
formacin de las expectativas inflacionarias se asume adaptativa:

n' = j ( P - n ) (0 < y < 1) (21)

10. E s to se d e b e al h e c h o d e q u e el e f e c to d e l fa c to r d e d e s c u e n t o e s m a y o r c o n f o r m e se in
c r e m e n ta el tie m p o .

I I . E ste m o d e lo fue t o m a d o d e C h ia n g , A lp h a , E lcm e n ts o f D x n a m ic O p tim ization, 3 a . e d i


ci n , Nueva Y ork: M cG raw H il!, 1992, pp. 5 4 -5 8 , y co n stitu y e una versin sim p lificad a del
tra b a jo de T ay lo r, op. vil.
12. El p r o d u c t o d e p l e n o e m p l e o ( Y O se a s u m e c o n s ta n t e e n el p r o b le m a .
Clculo de variaciones 49

Si la inflacin actual resulta superior a la inflacin esperada, entonces n' > 0


y la expectativa de inflacin se incrementa. Por otro lado, si la inflacin ac
tual es inferior a la inflacin esperada, entonces^ ' < 0 y la expectativa de in
flacin disminuye. Para resolver el problema de optimizacin dinmica es ne
cesario simplificar el modelo, con el fin de determinar la trayectoria ptima
de una sola variable. A partir de la ecuacin (21) es posible expresar la infla
cin efectiva en funcin de la inflacin esperada:

/
n
P = + 71 ( 22)
J

Si reemplazarnos la ecuacin (22) en (20), se obtendra una expresin para la


desviacin del producto del nivel de pleno empleo:

Yf (23)

Al sustituir las ecuaciones (22) y (23) en (19), obtendramos la funcin de


costo social en funcin de la inflacin esperada (n) y su primera derivada
( t i ')'-

< n 'V
X ( n , n r) +a n + (24)

Finalmente, el problema que debera resolver la sociedad (o el planificador


social) si desea disminuir a cero las expectativas de inflacin en un plazo de
T aos, sera el siguiente:

1n' Y n
Maximizar +a n + dt
o Pj
sujeto a 77(0) = 7lQ
n(T) = 0
50 Apuntes de Kstudio

Para determinar la senda ptima de las expectativas de inflacin, en primer


lugar, debemos hallar las derivadas que conforman la ecuacin de Euler:

f r = -2 an - 2a n
j
. _o~ . ...
7t' . _ n n
fn = 2a - - 2a
IV)2 j f
_ _o . T n

to

1
to
i
- /,

a
di j

Reemplazando estas derivadas en la ecuacin (4) llegaramos a la siguiente


ecuacin diferencial de segundo orden:

2an + 2a = 2 -- ,+ 2 a + 2 ,-
J (fijY j j

(1 + a lY ) n - a f l 2f n = 0

La solucin a la ecuacin diferencial viene dada por las races caractersticas


del siguiente polinomio:

(1 + a31)T~ - a f i 1j 1 = 0

y la integral particular:

k= 0

La solucin genrica a la ecuacin diferencial viene dada por:

n \ t ) = //,<fv + / / , e M

Donde n representa la raz caracterstica de la ecuacin diferencial y equivale a:

V/?7
1 (//'!
Clculo de variaciones 51

Las constantes se obtienen de la condicin inicial y terminal del problema. En


el perodo t = 0 se cumple que tc(0) = + Ib y en el perodo t = T se
- rt ri
cumple que n (T) = ll,e + H, e = 0 . Las constantes del problema son

iguales aH, = (7r0) / (1 - e 1 ) y H: = (7r0) / (1 - e ). Por ltimo, la senda


ptima de la inflacin esperada estara conformada por:

n'{t)
+ ( } - e rJ) e

La trayectoria ptima de la inflacin esperada depender bsicamente del sig


no de las constantes H| y EL, as como del signo de las races de la ecuacin
caracterstica. Considerando que la raz n es positiva (debido a que los par
metros "p y j son positivos), es fcil demostrar que las constantes Hi y Ib
tendrn un signo positivo y negativo, respectivamente. De esta forma, el primer
trmino de la inflacin esperada tender a cero, mientras que el segundo a me
nos infinito. Sumando ambos efectos, la trayectoria de la inflacin esperada ser
monotnicamente decreciente, tal como se muestra en el Grfico No. 2.4:

Grfico No. 2.4


52 Apuntes de Estudio

La convergencia rpida de la inflacin esperada a cero, se debe a la importan


cia relativa que se le asigna a la inflacin (P) a travs del parmetro a en la
funcin de costo social. Si asumiramos una baja ponderacin en la funcin
de costo social (a = 0), a partir de (24) obtendramos:


Un)
V Pj J

En este caso, la funcin de costo social depende solamente de ( t ' ) de manera


no lineal. Por consiguiente, empleando la ecuacin de Euler (16) la trayecto
ria ptima de la inflacin esperada vendra dada por la recta n (t) = Hit + H2.
Esta solucin, a diferencia de la representada en el Grfico No. 2.4, implica
una convergencia lenta de la inflacin esperada. Dicho resultado, como se
mencion anteriormente, se debe a la baja ponderacin de la inflacin espe
rada en la funcin de costo social.

2. C o n d ici n de tra n sv ersa lid a d

Hasta el momento, el problema (1) se ha resuelto empleando la ecuacin de Euler,


y la condicin inicial y terminal de la senda ptima. Sin embargo, en ausencia del
valor inicial y/o terminal de la senda ptima, para resolver el problema es necesa
rio contar con otra condicin adicional denominada condicin de transversali
dad. En este sentido, un nuevo problema a resolver sera el siguiente:

Maximi:ar V{ y ] = J " / ( f , y ( ) , y\t))dt ^ 5 )


o
sujeto a y(0) - y0 (yodado)

y(T) = yr (yr, Tlibres)

En (25) se ha mantenido fija la condicin inicial; sin embargo, la determina


cin de la condicin terminal pasa a formar parte del problema de clculo de
variaciones. A continuacin se explicar la derivacin de las condiciones de
transversalidad para resolver el problema (25) y algunas aplicaciones.
Clculo de variaciones 53

2.1 Condicin de transversalidad

La funcin y*(t) C" resuelve el problema (25), si satisface la ecuacin de


Eulcr (5) y la condicin de transversalidad:

, dy <V AT = 0 (26)
d i r)y '
t=T

o de manera simplificada:

\ f / \ : =r Aay 1 / v'/ i A/' i) (27)

Donde AT y Ayr representan pequeas variaciones del horizonte de tiempo


T y la condicin final "yr, respectivamente.

Demostracin

Al igual que en la demostracin de la ecuacin de Euler, para derivar la con


dicin de transversalidad es necesario comparar a la senda ptima con respec
to a un conjunto de sendas factibles. Para ello, creamos una trayectoria auxi
liar (x(t)) que nicamente satisfaga la condicin:

-v(0) = 0 (28)

A partir de esta curva auxiliar13, las sendas factibles estaran dadas por la re
lacin:

y() = >* (/)+ f-v(0 (29)

Como se mencion anteriormente, constituye un nmero arbitrariamente


pequeo. Como el horizonte de tiempo T es una variable a determinarse
dentro del problema, es posible construir un conjunto de valores de T facti
bles, los cuales estaran definidos por:

T=T*+eAT (30)

13. N t e s e q u e a d i f e r e n c i a d e la s e n d a a u x i l i a r (7 ). e n e s t e c a s o n o s e r e s t r i n g e el v a l o r t e r

m in a l a x ( T ) = 0 . L a c o n d i c i n t e r m in a l d e x (t) e s libre.
54 Apuntes je Estudio

Donde T representa el horizonte temporal ptimo. Tomando en cuenta (29) y


(30), la funcin objetivo a optimizar quedara definida del siguiente modo:

r'+t-xr r"
D(e) = J / ( f , v ' (t) + -:y ( ), y' * ( ) + cx\t))dt - J / ( r , x "{!), y ,r (t))di (31)
o o

Al igual que en el caso (9), la funcin D( e ) es no positiva y alcanza su valor


mximo cuando e = 0. De esta forma, la senda ptima se determina a partir de
la condicin D'(0) = 0. Para obtener la derivada D'(e), debemos aplicar la re
gla de Leibnitz14

T +rAT

D\e) = J [ f yx(t) + f y x ' m i t + f ( T , y(T), y \ T ) )


dT_
de
(32)
o '

Integrando por partes el primer trmino de (32) y tomando en cuenta la con


dicin (8), obtenemos la siguiente relacin:

-ttLAi 1

Jl/V.v(r) + fyx\t)\dt = J fv d t /v '


x(t)dt + \ f }, ] ^ r .x(T) (33)

Finalmente, reemplazando (33) en (32), D'(0) sera igual a:

D'(0)= x(tyit a I/VI, u-/- )*[./!, r AT (34)


0L

Con el objeto de establecer una condicin general para la solucin del pro
blema, independientemente de la trayectoria que tome x(t), es necesario
despejar el trmino x(T ). Para ello, se debe determinar en el instante T
cmo se relaciona dicho trmino con el valor final y*(T ) y el horizonte de
tiempo "1'. Hn el Grfico No. 2.5 se puede apreciar dicha relacin. La
senda ptima y (t) presenta el valor terminal y (T ), mientras que la senda

14. V e r el A n e x o A al fin a l d e l c a p tu lo .
Clculo de variaciones 55

factible, que cumple con la relacin (29), posee el valor terminal y(T +
eAT). La diferencia entre la condicin final de y(t) c y (t) puede ser defini
da del siguiente modo:

eA.Vy = y(T" + eAT) - y (T ) (35)

(trfico No. 2.5

Por otro lado, la curva y(t) entre el instante T y (T + eAT) puede ser apro
ximada mediante una lnea recta con intercepto igual a y(T ) y pendiente
y'(T):

>('/* + fA T) = y(Tt ) + y'* (T*)eAT (3 6 )


56 Apuntes de Estudio

De este modo, para valores muy pequeos de e, y reemplazando (36) en (35),


obtendremos:

'Avr = y(7'*)-y*(7'*) + y , (7'*)fA7 (37)

'Ay | r , i / ) + ev (/ )A/

A.v-/- = .v(74) + y'* (7'* )A7

.v(7*) = Avy- - y'* (7* )A7

Finalmente, sustituyendo (37) en (34), obtenemos la condicin de primer or


den del problema (25):

-v(D + [/ y ],=7- Ayy + [ / - y ' * / / W * AT = 0 (38)



v r/t v

Una senda y*(t) C" satisface (38), siempre y cuando se cumpla la ecuacin
de Eulcr y la condicin de transversalidad:

-i/ vV. ,.A/' 0

En esta condicin se han omitido los asteriscos por simplicidad. Es importan


te tomar en cuenta que mientras la ecuacin de Euler constituye una condi
cin de primer orden que se debe cumplir para todo el perodo de tiempo (t e
[0, T)), la condicin de transversalidad se cumple solamente en el ltimo pe
rodo (t = T). Por otra parte, la condicin de transversalidad tambin es vlida
cuando la determinacin de la condicin inicial forma parte del problema de
optimizacin.

2.2 Casos especiales de la condicin de transversalidad

Cuando la condicin terminal toma una caracterstica especfica, la condicin


de transversalidad se simplifica y es posible resolver el problema de clculo
de variaciones de una manera ms sencilla. A continuacin se muestran algu
nos casos especiales de la condicin de transversalidad.
Clculo de variaciones 57

Caso 1.- Horizonte temporal fijo

Cuando el horizonte temporal es fijo, se cumple que AT = 0 y desaparece el


segundo trmino de la condicin de transversalidad. En vista de que Ay r pue
de tomar cualquier valor, la nica forma de asegurar que se satisfaga (27) es
mediante la condicin:

l/vW =0 (39)

El problema a resolver se representa en el Grfico No. 2.6. Debe determinar


se simultneamente la senda ptima y el valor terminal yj. En este caso, dado
que solamente el horizonte de tiempo se encuentra fijo, existe un conjunto
amplio de valores terminales factibles. En este sentido, la condicin de trans
versalidad permite discriminar al valor terminal ptimo del conjunto de valo
res factibles.

Grfico No. 2.6


58 Apuntes de Estudio

Ejemplo.- Halle la senda ptima en el siguiente problema:

Maximizur V\ y ] = j" ( r + v'2)dl


o
sujeto a v(0) = 4
v(2)= v, {y. Libre)

En este caso, la funcin f() depende slo de t e y'(t), por lo que la ecuacin
de Euler se reduce a la siguiente condicin:

fe = 2 / = Ht

Integrando una vez esta ecuacin diferencial obtenemos la solucin:

v ( t ) = " ! II
2

Una constante de la senda ptima se obtiene a travs de la condicin inicial


y(0) = Hi = 4. La otra constante se determina aplicando la condicin de trans-
versalidad (39):

// 2 /(2 ) = Hl = 0

De esta manera, las constantes vienen dadas por Hi = 0 y H2 = 4. Finalmente,


la senda ptima sera:

yV) = 4

Con el valor terminal y i = 4.

Caso 2.- Valor terminal fijo

Cuando el valor terminal de la trayectoria ptima (y r) se encuentra fijo, A>'r


es igual a cero y se elimina el primer trmino de la condicin (27). Para que
se cumpla la condicin de transversalidad, independientemente del valor que
tome AT:

[ / - > '/; ] : ; o (40)


Clculo de variaciones 59

En el Grfico No. 2.7 se representa el problema a resolver. A diferencia del


caso anterior, deben determinarse la trayectoria ptima y el horizonte tempo
ral ptimo. Como se puede apreciar en el Grfico, para un valor terminal da
do existen diversos horizontes temporales factibles, y la condicin de trans-
versalidad permite determinar el valor de "T ptimo.

Grfico No. 2.7

Ejemplo.- Halle la senda ptima en el siguiente problema:


Maximiz.ur V \y ] = J ( r + y '2)dt
o
sujeto a y(0) = 4
y(7') = 5 (T Libre)
60 Apuntes de Estudio

Al igual que en el ejemplo anterior, la ecuacin de Euler brinda el siguiente


resultado:

* "i
y (t) = - J - t + U 9

La constante 1L se obtiene a partir de la condicin inicial del problema y(0) =


4 = EL. Para obtener la otra constante es necesario emplear la condicin de
transversalidad (40):

= U~ + v ' y '(2 y (
n = T Ji = '

Evaluando esta expresin en el ltimo perodo t = T, obtenemos la siguiente


relacin:

T 1- = 0

//
=T
o

En esta ecuacin, (H|/2) puede tomar dos valores +T o -T. Sin embargo, como
la senda ptima debe ir de un valor inicial igual a cuatro a un valor terminal de
5, necesariamente la pendiente de la funcin (H/2) debe ser positiva, por lo que
se debe cumplir que (H/2) = T. De lo contrario, el problema no tendra solu
cin. Finalmente, para hallar las constantes del problema evaluamos la trayecto
ria ptima en ltimo perodo T, tomando en cuenta que (Hi/2) = T:

y ( T) = T + 4 = T (T ) + 4 = 7 2 + 4 = 5

T =1

La solucin algebraica para la variable T arroja dos soluciones: T = 1 y T = -1.


Dado que el problema con un horizonte temporal negativo no tendra sentido, se
toma la solucin T = 1. La solucin al problema quedara definida por la senda:

y(t) = t + 4

Con el horizonte de tiempo T = 1.


Clculo de variaciones 61

Caso 3.- Curva terminal

En este caso, el valor terminal depende del horizonte de tiempo T de acuer


do con la siguiente funcin:

v(T) = 0(7')

Por otra parte, la primera diferencia del valor terminal se relaciona con "T
del siguiente modo:

Ay(T) = 0 '(7 )A7

Si reemplazamos esta relacin en la condicin de transversalidad (27) y tacto-


rizamos la expresin AT, obtendramos:

1/ ! / O '( 7 7 A T + |/ - y 7 , \ 7 O

U f y \ , =T ^ ( T ) + f - y % - ] l =T ] A T = 0

Simplificando la ecuacin, llegaramos a la siguiente condicin de transversa


lidad:

1/ + (O'(T) - y ' )j \ \ i = t A T = O (41)

En el Grfico No, 2.8 se representa el problema a resolver. Como se puede


apreciar, la condicin terminal est definida por la curva O(T).

Ejemplo.- Halle la senda con menor distancia que pase por el punto (0,1) y la
curva y(t) = 2 - 3t.

El problema a resolver sera similar al de la seccin 1.2 del presente captulo.


Debe determinarse una curva que posea la distancia mnima, pero sujeta a una
condicin terminal y(T) = 2 - 3T. De esta forma, el problema a resolver sera:

Maximizar V| y] = -j -j\ + y '2dt


o
sajelo a y(0) = 1
y(r) = i ~ y r
62 Apuntes de Estudio

Grfico No. 2.8

Como se demostr anteriormente, la senda ptima viene dada por la lnea


recta:

v*(f) = T7/ + /7,

El intercepto se obtiene evaluando la trayectoria ptima en la condicin ini


cial y(0) = II2 = 1. Para determinar la otra constante de la senda es necesario
evaluar la condicin de transversalidad (41). Tomando en cuenta la forma
funcional de la curva terminal:

0 (7 ) = 2 - 37'

& ( T ) = ~3

Aplicamos la condicin de transversalidad:

(,/ + ( < ! > ( / ) - y ) / v- ] ( =/ = - J 1 t- v + (-3 - y ) ( y )(~ y /l + y ) 11 , = = O


Clculo de variaciones 63

Si multiplicamos esta ecuacin por (1 + y ': ) 1/2 y tras algunas simplificacio


nes, finalmente, llegaramos a la siguiente condicin:

I-V L r = 1

Dado que y ' = Hi, se cumplira que 3H| = 1, con lo cual obtendramos el va
lor de la pendiente. Finalmente, la senda ptima quedara definida por:

y (t) = 1 + i
3

En el Grfico No. 2.9 puede observarse que la senda ptima es perpendicular


a la condicin terminal. Cualquier otra recta que no fuera perpendicular a la
curva terminal tiene una mayor distancia.

Grfico No. 2.9


64 Apuntes de Estudio

2.3 Aplicacin: minimizacin de costos'5

Suponga que una firma ha recibido un pedido de B unidades de un produc


to. En la elaboracin del producto existen dos tipos de costos. Por un lado se
encuentra el costo de produccin, que constituye una funcin cuadrtica de la
cantidad producida:

C(c/) = acf (a > 0)

Adicionalmente existe un costo de almacenaje. El costo unitario de mantener


una cantidad inventarios (y(t)) en el perodo "t es constante e igual a b". De
esta forma, el costo por concepto de almacenamiento es igual a:

C, (y(f)) = by(t) (b > 0)

El objetivo de la firma es determinar la evolucin de la produccin e in


ventarios que determine el menor costo total, y el perodo de produccin
T ptimo.

En primer lugar, es necesario plantear el problema de optimizacin en fun


cin de una sola variable. Si consideramos que los inventarios se incrementan
en el tiempo debido al aumento de la produccin, se cumple que q = y'(t). Por
consiguiente, los costos totales de la firma quedaran definidos del siguiente
modo:

C = C , + C 2 = a y ' 2 +by

De esta forma, la firma debera resolver el siguiente problema de optimiza


cin dinmica:

Ma.xiiniz.ar Ely] = -J (a/ 2 +by)dt


o
sujeto a y(0) = 0
yCT) = B (T Libre)15

15. E s t a a p l i c a c i n s e b a s a e n K a m i e n , M o r t o n I. y N a n c y L . S c h w a r t z . D ynam ic O ptim iza


tio n. T h e C a l c u l u s o f V a r i a t i o n s a n d O p t i m a ! C o n t r o l in E c o n o m i c s a n d M a n a g e m e n t . 2 a . e d i
c i n , A m s t e r d a m : N o r t h - H o l l a n d , 1 9 9 1 . p p . 5 y 6.
Clculo de variaciones 65

Para determinar la trayectoria ptima de la produccin y los inventarios, de


bemos obtener las derivadas que conforman la ecuacin de Euler:

/ , = ~b
f y- = - 2 ay'
d r rr
/ v' = ~2(l V
dt

Reemplazando las derivadas en la ecuacin de Euler obtendramos la siguien


te ecuacin diferencial:

2ay b = 0

Integrando dos veces dicha ecuacin, llegamos a la siguiente solucin:

v ( t ) = b r + 77/ + w,
4a

Para hallar una de las constantes de la senda ptima, evaluamos la funcin en


la condicin inicial y(0) = PE = 0. La otra constante puede hallarse a travs de
la condicin de transversalidad (40):

I./ =[~{ayn + by) - y'{~2ay'%_, =[ay'2 - b \ ] r = 0

Reemplazando la trayectoria ptima en la condicin anterior obtendramos:

a\ / + / / , /- + H,i + H, = 0
2a 4a
l=T

Simplificando la ecuacin anterior se obtiene que Hi = 0, por lo que la senda


ptima sera:

b
y r(0
4a

El horizonte de tiempo "1 se halla evaluando y (t) en la condicin final


y(T) = B, de este modo:
66 Apuntes de Estudio

v(T) = -b- T 1 = B
4a
Ba
T =7 i
~]< b

En la realidad, la variable T tiene dos soluciones; sin embargo, al ser uno


de los valores negativo, se descarta dicha solucin. Como se puede apreciar,
el horizonte de tiempo depende de todos los parmetros del problema. Cuan
do se incrementa el pedido de produccin B o el coeficiente de la funcin
de costos a, la estrategia ptima sera incrementar el perodo de produccin
para incurrir en menores costos. Por otro lado, cuando se incrementa el costo de
almacenaje, resulta conveniente cumplir con el pedido en un menor tiempo.

A continuacin se desarrollarn las condiciones de suficiencia del clculo de


variaciones, las cuales permiten determinar si la senda ptima hallada maxi-
miza o minimiza el funcional objetivo V|y],

3. Condicin de segundo orden

En los problemas de optimizacin esttica, adems de la condicin de primer


orden, es necesario contar con una condicin de suficiencia que determine si
el punto estacionario hallado determina un valor mnimo o mximo de la fun
cin objetivo . Para ello se evala la concavidad o convexidad de la funcin
objetivo. En el clculo de variaciones ocurre lo mismo. Es necesario evaluar
la concavidad de la funcin intermedia f(t, y, y'), para definir si la senda
hallada resuelve un problema de maximizacin o minimizacin.

3.1 Condicin de segundo orden

Si la funcin f(t, y, y') es cncava (convexa) respecto a (y, y') entonces:

a) La ecuacin de Euler es suficente para la maximizacin (minimizacin)


de Vi yJ, cuando la condicin terminal (T, y i ) es fija.

b) La ecuacin de Euler junto con la condicin de transversalidad son sufi


cientes para la maximizacin (minimizacin), cuando la condicin termi
nal (T, yr) es libre.61

16. Puede haber dos puntos que pueden no c u m p lir n e cesariam en te la c o n d i c i n de sufi
cien cia. p ero au n as so n p tim o s.
Clculo de variaciones 67

Demostracin

Dada la senda ptima y (t). una senda factible y(t), el horizonte temporal fijo
T , y el valor terminal fijo ya, una funcin intermedia f() cncava cumple
con la siguiente relacin' :

f((, y, y') - f(i. y ' , y ' * ) < / , . ( / . y * , y ' * )( v - y * ) + / , . - ( / . y y ' " ) ( y ' - y ' * ) (42)

Considerando que la senda factible se encuentra definida segn (8), entonces


(42) se reducira a la siguiente expresin:

/ ( ' y. y ' ) - / ( / , y , y ' * ) < / (/, y * . y ' * ) a ( / ) + / / (t, y * . y " *'(/) (43)

Al integrar ambos lados de la desigualdad entre el perodo t = 0 y t = T se ob


tiene:

VI y 1- Vj v*) < f | [ / , (t, y*, y'* ).v(/) + j \ (t, y *, y'* ).v'(/)]dt (44)
0

Al ser y (t) la trayectoria ptima, se satisface tanto la ecuacin de Euler como


la condicin (11), de tal forma que el ludo derecho de la desigualdad es igual
a cero:

V1y ] < V7[ v (45)

De esta manera, al ser f() cncava, se asegura que la senda ptima y genera
el mximo valor posible del funcional objetivo V|y J. Si la funcin f(*) fuera
estrictamente cncava, las desigualdades (42) a (45) se cumpliran estricta
mente y la senda ptima hallada dara como resultado un nico mximo abso
luto del funcional objetivo. El lector puede demostrar que cuando el valor
termina! de la senda ptima es libre, se llega a un resultado similar a (45)IK.
En este ltimo caso, cuando la funcin intermedia es cncava, tanto la ecua
cin de Euler como la condicin de transversalidad son condiciones suficien
tes para la maximizacin del funcional objetivo. 817

17 . Ver d A n e x o B al fin al d e l c a p tu lo .

18 . E s n e c e s a r i o e m p l e a r la c o n d i c i n ( 3 3 ) p a r a e s t a b l e c e r la e q u i v a l e n c i a e n l o s r e s u l t a d o s .
68 Apuntes de Estudio

3.2 Condiciones de concavidad

Bsicamente existen dos formas de evaluar la concavidad de la funcin t'O).


Una de ellas es evaluando los menores principales de la matriz Hessiana de la
funcin intermedia, para determinar si es definida negativa o positiva. El otro
mtodo consiste en hallar las races caractersticas de la matriz Hessiana. A
continuacin se detallan ambos procedimientos.

Mtodo de los menores principales

Dada una funcin f(t,y,y'), la matriz Hessiana A:

y sus menores principales Ai y A2:

A . = | / , v ! = / vV
fyV /
A, /vv/v, -/vv'/v
U l.

La funcin f(t. y, y') es cncava si la matriz A es semidefinida negativa (Ai < 0 y


A2 = 0), y estrictamente cncava si es definida negativa (Ai < 0 y A2 > 0). Por
otro lado, la funcin es convexa si A es semidefinida positiva (Ai > 0 y A:= 0), y
estrictamente convexa si es definida positiva (Ai > 0 y Az> 0).

Ejemplo.- Evale la condicin de segundo orden del problema desarrollado


en la seccin 1.3 de este captulo.

En el problema de extraccin ptima de recursos naturales, la funcin f(t, y,


y') est definida por:

/ (/, y, y') = Ln(y')

La matriz A de la funcin de beneficios sera:


Clculo de variaciones 69

y sus menores principales Ai y A2:

yA y'2

0 0

Los menores principales cumplen con la condicin Ai < 0 y Ai = 0, por lo tan


to, la funcin de beneficios es cncava. De esta forma se cumple la condicin
de suficiencia, y se comprueba que la Ecuacin de Euler resuelve el problema
de maximizacin del funcional objetivo.

Mtodo de las races caractersticas

Dada una funcin t(t, y, y'), la ecuacin caracterstica p(r) cuyas races son r
y r2:

IfyV ~ r fyy-
P(r) r ) ( f . ~ r ) - f >y. f }.y = 0
i U~r

La funcin f(t, y, y') es cncava si n < 0 y r2< 0, y estrictamente cncava si n


< 0 y r2 < 0. Asimismo, la funcin f(t, y. y') es convexa si n > 0 y r2 > 0, y es
trictamente convexa si n > 0 y r2 > 0.

Ejemplo.- Evale la condicin de segundo orden del problema desarrollado


en la seccin 2.3.

En este problema, f(t, y, y') est definido del siguiente modo:

/ ( / , y, y') = ay'2 + by

A partir de la funcin de costos se plantea la ecuacin caracterstica p(r):

/Ac) = r '0' ' ' J 3; = - r i l a - /) = 0


70 Apuntes de Estudio

Las races caractersticas n = 2a y ig= 0 satisfacen la condicin ti > 0 y n >


0; por lo tanto, la funcin es convexa. El problema cumple con la condicin
de segundo orden; y de esta forma, la ecuacin de Euler y la condicin de
transversalidad resuelven el problema de minimizacin del funcional obje
tivo. En la seccin 2.3 se multiplic por (-1) la funcin objetivo y el pro
blema de minimizacin se convirti en uno de maximizacin. Si bien dicho
artificio altera la condicin de segundo orden, no ocurre lo mismo con el
resultado del problema.

4. Horizonte de tiempo infinito

En esta seccin se desarrollar un problema ms general de clculo de varia


ciones, tomando en cuenta un horizonte de tiempo infinito, y un valor termi
nal libre de la senda y(t). En este sentido, el problema a resolver es el siguien
te;

(46)
0
sujeto a v(0) = v0(v0dado)

El supuesto de un horizonte temporal infinito es razonable cuando se con


sidera el caso de agentes que enfrentan decisiones de muy largo plazo. Por
ejemplo, podemos pensar una situacin en la cual una compaa planea in
vertir en un proyecto de gran escala, y para recuperar el capital invertido
necesita un amplio perodo de operaciones. De esta forma, la empresa pue
de ejecutar el proyecto teniendo en cuenta un horizonte temporal infinito.
Tambin podra pensarse en el caso de una familia que desee maximizar
sus utilidades futuras descontadas'9. Si consideramos que esta familia valo
ra el bienestar de las generaciones futuras, tomara sus decisiones de con
sumo, ahorro o inversin con un horizonte temporal infinito, de tal forma
que efectivamente asegure un nivel determinado de bienestar para sus des
cendientes. En algunos casos es ms realista un perodo de tiempo infinito,
no obstante, ello podra implicar que la integral del funcional objetivo no
converja, y por ende, que no exista una nica solucin al problema. A con
tinuacin se explicarn algunas condiciones bajo las cuales se asegura la
convergencia en el problema ( 4 6 ) . 19

19. C o n s i d e r a n d o u n a f u n c i n d e u t i l i d a d s i m i l a r a la p r e s e n t a d a e n la e c u a c i n ( 5 ) d e l p r i -
m cr cap tu lo .
Clculo de variaciones 71

4.1 Condiciones para la convergencia del funcional objetivo

La dificultad para resolver (46) radica en que la integral del funcional objeti
vo es impropia, y podra tomar un valor infinito:

J /( ,y ,y V - > (47)
o

Aparentemente, una condicin que podra superar este problema es que la


funcin f() converja a cero cuando el tiempo tiende a infinito:

Lim f( t, y, y') = 0 ( 48 )
! >co

Sin embargo, la condicin (48) no garantiza una solucin. Veamos porqu


mediante un ejemplo. Considere la siguiente funcin que depende del tiempo:
f(t) = 1/t. Claramente se puede apreciar que esta funcin en el infinito tiende a
cero:

Lim = 0
t

Sin embargo, al evaluar la integral impropia de la funcin, obtenemos el si


guiente resultado:

f dt = Liin[Ln(t)fa
Jf !)-><*>
0

De esta forma podemos apreciar que la condicin (48) no implica la existen


cia de una solucin al problema. A continuacin se plantean dos condiciones
suficientes que aseguran la convergencia del funcional objetivo.

Condicin 1

Dada la integral impropia de la funcin objetivo V[y], si la funcin f() posee


un valor finito hasta el perodo de tiempo T, y posteriormente toma un va
lor igual a cero y se mantiene constante, entonces la integral converge.
72 Apuntes de Estudio

Demostracin

La integral impropia de la funcin objetivo puede descomponerse en la suma


de dos integrales:

T
I J
f { u V, y')dt = | f(r, V, y')dt + f ( t , y, y')dt (49)
o o r

Si consideramos que la funcin f(*) es igual a cero a partir del perodo T,


entonces la segunda integral sera igual a cero, con lo cual la integral impro
pia se reducira a una propia:

T
J
| / (t, y, y')dt - f ( t , y, v')dt (50)
o o

De esta forma, se asegura la convergencia de la integral.

Condicin 2

Si la funcin f(*) es descontada a travs del factor e pt (donde p > 0), y posee
en todo el horizonte de tiempo un valor menor o igual a M" (M < oo), enton-
ces la integral converge.

Demostracin

La funcin f() tiene una cota superior igual a M , por tanto se cumple la si
guiente desigualdad:

f ( t , y, y V P' < M e ~ pl ( 51)

Si integramos ambos lados de la desigualdad obtenemos la expresin:

J /(? , y, y')e~*dt < | M e~f,ldt (52)


o o
Clculo de variaciones 73

Al desarrollar la integral del lado derecho de la desigualdad, se llega a la si


guiente condicin:

M
f ( t , v, y )(' p'dt < (53)

De esta forma se asegura que la integral no exceda el lmite superior (M/p) y,


por lo tanto, que exista una convergencia.

4.2 Condiciones de primer y segundo orden

Cuando el horizonte de tiempo es infinito, la ecuacin de Euler y la condicin


de segundo orden siguen siendo vlidas para la resolucin del problema de
clculo de variaciones. Sin embargo, la condicin de transversalidad se modi
fica ligeramente. En lugar de evaluar la expresin (27), es necesario emplear
la siguiente condicin:

Lim ( [ / - y'/,.-1l=r AC + [/ > ],=r Ay-, ) (54)

Como el horizonte T es infinito, la expresin AT es distinta de cero; por


tanto, debe cumplirse la condicin:

Lim [f - y ' f v'\ = 0 (55)

Si el valor terminal de la senda ptima no estuviera especificado, a! igual que


en el problema (46), adicionalmente debe cumplirse:

L im lfu 1= 0 (56)

Por el contrario, cuando se especifica un valor terminal de la senda y(t), tam


bin denominado meta asinttica, en lugar de la condicin (56) puede em
plearse la siguiente:

Limy(t) ~ y^ (5 7 )
74 Apuntes je Estudio

Donde y constituye un nmero real. A continuacin analizaremos un ejem


plo para el caso de horizonte temporal infinito.

Ejemplo.- Halle la senda ptima en el siguiente problema:

M inim izar E[ yj =Je~i' ( y- + ay + b y ' + c y ' 2 ).dt



sujeto a y(0) =d (a ,b,c.(l, p >0)
Para resolver este problema debemos aplicar los tres conceptos desarrollados
a lo largo del captulo: la ecuacin de Euler, la condicin de transversaiidad y
la condicin de suficiencia.

En este caso, al existir un factor de descuento, la ecuacin de Euler relevante


es la (18). Las derivadas que conforman la ecuacin de Euler son:

/, =2y + a
j\, =2ex + b

Reemplazando estas derivadas en la ecuacin (18) obtendramos una ecua


cin diferencial de segundo orden:

2y+ a =ley* - p(2cy' + b)

La ecuacin caracterstica del problema es la siguiente:

r - p r - = 0
c

cuyas races n y to son guales a:


Clculo de variaciones 75

Ntese que el trmino de la raz cuadrada, en valor absoluto, posee un valor


superior a (p/2); por lo tanto, una de las races es positiva y mayor que p (n >
p > 0) y la otra es negativa (n < 0). Por otra parte, la integral particular sera
la siguiente:

_ ( a + pb
\ 2

Dado que los parm etros a, b y p son positivos, la integral particular es


negativa (k < 0). Finalm ente, la solucin general al problema vendra da
da por:

a + pb
>* ( / ) = //.c-'1' + H,e'
?

Las constantes del problema, Hi y EL, pueden obtenerse a partir de las condi
ciones (55) y (56), y de la condicin inicial y(0) = d. La condicin (56) apli
cada a este problema sera igual a" :

Lim\e~P (2cy'+b)\ = Q

Reemplazando la senda ptima y*(t) en ia condicin de transversalidad, obte


nemos:

L i r u l l c ^ H - p + 2cr H e ' - ^ + be ' p' |=0

En esta condicin existen tres trminos exponenciales. Los dos ltimos trmi
nos convergen a cero, puesto que los exponentes (r^-p) y (-p) son negativos;
sin embargo, el exponente del primer trmino (n-p) es positivo, con lo cual
dicha expresin podra divergir conforme el tiempo tienda a infinito. Para que
ello no suceda, la constante Hi debe ser igual a cero, con lo cual se cumplira
la condicin (56). El lector puede comprobar fcilmente que al evaluar la20

20. E n e s t e c a s o , a l a p l i c a r la c o n d i c i n d e t r a n s v e r s a l i d a d s e c o n s i d e r a c o m o u n a s o l a f u n
c i n a f (* ) , m u l t i p l i c a d o p o r e l f a c t o r d e d e s c u e n t o e ' 1'.
76 Apuntes de Estudio

condicin (55) se llega al mismo resultado (Hi = 0). Para hallar la otra cons
tante Hi, evaluamos la senda ptima en la condicin inicial y(0) = H2 - (a +
pb/2) = d, con lo cual la solucin final sera:

La condicin de segundo orden del problema se verifica evaluando la matriz


Hessiana de la funcin intermedia f():

le 0
A=
0 lee

Dado que los menores principales de la matriz son ambos positivos, la matriz
es definida positiva y, por lo tanto, la funcin intermedia es convexa. En este
sentido se cumple la condicin de segundo orden y se asegura que la senda
ptima m inim izad funcional V |y|.

4.3 Diagrama de fase

En todos los ejemplos desarrollados hasta el momento, se han hallado solucio


nes cuantitativas al problema de clculo de variaciones con horizonte infinito.
Es decir, a travs de la ecuacin de Euler se ha obtenido la forma funcional de
la trayectoria ptima. Sin embargo, en algunos casos, la ecuacin de Euler ano-
ja una ecuacin diferencial no lineal de segundo orden, a partir de la cual no es
posible derivar la senda ptima de manera analtica. En estas situaciones resulta
conveniente emplear un diagrama de fase, a partir del cual es posible determi
nar la dinmica de las variables analizadas y el punto de equilibrio hacia el cual
convergen en el infinito, tambin conocido como estado estacionario. A conti
nuacin se explicar la tcnica del diagrama de fase.

4.3.1 Diagramas de fase de una variable

El paso inicial para la elaboracin de un diagrama de fase de este tipo es co


nocer una relacin entre la variable y su tasa de cambio con respecto al tiem-
po, mediante cualquier ecuacin diferencial autnoma'

dY/dt = Y = f( Y)12

21. L lam am o s a u t n o m a a a n a e c u a c i n d i f e r e n c i a l , c u a n d o e l t i e m p o n o a p a r e c e e n f o r m a
e x p l c i t a c o m o a r g u m e n t o d e la f u n c i n d Y / d t = f(Y ).
Clculo de variaciones 77

La funcin f(Y) puede presentar cualquier forma (lineal o no lineal); adems,


es posible graficarla en un plano cartesiano con ejes dY/dt e Y. La represen
tacin grfica de f(Y) es denominada curva de fase. Para entender el meca
nismo del diagrama de fase debemos conocer la dinmica de los diversos
puntos implicados en el mencionado plano cartesiano. Para tal fin, conside
remos el Grfico No. 2.10.

Grfico No. 2.10

La posicin del punto A har que ste tienda a moverse de izquierda a dere
cha, es decir, en la direccin en la que Y crece. Esto se debe a que est ubica
do en el cuadrante donde dY/dt > 0; el signo positivo de esta derivada implica
que conforme pasa el tiempo, la variable (representada por el eje de abscisas)
aumenta, dando as la explicacin al movimiento del punto. El punto B se
comporta de manera contraria a A, ya que en ese cuadrante dY/dt < 0 e Y de
crecer ante un incremento en la variable temporal, por lo que se describe un
movimiento de derecha a izquierda. El ltimo caso involucra al punto C. N
tese que ste se encuentra sobre el eje horizontal, donde dY/dt = 0. Este punto
representa lo que se conoce como un estado estacionario (t ) porque no
describe movimiento alguno. De esto podemos concluir que estamos frente a
un posible punto de equilibrio22, cuando la variable adquiere un estado estti
co (Y' = 0).

22. P o sterio rm e n te verem o s que la c o n d i c i n d Y /d t = 0 no in v o lu cra n e cesariam en te un

p u n t o d e e q u il i b r i o . T a l es el c a s o m o s t r a d o e n el G r f i c o N o . 2 .1 3 .
78 Apuntes de Estudio

Luego de comprender la dinmica que toma una variable ante los distintos
comportamientos de sus cambios con respecto al tiempo, podemos distinguir,
de manera cualitativa, tres tipos de trayectorias mostrados en los Grficos
Nos. 2.11,2.12 y 2.13.

En el primer caso, el punto "a" es un equilibrio dinmicamente inestable, por


lo que puede concluirse que la trayectoria Y diverge. Resulta interesante dar
cierto nfasis a las condiciones iniciales de esta trayectoria: si empezamos en
el equilibrio, es decir Y(o, = a, la dinmica har que nos alejemos, cada vez
ms, con el paso del tiempo y que no sea factible retornar a este equilibrio;
si Y(o) > a, tendremos una funcin creciente en todo momento y, por el con
trario, si Y(0) < a, la funcin ser decreciente.

Grfico No. 2.11

Por otro lado, el punto "b" en el segundo caso representa a un equilibrio di


nmicamente estable. En tal caso, si Y(o) = b, la dinmica har que siempre se
mantenga este punto; si Y * b, se dar un desplazamiento a lo largo de la
curva de fase que nos llevar, finalmente, al equilibrio.
Clculo (Je variaciones 79

Grfico No. 2.12

Grfico No. 2.13

Y'

t/t/t;
c'

0 t
80 Apuntes de Estudio

De los dos casos anteriores podemos obtener una conclusin importante, que
involucra a la pendiente de la curva de fase: si sta es negativa (dY/dY < 0),
aseguramos la estabilidad dinmica de la variable; si es positiva (dY /dY >
0), tratamos con inestabilidad dinmica23.

El ltimo caso presenta dos puntos en Y = 0. Estos no representan puntos de


equilibrio, ya que son las cotas de una trayectoria fluctuante. Este tipo de
movimiento se debe a que nos podemos situar tanto en la zona donde Y > 0
como en la que Y < 0. Adems podemos apreciar que dY /dY es indetermi
nada, hecho que descarta a c y a c de ser puntos de equilibrio.

4 .3 .2 D ia g r a m a s d e fa se d e d o s v a r ia b le s

Hasta el momento hemos resaltado que es posible evaluar cualitativamente


cualquier variable dinmica mediante la elaboracin de un diagrama de fase.
Del mismo modo, podemos analizar sistemas de ecuaciones diferenciales. A
continuacin trataremos el enfoque grfico-cualitativo de un sistema de pri
mer orden y autnomo, definido como:

X '( t) = dX/dt = f(X,Y)


Y'(t)= dY/dt = g(X, Y)

Recordemos que al resolver un sistema de ecuaciones diferenciales, las tra


yectorias de las variables involucradas se caracterizan por mostrar las mis
mas races. De esta manera, si una variable converge (o diverge) en el largo
plazo a su solucin particular, la otra tambin lo har, por lo que el anlisis
puede resumirse de manera integral a la convergencia (divergencia) del sis
tema.

Como en el caso de una sola variable, el diagrama de fase de dos variables es


realizado sobre un plano cartesiano donde los ejes estn dados por las varia
bles dinmicas, mas no por sus tasas de cambio (X e Y, no X e Y )- En los
Grficos No. 2.11 y 2.12, los equilibrios estn dados por puntos que hacen
que Y = 0; al incrementar el nmero de variables, el equilibrio del sistema

23. E s to p u e d e c o m p r o b a r s e f c ilm e n te c o n u n a e c u a c i n d if e r e n c ia l lin e a l, d e p r im e r o rd e n

y con t r m in o c o n s ta n te Y + aY = b, donde la tra y e c to ria f in a l e s ta dada por

Y) = K(0 , - c . C u a n d o t > o= ( l a r g o p l a z o ) , s t a c o n v e r g e s i - a < 0 y d i v e r g e e n e l c a s o


L 11J a
c a s o c o n tr a rio , -a > 0 . S i c o n s id e r a m o s q u e d Y '/ d Y = - a , lle g a r e m o s a lo s m is m o s r e s u l ta d o s .
Clculo de variaciones

est dado, por ende, cuando ambas variables alcanzan sus respectivos estados
estacionarios. Esta situacin puede ser graficada: ios estados estacionarios de
las variables generan las curvas de fase (X = 0 e Y = 0) y la interseccin de
ambas, el punto de equilibrio intertemporal del sistema (las curvas de fase,
representadas p or/(X , Y) = 0 y g(X, Y) = 0, nos proporcionan relaciones en
tre las variables (involucradas en los ejes) que podemos graficar sin mayor
complicacin24).

Al cruzarse las curvas de demarcacin o de fase en el punto de equilibrio (X


= Y = 0), el espacio de fases se dividide en cuatro regiones distintas. Fuera
del equilibrio, alguna variable o ambas reportan cambios con el tiempo en las
direcciones que indiquen las derivadas temporales2526 (parciales) 3X73X,
3Y73Y o bien, como manera alternativa, las derivadas cruzadas 3X73Y,
3Y73X. Estos movimientos generan las trayectorias de fase o sendas de fase
del diagrama20 (que pueden ser graficadas) y las combinaciones de ellas gene
ran diversos tipos de equilibrios: nodos, puntos de silla, focos y vrtices. Ca
be resaltar que, segn su forma funcional, las curvas de fase pueden determi
nar ms de un punto de equilibrio; cada uno de ellos tendr, consecuentemen
te, las mencionadas cuatro regiones y pueden corresponder a distintas
categoras27.

Para explicar la elaboracin del diagram a de fase de dos variables, as


como la naturaleza de los equilibrios, considerem os el siguiente ejem plo,
del cual desprendem os seis casos particulares28 ilustrados en el Grfico
No. 2.14.

24. D e la m i s m a f o r m a q u e e l d i a g r a m a d e f a s e d e u n a v a r i a b l e , p a r a a t r i b u i r a s p e c t o s c u a l i

tativos a un sistem a de ecu acio n es d ife ren ciales, no n e c esita m o s m s que un esbozo o una
ap ro x im aci n grfica. P o r e l l o , e s i m p o r t a n t e r e c o r d a r la r e g l a d e l a d e r i v a d a d e u na fu n ci n
im p l c i ta (las c u r v a s d e f a s e t o m a n e s ta f o rm a : f(-)= 0 ):

d Y / d X = - Q / n / d X ) / Q / D / d Y ) = - fx / fv
25. L a i n t e r p r e t a c i n d e las d e r i v a s t e m p o r a l e s es c o n o c id a : la v a r i a c i n d e la ta s a d e c a m
b io d e u n a v a ri a b le ( Z o Y ) a n te u n a v a r i a c i n e n la m i s m a v a ri a b le ( Z o Y ).

26. E stas tra y e c to ria s p u e d e n d e s p la z a rs e d e u n a reg i n a o tra sin m a y o r c o m p lic a c i n , y as


a d o p ta r d iv erso s m o v im ie n to s.

27. El a n lisis d e es to s c a s o s es e s e n c ia lm e n te el m i s m o q u e el e x p lic a d o e n esta secci n .

28. E x iste una m a y o r c a n tid a d de casos que el le c to r p u e d e d e sa rro lla r y e v a lu a r p o r su


cu en ta.
82 Apuntes de Estudio

Definimos un sistema diferencial lineal: Z = f(Y, Z) - aZ + bY + h


Y = g(Y, Z ) = cZ + (IY + k

Las curvas de fase son representadas por dos rectas, con pendientes -b /a para
Z = 0 y -d/c para Y = 0:

Z= 0 aZ + bY + h = 0 >Z = -b /a Y -h /a
Y' = 0 > cZ + d Y + k = 0 >Z = -d /c Y -k /c

Adems, d Z / d Z = f z = a d Y /dY = g v = d

Una vez determinadas las curvas de demarcacin, las graficamos en un plano


YZ y determinamos el equilibrio: (Y*, Z*) = [(he - ak)/(ad - be), (bk -
hd)/(ad - be)].

C a so (a): a > 0 , b < 0 , c > 0 , d > 0

De estas condiciones, vemos que Z = 0 constituye una recta de pendiente po


sitiva mientras que Y = 0, de pendiente negativa. Examinemos cuidadosa
mente el origen de la dinmica en el Grfico No. 2.14 (a). Al ser 5Z73Z = a >
0, apreciamos que conforme aumenta Z (zona superior a la curva de fase Z =
0) su variacin con el tiempo tambin lo hace; por ello, trazamos dos flechas
(una en cada regin involucrada) de abajo hacia arriba. Anlogamente, dibu
jamos un par de flechas en direccin opuesta (de arriba hacia abajo) en las
dos regiones restantes, ya que en ellas Z disminuye, por lo que Z tambin lo
har. Este movimiento vertical se debe exclusivamente a que la variable Z re
presenta al eje de las ordenadas.

Centrmonos ahora en movimientos horizontales. Tenemos que 3Y73Y = d >


0, por lo que al ser positiva la variacin temporal de Y (zona superior a Y =
0), Y aumentar, lo que describe movimientos de izquierda a derecha en las
regiones correspondientes. En las regiones restantes, por simetra, los movi
mientos sern contrarios. De esta forma, hemos determinado el comporta
miento que adoptar cada variable en cada zona de fase y, de esa forma, las
trayectorias. Un simple vistazo al Grfico No. 2.14 (a) nos sugiere que el
punto de equilibrio es inestable. Efectivamente, se trata de un nodo inestable.
Clculo de variaciones 83

Grfico No. 2.14


84 Apuntes de Estudio

C a so (b): a <0, b > 0, c > 0 , d < 0

En este caso, las pendientes de ambas curvas son positivas. Adems supon
gamos que -b /a > - d/c, hecho que hace que Y = 0 sea ms inclinada que
Z = 0.

Tenemos que 3Z73Z < 0 y 9Y73Y < 0, por lo que encontramos relaciones
inversas entre las variables y sus tasas de cambio: al ser positiva Y (zona in
ferior de Y = 0), Y disminuir y al ser Z positiva (zona inferior de Z =0),Z
tambin se ver reducida. Podemos percatarnos que tratamos con un equili
brio estable (Grfico No. 2.14 (b)), ya que todas las posibles trayectorias
tienden a ste (grficamente, las flechas sealan al punto de interseccin).
Formalmente, en este caso se presenta un nodo estable.

Tanto en el caso (a) como en el (b), hemos catalogado a los equilibrios como
nodos. Un nodo es un equilibrio tal que las posibles trayectorias fluyen de
manera directa hacia l (estable, Grfico No. 2.14 (bj) o hacia fuera de l
(Grfico No. 2.14 (a)).

C a so (c): a < 0, b > 0, c > 0, d > 0 (queda de tarea para el lector)

C a so (d): a > 0, b < 0, c < 0, d < 0

En estos dos casos (Grfico No. 2.14 (c) y (d)), se presenta un punto de silla como
equilibrio. Puede considerarse al punto de silla como un equilibrio que presenta
dos comportamientos: es estable en un par de trayectorias (las ramas estables), que
fluyen directa y consecuentemente al equilibrio, e inestable en otro par. Por esta
caracterstica particular, el punto de silla es calificado como inestable.

En el Grfico No. 2.14 (c) y (d), las lneas que atraviesan el equilibrio son
denominadas sendas de ensilladura y estn compuestas por el conjunto de
trayectorias convergentes del sistema. Por ello, con el fin de obtener un sis
tema estable, las condiciones iniciales de ste deben ubicarse sobre la senda;
de lo contrario, las trayectorias sern divergentes y el sistema, inestable.

C a so (e): a < 0 , b > 0 , c < 0 , d < 0

En el Grfico No. 2.14 (e) se presenta un foco estable. Este equilibrio se ca


racteriza por contar con trayectorias que se aproximan (estable) o se alejan
(inestable) del estado estacionario del sistema de manera cclica, describiendo
grficamente una espiral al cruzar de una zona a otra. Es as como Y y Z son,
en este caso, trayectorias fluctuantes.
Clculo de variaciones 85

La posicin e inclinacin de las curvas juegan un rol importante, ya que de


terminan la estabilidad o inestabilidad de la trayectoria; pero en cualquiera de
estas situaciones su pendiente en los puntos de cruce ser infinita (en Y = 0,
puesto que se establece un movimiento perfectamente vertical) o cero (en Z
= 0, movimiento perfectamente horizontal).

C a so (f): a - 0, b < 0, c < 0, d - 0 y , p a ra efe cto s p r ctic o s, h > 0 , k < 0

Notemos que los nuevos valores de los parmetros cambian la forma de las
curvas de fase (dejan de ser rectas): Z = 0 es una lnea vertical e Y = 0 es
una funcin constante:

Z = 0 y Y = -h/b

Y' = 0 - > Z = -k/c

En este caso, las derivadas que hemos utilizado hasta el momento no nos pro
porcionan ninguna informacin dinmica O Z73Z = 3Y73Y = 0), por lo que
recurrimos al uso de las derivadas temporales cruzadas: ya que 3Z73Y = b <
0, vemos que conforme Y aumenta (a la derecha de Z = 0), Z vara negati
vamente, por lo que trazamos en esa zona flechas de arriba hacia abajo; por
otro lado, dibujamos flechas de izquierda a derecha en las regiones sobre Y
= 0, ya que 3Y73Z = c > 0.

Apreciamos que el equilibrio es rodeado por trayectorias que forman crcu


los o espirales concntricas a travs de un movimiento perpetuo. Este tipo
es conocido como vrtice (o centro) y puesto que el equilibrio es inalcan
zable (con una excepcin: (Y<0), Z(o;) = (Y*, Z*)), es automticamente cla
sificado como inestable. De esta forma, las trayectorias Y y Z son sim ila
res, individualmente, a la mostrada en el Grfico No. 2.13: fluctuantes pero
de manera uniforme.

A manera de conclusin, confirm am os la idea de que el diagram a de fase


constituye una herram ienta til para atribuir aspectos cualitativos a las
variables dinm icas. Sin em bargo, tiene ciertas lim itaciones: por ejem
plo, no puede determ inar la rapidez o aceleracin con que las trayectorias
convergen o divergen; as como, resulta com plicado analizar con mayor
detalle el com portam iento que stas toman sin considerar el equilibrio de
largo plazo.
86 Apuntes de Estudio

4 .3 .3 A p lica c i n : ex p lo ta c i n p tim a d e p ec e s29

Suponga que una poblacin de N(t) peces en un cierto lago, crece a la si


guiente tasa:

N ' ( t ) = a N ( t ) - b N l (t) (a,b > 0)

en ausencia de actividades de extraccin. En una comunidad cercana al lago


se consume una cantidad C(t) de pescado, que brinda una utilidad igual
U(C) (U'(C) > 0, U "(C ) < 0) y altera el crecimiento de la biomasa de la
siguiente forma:

N \ t ) = aN(t) - b N \ t ) - C(t) (a,b > 0)

El objetivo de la comunidad es maximizar las utilidades futuras descontadas a


la tasa p:

V [ C l= J Y p't/(Cy/f
0

Considerando la poblacin actual de peces No= a/b, y la ecuacin que explica


el crecimiento de la poblacin de peces, el problema de clculo de variacio
nes a resolver sera el siguiente:

Maximizar V[N] = J e~p,U(aN - bN2 - N jd t


0

sujeto a N(0) = y
b

29. Esta aplicacin fue tomada de Kamien, Morton I. y Nancy L. y Schwartz, op. eit., p.
183. Dicho problema est basado en el trabajo de Clark, Colin W. y Gordon R. Munro, "The
Economics of Fishing and Modem Capital Theory: A Simplified Approach", en Journal o f E n
vironmental Economics and Management, Academic Press, 1975, pp. 92-106.
Clculo de variaciones 87

En primer lugar, para elaborar el diagrama de fase que permita obtener una
solucin cualitativa del problema debemos emplear la ecuacin de Euler. Las
derivadas que conforman la ecuacin son las siguientes:

IJN = U '(C ) dC = U \c.)(a - 2bN)


dN
V = V '(C ) - C = -U '( O
dN'
U N = - U \ C . ) C '
di

Al reemplazar las derivadas en la ecuacin de Euler (18) obtenemos:

U'(C)(a - 2bN) = -U"(C)C' + pU'(C)

La ecuacin de Euler y la ecuacin de comportamiento de la poblacin de pe;


ces, conforman el siguiente sistema de ecuaciones diferenciales no lineal de
primer orden:

C'= U^ - ( I b N - a + p)
U (C)

N =aN ~bN 2-C

Para construir el diagrama de fase es necesario establecer las curvas de de


marcacin, que representan el conjunto de puntos para los cuales las variables
del problema se mantienen constantes o estacionarias. Estas curvas se obtie
nen estableciendo las condiciones C ' = 0 y N ' = 0 en el sistema de ecuaciones
diferenciales. Al fijar C ' = 0 en la ecuacin de Euler, obtenemos la curva de
demarcacin:

2b

Por otra parte, al establecer N ' = 0 en la ecuacin de comportamiento de la


biomasa, obtenemos la otra curva:

C aN - b N 2
Apuntes de Estudio

Ambas ecuaciones de demarcacin determinan el diagrama de fase presenta


do en el Grfico No. 2.15.

Para hallar la dinmica de las dos variables, es necesario analizar su compor


tamiento en cada una de las cuatro reas delimitadas por las curvas de demar
cacin. La dinmica del consumo se obtiene a partir de la derivada parcial de
la primera ecuacin diferencial (C') con respecto a la poblacin de peces (N):

dC U'(C_)
2b < 0
dN U'(C)

Grfico No. 2.15

Dado que la funcin de utilidad presenta una utilidad marginal del con
sumo positiva y decreciente (U '(C ) > 0, U "(C ) < 0), el ratio de la prim e
ra derivada de la funcin sobre la segunda derivada ser estrictam ente
negativa, con lo cual la derivada parcial analizada tambin es negativa.
La relacin existente entre C ' y N im plica que conform e se increm ente N,
la derivada del consum o con respecto al tiempo (C ') dism inuir, as como
el nivel de consum o. En vista de que a lo largo de la curva de dem arca
Clculo de variaciones 89

cin el consumo perm anece estacionario, al lado derecho de la curva, con


un mayor valor de N, el consumo tendr un com portam iento decreciente;
mientras que al lado izquierdo, para un menor valor de N, el consumo se
r creciente. Esta evolucin del consumo puede ser representada m edian
te flechas con una direccin hacia abajo, al lado derecho de la curva
(reas II y IV), y con direccin hacia arriba, al lado izquierdo de la curva
(reas I y III).

Por otra parte, la derivada parcial de la segunda ecuacin diferencial (N ') con
respecto a C es negativa:

Siguiendo el mismo anlisis, esta condicin implica que ante un incremento


del consumo, la derivada de la poblacin de peces con respecto al tiempo
(N') disminuir y, por ende, lo har tambin la poblacin de peces. En este
sentido, en la parte superior de la curva de demarcacin, para un mayor valor
de C, la poblacin de peces disminuir; y por el contrario, en el lado inferior
de la curva, para un valor menor de C, la poblacin de peces tendr una tra
yectoria creciente. La dinmica de la poblacin de peces, en este caso, tam
bin puede representarse mediante flechas. En la parte superior de la curva
(reas I y II), el comportamiento decreciente de N se indica mediante flechas
con direccin a la izquierda; y en la parte inferior de la curva (reas III y IV),
el comportamiento creciente de la poblacin de peces se representa mediante
flechas con direccin a la derecha.

Considerando de manera conjunta el comportamiento de ambas variables, la


dinmica del sistema quedara determinado por flechas similares a las
manecillas del reloj, las que se encuentran incluidas en el Grfico No. 2.15.
El equilibrio descrito en este diagrama de fase se denomina equilibrio inesta
ble, lo cual significa que las variables C y N no siempre convergen al estado
estacionario. Si estas variables tuvieran un valor inicial que se ubicara en las
reas I o IV, la dinmica del sistema, representada a travs de las flechas,
muestra una trayectoria divergente en el tiempo. Por el contrario, si las condi
ciones iniciales se ubicaran en un conjunto de puntos dentro de las reas II o
III, tambin denominada senda de ensilladura, las variables convergeran di
rectamente al estado estacionario. El consumo y la poblacin de peces en es
90 Apuntes de Estudio

tado estacionario se obtienen resolviendo el sistema de ecuaciones definido


por las ecuaciones de demarcacin. De esta forma, ambas variables en el
equilibrio toman el siguiente valor:

2b

r " ' r'


4b

Un aspecto que llama la atencin en el problema es el nivel de consumo en


estado estacionario. A pesar de que la curva de demarcacin determinada a
partir de N ' = 0 posee un mayor nivel de consumo para N = a/2b, ste no
constituye el punto de equilibrio del diagrama de fase. Ello se debe a la exis
tencia de la tasa de descuento. Esta tasa, como se mencion anteriormente,
cumple la funcin de brindarle una menor ponderacin a las utilidades prove
nientes de las generaciones futuras. En este sentido, como el agente optimiza-
dor tiene un mayor bienestar por las utilidades cercanas al presente, la deci
sin ptima consistir en acceder a niveles altos de consumo en el presente, lo
cual ocasiona una depredacin del recurso marino y, por ende, un menor con
sumo en el largo plazo o estado estacionario. Si la tasa de descuento fuera
muy elevada, como por ejemplo p = a, se asignara una ponderacin baja a las
utilidades futuras, y el consumo y la poblacin de peces seran iguales a cero
en el estado estacionario30. Por el contrario, si la tasa de descuento fuera baja,
como por ejemplo p = 0, se dara igual importancia a las utilidades presentes
y futuras, de tal forma que el consumo y la poblacin de peces en el estado
estacionario tomaran el mximo valor posible determinado por la curva de
marcacin.

Ejercicios

1. Mediante la ecuacin de Euler, halle la senda ptima en los siguientes casos:

a. V[ v] = J (7 y )r// sujeto a y(0) = 9; y(2) = 11

I
b. V[ vi = J(_y - 2 y / + \0ty)dt sujeto a y(0) = 1; y(I) = 2

30. E l l o p u e d e c o m p r o b a r s e r e e m p l a z a n d o p = a e n e l c o n s u m o y la p o b l a c i n d e p e c e s e n el
esta d o e s ta c io n a rio (C * . N *).
Clculo de variaciones 91

c. V\ y] = J( v + 4 y y '+ 2y'z)dt sujeto a y(0) = 2; y(-72) = e + e

C -J'l.K
d. K[y| = j (2 v" + 3yy - 4 y ' 2)cit sujeto a y(0) = 1: v( -) = 2
0

e. K[ y 1= j"(2 ve' + y 2 + y'2)dt sujeto a y(0) = 2; y(2) = 2e2+ e 2


0

f. V\y] = J (7y' + 1)dt sujeto a y(0) = 3; y(5) = 8


g. V[_v] = J(f + y2 + 3 v'ylt sujeto a y(0) = 0; y(5) = 3


0

h. V/[vJ = j*' Ln(ay - y)dt sujeto a _v(0) = b\y(T) - 0 (a,b,p,T >0)


o

ir

i. C[y] = (.v2 - y'2)dt sujeto a y(0) = 0;y ( - ) = 1


o 2

j. V\y\ = ^ ( y ' 2e ' )dt sujeto a y(0) = 2;_v(4) = 1


2. Mediante la ecuacin de Euler y las condiciones de transversalidad, halle


la senda ptima en los siguientes casos:

r
a. V{y] = (ciy'2 +by)dt sujeto a y(0) = 0; y(T) = c (a,b,c >Q\T libre)
0
1
b. V[y\ = ^(ty + y2)dt sujeto a y(0) = l y ( T ) = 10 (T Ubre)
0
92 Apuntes de Estudio

c. V| vj )dt sujeto a y(0) = 1; v(2) = y2(y2 libre)


H

d. V[yl = |( 5 0 y - y 2 - 2 / - / 2X/f sujeto a y(0) = 1; y(l) = y, (_v, libre)


0

1
e. V[y] = + y'1^ sujeto a y(0) = 0; y(T) = 1- T 1
0

3. Una firma monopolista presenta la siguiente funcin de costos cuadrtica:

C = Q + Q + l

La produccin de esta firma no se almacena, por lo tanto, la cantidad pro


ducida Q siempre es igual a la cantidad demandada. Por otra parte, la can
tidad demandada depende tanto del precio P(t) como de la tasa de varia
cin del precio P'(t):

Q = 2 - 2 P ( r ) + P'(t)

La funcin de beneficios del monopolio en el instante t est determina


da del siguiente modo:

n(P,P') = P Q - C

a. Encuentre la trayectoria del precio que maximice los beneficios totales del
monopolio en el intervalo de tiempo [0, 5], tomando en cuenta un precio
inicial de 3 y un precio final de 6. Es decir, resuelva el problema:

Maximizar FI[P] = J ^ (P , P')dt


o
sujeto a P{0) = 3
P(5) = 6

b. Compruebe la condicin de suficiencia.


Clculo de variaciones 93

4. Una mina contiene una cantidad "A de un recurso mineral. La compaa


propietaria de la mina desea determinar el patrn de extraccin del recur
so que maximice el valor presente de sus beneficios descontados a la tasa
p en el intervalo de tiempo (0, T], Considerando que y(t) constituye las
ventas acumuladas del mineral en el perodo t, y'(t) la extraccin en el
perodo t\ y la funcin de beneficios de la compaa es igual a:

?r(y') = I <ftv'

a. Halle la evolucin de las ventas acumuladas y(t), la extraccin del recurso


y'(t) y el tiempo ptimo T para explotar la totalidad del recurso A . En
otras palabras, resuelva el problema:

0
sujeto a y(0) = 0
y(7) = A

b. Demuestre que en el ltimo perodo T , el beneficio promedio de la


compaa iguala al beneficio marginal.

c. Compruebe la condicin de suficiencia.

5. Los ingresos (B) de largo plazo de una firma dependen del stock de capi
tal de la siguiente forma:

B(k) = 50k - k~

Para incrementar el stock de capital, la firma incurre en costos que depen


den de manera cuadrtica de la inversin realizada (i). Asumiendo que la
depreciacin es igual a cero, la inversin equivale a la variacin del stock
de capital (i = k'), con lo cual la funcin de costos sera igual a:

C(k ) - k ~ + 2k

De este modo, la funcin de beneficios queda determinada por:

n(k,k') = B ~ C = 50k - k 2 - k ' 2 - 2 k '


94 Apuntes de Estudio

a. Encuentre la senda del stock de capital que maximice el valor presente de


los beneficios descontados a una tasa de 10 por ciento (p = 0.1) con un
horizonte temporal infinito. Considere un stock inicial de capital de 10
unidades. Resuelva el problema:

Maximizar J
n[A ] = e~'"jt(k,k')dt
o
sujeto a A:(0) = 10

b. Demuestre que en la inversin ptima en el perodo t, (i (t)) es una frac


cin ((3) de la brecha existente entre el stock de capital vigente (k (t)) y el
nivel de capital de largo plazo ( k ):

f( t) = 3 \k - k (t)\ (0 < /3 < 1)

c. Construya un diagrama de fase en el espacio inversin-capital (i - k), a partir


de la ecuacin de Euler obtenida en la seccin (a) y la relacin i = k'.

d. Compruebe la condicin de suficiencia.

6. Suponga una economa cerrada donde existe una poblacin constante


compuesta por L trabajadores, y el consumo per cpita de cada trabaja
dor es c(t). Cada individuo tiene una funcin de utilidad logartmica (U(c)
= Lnc). Adems, un planificador central desea determinar un plan de con
sumo que maximice el flujo de utilidades futuras de la sociedad desconta
das a la tasa 5 :

Maximizar V\c] = j e *LU(c(t))dt


0

En esta economa, la produccin se genera a partir de los insumos capital


(K) y trabajo (L) mediante una funcin de produccin Cobb-Douglas
(F(K,L) = KL Por otro lado, la produccin puede destinarse a con
sumo o a inversin con el fin de incrementar el stock de capital. De esta
forma:

F(K, L) = Lc{t) + K' Dado K(0) = K0


Clculo de variaciones 95

a. Plantee un diagrama de tase que explique la dinmica del consumo y el


capital per cpita en la economa.
b. Halle el valor del consumo, el capital y el producto en trminos per cpi
ta en el estado estacionario.

7. En una economa se desea maximizar el flujo futuro de utilidades de la


sociedad, descontadas a la tasa 5 (5 > 0):

Si se sabe que la sociedad tiene una funcin de utilidad logartm ica


(U (c) = Ln(c)) y que el consumo (c) depende del stock de capital (k) de
acuerdo con la siguiente funcin:

c(t) = rk(t) - k'(t)

Donde r representa la tasa de inters (r > 0).

a. Halle las sendas del consumo (c) y del stock de capital (k) ptimas, con
siderando que el stock inicial del capital es igual a "p y el stock en el
perodo T (T > 0) es igual a cero.

b. Indique el signo de la tasa de crecimiento del consumo si 5 > r. Interprete


el resultado.
96 Apuntes de Estudio

Anexos A

A. Regla de Leibnitz

Dada la integral definida:

F(t,c) ( 1 )

La derivada con respecto a c" (tambin definida como la regla de Leibnitz) es igual

'cdf(cj)
J de

La derivada con respecto a b" es igual a:

| J = / ( '- < - * =/(*<) (3)

Si el lmite superior de la integral dependiera de la variable c":

h-r)
F(t ,c)= J f(e,r)dr (4)

La derivada con respecto a c se obtiene a partir de las propiedades (2) y (3):

clF t) , , dh
-- = - - dt + f(b(c),c) (5)
de J de de

B. Condicin de concavidad de una funcin

Dada una funcin cncava que depende de una sola variable f(x), como la mostrada
en el Grfico A, esta cumple con la condicin:

|) < / ' ( a-,)( jc2 - A',) (1)


Clculo de variaciones 97

En trminos simples, la condicin (1) significa que en toda funcin cncava el seg
mento "AC" siempre ser mayor o igual que el segmento "BC". La condicin (1) es
valida tambin para el caso de dos variables (x e y) o ms:

) - /' t.v,, v,) < J\ t.v,, y, )(aa -,V|) + A,, V])( V, - v,) (2)

Grfico A

Pendiente = f'(,\i)
Ill

Control ptimo

En el captulo anterior se analiz en detalle la resolucin de un tipo especfico


de problema de optimizacin dinmica: el clculo de variaciones. En esta
seccin se desarrollar la teora del control ptimo, mediante la cual pueden
desarrollarse problemas de optimizacin intertemporal ms complejos. El
problema bsico de control ptimo a resolver es el siguiente:

Maximizar ( 1)
o
sujeto a y' = g(t,y,u)
y(0) = Vq(>o dado)
y(T) = yT(yr libre)
u(t) e Q. V? e |0,T]

Tal como se mencion en el primer captulo, en el problema de control pti


mo intervienen bsicamente tres tipos de variables: el tiempo (t), la variable
de estado (y) y la variable de control (u). Algunos ejemplos econmicos de
variables de control y estado podran ser la emisin monetaria y la inflacin,
o el gasto en publicidad y las ventas de una empresa. En estos casos, la pri
mera variable, la de control, est sujeta a la decisin del agente que enfrenta
el problema de optimizacin intertemporal, mientras que la segunda variable,
la de estado, refleja el resultado de las decisiones tomadas sobre la variable
de control.
Control ptimo 99

La trayectoria de la variable de estado se encuentra determinada a travs de la


ecuacin de movimiento o ecuacin de estado, en la cual se relaciona la va
riacin de la variable de estado con respecto al tiempo (y') con las variables
t , y y u a travs de la funcin g(*). Una vez seleccionado el valor pti
mo de la variable de control en un instante del tiempo, la funcin g(*) deter
mina la direccin de crecimiento de la variable de estado y, de este modo, su
trayectoria en el tiempo. De esta manera, cuando el agente optimizador selec
ciona la senda ptima de la variable de control, afecta tanto de manera directa
el funcional objetivo mediante la variable u, como de manera indirecta a
travs de la variable y, que se encuentra definida por la ecuacin de movi
miento.

Por otra parte, en el problema (1) se considera un valor libre de y(T). Esta
caracterstica se debe a que en la derivacin de la condicin de primer orden
del problema de control ptimo, se hace referencia a sendas de control facti
bles, similares a las empleadas en la demostracin de la ecuacin de Euler. A
travs de la ecuacin de movimiento, cada senda de control factible posee una
correspondiente trayectoria factible de la variable de estado. En este sentido,
si el problema tuviera un valor terminal y(T) = y r dado, las sendas de control
factibles no seran arbitrarias, sino que estaran predeterminadas para que sa
tisfagan el valor terminal de la variable de estado. De este modo, un valor
terminal libre permite derivar la condicin de primer orden del problema de
control ptimo.

Con respecto a la variable de control, sta se encuentra restringida al conjunto


2, que por lo general es un conjunto compacto y convexo. Esta restriccin
abre la posibilidad de que existan soluciones de esquina en el problema de
optimizacin, a diferencia de los problemas de clculo de variaciones, en los
cuales slo se admiten soluciones interiores. En algunos problemas no se es
tablecen restricciones a la senda de control (2 = ]-, o[), por lo que se omite
la condicin u(t) e 2-

Una de las ventajas que presenta la tcnica de control ptimo, es que no re


quiere necesariamente la continuidad y diferenciabilidad de las sendas de las
variables de control y de estado en todo el horizonte de tiempo [0, TJ. Para el
caso de la senda ptima de control, basta con que se sea continua por tramos
o piecewise continuous. Este requisito implica que la trayectoria de la varia
ble de control puede presentar un nmero determinado de puntos con discon
tinuidades, siempre y cuando en dichos puntos no tome un valor infinito. Un
100 Apuntes de Estudio

ejemplo de ello puede observarse en el Grfico No. 3.1 (a), donde la variable
de control es discontinua en los instantes t y ti. En el caso de la trayectoria
de la variable de estado, al menos se requiere que sea continua y diferenciable
por tramos o piecewise differentiable. Ello significa que la senda de la varia
ble de estado puede contener puntos en los cuales no sea diferenciable con res
pecto al tiempo. Grficamente, ello implica que la trayectoria presenta puntos
con esquinas, tal como se muestra en el Grfico No. 3.1 (b).

Grfico No. 3.1

En los Grficos No. 3.1 (a) y 3.1 (b), los instantes ti y ti en los cuales se pre
sentan discontinuidades en la variable de control coinciden exactamente con
aquellos en los cuales la variable de estado presenta esquinas. Esta coinci
dencia se debe a la forma cmo se obtiene la variable de estado. En este caso
en particular, una vez determinada la senda de control ptima en el intervalo
[0, t[, mediante la ecuacin de movimiento y la condicin inicial y(0) = yo, es
posible hallar la evolucin de la variable de estado para el mismo intervalo de
tiempo. Para el segundo intervalo [ti, t2L, nuevamente se puede hallar la tra
yectoria de la variable de control y para determinar la evolucin de la varia
ble de estado, necesitamos la ecuacin de movimiento y una condicin inicial.
La condicin inicial relevante es el valor terminal de la senda de la variable
de estado del primer tramo. Para los sucesivos puntos de discontinuidad de la
Control ptimo 101

variable de control se realiza el mismo procedimiento, de tal forma que se


asegura la continuidad de la variable de estado.

El presente captulo se encuentra compuesto por cinco partes. En la primera


se deriva la condicin de primer orden al problema de control ptimo, tam
bin conocido como principio del mximo. En la segunda, se explican las
condiciones de transversalidad para resolver el problema de control ptimo
cuando se establecen condiciones alternativas para el valor final de la variable
de estado. En la tercera seccin, se revisan las condiciones de suficiencia del
problema de control ptimo. En la cuarta, se compara las similitudes existen
tes entre el problema de control ptimo y el del clculo de variaciones, y se
explica cmo este ltimo constituye un caso especial de control ptimo. Fi
nalmente, en la ltima seccin, se desarrolla el problema de control ptimo
para el caso de un horizonte temporal infinito.

1. Condicin de primer orden: principio del mximo

As como el clculo de variaciones presenta una similitud con la optimizacin


esttica sin restricciones, el control ptimo vendra a ser equivalente a un
problema de optimizacin esttica sujeta a restricciones. En dicho caso, el
problema puede resolverse mediante el mtodo de los multiplicadores de La
grange. A partir de la funcin objetivo, la restriccin y una variable auxiliar
X, conocida como multiplicador de Lagrange, se conforma una nueva funcin,
denominada Lagrangiana. Los valores que resuelven el problema se determi
nan a partir de la optimizacin de esta funcin.

De igual forma, en el control ptimo, a partir de la funcin intermedia f(t, y,


u), la ecuacin de movimiento y ' = g(t, y, u) y una variable auxiliar A(t), de
nominada variable de coestado, se determina la funcin Hamiltoniana del si
guiente modo:

H(t, y ,, A) = / ( / , y, u) + Mt)g(t, y , u) (2)

Para determinar la senda de las variables de control y estado que resuelven el


problema, a partir de la funcin Hamiltoniana se emplea una condicin de
primer orden, denominada principio del mximo. A continuacin, se deri
varn las condiciones del principio del mximo y se desarrollarn algunas
aplicaciones.
102 Apuntes de Estudio

1.1 El principio del mximo

Las sendas u (t), y (t) y A. (t) resuelven el problema (1) si satisfacen las con
diciones del principio del mximo establecidas para la funcin Hamiltoniana
( 2 ):

a. Max fl (t, y,u,) sujeto a u(t)eQ. (3)

dll
b. y
dk

l
c. A' =
dy
C
d. UT)= 0

La primera condicin establece que el Hamiltoniano debe ser maximizado


con respecto a la variable de control, sujeto a la restriccin dada por el con
junto Q. La maximizacin del Hamiltoniano puede brindar bsicamente dos
tipos de soluciones: una solucin al interior del conjunto Q. o una solucin en
el contorno. Asumiendo que el conjunto de control es igual a Q = [ui, U2] (ui,
U2 R) y que H es una funcin que depende de manera no lineal de u, en
tonces nos encontraramos en una situacin como la presentada en la parte (a)
del Grfico No. 3.2. En este caso, para maximizar H, en el punto A se debe
cumplir que la primera derivada con respecto a la variable de control sea
igual a cero y que el Hamiltoniano sea cncavo con respecto a u QH/3u =
0; 3H/3u < 0). Por otra parte, con el mismo conjunto Q, si H dependiera li
nealmente de la variable de control, la primera derivada nunca se hara igual a
cero. En este caso, la maximizacin dara una solucin de esquina, tal como
se ilustra en la parte (b) del Grfico No. 3.2 QH/)u > 0).

La segunda condicin constituye la ecuacin de movimiento de la variable de


estado. La tercera condicin representa la ecuacin de movimiento de la va
riable de coestado. Estas dos ecuaciones, simultneamente, se denominan sis
tema cannico o sistema Hamiltoniano. Finalmente, la cuarta condicin
consiste en la condicin de transversal idad para el problema de control pti
mo, cuando el valor terminal de la variable de estado es libre.
Control ptimo 103

Grfico No. 3.2

Como regla prctica, para determinar la solucin al problema (1) se pueden


seguir los siguientes pasos:

1) Resolver la condicin (a) del principio del mximo y, si es posible, expre


sar u en funcin de t, X" e y.

2) Plantear el sistem a de ecuaciones diferenciales ordinarias de primer


orden para la variable de estado y coestado, a partir de las condicio
nes (b) y (c) del principio del mximo. Si en este sistema apareciera la
variable de control, debe reem plazarse por la expresin hallada en el
prim er paso.

3) Resolver el sistema de ecuaciones diferenciales considerando las constan


tes y(0) = yo y A(T) = 0.

4) Expresar u, X e y como funciones del tiempo.

A continuacin se derivarn las condiciones del principio del mximo para el


caso en el cual el Hamiltoniano presenta una solucin interior, y la variable
de control no se encuentra restringida.
Control ptimo 105

Para verificar que solamente las sendas ptimas u (t), y (t) y X (t) satisfacen
las condiciones del principio del mximo, en primer lugar, debemos construir
sendas factibles de la variable de control que sean prximas a la trayectoria
ptima u (t). As, para formar las sendas factibles de u(t) empleamos una sen
da auxiliar z(t) y un nmero 0 arbitrariamente pequeo:

u(t) = u (/) + 6 z(t) (10)

Por otra parte, dada una senda factible de la variable de control, mediante la
ecuacin de movimiento se determina la respectiva trayectoria factible de la
variable de estado. Sin prdida de generalidad, podemos definir a la variable
de estado factible del siguiente modo:

y{t) = y {t) + 6h(t) (11)

Donde h(t) representa otra senda auxiliar. Finalmente, si T e yr fueran libres,


podran definirse valores factibles de estas variables de la siguiente forma:

r= T*+ 0 A T (12)

yj yj O A vy ( 13)

De manera similar al caso de clculo de variaciones, elaboramos una funcin


D(0) conformada por la diferencia entre el valor subptimo del funcional W y
el valor ptimo W :

D(0) = W (, y, u, A )-V V (f, y , u*,X) (14)

r'+ow
D iQ ) = j{ H ( t , y + 6 h (t),u * + & ( t), ) + X [y * + 6 it ) ] } d t - M T + Q \ T){y* +QAvy]
0
r
+/l(0)_y0 -{[//(? , y\ u\ X ) +Xy] +A(0)y0
0
106 Apuntes de Estudio

En vista de que W es el valor mximo del funcional, la funcin D(0) siempre


tendr un valor no positivo, y alcanzar su mximo cuando 0 = 0. De este
modo, para maximizar la funcin D(0), se debe cumplir que D '(0) = 0. Em
pleando la regla de Leibnitz, la primera derivada de la funcin sera igual a:

r"+0&i , I

D\0)=
Jo
/!(/) +
du
z(t) + A7i(')U +[// + Av],-r &T-MT)Av, -?.'(T)y,AT (15)
i Ov
i

En la expresin (15) se elimin el trmino A.(0)yo debido a que es una cons


tante. Por otro lado, tomando en cuenta la siguiente igualdad:

UV],=rAr = A/(7')>rA7' (16)

simplificamos el segundo y cuarto elemento de la expresin (15), y plantea


mos la condicin de maximizacin D (0) = 0:

'ATi
dH
D + A |h(t) + z.(l) U+ [H)^T.bT* A(r*)Ayr . =0 (17)
dy du

Considerando que en el problema (1) el tiempo se encuentra predeterminado,


en la expresin (17) se cumple que AT = 0 y, por lo tanto, [H]t=rAT = 0. Para
que la condicin de maximizacin se satisfaga para las sendas ptimas y (t),
u (t) y X (t), y para cualesquiera sendas auxiliares h(t) y z(t), cada uno de los
elementos de la integral debe ser igual a cero:

dH n (18)
+ =0
dv
dl_
= 0
du

Por otra parte, como el valor terminal de las sendas de estado se encuentra
libre, AyT podra tomar cualquier valor. De este modo, para asegurar que se
cumpla la condicin de optimizacin, se debe satisfacer la condicin de
transversalidad:

X(T) = 0 (19)
Control ptimo 107

Por ltimo, en la derivacin se ha supuesto que la ecuacin de movimiento se


cumple en todo el perodo de la optimizacin t e [0,T|:

y' = g ( t , y , u ) (20)

Para que la condicin (17) se cumpla, deben verificarse necesariamente (18),


Xi2)-y (20), que constituyen las condiciones del principio del mximo.

A continuacin se desarrollarn tres aplicaciones de control ptimo, en las cuales


se explica la metodologa tanto en la resolucin de problemas que presentan solu
ciones de esquina como en aquellos que presentan soluciones interiores.

Ejemplo 1.- Halle las trayectorias y (t), u(t) y X (t) que resuelvan el problema:
i
Maximum V = J (y + u)dt
o
sujeto a y' = l- M 2
y(0) = 1

El primer paso para desarrollar el problema de control ptimo consiste en


formar la funcin Hamiltoniana:

H{t,y,u,X) = y + M + / l ( l - < 2)

En segundo lugar, debemos maximizar la funcin Hamiltoniana con respecto


a la variable de control. Para ello es necesario verificar si el Hamiltoniano es
o no una funcin lineal de la variable de control. Si fuera no lineal, la solu
cin sera interior; en caso contrario, nos enfrentaramos a un problema con
una solucin de esquina. En este problema, el Hamiltoniano presenta una va
riable de control elevada al cuadrado, por lo que podemos emplear las condi
ciones clsicas de maximizacin:

dll
- 2 A;/ = 0
du

d2l/
-2A < 0
du2
108 Apuntes de Estudio

A partir de esta maximizacin del Hamiltoniano, puede obtenerse la variable


de control en funcin de la variable de coestado: u (t) = 1/2- En segundo lu
gar, planteamos las ecuaciones de movimiento para las variables de estado y
coestado:

dH
y
al

dH
x
dy

Ambas ecuaciones de movimiento forman un sistema de ecuaciones diferen


ciales no lineales de primer orden. Con el fin de simplificar la resolucin del
problema, se resolver cada ecuacin de manera separada. Primero se puede
resolver la ecuacin de movimiento de la variable de coestado, mediante la
integracin de ambos lados de la ecuacin:

jdA = j-dt

A\t) = - t + H l

Para hallar la constante de integracin, evaluamos la senda ptima de la va


riable de coestado en la condicin de transversalidad del principio del mxi
mo, con lo cual obtendramos:

*(t)=~t + l (21)

Esta trayectoria ptima de la variable de coestado toma un valor comprendido


en el intervalo 0 < A < 1 para el intervalo de tiempo t e [0, 1], el cual permite
satisfacer la condicin de segundo orden de la maximizacin del Hamiltonia
no con respecto a la variable de control. La trayectoria de control ptima
vendra dada por:1

1
( 22)
(0 = ^ 2 (1 -0
Control ptimo 109

Para hallar la senda de la variable de estado tenemos que reemplazar la varia


ble de control en la ecuacin de movimiento:

y' = 1 - u 2 = 1 ---------------
4 (l-r> -

Esta ecuacin diferencial se resuelve integrando ambos lados de la ecuacin y


empleando la condicin inicial y(0i = 1. con io cual llegaramos ai siguiente
resultado:

v (o = t ----------- (23)
4(1-0 4

De este modo, las sendas de (21), (22) y (23) cumplen con las condiciones del
principio del mximo y resuelven el problema propuesto.

Ejemplo 2.- H alle las trayectorias y (t), u (t) y X (t) que resuelvan el
problema:

Maximizar V = j 3ydt
0
sujeto a y = y+ u
y(0) = 5
*#(/) e [0,2]

La funcin Hamiltoniana del problema es la siguiente:

H(t, y,u. A) = 3y + A(y + u) = (3y + Ay) + Ah

En este caso, la funcin depende de manera lineal de la variable de control, lo


que indica que la variable de control ptima se ubicar en la frontera del con
junto Q. La maximizacin del Hamiltoniano puede arrojar dos posibles resul
tados. Si X > 0, entonces es una funcin creciente de la variable de control,
por lo que el valor ptimo sera u (t) = 2. Por el contrario, si X<0, el Hamilto
niano sera una funcin decreciente de u y tomara el valor ptimo u (t) = 0.
Ambos casos se ilustran en el Grfico No. 3.3.
110 Apuntes de Estudio

Grfico No. 3.3

De esta forma, para hallar la senda de control ptima, debe determinarse en


cul de los dos casos anteriores se encuentra la variable de coestado del pro
blema. La trayectoria de la variable de coestado puede obtenerse a partir de la
siguiente ecuacin de movimiento:

3 -a
dy

Resolviendo esta ecuacin diferencial y empleando la condicin de trans-


versalidad A(4) = 0, llegamos a la siguiente trayectoria para la variable de
coestado:

A*(r) = 3e4 ' - 3 (24)

La senda ptima de la variable de coestado es exponencialmente decreciente


y toma valores positivos en todo el intervalo t e [0, 4]; por consiguiente, nos
encontraremos en el primer caso (A. > 0) y el control ptimo ser:

u* (t) = 2 (25)
Control ptimo 1I 1

La trayectoria de la variable de estado puede obtenerse mediante la ecuacin


de movimiento y reemplazando la variable de control u (t) = 2:

, i)II
y = - = y +u = y + 2
<JA

Con la condicin inicial y(0) = 5, la solucin de la ecuacin diferencial


sera:

y (r) = l e' - 2 (26)

En este ejemplo, las sendas ptimas en (24), (25) y (26) satisfacen las condicio
nes del principio del mximo y resuelven el problema propuesto.

E jem plo 3.- Halle las trayectorias y (t), u (t) y X (t) que resuelvan el problema:

5
Maximizar V = j (uy - u 2 - y 2 )dt
i
sujeto a = v +u
,V(1) = 2

La funcin Hamiltoniana del problema es la siguiente:

II (?, y, t/, A) = uy - ir - y~ + A(y + u)

Tal como se observa, la funcin Hamiltoniana depende de manera no lineal


de u ; por tanto, la solucin al problema es interior y debe satisfacer las si
guientes condiciones:

i)H
y - 2h + A = 0
ihi

d]H
= -2 < 0
du{
112 Apuntes de [estudio

A partir de esta condicin de maximizacin. expresamos la variable de con


trol en funcin del resto de variables: u = (X + y)/2. Las ecuaciones de movi
miento de las variables de estado y coestado son:

. '<)/!
\ = = V + II

<) \

Reemplazando la variable de control u = ( a + y)/2 en el sistema cannico, ob


tenemos el siguiente sistema de ecuaciones diferenciales de primer orden:

A+
v = v+

A' = - A + V + 2 v - A
?

Para resolver este sistema de ecuaciones diferenciales, resulta conveniente


expresarlo matricialmente de la siguiente forma:

f-3/2 -1/2' y 'o '


Lp o '1 +|
ijy. |-3/2 3/2 A L

Con las condiciones A(5) = 0 e y(l) = 2.

La solucin general del problema viene dada por:

*
y (0 = G)ev +G2c r- 'y
+ (27)
H / ' ' + H 2eriJ K

La integral particular del sistema de ecuaciones est dada por:

'o'
K 0
Control ptimo 113

Las races caractersticas se obtienen a partir del siguiente determinante:

r1 o-
r+
"-3/2 - 1 / 2 ]
|_0 1_ -3/2 3/2 J
que forma la siguiente ecuacin caracterstica:

r1 - 3 = 0

Para n = V3 se puede obtener la relacin existente entre Gi y Hi:

-312 + f i - 1/2 G>' = 0


-3/2 3 / 2 + V3 . 1.

//, = G,( 2 ^ 3 - 3 )

Del mismo modo, para r2=-V3 se obtiene la relacin entre G2 y H2:

-3 /2 -V J -1/2 ' c 2'


-3 /2 3/2-V 3 . " 2 .

12 = C 2(- 2-73-3)

Una solucin ms simplificada de (27), que incorpore las relaciones existentes


entre los coeficientes H y G (i = 1,2) y la integral particular, es la siguiente:

Veo (28)
A*(O

Los valores de Gi y G2 se obtienen al evaluar la sendas ptimas de la variable


de estado y coestado en los puntos \ ( 5) = 0 e y (l) = 2. A partir de esos pun
tos se obtiene el siguiente sistema de ecuaciones:

A(5) = G, (2-V3 - 3)e5/3 + G2(-2^3 - 3)e~^ = 0

y ( l ) = G le ' / 3 + G 2U ' /5 = 2
114 Apuntes de Estudio

Resolver este sistema de ecuaciones arroja como resultado aproximado las


constantes Gi = 4,73 y G j= 11,30, por lo que las sendas ptimas de las varia
bles de estado, coestado y control quedaran definidas del siguiente modo:

y* (0 = 4 ,7 3 ^ ' + 11.30c ;'

X*(t) = 4,73(2-73 - 3 ) c ^ ' + 1l,30(-2yf3 - 3)c~^'

, A + y 9,46(73 - l)e ^ ' - 22.60(73 +


a (t ) - - ----- = ------ - - ..--- - - -

1.2 Aplicacin: nivel ptimo de contaminacin1

Suponga una economa que produce una cantidad C(t) de un bien de consu
mo, y esta produccin se elabora a partir de una cantidad L(t) de trabajo, de
acuerdo con la siguiente funcin:

C(t)=aL(t) ( a > 0)

Por otra parte, la evolucin del stock de polucin P(t) en la economa se


determina a partir de la siguiente ecuacin de movimiento:

p'(t) = c 1( t ) - YP(t) (y > 0)

Esta ecuacin diferencial indica que un incremento del consumo afecta posi
tivamente el nivel de contaminacin, y que la contaminacin presenta una ta
sa natural de eliminacin igual a y.

Por otra parte, el bienestar de la sociedad es una funcin del consumo, el es


fuerzo y la contaminacin:

U = L n C - p -0P

1. E sta a p lic a c i n fue to m a d a de L eo n ard . D an iel y N g o V a n L ong. O ptim al C ontrol T h e o


r y a n d S t a t i c O p t i m i z a t i o n in e c o n o m i c s , C a m b r i d g e : C a m b r i d g e U n i v e r s i t y P r e s s . 1 9 9 3 . p p .
2 2 4 - 2 2 6 . El p r o b le m a se b a s a en el a rtc u lo e s c r ito p o r F o rste r. B r u c e A .. " O n a O n e S ta te V a
ria b le O p t i m a l C o n tr o l P ro b le m : C o n s u m p ti o n - P o ll u ti o n T r a d e - O ff s " , e n F o rster. B r u c e A ., Ap
p l i c a t i o n s o f C o n t r o l T h e o r y to E c o n o m i c A n a l y s i s , A m s t e r d a m : N o r t h H o l l a n d . 1 9 7 7 .
Control ptimo 115

En la funcin de utilidad, el consumo incrementa el nivel de bienestar, mien


tras que el trabajo y la contaminacin lo disminuyen.

Si consideramos que la sociedad descuenta las utilidades futuras a la tasa p, y


reemplazamos la condicin C = otL en la funcin de utilidad, el problema de
control ptimo se resumira de la siguiente manera:

M a xim iea r V =f LnC C 2 - OP


0 a2

sujeto a P ' = C 1 - yP
/>(0) = 1
/ ( '/') = PT ( P T libre )

En este problema, la variable de control viene dada por el consumo (C),


mientras que la variable de estado est representada por el stock de polucin
(P). La funcin Hamiltoniana es la siguiente:

ll(t.C .P .X ) = (L nC - C l -0 P )e + M C '- y P )
a

Para maximizar el Hamiltoniano, debe cumplirse las condiciones de optimi


zacin2:

di! 1
e-P> +2AC=0
'dC c.

D// f J 2/3
"dcT '[ c 2
e-f +2A<0
a2

Despejando la condicin de primer orden obtenemos la siguiente expresin


para el consumo:

2 P
- 2 X e <*
a2

2. P o s t e r i o r m e n t e s e d e m u e s t r a q u e la v a r i a b l e d e c o e s t a d o e s n o p o s i t i v a e n e l p e r o d o d e

o p t i m i z a c i n , c o n lo c u a l la c o n d i c i n d e s e g u n d o o r d e n d e la m a x i m i z a c i n s e c u m p l e .
116 Apuntes de Estudio

El sistema Hamiltoniano del problema viene dado por el siguiente par de


ecuaciones de movimiento:

r , L ,c - r
JA

A '= + yk
P

La ecuacin de movimiento de la variable de coestado constituye una ecua


cin diferencial de primer orden, que puede ser resuelta de manera indepen
diente. La solucin general de esta variable es la siguiente:

X{t) = He1' ----- e'1*


P +Y

Para hallar la constante Hi, basta con aplicar la condicin de transversalidad:

0
X(T) = H / ' -- e"T = 0
P+Y

Resolviendo la ecuacin anterior obtenemos Hi en funcin de todos los parmetros


del problema, con lo cual llegamos a las variables de coestado y control ptimas:

6 (29)
X ( t ) = - " e p' [ e - ' p+r)tT-n 1]
P +Y

2 B 20 t Xi (30)
C *(f) = + -------(i _ e(p+7)(f-r))
a 2 p+y

Este problema de optimizacin intertemporal da como resultado una variable


de coestado no positiva en todo el horizonte temporal3. Dado que esta varia
ble se interpreta como el precio sombra del stock de polucin, es razonable
que tome un valor no positivo. Ello implica que el incremento de una unidad
adicional de polucin disminuye el valor del funcional objetivo, compuesto
por la agregacin de las utilidades futuras descontadas.

3. E llo p u e d e ser c o m p r o b a d o p o r el lector, y a q u e el s e g u n d o t r m in o e x p o n e n c ia l s ie m p re


e s i n fe r io r a la u n i d a d , c o n lo c u a l la v a ria b le d e c o e s t a d o s e ria n o p o s itiv a .
Control ptimo 117

La senda del stock de polucin puede obtenerse reemplazando la senda pti


ma de consumo en la ecuacin de movimiento:

l t 70 (| )) yP
P' = e (p+yXl-T
2 p +y

Esta ecuacin diferencial se resuelve mediante mtodos numricos, por lo cual


no se derivar una solucin exacta. En su lugar, se esbozar una solucin gen
rica de la trayectoria de la contaminacin. Para ello se traslada al lado izquierdo
de la ecuacin el trmino yP y se multiplica toda la expresin por e71:

e* - +-~ (l - e ( P+YW- T ) ) = e*( P'- yP) = d (Pe*)


a1 p +y dt

Si integramos esta expresin entre 0 y t, y empleamos como variable auxi


liar x, obtendramos finalmente la siguiente expresin para el stock de con
taminacin:

-1
'2/3 + 2 0 _ (p+y)( T- r , j
l+jen dr (31)
0 a 2 P + y ' _

2. C o n d ici n de tra n sv ersa lid a d

El problema base de control ptimo (1) puede ser modificado asumiendo un


valor final de la variable de estado determinado (yx, T fijo), un horizonte de
tiempo indeterminado (T libre), o un valor final de la variable de estado que
dependa del tiempo (curva terminal yx= <j>(T)). Para resolver el problema de
control ptimo en estos tres casos, es necesario contar con condiciones de
transversalidad distintas a las establecidas en el principio del mximo (3). La
condicin de transversalidad genrica para estos tres casos puede obtenerse a
partir de los dos ltimos trminos de la ecuacin (17):

[H]l=TA T - M T ) b y r = 0 (32)

A continuacin se explican las condiciones de transversalidad especficas pa


ra los tres casos anteriores.
118 Apuntes de Estudio

2.1 Casos especiales de la condicin de transversalidad

Caso 1.- Valor terminal y horizonte temporal fijo

Cuando el valor terminal de la variable de estado y el horizonte temporal se


encuentran prefijados, se cumple que sus diferencias Ayx y AT son iguales
a cero; por lo tanto. (28) se satisface automticamente. En este sentido, pa
ra determ inar la solucin del problema de control ptimo, basta emplear la
condicin;

y(T)=yT (T, y T dado) (33)

Ejemplo.- Halle las trayectorias y (t), u (t) y X (t) que resuelvan el problema:

Tr u\-o
Maxi mi zar V = j ------- (0e]O ,l[)
o 1 -0
sujeto a y' = - y - u
y( 0) = 2
>-(!) = 1

La funcin Hamiltoniana del problema sera la siguiente:

H (t , y , u, X) ------ + A (-y - m)
1 -0

En esta caso, el Hamiltoniano constituye una funcin no lineal, por lo cual


pueden emplearse las condiciones de optimizacin tradicionales:

dH
-A = 0
du

d 2H
= -du <0
du2
Control ptimo 119

A partir de la condicin de maximizacin puede expresarse la variable de


control ptima en funcin de la variable de coestado: u (t) = X U- Posterior
mente, se pueden plantear las ecuaciones de movimiento para las variables de
estado y coestado:

, dH
y = ---- = y u
dX

x -J J L .x
dy

Al reem plazar la variable de control ptima en la ecuacin de movimiento


de la variable de estado, las dos ecuaciones anteriores constituiran un sis
tema de ecuaciones diferenciales no lineales de primer orden. Para obtener
las trayectorias ptimas de una manera simplificada, resulta conveniente
resolver independientemente cada ecuacin de movimiento. La senda pti
ma de la variable de coestado est dada por la solucin de su ecuacin de
movimiento:

X*(t) = H e> (34)

A partir de (34) es posible obtener la senda ptima de la variable de control:

-1 -I J
u*(t) = {X*(t)) a = ( H ie>) H = H ~ e 0 (35)

La senda ptima de la variable de estado puede hallarse reemplazando la va


riable de control en la ecuacin de movimiento:

y = - y - //, "e

La solucin general de la ecuacin diferencial es la siguiente:

i i
0
y (t) = H 2e~ + ------ H, e 0 (36)
1-0
120 Apuntes de Estudio

Las constantes Hi y FL del problema pueden obtenerse a partir de la condi


cin inicial y terminal de la variable de estado:

y (0) = H 1 +- ^ - H " =2
1 C7

y'(l) = H ,e - V" =1
1-0

Este sistema de ecuaciones tiene como solucin los siguientes valores:


is

" l-2er' 1
es
i

1
0J L

Estas dos constantes junto con las sendas (34), (35) y (36), determinan la so
lucin al problema de control ptimo.

Caso 2.- Valor terminal fijo

En este caso, como el valor terminal de la variable de estado es constante, se


cumple que su primera diferencia Ay r es igual a cero. En este sentido, para
que se satisfaga la condicin (32) independientemente del valor que tome la
diferencia del horizonte de tiempo AT, debe cumplirse:

[tf ],= 7 = 0 (37)

Es decir, el Hamiltoniano debe ser igual a cero en el ltimo perodo. Este ca


so es similar al analizado en el clculo de variaciones, y la representacin del
problema es la misma a la presentada en el Grfico No. 2.7.
Control ptimo 121

Ejemplo.- Halle las trayectorias y*(t), u*(t) y A*(t) que resuelvan el problema:
i
M a xim izn r V = J"( - ' - u t)dt
o
sujeto a y ' = it

y(0) = I
v ( T ) = 5 (T lib re)

La funcin Hamiltoniana del problema est dada por:

H (/, y,,A) = ~u- - u t + Au

Aplicando las condiciones del principio del mximo, optimizamos la funcin


Hamiltoniana con respecto a la variable de control:

d/l
= -2 - 1+ A = 0
du

d 2H
2< 0
du2

Simplificando la condicin de primer orden podemos expresar la variable de


control en funcin de la variable de coestado y el tiempo: u*(t) (X - t)/2.
Posteriormente, obtenemos el sistema cannico dado por las ecuaciones de
movimiento de las variables de estado y coestado:

, 3H
v = =u
' i)A

dH
= 0
dv

Integrando ambos lados de la ecuacin de movimiento de la variable de coes


tado obtenemos su trayectoria ptima, que en este caso es una constante:

W 0dt (38)

A*(/) = //,
122 Apuntes de Estudio

Reemplazando esta solucin en la variable de control, obtenemos la siguiente


senda ptima:

(39)

La senda de la variable de coestado puede obtenerse a partir de (39) y la res


pectiva ecuacin de movimiento:

(40)

. 1 , H,
v (/) = - r + -1 + //,
4 2

Para hallar las constantes Hi y H2 del problema, debemos emplear tres condi
ciones. La primera se obtiene al evaluar la variable de estado y (t) en el punto
inicial; la segunda, al evaluar la misma variable en el punto final (con el hori
zonte de tiempo desconocido); y la tercera est dada por la condicin de
transversalidad [H |1=t= 0. A partir de la primera condicin y(0) = 1 se obtie
ne el valor de la constante Lp:

y(0) = H , =1

Por otra parte, la condicin de transversalidad brinda la siguiente relacin:

\H\__r = - u ( T f - u ( T ) T + X ( T ) u ( T ) = 0

Esta condicin, junto con la senda ptima de control u*(t) = (X - t)/2, se redu
ce a la ecuacin u"(T) = 0 o u(T) = 0. Empleando (39), planteamos dicha
condicin:

U(T) = 0
2 ?

//, = T
Control ptimo 123

Finalmente, al evaluar a la variable de estado en el punto final y empleando la


condicin H| = T, obtenemos la siguiente ecuacin cuadrtica:

v(T) = ~ - T 2+ ^ T + 1 = 5
4 2

v(7') = - - r 2+ - r - + i = 5
4 2

Las races de esta ecuacin son los valores T = 4, como el valor T = -4 no es


relevante, el horizonte de tiempo que resuelve el problema serta T = 4. De
este modo, a partir de (38), (39) y (40) junto con las constantes Hi = 4 y U2-
1, se obtendran las trayectorias ptimas del problema de control ptimo:

v ' ( ! ) = - - r + 2 / +1
4

u(t) = - t +2
2

X(t) = 4

Caso 3.- Curva terminal

En este ltimo caso, el valor terminal de la variable de estado depende del


horizonte de tiempo a travs de la funcin yT = <j)(T). Aplicando diferencias,
obtenemos una condicin que relaciona la variacin del horizonte temporal
AT con la variacin del valor terminal Ay-p: Ay-r = <J>'(T)AT. Reemplazando
esta condicin en (32) obtenemos:

[H]i=l.AT - (T)()'(T)AT = [H-<>X, AT = 0

Para un valor arbitrario de AT, bastar que se cumpla la condicin de trans-


versalidad:

IH-A<>),=t =0 (4 1 )
124 Apuntes de Estudio

Este problema es similar al desarrollado mediante el clculo de variaciones, y


la representacin de la condicin de transversalidad se muestra en el Grfico
No. 2.8.

Ejemplo.- Halle la senda con menor distancia entre el origen y la curva y(t)
= 10 - t2.

Este es un problema de minimizacin de la distancia, el cual ha sido desarro


llado en el captulo anterior mediante el clculo de variaciones. La resolucin
mediante el control ptimo no implica mayores dificultades. El planteamiento
del problema es el siguiente4*:

Maximizar V = J - V T + k7*
0
sujeto a y =u
}(0) = 0
y(T) = 1 0 - E 2

El Hamiltoniano del problema est dado por:

H( t, y , u , ) = <Jl + u 2 +u

Como la funcin Hamiltoniana es no lineal con respecto a la variable de con


trol, entonces se aplican las condiciones de maximizacin:

()]]
---- . 2 u + A 0
du 2 7(1 + r )

d 2H
-(1 + U 2) 1 <0
du2

4. Si se reem p lazara la e c u a c i n d e m o v i m i e n t o y ' = u e n la f u n c i n i n t e r m e d i a , o b t e n


d ra m o s el p la n te a m ie n to d e u n p ro b le m a d e c lc u lo d e v aria c io n e s.
Control ptimo 125

A partir de la maximizacin del Hamiltoniano se obtiene la siguiente expre


sin para la variable de control: u*(t) = a/ ( 1 - A2)' "- Las ecuaciones de mo
vimiento para las variables de estado y coestado vienen dadas por:

, _ dH_ _ ^

dH
X -
ck

Integrando ambos lados de la segunda ecuacin de movimiento, obtenemos


que la variable de coestado es igual a una constante:

A* (0 = // (42)

Reemplazando (42) en la variable de control, obtenemos lo siguiente:

" i
u*(t) (43)

A partir de (43) y la primera ecuacin de movimiento, se puede obtener la


senda ptima de la variable de estado:

v*(0 t + //1 (44)

Al igual que en el caso anterior, para hallar las constantes Mi y IL del pro
blema, es necesario emplear tres condiciones: la variable de estado evaluada
en el punto inicial, la variable de estado evaluada en el punto final (con el
tiempo y el valor terminal desconocido) y la condicin de transversalidad. La
variable de estado en el punto inicial cumple con la condicin:
126 Apuntes de Estudio

Aplicando la condicin de transversalidad (41) con la curva terminal 0(T) =


10 - T 2, obtenemos la condicin:

lW - A f U l + - ^ _ + , H' ... - + 277/, = 0


l-H ;

Simplificando la condicin de transversalidad llegamos a la siguiente relacin:

f, _ 1

Finalmente, reemplazando la relacin anterior en el valor terminal de la va


riable de estado, obtenemos una ecuacin cuadrtica:

H I 1
y(T) = , ' t = 7 =- =io -r
2T 2

Las soluciones de la ecuacin cuadrtica son: T = -j3S/2. En este caso, el


valor negativo queda descartado y el horizonte de tiempo estara dado por T
= \/38/2 . Empleando este resultado obtenemos las trayectorias ptimas que
resuelven el problema:

y\t)

u\t)

X{t ) =
Control ptimo 127

2.2 Aplicacin: asignacin de consumo y ahorro5

La asignacin de consumo y ahorro de un agente puede ser formulada de una


manera sencilla, en un problema de optimizacin intertemporal. Considere
mos un individuo que vive T aos, a lo largo de los cuales percibe una re
muneracin igual a w , gana una tasa de inters r sobre sus ahorros, y paga
sus deudas a la misma tasa. Dado una senda del nivel de consumo (C) a lo
largo del tiempo, sus ahorros (S) evolucionan de acuerdo con la siguiente
ecuacin:

S '= w + rS -C

Esta ecuacin de movimiento determina la evolucin de los ahorros a lo largo


del tiempo. En trminos sencillos, sta establece que la diferencia entre los
ingresos (w + rS) y el consumo (C) determina la variacin del ahorro. Por
otra parte, este agente no ha recibido herencia alguna y piensa consumir toda
su riqueza a lo largo de su vida:

5 (0) = 5(7") = 0

Por ltimo, el individuo presenta la siguiente funcin de utilidad intertemporal:

U = J Ln(C)e dt

El problema que debe resolver el agente, para determinar las trayectorias p


timas del consumo (variable de control) y el ahorro (variable de estado), es el
siguiente:

Maximizar

sujeto a S' = vc + rS - C
S( 0 ) = 0

5(7) =0

5. E sta a p lic a c i n fu e t o m a d a d e D ixit, A v in a s h . O p t i m i z a t i o n in E c o n o m i c T h e o r y , O x


ford: O x f o r d U n iv e rs ity P ress, 1 9 9 3 , p p . 1 5 4 - 1 5 5 .
128 Apuntes de Estudio

La funcin Hamiltoniana del problema es la siguiente:

H (t , v, ii, A) = Ln(C)e '' + A(vv + rS - C)

Como la funcin es no lineal con respecto al consumo, aplicamos las condi


ciones de optimizacin tradicionales:

L// 1
dC2 C1

Simplificando esta condicin podemos obtener el consumo en funcin de la


variable de coestado C = (e"pl)/A. Por otro lado, la variable de coestado puede
obtenerse a partir de su ecuacin de movimiento:

X = = - r\
dS

Cuya solucin es:

X( t) = H te r'

La trayectoria ptima de la variable de coestado puede reemplazarse en la


condicin de optimizacin del Hamiltoniano, y as obtenemos la senda del
consumo:

Por ltimo, para hallar la senda del ahorro, reemplazamos el consumo ptimo
en la ecuacin de movimiento:

= w + rS - C = w + r S ----- e
H,
Control ptimo 129

Resolviendo la ecuacin diferencial obtenemos la siguiente funcin de ahorro:

. , 1 , ,, w
S (?) = H ,er H------- e ' ----
H P r

Evaluando la senda ptima del ahorro en la condicin inicial y final S(0) =


S(T) = 0, obtenemos el siguiente sistema de ecuaciones que determina las
constantes Hi y LL:

S(0) = H. + W = 0
//,p r

S'(T) = I/,e" + - - e - = 0
IItp r

La solucin a este sistema de ecuaciones est dada por:

_ rerl (e~PT - 1)
1 pw(l - e rT)

_ w ( e (r- P )T - 1 )
2 rerT(e~PT - 1)

La evolucin del consumo a lo largo del tiempo depender del valor relativo
de la tasa de inters con respecto a la tasa de descuento. Por ejemplo, si la ta
sa de descuento de la utilidad es superior a la tasa de inters, la tasa de creci
miento del consumo sera negativa:

En ese caso, el consumo sera superior al ingreso laboral w hasta el perodo


i, mientras que sera inferior a w a partir de dicho instante. Esto implica
que en un perodo de tiempo, el individuo acumula deudas y posteriormente
disminuye su consumo, de tal forma que financia toda la deuda contrada pre
viamente. Este comportamiento se ilustra en el Grfico No. 3.4. Queda como
ejercicio para el lector determinar el perodo crtico i en funcin de los pa
rmetros del problema.
130 Apuntes de Estudio

Grfico No. 3.4

3. Condicin de segundo orden

De manera similar al clculo de variaciones, para que el funcional objetivo


sea maximizado debe satisfacerse una condicin de suficiencia. Si se cumple
la condicin de segundo orden, entonces el principio del mximo es suficiente
para la maximizacin del funcional. A continuacin se desarrollar una con
dicin de suficiencia, conocida como el teorema de suficiencia de Manga-
sarian.

3.1 Condicin de segundo orden (teorem a de suficiencia de


M angasarian)6

Si la funcin Hamiltoniana (2) es cncava (convexa) respecto a (y, u) y el


horizonte de tiempo (T) se encuentra fijo, entonces el principio del mximo es
una condicin suficiente para la maximizacin (minimizacin) del funcional
objetivo.

6. B a s a d o e n el tra b a jo d e M a n g a s a ria n . O .L , S u ffic ie n t C o n d itio n s for th e O p tim a l C o n


trol o f N o n lin e a r S y s t e m s , e n S I A M J o u rn a l o n C ontrol, v o l. 4 , 1 9 6 6 , p p . 1 3 9 - 1 5 2 .
Control ptimo 131

3.2 Condiciones de concavidad y convexidad

El Hamiltoniano es una funcin cncava con respecto a (y, u) si:

a) f(t, y, u) es cncava, g(t, y, u) es cncava y A(t) > 0.

b) f(t, y, u) es cncava, g(t, y, u) es convexa y A.(t) < 0.

El Hamiltoniano es una funcin convexa con respecto a (y, u) si:

a) f(t, y, u) es convexa, g(t, y, u) es convexa y A(t) > 0.

b) f(t, y, u) es convexa, g(t, y, u) es cncava y A(t) < 0.

Demostracin

La demostracin se realizar sobre la base del problema ms simple de control


ptimo (1). Considerando la funcin Hamiltoniana (2) y que la funciones f(t, y,
u) Y g(L Y u) son cncavas y diferenciales, el principio del mximo establece
las siguientes condiciones:

+ A^ - = 0 (45)
9u du

X' = J - X dJ _ (46)
dy y

X(T) = 0 (47)

Adems, para asegurar la concavidad de la funcin Hamiltoniana, supondremos


que X(t) > 0 (V t e [0, T]). Por otra parte, considerando que las funciones f(t, y,
u) y g(t, y, u) son cncavas, y la existencia de sendas ptimas (X , y , u'), y
sendas factibles (X, y, u), entonces se cumplen las desigualdades:

f(t, y , ) - / ( / , y \ u*) <f y(t, y *, u ) ( y - y*) + /(t, y* , u ) ( u - u ) (48 )

g ( - g(t, y* ,U ) < g ,,(t, y* ,u )(y - y*) + gu(t, y*,u ){u - u*)


132 Apuntes de Estudio

Si integramos ambos lados de la primera desigualdad en (48), obtenemos lo


siguiente:

7
V - l/* < J [ f y (/, y *, h )(y - y *) + / { U y \ u )(M ~ U )}di (49)
o

Reemplazando las condiciones del principio del mximo (45) y (46) en la


desigualdad (49), se obtiene:

T
J
V - V < [(-A*g v(I, y , u) - ')(y - y *) - *gu (/, y, u){u - u *)]dt (50)
o

Simplificando (50) se llega a la siguiente expresin:

V - v ' < J * \-'(y - y *) - X*gy (t, y*, u*)(y - y*) - *gu (t, y*, u* )(u - u" )}dt (51)
o

El primer componente de la integral de (51) puede ser modificado mediante


una integracin por partes del siguiente modo:

T T
J l - A ' O - y* )\dt = [A* ( y - y* )]Jt - J [ - A * ( y ' - y'")]dt (52)
o o

= -X'(T)(yT - y \ ) + A * ( 0 ) ( y 0 -y ) +j[A *(y'-y'*)]A


o

El primero de los trminos es igual a cero por la condicin de transversalidad


(47), y el segundo trmino tambin desaparece, ya que el valor inicial de la
senda ptima y la senda factible son iguales ( yj = y0). Finalmente, si conside
ramos que la variacin de la variable de estado viene determinada por la
ecuacin de movimiento, la expresin (52) se resumira del siguiente modo:
T T

J [A ' ( y - y * )]dt =| [2* ( g(t , y, u) - g(t, y" ,u ))]dt (5 3 )


o o
Control ptimo 133

Reemplazando (53) en (51) se obtiene la desigualdad:

7
V - V < J[A *( # (/, v, h ) - ^ ( , V*,H*)) - x y (I. V * ,M *) ( V - V*) - A*, ? ( / , v' , h ) ( h - (/* ) ]< *

0 (54)
/
K - K* < JA [ ( ^ ( , _v, h ) - ,1>((, v , m*) - ,1 ',(/,> *, *)(>' - V*) /, ( '. > * . * )( - H*)]/
o

Tomando en cuenta la segunda desigualdad en (48) y que la variable de coes


tado es no negativa7, el lado izquierdo de la desigualdad tomara un valor no
positivo y, por lo tanto, se cumplira:

V R* (55)

De este modo, si las funciones f(t, y, u) y g(t, y, u) son cncavas, y la variable


de coestado es no negativa en todo el horizonte de tiempo, entonces, las sen
das (u , y , X ) obtenidas a partir de las condiciones del principio del mximo
aseguran que el funcional objetivo sea maximizado. Expresado de otra forma,
si la funcin Hamiltoniana es cncava con respecto a la variable de control y
estado (y, u), el principio del mximo es una condicin suficiente para la
maximizacin del funcional objetivo, es decir, para que se cumpla la de
sigualdad (55). Si las funciones f(t, y, u) y g(t, y, u) fueran estrictamente cn
cavas, la desigualdad (55) sera estricta y el funcional objetivo alcanzara un
nico mximo global. Cuando se considera el valor terminal de la variable de
estado fijo, los resultados anteriores no se ven alterados. Empleando la condi
cin (52), el lector puede demostrar que en dicho caso la desigualdad (55) se
mantiene.

Ejemplo 1.- Evale la condicin de segundo orden para el problema desarro


llado en la seccin 1.2 de este captulo.

En este caso se verificar la condicin de suficiencia de manera separada para


la ecuacin de movimiento y la funcin intermedia. La ecuacin de movi
miento del problema es la siguiente:

g(C,P) = C 2(t)-yP(t)

7. T a l c o m o l o e s t a b l e c e e l c a s o ( a ) d e la s e c c i n 3 . 2 d e l p r e s e n t e c a p t u l o .
134 Apuntes de Estudio

y su matriz Hessiana es:

2 0
A=
0 0

Los menores principales de la matriz son Ai = 2 y A2 = 0, por lo que la matriz


es semidefinida positiva y la ecuacin de movimiento es convexa. Por otra
parte, la funcin intermedia es la siguiente:

f(C.P) = I . n C - ^ C - O P
a'

la cual presenta la siguiente matriz Hessiana:

(
A = c a
0 0

y los menores principales:

1 _ 2/ ! _ _ 1 _ 2P
A,
C 2 a 2\ C2 a 2

1 2fi
(---- T----~) 0
A, =
C tr
0 0

La matriz A es semidefinida negativa y, por lo tanto, la funcin intermedia es


cncava. Considerando que la variable de coestado es no positiva en este
ejemplo, nos encontraramos en el caso (b) del punto 3.2, de tal forma que la
funcin Hamiltoniana sera cncava y se cumplira la condicin de suficiencia
de Mangasarian.

Ejemplo 2.- Evale la condicin de segundo orden para el problema desarro


llado en la seccin 2.2 de este captulo.

En el problema de asignacin de consumo y ahorro, la funcin Hamiltoniana


est definida por:

H(t,S,C, A) = Ln(C)c '' + (u+ rS - C)


Control ptimo 135

La matriz Hcssiana del Hamiltoniano es la siguiente:

A C2
0 o

Los menores principales son iguales a:

A e-f <0
C2

1
A ..- e-i
C2
0 0

La matriz A es semidet'inida negativa; por lo tanto, la funcin Hamiltoniana es


cncava. De esta manera, la condicin de suficiencia se satisface, y se com
prueba que las sendas ptimas halladas maximizan el funcional objetivo.

4. C o m p a ra ci n en tre el c lcu lo de v a ria cio n es y el con trol


p tim o

Hasta el momento, hemos estudiado el problema de clculo de variaciones y


el de control ptimo de manera separada. En esta seccin se demostrar que
el clculo de variaciones constituye tan slo un caso particular del problema
de control ptimo, y que tanto las condiciones de primer orden como las de
suficiencia llegan a ser similares para ambos casos.

Consideremos el siguiente problema general de clculo de variaciones:

r
Maximizar V = J f ( t , y, y')dt

sujeto a y(0) = y0 (y0 dado)


y(T) = y r ( y T libre)
136 Apuntes de Estudio

Estableciendo la ecuacin de movimiento y = g(y ,u) = u, el problema de


control ptimo equivalente sera el siguiente:

T
Maximizar V = j f (t, y,u)dt (5 7 )

sujeto a y' = u
v(0 ) = y o (>'o dado)
y(T) = y r {yT libr)

Para resolver el problema (57), en primer lugar debemos plantear la funcin


Hamiltoniana:

H = f ( t , y,u) + Xu

A partir de la funcin Hamiltoniana, derivamos las condiciones que confor


man el principio del mximo8:

a. Zl ~ f + ^ _ 0 (58)
dit
, dH
b. y = - =u
' dX

c.
<
II

II
I

i
b

d.
II

A partir de las condiciones (a) y (b) del principio del mximo, obtenemos la
relacin:

= -/v (59)

Derivando la expresin (59) con respecto al tiempo se obtiene lo siguiente:

A' = - /> (60)


dt

8. P o r s i m p l i c i d a d a s u m i r e m o s q u e la f u n c i n H a m i l t o n i a n a p r e s e n t a u n a s o l u c i n i n te r io r .
Control ptimo 137

Al igualar (60) con la condicin (c) del principio del mximo llegamos a la
siguiente identidad:

(61)
d t Jy

que no es otra cosa que la ecuacin de Euler planteada en la ecuacin (4) del
captulo II. De esta manera, a partir de la condicin de primer orden del pro
blema de control ptimo, puede obtenerse la respectiva condicin de primer
orden para el problema de clculo de variaciones. Con respecto a la condicin
de transversalidad del problema (57), a partir de (59) y la condicin (d) del
principio del mximo, se obtiene lo siguiente:

/,']/= / = 0 (62)

que tambin representa la condicin de transversalidad del problema de cl


culo de variaciones planteada en la ecuacin (39) del captulo II. Para las
otras condiciones terminales y empleando (58), las condiciones de transversa
lidad tanto del problema de control ptimo como del clculo de variaciones
llegan a ser equivalentes. En el Cuadro No. 3.1 se resume la relacin existente
entre las condiciones de transversalidad de ambos problemas.

Cuadro No. 3.1

CONDICIONES DE TRANSVERSALIDAD PARA LOS PROBLEMAS DE


CONTROL PTIMO Y CLCULO DE VARIACIONES

Condicin de Condicin de
Condicin terminal transversalidad transversalidad
Control ptimo Clculo de variaciones

(yT lijo, T fijo) y(T) = yT


II
1

(y-r fijo, T libre) [HWr = 0 |f-y'fy].= r = 0

(yr = (p(T)) [H-Af(T)],=T= 0 |f + ( (T) - y')fv D t = 0

La condicin de segundo orden en ambos problemas tambin llega a ser simi


lar. La condicin de suficiencia en el problema de control ptimo establece
que si la funcin Hamiltoniana es cncava (convexa) con respecto a la varia
138 Apuntes de Estudio

ble de control y estado, entonces, el principio del mximo resuelve el pro


blema de maximizacin (minimizacin) del funcional objetivo. Para que el
Hamiltoniano sea cncavo, la matriz de segundas derivadas y derivadas cru
zadas debe ser definida o semidefinida negativa. Es decir, dada la siguiente
matriz:

X , 'fyy fy
(63)
_Hy h u, _ -/uy fmi

los menores principales Ai y A2:

A,

/
L L

deben satisfacer las condiciones Ai < 0 y A2 = 0, si la matriz es semidefinida


negativa, y Ai < 0 y A2 > 0, si es definida negativa. En el clculo de variacio
nes, la condicin de suficiencia establece que la funcin intermedia debe ser
cncava (convexa) para que la ecuacin de Euler y la condicin de transver-
salidad resuelvan el problema de maximizacin (minimizacin) del funcional
objetivo. Reemplazando la ecuacin de movimiento y ' = u en (63), obten
dramos la condicin de suficiencia para el problema de clculo de variacio
nes. Es decir, dada la matriz:

fyy fyy'
(64)
fyy fyy

y los menores principales Ai y A2 :

A, = /

/
A,
Lv
Control ptimo 139

La funcin intermedia ser cncava si la matriz (64) es semidefinida negativa


(Ai < 0 y 0), y estrictamente cncava si la matriz es definida negativa (Ai
< 0 y Az> 0).

5. Control ptimo con factor de descuento

Un problema de control ptimo comn es aquel en el cual la funcin interme


dia se encuentra multiplicada por un factor de descuento. En estos casos, me
diante un artificio, el Ilamiltoniano puede ser transformado de tal forma que
las condiciones del principio del mximo sean derivadas de una forma ms
sencilla. Consideremos el siguiente problema de control ptimo con factor de
descuento:

T
Maxiniizar V = e~f* f ( t , y , u ) d t ^ 5)
o
sujetad y' = g ( t ,\ \u )
y(0 ) = y0 (y0 dado)
y(T) = y T (y libre)
u(t)e Q

Con la respectiva funcin Hamltoniana:

H =e~pl f ( t , y , u ) + g(t,y\u) (6 6 )

Con el objeto de eliminar el factor de descuento y simplificar la derivacin de


las condiciones de primer orden, multiplicamos (6 6 ) por el factor epl, con lo
cual obtenemos la siguiente expresin:

//e p' = H * = f ( t , v jt) + e pl>(, \\tt) (67)

Por otra parte, realizando una transformacin a la variable de coestado:

m = epl (68)

llegaramos a la siguiente expresin:

H = / (f, >,n) + mg(t, y,ii) (69)


140 Apuntes de Estudio

A la expresin (6 6 ) se le denomina Hamiltoniano en v a lo r p r e sen te debido a


que cuenta con un factor de descuento, mientras que a la expresin (69) se le
denomina Hamiltoniano en v a lo r co rrien te . En el primer caso, la variable de
coestado (A) se interpreta como el precio sombra de la variable de estado ex
presado en valor presente; y en el segundo, la nueva variable de coestado (m)
se interpreta como el precio sombra expresado en valor corriente. A conti
nuacin obtendremos la condicin del principio del mximo para el Hamilto
niano expresado en valor corriente.

La primera condicin del principio del mximo establece que en cada instante
del horizonte de tiempo, la funcin Hamiltoniana debe ser maximizada con
respecto a la variable de control. Como el factor de descuento no depende de
la variable de control, sta se considera como una constante positiva que no
altera el resultado del proceso de maximizacin. De esta forma, dicha condi
cin puede plantearse del siguiente modo:

Maximizar H sujeto a u(t)eQ. (70)


U

La ecuacin de movimiento para la variable de estado puede plantearse del


siguiente modo:

dH dH*
v ---- = e(l, \\u) (71)
DX ' din

La ecuacin de movimiento de la nueva variable de coestado (m) puede deri


varse a partir de la siguiente condicin:

dH
(72)
dy

Al derivar (6 8 ) con respecto al tiempo obtenemos la siguiente igualdad:

X' = m'e pt pme pl (7 3 )

Adems, a partir de (67) se cumple:

dH _ dH" _p,
(74)
dy dy
Control ptimo 141

Finalmente, reemplazando (74) y (73) en (72), obtenemos la ecuacin de mo


vimiento:

, >11
m ----------- 1 pin (75)
ch

La condicin de transversalidad se puede obtener directamente a partir de


(6 8 ) y de la condicin del principio del mximo L(T) = 0.

MT) = [me-<*]t=r =m(T)e-pT =0 (76)

A manera de resumen, el principio del mximo para el problema de control


ptimo (65) estara conformado por las siguientes condiciones:

a. Maximiz.ar / { ' sujeto a u(t)e i (77)

c. m
,=d f l' r pin
dy
d. m(T)e>" =0

6. Control ptimo con horizonte temporal infinito


Al igual que en el clculo de variaciones, algunas aplicaciones econmicas de
control ptimo se desarrollan suponiendo un horizonte temporal infinito. Este
planteamiento si bien en muchos casos se ajusta a la realidad que se desea
modelar, puede traer problemas en la medida en que el funcional objetivo no
converja. Las condiciones para la convergencia del funcional objetivo
analizadas en el captulo anterior se siguen cumpliendo para el problema de
control ptimo.

El problema bsico de control ptimo con horizonte infinito a resolver es el


siguiente:

Maximizar V = j f ( t , y,u)dt (78)


o
sujeto a y ' = g(t, y,u)
>(0 ) = y 0 ( y Qdado)
142 Apuntes de Estudio

En la presente seccin se desarrollarn las condiciones de primer y segundo


orden necesarias para resolver el problema (78). Asimismo, se emplear la
tcnica del diagrama de fase para obtener una solucin cualitativa al problema
con horizonte temporal infinito.

6.1 Condiciones de primer y segundo orden

Las tres primeras condiciones del principio del mximo (3) se siguen
cumpliendo para el horizonte temporal infinito; sin embargo, la cuarta, que
representa la condicin de transversalidad, debe ser modificada. En el problema
con horizonte temporal infinito se debe cumplir que el lmite en el infinito de
(32) debe ser igual a cero, es decir:

Un ([// ]l=T AT - ?.(T)Ayr ) = 0 (79)

Como el horizonte temporal T tiende a infinito, la diferencia AT es distinta de


cero, por lo que necesariamente debe cumplirse:

Lim H = 0 (80)

Si la variable de estado se encuentra libre, entonces Aya es distinto de cero y,


por lo tanto, adicionalmente debe satisfacerse la condicin:

LimX(t) = 0 (81)

Por el contrario, si el valor terminal de la variable de estado se encuentra de


terminado, en lugar de la condicin anterior, basta con emplear una meta
asintotica:

Lim y(t) = y (82)

Donde y es una constante que pertenece a los nmeros reales. A continua


cin desarrollaremos un ejemplo, empleando los conceptos vistos hasta el
momento.
Control ptimo 143

Ejemplo.- Halle las trayectorias y (t), u (t) y A (t) que resuelvan el problema:
cc / *)
Maximizeir
y' - U
-v>
sujeto a
v(0 ) -- 1

La funcin Hamiltoniana del problema es la siguiente:

9\
H = e _3'| - - + vu - - - -r Alt
2 ' 2

La primera condicin del principio del mximo establece que el Hamiltoniano


debe ser maximizado con respecto a la variable de control. Como nos encon
tramos ante una funcin no lineal, se plantean las condiciones clsicas de op
timizacin:

---- = e
'(- + v) + A = 0
<1
<T-H
= <0
IhF

Simplificando la condicin de primer orden obtenemos la siguiente relacin:

A = e 3 (w - y) (83)

Por otra parte, las ecuaciones de movimiento de las variables de estado y co


estado son las siguientes:

dH (84)
---- = u
3
dfl -y,
= (->') (85)
ay

Al reemplazar (83) en la ecuacin de movimiento de la variable de coestado,


llegamos a la siguiente ecuacin diferencial:

A' + A = 0 (86)
144 Apuntes de Estudio

Cuya solucin es:

*(t) = H le~l (87)

Donde Hi es una constante desconocida por el momento. Para hallar la trayec


toria de la variable de estado reemplazamos (87) y (84) en (83), con lo cual ob
tenemos la ecuacin diferencial:

y' ~ y = H xe z< (8 8 )

que presenta la siguiente solucin:

y~(t) = H 2e + H \ e 2' (89)

Donde Hi constituye una nueva constante. A partir de (89) y la ecuacin de


movimiento (84), obtenemos la senda ptima de la variable de control:

u ( t ) = H 2e' + 2 H ]e 2' (90)

Para obtener el valor de las constantes Hi y LL, en primer lugar, necesitamos


la condicin inicial y(0 ) = 1 , con lo cual:

y \ 0 ) = H 2 + H i =l (91)

Adems, necesitamos contar con las condiciones de transversalidad para el


caso de horizonte temporal infinito. La condicin asociada al valor terminal
libre es la siguiente:

Lim Mt ) = H e 1 = 0 (92)

Como en esta expresin el exponente es negativo, la variable de coestado conver


ge a cero, con lo cual la condicin se satisface automticamente independiente
mente del valor que tome la constante H;. En este sentido, necesitamos la otra
condicin de transversalidad para hallar el valor de las constantes:

y-
Lim II = Lim e + iiy + u =0 (93)
o 2
Control ptimo 145

Simplificando el lmite anterior obtenemos:

1
U m I I = Um (-.1/ (u - y ) 1 + Aa (94)
1

Um II = Um -e-i< (//, '2') +//,?-'(//, + 211 c11)

U m I I = Linil - - I I f e ' + / / , / / , + 2H^e'

Para que la anterior expresin converja a cero, se debe cumplir que IIi = 0.
De este modo, la otra constante tomara el valor H2 = 1 y la solucin al pro
blema estara dada por las sendas:

y { t ) = e'

u( t ) =

X(t) = 0

Para verificar la condicin de segundo orden evaluamos la matriz de deriva


das cruzadas y segundas derivadas de la funcin Hamiltoniana:

A= (95)

Como la matriz es semidefinida negativa (Ai < 0, A2 = 0), el principio del


mximo y las condiciones de transversalidad constituyen condiciones sufi
cientes para la maximizacin del funciona] objetivo.
146 Apuntes de Estudio

6.2 Aplicacin: modelo neoclsico de crecimiento'

El modelo neoclsico de crecimiento fue planteado inicialmente por el ma


temtico ingls Frank Ramsey en 1928, y posteriormente fue modificado
por David Cass y Tjallinjg C. Koopmans en 1965. Este modelo intenta ex
plicar desde un enfoque neoclsico (asumiendo una funcin de produccin
neoclsica y supuestos de competencia perfecta), las caractersticas
esenciales de un crecimiento econmico ptimo. De esta forma se plantea
un problema de optimizacin intertemporal del bienestar de las
generaciones presentes y futuras de la sociedad, a partir del cual se pueden
obtener las trayectorias ptimas de consumo, capital y producto. Cabe
destacar que en este modelo se asume la existencia de un planificador
social, que resuelve el problema y decide las asignaciones de consumo y
capital. El modelo supone una economa en la cual se produce un solo bien,
de acuerdo con la siguiente funcin de produccin que depende del capital
(K) y el trabajo (L):

Y = F(K,L) (96)

Esta funcin de produccin es neoclsica, en la medida en que cumpla tres


propiedades. En primer lugar, debe presentar productos marginales positivos
y decrecientes, es decir:

(97)

En segundo lugar, la funcin de produccin debe presentar retornos constan


tes a escala:

F(K,L) = F( K, L) ( > 0) (98)

9. S i b i e n e l m o d e l o n e o c l s i c o d e c r e c i m i e n t o f u e d e s a r r o l l a d o i n i c i a l m e n t e p o r Ca s s , D a

v id ( " O p t i m u m G r o w t h in a n A g g r e g a te M o d e l o f C a p i ta l A c c u m u l a t i o n " , e n Review o f Econo


mic Studies, v o l. 3 2 . N o . 3, p p . 2 3 3 - 2 4 0 ) y K o o p m a n s , T . C . (O n the C o n c e p t o f O p tim a l Eeo-
tiom ie G ro w th , D i s c u s s i o n p a p e r , N e w H a v e n : C o u l e s F o u n d a t i o n , Y a l e U n i v e r s i t y , 1 9 6 3 ) , el
d e s a r r o l l o e s p e c f i c o d e e s t a a p l i c a c i n f u e t o m a d o d e B a r r o . R o b e r t J. y X a v i e r S a l a - i - M a r t i n ,
E c o n o m ic G row th, M c G r a w - H i l l , 1 9 9 5 , p p . 5 9 - 7 4 .
Control ptimo 147

En tercer lugar, se deben cumplir las condiciones de Inada101:

Lim F, = Lim F, = (99)


K >0 K L-> 0 L

Lim Ft = Lim F, = 0
K-^ * L->~ L

Por otro lado, se asume que la fuerza laboral crece a una tasa exgena n :

L\t)
------ = n ( 100)
u n

por lo tanto, presenta la siguiente trayectoria temporal:

L(t) = LQe'" (o > 0) (1 0 1 )

En el modelo tambin se asume una economa cerrada, en la cual se cumple


la identidad macroeconinica:

Y =C +I (102)

Es decir, la oferta agregada (Y) es igual a la suma de los componentes de la de


manda agregada: consumo (C) e inversin bruta (I). Como la economa es ce
rrada, toda la inversin es financiada mediante el ahorro interno (S), en otras
palabras, se cumple la igualdad I = S. La inversin bruta se define como la va
riacin del stock de capital ms la depreciacin del capital. Considerando una
tasa de depreciacin del capital constante e igual a 5 , obtenemos lo siguiente:

/ = K ' + SK (103)

Con la finalidad de simplificar el problema, se plantear el modelo en forma


intensiva, es decir, expresando las variables en trminos per cpita11. A partir
de (102) y (103) obtenemos la siguiente expresin para la identidad macroe-
conmica:

Y K' .K
+ (104)
I. I. L

10. Inada, K cn -Ich i, "O n a T w o -S c c to r M o d el o f E c o n o m ic G ro w th : C o m m e n ts a n d a G e n e


ralizatio n ". cn R eview o f E c o n o m ic S tu d ie s, vol. 3 0 , 1 9 6 3 , p p . 1 1 9 - 1 2 7 .
11. S e a s u m e p o r s i m p l i c i d a d , q u e la p o b l a c i n e s i g u a l a l n m e r o d e t r a b a j a d o r e s .
148 Apuntes de Estudio

Al expresar las variables per cpita en minsculas, llegamos a la siguiente


igualdad:

= v - c - Sk (105)
L '

Para obtener el ratio de variacin del stock de capital sobre la cantidad de


trabajadores, realizamos la siguiente derivacin:

k: i K' K
(106)
k ~ 1. 1:
K K L
L L L
k ' = K ~nk
L

Adems, considerando que la funcin de produccin es homognea de grado


1 , se cumple que:

Y _ F(K, L)
F ( j , l ) = V (k ) (107)
L~ L

Reemplazando (107) y (106) en (105), obtenemos una versin simplificada de


la identidad macroeconmica (105):

k ' ^ xY { k ) - c - { n + S ) k (108)

La ecuacin diferencial (108) se interpreta tambin como la ecuacin de mo


vimiento del capital, ya que indica la evolucin del stock de capital per cpita
dada una senda de consumo especfica.

Los agentes del modelo son homogneos, es decir, presentan la misma fun
cin de utilidad con las siguientes caractersticas:

U'(c) > 0 , / '( c ) <0 (109)


Control ptimo 149

Como los agentes son homogneos, cada uno de ellos consume un monto
igual al consumo per cpita (c). La utilidad agregada de la sociedad en un ins
tante determinado, viene dada por la utilidad individual multiplicada por el
nmero de agentes en la economa:

U (c)L() (110)

De esta manera, el funcional objetivo del problema es igual a la suma de las


utilidades futuras de la sociedad descontadas a la tasa p:

V = J II (c)L(t)e~pt dt = | U (c) L0e"1e pl dt = L0J U (c)e{n~pMdi (111)


o o o

En este sentido, el problema que enfrenta la sociedad es el siguiente:

Maximizar V = \ U (c)e{n~pn dt (1 P )
o
sujeto a k ' = x( k) - c - (n + S)k
m = k 0 ( * 0>o)
0 < r< f(l)

Con respecto al problema intertemporal (112) cabe destacar cuatro puntos. En


primer lugar, para que el funcional objetivo sea convergente debe cumplirse
que (n - p) < 0. En segundo lugar, la variable de control del problema est
dada por el consumo per cpita, y la variable de estado por el stock de capital
per cpita. En tercer lugar, corno el valor inicial del factor trabajo (Lo) es una
constante positiva, por conveniencia se ha fijado dicho valor en la unidad. En
cuarto lugar, para que el modelo sea consistente, el consumo no debe ser su
perior al producto. En la medida en que se considera una economa cerrada,
los agentes no pueden acceder a un nivel de consumo superior al producto
que se genera.

La funcin Hamiltoniana en valor corriente del problema (112) es la si


guiente:

H* = U(c) + m ( ' V ( k ) - c ~ ( n + 8 )k) (113)


150 Apuntes de Estudio

El principio del mximo establece, en primer lugar, que el Hamiltoniano debe


ser maximizado con respecto a la variable de control, que en este caso viene
dada por el consumo:

dH'
= U'(c) - m = 0 (114)
k

La maximizacin del Hamiltoniano arroja la siguiente condicin de equilibrio:

m = U'(c) (115)

La condicin (115) tiene una interpretacin econmica: en cada instante del


tiempo, el precio sombra del capital expresado en valor corriente (m) debe ser
igual a la utilidad marginal del consumo. Esta condicin de equilibrio implica
una asignacin de recursos eficiente entre consumo e inversin en todo el ho
rizonte de tiempo. Si no fuera este el caso, analicemos qu sucedera con la
trayectoria del consumo y el capital. Partamos considerando la ecuacin de
equilibrio ( 1 0 2 ), que establece que el monto total de la produccin se destina
solamente a dos fines: consumo o inversin. Ahora, supongamos que en lugar
de la condicin (115) se cumpliese la desigualdad m < U'(c). En dicho caso,
el precio sombra sera inferior a la utilidad marginal del consumo. Esta situa
cin no sera de equilibrio, ya que el valor marginal que posee el capital sera
inferior al del consumo, de tal forma que aumentara el nivel de bienestar de
la sociedad incrementando el consumo y, por ende, disminuyendo el monto
de inversin. Este incremento del consumo disminuira el valor de la utilidad
marginal, hasta que eventualmente se igualara al precio sombra12. Por el con
trario, si se cumpliera la desigualdad m > U'(c), el valor marginal del capital
sera superior al del consumo y, por lo tanto, la decisin ptima sera dismi
nuir el consumo y aumentar el monto de inversin. La disminucin del con
sumo incrementara el valor de la utilidad marginal hasta que se iguale al pre
cio sombra del capital. De esta forma, la nica situacin de equilibrio ad
misible es (115), donde el precio sombra del capital se iguala a la utilidad
marginal.

12. L a u t i l i d a d m a r g i n a l d i s m i n u i r a p o r l a s p r o p i e d a d e s d e la f u n c i n d e u t i l i d a d e s t a b l e c -
d a en (112).
Control ptimo 151

Las ecuaciones de movimiento para el capital y la variable de coestado vienen


dadas por:

= M'() - r - (// +S)k ( 116)


din

ni' = - \ + ( p - n ) m = - n i C V ( k ) - (n + <>)) + ( p - n )m = - i n ( ' V ' ( k ) - ( p + )) (1 1 7 )


dk

Las dos ecuaciones anteriores constituyen un sistema de ecuaciones diferen


ciales no lineal, que depende de tres variables: el consumo (c), el capital (k) y
la variable de coestado (m). Con el objeto de construir un diagrama de fase
que explique la dinmica de crecimiento de la economa, se expresar el sis
tema de ecuaciones en funcin solamente del consumo y el capital. Para ello,
debemos despejar tanto la variable de coestado como su primera diferencia
del sistema de ecuaciones anterior. La primera diferencia de la variable de
coestado es igual a:

m = U"{c)c 18)

Reemplazando (115) y (118) en (117), obtenemos la expresin:

, U\c)
( ' ( * ) - ( p + >)) (119)
U'(c)

Dividiendo ambos lados de la ecuacin (119) entre el consumo se obtiene:

c U (c)
C \ k ) - ( p + 8))
c U\c)c

La expresin -U '(c)/ U "(c)c es igual a la inversa de la elasticidad de la utili


dad marginal con respecto al consumo. Ello puede apreciarse en la siguiente
expresin:

d ( U (c)) c U (c)c
t)(c) - (120)
de U\c) U '(c)
152 Apuntes de Estudio

La elasticidad r\(c) indica la sensibilidad de la utilidad marginal ante cambios


en el nivel de consumo. Como en la parte superior de este ratio se encuentra
la segunda derivada de la funcin de utilidad, esta elasticidad constituye una
medida del grado de concavidad de la funcin de utilidad. Mientras mayor
sea la elasticidad, mayor ser la curvatura o concavidad de la funcin de uti
lidad. En el caso del modelo de crecimiento neoclsico, como la funcin de
utilidad satisface los requisitos de (109), la elasticidad tomar siempre un va
lor positivo.

Finalmente, las ecuaciones (119) y (120) establecen lo siguiente:

- = - ^ - V \ k ) - ( p + S)) (121)
c /7(c)

La ecuacin (121) tambin se conoce como la regla de Keynes-Ram sey de


consumo ptimo. Esta relacin establece de forma explcita, los componentes
que determinan la senda ptima de consumo. En esta ecuacin, cuando la
productividad marginal del capital neta de depreciacin ('F'(k) - 5 ) es supe
rior a la tasa de descuento subjetiva (p), la tasa de crecimiento del consumo
(c'/c) es positiva. Ello se puede interpretar de la siguiente forma: cuando la
productividad marginal del capital o la tasa de inters13 es relativamente ele
vada, resulta conveniente destinar una buena parte de la riqueza (producto) al
ahorro (inversin), con lo cual el consumo ser mayor en el futuro que en el
presente. De este modo, la trayectoria temporal del consumo ser creciente.
En caso contrario, 'F '(k) - 5 < p, como la tasa de inters neta es inferior al
grado de impaciencia intertemporal (p), la estrategia ptima sera disminuir el
ahorro (inversin) para incrementar el consumo presente, con lo cual dismi
nuyen las posibilidades de consumo futuro. En este caso, la senda de consu
mo tendra un comportamiento decreciente en el tiempo (c'/c < 0 ).

Por otra parte, mientras mayor sea el grado de concavidad de la funcin de


utilidad, es decir un valor de r|(c) ms elevado, la senda ptima de consumo
ser ms estable. Por ejemplo, en el caso que la elasticidad de la utilidad
marginal tienda a infinito, la tasa de crecimiento del consumo tendera a cero

13. E n u n a s i t u a c i n d e c o m p e t e n c i a p e r f e c t a s e c u m p l e q u e la r e t r i b u c i n a l c a p i t a l o la t a

s a d e in te r s e s i g u a l a la p r o d u c t i v i d a d m a r g i n a l d e l c a p ita l. E l lo s e d e riv a a p a rtir d e la m a x i-

m iz a c i n d e los b e n e fic io s d e u n a f ir m a n = F (K , L) - w L - rK , d o n d e el p re c io del b ien se n o r


m a l i z a a 1, y l o s p r e c i o s d e l c a p i t a l y e l t r a b a j o s o n i g u a l e s a r y w , r e s p e c t i v a m e n t e . E n f o r

m a in te n s iv a , los b e n e f i c io s s o n n = H '(k ) - w -rk. L a c o n d i c i n d e p r im e r o r d e n d e m a x i m i z a -


c i n d e b e n e f i c i o s e s t a b l e c e r = H D k ) , lo c u a l i m p l i c a q u e e n c o m p e t e n c i a p e r f e c t a la r e t r i b u
c i n al c ap ital d e b e ser ig u al a su p ro d u c tiv id a d m arg in al.
Control ptimo 153

y, por lo tanto, se apreciara un comportamiento del consumo casi constante.


De manera opuesta, si la elasticidad tendiera a un valor cercano a cero, la tasa
de crecimiento del consumo tendera a infinito y la trayectoria del consumo
sera explosiva.

A partir de (116) y (121) conformamos el sistema de ecuaciones diferenciales


con el cual se construir el diagrama de fase. En primer lugar, debemos fijar
el consumo y el capital per cpita en su estado estacionario (k ' = c ' = 0 ) para
obtener las curvas de demarcacin:

c = ' ( k ) - ( n + 5)k (1 2 2 )

''(k) = p + S (123)

La primera curva de demarcacin es una funcin que se obtiene a partir de la di


ferencia de dos componentes: la funcin de produccin 'Fjk) y la recta (n + 5 )k .
La funcin de produccin cumple con las condiciones de Inada en forma
intensiva: LiinxV'(k) = ^ y ^ Lwi^'V (k) = o raz0 nporlacualpuederepresentar.se
como una funcin cncava, tal como aparece en el Grfico No. 3.5. La dife
rencia de ambas funciones da como resultado una funcin similar a una par
bola (ver el Grfico No. 3.6.).

Grfico No. 3.5


154 Apuntes de Estudio

La segunda curva de demarcacin (123) constituye una recta perfectamente


vertical. Como la curva de productividad marginal es una funcin homognea
y depende solamente del capital per cpita (k), la ecuacin (123) da como re
sultado un valor constante del capital que depende de los parmetros p y 8 : k
= T(p, 8 ). Las curvas de demarcacin (122) y (123) se encuentran representa
das en el Grfico No. 3.6, y constituyen el lugar geomtrico en el cual el capi
tal y el consumo, respectivamente, se encuentran en estado estacionario (c' =
k ' = 0 ).

Grfico No. 3.6

Una propiedad que se cumple en el diagrama de fase es que el consumo y el


capital en el estado estacionario, siempre son inferiores al mximo nivel que
se puede obtener de estas variables. Si maximizamos la ecuacin (122) con
respecto al nivel del capital, se obtiene la siguiente condicin:

V ernal )=n +5 (124)


Control ptimo 155

Como p > n, se cumple p + 8 > n + 5 y , por lo tanto, '( k ) > ^ ' ( k ^ ) . Al ser
la curva de productividad marginal del capital 'F'(k) decreciente, entonces
necesariamente se satisface la desigualdad k < kmax. Al stock de capital kmax
se le denomina nivel de capital de la regla de oro, debido a que constituye el
mximo valor factible que puede alcanzarse en la economa. El valor k , que
representa el nivel en el estado estacionario, recibe el nombre de capital de la
regla de oro modificada, ya que es el mximo valor del capital que se obtie
ne al resolver el problema de maximizacin intertemporal.

La trayectoria del consumo y el capital en cada una de las cuatro reas del
diagrama de fase presentado en el Grfico No. 3.6, se obtiene a partir de las
derivadas parciales de las ecuaciones (116) y ( 1 2 1 ):

= -l < 0 (125)

= Y'(A) < 0 (126)


n (c)

El signo de la derivada en (125) indica que conforme se incremente el con


sumo, la variacin del stock de capital con respecto al tiempo disminuir, y
por ende el stock de capital. Ello implica que niveles de consumo por encima
de la curva k ' = 0 disminuyen el stock de capital; y niveles de consumo infe
riores, incrementan el stock de capital. En el Grfico No. 3.2, esta dinmica
se representa mediante flechas con direccin a la izquierda en las reas I y II,
y con direccin a la derecha en las reas III y IV.

Por otra parte, el signo de la derivada (126) indica que conforme se incremen
te el stock de capital, la variacin del consumo con respecto al tiempo dismi
nuir, y por lo tanto el nivel de consumo. De esta forma, cualquier nivel de
capital que se encuentre a la derecha del lugar geomtrico c ' = 0 ocasionar
una disminucin del consumo, y cualquier nivel de capital a la izquierda de
dicha curva significar un crecimiento del consumo. De manera similar al ca
so anterior, este comportamiento se representa mediante flechas con direccin
hacia abajo en las regiones II y IV, y con direccin hacia arriba en las regio
nes I y III.

El impacto negativo del consumo sobre el capital y viceversa se debe al ca


rcter de asignaciones competitivas que tienen el consumo y la inversin. Un
crecimiento del consumo puede lograrse a travs de una disminucin de la
156 Apuntes de Estudio

inversin y, por ende, de una cada del capital en el futuro. Asimismo, un in


cremento del stock de capital se obtiene a travs de una mayor inversin, lo
cual slo es posible de obtener a travs de una disminucin del consumo.

La direccin de las trayectorias definidas por las derivadas (125) y (126) dan
como resultado un equilibrio inestable, en el cual se puede alcanzar el estado
estacionario (c , k ) solamente a travs de la senda de ensilladura. Cualquier
nivel de consumo y capital que se encuentre fuera de la senda de ensillada,
conduce a trayectorias divergentes de estas dos variables.

Para el caso especfico de una funcin logartmica U(c) = Ln(c) y una fun
cin de produccin Cobb-Douglas F(K,L) =K L 1", el nivel de estado es
tacionario o de largo plazo del capital y el consumo est definido del si
guiente modo:

(127)

(128)

Ejercicios

1. Halle las sendas ptimas u*(t), y*(t) y A*(t) en los siguientes casos:

b. V = \ Ln(4yu)dt sujeto a y = 4 y (l- );y (0 ) = l;y(l) = e1

c. V = \ - u 1dt sujeto a y' = y + u;y(0) = l;y(l) = 0


Conlrol ptimo 157

d. V = J - ' ( i r + \ 2)d t su jeto a y = u - y ; y ( 0 ) = 1; v ( 1 ) = v, ( v, lib re )


r
e. V = J - dt sujeto a y' = y + u\ v(0) = 5; y(T) = 11; (T libre)
o

f. V = J (1 - yjudt sujeto a y = (1 - y)u\y(0) = 0 ; (u(t)e [0 , 1 ])


0

/
g. V = J ( v " +<J.v + b u + ( ' ) dt su jeta n y ' = ir. v ( 0 ) = </; v ( 7 " ) = y , ( y , l i b r e ) ( a . b . c . d > 0 )
O

1
h. V = J(2 v -3 - u2)dt sujeto a y = v+u v(0) = 5; v(l) = v, (>, libre)
o

2. El siguiente problema de control ptimo:

I
Maximizar V = j* f ( y , u ) d t

sujeto a y = g (v, )
v(0 ) = dado)
y(T) = dado)

Se denomina autnomo debido a que no depende explcitamente del


tiempo (t).

a. Demuestre que en el problema anterior, el Hamiltoniano ptimo es cons


tante en todo el horizonte temporal.
b. Demuestre que para g(y, u) = u se cumple la condicin:

./ y'f e Vr e [0,71

Donde c pertenece a los nmeros reales.


158 Apuntes de Estudio

3. Dado el siguiente problema de control ptimo:

Ma.ximizar V(a) = e '*Ln(u)dt

sujeto a y' = by - it
y (a) = c
Lini y(t) = 0
(a, b, c > 0 )

Demuestre que se cumple la siguiente condicin:

V(a) = e~p"V( 0)

4. La curva de demanda de un mercado en el instante t viene dada por:

c/(t) = a bp(t) (a,b > 0 )

Donde q(t) y p(t) representan la cantidad y el precio, respectivamente. Hn


este mercado existe una firma grande que fija el precio, y un grupo de
firmas pequeas que son tomadoras de precios. Nuevas firmas pequeas
entrarn al mercado si la firma grande determina un precio mayor a p .
La produccin agregada de las firmas pequeas (y(t)) se comporta de
acuerdo con la siguiente ecuacin diferencial:

y = k ( p p') (k > 0 )
v(0 ) = y0 (y > 0 )

La compaa grande produce una cantidad q(t) - y(t), y presenta un costo


medio constante e igual a c (p > c > 0). Fd objetivo de la empresa es ma-
ximizar el valor presente de sus beneficios descontados a la tasa r":
Control ptimo 159

a. Plantee un diagrama de fase que explique la dinmica del precio y la pro


duccin de las pequeas firmas.
b. Encuentre el valor del precio y la produccin de las pequeas firmas en el
estado estacionario.
c. Compruebe la condicin de suficiencia de Mangasarian.

5. La variacin de las ventas (V) de un producto de la firma XYZ decrece


de manera proporcional al monto de las ventas, pero aumenta proporcio
nalmente al gasto en publicidad (P) destinado al sector del mercado que
an no adquiere el producto. De esta forma, las ventas se comportan de
acuerdo con la siguiente ecuacin diferencial:

M
DadoV(0) = Vo (V0 > 0)

Donde M es el valor de las ventas de todas las empresas dentro del


m ercado. El objetivo de la em presa es m axim izar el valor de las ven
tas hasta el perodo T :

a. Si la firma XYZ puede destinar a lo ms 3,000 unidades monetarias (u.m.)


en publicidad, mediante el principio del mximo halle la poltica publici
taria ptima y la evolucin de las ventas. Asuma los siguientes valores pa
ra los parmetros: a = 1, b = 2, M = 100, a = 4, T = 12. Considere que las
variables de control y estado se encuentran expresadas en miles de u.m.
b. Compruebe si se cumple la condicin de suficiencia de Mangasarian.

6 . Suponga que un partido poltico acaba de ganar las elecciones presiden


ciales (t = 0) y que las prximas elecciones se realizarn dentro de T
aos. El partido gobernante desea ser reelegido en las siguientes eleccio
nes, razn por la cual busca maximizar la intencin de voto de la ciuda
dana representada a travs de la funcin v(*). Los votantes evalan al
gobierno sobre la base de la evolucin de la inflacin (p) y el desempleo
(u) durante el perodo de gobierno. Los electores le asignan una mayor
160 Apuntes de Estudio

importancia a la situacin econmica cercana al perodo de eleccin, de


acuerdo con el factor e". De este modo, el funcional objetivo del partido
gobernante es el siguiente:
I

La inflacin, el desempleo y la inflacin esperada (n) en la economa se


relacionan de acuerdo con la curva de Phillips:

p = a ~ b u + cn (a, b, c> 0 )

Por otra parte, a inflacin esperada se forma de acuerdo con expectati


vas adaptativas:

n' = d ( p - n ) (d > 0 )

Si la intencin de voto de los electores se representa a travs de la si


guiente funcin:

v( m. p) = -u~ - kp (k > 0 )

a. Halle la trayectoria del desempleo, la inflacin y la inflacin esperada, si


el valor inicial de la inflacin esperada es n(0) = m y el valor terminal es
libre. Considere al desempleo como la variable de control y a la inflacin
esperada como la variable de estado.
b. Compruebe la condicin de suficiencia de Mangasarian.
IV
Programacin dinmica
En este captulo estudiaremos la tercera de las tcnicas de optimizacin inter
temporal ms empleadas en la formulacin de problemas econmicos: la
programacin dinmica. Esta metodologa de optimizacin dinmica fue
desarrollada por el matemtico Richard Bellman en 1957' y, desde entonces,
ha sido utilizada principalmente en el planteamiento de modelos de macroe-
conoma dinmica. La formulacin bsica del problema de programacin di
nmica es muy similar al del control ptimo:
T
M a x im iza r v = ^ f i (>V - " , ) + Z ( y T + l ) ( 1)
1=0

su jeto a >( + ! - ) V / = 0 ,1 ,2 ,.. J

y0 dado

y,+1 Ubre
yt >0
u, > 0

Con el fin de introducirnos en la tcnica de la programacin dinmica, de


sarrollaremos los problemas en tiempo discreto. La programacin dinmica
en tiempo continuo involucra el conocimiento de ecuaciones diferenciales
parciales, y la explicacin de ese tema excede los objetivos del presente texto.
Por otro lado, los elementos que componen el problema (1) son los mismos
que en el control ptimo. Las variables ut e y, constituyen las variables de
control y estado respectivamente, a la funcin g() se le denomina ecuacin
de movimiento o de transicin, y a la funcin f(*) se le conoce como funcin
de retorno (sta es equivalente a la funcin intermedia). Finalmente, al igual
que en los captulos anteriores, a V se le denomina funcional objetivo.1

1. B ellm an , R ic h a rd , D y n a m ic P rogram m ing, P r in c e t o n : P r i n c e t o n U n i v e r s i t y P r e s s , 1 9 5 7 .


162 Apuntes de Estudio

Antes de iniciar con la explicacin de la tcnica de programacin dinmica


cabe resaltar tres aspectos. En primer lugar, si bien un mismo problema puede
plantearse a travs de la programacin dinmica y del control ptimo, existe
una suerte de especializacin. En aquellos problemas en los cuales se consi
dera el tiempo continuo y variables determinsticas, usualmente se emplea la
tcnica de control ptimo; mientras que aquellos en los cuales se consideran
el tiempo discreto y variables estocsticas (es decir, variables que tienen un
comportamiento aleatorio), se emplea la tcnica de programacin dinmica.

En segundo lugar, mientras que en el control ptimo es posible obtener una


solucin analtica de una forma relativamente sencilla para las variables en
anlisis, en la programacin dinmica no ocurre lo mismo. Por lo general, a
partir de las condiciones de primer orden del problema de programacin di
nmica se obtienen caractersticas cualitativas acerca del proceso de optimi
zacin intertemporal que enfrentan los agentes. Solamente bajo formas fun
cionales especficas de la ecuacin de movimiento y la funcin de retorno, se
pueden obtener soluciones analticas simples para el problema (1). En caso
contrario, las trayectorias de las variables de control y de estado se obtienen a
travs de mtodos numricos o de computacin.

En tercer lugar, las variables de control ptimas en programacin dinmica


son de circuito cerrado (tambin denominado closed-loop control), es decir,
dependen tanto de la variable de estado (yt) como del tiempo (t). En el caso
del control ptimo, las variables de control son de circuito abierto (tambin
denominado open-loop control), ya que stas dependen exclusivamente del
tiempo. A la estrategia que determina el valor del control ptimo para un va
lor dado de la variable de estado se le denomina funcin de poltica (policy
function), y se le representar mediante la funcin ut = h(yt). Esta funcin
constituye la esencia de la solucin al problema ( 1 ).

El presente captulo est compuesto por cuatro secciones. En la primera se


desarrollar, a manera de introduccin, la forma convencional de resolver el
problema de optimizacin intertemporal discreto, es decir, empleando las
condiciones de Kuhn-Tucker. En la segunda seccin se plantea cmo a tra
vs de la ecuacin de Bellman un problema de optimizacin multiperodos
se transforma en una secuencia de problemas de solamente dos perodos.
Adicionalmente, se desarrollarn las condiciones de primer orden cuando el
horizonte temporal es finito. En la tercera seccin, se extendern los resulta
dos a un horizonte temporal infinito. Por ltimo, se considerar el problema
de programacin dinmica en un entorno de incertidumbre.
Programacin dinmica 163

1. Optimizacin dinmica empleando las condiciones de


Kuhn-Tucker

En el problem a (1), el objetivo consiste en determ inar las secuencias de


las variables de control y estado que logren m aximizar el funcional obje
tivo. No obstante, dicho problem a puede ser interpretado como un pro
blema de optim izacin esttica en el cual se deben determ inar las 2T +
2 variables2 que optim icen la funcin objetivo. Con el fin de introducir
nos en la program acin dinm ica, desarrollarem os el problem a ( 1 ) bajo
el segundo enfoque.

1.1 Las condiciones de Kuhn-Tucker

Dada la funcin Lagrangiana del problema (1):

T T

L =X (-v' }+ +)+S
t~ o
Z (-v?
!=<>
A' (g >(y' } 'v'+ '} (2 )

Las condiciones de Kuhn-Tucker establecen que las variables que optim i


zan la funcin objetivo cumplen con las siguientes condiciones de primer
orden:

dL dL
<0
O

u, = 0
Al
25

(3)
du, du,
dL dL
<0 vr = 0,1,2,.. r
O
Al

A+i
dL dL .
---- > 0
!

X, > 0
li

dXt dX,

Para simplificar el problema, asumiremos que la solucin es interior. Por lo


tanto, las condiciones de primer orden se resumen del siguiente modo:

=0 -^ _ =o ^ V/ = 0,1,2,..., r (4 )
du, dy,+ dX,

2. S e d e t e r m i n a n T + I v a r i a b l e s d e c o n t r o l y T + 1 v a r i a b l e s d e e s t a d o .
164 Apuntes de Estudio

Desarrollando cada una de las tres condiciones, obtenemos el siguiente siste


ma de ecuaciones en diferencias:

a. Vf = 0,1,2,..., T (5)
du, du, du,

L df ,+ 1 , o g ,+i
b. A, 0
dy, +1 dy,+ ' +1 dy,+

dL_
c. g t ( y , , u , ) - y t+{ = 0
dA,

Para obtener el conjunto de variables que optimizan la funcin objetivo es


necesario seguir el siguiente procedimiento. En primer lugar, se desarrolla la
ecuacin (5.b) para t = T:

dZ
-At = 0 (6 )
dyr+i

En segundo lugar, se debe reemplazar la ecuacin (6 ) en (5.a) para el perodo


T , con lo cual obtenemos la siguiente expresin:

dfT | dgT dZ
(V )
duT duT dyT+l

La ecuacin (7) junto con la ecuacin de transicin para el perodo T :

>r+i t (yr u t ) ( 8)

constituyen un sistema con dos ecuaciones y tres incgnitas (uj, yj, yt+i) A
partir de dicho sistema se puede obtener una funcin de poltica que indique
la eleccin ptima de la variable de control (ut), dada la variable de estado
(yt): Ut = h(yT).

En tercer lugar, desarrollamos la ecuacin (5.b) para el perodo t = T -l:

d/r , d8r ~ 0 (9)


dyT 7 dyT
Programacin dinmica 165

Reemplazando (9) y (6 ) en la ecuacin (5.a), obtenemos para el perodo t = T -l


la siguiente condicin:

d/r-i | dgr -i dfT | dgT dZ


=0 ( 10)
^_i dy-f dyj-

Como se ha podido encontrar una funcin de poltica u r = h(yr), en realidad


la variable yT+i puede expresarse en funcin yx del siguiente modo: yT+i =
g(yT, h(y-r)). De esta forma, en la condicin (10) intervienen 3 variables: ut-i ,
yx-i e yx- Dicha ecuacin junto con la ecuacin de movimiento para el perodo
T - 1:

yT-i 8 T - \ ( y T - \ , u T~\ } d i)

representan nuevam ente un sistem a de dos ecuaciones con tres incgni


tas. A partir de dichas relaciones se puede obtener la funcin de poltica
para el perodo T - 1 : ux-i = h(yx-i). En general, para el perodo t, la
funcin de poltica ut = ht(yt) se obtendr a partir del siguiente sistema
recursivo:

f
+ dg,_ \ dfn2 , d8,+2 dZ "
11 ( 12)
d u, 3, _9 +1 9 +i i 9 v, +2 V J

yl+, = 8 ,(,- y,)

Vf =0,1,2,. ..,T

Este mtodo, utilizado para hallar la funcin de poltica, es denom inado


induccin hacia atrs, ya que es necesario resolver el problem a em pe
zando desde el ltimo perodo hasta el tiempo inicial t = 0. Tal como se
puede apreciar en (12), el m todo perm ite obtener la variable de control
ptim a en el perodo t excluyendo los valores pasados de las variables
de control y de estado (u, yj, Vj = 0, 1, 2,..., t-l). Esta caracterstica de la
condicin de prim er orden (12) constituye la base del principio de opti-
m alidad desarrollado por Bellman, el cual ser explicado en la seccin
2.1 del presente captulo.
166 Apuntes de Estudio

Una vez obtenida la funcin de poltica para cada perodo, la secuencia de


variables de control y estado ptimas se obtienen de una manera relativamen
te sencilla, siguiendo el esquema que se presenta a continuacin:

y, ------- /!( } ' , ) ------- u

En el perodo t = 0 contamos con el valor inicial yo (yo > 0), y empleamos la


funcin de poltica h(*) para obtener el control ptimo uo. A continuacin,
reemplazamos los valores uo e yo en la ecuacin de transicin, con lo cual se
obtiene la variable de estado en el siguiente perodo yi. Se repite el procedi
miento para t = 1 , y se obtiene la variable de control ui y la variable de estado
y2 - Siguiendo el mismo esquema hasta el ltimo perodo, se halla el valor p
timo de las 2T + 2 variables que intervienen en el problema.

1.2 La ecuacin de Euler: condicin de optimizacin intertemporal

En un problema econmico, muchas veces ms importante que obtener la tra


yectoria de una variable es la condicin de optimizacin intertemporal, y c
mo se interpreta dicha condicin en el marco de la teora econmica. Con este
propsito se emplea una condicin de equilibrio denominada ecuacin de
Euler. Esta ecuacin es similar a la vista en el clculo de variaciones; sin em
bargo, en el presente caso est planteada en tiempo discreto. Para derivar la
ecuacin de Euler utilizaremos las condiciones de primer orden planteadas en
(5). En primer lugar, debe despejarse el multiplicador de Lagrange de la
ecuacin (5.b), con lo cual se obtiene la siguiente expresin:

(13)

Por otro lado se despeja la ecuacin (5.a) y se adelanta un perodo, con lo


cual se obtiene:
Programacin dinmica 167

Reemplazando (13) y (14) en la condicin (5.a), finalmente obtenemos la


ecuacin de Euler:

z'
| dg, df, +1 = 0 (15)
du, du, v+1 dy,+1 dS , +i

_ ( <&,+. j

La ecuacin de Euler junto con la ecuacin de transicin:

3\+i = 8 , ( u , , y t ) (16)

resumen las condiciones de primer orden del problema (1). Para interpretar
de una manera ms sencilla la ecuacin de Euler, asumiremos que la ecuacin
de transicin no depende de la variable estado (gt(uO), con lo cual (15) se
simplifica del siguiente modo:

M - + d8> -o \/t = 0,1,2.... T (17)


du, du, fy(+1

Esta condicin im plica que la eleccin de la variable de control en el pe


rodo t debe ser tal que garantice que la funcin de retorno en el mismo
perodo sea la mayor posible, pero considerando el efecto de la asigna
cin sobre la funcin de retorno en el perodo siguiente. Ello se debe a
que a travs de la ecuacin de movim iento, las variables en distintos pe
rodos de tiempo se encuentran interrelacionadas. De este modo, las deci
siones en un perodo afectarn a la funcin de retorno en los siguientes
perodos. En este sentido, el segundo trm ino de la ecuacin (17) es un
producto de derivadas que miden el efecto de la eleccin de la variable
de control ut sobre la funcin de retorno en el perodo t+1 . D ichas de
rivadas constituyen una aplicacin de la regla de la cadena, ya que indi
can cmo cam bia la funcin de retorno ante una variacin de la variable
de estado en el perodo t + 1 , m ultiplicado por la variacin de esta va
riable ante un cambio en la variable de control en el perodo t .

De esta manera, si la condicin (17) se cumple para todos los perodos, la se


cuencia de la variable de control es ptima en la medida en que garantiza que
el control en cada perodo toma en cuenta el efecto sobre las funciones de re
torno en el futuro. Si estuviramos en el caso en el cual no existiera una ecua-
168 Apuntes de Estudio

ctn de movimiento (g, = 0 ), y no hubiera interrelacin entre las variables de


distintos perodos, entonces nos enfrentaramos a la siguiente condicin de
optimizacin:

~ =0 V/ = 0,1,2,..., T (18)
Ol,

que constituye la condicin de optimizacin empleada en los problemas est


ticos. La condicin (18) implica que la funcin de retorno en cada perodo se
encuentra maximizada. Dicho resultado es consistente, ya que no es necesario
considerar los efectos de la variable de control sobre perodos futuros.

1.3 Condicin de segundo orden'

Para asegurar que efectivamente a partir de las condiciones de primer orden


se obtengan las secuencias de las variables de control y estado ptimas, es
necesario emplear las condiciones de suficiencia planteadas en Sargent34. Es
tas condiciones establecen que si se cumple que:

a) f,(ut, y es una funcin cncava y acotada.

b) El conjunto definido por {yt+i, y,, u,: yt+i < gt(ut, yt))es convexo y compac
to para cualquier senda ut factible.

c) La secuencia de variables yt+I, ut (Vt = 0, 1,2,..., T) satisface las condicio


nes de primer orden de Kuhn-Tucker.

Entonces, yt+, u, (Vt = 0, 1, 2,..., T) da como resultado un mximo global de


V. Si la funcin de retorno fuera estrictamente cncava, dicho mximo global
sera nico.

A continuacin desarrollaremos dos aplicaciones econmicas sobre los con


ceptos vistos hasta el momento. En el primer ejemplo desarrollaremos un
problema microeconmico, en el cual un individuo enfrenta la decisin de
determinar la senda de consumo que maximice su utilidad intertemporal. El
segundo ejemplo es una aplicacin macroeconmica, en la cual se determina
el patrn de crecimiento ptimo de una economa. En vista de que el proce

3. B a s a d o e n la s c o n d i c i o n e s d e s u f i c ie n c i a d e K u h n - T u c k e r .

4. S a rg e n t, T h o m as. D y n a m iv M a r r o e c o n o m ic T lie o r y , C a m b r i d g e : H a r v a r d U n iv e rs ity


P re ss, 1987.
Programacin dinmica 169

dimiento para obtener los valores ptimos de las variables de control y estado
es relativamente engorroso, limitaremos la solucin del problema a la obten
cin de la funcin de poltica.

Ejemplo 1.- Asignacin de consumo y ahorro5

Un individuo cuenta con un stock de ahorros igual a St. Cada perodo, el


agente retira de sus ahorros un monto igual a c, para destinarlo a bienes de
consumo. El stock de ahorros remanente (S, - Ct) se deposita en un banco que
paga una tasa de inters constante e igual a r (0 < r < 1). De este modo, en
el siguiente perodo, el nuevo stock de ahorros ser igual a (1 + r)(St - Ct). Es
ta operacin se repite perodo a perodo hasta el momento T, cuando termina
el horizonte de optimizacin del individuo. El comportamiento de los aho
rros puede ser expresado de una manera simple, a travs de una ecuacin
de movimiento:

S l+I <(1 + 0 (5 , - C , ) V/ = 0,l,2,...,7" (19)

Dado un stock inicial de ahorros So, el objetivo del individuo consiste en


maximizar su bienestar intertemporal hasta el perodo T, empleando el fac
tor de descuento (3 ( 0 < < 1 ):
r
u ^ p ' m ) (2 0 )
f=0

Donde f(Ct) es la funcin de retorno, que se interpreta como la funcin de uti


lidad asociada a cada perodo. El problema que enfrenta el consumidor se re
sume del siguiente modo:

Maximizar (2 1 )
1=0
sujeto a S,+i - a (S, C, ) (a = (1 + r)) Vi =0,1,2,...,T
So > 0
S/+1 libre
S, > 0
C, > 0

5. P a ra m a y o r d e ta lle s o b re e s ta a p lic a c i n e c o n m ic a , v e r L o n a rd , D a n ie l y N g o van


Long, O p tim a l C o n tr o l T h e o r y a n d S ta tic O p tim iz a tio n in E c o n o m ic s , C a m b r i d g e : C a m b r i d g e
U n iv e rs ity P r e s s ,1 9 9 3 , p p . 1 7 9 - 1 8 1 .
170 Apuntes de Estudio

La resolucin del problema se divide en tres partes. En la primera se desarro


llar la ecuacin de Euler, para una funcin de utilidad genrica f,(Ct); en la
segunda, se hallar una funcin de poltica; y finalmente, se evaluarn las
condiciones de segundo orden.

a) Ecuacin de Euler

En los casos en que la funcin de utilidad es compleja, no es posible obtener


la funcin de poltica de una manera analtica, por lo que resulta conveniente
analizar la condicin de optimizacin intertemporal. Asumiendo una funcin
de utilidad general f(C,) (f (C t) > 0, f (Ct) < 0) y empleando la ecuacin de
Euler (15), obtenemos la siguiente condicin de equilibrio intertemporal:

( 22 )

El lado izquierdo representa la tasa marginal de sustitucin entre consumo


presente y consumo futuro, e indica cunto valora el consumidor en trminos
relativos una unidad de consumo de un perodo a otro. El lado derecho de la
ecuacin representa la tasa de inters bruta ( 1 + r), es decir, cunto se valora
en el sistema financiero una unidad de consumo de un perodo a otro. En el
equilibrio, las dos valoraciones deben ser iguales; de lo contrario, la asigna
cin de consumo no sera ptima. Si la tasa marginal de sustitucin fuera ma
yor a la tasa de inters bruta, el agente valora ms el consumo que el sistema
financiero, por lo tanto resultara conveniente incrementar el consumo. Por el
contrario, si la tasa marginal de sustitucin fuera inferior a la tasa de inters
bruta, convendra disminuir el consumo. Cuando la asignacin de consumo es
ptima en cada perodo de tiempo, entonces ambas tasas deben ser iguales.

La condicin de equilibrio tambin puede ser interpretada de otra forma. Su


pongamos que en un perodo t disminuye el consumo en una unidad, ello
trae como consecuencia una disminucin de la utilidad en (3f (Ct). Esta uni
dad de consumo puede ser invertida en un banco, donde se puede obtener un
rendimiento constante e igual a r . En el perodo siguiente se podr contar
Programacin dinmica 17 1

con (1 + r) unidades de consumo. En t + 1, el bienestar del agente se incre


mentar en p t+1 f (Cl+i)(l + r). Si la asignacin es ptima, se debe cumplir que
el agente debe ser indiferente entre ambas opciones, con lo cual llegamos a la
siguiente condicin:

, +r )
(23)
se, p s c ,

la cual es equivalente a la ecuacin de Euler.

b) Funcin de poltica

Asumiendo una funcin de utilidad logartmica f(Ct) = LnCt, la funcin La-


grangiana del problema es la siguiente:

L = ^ p ' L n C , + ^ X , ( a ( S , - C,) - S l+) (24)


(=0 r=0

La condicin de primer orden se resume del siguiente modo:

dL 1 , dL
a . ---- = P ------ aX. < 0 C >0 -----C, =0
dC, C, de, (25)
dL
b. = -A, +dk,, <0 S , >0 0 V/= 0,1,2....,L
dS, dS,L,

c. L- = a ( S , - C , ) - S . tl >0 A, >0 -A , =0
dX, ' dX,

Ahora resolveremos el problema mediante induccin hacia atrs. En primer


lugar, empezaremos por resolver el problema en el perodo T . Para dicho
perodo se cumple:
^ \i
IV

- dL- = P r - a X r < 0
U

O
n

II

dC, H Cr ' (26)


^

^1
O
VI

o
Al

is*

o
II

i +t
ii
1

1

dsT+l 1

c. = orOS,. - CT) - S r+l > 0 A-, > 0 A, = 0


dAj dX-,
172 Apuntes de Estudio

De manera intuitiva podra determinarse cules son las asignaciones de con


sumo y ahorro en el ltimo perodo. Qu sucedera si el nivel de ahorro fuera
positivo en el perodo T + 1? En dicho caso nos encontraramos en una si
tuacin subptima, ya que en la medida en que no existe utilidad por el con
sumo realizado ms all del perodo T, cualquier herencia dejada por el
agente implicara una prdida de bienestar. En este sentido, el ahorro ptimo
St+i debera ser igual a cero. Del mismo modo, como la utilidad marginal es
siempre positiva, el consumo ptimo deber ser mayor a cero en todo el hori
zonte temporal. A continuacin se demostrarn estos resultados matemtica
mente. Dado que C j> 0, entonces se satisface la condicin:

I <27,

F
a C,

Reemplazando (27) en (26.b) obtenemos lo siguiente:

L >0 (28)
a CT

Como el consumo es positivo, la expresin anterior es estrictamente positiva.


Por otra parte, en (26.b) se cumple la tercera condicin:

7 T S'* '=0 (29)

Como el primer trmino en (29) es estrictamente positivo, ello implica que


el ahorro en el ltimo perodo es igual a cero. Esta igualdad equivale a la
condicin de transversalidad del problema de control ptimo y del clculo
de variaciones, en la medida en que determina el valor de la variable de es
tado en el ltimo perodo. El resultado obtenido (S t+i = 0) lo reemplazamos
en la ecuacin de movimiento, con lo cual obtenemos la siguiente funcin
de poltica:

CT = ST (30)
Programacin dinmica 173

De igual forma, en el perodo T - 1 se cumplen las condiciones:

ST > 0 Sr = 0
' dST

= a(S r_t - cy_,) ~ S T > 0 X

Considerando que CT.i > 0 y despejando la ecuacin (31.a.), obtenemos lo


siguiente:

Por otra parte, si consideramos que S t > 0, se cumple:

(33)

Reemplazando (27) y (32) en (33), se llega a la siguiente relacin:

a c r _x ~ * c, (34)

CT = a fiC, ,

Reemplazando (30) y (34) en la ecuacin de movimiento, se obtiene final


mente la funcin de poltica para el perodo T - 1:

a p C T_{ = a ( S T_l - C T_)


(35)
174 Apuntes de Estudio

P a ra d perodo T - 2 se cumplirn las condiciones:

dL

o
VI

Al
- ^ - c , , = o

ii

1
a C r-! '
(36)

O
J L .

-
VI

Al
ii
, = 0

i
d L -S,

+
ds, ,
V i

"")
dL

- r
t>5

O
c/i

O
Al
3

IV
ii

II
o
d X ,._ 2

Las condiciones de (36) junto con la funcin de poltica (35) determinan la


funcin de poltica:

Sr-2
Cr (37)
\ +P +p 2

En general, para el perodo t , la funcin de poltica tomar la siguiente for-

S, 1 ~P
C, =- -s, vt = 0 ,1 , 2 ....r (38)
1 + / + ... + /P \-P '

Esta funcin de poltica indica que el consumo es igual a una fraccin, cam
biante en el tiempo, del nivel de ahorro.

c) Condicin de suficiencia

Con el fin de asegurar que las condiciones de Kuhn-Tucker efectivamente


maximicen la funcin objetivo, se evaluar la condicin de suficiencia. En
primer lugar, la funcin de retorno debe ser cncava, lo cual se satisface:

d \ -<0 (39)
d C ,2

En segundo lugar, la ecuacin de movimiento es lineal y se clasifica como


funcin convexa:
Programacin dinmica 175

Por lo tanto, la funcin de poltica obtenida a travs de las condiciones de


Kuhn-Tucker permite obtener las secuencias de las variables de control y estado
que maximizan la funcin objetivo.

E jem p lo 2.- M o d e lo d e c r ec im ien to n e o c l sic o 6

Suponga una economa en la cual se produce un solo bien de acuerdo con la


funcin de produccin 0 (k,). Cada perodo, la produccin se destina solamente a
dos fines: consumo (Ct) o inversin en capital para el perodo siguiente (kt+i).
Dicho proceso de asignacin puede representarse a travs de la siguiente ecua
cin de movimiento:

C , + k l+] < 0 { k t ) (41)

Por otra parte, el objetivo de la sociedad es maximizar su bienestar intertem


poral empleando el factor de descuento |3 :

U = ^ P ' f ( c ,) (0< /3 < 1) (42)


(=0

De esta manera, el problema que enfrenta el planificador social se resume del


siguiente modo:

T
Maximizar u ^ P 'n c ,) (43)
l-o
sujeto a c , + c+i - 0(^i)
A0 > 0

kTrl libre
k,u > 0
C, > 0

6. La aplicacin ha sido tomada de Sargent, Thomas, op. vit , pp. 24-27. El modelo pro
puesto se basa en el artculo escrito por Brock, William y Leonard Mirman, Optimal Economic
Growth and Uncertainty: The Discounted Case, en Journal o f Economic Theory, 1972. pp.
479-513.
176 Apuntes de Estudio

Al igual que en el primer ejemplo, la resolucin del problema se divide en


tres partes. En la primera se establece la condicin de primer orden del pro
blema, para funciones generales f(Ct) y (j)(kt). En la segunda, se halla la fun
cin de poltica ptima. Finalmente, en la tercera seccin, se evala la condi
cin de segundo orden.

a) Ecuacin de Euler

Como se mencion anteriormente, en algunos casos, en lugar de hallar las


trayectorias de las variables de control y estado resulta conveniente analizar
la condicin de optimizacin. Asumiendo funciones genricas para el nivel de
utilidad f(Ct) (f(Ct) > 0 f (C,) < 0) y la produccin (J)(kt) ((J>(kt) > 0 (]) (kt) <
0), podemos plantear la ecuacin de Euler para analizar la condicin de equi
librio intertemporal. Considerando la ecuacin de movimiento k,+i = (j)(kt) -
Ct, la ecuacin de Euler establece lo siguiente:

(44)

La interpretacin de la ecuacin de Euler es muy similar a la del ejemplo an


terior. En el contexto macroeconmico, el uso alternativo de una unidad de
consumo ya no consiste en realizar un depsito en un banco sino en la inver
sin en capital. De esta forma, la ecuacin de Euler establece que la tasa mar
ginal de sustitucin entre consumo presente y consumo futuro debe ser igual a
la productividad marginal del capital. Si la tasa marginal de sustitucin fuera
mayor a la productividad marginal, entonces, la sociedad como un todo valo
ra ms el consumo presente que la inversin en capital; por lo tanto, la deci
sin ptima sera aumentar el consumo y disminuir la inversin en capital.
Por el contrario, si la tasa marginal de sustitucin fuera inferior a la producti
vidad marginal, convendra disminuir el consumo e incrementar la inversin
en capital. De esta forma, en el equilibrio, las secuencias ptimas de consumo
y capital deben cumplir con una relacin de igualdad entre la tasa marginal de
sustitucin y la productividad marginal.
Programacin dinmica 177

b) Funcin de poltica

Para obtener la funcin de poltica asumiremos una funcin de utilidad loga


rtmica f(C,) = LnC,, asimismo se asumir la funcin de produccin <>(k,) =
k . Como la utilidad marginal es siempre positiva, entonces nunca se desper
diciarn unidades de consumo y la restriccin (41) siempre se cumplir con
igualdad. De este modo, para simplificar el problema, reemplazaremos la res
triccin (41) en la funcin objetivo (42), con lo cual obtendramos la siguien
te funcin Lagrangiana:
T
= / 3 ' /.(*, ~ ki+\) (45)
r=0

Este problema presenta una ligera variacin con respecto al anterior. Con el
fin de hacer ms simples los clculos operativos, se ha eliminado la variable
Ct del problema y se ha considerado como nica variable de eleccin a k1+i.
En este sentido, la condicin de primer orden es la siguiente:

ak
dL = -/T ' +/r <0 /C , > 0 - k,^ = o (46)
dk, dk,_
V? = o,i, 2 , . . r - i
dL
dkni- = - p ' -(k
- - -1-k -, H)
- <0 t ,>0
dk.
-kn] = 0

Vr =T

Para resolver el problema mediante el mtodo de induccin hacia atrs, de


bemos empezar por la condicin de primer orden en el perodo T :

dL 1 dL
= ~ P 7 -<0 >0 kTj_ 0 (47)
dkT+ (kT kT+l) dk-r

Al igual que en el ejemplo anterior, intuitivamente resulta razonable plantear


que el stock de capital kx+i sea igual a cero. En caso contrario, se estaran
desperdiciando recursos y la sociedad alcanzara un nivel de bienestar subp
timo. A continuacin demostraremos este resultado matemticamente. La de
rivada del lagrangiano con respecto a kx+i es igual a:

= ------- 1------- > 0 (48)


dkT+ (kj - kT+l)
178 Apuntes de Estudio

La expresin (48) es estrictam ente positiva, ya que por la restriccin (41) el


denominador equivale al consumo7. Ello implica que se debe cumplir la
condicin:

dL
kr+\ - P ' ~k7+i - 0 (49)
dk +i (k? - * r +1)

Lo cual significa que necesariamente kr+i = 0. Siguiendo con el procedimien


to, en el perodo T - 1 se cumplen las condiciones:

dL _ _o 7 '-1 1 + nT (^ T d_
kT = 0 (50)
dk (A>_, - kT) (k - kT+]) SkT

Para resolver las condiciones partimos de la condicin Rt > 0, con lo cual se


cumple:

3L _(
i. "X .o
dk, (k '^ -k ,) (k' - k lt) (51)

L ' (/i k
' I +afi 1

La condicin (51) constituye la funcin de poltica que determina el stock de


capital ptimo para el perodo T, en funcin del capital en T - 1. En T -
2 , las condiciones de primer orden estn dadas por:

dL dL
-p7 + P7 -< 0 kT > 0 kT = 0 (52)
dkj (kT_2 kr_|) (kL
T kr) dkT

Partiendo de la condicin k-r-i > 0, se cumple que:

5L 1 ak',
dkT_:
=-p' - + PT-
(k'_, - kr_) (53)
(k -i k )

afik" _ 1
(kr , - k , ) (*_2*v-,)

7. P a r a q u e e l m o d e l o s e a c o n s i s t e n t e , e l c o n s u m o d e b e s e r e s t r i c t a m e n t e p o s i t i v o . O e lo
c o n t r a r i o , a p a r t i r d e la f u n c i n d e r e t o r n o n o s e p o d r a n o b t e n e r v a lo r e s r e a l e s q u e r e p r e s e n t e n
el n iv e l d e b ie n e s ta r.
Programacin dinmica 179

Reemplazando (51) en (53) se obtiene la funcin de poltica para el perodo


T - 2:

k ~aB
K j - i - a p + a^ kkaT _ 2 (54)
1 +ap +a~P~

En general, la funcin de poltica para el perodo t viene dada por:

(aP')T~
--a/3 Vi =0,1,2,..., T (55)
1 - ( a / 3 ) T - l+l K<

De manera similar al ejemplo anterior, el capital en un perodo constituye una


fraccin variante en el tiempo de la produccin agregada en la economa.

c) Condicin de suficiencia

En la medida en que la funcin de utilidad es estrictamente cncava:

L -<o (56)
dC,2 c:

y la ecuacin de transicin es convexa:

H l = 0 (57)
dC:

las condiciones de Kuhn-Tucker constituyen una condicin necesaria y sufi


ciente para la maximzacin de la funcin objetivo. En este sentido, la se
cuencia de consumo y capital generada a partir de la funcin de poltica (55)
es ptima.

2. Programacin dinmica con horizonte temporal finito

La resolucin del problema (1) a travs de las condiciones de Kuhn-Tucker,


si bien es correcta, no es la manera ms eficiente de enfrentar el problema.
Tal como se ha podido apreciar, la resolucin de las condiciones de primer
orden de Kuhn-Tucker involucra clculos engorrosos para despejar las varia
180 Apuntes de Estudio

bles de control y de estado ptimas. Con la finalidad de resolver aquellos


problemas con una estructura similar a (1), Bellman8 desarroll el mtodo de
programacin dinmica. Esta tcnica aprovecha la naturaleza recursiva del
problema para resumir el planteamiento en una relacin denominada ecua
cin de Bellman. El mtodo se sustenta en el principio de optimalidad, el
cual ser explicado a continuacin.

2.1 El principio de optimalidad

El problema de programacin dinmica (1) cumple con dos propiedades fun


damentales, que permiten la resolucin de una forma recursiva:

a) Propiedad de separabilidad: Para todo t, las funciones de retorno y tran


sicin, ft() y gt(*), dependen de t y de los valores contemporneos de las
variables de control y estado, pero no de sus valores pasados o futuros.

b) Propiedad de aditividad: El funcional objetivo V es la suma de las fun


ciones de retorno en los T perodos.

Sobre la base de estos dos principios se establece el principio de optimalidad:

Principio de optimalidad

La secuencia de variables de control ut* (Vt = 0, 1, 2,..., T) es una solucin


ptima al problema (1) si y slo si ut* (Vi = t, t + 1, t + 2,..., T) resuelve el
siguiente problema Vt = 0, 1, 2,..., T:

r
Maximizar V, = ' Z f T(yT,uT) + Z ( y T+l) (58)
T l

sujetoa y \ +x= g T( y \ ,u z ) \/z = t,t + l,t + 2,...,T


y, dado
yy+1 dado

Ntese que en el problema (58), sin prdida de generalidad, se ha supuesto


que las trayectorias de las variables de control y estado son estrictamente po
sitivas y que la ecuacin de movimiento se satisface con una relacin de
igualdad.

8. B e llm a n , R ic h a r d , o p . cit.
Programacin dinmica

En trminos intuitivos, el principio de optimalidad establece que la variable


de control ptima ut* posee la propiedad de que en cualquier perodo t, el
conjunto de decisiones restantes ut+i*, u1+2*,..., ut* debe ser ptima con res
pecto al valor actual de la variable de estado yt, el cual se encuentra determi
nado en funcin del valor inicial yo y las decisiones pasadas de la variable de
control uo*, ui*, U 2* , . . . , u,-i*. La esencia del principio de optimalidad puede
resumirse en el siguiente esquema:

* * * * % * *
Mq , li j 5 14 2 } ^ J _|_ 1 5... li y _ j li 'Y

La secuencia de variables de control u," (V t = 0, 1, 2,..., T) perteneciente al


conjunto A ser ptima si y solo si dicha secuencia es ptima por tramos9.
Es decir, el conjunto A ser ptimo si todos los subconjuntos (tales como,
B y C) tambin son ptim os10.

Demostracin

El principio de optim alidad puede ser dem ostrado form alm ente a partir
de una contradiccin. Supongam os que la secuencia u o * , ui*, U 2* , . . . , u t *
es ptim a y resuelve el problem a (1). Ahora, considerem os que la se
cuencia ut*, U|+i*, u1+2 *,..., ut* no cum ple con la condicin ( 5 8 ) . D efina
mos la secuencia ut\ u1+i', ul+2*,..., u - r \ como la solucin al problema
( 5 8 ) . Si as fuera, la secuencia u o * , ut*, U 2* , - . . , u n * , ut',..., u-r* generara
un mayor valor del funcional objetivo V que el conjunto de variables de
control u o * , u;*, U 2* , u t. i * , ut*,..., u -r*. Este resultado contradice la hip
tesis inicial, la cual establece que la ltima secuencia de variables consti
tuye la solucin al problem a ( 1 ).

9. P o r tra m o s s e e n tie n d e a a q u e lla s s e c u e n c ia s d e v a ria b le s d e c o n tr o l q u e e m p ie z a n e n u n

p e ro d o a rb itra r io t , y te r m in a n e n e l ltim o p e ro d o T .
10. E s d e c ir , r e s u e lv e n (5 8 ).
182 Apuntes de Estudio

2.2 La ecuacin de Bellman

El problema (58) puede ser planteado en trminos de una relacin recursiva


denominada ecuacin de Bellman:

V,(y,) = Maximizar [/,(> ,, w,) + V,+1 (_y,+1)] (5 9 )

sujeto a },+i = g,(y,,M,) Vr = 0,1,2,...,T


y, dado
) 'o >
yT+ dado

En la ecuacin (59), la maximizacin se realiza exclusivamente con respecto


a la variable de control, y la variable de estado se mantiene constante con el
fin de obtener la funcin de poltica. En la ecuacin de Bellman, V, represen
ta la funcin de valor para el problema (58) en el perodo t. Si reemplaza
mos la restriccin en la funcin objetivo, la condicin de primer orden del
problema sera la siguiente:

dfi , dg, dv,+\ =Q (60)


du, du, d y , +l

La condicin (60) junto con la ecuacin de transicin representan un sistema


de dos ecuaciones con tres incgnitas (u,, yt, yt+i). A partir de dicho sistema es
posible obtener la funcin de poltica que relacione la variable de control con
la de estado: ut = h(yt).

2.3 La ecuacin de Benveniste y Scheinkman

Para caracterizar completamente las condiciones de primer orden del proble


ma (1), tambin es necesaria la ecuacin de Benveniste y Scheinkman11, que
constituye una aplicacin del teorema de la envolvente1112. Para obtener esta
ecuacin reemplazamos la funcin de poltica ut = h(yt) en la ecuacin de

11. B e n v e n is tc , L a w r e n c e y J o s e S c h e in k m a n , " O n th e D if f e r e n tia b ility o f th e V a lu e F u n c

tio n in D y n a m ic M o d e ls o f E c o n o m ic s " , e n E c o n o m e tr ic c i, v o l . 4 7 , N o . 3 , E v a n s t o n , 111.: B l a c k -


w e ll P u b lis h e r s , 1 9 7 9 , p p . 7 2 7 - 7 3 2 .

12. V e r c l A n e x o a l F in a l d e l c a p i t u l o .
Programacin dinmica 183

transicin, con lo cual obtenemos yt+i = gt(yt,h(y,)). Posteriormente se reem


plazan la funcin de poltica y la ecuacin de transicin en la ecuacin de
Bellman maximizada, con lo cual se obtiene la siguiente relacin:

(61)

En (61), la variacin de v, afecta directamente a la funcin de valor a travs


de la misma variable e indirectamente, a travs de la ecuacin de movimiento
(y,+i = gt(y,,h(y,))) y la funcin de poltica (ut = h(y,)). El teorema de la envol
vente establece que cuando la funcin de valor se encuentra maximizada, so
lamente se consideran los efectos directos. En este sentido, a partir del teore
ma de la envolvente, se cumple lo siguiente:

(62)
dy, dy, <?v,+( dy,

A la relacin (62) se le denomina la ecuacin de Benveniste y Scheinkman.

2.4 La ecuacin de Euler

A partir de la condicin de primer orden de la ecuacin de Bellman y la ecua


cin de Benveniste y Scheinkman, es posible obtener la ecuacin de Euler
derivada en la seccin anterior. El primer paso para obtener la ecuacin de
Euler consiste en despejar la derivada de la funcin de valor en (60) y adelan
tarla un perodo:

dV,tl _ (?,,,
(63)
dy,,2
i

El segundo paso consiste en adelantar la ecuacin de Benveniste-Scheinkman


un perodo, y reemplazar la relacin obtenida en (63):

i , iL
dv,.L= i _ dg ,A
(64)
dy,,x <?y,.i ^ ijl V,+i
dun
184 Apuntes de Estudio

Reemplazando (64) en la condicin de primer orden de la ecuacin de Bell


man (60) obtenemos:

# ,+ 1 <%,+ ()uf+
= 0 (65)
/)tt, dut (A\ *,+ 1 <kn
Jl

que no es otra cosa que la ecuacin de Euler derivada en (15). De igual


forma, asumiendo una ecuacin de transicin que depende solamente de la
variable de control, obtenemos una versin simplificada de la ecuacin de
Euler:

dft , 3St df, +1 Q


( 66 )
du: du, <?v(+i

Tal como se ha analizado anteriormente, la ecuacin de Euler garantiza que


la eleccin de la variable de control ptima sea tal que la funcin de retor
no tome el valor mximo posible, considerando los efectos en los siguientes
perodos.

A continuacin se desarrollarn los mismos ejemplos vistos en la primera


seccin, empleando la tcnica de la programacin dinmica. Como los con
ceptos de la ecuacin de Euler y la condicin de suficiencia son iguales a los
analizados anteriormente, en los ejemplos solamente se incluir la derivacin
de la funcin de poltica y la funcin de valor.

Ejem plo 1.- A signacin de consum o y ahorro

En trminos de la ecuacin de Bellman (59), el problema que enfrenta el con


sumidor para elegir entre consumo y ahorro se resume del siguiente modo:

V,(St ) = Maximizar \3' LnCt +E(+1 (S,+1)| (6 7 )


Q
sujeto a S+1 = a ( S ,- C ,) (a = 1+ r) V; = 0,1,2,....T
St dado
S0 > 0
s T+l= o
Programacin dinmica 185

Para hallar la funcin de poltica es necesario resolver el problema empezan


do por el ltimo perodo. Como la funcin de utilidad intertemporal no consi
dera beneficio alguno por el consumo generado ms all del perodo T (no
hay bienestar por dejar herencias), la funcin de valor Vt+i es igual a cero.
As, el problema en el ltimo perodo se resume del siguiente modo:

V, (S,) = Maximizar | LnCr ]

sujeto a 0 = a ( S r - C ,)
Sr dado

El resultado de este problema es la funcin de poltica en el perodo T :

C = S T (69)

y la funcin de valor:

Vr = P 1 LnST (70)

En el perodo T - 1, la ecuacin de Bellman respectiva es la siguiente:

, ) = Maximizar \f} ~'LnCr^ + 31LnS,]

sujeto a Sr = - C7._,)
Sr , dado

La condicin de primer orden de (71) da como resultado la funcin de polti


ca en el perodo T :

1
=o (72)
c ,; -C, ,

Al reemplazar la funcin de poltica en la ecuacin de Bellman, se obtiene la


funcin de valor:

Ly- i P \PLn(xji (1 + P)Ln(\ + ft) + (1 + P)L/iSr _| J (73)


186 Apuntes de Estudio

Para el perodo T - 2, la ecuacin de Bellman est dada por:

V . = Ma.ximizar 1/31 ' LnCr_-, + 31 l[PLnaj3 + (1 + P)Ln ^


sujeto a ST , = a ( S r _-, - CT_-,)
S r _-, dado

la cual da como resultado la funcin de poltica:

ST-i
c, (75)
1 + p + p-

y la funcin de valor:

V T_-, = P1 ~[(P + 2 / jtjiezP (1 + p + P ~)Ln(\ + P + P ~) + (1 + P + P ~ )LuSr_2j (76)

En general, para el perodo t, la funcin de poltica y la funcin de valor


tomarn la siguiente forma:

S, 1~P (77)
S,
\ + p + ... + p T~ 1 - P t -'+]

1 -pr-'+ ' \-P 1-JVp-i+i


V , = p X JP Ln ap \Ln + l.nS, (78)
l-P " i - T ' P
1 ,=0

Como se puede apreciar, la funcin de poltica obtenida a travs de la tcnica


de programacin dinmica es la misma que la obtenida a travs de las condi
ciones de Kuhn-Tucker.

Ejemplo 2.- Modelo de crecimiento neoclsico

La ecuacin de Bellman para el problema de crecimiento econmico ptimo


est definida del siguiente modo:

V(kt) = Maximiz.ar \P' Lnjk'P - kn ) + Vt., (k^ ) | (7 9 )


k,+ i
kt dado
k ,, = 0
Programacin dinmica 187

Este problema difiere ligeramente del anterior, en la medida en que la funcin


de retorno incorpora la ecuacin de movimiento. Sin embargo, esta caracte
rstica no altera los resultados de la ecuacin de Bellman. En este problema,
como el capital en el perodo T + 1 no genera bienestar a la sociedad, se
cumple que Vt+i = 0. Al igual que en el ejemplo anterior, para obtener la fun
cin de poltica es necesario resolver la ecuacin de Bellman empezando
desde el perodo T hasta el perodo inicial. Para t = T, la ecuacin de Bell
man es la siguiente:

Vr (kT) = Maximizar f3 Ln(k* - kT+l)]


kr +
kT dado
kr+=0

Como el stock de capital ptimo en el perodo T + 1 es igual a cero, la fun


cin de valor sera la siguiente:

VT = [3T L n k (81)

Para el perodo T - 1, la ecuacin de Bellman sera la siguiente:

VT_l(kT_) = Maximizar [ p T^[Ln(k_ - kT) + 3TLn(k^)]

dado

A partir de la condicin de primer orden se obtiene la funcin de poltica


respectiva:

- / 3 y 1 ----------- + p T ak (83)
Ia - l ka
Kr - \ Kr K

k - ha
1 + a 0 I' " 1

Reem plazando la funcin de poltica (83) en la ecuacin de Bellman, se ob


tiene la funcin de valor:

VT-\ ~ PT 1[ul3Lna[} - (1 + aP)Ln(l +afi) + (1 + a$)Lnkj_xJ (84)


188 Apuntes de Estudio

Para el perodo T - 2, la ecuacin de Bellman correspondiente sera:

' -L L = Ma.xiinizar a/i Ijkx P + O +( [ )I ji (85)


k. 1 + a/J
dado

La condicin de primer orden de (85) est dada por:

(1 + aP)ak,
P T- ( 86 )
W -z-kr-

aP( 1 + ap)kj_
( kj _2 ky_ | )

Reemplazando la funcin de poltica (83) en (8 6 ), se obtiene la funcin de


poltica para el perodo respectivo:

*r-> = /3------1 + ^ (87)


1 + ap + a~p~

Por otra parte, para el perodo T-2, la funcin de valor es la siguiente:

V , = p 1 2\(aP)(l+aP)lM(aP)(\ +<xP)-(\+aP+(aP)2)lM(\+(xP +(aP)2) g^


+aP'l,u(aP) - P(l +aP)Ln(l +aP) +([ +aP +(<xPy)Lnkp1\

En general para el perodo t , la funcin de poltica y la funcin de valor


sern:

l- ( aP)1 '
k. (/ i ----- k (89)
H \~(aP) '

,, 1- ( a P ) 1 i ,, 1- ( a P ) > - 1-(a/))'' d \-(a P ) ~


V , = p< 1P> {(x\)( -'2 )[J l ( a P ) ( )-( -2-2 ) '
1-H/f 1- viP 1- a P I-e x p
1 -(/))'
+( C )/-*, I
l~/f J
Programacin dinmica 189

3. P r o g r a m a c i n d in m ic a c o n h o r iz o n te te m p o r a l in fin ito

AI igual que en el control ptimo, existen problemas de optimizacin dinmi


ca donde el horizonte temporal relevante es infinito. El problema general de
programacin dinmica en dichos casos es el siguiente:

Maximizar v = Y J fSy<,) (91)


/=o v J
sujeto a v,+i = ,(>,, ,) Vr = 0,1,2,...,oo
y0 dado

El problema (91), al igual que (1), se resuelve mediante la ecuacin de Bell


man y la ecuacin de Benveniste y Scheinkman. Sin embargo, como la fun
cin de retorno usualmente se encuentra multiplicada por un factor de des
cuento del siguiente modo:

f , { y n ut ) = f ( y t ,u t ) (92)

resulta conveniente modificar la ecuacin de Bellman con el fin de eliminar la


variable temporal (t) que aparece en el factor de descuento, para as obtener
una expresin ms simple de la funcin de valor. Para ello definiremos la
funcin de valor corriente (W t), que no es otra cosa que la funcin de valor
(Vt) multiplicada por la inversa del factor de descuento:

W ,{yt ) = p - ' V ' i y , ) (9 3 )

Mientras que la funcin de valor (Vt) se encuentra medida en trminos del


bienestar percibido en el perodo inicial (t = 0 ), la funcin de valor corriente
(W,) se encuentra expresada en unidades de bienestar percibido en el perodo
t. De esta manera, empleando el concepto de la funcin de valor corriente,
la ecuacin de Bellman (59) para la funcin de retorno descontada (92) es la
siguiente:

w , (}, ) = Maximizar [/(> , , m, ) + PWi+ (y,+1)]


(94)
sujeto a +1 Vt = 0,1,2,..,,oo

y, dado
y0 dado
190 Apuntes de Estudio

Tal como se puede apreciar en (94), el tiempo no aparece explcitamente en la


ecuacin, lo cual facilita en cierta medida la resolucin del problema.

Adicionalmente a la ecuacin de Bellman, es necesario emplear una metodo


loga complementaria para poder hallar la funcin de poltica del problema.
En esta seccin veremos dos de las metodologas ms conocidas para hallar la
funcin de poltica y la funcin de valor: la metodologa de las aproximacio
nes sucesivas y la metodologa de adivinar y verificar. Asimismo, se de
sarrollarn los dos ejemplos vistos en la seccin anterior, pero incorporando
un horizonte temporal infinito.

3.1 Mtodo de las aproximaciones sucesivas

Este mtodo consiste en construir una secuencia convergente de funciones de


valor con sus respectivas funciones de poltica. Esta secuencia se obtiene ite
rando la ecuacin de Bellman (59)

Wj +i (y T- j ) = Maximizar [ f ( y T_ j,u r_ j ) + fiW J(y T_j+)]


1-1
sujeto a y T- j+i= g j ( y T- j ur - j ) V; = 0,1,2,...,
yT_j dado
y0 dado

Se parte de una condicin inicial W o= 0, y a partir de (95) calculamos la si


guiente funcin de valor corriente Wi. Posteriormente, reemplazamos Wi en
la ecuacin de Bellman para obtener W 2. El procedimiento se realiza iterati
vamente hasta que se obtenga una funcin de valor corriente Wj convergente.
En trminos prcticos, el mtodo de las aproximaciones sucesivas consiste en
resolver la ecuacin de Bellman de la misma forma que en el caso del hori
zonte temporal finito, pero adems a la funcin de valor y a la funcin de po
ltica resultantes se les debe tomar el lmite cuando T> 00.

Ejemplo 1.- Asignacin de consumo y ahorro

El problema de asignacin de consumo y ahorro cuando el horizonte temporal


es infinito es el siguiente:

Maximizar U ~ X LnC (96)

sujeto a Sl+ = a ( S ,- C ,) Vt = 0,1,2,..., OO


S0 dado
Programacin dinmica 191

Mediante el mtodo de las aproximaciones sucesivas, la solucin a (96) se


obtiene tomando el lmite a (77) cuando T> >, con lo cual se obtiene la fun
cin de poltica convergente:

C, = ( l ~ P ) S , (97)

La funcin de poltica (97) indica que el consumo ptimo en un horizonte


temporal infinito constituye una fraccin constante de los ahorros. Por otro
lado, teniendo en cuenta la igualdad13:

2>
t= 0
p
(1 - p ) 2
(98)

la funcin de valor convergente para un horizonte temporal infinito es la siguiente:

V ,= P ' P L n a P + ----- L n ( S ,( l- p ) ) (99)


(i-p y - 1-0

Considerando la definicin (93), la funcin de valor corriente para el horizon


te temporal infinito sera:

W, = ~ l ^ LnaP + T [- Ln*S <{l~ P P ( 100)


(l ~ p ) 1 ~p

la cual no incorpora de manera explcita el tiempo.

Ejemplo 2.- Modelo de crecimiento neoclsico

El problema de crecimiento ptimo para un horizonte temporal infinito sera


el siguiente:

Maximizar U ^ P 'L n C , (1 0 1 )
1=0
sujeto a fc,+i = kj - C, Vf =0,1,2,...,
k0 dado

13. D ic h a ig u a ld a d se e n c u e n tra d e s a rro lla d a en la e c u a c i n 21 del lib ro de S a rg e n t,


T h o m as, M a c r o e c o n o m ic T h e o r y , N u e v a Y o r k : A c a d e m i c P r e s s , 1 9 7 9 , p . 8 8 .
192 Apuntes de Estudio

La solucin a (101) se obtiene tomando lmite a (89) cuando con lo


cual la funcin de poltica converge a la expresin:

*,+i = a [ 3 k ? (102)

La funcin de poltica (102) indica que el stock de capital en un perodo es


una fraccin constante de la produccin (k,a) en el perodo anterior. Del mis
mo modo, al tomar el lmite a (90) obtenemos la funcin de valor para el ho
rizonte temporal infinito:

aP
Ln(\ - a P ) + LnaP Lnk (103)
-aP I-a P

Sobre la base de la definicin (93), la funcin de valor corriente sera la siguiente:

w , (k, ) = Y ^ -j^ L n (\ - ap) + | LnaP + ! Lnk? (104)


1 -aP

3.2 Mtodo de adivinar y verificar

Este mtodo consiste en adivinar la funcin de valor o la funcin de polti


ca y posteriormente verificar la adivinanza, a travs de la ecuacin de
Bellman y la ecuacin de Benveniste y Scheinkman. La eficiencia de este m
todo para resolver (91) depender de: (a) la existencia de una solucin nica
al problema, y (b) la suerte en realizar la adivinanza. Este mtodo se utiliza
usualmente para formas funcionales especficas, tales como preferencias cua
drticas y restricciones lineales o preferencias logartmicas y restricciones con
funciones Cobb-Douglas.

El ejemplo de asignacin de consumo y ahorro se resolver adivinando la


funcin de poltica, mientras que el modelo neoclsico de crecimiento se re
solver adivinando la funcin de valor.

Ejemplo 1.- Asignacin de consumo y ahorro

Resolveremos el problema de asignacin de consumo y ahorro con horizonte


temporal infinito, suponiendo que la funcin de poltica toma la siguiente
forma:

c, =xS, (105)
Programacin dinmica 193

donde constituye una constante por determinar. Para hallar el valor de


reemplazamos (105) en la ecuacin de Euler (22), asumiendo una funcin de
retorno logartmica f(Ct) = Ln(C,), con lo cual obtenemos:

X^in = a
(106)
X0S,

Reemplazando la ecuacin de transicin (19) en (106), obtenemos la expresin:

X aS ,( l - x )
(107)
XPS,

Con lo cual obtendramos la solucin:

X =1~P (108)

y la funcin de poltica:

C, = ( 1 - j3)5, (109)

Esta funcin coincide exactamente con la solucin hallada en (97). Para


hallar la funcin de valor para el perodo t, es necesario realizar un artifi
cio. Empleando la definicin de la funcin de valor (61), realizamos reempla
zos sucesivos de la funcin de valor hasta derivar la siguiente expresin:

v,(y,) = ' E f l+j ( y l+j M y l+j)) (U0)


r- o

donde h(yt) constituye la funcin de poltica. Para el presente problema es ne


cesario evaluar la siguiente funcin de valor:

,+ILnCl+J (111)
./=()

Reemplazando la funcin de poltica (109) en la ecuacin de transicin (19),


obtenemos una funcin que relaciona el consumo en cada perodo con el aho
rro en el perodo t :

C ,+; = ( l - P ) ( a P ) J S, (112)
194 Apuntes de Estudio

Reemplazando (112) en (111), finalmente obtenemos la funcin de valor:

V , = ^ p ,+JL n (l-P )(a l3 )JS, (113)


j=o

La funcin de valor (113) converge a la siguiente expresin:

V ,= P 13 Lna3 + Ln(S. (1 - 3)) (114)


(1 - P ) 2 1 -/3

Mientras que la funcin de valor corriente sera igual a:

W. = ---- ^ ---- Lnaf + Ln(S. (1 - (3)) (115)


' (1 - P ) 2 H 1 - 3

Tanto (114) como (115) coinciden con la solucin obtenida a travs del m
todo de las aproximaciones sucesivas.

Ejemplo 2.- Modelo de crecimiento neoclsico

Para resolver este ejemplo supondremos que la funcin de valor corriente to


ma la siguiente forma:

W, ( ,) = 8 + 6L nkt (116)

donde 5 y 0 son constantes por determinarse. Considerando la funcin de va


lor (116), la ecuacin de Bellman expresada en trminos de la funcin de va
lor corriente sera la siguiente:

W ,( k ,) = Maximizar \L n ( k - k l+l) + (3VP, +1 ( k l+l)] (117)


*4+1

La condicin de primer orden de la ecuacin de Bellman es la siguiente:


Programacin dinmica 195

a partir de la cual se deriva la funcin de poltica:

OP , .a
kt\ 1 - ' (119)
1+0/3 '

Reemplazando la funcin (119) en la ecuacin de Bellman obtenemos:

8 +OLnk , = Ln[ - ]+38 +P0Ln\ ^ --k'/ ( 120)


[ i + op J H ( i + op '

Como resultado de la ecuacin (120) se obtienen los parmetros y 0:

a
0= ( 121)
i-a P
1
8 - Ln( 1-a/3 ) + - LnaP
1-/3 \-a P

Sobre la base de (116), (119) y (121), la funcin de poltica y la funcin de


valor corriente del problema seran las siguientes:

k l+1 =a0k? ( 122)

aP
W,{k,) = - Ln(\ - a f i ) + LnaP - Lnk, (123)
1 ~ap 1 -aP

Nuevamente, la solucin coincide con la respuesta obtenida a travs del m


todo de las aproximaciones sucesivas.

3.3 Condicin de transversalidad

De igual form a que en el control ptim o, en el problem a de program acin


dinm ica con horizonte tem poral infinito es necesario imponer una con
dicin de transversalidad para obtener la secuencia ptima de las varia
bles. Esta condicin de transversalidad se deriva de las condiciones de
Kuhn-Tucker desarrolladas en la seccin 1.1 del presente captulo. A
continuacin aplicarem os este concepto a los dos ejem plos vistos hasta el
momento.
196 Apuntes de Estudio

Ejemplo 1.- Asignacin de consumo y ahorro

Tomando el lmite cuando T > oo a la condicin de transversalidad (29), ob


tenemos lo siguiente:

B 1
Lin Sr H = 0 (124)
T> (X C y

Como Ct y a son siempre distintos de cero, (124) se simplifica del siguiente


modo:

Lim [3 1 S1, = 0 (125)

sta constituye la condicin de transversalidad del problema de programacin


dinmica cuando el horizonte temporal es infinito. En trminos intuitivos, la
condicin (125) asegura una trayectoria convergente de la variable de estado,
que en este caso est definida como el stock de ahorros. De no cumplirse la
condicin de transversalidad habra la posibilidad de que exista una secuencia
del stock de ahorros que sea explosiva, la cual solamente podra obtenerse
con bajos niveles de consumo en el largo plazo.

Ejemplo 2.- Modelo de crecimiento neoclsico

Tomando el lmite cuando T> cx> a la condicin de transversalidad (49), ob


tenemos:

Lim P ' = 0 (126)


r->o (kT kT+i)

Como el consumo, definido como (le - kj+i), es estrictamente positivo, (126)


se simplifica a:

L im P ''k ,= 0 (127)

que constituye la condicin de transversalidad para el modelo de crecimiento


neoclsico con horizonte temporal infinito. Al igual que en el caso anterior,
esta condicin asegura que la variable de estado (el stock de capital) presente
una secuencia de valores convergente.
Programacin dinmica 197

4. Programacin dinmica con incertidumbre

En esta seccin desarrollaremos un caso especial de optimizacin dinmica,


en el cual se incorpora un entorno estocstico. En todos los tipos de proble
mas vistos hasta el momento, tanto de clculo de variaciones como de control
ptimo y programacin dinmica, se ha supuesto que las variables son deter-
minsticas, es decir, que los valores futuros de las variables de control y esta
do en el futuro pueden ser conocidas de antemano por el agente. En el caso de
la programacin dinmica con incertidumbre no ocurre lo mismo. A pesar de
que el agente optimizador debe elegir una secuencia de variables futuras, en
frenta el problema que stas presentan aleatoriedad, es decir, su valor no pue
de ser conocido con anticipacin. De esta forma, el agente busca optimizar el
valor esperado de la funcin objetivo:

Maximizar V = E0^ f l(yul) (128)


/=0
sujeto a } , +1 = ,(v ,,w ,,,+i) Vr = 0,1,2,. ,.,oo
y0 dado

En el problema (128) cabe destacar dos aspectos. En primer lugar, la incerti


dumbre en el problema es introducida a travs de la variable aleatoria et+i,
que aparece en la ecuacin de transicin. El valor que toma dicha variable es
conocido en el perodo t + 1 , una vez que la variable de control ut ha sido
elegida en el perodo t . Tambin se asume que et+i (Vt = 0, 1, 2,... ,) cons
tituye una secuencia de variables aleatorias independientes e idnticamente
distribuidas14 (con una funcin de distribucin conocida). En segundo lugar,
al trmino E,(*) se le denomina esperanza matemtica condicional a la infor
macin en el perodo t . En (128), la optimizacin se realiza con la esperan
za matemtica condicional al perodo inicial (t = 0). En trminos prcticos, la
esperanza matemtica indica el valor promedio de una variable aleatoria. De
este modo, el problema que enfrenta el agente consiste en maximizar el valor
promedio de su funcin objetivo intertemporal.

La solucin a (128) ser una funcin que determine la variable de control p


tima para un valor dado de la variable de estado: ut = h(yt). Esta funcin es
similar a la funcin de poltica definida en las secciones anteriores y se le de
nomina plan contingente . La funcin tiene esta denominacin porque la

14. L o c u a l c o r r e s p o n d e a l c a s o m s s im p le e n p r o g ra m a c i n d in m ic a c o n in c e r tid u m b re .
198 Apuntes de Estudio

eleccin de la variable de control ptima depender del valor que tome la va


riable de estado, la cual es desconocida a priori debido a la existencia de la
variable aleatoria e.,+i.

El mtodo para resolver un problema de programacin dinmica con incerti


dumbre no difiere en gran medida de la metodologa vista hasta el momento.
Es necesario emplear los conceptos de la ecuacin de Bellman, la ecuacin de
Benveniste-Scheinkman y la ecuacin de Euler, pero incorporando el concep
to de la esperanza matemtica.

4.1 La ecuacin de Bellman

La ecuacin de Bellman incorporando un horizonte temporal infinito y un en


torno estocstico es la siguiente:

W, (y,) = Maximizar [/ ( , , ) + pE,\Wl+l( y ,)]] (129)

sujeto a i = V? = 0,1,2,...,
y, dado
y0 dado

La condicin de primer orden del problema viene dada por:

3/ 3- 3U'..
+ PE, =0 (130)
du, du, 3y(+1

La condicin (130) es similar a la condicin de primer orden derivada en


(60), no obstante incorpora la funcin de valor corriente (Wt) y la esperanza
matemtica Et(*). En este caso, la condicin de primer orden permite obtener
un plan contingente ut = h(y,) que maximice el valor esperado de la funcin
objetivo.

4.2 La ecuacin de Benveniste y Scheinkman

Al reemplazar el plan contingente en la ecuacin de Bellman, obtenemos la


siguiente funcin de valor corriente:

W, (y,) = / (y ,,/)( )) + PE, [W,+1(g, (v,,/;(y,), , tl )J (131)


Programacin dinmica 199

Aplicando el teorema de la envolvente a (131), obtenemos la ecuacin de


Benveniste y Scheinkman para el problema (128):

dW, df dWl+_
PE, (132)
d>', dv, d>', d-'+i

4.3 La ecuacin de Euler estoestica

Debido a la existencia de la esperanza matemtica, no es posible simplificar


fcilmente (131) y (132) para hallar una expresin general de la ecuacin de
Euler. Para ello sera necesario tener un conocimiento previo de las formas
funcionales de la funcin de retorno, la ecuacin de movimiento y la funcin
de distribucin. En lugar de ello, derivaremos la ecuacin de Euler para el
caso especial en el cual la ecuacin de transicin depende exclusivamente de
la variable de control. En dicho caso (132) se simplificara a:

dW, _ d f
(133)
dy, dy,

De este modo, la ecuacin de Euler estoestica sera la siguiente:

df + PE, df!, <>/


= 0 (134)
du, du, dy , + 1

Ejemplo 1.- Seleccin de portafolio'5

En este ejemplo introduciremos algunas modificaciones al problema de asig


nacin de consumo y ahorro que hemos visto hasta el momento. Plasta ahora,
el consumidor enfrentaba el problema de seleccionar la trayectoria del con
sumo que maximice su utilidad intertemporal. En este ejemplo incorporare
mos un nuevo tipo de decisin. Adems de decidir cunto destinar a consumo
y ahorro, el agente deber tomar una decisin de portafolio. Es decir, deber
elegir entre asignar sus ahorros a un instrumento libre de riesgo (como un bo
no del gobierno) que brinda un retorno constante (r), o invertir en un instru-15

15. E s te e je m p lo fu e to m a d o d e B la n c h a r d , O liv ie r J e a n y S ta n le y F is c h e r, le c tu r e s on M a
c r o e c o n o m ic s , C a m b r i d g e : T h e M I T P r e s s , 1 9 9 3 . p p . 2 7 9 - 2 8 5 . D i c h o m o d e l o s e b a s a e n e l t r a
b a jo d e S a m u e ls o n , P a id . L ife tim e P o r tf o lio S e le c tio n b y D y n a m ic S to c h a s tic P r o g ra m m in g " ,

en R e v ie w o f E c o n o m ic s a n d S ta tis tic s , N o . 5 1 , 1 9 6 9 , p p . 2 3 9 - 2 4 6 .
200 Apuntes de Estudio

ment riesgoso (como es el caso de las acciones) que presenta una rentabili
dad (z,) variable en el tiempo c incierta. Asumiremos que el retorno z, es una
variable independiente e idnticamente distribuida. En este caso, las variables
de control seran el consumo y la participacin de los ahorros que destina a
cada instrumento. Impondremos la restriccin de que la suma de las partici
paciones es igual a uno. En este sentido, la fraccin de los ahorros destinada
al instrumento libre de riesgo ser (o*) y la destinada en el instrumento ries
goso ser (1 - a)t). De este modo, el problema que debe resolver el consumi
dor ser el siguiente:

Maximizin' U = E0^ 3'f(C , ) (135)


l-o
sujeto a S,:i = (S, - C, )[(1 + r)(, + (1 + z,)(l - fit,)]
S0 dado

En el problema asumiremos que la funcin de retorno es logartmica f(Ct) = LnC(.


Para resolver (135), en primer lugar, debemos plantear la ecuacin de Bell
man estocstica:

W, (5,) = Maximizar [LnC, + /3,[W,4|(5MI)J] (136)


G , (th

sujeto a S,t] =(S, - C, )[(1 + r)w, + (1 + z, )(1 -(t,)]


5) dado
So dado

En este caso emplearemos el mtodo ms simple, el de adivinar y verificar .


Dado que la funcin objetivo es la misma que en los casos anteriores, supon
dremos que la funcin de valor corriente toma la siguiente forma:

W, = 5 + 6 L n S l (137)

Tomando en cuenta (137), desarrollamos las condiciones de primer orden de


la ecuacin de Bellman:

1_ _____ [(1 +r)col + (1 + z, )(1 - to, )]


OPE, = 0 (138)
G (S, - C , )[(1 + r)(0, + (1 + z, )(1 - 0J, )]

_____ (S, - C , )( r - z , ) ______ 1


E,
(S , - Cj )[(1 + r)(, + (1 + z, )(1 - t , )] OPC,
Programacin dinmica 201

Simplificando (138) obtenemos el plan contingente del consumo (Ct):

_ S j_
C, (139)
1 +6(3

Al reemplazar el plan contingente (139) en la ecuacin de Bellman (136), ob


tenemos la igualdad:

S
S+OLnS. .n + fE, S + OLn 1(1 + r)cot + (1 + r , )(l - w, )] :i40)
' 1+ 0/1 1

Despejando (140) podemos obtener la solucin para los parmetros 0 y 8:

i
0 = (141)
P

S= - - Ln( 1- P) + - LnP + E,(Ln(,(r - z, ))\


1- P 1- P 1- P

Finalmente, hallamos los planes contingentes para el consumo, la decisin de


portafolio y la funcin de valor corriente:

C ,= (I-/?)S , (142)

_______ ( r - z t )_______
(143)
(1 + r)o>, + (1 + z, )(1 - (O, )

W, Ln( - P) + LnP + E, 1 Ln{(, (r - z, )) LnS, (144)


1- P 1-/1

En (143), la decisin de portafolio (o>) se encuentra definida implcitamente.


Bajo el supuesto de que la rentabilidad del activo riesgoso es una variable
aleatoria independiente e idnticamente distribuida, la participacin de los
ahorros destinada al activo libre de riesgo ser una constante a lo largo del
tiempo.
202 Apuntes de Estudio

La principal conclusin del problema de seleccin de portafolio consiste en


que la decisin de portafolio (eleccin de a>) y la decisin de consumo y aho
rro (eleccin de C,) se realizan de manera separada. Ello puede apreciarse en
la ecuacin (143), donde la variable o se define implcitamente independien
temente del nivel de ahorros. De este forma, para cualquier nivel de riqueza
inicial (So), la estrategia de portafolio ptima para unas preferencias logart
micas siempre ser la misma.

Ejemplo 2.- Modelo de crecimiento neoclsico estocstico16

En este ejemplo desarrollaremos el modelo de crecimiento neoclsico en un


entorno de incertidumbre. Asumiremos que la variable estocstica afecta la
funcin de produccin de la siguiente forma:

<)(kr, l ) = k ? e 1 (145)

La variable aleatoria e, puede ser interpretada como shocks que afectan la


oferta agregada de la economa, como desastres naturales o shocks de tecno
loga. Por otra parte, supondremos que Lne, presenta una distribucin normal
con media cero (Et[Lnet) = 0)y varianza constante (Et[Lntr = o ).

Asumiendo una funcin de utilidad logartimica, la ecuacin de Bellman co


rrespondiente a este problema sera la siguiente:

Wl (kl ,e t ) = Maximizar [u d k '/e , - k[ ) + fE, [lV,+l (kl+i ,e ,+1 )J] (U 6 )

k' + ' k, ciado


k0 dado

Para resolver el problema recursivo (146) emplearemos el mtodo de adivi


nar y verificar. De este modo, supondremos que la funcin de valor corriente
presenta la siguiente forma:

W , =8 + O L u k j +yLne, (147)

16. La ap lic a ci n fue to m a d a de Sarg en t, T h o m a s. D y n a m ic M a c r o e c o n o m ic T h e o r y , C a m


b rid g e: H a rv a rd U n iv e rsity Press, 1 9 8 7 , p p . 3 5 - 3 6 . D i c h o m o d e l o se b a s a e n el a rtc u lo e s c r ito

p o r K y d la n d y P re sc o tt, " T i m e to B u ild a n d A g g r e g a te F l u c tu a t io n s , e n T c o n o m e tr ic a , E v a n s


t o n III.: B l a c k w e l l P u b l i s h e r s . 1 9 8 2 . p p . 4 7 3 - 4 9 1 .
Programacin dinmica 203

La condicin de primer orden de la ecuacin de Bellman es la siguiente:

pe 0 (148)
K, t,
I a F k i+]
- f

a partir de la cual se deriva la funcin de poltica:

, _ op
k, e, (149)
+ op

Reemplazando la funcin de poltica (149) en la ecuacin de Bellman, obte


nemos la siguiente igualdad:

S + dLiikt S +6Ln k ? E , +yLiiE,. i (150)


1+ 0/3 r nl

Con lo cual obtenemos las soluciones para los parmetros y, 0 y 5:

I
1- a fi (151)
_ afi
1- a ft
1
Ln( 1-aft)+ Lnafi
-P 1- aP

Empleando (151), hallamos el plan contingente ptimo y la funcin de valor


corriente:

k ,+1 = a P k t E (152)

a[j aP Lnk, , , +-
W, =- Ln( 1- afi) + Ln aP H------------ Lu e , (153)
1- P 1 - afi 1- a P 1 - aP

Tal como se puede apreciar, la funcin de valor corriente hallada en (153) es


consistente con la adivinada en (147); por lo tanto, el plan contingente
(152) determina la secuencia de variables de control y estado que maximiza el
valor esperado de la utilidad intertemporal.
204 Apuntes de Estudio

E je r c ic io s

1. Resuelva el siguiente modelo correspondiente al problema de asignacin


de consumo y ahorro de tres perodos:

3
Maximizar U = ^ Ln C(t)
ii
sujeto a S(t + 1) = 1.15(f)- C ( t)
5(1) = 1 5(4) = 1.21

2. Un consumidor vive durante tres perodos designados por t = 0, 1, 2, y


consume avena (a) y brcoli (b) cada da. Este consumidor tiene prefe
rencias sobre cantidades de consumo segn la funcin de utilidad que
se muestra. Este consumidor debe elegir cunto consumir de los bienes
(a) y (b) en cada uno de los tres perodos, y dispone de un ingreso de
300 u.m. para los tres perodos. Adems, se sabe que la cantidad de di
nero que no gasta en un determinado da permanece en su bolsillo, no
obtenindose ningn inters. Halle las cantidades ptimas de avena (a)
y brcoli (b) que maximicen la utilidad del consumidor para cada uno
de los tres perodos.

Maximizar U ( a ^ b ^ a ^ b ^ a ^ b j) = (aobo)0K + 0 .9 (0 ^ ) ^ + 0.8 (chb,)0"'


P = 1 / = 300 Ph =1.1

3. Desarrolle el problema de asignacin de consumo y ahorro para un hori


zonte temporal finito (T) e infinito (m), con las siguientes funciones de
utilidad instantneas:

a. f( C ,) = - 1 r n (o > 0)
1 cr

b. / ( C , ) = pC, - c ; > 0)

( i j
c. /( C ,) = - - e (P >0)
I 7? /
Programacin dinmica 205

4. Resuelva el modelo neoclsico de crecimiento para el caso en que existe


persistencia en los hbitos de consumo:

Maximizar U = X/ 3 '(L n C , +(pLnC,_)


/-O
sujeto a fcl + l = k " ~ c , W = 0 .1 .2 .
k 0 dado
C_, dado

Para los parmetros a. p. cp e ]0, 1(

5. Considere el problema de asignacin de consumo y ahorro, en el cual


existe solamente un instrumento financiero que presenta un retorno (rt)
incierto, y el consumidor tiene la funcin instantnea de utilidad (f(C,)j
mostrada en (1.a):

Maximizar / = 0Y / 3 ' - - c ;- ct

sujeto a S n] = (1 + rj)(S, - C , ) Vf = 0,1,2 oo


S o dado

Para p e |0, 1(, y o > 0 A a * 1.

a. Calcule el coeficiente de aversin al riesgo relativa (C.A.R.R.), definido


por:

_ fiC ,)C L
fie ,)

b. Halle el plan contingente del consumo,

c. Suponga que L n (l+ rt) tiene una distribucin normal con media cero y
varianza constante 0". Bajo esas propiedades estadsticas se cumple que:

- a (1 - c r )0 '

E ,[ ( \ + r , ) - CT] = ,[1 + r , t a e
206 Apuntes de Estudio

Empleando dicha propiedad, indique el efecto de un incremento del rendi


miento esperado Et[ 1 + rt] (todo lo dems constante) sobre el consumo. Con
sidere los casos en los cuales el C.A.R.R. es mayor a uno y menor a uno.

6. Un individuo busca m axim izar el valor esperado de su utilidad inter


temporal:

Asimismo, el agente invierte una cantidad de dinero At en una accin que


presenta un precio (pt) y un dividendo (dt), ambos con un comportamien
to estoestieo. La rentabilidad de la accin Rt (que tambin es una varia
ble aleatoria) est definida por:

P,

Por otra parte, la ecuacin de movimiento que describe la evolucin de la


inversin es la siguiente:

Asimismo, defina la variable de control u, = A, - ct, y la funcin de valor


corriente W t(A|, Rt i).

a. Resuelva la ecuacin de Bellman:

sujeto a Al+I =

y demuestre a partir de la condicin de primer orden y la ecuacin de


Benveniste y Scheinkman, que se cumple lo siguiente:
Programacin dinmica 207

b. Demuestre a partir de (a) que el precio de equilibrio de la accin es el


siguiente:

P,
/ <C , )

(Sugerencia: Considere la ley de las expectativas iteradas, la cual estable


ce que B,[Et+l[X]J = E,|X |)

c. Desarrolle la expresin de (b) para la funcin de utilidad f(C,) = Ct


208 Apuntes de Estudio

A nexo

TEOREMA DE EA ENVOEVENTE

Los problemas de optimizacin en economa usan funciones dependientes de cierta


cantidad de parmetros, como precios, ingreso y otros. Estos parmetros, normalmen
te, se mantienen constantes durante el anlisis, pero podran variar segn lo que se
pretende analizar. En teora del consumidor, por ejemplo, podramos calcular la
utilidad mxima considerando los precios que enfrenta como parmetros, y luego
querer averiguar cmo cambia esa utilidad mxima al cambiar los precios. El teo
rema de la envolvente nos brinda un resultado general acerca de cmo derivar la fun
cin de valor:

Consideremos el siguiente problema de optimizacin esttica:

MAX f ( x ,r ) suj eto a g j (x,r) = 0 j = 1,........ , m

Donde r = ( r , r 2 ......rk e s un vector de parmetros. Aqu r se mantiene constante


durante la maximizacin con respecto a x = (. ,,.. ) . El valor mximo de
f ( x , r ) que se obtenga del proceso anterior se denota mediante f (>'), tambin lla
mado funcin de valor. Si designamos por (x*,......,x*) los valores del vector Apara
los cuales se alcanza el valor mximo, entonces:

/V ) =f(x r) = f(x (r).......x' (r ), r , rk )

El resultado siguiente muestra de manera general, cmo derivar la funcin de valor:

Si f (r ) = m a x xf ( . \ , r ) y x ( r ) es el valor de x que maximizxi f (,v, r), entonces :


d[Ur) = df(x\r),r)

Este es el llamado teorema de la envolvente y resulta muy til. Ntese que si vara r ,
entonces /*(/') cambia por dos razones: en primer lugar, un cambio en >j cambia el
vector r y as cambia / ( r. r) directamente. En segundo lugar, un cambio en r
cambia todas las funciones x ( r ) , ......,x n(r)y, por lo tanto, f ( x O), r) cambia indi
rectamente. El resultado anterior demuestra que el efecto total sobre la funcin de va
lor de un pequeo cambio en f j se puede hallar calculando la derivada parcial de
f ( x (r),r)con respecto a r, ignorando el efecto indirecto de la dependencia de
x de r.
Programacin dinmica 209

Consideremos, ahora, el problema ms general y supongamos que X = X, 0 ), / = 1..... m,


son los multiplicadores de Lagrange que se obtienen de las condiciones de primer orden
ni
para el problema. Sea, adems, L(x, r) = f( x , r ) - -, ; ( v, r ) , la Funcin de Lagrange
correspondiente. Entonces: 1

d f \ r ) = dL(x'(r),r)
,k

Segn este resultado, el electo total sobre el valor de f*(r) de un cambio pequeo de
i', se puede hallar derivando parcialmente la Funcin lagrangiana /.(.*. r) con respecto
a i'j , considerando como constantes las v y las A . Este es el teorema general de la
envolvente.
Bibliografa

Barro, Robert J. y Xavier Sala-i-Martin, Economic Growth, McGraw-Hill,


1995.

Bellman, Richard, Dynamic Programming, Princeton: Princeton University


Press, 1957.

Benveniste, Lawrence y Jose Scheinkman, "On the Differentiability of the


Value Function in Dynamic Models of Economics", en Econometrica, vol.
47, No. 3, Evanston, III.: Blackwell Publishers, 1979, pp. 727-732.

Berck, Peter y Knut Sydsaeter, Economists' Mathematical Manual, Springer-


Verlag,1993.

Blanchard, Olivier Jean y Stanley Fischer, Lectures on Macroeconomics,


Cambridge: The MIT Press, 1993.

Brock, William y Leonard Mirman, "Optimal Economic Growth and Uncer


tainty", en McCall, J.J. (ed.), Chicago: The University of Chicago Press,
1972, pp. 1-43.

Brock, William y Leonard Mirman, Optimal Economic Growth and Uncer


tainty: The Discounted C ase, en Journal o f Economic Theory, 1972, pp.
479-513.

Cass, David, "Optimum Growth in an Aggregate Model of Capital Accumula


tion", en Review o f Economic Studies, vol. 32, No. 3, 1965, pp. 233-240.
Clark, Colin W. y Gordon R. Munro, "The Economics o f Fishing and Modern
Capital Theory: A Simplified Approach", en Journal o f Environmental Eco
nomics and Management, Academic Press, 1975, pp. 92-106.

Chiang, Alpha, Mtodos fundamentales de economa matemtica, 3a. Edi


cin, Madrid: McGraw-Hill, 1996.

Chiang, Alpha, Elements o f Dynamic Optimization, 3a. edicin, Nueva York:


McGraw-Hill, 1992.

Dixit, Avinash, Optimization in Economic Theory, Oxford: Oxford University


Press, 1993.

Evans, G.C., "The Dynamics o f Monopoly", en American Mathematical


Monthly, febrero 1924, pp. 77-83.

Forster, Bruce A., "On a One State Variable Optimal Control Problem: Con
sumption-Pollution Trade-Offs, en Forster, Bruce A., Applications o f Con
trol Theory to Economic Analysis, Amsterdam: North Holland, 1977.

Hotelling, Harold, "The Economics o f Exhaustible Resources", en Journal o f


Political Economy, Chicago: The University o f Chicago Press, abril 1931, pp.
137-175.

Inada, Ken-Ichi, "On a Two-Sector Model o f Economic Growth: Comments


and a Generalization", en Review o f Economic Studies, vol. 30, 1963, pp.
119-127.

Intriligator, Michael D., Optimizacin matemtica y teora econmica, Bo


got: Editorial: Prentice-Hall Internacional, 1973.

Kamien, Morton I. y Nancy L. Schwartz, Dynamic Optimization. The Calcu


lus o f Variations and Optimal Control in Economics and Management, 2a.
edicin, Amsterdam: North-Holland, 1991.

Kline, M., Mathematics: A Cultural Approach, Mass.: Addison-Wesley,


1962.

Koopmans, T.C., On the Concept o f Optimal Economic Growth, Discussion


paper, New Haven: Coules Foundation, Yale University, 1963.
Kreps, David M., Carso de teoria microeconmica, Madrid: McGraw-Hill,
1995.

Kydland y Prescott, Time to build and aggregate fluctuations, en Econo


metrica, Evanston 111.: Blackwell Publishers, 1982, pp. 473-491.

Lonard, Daniel y Ngo van Long. Optimal Control Theory and Static Optimi
zation in Economics, Cambridge: Cambridge University Press, 1993.

Mangasarian. O.L, Sufficient Conditions for the Optimal Control of Nonlin


ear Systems, en SIAM Journal on Control, voi. 4, 1966, pp. 139-152.

Obtsfeld, Maurice y Kenneth Rogoff, Foundations o f International Macro


economics, Cambridge: The MIT Press, 1997.

Pontryagin, L.S., The Mathematical Theory o f Optimal Processes, 1962.

Ramsey, Frank P., "A Mathematical Theory o f Savings", en Economic Jour


nal. Oxford: Blackwell Publishers, diciembre 1928, pp. 543-559.

Samuelson, Paul, Lifetime Portfolio Selection by Dynamic Stochastic Program


ming, en Review o f Economics and Statistics, No. 51,1969, pp. 239-246.

Sargent, Thomas, Dynamic Macroeconomic Theory, Cambridge: Flarvard


University Press, 1987.

Sargent, Thomas, Macroeconomic Theory, Nueva York: Academic Press,


1979.

Stokey. Nancy, Robert Lucas y E. Prescott, Recursive Methods in Economic-


Dynamics, Cambridge: Harvard University Press. 1989.

Sydsaeter, Knut y Peter J. Hammond. Mathematics for Economic Analysis,


Pretince-Hall. 1995.

Takayama, Akira. Analytical Methods in Economics, Harvester Wheatsheaf,


1994.

Taylor, Dean, Stopping Inflation in the Dornbusch Model: Optimal M o


netary Policies with A lternate Price-A djustm ent E quations, en Journal
o f M acroeconom ics, Baton Rouge: Louisiana State University Press,
1989, pp. 199-216.
Tu, Pierre N.V., Introductory Optimization Dynamics. Optimal Control with
Economics and Management Applications, Springer-Verlag, 1991.

Urrutia, Carlos, Notas sobre crecimiento y ciclos econmicos, Ila-


des/Georgetown University, 1996.

Varian, Ilal R., Anlisis microeconmico, Barcelona: Antonio Bosch editor,


1992.

Varian, Hal R., Microeconoma intermedia, Barcelona: Antonio Bosch editor,


1988.
APUNTES DE ESTUDIO

1. PortocaiTcro Surez, Felipe, Cmo hacer un trabajo de investigacin, 3a.


ed. Lima: CIUP, 1990.

2. Miyashiro Miyashiro, Isabel, Casos en administracin de organizaciones


que operan en el Per, tomo I, 3a. ed., Lima: CIUP, 1991.

3. Miyashiro Miyashiro, Isabel, Casos en administracin de organizaciones


que operan en el Per, tomo II, 3a. ed., Lima: CIUP, 1991.

4. Injoque Hspinoza, Javier, WordPerfect 5.1. Fundamentos y orientaciones


prcticas, 2a. ed., Lima: CIUP, 1992.

5. Miyashiro Miyashiro, Isabel, Casos en administracin de organizaciones


que operan en el Per, tomo III, Lima: CIUP, 1991.

6. Gatti Murricl, Carlos y Jorge Wicsse Rebagliati, Elementos de gramtica


espaola,4a. ed., Lima: Universidad de! Pacfico, 2008.

7. Gatti Murricl. Carlos y Jorge Wiesse Rebagliati, Tcnicas de lectura r


redaccin. Lenguaje cientfico y acadmico, 4a. ed., Lima: Universidad
del Pacfico, 2009.

8. Mayorga, David y Patricia Araujo, Casos de politica de Ia empresa, Lima:


CIUP, 1992.

9. Miyashiro Miyashiro, Isabel (comp.). Casos en administracin de organiza


ciones que operan en el Per, tomo IV, Lima: CIUP, 1992.

10. Pipoli de Butrn, Ghia (comp.), Casos de mercadotecnia aplicados a la


realidad peruana, Lima: CIUP, 1992.

11. Miyashiro Miyashiro. Isabel (comp.). Casos en administracin de organiza


ciones que operan en el Per, tomo V. Lima: CIUP, 1993.

12. Rivero, Eduardo, Contabilidad /, 2a. ed. corregida, Lima: Universidad del
Pacfico, 2000.
13. Altamirano, Jess, Lotus 2.4. Conceptos y consejos prcticos, Lima: Univer
sidad del Pacfico, 1993.

14. Schwalb. Mara Matilde y Carlos Herrera, Coleccin de casos de merca


dotecnia, Lima: CIUP. 1993.

15. Cliong. Esteban y otros. Teora y prctica de la contabilidad intermedia,


Lima: CIUP, 1994.

16. Wong. David, Finanzas en el Per: un enfoque de liquidez, rentabilidad v


riesgo, 2a. ed.. Lima: CIUP, 1995.

17. Mayorga, David y Patricia Araujo. La importancia de la mercadotecnia


estratgica: el caso de la empresa peruana, Lima: CIUP, 1994.

18. Aliaga Valdcz, Carlos, Manual de matemtica financiera: texto, problemas


y c,vav. 4a. ed. corregida. Lima: Universidad del Pacfico, 1999.

19. Angeles, Julio: Jorge Rubio; Yvn Soto y Jorge Toma, Procesamiento esta
dstico de datos con Minitab y Harvard Graphics, Lima: Univ ersidad del
Pacfico, 1995.

20. Schwalb. Mara Matilde y Carlos Herrera, Casos peruanos de mercadotec


nia.Uma:C\CP, 1995.

21. Miyashiro Miyashiro, Isabel (comp.). Casos en aduna i s a . <v.- -cz organiza
ciones que operan en el Per, tomo VI, Lima: CIUP, 995.

22. Vento Ortiz, Alfredo, Finanzas aplicadas, 7a. ed.. Luna: CIUP, 2005.

23. Mayorga. David y Patricia Araujo, Casos peruanos de negocios internacio


nales, Lima: CIUP, 1995.

24. Muoz. Jos Luis, Anlisis e interpretacin de estados financieros ajusta


dos por inflacin, Lima: CIUP, 1995.

25. Pipoli de Butrn. Gina (comp.). Casos de mercadotecnia aplicados a a


realidad peruana, tomo II, Lima: CIUP, 1996.

26. Beltrn, Arlette y Hanny Cueva, Ejercicios de evaluacin privada de pro


yectos, 3a. ed., Lima: CIUP, 2000.
27. Aliaga Valdez, Carlos, Aplicaciones prcticas ele matemtica financiera:
603problemas resueltos, 1a. ed. corregida, Lima: Universidad del Pacfico,
1998.

28. iS/Iiyashiro Miyashiro, Isabel (comp.). Casos en administracin de organiza


ciones que operan en el Per, tomo VII. Lima: CIUP, 1996.

29. Mayorga, David y Patricia Araujo, Casos sobre la mercadotecnia estratgi


ca de la empresa peruana, Urna: CIUP, 1997.

30. Miyashiro Miyashiro, Isabel (comp.). Casos en administracin de organiza


ciones que operan en el Per, tomo Vili, Lima: CIUP, 1997.

31. Seinfeld, Janice y otros, Introduccin a la economa de los recursos natu


rales y del medio ambiente, Lima: 2a. ed., CIUP, 1999,

32. Miyashiro Miyashiro, Isabel (comp.), Casos en administracin de organiza


ciones que operan en el Per, tomo IX, Lima: CIUP, 1998.

33. Bonifaz, Jos Luis y Ruy Lama C., Optimizacin dinmica y teora econmi-
ea, la. ed. corregida, Lima: CIUP. 2002.

34. Franco Concha, Pedro, Planes de negocios: una metodologa alternativa,


2a. ed., Lima: CIUP, 2005.

35. Miyashiro Miyashiro, Isabel (comp.). Casos en administracin de organiza


ciones que operan en el Per, tomo X, Lima: CIUP, 1999.

36. Schuldt, Jrgen, Polarizacin oficial de la economa: un debate en once


actos, Lima: CIUP, 1999.

37. Schwalb, Mara Matilde y Juan Carlos Casafranca, Casos ganadores de los
Premios MAX/EFF1E, Lima: CIUP, 2000.

38. Medina, Oswaldo, El achoramiento: una interpretacin sociolgica, Lima:


CIUP, 2000.

39. Espejo Reese, Ricardo, Etica y empresas: el caso de Ia banca peruana, 2a.
cd. corregida y aumentada, Lima: CIUP, 2003.

40. Malea, scar, Comercio electrnico, Lima: Universidad del Pacfico, 2001.
41. Le.scano, Lucio. La disciplina del servicio, 2a. ed. corregida y aumentada.
Lima: CIUP, 2003.

42. Scluvalb. Mara Matilde; Patricia Araujo y David Mayorga, Casos ganado
res de los Premios Ejfic 1999. Lima: Universidad del Pacfico-AFP Integra.
2001.

43. Urrunaga, Roberto; Tami I liraoka y Antonio Risso, Fimdanicn/os de econo


ma )hlica, Lima: CIUP. 2001.

44. Bonifaz, Jos Luis y Diego Winkelried, Matemticas para la economa di


nmica, la. ed. corregida, Lima: CIUP, 2003.

45. Miyashiro, Isabel (compiladora). Casos de administracin general en orga


nizaciones que operan en el Per, tomo XI, Lima: CIUP, 2001.

46. Pipoli de Butrn, (lina. Casos de mercadotecnia aplicados a la realidad


peruana, tomo II, Lima: C'IUP. 2002.

47. Malea, scar, Comercio internacional, 4a. ed., Lima: CIUP, 2008.

48. Sehwalb, Mara Matilde; Patricia Araujo y David Mayorga, Casos ganado
res de los Premios Ejjie 2000. lama: Universidad del Pacfico-Alicorp, 2002.

49. Mayorga, David; Mara Matilde Sehwalb y Patricia Araujo, Casos ganado
res de los Premios Efjic 2001. Lima: Universidad del Pacfico-Alicorp, 2002.

50. Miyashiro. Isabel (compiladora), Cusas de administracin general en orga


nizaciones que operan en el Per, tomo XII, Lima: CIUP. 2002.

51. Miyashiro, Isabel (com piladora), Casos peruanos de comportamiento


organizacional, tomo I, Lima: CIUP, 2003.

52. Sin K Ricardo y Carlos Andaluz X., Clculo diferencial: teora y aplicacio
nes, Lima: CIUP. 2003.

53. Sehwalb. Mara Matilde; Claudia Ortega y Emilio Garca (editores), Casos de
responsabilidad social, Lima: CIUP, 2003.
54. Araujo, Patricia; David Mayorga y Mara Matilde Schwalb, Casos ganadores
de los Premios Effie 2002, Lima: Universidad del Pacfico, 2003.

55. Mayorga, David; Patricia Araujo y Mara Matilde Schwalb, Casos ganadores-
de los Premios Effie 2003, Lima: Universidad del Pacfico - Interbank, 2004.

56. Malea, Oscar, Perfiles de productos con potencial agroexportador, Lima:


C1UP, 2004.

57. Miyashiro, Isabel, Empresa y gerencia en Asia: el caso de la Repblica


Popular China,, Lima: CIUP, 2004.

58. Schwalb, Mara Matilde y Emilio Garca (editores), Buenas prcticas perua
nas de responsabilidad social empresarial, Lima: CIUP, 2004.

59. Cortez, Rafael y Luis Rosales, 340 ejercicios de Microeconoma, Lima: CIUP,
2005.

60. Seinfeld, Janicc, Anlisis econmico de la salud, Lima: CIUP, 2005.

61. Yamada, Gustavo y Patricia Pcrcz, Evaluacin de impacto de proyectos de


desarrollo en el Per, Lima: CIUP, 2005.

62. Alva, Edgar, Fundamentos de Contabilidad. Un enfoque de dilogo con un


lenguaje claro, Lima: CIUP, 2005.

63. Schwalb, Mara Matilde; Emilio Garca y Virginia Soldevilla (eds.). Buenas
prcticas peruanas de responsabilidad social empresarial. Coleccin 2005,
Lima: CIUP, 2006.

64. Toma Inafuko, Jorge y Jorge Luis Rubio Donet, Estadstica aplicada. Pri
mera parte, Lima: CIUP, 2007.

65. Siu, Koochoy, Ricardo y Carlos Andaluz Zmga, Algebra, Lima: CIUP, 2007.

66. Yamada, Gustavo y Juan Chacaltana, Generacin de empleo en el Per: seis


casos recientes de xito, Lima: CIUP, 2007.
67. Urrunaga, Roberto y Jos Luis Bonifaz (eds.), Estudios de caso sobre
regulacin en infraestructura v servicios pblicos en el Per, Lima: CIUP,
2008.

68. Schuldt, Jrgen, Modelos macroeconmicos computariz.ados (una intro


duccin), Lima: CIUP, 2008.

69. Toma Inafuko, Jorge y Jorge Luis Rubio Donet. Estadstica aplicada.
Segunda parte, Lima: CIUP, 2008.

70. Del Castillo, Lisa y Gustavo Yantada. Responsabilidad social y buen


clima laboral: una frmula ganadora, Lima: CIUP, 2008.

71. Beltrn, Arlette; Juan Francisco Castro y Gustavo Yantada, Hacia un


programa de crdito de largo plazo para la educacin superior en el
Per, Lima: CIUP, 2008.

72. Schwalb, Mara Matilde (editora). Experiencias exitosas de responsabilidad


empresarial, Lima: Universidad del Pacfico, 2010.

73. Siu Koochoy, Ricardo y Carlos Andaluz Ziga, Aritmtica, Lima:


Universidad del Pacfico, 2011.

74. Siu Koochoy, Ricardo y Carlos Andaluz Ziga, Clculo diferencial de


funciones con varias variables, Lima: Universidad del Pacfico, 2012.

75. Yamada, Gustavo; Juan Francisco Castro y Roberto Asmat, Inversin


en educacin e ingresos laborales. Ms all de la ecuacin de Mincer,
Lima: Universidad del Pacfico, 2013.

You might also like