Document

Anuncio
Programación dinámica
Conceptos matemáticos
1
INTRODUCCIÓN
Partimos de la ecuación funcional
v( x) = max
{F ( x, y ) + βv( y )}, para todo x ∈ X
0≤ y ≤ Γ ( x )
Esta ecuación es la combinación de dos problemas:
- un problema de maximización
- un problema de punto fijo
Vamos a separar estos dos problemas para entender
los elementos que necesitamos en el análisis de este
tipo de ecuaciones funcionales.
2
TEOREMA DEL MÁXIMO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Para ilustrar el tipo de resultados que buscamos vamos
a considerar el siguiente ejemplo:
Teorema: Sean
X ⊂R e Y⊂R
con Y compacto y convexo. Sea f: X×Y→R una función
continua tal que para todo x∈X, f(x) es estrictamente
cóncava en y. Defina las funciones
h( x) = max f ( x, y ) y f [ x, g ( x)] = h( x).
y∈Y
Entonces las funciones h(x) y g(x) son continuas.
3
TEOREMA DEL MÁXIMO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Queremos generalizar resultados de este tipo. Usando el
ejemplo anterior queremos entender qué condiciones
hemos de imponer sobre los elementos dados del
problema (f, X e Y) para que las funciones h(x) y g(x)
sean continuas.
Un problema es que no podemos garantizar que hay un
único valor de y que maximiza la función objetivo. Por lo
tanto, en vez de una función y = g(x), en general,
tendremos una correspondencia y = G(x). Pero ¿qué
significa que una correspondencia sea continua?
4
TEOREMA DEL MÁXIMO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Intuitivamente una correspondencia es continua si
pequeños cambios en x no cambian mucho el conjunto
imagen G(x).
El problema es que el conjunto imagen puede cambiar
de dos formas. Por tanto, vamos a tener dos conceptos
de continuidad de correspondencias.
5
TEOREMA DEL MÁXIMO
Definición: una correspondencia G: X→X es hemicontinua
inferiormente (hci) en x si G(x) es no vacía y si, para
cada y∈G(x) y cada secuencia xn→ x, existe N ≥ 1 y una
secuencia {yn} de n = N a ∞ tal que yn→y e yn∈G(xn), para
todo n ≥ N.
Definición: una correspondencia G: X→X es hemicontinua
superiormente (hcs) en x si G(x) es no vacía y si, para
cada cada secuencia xn→ x y cada secuencia {yn} tal que
yn∈G(xn), para todo n, existe una subsecuencia de {yn} que
converge a un punto y en G(x).
Definición: una correspondencia G: X→X es continua en x
si es a la vez hci y hcs en x.
6
TEOREMA DEL MÁXIMO
G(x)
x1
x2
x
7
TEOREMA DEL MÁXIMO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Vemos que el concepto de hcs no permite que la
correspondencia se abra de repente pero permite que se
reduzca.
Por otro lado, el concepto de hci no permite que la
correspondencia se reduzca de repente pero permite
que se abra.
Una correspondencia es continua cuando ni se abre ni
se reduce de repente.
8
TEOREMA DEL MÁXIMO
Teorema del Máximo (SLP3.6): Sean
X ⊆ Rl e Y ⊆ R m .
Sea f: X×Y→R una función continua. Sea Γ: X→Y una
correspondencia compacta y continua. Entonces la
función h(x) definida como
h( x) = max f ( x, y )
y∈Γ ( x )
es continua y la correspondencia G(x) definida como
G ( x) = {y ∈ Γ( x) : f ( x, y ) = h( x)}
es no vacía, compacta y hcs.
9
TEOREMA DEL MÁXIMO
En este teorema imponemos condiciones para que los
objetos h(x) y G(x) varíen de forma continua con x:
− Γ no vacía y compacta junto con f continua
asegura que G es no vacía y compacta
− Γ y f continuas aseguran que h sea continua y G
sea hcs.
Si además suponemos que Γ es convexa y que f es
estrictamente cóncava, entonces G es una función
continua.
10
TEOREMA DEL MÁXIMO: EJEMPLOS
Sea X = R y sea Γ(x) = Y = [-1,1], para todo x∈X. Defina la
función f: X×Y→R como
f ( x, y ) = xy 2 .
1. Compruebe que las hipótesis del Teorema del Máximo
se cumplen.
2. Represente gráficamente h(x)
3. Represente gráficamente G(x)
4. Muestre que G(x) es hcs pero no hci en x = 0.
11
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Para ilustrar el tipo de resultados que buscamos vamos
a considerar el siguiente ejemplo:
Teorema de Brouwer: Sea
A ⊂ Rl
un conjunto compacto y convexo. Sea f: A→A una
función continua. Entonces f tiene, al menos, un punto
fijo, es decir, para algún x∈A, f(x) = x.
12
TEOREMAS DE PUNTO FIJO
f(x)
f(x)
A
45º
A
x
13
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Nótese que el Teorema de Brouwer da condiciones
suficientes para que determinados objetos (funciones
continuas definidas en subconjuntos de Rl) tengan al
menos un punto fijo. Sin embargo, no asegura que
exista sólo uno.
Nosotros queremos ir un poco más allá en dos
direcciones:
1. queremos trabajar con objetos más generales
2. queremos asegurar unicidad del punto fijo
14
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
En el caso del Teorema de Brouwer vemos que una
condición suficiente para que la función tenga sólo un
punto fijo es que su pendiente sea menor que 1.
Por otro lado, esa misma condición nos asegura que si
comenzamos desde cualquier punto x0 en A e iteramos
de la siguiente manera
xn+1 = f(xn), n = 0, 1, …
siempre llegaremos al punto fijo en el que x = f(x).
15
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Como vimos anteriormente, la ecuación funcional define
una “función de funciones”:
(Tw)( x) = max {F ( x, y ) + βw( y )}
y∈Γ ( x )
Es decir, para cualquier función w nuestro operador define
otra función (Tw)(x). Los puntos fijos de este operador son
aquellas funciones v que cumplen
(Tv)(x) = v(x).
16
[EJEMPLO DE ITERACIÓN EN LA F. DE VALOR]
Vamos a iterar sobre el operador definido por el modelo
de Ramsey más sencillo en el que debíamos encontrar la
secuencia de capitales {Kt+1} desde t = 0 hasta ∞ que
maximiza
∞
∑ βt ln( K tα − K t +1 )
t =0
Asociado a este problema secuencial hay una ecuación
funcional
v(k ) = maxα ln(k α − y ) + βv( y )
{
0≤ y∈k
que define el operador
{
0≤ y∈k
}
}
(Tw)(k ) = maxα ln(k α − y ) + βw( y )
17
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Si comparamos con el Teorema de Brouwer los
elementos que tenemos son:
- f(x) en el Teorema de Brouwer es (Tw)(x) en la
ecuación funcional
- A en el Teorema de Brower es un conjunto de
funciones en la ecuación funcional
18
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Por lo tanto, para aplicar algo parecido al Teorema de
Brouwer a nuestro caso necesito:
- condiciones sobre f: f:A→A y f continua,
es decir, que nuestro operador (Tw)(x) transforme
de forma continua un conjunto de funciones en sí
mismo
- condiciones sobre A: A compacto y convexo
es decir, que el conjunto de funciones con el que
trabajamos sea compacto y convexo
19
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Con las condiciones anteriores aseguramos que exista,
al menos, una función que es un punto fijo del operador
pero no aseguramos unicidad.
Para, además, asegurar unicidad necesitamos:
- condiciones adicionales sobre f: f tiene pendiente
menor que 1
es decir, que nuestro operador (Tw)(x) tenga
“pendiente” menor que 1
20
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Con la condición sobre la pendiente nos aseguramos
además que si comenzamos desde cualquier elemento
x0 en A (función w en el conjunto de funciones que
estemos considerando) e iteramos sobre la función f
[operador (Tw)] convergemos al punto fijo.
Para saber que una sucesión de elementos de un
conjunto converge necesito una idea de distancia. Por
lo tanto, tenemos que desarrollar una idea de distancia
entre funciones.
21
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Lo que vamos a hacer es definir los conceptos que
necesitamos para conjuntos generales y luego
especializarlos en los conjuntos con los que trabajamos
(conjuntos de funciones).
Pensemos en un conjunto cualquiera S. Una distancia
no es más que una función que coge dos elementos del
conjunto y les asigna un número. Por lo tanto, podemos
escribir una distancia como una función ρ
ρ: S × S → R
22
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Lo que ocurre es que no me sirve cualquier función.
Para que ρ tenga las características que pensamos tiene
que tener una distancia ha de cumplir una serie de
condiciones.
En particular, para cualquier trío de elementos x, y, z ∈ S
necesito que la función ρ cumpla:
− ρ(x, y) ≥ 0, con igualdad si y sólo si x = y
− ρ(x, y) = ρ(y, x)
− ρ(x, y) ≤ ρ(x, z) + ρ(z, y)
23
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Definición: un espacio métrico es un conjunto S junto
a una función de distancia definida sobre el conjunto:
ρ: S × S → R.
Un espacio métrico es, por tanto, un conjunto en el que
podemos calcular distancias.
24
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Ahora podemos definir una clase de operadores, es
decir, funciones generales definidas sobre conjuntos
generales, que tienen la característica que una noción
de pendiente tiene valor menor que 1. Estos operadores
se llaman contracciones.
Definición: Sea (S, ρ) un espacio métrico y T: S→S una
función definida sobre S en S. T es una contracción
(con módulo β) si, para algún β∈(0,1)
ρ(Tx, Ty) ≤ βρ(x, y), para todo x, y ∈ S.
25
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Teorema de la Contracción (SLP3.2): Si (S, ρ) es un
espacio métrico completo y T: S→S es una contracción
con módulo β, entonces
1. T tiene sólo un punto fijo v en S, y
2. para cualquier v0∈S, ρ(Tnv0, v) ≤ βnρ(v0,v), n = 0, 1,…
26
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
El Teorema de la Contracción (Contraction Mapping
Theorem) nos dice dos cosas:
1. las condiciones suficientes para que el operador T
tenga sólo un punto fijo (en nuestro caso, que el
conjunto de funciones con el que trabajamos sea
un espacio métrico completo y que la ecuación
funcional defina un operador que sea una
contracción), y
2. que vamos a converger a ese punto fijo con
independencia de donde comencemos a iterar en
el operador.
27
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
La condición de que el operador sea una contracción la
necesitamos porque queremos imponer que nuestra
función de funciones tenga “pendiente” menor que 1.
Pero, ¿para qué necesitamos que el conjunto con el que
trabajamos sea un espacio métrico completo?
En primer lugar necesitamos trabajar con espacios
métricos porque necesitamos tener definida una
distancia de forma que sepamos cuando en la iteración
nos estamos acercando al punto fijo.
28
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Para entender qué es un espacio métrico completo y por
qué lo necesitamos, tenemos primero que definir cuando
una secuencia es convergente.
Definición: Una secuencia {xn} en S (con n = 0 hasta ∞)
converge a x ∈ S si para todo ε > 0, existe un número
Nε, tal que para todo n ≥ Nε
ρ(xn, x) < ε.
29
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Es decir, una secuencia es convergente si cada vez se
aproxima más al límite. El problema de esta definición es
que para verificar que una secuencia es convergente
necesitamos un candidato al límite.
Definición: Una secuencia {xn} en S (con n = 1 hasta ∞)
es una secuencia de Cauchy si para todo ε > 0, existe
un número Nε, tal que para todo n, m ≥ Nε
ρ(xn, xm) < ε.
30
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Es decir, una secuencia es Cauchy si los elementos de la
misma cada vez están más cerca los unos de los otros.
Por lo tanto, podemos saber si una secuencia converge
simplemente sabiendo los elementos de la misma.
Definición: Un espacio métrico (S, ρ) es completo si
cada secuencia de Cauchy en S converge a un elemento
de S.
31
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Por lo tanto, si el conjunto de funciones con el que
trabajamos es un espacio métrico completo y la
secuencia de funciones que generamos con el operador
que definimos a partir de nuestra ecuación funcional
satisface el criterio de Cauchy (las funciones que
generamos están cada vez más cerca las unas de las
otras), sabemos que el punto fijo pertenecerá al mismo
conjunto de funciones y, por lo tanto, compartirá las
mismas características.
32
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Recapitulando, el Teorema de la Contracción, aplicado a
nuestra ecuación funcional nos dice dos cosas:
1. necesitamos que el operador sea una contracción
para asegurarnos que existe un único punto fijo y
que llegaremos a él iterando en el operador desde
cualquier elemento (función) inicial
2. tenemos que trabajar con conjuntos de funciones
que sean espacios métricos completos para que el
punto fijo (límite) pertenezca al mismo conjunto de
funciones y, por tanto, sepamos qué propiedades
tiene (sin ni siquiera saber su forma explícita).
33
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Corolario: Sea (S, ρ) un espacio métrico completo y sea
T: S→S una contracción con punto fijo v ∈ S. Si S´ es un
subconjunto cerrado de S y
T (S ' ) ⊆ S ' ,
entonces v ∈ S´. Si, además
T (S ' ) ⊆ S ' ' ⊆ S ' ,
entonces v ∈ S´´.
34
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Este corolario es importante por la siguiente razón.
Imaginemos que estamos trabajando con funciones
continuas junto con una definición de distancia (este es
un espacio métrico completo). Ahora sabemos que si
nuestro operador es una contracción el punto fijo
resultante (esa función de valor que no conocemos) es
una función continua.
Lo que nos dice el corolario es que si nos concentramos
en el subconjunto de funciones continuas que además
son crecientes, y si el operador preserva esa propiedad,
el punto fijo es, además, creciente.
35
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
De esta forma, aplicando el corolario del Teorema de la
Contracción podemos averiguar propiedades adicionales
de la función de valor fácilmente.
Por otro lado, el segundo resultado del teorema pone
cota a la distancia entre la iteración número n del
operador y el punto fijo en términos de la distancia
entre la función inicial y el punto fijo, es decir,
para cualquier v0∈S, ρ(Tnv0, v) ≤ βnρ(v0,v), n = 0, 1,…
Pero esta condición no es muy útil si no conocemos v.
36
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Resultado: Sea (S, ρ) un espacio métrico completo y sea
T: S→S una contracción con módulo β ∈ (0,1) y con
punto fijo v ∈ S. Entonces
1
n
ρ(T v0 , v) ≤
ρ(T n v0 , T n+1v0 ).
1− β
Este resultado pone una cota a la distancia entre el
punto fijo y la iteración n generada por el operador sin
saber cual es el punto fijo (aproximación lineal).
37
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Aplicando el Teorema de la Contracción podemos saber si
una ecuación funcional tiene una solución única.
Podemos, además, iterar en el operador y aproximarnos a
la solución (punto fijo) tanto como queramos.
El problema ahora es saber cuando el operador definido
por la ecuación funcional es una contracción. Para ello
tendríamos que comprobar que satisface la definición de
contracción.
38
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Dado el conjunto de funciones y la definición de
distancia con la que estamos trabajando (que ha de ser
un espacio métrico completo) se ha de cumplir que para
cualquier par de funciones f y h de ese conjunto
ρ(Tf, Th) ≤ βρ(f, h).
Verificar que se cumple la definición de contracción
puede ser complicado. El siguiente teorema nos da una
ruta sencilla para hacer eso para una clase especial de
funciones.
39
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
Teorema de Blackwell (SLP3.3): Sea
X ⊆ Rl
y sea B(X) el espacio de funciones acotadas definidas en
X, v: X→R, con la norma superior. Sea T: B(X)→B(X) un
operador que satisface
1. (monotonicidad) v, w ∈ B(X) y v(x) ≤ w(x) para todo
x∈X, implica (Tv)(x) ≤ (Tw)(x) para todo x∈X;
2. (descuento) existe un β∈(0, 1) tal que
[T(v+a)](x) ≤ (Tv)(x) + βa para todo v∈B(X), a ≥ 0, x∈X.
Entonces T es una contracción con módulo β.
40
TEOREMAS DE PUNTO FIJO
v( x) = max {F ( x, y ) + βv( y )}, para todo x ∈ X
y∈Γ ( x )
En la mayoría de aplicaciones que hacemos en Economía
las dos condiciones suficientes para que un operador sea
una contracción descritas en el Teorema de Blackwell se
verifican fácilmente.
Por ejemplo, en el modelo de Ramsey
(Tv )(k ) = max
{U [ f (k ) − y ] + βv( y )}
0≤ y ≤ f ( k )
las dos condiciones son inmediatas
Nota: la función (v+a)(x) se define como
(v+a)(x) = v(x) + a.
41
Descargar