Subido por miguel.matta.04

An´alisis convexo

Anuncio
Análisis convexo
Jean Pierre Crouzeix
Eladio Ocaña
Wilfredo Sosa
December 9, 2002
PREFACIO
El análisis convexo es un tema clásico, pero fundamental para la teorı́a de
la optimización. Por lo tanto, debe ser bién entendido por los estudiantes
interesados en la teorı́a de la optimización. El objetivo de esta monografı́a
es enfocar el análisis convexo desde un punto de vista geométrico, puesto
que la geometrı́a es fundamental para la convexidad. Veremos que solo
usando la geometrı́a, podemos demostrar todos los resultados clásicos del
análisis convexo, en particular cuando se trabaja en los espacios euclidianos
de dimensión finita, ya que la topologı́a inducida por la norma euclidiana
también tiene ese ingrediente geométrico que lo hace todo más fácil.
Los temas a considerar, lógicamente no son nuevos, pero la diferencia
esta en el enfoque geométrico. En el primer y segundo capitulo consideramos los conjuntos y las funciones convexas y sus generalidades. Los
resultados considerados, lógicamente son las herramientas a utilizar en los
capı́tulos subsiguintes. En el tercer capitulo consideramos los teoremas de
separación y la conjugación de Fenchel que es fundamental para la teorı́a
de dualidad que es desarrollada en el cuarto capitulo. Finalmente en el
quinto capitulo consideramos la monotonı́a de los subdiferenciales de las
funciones convexas.
Esta monografı́a fue basada en los manuscritos del Prof. Jean Pierre
Crouzeix y fue utilizada como material para el minicurso ”Analisis Convexo” impartido por el mismo profesor del 21 de Noviembre al 16 de Diciembre del 2002 en el Instituto de Matemática y Ciencias Afines (IMCA)
de Lima (Peru).
Lima, Enero del 2003
Jean Pierre Crouzeix
Eladio Ocaña
Wilfredo Sosa
Contenido
1 Convexidad
1.1 Conjuntos convexos . . . . . . . . . . . .
1.2 Propiedades topológicas . . . . . . . . .
1.2.1 Propiedades relativas a abiertos .
1.2.2 Propiedades relativas a cerrados
1.3 Teorema de Caratheodory . . . . . . . .
1.4 Conos asintóticos . . . . . . . . . . . . .
1.5 Convexos y aplicaciones lineales . . . . .
.
.
.
.
.
.
.
1
1
5
5
6
8
10
12
2 Funciones convexas
2.1 Generalidades de las funciones de IRn en IR . . . . . . . . .
2.2 Funciones convexas de IRn en IR . . . . . . . . . . . . . . .
2.3 Funciones asintóticas . . . . . . . . . . . . . . . . . . . . . .
16
16
20
25
3 Conjugación y Subdiferencial
3.1 Teorema de separación . . . . . . . . . . . . .
3.2 Conos polares . . . . . . . . . . . . . . . . . .
3.3 Funciones conjugadas . . . . . . . . . . . . .
3.3.1 Introducción geométrica . . . . . . . .
3.3.2 Definición . . . . . . . . . . . . . . . .
3.4 Funciones indicatriz y soporte de un conjunto
3.5 Función ası́ntota y conjugación . . . . . . . .
3.6 Subdiferencial de una función convexa . . . .
31
31
35
36
36
37
41
43
45
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3.7
3.8
3.9
Derivadas direccionales de una función convexa . . . . . . .
Derivadas de una función convexa . . . . . . . . . . . . . .
Subdiferencial de la suma de dos
funciones convexas . . . . . . . . . . . . . . . . . . . . . . .
47
50
52
4 Introducción a la Dualidad Convexa
4.1 Esquema General . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Noción del Lagrangiano . . . . . . . . . . . . . . . .
4.2 Dualidad en Programación Lineal . . . . . . . . . . . . . . .
4.3 Pertubación vertical con solo restricciones de desigualdad .
4.4 Perturbación Vertical - Caso General . . . . . . . . . . . .
4.5 Ejemplo de perturbaciones no Verticales . . . . . . . . . . .
4.6 Inf convolución y el Sub diferencial de la suma de dos funciones convexas . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 Subdiferencial de una función máximo de funciones . . . .
53
53
56
58
60
62
64
5 Monótonia y continuidad del subdiferencial
5.1 Nociones generales sobre las multiaplicaciones . . . . . .
5.2 Monotonı́a del subdiferencial . . . . . . . . . . . . . . .
5.3 Continuidad de una multiaplicación . . . . . . . . . . . .
5.4 Continuidad del subgradiente . . . . . . . . . . . . . . .
5.4.1 Aplicación a la sensibilidad . . . . . . . . . . . .
5.4.2 Propiedades genéricas de las funciones convexas
5.5 -subdiferenciales . . . . . . . . . . . . . . . . . . . . . .
72
72
73
74
76
77
80
84
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
66
70
Capı́tulo 1
Convexidad
1.1
Conjuntos convexos
Definición 1.1.1 Un conjunto C ⊂ IRn es convexo si:
∀x ∈ C, ∀y ∈ C y ∀t ∈ [0, 1] : tx + (1 − t)y ∈ C
Observación, La definición de convexidad es meramente vectorial y unidimensional, es decir que no se requiere de ninguna topologı́a ni de otras
estructuras matemáticas excepto la vectorial, para definirla y la verificación
es hecha sobre un segmento de recta.
Definición 1.1.2 Dados x ∈ IRn y C ⊂ IRn . Se dice que x es una combinación convexa de elementos de C, si existen: p ∈ IN, {ti }pi=1 ⊂ [0, 1] y
Pp
Pp
{xi }pi=1 ⊂ C tales que x = i=1 ti xi y i=1 ti = 1.
Proposición 1.1.1 Dado C ⊂ IRn . C es convexo si y solo si contiene
todas las combinaciones convexas de C.
Demostración. La Definición 1.1.1 implica que todo conjunto que contiene a todas sus combinaciones convexas es un conjunto convexo. La
recı́proca es consecuencia de la inducción matemática. En efecto, la Definición 1.1.1 implica que vale para p = 1 y para p = 2. Por hipótesis de
1
inducción, supongamos que vale para p > 2, entonces debemos probar que
p+1
vale para p + 1. Para esto considere {xi }p+1
i=1 ⊂ C y {ti }i=1 ⊂ [0, 1] tal que
Pp+1
Pp+1
x = i=1 ti xi y i=1 ti = 1. Sin perdida de generalidad supongamos que
Pp
(caso contrario ti = 0 ∀i = 1, · · · , p, ası́ x = xp+1 ∈ C). Hai=1 ti 6= 0
Pp
Pp
Pp
ciendo t = i=1 ti y y = i=1 tti xi , se tiene que i=1 tti = 1, tp+1 = 1 − t
y x = ty + (1 − t)xp+1 . Por la hipótesis de inducción y ∈ C y por la
Definición 1.1.1 x ∈ C.
Proposición 1.1.2 Si I es un conjunto de indices cualquiera y {Ci }i∈I es
una familia de conjuntos convexos de IRn , entonces ∩i∈I Ci es también un
conjunto convexo.
Demostración. Queda como ejercicio para el lector.
Definición 1.1.3 Dado un conjunto S ⊂ IRn no vacı́o, diremos que la
cápsula convexa de S, la cual denotaremos como co(S), es la intersección
de todos los conjuntos convexos que contienen a S.
Observación, la cápsula convexa co(S) de un conjunto S es también convexa, resulta de aplicar la Proposición 1.1.2. Más aún, la cápsula convexa
de un conjunto S, es el menor conjunto convexo que contiene a S.
Proposición 1.1.3 La cápsula convexa de un conjunto S ⊂ IRn no vacio,
es el conjunto de todas las combinaciones convexas del conjunto S.
Demostración. Sea D el conjunto de todas combinaciones convexas de
S, entonces S ⊂ D. Por la Proposición 1.1.1 D es convexo, por lo tanto
S ⊂ co(S) ⊂ D. Recı́procamente, sea y ∈ D, esto implica que y es una
combinación de elementos de S ⊂ co(S), ası́ y también es una combinación
convexa de elementos de co(S). Finalmente, usando la Proposición 1.1.1,
se tiene que y ∈ co(S).
Corolario 1.1.1 S1 ⊂ S2 implica que co(S1 ) ⊂ co(S2 ).
Demostración. Queda como ejercicio para el lector.
2
Definición 1.1.4 K ⊂ IRn es un cono, si ∀x ∈ K, ∀λ > 0 : λx ∈ K.
El cono K es llamado sin punta, si 0 ∈
/ K.
El cono K es llamado convexo si K es un conjunto convexo.
Proposición 1.1.4 Dado K ⊂ IRn .
a) K es un cono convexo si y solo si K es un cono y se verifica que x + y ∈
K para cada x, y ∈ K.
b) Si I es un conjunto de indices cualquiera y {Ki }i∈I es una familia de
conos en IRn , entonces ∩i∈I Ki es también un cono.
Demostración. queda como ejercicio para el lector.
Dado un conjunto S ⊂ IRn , consideremos la familia de todos los conos
que contienen a S (esta familia es no vacı́a, pues contiene a IRn ). La
intersección de los conos que contienen a S es también un cono que contiene
a S y es el cono más pequeño que contiene a S. Este cono es llamado la
cápsula cónica de S generada por S y es denotada por con(S). Si a la
cápsula cónica de S le incluimos el origen, entonces obtenemos un cono que
es llamado cono generado por S y es denotado por cono(S).
Proposición 1.1.5 Sea S ⊂ IRn .
a) con(S) := {λx : x ∈ S, λ > 0}
b) cono(S) := {λx : x ∈ S, λ ≥ 0}
c) Si S es convexo, entonces con(S) y cono(S) son también convexos.
Demostración. Queda como ejercicio para el lector.
Dado un conjunto S ⊂ IRn , ahora consideremos la familia de todos los
conos convexos que contienen a S (esta familia también es no vacı́a pues
contiene a IRn ). La intersección de los conos convexos que contienen a S,
es también un cono convexo, más aún es el cono convexo más pequeño que
3
contiene a S, el cual es llamado cápsula convexa cónica de S. Si a esta
cápsula convexa cónica de S le incluimos el origen, entonces obtenemos el
cono convexo generado por S.
Proposición 1.1.6 Sea S ⊂ IRn , S 6= ∅.
a) La cápsula convexa cónica de S y la cápsula convexa cónica de co(S)
coinciden.
b) Los conos convexos generados respectivamente por S, co(S) y co(S)∪{0}
coinciden.
Demostración. Queda como ejercicio para el lector.
Dado H ⊂ IRn , H 6= ∅. Se dice que H es un subespacio afı́n de IRn si
existe a ∈ H tal que H − a := {h − a : h ∈ H} es un subespacio vectorial de
IRn . Note que H es un conjunto convexo y que H −a = H −b ∀a, b ∈ H. La
dimensión de H (dim(H)) es la dimensión del subespacio vectorial H − a.
Proposición 1.1.7 Si I es un conjunto de indices cualquiera y {Hi }i∈I es
una familia de subespacios afines de IRn , entonces ∩i∈I Hi es un subespacio
afı́n de IRn .
Demostración. Queda como ejercicio para el lector.
Dado un conjunto S ⊂ IRn , consideremos la familia de subespacios
afines que contienen a S (esta familia también es no vacı́a pues contiene
a IRn ). La intersección de estos subespacios afines que contienen a S es
también un subespacio afı́n y es el más pequeño de los subespacios afines
que contiene a S y se llamará subespacio afı́n generado por S y es denotado
por af f (S). Por definición, la dimensión de S es la dimensión de af f (S).
Proposición 1.1.8 Sea S ⊂ IRn , S 6= ∅ y a ∈ S.
Pp
1. af f (S) = {a + i=1 ti (bi − a) : p ∈ IN, {ti }pi=1 ∈ IR, {bi }pi=1 ∈ S}.
2. S1 ⊂ S2 implica af f (S1 ) ⊂ af f (S2 ).
4
3. af f (S) = af f (co(S)).
Demostración. Queda como ejercicio para el lector.
Observación, Sea S ⊂ IRn , en general af f (S) 6= af f (con(S)).
1.2
1.2.1
Propiedades topológicas
Propiedades relativas a abiertos
Sea S ⊂ IRn no vacı́o. Se define el interior relativo de S, denotado por
ri(S), al interior de S en la topologı́a relativa de af f (S). Observe que en
general S1 ⊂ S2 no implica que ri(S1 ) ⊂ ri(S2 ). Por ejemplo considere en
IR2 , S1 = [0, 1] × {0} y S2 = [0, 1] × [0, 1].
Una propiedad topológica fundamental de los conjuntos convexos es la
siguiente.
Teorema 1.2.1 El interior relativo de un conjunto convexo no vacı́o es
no vacı́o.
Demostración. Sin perdida de generalidad supongamos que dim(S) = n
y que 0 ∈ S. Como dim(S) = n, entonces existen n vectores linealmente
independientes {x1 , · · · , xn } ⊂ S. Ahora consideremos
T := {
n
X
ti xi :
{ti }ni=1
i=1
⊂ (0, 1),
n
X
ti < 1}
i=1
entonces T ⊂ S. Por otro lado es fácil ver que T es un conjunto abierto,
pues es la imagen de un conjunto abierto por medio de una aplicación lineal
Pn
biyectiva que lleva (t1 , · · · , tn ) ∈ IRn → i=1 ti xi ∈ IRn .
Corolario 1.2.1 Si C ⊂ IRn es convexo, entonces af f (C) = af f (ri(C)).
Demostración. Sabemos que ri(C) ⊂ C, esto implica que af f (ri(C)) ⊂
af f (C). Por otra parte: C convexo implica ri(C) 6= ∅. Luego ri(C)
5
contiene una bola en la topologı́a relativa de af f (C), esto implica que
af f (C) ⊂ af f (ri(C)).
Teorema 1.2.2 Si C es convexo entonces ri(C) es convexo.
Demostración. Sin perdida de generalidad, supongamos que dim(C) =
n. Sean x, y ∈ int(C) y t ∈ [0, 1], luego existe r > 0 tal que B(x, r),
B(y, r) ⊂ C. Sea d ∈ IRn tal que ||d|| < r, entonces x + d ∈ C, y + d ∈ C,
esto implica que x + d + t(y − x) ∈ C, por lo tanto B(x + t(y − x), r) ⊂ C.
1.2.2
Propiedades relativas a cerrados
Proposición 1.2.1 Si S ⊂ IRn , entonces af f (S) = af f (S).
Demostración. Queda como ejercicio para el lector.
Observación, Es fácil ver que en IR los conjuntos convexos son los intervalos. Por otro lado, la clausura de un intervalo sigue siendo un intervalo
y por lo tanto convexo. Una generalización de esta observación es dada en
el siguiente resultado.
Proposición 1.2.2 Si C ⊂ IRn es convexo, entonces C es convexo.
Demostración. Sean a, b ∈ C, t ∈ [0, 1] y > 0, luego existen a0 ∈ C,
b0 ∈ C tales que ||a − a0 || < y ||b − b0 || < , luego
||a0 + t(b0 − a0 ) − a + t(b − a)|| ≤ (1 − t)||a0 − a|| + t||b − b0 || ≤ esto implica que a0 + t(b0 − a0 ) ∈ B(a + t(b − a), ).
Proposición 1.2.3 Sean C convexo y no vacı́o, x̄ ∈ ri(C), ȳ ∈ C y t ∈
]0, 1[ implican que x̄ + t(ȳ − x̄) ∈ ri(C).
Demostración. Sin perdida de generalidad, supongamos que dim(C) = n,
pues af f (ri(C)) = af f (C) = af f (C). Sea t ∈]0, 1[, z̄ = x̄ + t(ȳ − x̄) (se
6
supone que x̄ 6= ȳ), luego existe r > 0 tal que r < ||x̄ − z̄|| y V = {x ∈ IRn :
||x − x̄|| < r} ⊂ C, luego z̄ ∈
/ V , ȳ ∈
/ V y V ⊂ int(C). Sea
T := {y ∈ IRn : ∃x ∈ V, t ∈]0, 1[, z̄ = x + t(y − x)}
entonces
T = {y ∈ IRn : ∃x ∈ V, λ > 0, y = z̄ − λ(x − z̄)}
luego T es un cono abierto y ȳ ∈ T ∩ C, esto implica que existe ŷ ∈ T ∩ C.
Ahora considere U := {z ∈ IRn : ∃x ∈ V, µ ∈]0, 1[, z = ŷ + µ(x − ŷ)}. Es
fácil verificar que U es abierto y que U ⊂ C, luego z̄ ∈ U ⊂ C, esto implica
que z̄ ∈ int(C).
Proposición 1.2.4 Si C es no vacı́o y convexo, entonces:
1. ri(C) = ri(C).
2. ri(C) = C.
Demostración.
1. Sabemos que af f (C) = af f (C) y C ⊂ C. Tomemos z̄ ∈ ri(C),
sabemos que existe x̄ ∈ ri(C), esto implica que existe ȳC y t̄ ∈]0, 1[
tal que z̄ = x̄ + t̄(ȳ − x̄), finalmente usando la proposición anterior
tenemos que z̄ ∈ ri(C)
2. Sabemos que ri(C) ⊂ C. Sea ȳ ∈ C, como C 6= ∅, entonces existe
x̄ ∈ ri(C), luego para todo n ∈ IN zn = x̄ + (1 − n1 )(ȳ − x̄) ∈ ri(C),
esto implica que ȳ ∈ ri(C).
Sea S ⊂ IRn . Consideremos la familia de conjuntos convexos cerrados
que contienen a S, esta familia es no vacı́a porque contiene a IRn . La
intersección de todos los conjuntos convexos y cerrados que contienen a
S es el conjunto convexo cerrado más pequeño que contiene a S. Esta
intersección es llamada la cápsula convexa cerrada de S y es denotada por
co(S).
7
Proposición 1.2.5
co(S) = co(S)
Demostración. Queda como ejercicio para el lector.
Observación, Note que en general, si C es un convexo y cerrado, entonces
el cono generado por C no es necesariamente cerrado. En efecto, en IR2
considere
C := {(x, y) : x > 0, y > 0, xy ≥ 1}
Este mismo ejemplo muestra que la proyección de un convexo y cerrado,
no necesariamente es cerrado, pero la proyección de un convexo es siempre
un conjunto convexo.
Frontera de un conjunto convexo Dado S ⊂ IRn . Se define y se denota
la frontera de S como:
/ int(S)}
F r(S) := {x ∈ S : x ∈
Proposición 1.2.6 Si C es convexo, entonces las fronteras relativas de C,
de ri(C) y de C coinciden.
Demostración. Queda como ejercicio para el lector.
1.3
Teorema de Caratheodory
Teorema 1.3.1 Sea S ⊂ IRn , S 6= ∅ y sea x0 ∈ S fijo. Si x ∈ S, entonces
existen: p ∈ IN, {ti }pi=1 ⊂]0, +∞[ y {xi }pi=1 ⊂ S; tales que:
Pp
• x = x0 + i=1 ti (xi − x0 ).
Pp
•
i=1 ti ≤ 1
• Los vectores {xi − x0 }pi=1 son linealmente independientes.
8
Demostración. Como x ∈ S ⊂ co(S), entonces existe p ∈ IN, {ti }pi=0 ⊂
Pp
Pp
[0, 1] y {xi }pi=0 ⊂ S tales que i=0 ti = 1 y x = i=1 ti xi (eventualmente
t0 = 0), luego
x = x0 +
p
X
ti (xi − x0 ),
i=1
p
X
ti = 1 − t 0 ≤ 1
(1.1)
i=1
Sin perdida de generalidad, supongamos que ti > 0 ∀i = 1, · · · , p. Si los
vectores {xi − x0 }pi=1 son linealmente independientes, entonces habremos
probado el teorema, caso contrario existen {µi }pi=1 ⊂ IR no todos nulos
tales que
p
X
µi (xi − x0 ) = 0
(1.2)
i=1
Pp
podemos suponer que i=1 µi ≥ 0 (caso contrario tomamos µi = −µi ).
µ
Seleccionemos i0 ∈ {1, · · · , p} tal que tii0 = max[ µtii : i = 1, · · · , p], esto
0
implica que µi0 > 0. Sin perdida de generalidad, podemos suponer i0 = p,
entonces
µp
µi
≥
∀i = 1, · · · , p − 1
(1.3)
tp
ti
Combinando las ecuaciones (1.3) y (1.2) obtenemos:
x = x0 +
p−1
X
(ti −
i=1
considerando t0i = ti −
1, · · · , p − 1, más aún
p−1
X
i=1
µi
µp tp
t0i =
µi
tp )(xi − x0 )
µp
(1.4)
y la ecuación (1.3), se tiene que t0i ≥ 0 ∀i =
p−1
X
i=1
ti −
p−1
p−1
X
tp X
µi ) ≤
ti ≤ 1
µp i=1
i=1
repetir este proceso (desde la ecuación 1.2 hasta que los vectores resultantes
sean linealmente independientes.
Teorema 1.3.2 Teorema de Caratheodory. Sea S ⊂ IRn , para obtener su
cápsula convexa, es suficiente considerar las combinaciones convexas de a
lo mas (n + 1) elementos de S
9
Demostración. Como consecuencia directa del Teorema 1.3.1 tenemos
Pp
P
que: si x ∈ co(S), entonces x = i=0 ti xi con t0 = 1 − ti . Los vectores
(xi − x0 ) son linealmente independiente, en consecuencia se tiene que p ≤
n.
Teorema 1.3.3 La cápsula convexa de un conjunto cerrado y acotado es
cerrado y acotado
Demostración. Sea S cerrado y acotado (entonces compacto). Si x ∈
n+1
co(S) entonces existen {xi }n+1
i=1 ⊂ S, {ti }i=1 ⊂ [0, 1] (hacer eventualmente
Pn+1
Pn+1
ti = 0) tales que i=1 ti = 1 y x = i=1 ti xi . Consideremos
T = {t ∈ IRn+1 : {ti }n+1
i=1 ⊂ [0, 1],
n+1
X
ti = 1}
i=1
el cual es un conjunto compacto y sea f : IRn ×(IRn )n+1 → IRn definida por
P
f (t, x1 , x2 , ..., xn+1 ) =
ti xi , f es continua. Observe que co(S) = f (T ×
n+1
S
), luego co(C) es compacto como imagen de un conjunto compacto
por una aplicación continua.
1.4
Conos asintóticos
Sea C ⊂ IRn convexo no vacı́o y a ∈ C. Ahora considere
C∞ (a) = {d ∈ IRn : a + λd ∈ C, ∀λ > 0}
Se observa inmediatamente que 0 ∈ C∞ (a) y que C∞ (a) es un cono, más
aún, este cono es convexo. En efecto: sean d1 , d2 ∈ C∞ (a) hay que probar
que d1 + d2 ∈ C∞ (a), es decir a + λ(d1 + d2 ) ∈ C para todo λ > 0. Pero
a + λ(d1 + d2 ) = 12 (a + 2λd1 ) + 12 (a + 2λd2 ) ∈ C.
Observación, En general C∞ (a) depende de a, por ejemplo considere:
[
C = {(x, y) : x > 0, y > 0} {(0, 0)}
10
Es fácil ver que C es convexo. Además
[
C∞ ((0, 0)) = {(0, 0)} C
C∞ ((1, 1)) = {(x, y) : x ≥ 0, y ≥ 0}.
Definición 1.4.1 Dado C ⊂ IRn convexo no vacı́o, se llama cono de reT
cesión de C (o cono asintótico de C) al conjunto C∞ = a∈C C∞ (denotado
por Rockafellar O+ C). Los elementos d ∈ C∞ son llamadas direcciones de
recesión de C.
Teorema 1.4.1 Sea C ⊂ IRn convexo cerrado no vacı́o, entonces
C∞ (a) = C∞ (b) ∀ a, b ∈ C
además C∞ := C∞ (a) = C∞ (b) es cerrado
Demostración.
a) Mostraremos que C∞ (a) ⊂ C∞ (b). Sea d ∈ C∞ (a), λ > 0 se va
mostrar que b + λd ∈ C. Se sabe que a + nλd ∈ C ∀n ∈ IN, luego
(1 − n1 )b + n1 (a + nλd) ∈ C (por la convexidad de C y porque b ∈ C),
en consecuencia (1 − n1 )b + n1 a + λd ∈ C, haciendo tender n → ∞ y
utilizando el hecho de que C es cerrado se tiene que b + λd ∈ C.
b) Por simetrı́a C∞ (b) ⊂ C∞ (a)
c) Sea {dn }i∈IN ⊂ C∞ tal que dn → d mostraremos que d ∈ C∞ , es
decir a + λd ∈ C ∀λ > 0. Se sabe que a + λdn ∈ C ∀n, dn → d y
C cerrado, en consecuencia a + λd ∈ C.
Proposición 1.4.1 Sea C ⊂ IRn convexo cerrado y no vacı́o. Entonces C
es acotado si y solo si C∞ = {0}
Demostración.
a) Si C es acotado entonces trivialmente C∞ = {0}
b) Supongamos que C no es acotado, entonces mostraremos que C∞ no
se reduce al origen. Fijemos a ∈ C, entonces ∀n ∈ IN ∃{xn }n∈IN ∈ C
11
−a
tal que kxn −ak ≥ n. Consideremos dn = kxxnn −ak
, entonces kdn k = 1,
n
luego ∃d ∈ IR , kdk = 1 y una sub sucesión dnk → d. Se va mostrar
que d ∈ C∞ . Sea λ > 0 cualquiera, como a ∈ C y xnk ∈ C, entonces
tkx −ak
a+t(xnk −a) ∈ C ∀ t ∈]0, 1[, luego a+ nλk
(λdnk ) ∈ C ∀ t ∈]0, 1[.
Considerando tnk = kxn λ−ak se tiene que a + λdnk ∈ C ∀k ≥ k0 . Si
k
k → ∞ entonces dnk → d, C cerrado y en consecuencia a + λd ∈ C.
Sea C convexo cerrado no vacı́o,luego es fácil verificar que el conjunto
T
C∞ (−C∞ ) es un subespacio vectorial de IRn , el cual se llamará espacio de
T
linealidad de C (“lineality space”). Ahora considerando L = C∞ (−C∞ )
se tiene que
\
C = L + (C
L⊥ )
donde L⊥ = {y : hx, yi = 0 ∀x ∈ L}
Proposición 1.4.2 Si Ci son convexos cerrados de IRn y C =
T
entonces C∞ = i (Ci )∞
T
Ci 6= ∅,
Demostración. Queda como ejercicio para el lector.
1.5
Convexos y aplicaciones lineales
Imagen Recı́proca Sea A : IRn → IRp una aplicación lineal y C ⊂ IRp ,
se considera A− (C) = {x ∈ IRn : Ax ∈ C}. Debido a que A es continua,
A− (C) es abierto cuando C es abierto, cerrado cuando C es cerrado. Se
demuestra también fácilmente que A− (C) es convexo si C es convexo.
Imagen Sea A : IRn → IRp una aplicación lineal y C ⊂ IRn se considera
A(C) = {y ∈ IRp : ∃ x ∈ C con y = Ax}. Se verifica fácilmente que
A(C) ⊂ A(C) y que si C es convexo, entonces A(C) es convexo.
Proposición 1.5.1 Si C ⊂ IRn es convexo no vacı́o y A : IRn → IRp es
una aplicación lineal, entonces
A(ri(C)) = ri(A(C)) = ri(A(C))
12
Demostración. Es fácil verificar que:
A(ri(C)) ⊂ A(C) ⊂ A(C) = A(ri(C)) ⊂ A(ri(C)) ⊂ A(C)
esto implica que A(ri(C)) = A(C) = A(C) y como ri(D) = ri(D) entonces
se tiene
ri(A(C)) = ri(A(C)) = ri(A(ri(C))) ⊂ A(ri(C))
Para la recı́proca, tome ȳ ∈ A(ri(C)) y yb ∈ ri(A(C)) (b
y existe debido a que
A(C) 6= ∅). Luego, existen x̄ ∈ ri(C) y x
b ∈ C tal que ȳ = Ax̄ y yb = Ab
x.
Como x̄ ∈ ri(C), existe x̃ ∈ ri(C) y t ∈]0, 1[ tal que x̄ = tx̂ + (1 − t)x̃ y por
lo tanto ȳ = tŷ + (1 − t)ỹ, siendo ỹ = A(x̃). Debido a que ŷ ∈ ri(A(C)) y
ỹ ∈ A(C), entonces se tiene que ȳ ∈ ri(A(C)).
Sea C ⊂ IRn un conjunto cerrado no vacı́o y sea A : IRn → IRp una
aplicación lineal. A(C) es cerrado?. Este es verdad si además el conjunto
C es acotado; porque la imagen de un compacto por una aplicación continua
es compacto y en consecuencia cerrado. Este es falso en general, por ejemplo
considere:
C = {(x, y) ∈ IR2 : x > 0, y > 0, xy ≥ 1}
A : IR2 → IR tal que A(x, y) = x
Entonces A(C) =]0, +∞[ no es cerrado. (Aquı́ A(C) es la proyección de C
sobre el eje x)
Teorema 1.5.1 sea A : IRn → IRp una aplicación lineal. C ⊂ IRn convexo
no vacı́o. Si la siguiente condición es satisfecha:
Para d ∈ IRn : Ad = 0 y d ∈ (C)∞ ⇒ −d ∈ (C)∞ ,
entonces,
a) A(C) = A(C)
b) A(C ∞ ) = [A(C)]∞
Demostración.
13
a) Se tiene siempre A(C) ⊂ A(C) ⊂ A(C) ⊂ A(C). Poniendo D = C es
suficiente demostrar que A(D) es cerrado. Sin perdida de generalidad
T
T
se supone que 0 ∈ D. Sea L = D∞ (−D∞ ) {d : Ad = 0} y L⊥
e = D T L⊥ entonces D
e es
el sub espacio ortogonal de L. Tomando D
e + L, A(D) = A(D).
e Por otro lado
cerrado, D = D
\
\
\
e ∞ {d : Ad = 0} = (L⊥ )∞ D∞ {d : Ad = 0} =
D
L⊥
\
D∞
\
(−D∞ )
\
{d : Ad = 0} = {0}
e existe una sucesión
e es cerrado. Sea ȳ ∈ A(D),
Mostraremos que A(D)
e
e T{x : kAx− ȳk ≤
{xn } tal que xn ∈ D y Axn → ȳ. Considere K = D
1}, K es convexo cerrado. Se verifica que {x : kAx − ȳk ≤ 1}∞ =
e ∞ T d : Ad = 0 = {0} y
{d : Ad = 0}. Se sigue que K∞ = (D)
K es acotado. Por consiguiente la sucesión {xn } es acotada, sea x̄
e Ax̄ = ȳ y
un elemento de la adherencia, se tiene entonces x̄ ∈ D,
e
ȳ ∈ A(D).
b) Se va mostrar que A(D∞ ) = [A(D)]∞ . Sea d ∈ D∞ , debido a que
0 ∈ D se tiene λd ∈ D ∀ λ > 0, por consiguiente λA(d) = A(λd) ∈
A(D) ∀ λ > 0 y en consecuencia Ad ∈ [A(D)]∞ . Sea v ∈ [A(D)]∞ =
e ∞ , v 6= 0. Debido a que 0 ∈ D,
e 0 ∈ A(D)
e y en consecuencia
[A(D)]
e ∀λ > 0, en particular si λ = 1 y poniendo K = {d ∈ D
e :
λv ∈ A(D)
T
e
Ad = v} = D {d : Ad = v} entonces K es convexo cerrado no vacı́o
e ∞ T{d : Ad = v} = {0} y por consiguiente K es acotado.
y K∞ = D
e existe dn ∈ K tal que ndn ∈ D.
e La sucesión
Debido a que nv ∈ A(D),
{dn } es acotada, entonces admite valor de adherencia, sea d un tal
e ∞ , acabo; en caso contrario existe
valor, entonces d ∈ K. Si d ∈ (D)
e
λ > 0 tal que λd ∈
/ D. Notemos que debido a que 0 y ndn están en
e se tiene λdn ∈ D
e ∀n > λ. Debido a que λd es valor de adherencia
D
e debido a que D
e es cerrado lo cual es una
de {λdn } entonces λd ∈ D
contradicción.
Proposición 1.5.2 Si C y D son dos conjuntos convexos de IRn , entonces
C + D es un conjunto de IRn y se tiene ri(C) + ri(D) = ri(C + D)
14
Demostración. Considere A : IRn × IRn → IRn definida por A(x, y) =
x + y entonces A(C × D) = C + D. Es fácil ver que C × D es convexo y
ri(C × D) = ri(C) × ri(D).
De manera general, la suma de dos convexos cerrados no es necesariamente
cerrado. Considere por ejemplo
C = {(x, y) ∈ IR2 : x > 0, y > 0, xy ≥ 1
C = {(x, y) ∈ IR2 : y = 0, x ≤ 0
entonces
C + D = {(x, y) : y > 0}
Teorema 1.5.2 Si C y D son dos conjuntos convexos de IRn tales que
\
\
d ∈ (C)∞ (−C)∞ ⇒ −d ∈ (C)∞ (−C)∞
entonces
C +D =C +D
y
(C + D)∞ = (C)∞ + (D)∞
Demostración. Considere la aplicación lineal A(x, y) = x + y.
15
Capı́tulo 2
Funciones convexas
2.1
Generalidades de las funciones de IRn en
IR
Dada una función f : S → IR con S ⊂ IRn , se puede siempre prolongar a
una función g : IRn → IR definida por:
(
f (x) si x ∈ S
g(x) =
+∞
si x ∈
/S
Supondremos que las funciones están definidas en IRn con valores en IR
Dada f : IRn → IR y λ ∈ IR, consideraremos:
dom(f ) = {x ∈ IRn : f (x) < +∞}
epi(f ) = {(x, λ) ∈ IRn × IR : f (x) ≤ λ}
f ) = {(x, λ) ∈ IRn × IR : f (x) < λ}
epi(f
Sλ (f ) = {x ∈ IRn : f (x) ≤ λ}
Seλ (f ) = {x ∈ IRn : f (x) < λ}
No es difı́cil verificar:
• dom(f ) =
S
λ∈IR
Sλ (f ) =
S
λ∈IR
Seλ (f )
16
dominio de f
epigrafo de f
epigrafo estricto de f
subnivel λ de f
subnivel λ estricto de f
f ))
• dom(f ) = projIRn (epi(f )) = projIRn (epi(f
• λ < µ ⇒ Seλ (f ) ⊂ Sλ (f ) ⊂ Seµ (f ) ⊂ Sµ (f )
• λ < µ y (x, λ) ∈ epi(f ) ⇒ (x, µ) ∈ epi(f )
• f (x) = inf[λ : (x, λ) ∈ epi(f )] = inf[λ : x ∈ Sλ (f )]
f )] = inf[λ : x ∈ Seλ (f )]
• f (x) = inf[λ : (x, λ) ∈ epi(f
• f1 ≤ f2 ⇔ epi(f1 ) ⊃ epi(f2 ) ⇔ Sλ (f1 ) ⊃ Sλ (f2 ) ∀ λ ∈ IR
f 1 ) ⊃ epi(f
f 2 ) ⇔ Seλ (f1 ) ⊃ Seλ (f2 ) ∀ λ ∈ IR
• f1 ≤ f2 ⇔ epi(f
T
• Sλ (f ) × {λ} = epi(f ) [IRn × {λ}] ∀ λ ∈ IR
T
f ) [IRn × {λ}] ∀ λ ∈ IR
• Seλ (f ) × {λ} = epi(f
Recordemos que:
• Una función f es llamada semicontinua inferiormente (sci) en x0 si
∀ λ < f (x0 ) existe una vecindad V de x0 tal que x ∈ V ⇒ f (x) > λ.
• Una función f es llamada semicontinua superiormente (scs) en x0 si
−f es sci en x0 , es decir ∀ λ > f (x0 ) existe una vecindad V de x0 tal
que x ∈ V ⇒ f (x) < λ.
• Una función f es llamada sci (scs) si este es sci (scs) en todo x ∈ IRn
Teorema 2.1.1 f es sci ⇐⇒ epi(f ) cerrado ⇐⇒ Sλ (f ) cerrado ∀ λ ∈
IR.
Demostración.
a) f sci ⇒ epi(f ) es cerrado. En efecto, se va mostrar que [epi(f )]c es
abierto. Sea (x0 , λ0 ) ∈
/ epi(f ), entonces λ0 < f (x0 ). Sea µ tal que
λ0 < µ < f (x0 ) entonces debido a que f es sci en x0 , existe una
vecindad V de x0 tal que x ∈ V ⇒ f (x) > µ, lo cual implica que
V ×] − ∞, µ] es una vecindad de (x0 , λ0 ) que no intersecta al epi(f ).
17
b) epi(f ) cerrado ⇒ Sλ (f ) cerrado. En efecto, esto se deduce de la
T
siguiente igualdad: Sλ (f ) × {λ} = epi(f ) [IRn × {λ}].
c) Sλ (f ) es cerrado ∀ λ ∈ IR, entonces ⇒ f es sci. En efecto, Si f (x0 ) =
−∞ entonces f es sci en x0 por definición. Si f (x0 ) > −∞ entonces
∀ < f (x0 ) se tiene que x0 ∈
/ Sλ (f ). Sλ (f ) cerrada entonces existe
una vecindad V de x0 tal que x ∈
/ Sλ (f ) ∀x ∈ V , es decir f (x) > λ
∀x∈V.
Los siguientes resultados son clásicos y bien conocidos:
• Si f y g son sci en x0 entonces f + g, min(f, g), kf , para todo k > 0
son sci en x0 .
• Sea I un conjunto de indices arbitrario. Si {fi }i∈I es una familia de
funciones sci en x0 , entonces supi∈I fi es sci en x0 .
Proposición 2.1.1 Si C es un compacto en IRn y f es sci en todo x ∈ C,
entonces existe x̄ ∈ C tal que f (x̄) = inf[f (x) : x ∈ C]
Demostración. Para todo λ > inf [f (x) : x ∈ C] = α considere Kλ =
T
{x ∈ C : f (x) ≤ λ} = C Sλ (f ). Los Kλ son compactos encajados no
T
vacı́os para todo λ > α (µ > λ ⇒ Kµ ⊃ Kλ ). Se sigue que K = λ>α Kλ
es no vacı́o. Tome x̄ ∈ K.
Proposición 2.1.2 Sean X × T ⊂ IRn , ϕ : X × T → IR y x̄ ∈ X tales
que ϕ es sci en (x̄, t) ∀ t ∈ T y T compacto. Si definimos h mediante
h(x) = inf t∈T ϕ(x, t), entonces h es sci en x̄.
Demostración. Sea λ ∈ IR tal que λ < h(x̄), entonces λ < ϕ(x̄, t)
∀t ∈ T , debido a que ϕ es sci en (x̄, t), existe una vecindad Vt × Wt de
(x̄, t) tal que (x0 , t0 ) ∈ Vt × Wt ⇒ λ < ϕ(x, t0 ). Pero T es compacto y
S
S
T , en consecuencia existen t1 , ..., tq tal que i=1,...,q Wti ⊃ T .
t∈T Wt ⊃
T
Sea V = i=1,...,q Vti , entonces V es una vecindad de x̄. Debido a que
S
Vti ⊃ V y Wti ⊃ T se tiene ϕ(x, t) > λ ∀ x ∈ V, ∀ t ∈ T y en
consecuencia h(x) ≥ λ. Se deduce que h es sci en x̄.
18
Dado una función f : IRn → IR, consideremos
= = {g : IRn → IR : g es sciy g(x) ≤ f (x)∀ x ∈ IRn }
Note que = es no vacı́o (pues contiene a la función idénticamente −∞).
Ahora consideremos supg∈= g, esta es una función sci mayorada por f y es
la mas grande función sci que es mayorada por f . Se llama regularización
sci de f y se le denota por f (cl(f )).
Proposición 2.1.3 epi(f¯) = epi(f ), Sλ (f¯) =
T
µ>λ
Sµ(f )
Demostración. Se tiene f ≤ f y en consecuencia epi(f ) ⊃ epi(f ). Debido a que f es sci epi(f ) es cerrado y en consecuencia epi(f ) ⊃ epi(f ).
Recı́procamente. Definamos g(x) = inf [λ : (x, λ) ∈ epi(f )]. Se ve que
epi(f ) = epi(g) y en consecuencia g es sci y g ≤ f , por lo tanto g ≤ f y
epi(g) = epi(f ) ⊂ epi(f ).
Proposición 2.1.4 f es sci en x0 si y solo si f (x0 ) = f (x0 ).
Demostración. Sabemos que f ≤ f . Si f (x0 ) < f (x0 ) elegimos λ ∈
]f (x0 ), f (x0 )[. Como ((x0 ), f (x0 )) ∈ epi(f¯) = epi(f ), entonces para cada
T
vecindad V de x0 V ×] − ∞, λ[ epi(f ) 6= ∅ y en consecuencia para cada
vecindad V de x0 , ∃x ∈ V tal que f (x) < λ lo cual implica que f no es sci
en x0 . Para la recı́proca, si f (x0 ) = f (x0 ). Sea λ < f (x0 ), debido a que f
es sci, existe una vecindad V de x0 tal que λ < f (x) ≤ f (x) ∀x ∈ V por
consiguiente f es sci en x0 .
T
Observación, Se tiene siempre que Sλ (f ) = µ>λ Sµ (f ) pero no necesariamente Sλ (f ) = Sλ (f ). Por ejemplo considere
(
x2 si x 6= 0
f (x) =
1
si x = 0
S0 (f ) = ∅
S0 (f ) = {0}
19
2.2
Funciones convexas de IRn en IR
a) Generalidades y primeras propiedades.
haremos la convención siguiente:
En todo lo que sigue
∞ + α = α + ∞ = +∞ ∀ α ∈ IR
−∞ + α = α − ∞ = −∞ ∀ α ∈ IR
(−∞) + ∞ = ∞ + (−∞) = +∞
Definición 2.2.1 Una función f : IRn → IR es llamado convexa si su
epı́grafo es convexa.
Por ejemplo



+∞
f (x) =
13

 −∞
si x < 0
si x = 0
si x > 0
es una función convexa.
Los siguientes resultados pueden ser verificados fácilmente:
f ) es convexo
• f es convexa si y solo si epi(f
• f es convexa si y solo si ∀x, y ∈ IRn , ∀ t ∈]0, 1[ se tiene
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
• f es convexa si y solo si ∀x ∈ IRn , ∀d ∈ IRn la función de una variable
real fx,d (t) = f (x + tx) es convexa.
• Si f es convexa, entonces dom(f ) = projIRn (epi(f )) es convexa, Sλ (f )
T
es convexa ∀λ ∈ IR (Sλ (f ) × {λ} = epi(f ) IRn × {λ})
• Si f es convexa, entonces f es convexa epi(f ) = epi(f ).
• Si f es convexa y si λ > 0 entonces λf es convexa.
• Si f es convexa y k : IR → IR es una función convexa creciente
entonces kof es convexa (Utilice la definición analı́tica).
20
• Si f y g son convexas, entonces f + g es convexa.
• Sea {fi }i∈I fi : IRn → IR convexas ∀ i ∈ I entonces f = supi∈I fi es
T
convexa (epi(f ) = i∈I epi(fi ))
Proposición 2.2.1 Sea ϕ : IRn × IRp → IR y h : IRn → IRp definida por
h(x) = inf y∈IRp ϕ(x, y). Si ϕ es convexa sobre IRn × IRp entonces h es
convexa sobre IRn
Demostración.
f
epi(h)
= {(x, λ) : h(x) < λ} = {(x, λ) : ∃ y ∈ IRp con ϕ(x, y) < λ}
f
f
epi(h)
= projIRn ×IR epi(ϕ)
f
en consecuencia epi(h)
es convexa como proyección de un convexo.
b) Propiedades de las funciones convexas de una variable real.
Proposición 2.2.2 Si θ es convexa y si ∃ x0 tal que θ(x0 ) = −∞, entonces
θ no puede tomar valores finitos en puntos que no están en la frontera de
su dominio.
Demostración. dom(θ) es un intervalo I. Si θ en finito en a ∈ int(I),
tomando b ∈ int(I) y t ∈]0, 1[ tal que a = tx0 + (1 − t)b entonces θ(a) ≤
tθ(x0 ) + (1 − t)θ(b) = −∞ debido a que θ(b) < +∞.
Proposición 2.2.3 Si θ es convexa y si θ(t) > −∞ ∀t ∈ IR, entonces θ es
continua sobre int(dom(θ). Por otro lado θ admite derivada por la derecha
y por la izquierda en todo t ∈ int(dom(θ)) y se tiene
0
0
0
0
θ−
(t) ≤ θ+
(t) ≤ θ−
(s) ≤ θ+
(s)
∀ ∀ s, t ∈ int(dom(θ)) tal que s ≤ t
Demostración. Sea a, b, c ∈ int(dom(θ)) tal que a < b < c, sea t tal que
b = (1 − t)a + tc se tiene entonces θ(b) ≤ (1 − t)θ(a) + tθ(c) en la que se
tiene
θ(b) − θ(a)
θ(c) − θ(a)
θ(c) − θ(b)
≤
≤
b−a
c−a
c−b
21
θ(c)−θ(b)
∀c
c−b
θ(c)−θ(b)
0
≤ θ+ (b); ∀a
c−b
0
Fijando b y c y haciendo tender a hacia b se tiene θ−
(b) ≤
>b
Fijando a y b y haciendo tender c hacia a se tiene
Por lo que se obtiene:
<b
0
θ+
(a) ≤
θ(b) − θ(a)
θ(c) − θ(b)
0
0
0
≤ θ−
(b) ≤ θ+
(b)
≤ θ−
(c)
b−a
c−b
Teorema 2.2.1 Sea θ : I → IR diferenciable donde I es un intervalo de
IR. Una condición necesaria y suficiente para que θ sea convexa sobre I es
que θ0 sea creciente sobre I.
Demostración. El resultado precedente muestra que la condición es necesaria. Supongamos ahora que θ0 es creciente y sea a, b ∈ I, t̄ ∈]0, 1[, a < b
y c = t̄a + (1 − t)b. Existe por el teorema de valor medio x1 y x2 tales que
a < x1 < c < x2 < b con
θ0 (x1 ) ≤
θ(c) − θ(a)
θ(b) − θ(c)
, θ0 (x2 ) ≤
c−a
b−c
Pero θ0 (x1 ) ≤ θ0 (x2 ), de donde se deduce que θ(c) ≤ t̄θ(a) + (1 − t)θ(b).
Teorema 2.2.2 Sea θ : I → IR diferenciable donde I es un intervalo de
IR. θ es convexa sobre I si y solo si θ00 ≥ 0 ∀ x ∈ I
Demostración. Queda como ejercicio para el lector.
b) Primeras propiedades de las funciones de varias variables. Sea
f : IRn → IR una función.
Proposición 2.2.4 Si f es convexa y si ∃ x0 tal que f (x0 ) = −∞, entonces f (x) = −∞ ∀x ∈ ri(dom(f )). Se sigue que f no puede tomar
valores finitos en puntos que están fuera de su frontera relativa de su dominio.
22
Demostración. Sea x ∈ ri(dom(f )), entonces t ∈]0, 1[ y y ∈ dom(f )
tal que x = tx0 + (1 − t)y. Debido a que f (x0 ) = −∞, f (y) < +∞ y
f (x) ≤ tf (x0 ) + (1 − t)f (y) se tiene f (x) = −∞.
Se dirá que una función convexa es propia si f (x) > −∞ ∀ x y si exists
x ∈ IRn tal que f (x) < +∞.
Proposición 2.2.5 Si f es una función convexa y propia entonces f es
sci sobre ri(dom(f )) y f es continua sobre int(dom(f )). En particular
f (x) = f (x) ∀ x ∈ ri(dom(f ))
Demostración.
a) Si f no es sci en x0 , entonces f (x0 ) < f (x0 ) y por lo tanto se tiene
T
que x0 ∈ Sf (x0 ) (f ) = λ>f (x0 ) Sλ (f ). Considere Sλ (f ) con λ ∈
]f (x0 ), f (x0 )[. Sea x̄ ∈ ri(Sλ (f )) (este elemento existe debido a que
ri(Sλ (f )) 6= ∅), Consideremos θ(t) = f (x0 + t(x̄ − x0 )). Debido a que
f es convexa, se tiene que 0 ∈ int(dom(θ)) ( ya que x0 ∈ ri(dom(f ))
y x̄ ∈ dom(f )) y por consiguiente θ es continua en 0. Por otro lado
x0 +t(x̄−x0 ) ∈ Sλ (f ) ∀t ∈ ]0, 1[ y por consiguiente f (x0 +t(x̄−x0 )) ≤
λ. Se sigue que x0 ∈ Sλ (f ) y f (x0 ) ≤ λ, en contradicción con λ ∈
]f (x0 ), f (x0 )[. Se tiene entonces que f (x) = f (x) ∀x ∈ ri(dom(f )).
b) Es suficiente mostrar que f es scs en todo x0 ∈ int(dom(f )). Sea
λ > f (x0 ), para i = 1, · · · , n considere θi (t) = f (x0 + tei ) donde
(e1 , · · · , en ) es la base canónica de IRn . Para i = 1, · · · , n, θi es
convexa y 0 ∈ int(dom(θi )) en consecuencia θi ) es continua en 0.
Debido a que θi (0) = f (x0 ) < λ, existe ti > 0 tal que θi < λ ∀ t ∈
[−ti , ti ]. Sea S = co(x0 ± ti ei ). Debido a que x0 ± ti ei ∈ Sλ (f ) y
Sλ (f ) es convexa se tiene S ⊂ Sλ (f ). Por otro lado S es una vecindad
de x0 .
Proposición 2.2.6 Si f es convexa propia, entonces f es convexa propia.
Demostración. Se ve fácilmente que dom(f ) ⊂ dom(f ) ⊂ dom(f ) y en
consecuencia ri(dom(f )) = ri(dom(f )). Si f (x0 ) = −∞ entonces f (x) =
f (x) = −∞ ∀ x ∈ ri(dom(f )) y en consecuencia f no es propia.
23
Proposición 2.2.7 Sea C un convexo abierto de IRn y f : C → IR diferenciable. f es convexa si y solo si h∇f (y) − ∇f (x), y − xi ≥ 0 ∀ x, y ∈ C
Demostración. Sea x ∈ C y d ∈ IRn . Considere θ(t) = f (x + td)
• Si f es convexa, θ es convexa. Tomando d = y − x entonces debido a
que θ0 (0) ≤ θ0 (1) se tiene h∇f (x), y − xi ≤ h∇f (y), y − xi.
• Si h∇f (y) − ∇f (x), y − xi ≥ 0 ∀ y ∈ C se deduce que θ0 es creciente
y en consecuencia θ es convexa.
Proposición 2.2.8 Sea C un convexo abierto de IRn y f : C → IR dos
veces diferenciable. f es convexa sobre C si y solo si ∇2 f (x) es semidefinida
positiva sobre C
Demostración. Como antes, considere θ(t) = f (x + td). Se ve que
f es convexa si y solo si θ00 (0) ≥ 0 ∀ x, d en consecuencia si y solo si
h∇2 f (x)d, di ≥ 0 ∀ x, d
Observación, Una función convexa propia sci no es necesariamente continua sobre la frontera de su dominio, para ello considere el siguiente ejemplo:
(
x2
si y > 0
y
f (x, y) =
+∞ en otros casos
!
2
y2
−xy
2
∇ f (x, y) = 3
y
−xy x2
Por consiguiente f es convexa sobre IR×]0, +∞[.
(
{(x, y) : y > 0, x2 − λy ≤ 0}
Sλ (f ) =
∅
Pero f (x, y) = inf [λ : (x, y) ∈ Sλ (f )]

x2


y
f (x, y) =
0


+∞
si λ ≥ 0
si λ < 0
y en consecuencia
24
si y > 0
si x = y = 0
en otros casos
Notemos que f ( n1 , n12 ) = 1 ∀n ∈ IN en consecuencia f no es s.c.s en (0, 0)
Proposición 2.2.9 Sea f convexa propia, entonces
dim(Sλ (f )) = dim(dom(f )) ∀ λ > inf f (x)
x
Demostración. Como f es propia, entonces existe x0 ∈ dom(f ) tal que
f (x0 ) < λ. Sea x1 ∈ ri(dom(f )), entonces f [(x0 + t(x1 − x0 )) = f (xt ) ≤
f (x0 ) + t[f (x1 ) − f (x0 )]. ∃t̄ ∈]0, 1[ tal que f (xt̄ ) < λ. Ası́ xt̄ ∈ ri(dom(f )).
La restricción de f al af f (dom(f )) es continua en xt̄ y en consecuencia
Sλ (f ) contiene una vecindad de xt̄ para la topologı́a de af f (dom(f )).
2.3
Funciones asintóticas
Sea f una función convexa sci propia, entonces epi(f ) es un convexo cerrado. Considere (epi(f ))∞ . Se observa que (0, 1) ∈ (epi(f ))∞ que es un
cono convexo cerrado, en consecuencia
(d, λ) ∈ (epi(f ))∞ y µ > λ ⇒ (d, µ) ∈ (epi(f ))∞
Luego (epi(f ))∞ es el epı́grafo de una función convexa sci que se denotara
por f∞ (o f 0+ Rockafellar), se llamara la función asintótica de f o función
de recesión de f
Proposición 2.3.1 Sea f una función convexa sci propia, entonces f es
positivamente homogénea de grado 1, es decir:
f∞ (kd) = kf∞ (d) ∀ k > 0, f∞ (0) = 0
Demostración.
a) (d, f∞ (d)) ∈ (epi(f ))∞ que es un cono, por lo tanto (kd, kf∞ (d)) ∈
(epi(f ))∞ y ası́ f∞ (kd) ≤ kf∞ (d) ∀ k > 0.
De la misma manera (kd, f∞ (kd)) ∈ (epi(f ))∞ ⇒ (d, k1 f∞ (kd)) ∈
(epi(f ))∞ y en consecuencia f∞ (d) ≤ k1 f∞ (kd) ∀ k > 0.
25
b) Se sabe que (0, 0) ∈ (epi(f ))∞ y en consecuencia f∞ (0) ≤ 0. Por
otro lado debido a que f es propia, existe a tal que f (a) < +∞.
(a, f (a)) ∈ epi(f ) y (0, f∞ (0)) ∈ (epi(f ))∞ ⇒ (a + λ0, f (a) +
λf∞ (0)) ∈ epi(f ) ∀ λ > 0. f (a) ≤ f (a) + λf∞ (0) ∀ > 0 ⇒ f∞ (0) ≥
0.
Proposición 2.3.2 Sea f convexa sci propia y a ∈ dom(f ), entonces
f∞ (d)
(a)
= supk>0 f (a+kd)−f
k
(a)
= limk→+∞ f (a+kd)−f
k
= limk→+∞ f (a+kd)
k
Demostración. Sean (a, f (a)) ∈ epi(f ) y (d, f∞ (d)) ∈ (epi(f ))∞ , entonces (a + kd, f (a) + kf∞ (d)) ∈ (epi(f ))∞ ∀k > 0, por lo tanto se tiene
(a)
(a)
que f (a+kd)−f
≤ f∞ (d) ∀k > 0. Sea ahora m ≥ supk>0 f (a+kd)−f
,
k
k
entonces f (a + kd) ≤ f (a) + km ⇒ (a + kd, f (a) + kf∞ (d)) ∈ (epi(f ))∞
∀k > 0 y en consecuencia (d, m) ∈ (epi(f ))∞ ⇒ f∞ (d) ≤ m. Considere ahora la función θ(t) = f (a + td) − f (a), esta función es convexa
0
y se tiene por dicha propiedad que θ(t)−θ(0)
≤ θ(tt)−θ(0)
∀ t0 > t y por
0 −0
t−0
lo tanto la función k →
(a)
limk→+∞ f (a+kd)−f
.
k
f (a+kd)−f (a)
k
es creciente y supk>0
f (a+kd)−f (a)
k
=
Ejemplos.
(
x
f (x) = e , entonces f∞ (d) =
0
+∞
si d ≤ 0
si d > 0
f (x) = 12 hx, Axi − hb, xi con A simétrica semi definida positiva
(
−hb, di si Ad = 0
f∞ (d) =
+∞
en caso contrario
(
0
si d = 0
f (x) = kxk, entonces f∞ (d) =
+∞ en caso contrario
Teorema 2.3.1 Sea f una función convexa propia y sci, entonces f∞ es
propia y S0 (f∞ ) = [Sλ (f )]∞ ∀λ tal que Sλ (f ) 6= ∅
26
Demostración.
a) Sea a ∈ dom(f ), se tiene por la proposición anterior que f∞ (d) ≥
f (a + d) − f (a) en consecuencia f∞ (d) > −∞. Por otro lado f∞ (0) =
0. Se sigue que f∞ es propia.
b) Sea d ∈ S0 (f∞ ), es decir (d, 0) ∈ (epi(f ))∞ y sea a ∈ Sλ (f ), es decir
(a, λ) ∈ epi(f ) entonces se tiene (a + kd, λ) ∈ epi(f ) en consecuencia
a + kd ∈ Sλ (f ) ∀ k > 0 , de esta manera d ∈ [Sλ (f )]∞ .
Recı́procamente sea d ∈ [Sλ (f )]∞ y sea a ∈ Sλ (f ), se tiene a +
kd ∈ Sλ (f ), es decir (a + kd, λ) ∈ epi(f ) ∀ k > 0 y por lo tanto
(d, 0) ∈ [epi(f )]∞ es decir f∞ (d) ≤ 0 por consiguiente d ∈ S0 (f∞ ).
Se dice que una función f es inf-compacta si Sλ (f ) es compacto ∀ λ. Esto
implica que una función inf-compacto es sci. Una propiedad fundamental
de funciones inf-compactas es la siguiente:
Proposición 2.3.3 Sea f : IRn →] − ∞, +∞] y sea α = inf f (x). Si f es
inf-compacto, entonces α > −∞ y S = {x : f (x) = α} es un compacto no
vacı́o.
T
Demostración. Note que S = λ>α Sλ f . Los Sλ f son compactos encajados no vacı́os, en consecuencia S es un compacto no vacı́o, Sea x̄ ∈ S,
entonces α = f (x̄) > −∞.
Proposición 2.3.4 Sea f convexa sci propia, entonces
f es inf-compacto ⇐⇒ S0 (f∞ ) = {0}
f es inf-compacto ⇐⇒ ∃ λ tal que Sλ (f ) es compacto no vacı́o.
Demostración. Utilizar el teorema anterior y el hecho que un conjunto
convexo cerrado C es compacto si y solo si C∞ = {0}.
Finalmente se da una caracterización de las funciones inf-compacto (no
necesariamente para funciones convexas)
27
Proposición 2.3.5 Sea f : IRn → [−∞, +∞] sci f es inf-compacto ⇐⇒
(kxn k → +∞ ⇒ f (xn ) → +∞)
Demostración. Supongamos que f no es inf-compacto, entonces existe λ
tal que Sλ (f ) es no acotado, es decir ∀ n ∈ IN, ∃ xn ∈ Sλ (f ) con kxn k ≥
n, luego kxn k → +∞ y por tanto limsupf (xn ) ≤ λ. Recı́procamente,
Supongamos que f es inf-compacto y que exista una sucesión kxn k → +∞
con limsupf (xn ) ≤ λ < +∞, xn ∈ Sλ+1 (f ) para n suficientemente grande,
lo cual es imposible ya que Sλ+1 (f ) es acotado.
Proposición 2.3.6 Sean f, g : IRn → [−∞, +∞] f inf-compacto, g sci y
acotada inferiormente( es decir ∃ β > −∞ tal que g(x) ≥ β ∀ x), entonces
f + g es inf-compacto.
Demostración. Observe que f (x) + g(x) ≤ λ ⇒ f (x) + β ≤ λ. En
consecuencia Sλ (f + g) ⊂ Sλ−β (f ) que es acotada. Se sigue que f + g es
inf-compacto.
Una función f es llamada estrictamente convexa si
f (tx + (1 − t)y) < tf (x) + (1 − t)f (y) ∀ t ∈]0, 1[, ∀ x, y; x 6= y
Una función f es llamada fuertemente convexa si
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) −
α
t(1 − t)kx − yk2 ∀ t ∈ [0, 1]
2
∀ x, y ∈ IRn (k.k norma euclidiana ) α es llamado coeficiente de la convexidad fuerte (coercividad) de f . Una función fuertemente convexa es
estrictamente convexa. Una función estrictamente convexa si alcanza su
ı́nfimo, ella la alcanza en un único punto.
Proposición 2.3.7 Sea f : IRn →] − ∞, +∞] y sea x̄ un punto arbitrario
de IRn . Sea g definida por g(x) = f (x) − α2 kx − x̄k2 . Entonces f es
fuertemente convexa de coeficiente α > 0 si y solo si g es convexa.
28
Demostración. f es fuertemente convexa de coeficiente α si y solo si
∀ t ∈]0, 1[, ∀ x, y ∈ IRn se tiene
α
f (x + t(y − x)) ≤ f (x) + t[f (y) − f (x)] − t(1 − t)kx − yk2
2
esto es si y solo si
α
α
kx + t(y − x) − x̄k2 ≤ g(x) + t[g(y) − g(x)] + tky−
2
2
α
α
x̄k2 + (1 − t)kx − x̄k2 − t(1 − t)kx − yk2
2
2
Es suficiente entonces observar que:
g(x + t(y − x)) +
kx + t(y − x) − x̄k2 = kx − x̄k2 + tky − x̄k2 − tkx − x̄k2 − t(1 − t)kx − yk2
Corolario 2.3.1 Sea f : IRn → IR. Si int(dom(f )) 6= ∅ y f es dos veces
diferenciable sobre sobre C, entonces f es fuertemente convexa de coeficiente de coercividad α > 0 si y solo si h∇2 f (x)d, di ≥ αkdk2 ∀ x ∈
int(dom(f )), ∀d ∈ IRn
Demostración. Defina g(x) = f (x) − α2 kxk2 . Se tiene entonces que para
todo x ∈ int(dom(f )) ∇2 g(x) = ∇2 f (x)−αI, en consecuencia g es convexa
sobre int(dom(f )) si y solo si h∇2 f (x)d, di ≥ αkdk2 ∀ x ∈ int(dom(f )).
Es suficiente de constatar que g es sci.
Teorema 2.3.2 Sea f : IRn → IR convexa sci propia. Si f es fuertemente
convexa, entonces f es inf-compacto.
Demostración. Sea α el coeficiente de la convexidad fuerte de f , x̄ ∈
dom(f ) y g(x) = f (x) − α2 kx − x̄k2 , g es entonces convexa y sci. Sea d 6= 0,
f∞ (d) = sup
t>0
g(x̄ + td) − g(x̄) αt 2
+ |dk .
t
2
g es convexa y en consecuencia
g(x̄ + td) − g(x̄)
g(x̄ + d) − g(x̄)
≥
∀t > 1
t
1
29
y en consecuencia f∞ (d) = ∞ si d 6= 0.
Aplicación. El principio variacional de Ekeland.
Teorema 2.3.3 Sea f : IRn →]−∞, +∞[ diferenciable tal que −∞ < m =
inf f (x). Sea > 0 y sea x tal que f (x ) ≤ m + . Existe entonces x̄ tal
√
√
que kx̄ − x k ≤ , k∇f (x̄)k ≤ 2 y f (x̄) ≤ m + .
Demostración. Consideremos g(x) = f (x) + α2 kx − x k2 con α > 0 f es
sci y la componente x → α2 kx − x k2 es inf-compacto. Se sigue que g es
inf-compacto. En consecuencia existe x̄ tal que g(x̄) ≤ g(x) para todo x,
se sigue que ∇g(x̄) = 0 y en consecuencia ∇f (x̄) + α(x − x ) = 0 y por lo
tanto k∇f (x̄)k = αkx − x k. Por otro lado
m+
α
α
kx − x k2 ≤ f (x̄) + kx − x k2 ≤ f (x ) ≤ m + 2
2
Se tiene por lo tanto kx − x k2 ≤
2
α,
f (x̄) ≤ m + . Tome α = 2.
30
Capı́tulo 3
Conjugación y
Subdiferencial
3.1
Teorema de separación
Se llaman hiperplanos de IRn , a los conjuntos de la forma
H = {x ∈ IRn : ha, xi = α}
donde a ∈ IRn , a 6= 0 y α ∈ IR. Los hiperplanos de IRn son los subespacios afines de dimensión (n − 1). Un hiperplano de R n divide IRn en dos
semiespacios cerrados
E1 = {x ∈ IRn : ha, xi ≥ α}
y
E2 = {x ∈ IRn : ha, xi ≤ α}
Dados S1 , S2 ⊂ R n , S1 y S2 no vacı́os, se habla de:
Separación Si existen a ∈ R n , a 6= 0 y α ∈ R tales que
ha, x1 i ≤ α ≤ ha, x2 i ∀ x1 ∈ S1 y x2 ∈ S2
31
Separación propia Si existe separación y además existen x1 ∈ S1 , x2 ∈
S2 tales que
ha, x2 − x1 i > 0
(S1 y S2 no están contenidos ambos en el hiperplano).
Separación estricta Si existen a ∈ R n , a 6= 0 y α ∈ R tales que
ha, x1 i < α < ha, x2 i ∀ x1 ∈ S1 y x2 ∈ S2
Separación fuerte Si existen a ∈ R n , a 6= 0, α1 ∈ IR y α2 ∈ IR tales que
ha, x1 i ≤ α1 < α2 ≤ ha, x2 i ∀ x1 ∈ S1 y x2 ∈ S2
Ahora analizaremos la separación de conjuntos con intersección vacı́a. Note
que:
S1 ∩ S2 = ∅ si y solo si 0 ∈
/ S2 − S1
Los primeros resultados de separación caracterizan la separación del
origen con un conjunto.
Teorema 3.1.1 Si C ⊂ IRn es un convexo cerrado no vacı́o tal que 0 ∈
/ C,
n
entonces existen a ∈ R y α > 0 tales que ha, xi ≥ α ∀ x ∈ C
Demostración. Consideremos el problema m = inf[||x||2 : x ∈ C] (donde
|| · || es la norma euclidiana). Observe que la función x → kxk2 es fuertemente convexa y en consecuencia convexa y sci. Entonces, existe un único
x̄ en C tal que m = kx̄k2 ≤ kxk2 ∀x ∈ C. Debido a que 0 ∈
/ C, se tiene
que x̄ 6= 0 y en consecuencia m > 0. Luego, ∀x ∈ C y t ∈ [0, 1] se tiene que
kx̄k = m ≤ hx̄ + t(x − x̄), x̄ + t(x − x̄)i = kx̄k2 + 2thx̄, x − x̄i + kx − x̄k2 . Esto
ultimo implica que hx̄, x − x̄i ≥ 0 ∀ x ∈ C. Tomando a = x̄ y α = kx̄k2 se
tiene el resultado.
Teorema 3.1.2 Si C es un convexo no vacı́o tal que 0 ∈
/ C, entonces existe
n
a ∈ R , a 6= 0 tal que ha, xi ≥ 0 ∀ x ∈ C y ha, xi > 0 ∀ x ∈ ri(C) (se tiene
separación propia)
32
Demostración. Si 0 ∈
/ C, entonces separar 0 de C usando el Teorema
3.1.1. Caso contrario, 0 ∈ C en consecuencia 0 ∈ af f (C). Ahora, considere
D = C + [af f (C)]⊥ . Note que D es convexo, 0 ∈
/ D y int(D) = ri(C) +
⊥
[af f (C)] . Sea x̄ ∈ ri(C), entonces x̄ ∈ int(D). Luego, para todo entero
p > 0, − xp ∈
/ D (en caso contrario 0 ∈ (D) ya que x̄ ∈ int(D) y 0 =
1
1
x̄
x̄
x̄
+
(1
−
p+1
p+1 )(− p )). Separando 0 de D + p , tenemos que existen:
ap 6= 0 y αp > 0 tales que
0 < αp ≤ hap , (x +
x̄
)i ∀ x ∈ D
p
Sin perdida de generalidad, se puede suponer kap k = 1. Haciendo x = x̄ se
tiene
1
0 < αp ≤ (1 + )hap , xi ≤ 2kxk
p
Luego, la sucesión {(ap , αp )} es acotada. Sea (a, α) un valor de adherencia
de la sucesión, entonces existe una subsucesión convergente a este valor. Se
tiene kak = 1 y α ≥ 0. Pasando al limite:
0 ≤ α ≤ ha, xi ∀ x ∈ D por lo tanto ∀ x ∈ C
Por otro lado si x ∈ ri(C) entonces x ∈ int(D) y por lo tanto ha, xi > 0.
Teorema 3.1.3 (Separación fuerte) Sean C, D dos convexos cerrados y
no vacı́os tales que:
1. C ∩ D = ∅,
2. d ∈ C∞ ∩ D∞ ⇒ −d ∈ C∞ ∩ D∞
entonces existen a ∈ R n , α1 , α2 ∈ R tales que
ha, xi ≤ α1 < α2 ≤ ha, yi ∀ x ∈ C, ∀y ∈ D
Demostración. Tomando S = D − C, entonces 0 ∈
/ S y S es cerrado, en
consecuencia por el Teorema 3.1.1 existen a ∈ R n y β > 0 tal que
β≤
inf
x∈C,y∈D
ha, y − xi = inf ha, yi − sup ha, xi
y∈D
33
x∈C
Tomando α1 = supx∈C ha, xi y α2 = inf y∈D ha, yi, se tiene α2 − α1 ≥ β >
0.
Teorema 3.1.4 (Separación propia) Sean C, D dos convexos no vacı́os
tales que ri(C) ∩ ri(D) 6= ∅, entonces existen a ∈ R n , a 6= 0 y α ∈ R tales
que
ha, xi ≤ α ≤ ha, yi ∀ x ∈ C, y ∈ D
Además para todo x ∈ ri(C) y y ∈ ri(D) se tiene ha, y − xi > 0
Demostración. Tomando M = ri(D) − ri(C) = ri(M ), se tiene 0 ∈
/M
n
convexo no vacı́o, por el Teorema 3.1.2, existe a ∈ R , a 6= 0 tal que
ha, xi < ha, yi ∀ x ∈ ri(C), y ∈ ri(D)
por lo tanto
sup ha, xi <
inf ha, yi
x∈ri(D)
x∈ri(C)
Luego debido a que
sup ha, xi = sup ha, xi = sup ha, xi
x∈ri(C)
x∈ri(C)
x∈C
y
inf ha, yi =
y∈ri(D)
inf ha, yi = inf ha, yi
y∈ri(D)
y∈D
se tiene el teorema tomando α = 12 [supx∈C ha, xi + infy∈D ha, yi].
Observación, En general no se tiene la existencia de α ∈ R y a ∈ R n tal
que
ha, xi < α < ha, yi ∀ x ∈ ri(C) y y ∈ ri(D)
como contraejemplo considere:
C = {(x, y) : x > 0, y > 0, xy ≥ 1} y D = {(x, y) : y = 0}
34
3.2
Conos polares
Sea K ⊂ R n , K 6= ∅. Definamos
K 0 = {x∗ ∈ R n : hx, x∗ i ≤ 0 ∀ x ∈ K} =
\
{x∗ ∈ R n : hx, x∗ i ≤ 0}
x∈K
K 0 es un cono convexo y cerrado como intersección de conos convexos
cerrados. Es fácil ver que K1 ⊂ K2 implica K10 ⊃ K20 , (K)0 = K 0 ,
[con(K)]0 = K 0 . Existen numerosas propiedades concerniente a los polares tanto de la intersección, reunión, de la suma, etc que son estudiadas
aquı́. Notemos que siempre se tiene K 00 ⊃ K.
Teorema 3.2.1 Sea K un cono convexo cerrado y no vacı́o, entonces
(K 0 )0 = K
Demostración. sea x ∈
/ K, entonces existe a 6= 0 y α ∈ R tal que
ha, xi = α < ha, yi ∀y ∈ K. Debido a que 0 ∈ K se tiene α < 0, luego
como K es un cono h−a, yi ≤ 0 para todo y ∈ K y por lo tanto −a ∈ K 0 ,
de esta manera h−a, xi = −α > 0 y ası́ x ∈
/ K 00 .
Observación, si K = ∅, K 0 = R n y K 00 = {0} aquı́ K 00 6= K. El teorema
nos dice que si K es un cono convexo cerrado no vacı́o este es el polar de su
polar, luego perfectamente definido con K 0 este es la base de la dualidad
convexa.
Corolario 3.2.1 Sea K ∈ R n , K 6= ∅, entonces K 00 es el cono convexo
cerrado mas pequeño conteniendo K.
Demostración. Sea x ∈ K, entonces hx, x∗ i ∀ x∗ ∈ K 0 y por consiguiente
x ∈ K 00 . Se sigue que K 00 es un cono convexo cerrado conteniendo K. Sea
T un cono convexo cerrado conteniendo K, entonces T ⊃ K ⇒ T 0 ⊂ K 0
⇒ T = T 00 ⊃ K 00 . En consecuencia K 00 es el cono convexo cerrado mas
pequeño conteniendo K. Si K es un cono convexo, K es el cono convexo
cerrado mas pequeño conteniendo K.
35
3.3
Funciones conjugadas
3.3.1
Introducción geométrica
Sea f una función convexa sci propia, epi(f ) es un convexo cerrado de
R n+1 . Considere
K = {(kx, kλ, −k) : k ≥ 0, (x, λ) ∈ epi(f )}
el cono generado por epi(f )×{−1} en R n+2 este es convexo porque epi(f )×
{−1} es convexo. K no es necesariamente cerrado, de hecho, K difiere de
su clausura solo en el subespacio R n × R × {0}. Se tiene:
\
K (R n × R × {−1}) = epi(f ) × {−1}
Consideremos K 0 , este es un cono convexo cerrado. En efecto
K 0 = {(x∗ , λ∗ , µ∗ ) : hx, x∗ i + λλ∗ − µ∗ ∀ x ∈ dom(f ), ∀ λ ≥ f (x)}
Sea x ∈ dom(f ), haciendo variar λ en [f (x), +∞[ se ve que necesariamente
se debe tener λ∗ ≤ 0 si (x∗ , λ∗ , µ∗ ) ∈ K 0 . Sea T = {(x∗ , µ∗ ) : (x∗ , −1, µ∗ ) ∈
K 0 }. T es convexo cerrado. Además µ∗1 ≤ µ∗2 y (x1 , µ∗1 ) ∈ T ⇒ (x1 , µ∗1 ) ∈
T por lo tanto T es el epı́grafo de una función convexa cerrada que se
denotará por f ∗ . Se tiene:
f ∗ (x∗ ) = Inf [µ∗ : hx, x∗ i − λ ≤ µ∗ ∀ x ∈ dom(f ), ∀ λ ≥ f (x)]
es decir
f ∗ (x∗ ) =
sup
[hx, x∗ i − f (x)]
x∈dom(f )
Además se puede mostrar que
K 0 = {(kx∗ , −k, kµ∗ ) : k ≥ 0, (x∗ , µ∗ ) ∈ epi(f ∗ )}
Debido a que K y K 0 se corresponden por dualidad, se sigue que f y f ∗
se corresponden por dualidad. Cuando uno de ellos es conocido, entonces
el otro también es conocido.
36
3.3.2
Definición
Sea f : R n → R, se llama conjugación (en el sentido de Fenchel) a la función
siguiente:
f ∗ (x∗ ) =
sup
[hx, x∗ i − f (x)] = sup[hx, x∗ i − f (x)]
x
x∈dom(f )
(porque f (x) = +∞ si x ∈
/ dom(f )). Observemos que la función x →
hx, x∗ i − f (x) es convexa y sci en consecuencia f ∗ es siempre convexa y sci
como un supremo de funciones convexas y sci.
• si existe x0 tal que f (x0 ) = −∞, entonces f ∗ (x∗ ) ≥ hx, x∗ i − f (x0 ) =
+∞ en consecuencia f ∗ (x∗ ) = +∞ ∀ x∗
• si f (x) = +∞ ∀ x, entonces f ∗ (x∗ ) = −∞ ∀ x∗
• si f (x) ≤ g(x) ∀ x, entonces f ∗ (x∗ ) ≥ g ∗ (x∗ ) ∀ x∗
• f ∗ (x∗ ) + f (x) ≥ hx, x∗ i ∀ x, ∀ x∗ .
Dada f : IRn → IR definamos:
fc (x) = inf[λ : (x, λ) ∈ co(epi(f ))]
fc (x) = inf[λ : (x, λ) ∈ co(epi(f ))]
Las dos funciones son respectivamente la función convexa mas grande mayorada por f , la función convexa sci más grande mayorada por f .
Denotaremos por f a la función sci mas grande mayorada por f , esto es:
f (x) = inf [λ : (x, λ) ∈ epi(f )]
Proposición 3.3.1
f ∗ = (f )∗ = (fc )∗ = (fc )∗
Demostración. f ∗ (x∗ ) = sup[hx, x∗ i − λ : f (x) ≤ λ] pero
hx, x∗ i − λ ≤ µ∗
37
∀(x, λ) ∈ epi(f )
m
hx, x∗ i − λ ≤ µ∗ ∀(x, λ) ∈ epi(f )
m
hx, x∗ i − λ ≤ µ∗ ∀(x, λ) ∈ co(epi(f ))
hx, x∗ i − λ ≤ µ∗ ∀(x, λ) ∈ co(epi(f ))
Proposición 3.3.2
f ∗∗ (x) = sup inf [hx − y, x∗ i + f (y)]
x∗
y
y
f ∗∗ (x) ≤ f (x) ∀ x
Demostración.
f ∗∗ (x) = sup[hx, x∗ i − f ∗ (x∗ )] = sup[hx, x∗ i − sup[hy, x∗ i − f (y)]]
x∗
x∗
y
de donde
f ∗∗ (x) = sup inf [hx − y, x∗ i + f (y)]
x∗
y
En particular
f ∗∗ (x) ≤ sup[hx − x, x∗ i + f (y)] = f (x)
x∗
Teorema 3.3.1 Sea f una función convexa sci propia, entonces f ∗ es convexa sci y propia y f ∗∗ = f
Demostración. Nosotros sabemos que f ∗∗ (x) ≤ f (x) para todo x. Para
probar la recı́proca, sea λ0 < f (x0 ). Entonces (x0 , λ0 ) no pertenece al
epi(f ). Por el teorema de separación fuerte, existe (x∗0 , λ∗0 ) and α0 > 0
such that
hx∗0 , x0 i + λ∗0 , λ0 ≥ hx∗0 , xi + λ∗0 , λ + α0 ∀(x, λ) ∈ epi(f )
38
(3.1)
Fijemos x ∈ dom(f ) y sea λ ∈ [f (x), +∞[, la equación 3.1 implica que
λ∗0 ≤ 0.
Caso 1: λ∗0 < 0 Sin pérdida de generalidad, asumamos que λ∗0 = −1. De
la ecuación 3.1, cuando λ = f (x) y x ∈ dom(f ) se tiene que:
hx∗0 , x0 i − λ0 ≥ hx∗0 , xi − f (x) + α0 ∀x ∈ dom(f )
hx∗0 , x0 i − λ0 ≥ f ∗ (x∗0 ) + α0
finalmente
f ∗∗ (x0 ) ≥ hx∗0 , x0 i − f ∗ (x∗0 ) ≥ α0 + λ0
La desigualdad ocurre para todo λ0 < f (x0 ). Ası́, f ∗∗ (x0 ) ≥ f (x0 ).
Caso 2: λ∗0 = 0 En este caso la equación 3.1 se reduce a:
hx∗0 , x0 i ≥ hx∗0 , xi + α0 ∀x ∈ dom(f )
sin pérdida de generalidad podemos asumir que α0 = 1. Entonces
hx∗0 , x0 i ≥ hx∗0 , xi + 1 ∀x ∈ dom(f )
(3.2)
En este caso x0 ∈
/ dom(f ).
Tomemos x1 ∈ dom(f ) and λ1 < f (x1 ). De forma similar (porque
(x1 , λ1 ) ∈
/ epi(f )), existen (x∗1 , λ1 ) ∈ R n+1 y α1 > 0 tal que
hx∗1 , x1 i − λ1 ≥ hx∗1 , xi − f (x) + α1
(3.3)
combinando las ecuaciones 3.2 y 3.3, tenemos que ∀µ > 0:
hx∗1 , x1 i − λ1 + hµx∗0 , x0 i ≥ hx∗1 + µx∗0 , xi − f (x) + α1 + µ ∀x ∈ dom(f )
luego
hx∗1 + µx∗0 , x0 i + hx∗1 , x1 − x0 i − λ1 ≥ f ∗ (x∗1 + µx∗0 ) + α1 + µ
f ∗∗ (x∗0 ) ≥ hx∗1 + µx∗0 , x0 i − f ∗ (x∗1 + µx∗0 ) ≥ α1 + µ + λ1 + hx∗1 , x0 − x1 i
esta ultima desigualdad ocurre para todo µ > 0. Ası́ f ∗∗ (x∗0 ) = +∞.
39
En ambos casos f (x0 ) = f ∗∗ (x0 ).
Corolario 3.3.1
a) f ∗∗∗ = f ∗
b) Si f convexa propia, entonces f ∗∗ = f
Demostración.
a) f ∗ es siempre convexa sci. Si f ∗ (x∗0 ) = −∞, entonces dom(f ) = y
por lo tanto f ∗ (x∗ ) = −∞ ∀x∗ , luego f ∗∗ (x) = +∞ ∀x y f ∗∗∗ (x∗ ) =
−∞ ∀x∗ . Si dom(f ∗ ) =, entonces f ∗∗ (x) = −∞ ∀x y f ∗∗∗ (x∗ ) = +∞
∀x∗ . En los otros casos f es convexa propia y f = f ∗∗ y f ∗∗∗ = f ∗ .
b) Si f es convexa y propia, entonces f es convexa y propia. De otro
lado, f ∗ = (f )∗ y en consecuencia f ∗∗ = (f )∗∗ = f .
Observación, Si f es convexa sci pero no propia, se puede tener que
f 6= f ∗∗
Ejemplo.
(
−∞ si x ≤ 0
f (x) =
+∞
si x > 0
entonces
f ∗ (x∗ ) = +∞ ∀x∗ y por lo tanto f ∗∗ (x) = −∞ ∀ x
Por último se tiene
f ∗∗ (x) = sup[hx, x∗ i − f ∗ (x∗ ) = sup[hx, x∗ i − sup[hy, x∗ i − f (y)]]
x∗
x∗
y
y por lo tanto
f ∗∗ (x) = sup inf [hx − y, x∗ i + f (y)]
x∗
y
Bajo esta formula se ve inmediatamente que f ∗∗ (x) ≤ f (x) ∀x. Por otro
lado debido a que f ∗ = (fc )∗ , se tiene f ∗∗ = (fc )∗∗ . Debido a que fc es
convexa sci se sigue que si fc (o f ∗∗ ) es propia, entonces f ∗∗ = fc . En este
caso f ∗∗ es la mas grande minorante convexa sci de f
40
3.4
Funciones indicatriz y soporte de un conjunto
(
n
Sea C ⊂ IR , C 6= ∅ definamos δ(x|C) =
0
+∞
si x ∈ C
si x ∈
/C
δ(.|C) es llamado función indicatriz de C Se ve inmediatamente que:
C es convexo ⇐⇒ δ(.|C) es convexa
C es cerrado ⇐⇒ δ(.|C) es sci
S ⊂ C ⇐⇒ δ(.|S) ≥ δ(.|T ) ∀x
Por otro lado δ(.|S), δ(.|co(S)) y δ(.|coS) son respectivamente las mas
grandes funciones sci la mas grande función convexa y la mas grande función
convexa sci
La función conjugación de la función indicatriz de C es llamada función
soporte de C. Se tiene entonces
δ ∗ (x∗ |C) = sup[hx, x∗ i − δ(x|C)] = supx∈C hx, x∗ i
x
∗
Si C 6= ∅, entonces δ (.|C) es convexa sci y propia.
Por otro lado se ve que δ ∗ (kx∗ |C) = kδ ∗ (x∗ |C) ∀k > 0, ∀x∗ se dice entonces
que δ ∗ (.|C) es positivamente homogénea (de grado 1). Recı́procamente se
tiene:
Teorema 3.4.1 Sea f convexa sci propia y positivamente homogénea de
grado 1, entonces existe C convexa cerrada y no vacı́o tal que f (x∗ ) =
δ ∗ (x∗ |C) ∀x∗ además f ∗ (x) = δ(x|C) ∀x
Demostración.
a) f ∗ (x) = supx∗ [hx, x∗ i − f (x∗ )] = supx∗ ,k>0 [hx, kx∗ i − f (kx∗ )], pero
se sabe que f (kx∗ ) = kf (x∗ ) si k > 0, por lo tanto
f ∗ (x) = sup[k[sup[hx, x∗ i − f (x∗ )]]]
k>0
x∗
41
Puesto que f es propia, notamos que siempre supx∗ [hx, x∗ i−f (x∗ )] >
−∞. Si supx∗ [hx, x∗ i − f (x∗ )] ≤ 0, entonces f ∗ (x) = 0, en caso
contrario f ∗ (x) = +∞. En consecuencia f ∗ solo toma los valores
0 o +∞. Sea C = S0 (f ∗ ). C es un conjunto convexo cerrado y
f ∗ (x) = δ(x|C) ∀x
b) Debido a que f es convexa sci y propia, se tiene f = f ∗∗ y en consecuencia f (x∗ ) = δ ∗ (x∗ |C).
Sea C un conjunto no vacı́o, Se llama cono barrera de C al conjunto K
definido por
K = {x∗ : δ ∗ (x∗ |C) < +∞} = dom(δ ∗ (.|C))
Es fácil ver que K es un cono, K es convexa como dominio de una función
convexa, en general K no es cerrado aun cuando C es convexo cerrado. Por
ejemplo considere: C = {(x, y) ∈ IR2 : y + ex ≤ 0} es un convexo cerrado.
Calculándose δ ∗ (.|C) se verifica que K no es cerrado.
Teorema 3.4.2 Sea C convexa cerrada y no vacı́o y K su cono barrera,
entonces K ⊂ (C∞ )0 y K 0 = C∞ .
Demostración. Sea a ∈ C
i) Sea x∗ ∈ K, entonces δ ∗ (x∗ |C) < +∞. En particular si d ∈ C∞ se
tiene ha + λd, x∗ i ≤ δ ∗ (x∗ |C) ∀λ > 0. Por consiguiente hd, x∗ i ≤ 0
∀d ∈ C∞ y por lo tanto x∗ ∈ (C∞ )0 , de esta manera K ⊂ (C∞ )0 . Por
dualidad K 0 ⊃ (C∞ )00 = C∞ debido a que C∞ es un cono convexo
cerrado no vacı́o.
ii) Sea d ∈
/ C∞ entonces existe λ > 0 tal que a + λd ∈
/ C. Se separa
∗
a + λd de C. Existe x =
6 0 tal que
ha + λd, x∗ i > hx, x∗ i ∀x ∈ C.
Haciendo x = a ∈ C, se tiene hd, x∗ i > 0. Por otro lado x∗ ∈ K por
que
sup[hx, x∗ i : x ∈ C] < ha + λd, x∗ i
42
Por lo tanto d ∈
/ K 0.
Corolario 3.4.1 Un convexo es acotado si y solo si su cono barrera = IRn
Demostración. C es acotado ⇐⇒ C es acotado ⇐⇒ (C)∞ = {0} ⇐⇒
K = IRn porque los conos barrera de C y C son los mismos. Por último se
notara que las funciones soportes de un conjunto y de su envoltura convexa
cerrada son los mismos.
3.5
Función ası́ntota y conjugación
Proposición 3.5.1 Sea f convexa sci propia, entonces f∞ es la función
soporte de del dom(f ∗ ) es decir f∞ (d) = δ ∗ (d|dom(f ∗ ))
(a)
Demostración. Sea a ∈ dom(f ), entonces f∞ (d) = supt>0 f (a+td)−f
t
∗
∗ ∗
∗∗
pero f (a + td) = supx∗ ∈dom(f ∗ ) [hx , a + tdi − f (x )] pero f = f y por lo
tanto
1 ∗
f∞ (d) =
sup
[hx , a + tdi − f ∗ (x∗ ) − f (a)]
t>0,x∗ ∈dom(f ∗ ) t
f∞ (d) =
sup
x∗ ∈dom(f ∗ )
1
[hx∗ , di + sup (hx∗ , ai − f ∗ (x∗ ) − f (a))]
t>0 t
pero siempre se tiene hx∗ , ai ≤ f ∗ (x∗ ) + f (a) en consecuencia
f∞ (d) = δ ∗ (d|dom(f ∗ ))
Corolario 3.5.1 Sea f convexa sci propia sobre IRn , entonces
f inf-compacto ⇐⇒ 0 ∈ int(dom(f ∗ ))
f ∗ inf-compacto ⇐⇒ 0 ∈ int(dom(f ))
43
Demostración.
(
f inf-compacto ⇐⇒ f∞ (d) =
0
>0
si d = 0
en caso contrario
⇐⇒ 0 ∈ int(dom(f ∗ ))
La otra equivalencia es por dualidad.
El resultado siguiente es muy usado para algunas aplicaciones
Sea f convexa sci propia, pongamos
(
0
si f ∗ (x∗ ) + λ∗ ≤ 0
∗
∗
ψ(x , λ ) =
+∞ en caso contrario
Entonces ψ es convexa sci y propia ( esta es una función indicatriz)
Calculemos ψ ∗
ψ ∗ (x, λ) = sup [hx, x∗ i + λλ∗ : f ∗ (x∗ ) + λ∗ ≤ 0]
x∗ ,λ∗
Si λ < 0, entonces ψ ∗ (x, λ) = ∞ (tomando x∗ ∈ dom(f ∗ ) y haciendo
λ∗ → −∞)
Si λ = 0, entonces ψ ∗ (x, λ) = sup[hx, x∗ i : x∗ ∈ dom(f ∗ )] = f∞ (x)
Si λ > 0, entonces ψ ∗ (x, λ) = supx∗ [hx, x∗ i − λf ∗ (x∗ )] = λ supx∗ [h λx , x∗ i −
f ∗ (x∗ )] = λf ( λx )
Poniendo ϕ = ψ ∗ , el resultado puede ser establecido como:
Dada f convexa sci propia positivamente homogénea, definiendo la función
ϕ

x

 λf ( λ ) si λ > 0
ϕ(x, u) =
f∞ (x) si λ = 0

 +∞
si λ < 0
entonces su conjugada es ϕ∗ = ψ ∗∗ = ψ en consecuencia
(
0
si f ∗ (x∗ ) + λ∗ ≤ 0
∗ ∗
∗
ϕ (x , λ ) =
+∞ en caso contrario
44
3.6
Subdiferencial de una función convexa
Sea f convexa propia sobre IRn , a ∈ dom(f ), se dice que
x∗ ∈ ∂f (a) ⇐⇒ f (a) + f ∗ (x∗ ) = hx∗ , ai
(3.4)
recordemos que hx∗ , ai ≤ f ∗ (x∗ )+f (a) siempre es satisfecho, en consecuencia
x∗ ∈ ∂f (a) ⇐⇒ f (a) + f ∗ (x∗ ) ≤ hx∗ , ai
(3.5)
y debido a que f ∗ (x∗ ) = supx [hx∗ , xi − f (x)]
x∗ ∈ ∂f (a) ⇐⇒ f (a) + hx∗ , x − ai ≤ f (x) ∀x
(3.6)
Note que
0 ∈ ∂f (a) ⇐⇒ f (a) = inf f (x)
Interpretación geométrica
Sea
H = {(x, λ) : f (a) + hx∗ , x − ai = λ}
H es hiperplano de IRn ,(3.6, 3.4) significa que el epı́grafo de f esta situado
enteramente encima del hiperplano ∂f (a) es llamado el subdiferencial (sub
gradiente) de f en a
Proposición 3.6.1 ∂f (a) es un convexo cerrado
Demostración. ∂f (a) = {x∗ : f ∗ (x∗ ) − ha, x∗ i ≤ −f (a)}. Pero la aplicación x∗ → f ∗ (x∗ ) − ha, x∗ i es convexa sci
Proposición 3.6.2 Sea f convexa propia sobre IRn , sea a ∈ dom(f ). Si
∂f (a) 6= ∅ entonces f es sci en a
Demostración. Sea x∗ ∈ ∂f (a), f (a) + hx∗ , x − ai ≤ f (x) ∀x. Sea
λ < f (a), existe V ∈ ϑ(a) tal que x ∈ V ⇒ λ < f (a) + hx∗ , x − ai ≤ f (x)
porque la aplicación x → f (a) + hx∗ , x − ai es continua , entonces f es sci
en a.
45
Observación, La recı́proca es falsa: Considerar f : IR →] − ∞, +∞] con
(
+∞ si x < 0,
√
f (x) =
− x si x ≥ 0.
f es convexa sci y
∗
∗
∗
f (x ) = sup[xx +
√
(
x] =
x≥0
+∞ si x∗ ≥ 0
− 4x1∗ si x∗ < 0
√
entonces se tiene x∗ ∈ ∂f (x) ⇐⇒ − x − 4x1∗ = x∗ x, x ≥ 0 y x∗ < 0.
Entonces
(
1
{− 2√
}
si x > 0
x
∂f (x) =
∅
en caso contrario
Por lo tanto 0 ∈ dom(f ) y f sci en 0.
Proposición 3.6.3 Sea f convexa sci propia, entonces x∗ ∈ ∂f (x) ⇐⇒
x ∈ ∂f ∗ (x∗ ).
Demostración. En efecto f = f ∗∗ , utilizar la definición de ∂f .
Teorema 3.6.1 Sea f convexa sci y propia, entonces ∂f (a) 6= ∅ ∀a ∈
ri(dom(f )).
Demostración. Definamos C = {a} × {f (a)}. Entonces C = ri(C) y
C ∩ ri(epi(f )) = ∅. Entonces existe (x∗ , α∗ ) 6= (0, 0) tal que
ha, x∗ i + α∗ f (a) > hx, x∗ i + α∗ λ ∀(x, λ) ∈ ri(epi(f ))
(3.7)
Pero (a, λ) ∈ ri(epi(f )) ∀λ > f (a), entonces α∗ < 0. Sin perdida de
generalidad consideremos α∗ = −1. Luego de la ecuación 3.7 tenemos que
ha, x∗ i − f (a) ≥ hx, x∗ i − f (x) ∀x ∈ dom(f )
ası́ ha, x∗ i − f (a) ≥ f ∗ (x∗ ). Esto implica que x∗ ∈ ∂f (a).
46
3.7
Derivadas direccionales de una función
convexa
Sea f : IRn → [−∞, +∞] finita en a. Se llama derivada direccional de f en
a en la dirección de d, y denotado por f 0 (a, d) al limite siguiente si si este
existe
f (x + td) − f (a)
f 0 (a, d) = lim
t→0,t>0
t
Teorema 3.7.1 Sea f convexa propia y sea a ∈ dom(f ), entonces
a)
f 0 (a, d) = inf
t>0
f (x + td) − f (a)
t
(en consecuencia f 0 (a, d) existe con eventualmente f 0 (a, d) = +∞ o
−∞)
b) f 0 (a, .) es una función convexa positivamente homogénea.
Demostración.
(a)
es creciente
a) debido a que f es convexa, la función t → f (x+td)−f
t
f (x+td)−f (a)
0
sobre ]0, +∞[, en consecuencia f (a, d) = inf t→0+
t
b) Se ve trivialmente que f 0 (a, kd) = kf 0 (a, d) ∀k > 0
Por otro lado la función g(d) = f (a+d)−f (a) es convexa, entonces ϕ(d, θ) =
θg( dθ ) = θ[f (a + dθ ) − f (a)] es convexa sobre IRn ×]0, +∞[. Se sigue que
f 0 (a, d) es convexa en d debido a que f 0 (a, d) = inf θ>0 ϕ(d, θ).
Proposición 3.7.1 Sea f convexa, propia, a ∈ dom(f ), entonces
x∗ ∈ ∂f (a) ⇐⇒ f 0 (a, d) ≥ hx∗ , di ∀d ∈ IRn .
Demostración. Sea x∗ ∈ ∂f (a), entonces f (a + td) − f (a) ≥ thx∗ , di ∀d ∈
IRn , ∀t > 0. Dividiendo por t y luego pasando al limite, f 0 (a, d) ≥ hx∗ , di.
Mostraremos que si f 0 (a, d) ≥ hx∗ , di ∀d entonces x∗ ∈ ∂f (a). Es suficiente
probar que hx∗ , x − ai ≤ f (x) − f (a) ∀x. En efecto, tomando d = x − a se
47
tiene hx∗ , x − ai ≤ f 0 (a, d) ≤
el resultado.
f (x+td)−f (a)
t
∀t > 0, haciendo t = 1 se tiene
Proposición 3.7.2 Sea f convexa propia y a ∈ dom(f )
a) Si existe d tal que f 0 (a, d) = −∞ entonces ∂f (a) = ∅.
b) Si f 0 (a, d) > −∞ ∀d, entonces θ(d) = δ ∗ (d|∂f (a)) donde θ es la
función θ(d) = f 0 (a, d) ∀d. Se sigue que ∂f (a) 6= ∅.
Demostración.
a) Si f 0 (a, d) = −∞, debido a que hx∗ , x − ai ≤ f 0 (a, d) ∀x∗ ∈ ∂f (a), se
tiene que ∂f (a) = ∅.
b) θ es convexa positivamente homogénea y θ también es convexa y
positivamente homogénea. Ası́ θ es la función soporte de un conjunto
convexo cerrado D 6= ∅. Sea µx∗ (d) = f 0 (x, d) − hx∗ , di entonces
µx∗ (d) = θ(d) − hx∗ , di se sigue que
x∗ ∈ ∂f (a) ⇐⇒ µx∗ (d) ≥ 0 ∀d ⇐⇒ µx∗ (d) ≥ 0 ∀d
es decir
x∗ ∈ ∂f (a) ⇐⇒ hx∗ , di ≤ δ ∗ (x∗ |D) ∀d
⇐⇒ sup[hx∗ , di − δ ∗ (x∗ |D)] ≤ 0 ⇐⇒ δ ∗ (x∗ |D) ≤ 0 ⇐⇒ x∗ ∈ D
d
en consecuencia ∂f (a) 6= ∅ y θ(d) = δ ∗ (d|∂f (a)).
Observación, f convexa, sci en a y ∂f (a) 6= ∅ 6=⇒ f 0 (a, .) sci
Ejemplo.
f (x, y) =



y
0

 +∞
si y < 0
si x = y = 0
en caso contrario
luego
(
∗
∗
∗
f (x , y ) =
si x∗ = 0 y y ∗ ≥ 1
en caso contrario
0
+∞
48
∂f (0, 0) = {0} × [1, ∞[
θ(1, 0) = f 0 ((0, 0), (1, 0)) = +∞
pero
θ(1, 0) = sup[1x∗ + 0y ∗ : (x∗ , y ∗ ) ∈ ∂f (0, 0)] = 0
Proposición 3.7.3 Sea f convexa propia, a ∈ dom(f ) entonces
∂f (a) 6= ∅ y compacto ⇐⇒ a ∈ int(dom(f ))
En tal caso
f 0 (a, .) = δ ∗ (.|∂f (a))
Demostración.
a) Supongamos que a ∈ int(dom(f )), y sea d ∈ IRn , d 6= 0, entonces
existe t > 0 tal que a + td ∈ dom(f ). Pero
θ(d) = f 0 (a, d) = inf
t>0
f (a + td) − f (a)
≤ f (a + d) − f (a)
t
y en consecuencia f 0 (a, d) = θ(d) < +∞ ∀d ∈ IRn . θ convexa =⇒ 0 =
θ(0) ≤ 12 θ(d) + 12 θ(−d) < +∞. Se sigue que θ(d) > −∞ ∀d. Por lo
tanto θ es una función convexa propia y dom(θ) = IRn , θ es entonces
continua sobre int(dom(f )) = IRn y por consiguiente θ = θ de esta
manera f 0 (a, d) = δ ∗ (d|∂f (a)) < +∞ ∀d. Por consiguiente ∂f (a) es
acotado y por lo tanto compacto.
b) Supongamos que ∂f (a) es compacto. Sea e1 , ..., en los vectores de la
base canónica. Se observa que dom(θ) = IRn , ya que dom(θ) = IRn
en consecuencia θ = θ. Debido a que f 0 (a, ei ) y f 0 (a, −ei ) son finitas
existen ti > 0 y t0i > 0 tal que f (a + ti ei ) y f (a − ti ei ) son < +∞
por consiguiente a + ti ei y a − t0i ei ∈ dom(f ). Observemos que la
envoltura convexa de los 2n puntos a + ti ei , a − t0i ei es una vecindad
de 0 contenido en el dom(f ).
Corolario 3.7.1 Sea f convexa propia, a ∈ ri(dom(f )) entonces ∂f (a) 6=
∅ y f 0 (a, d) = δ ∗ (d|∂f (a))
49
Demostración. Considere IRn = [af f (dom(f ))] × [af f (dom(f ))]⊥ . Definamos f˜ como la restricción de f a af f (dom(f )). Se tiene que
(
fe(x) si y = 0
f (x, y) =
+∞
en caso contrario
entonces
∂f (a1 , a2 ) = ∂ fe(a1 ) × [af f (dom(f ))]⊥
3.8
Derivadas de una función convexa
Sea f : IRn → IR finita en a. Se dice que f es Fréchet-diferenciable en a si
existe x∗ ∈ IRn tal que
f (a + h) − f (a) − hh, x∗ i
→0
khk
cuando h → 0.
Notamos que la definición no depende de la norma in IRn y que el elemento
x∗ (si existe) es único. Entonces ponemos x∗ = ∇f (a) que es llamado la
derivada de Frechet en a. De manera trivial se tiene :
h∇f (a), hi = f 0 (a, h) ∀h si ∇f (a) existe
Teorema 3.8.1 Sea f una función convexa propia y a ∈ dom(f ). Entonces f es Frechet diferenciable en a ⇐⇒ ∂f (a) es un singleton. En este
caso a ∈ int(dom(f )) y ∂f (a) = {∇f (a)}.
Demostración.
a) f Frechet-diferenciable en a ⇒ f 0 (a, h) = h∇f (a), hi∀h. Si x∗ ∈
∂f (a), entonces hx∗ , hi ≤ f 0 (a, h) ≤ h∇f (a), hi∀h, y entonces hx∗ −
∇f (a), hi ≤ 0 ∀h. Haciendo h = x∗ − ∇f (a) se tiene x∗ = ∇f (a).
50
b) Se supone que ∂f (a) = {x∗ } entonces ∂f (a) es un compacto y a ∈
int(dom(f )). Se pone g(x) = f (x) − f (a) − hx − a, x∗ i, entonces g es
convexa y g(a) = 0.
g 0 (a, h) = 0 ∀h
Sea (e1 , e2 , ..., en ) la base canónica de R n , se pone di = ei , dn + i =
−ei ∀i = 1, 2, ..., n. Sea h ∈ R n , se pone ξi = 0, ξn + i = −hi si
hi < 0 y ξi = hi , ξn + i = 0 si hi ≥ 0. Entonces se tiene h =
P2n
Pn
ξi
i=1 ξi di . se considera la norma khk1 = P i=1 |hi | y sea ti = khki
para i = 1, 2, ..., 2n. Entonces ti ≥ 0 ∀i y
ti = 1. Por convexidad
P2n
P2n
de g se tiene g(a + h) = g(a + i=1 ti khk1 di ) ≤ i=1 ti g(a + khk1 di ).
P
2n
g(a+khk1 di )−g(a)
Entonces 0 ≤ g(a+h)−g(a)
≤
. La primera
i=1 ti
khk1
khk1
desigualdad viene del hecho de que g(a + h) ≥ g(a) ∀h. Ya que
g 0 (a, di ) = 0. Y pasando al limite se ve que
lim
h→0
g(a + h) − g(a)
=0
khk1
y entonces ∇g(a) = 0. Por consiguiente x∗ = ∇f (a).
Proposición 3.8.1 Sea f convexa sci propia. Si f es estrictamente convexa, entonces int(dom(f ∗ )) 6= ∅, f ∗ es diferenciable sobre int(dom(f ∗ )) y
∂f ∗ (x∗ ) = ∅ si x∗ ∈
/ int(dom(f ∗ )).
Demostración.
x ∈ ∂f ∗ (x∗ ) ⇒ x es solución optimal de inf x f (x) −
∗
hx, x i. La función f es estrictamente convexa, la solución optimal, si
existe, es única, entonces ∂f ∗ (x∗ ) es un singleton cada vez que ∂f ∗ (x∗ ) 6= ∅.
Pero ∂f ∗ (x∗ ) 6= ∅ si x∗ ∈ ri(dom(f ∗ )), entonces f ∗ es diferenciable sobre
ri(dom(f ∗ )) 6= ∅, f ∗ diferenciable en x∗ ⇒ x∗ ∈ int(dom(f ∗ )). Si x∗
pertenece a la frontera del dom(f ∗ ) entonces ∃d 6= 0 tal que x∗ + td ∈
/
dom(f ∗ ) ∀t > 0, pero entonces f 0∗ (x∗ , d) = +∞, ∂f ∗ (x∗ ) es no acotado o
vacı́o. Pero, si no es vacı́o, es acotado porque es reducido a un punto.
Proposición 3.8.2 Sea f convexa sci propia. Si f ∗ es diferenciable en
todo x∗ tal que ∂f ∗ (x∗ ) 6= ∅, entonces f es estrictamente convexa sobre
ri(dom(f )).
51
Demostración. Supongamos que f no es estrictamente convexa sobre
ri(dom(f )), entonces ∃x, y ∈ ri(dom(f )) y t ∈]0, 1[ tal que x 6= y y
f (tx + (1 − t)y) = tf (x) + (1 − t)f (y)
(3.8)
Porque tx + (1 − t)y ∈ ri(dom(f )), ∃x∗ ∈ ∂f (tx + (1 − t)y) y entonces
f (tx + (1 − t)y) + hx − tx − (1 − t)y, x∗ i ≤ f (x)
(3.9)
f (tx + (1 − t)y) + hy − tx − (1 − t)y, x∗ i ≤ f (y)
(3.10)
Multiplicamos (3.9) por t y (3.10) por (1 − t) y sumando se tiene
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y)
Por la ecuación (3.8), se tiene necesariamente la igualdad en (3.9) y (3.10).
Por otro lado
f (tx + (1 − t)y) + f ∗ (x∗ ) = htx + (1 − t)y, x∗ i
(3.11)
Reemplazando en (3.9) y (3.10) se tiene
f ∗ (x∗ ) + f (x) = hx, x∗ i y f ∗ (x∗ ) + f (y) = hy, x∗ i
y entonces x, y ∈ ∂f ∗ (x∗ ). Lo que es imposible porque ∂f ∗ (x∗ ) o es vacı́o
o es reducido a un punto.
3.9
Subdiferencial de la suma de dos
funciones convexas
Para completar, nosotros solo enunciaremos el siguiente Teorema. La demostración de este Teorema será dada en el siguiente capı́tulo.
Teorema 3.9.1 Sea f y g dos funciones convexas sci propias, s = f + g,
T
a ∈ dom(s) = [dom(f )] [dom(g)] tal que ∂f (a) 6= ∅ y ∂g(a) 6= ∅. Entonces
a) ∂f (a) + ∂g(a) ⊂ ∂s(a)
T
b) Si int(dom(f )) int(dom(g)) 6= ∅, entonces ∂f (a) + ∂g(a) = ∂s(a)
52
Capı́tulo 4
Introducción a la
Dualidad Convexa
4.1
Esquema General
Los problemas de Optimización se presentan, en general, bajo la forma
α = inf [fe(x) : x ∈ C]
donde C ⊂ R n
Considerando f : X → R ∪ {+∞} definida por:
(
fe(x) si x ∈ C
f (x) =
+∞
si x 6∈ C
obtenemos un problema equivalente en el que ya no aparecen las restricciones,
α = inf[f (x) : x ∈ X]
(P )
nosotros llamaremos a (P) problema primal.
Definamos una función ϕ : R n × R p → R verificando la propiedad
ϕ(x, 0) = f (x)
53
∀x ∈ R n
La función ϕ será llamada función de perturbación y denotaremos por u a
la variable de pertubación.
La función h : R p → R definida por:
h(u) = infn ϕ(x, u)
x∈R
es llamada función marginal. Observe que:
α = h(0) = infn ϕ(x, 0) = infn f (x)
x∈R
x∈R
∗∗
Considerando ahora h , la biconjugada de h, se tiene que:
h∗∗ (0) ≤ h(0) = α
donde
h∗∗ (0) = sup[h0, u∗ i − h∗ (u∗ ) : u∗ ∈ R n ]
Luego, haciendo −β = h∗∗ (0), tenemos que:
β = inf n h∗ (u∗ )
(Q)
u∗ ∈R
(Q) es llamado problema dual de (P ) y en general se tiene que −β ≤ α. El
intervalo [−β, α] es llamado salto de dualidad. Obviamente no existe salto
de dualidad si h∗∗ (0) = h(0).
Por otro lado, sabemos que:
h∗ (u∗ ) = sup [hu, u∗ i − h(u)] = sup [hu, u∗ i − infn ϕ(x, u)]
u∈R
∗
∗
n
h (u ) =
u∈R
n
x∈R
∗
[h0, xi + hu, u i − ϕ(x, u)]
sup
(x,u)∈R ×R
n
n
h∗ (u∗ ) = ϕ∗ (0, u∗ )
Denotando por k(x∗ ) = inf u ϕ∗ (x∗ , u∗ ), se tiene que β = k(0).
Ahora observe la simetrı́a entre los dos problemas:
β = inf h∗ (u∗ )
(Q)
ϕ (0, u ) = h∗ (u∗ ) ∀ u∗ ∈ U ∗
k(x∗ ) = inf u∗ ϕ∗ (x∗ , u∗ )
β = k(0)
α = inf f (x)
(P)
ϕ(x, 0) = f (x) ∀ x ∈ X
h(u) = inf x ϕ(x, u)
α = h(0)
∗
54
∗
−β ≤ α
En el caso particular, cuando ϕ = ϕ∗∗ , entonces (Q) es también el dual de
(P ) y f ∗ = k.
Se nota por construcción que h∗ es convexa semicontinua inferiormente (sci)
y por consiguiente (Q) es siempre un problema de optimización convexa.
Si ϕ es convexa sobre R n × R p , entonces h es convexa sobre R p . Si h es
convexa y propia una condición necesaria y suficiente para que no exista
salto de dualidad es que h sea sci en 0 (en general ϕ sci no implica que h
sea sci).
Si h es convexa y sci en 0 y si además α = h(0) < +∞, entonces necesariamente h(0) = h∗∗ (0). En consecuencia no se tiene salto de dualidad.
Ahora, estamos interesados en las soluciones optimales de (P ) y (Q).
u∗ es solución optimal de (Q) ⇔ h∗ (u∗ ) ≤ h∗ (u∗ ) ∀u∗
m
u∗ ∈ ∂h∗∗ (0)
⇐⇒
0 ∈ ∂h∗ (u∗ )
Por consiguiente, el conjunto de soluciones optimales de (Q) es el subdiferencial de h∗∗ en 0. Si h∗∗ (0) = h(0), es decir si α = −β, es también el
subdiferencial de h en 0. Ası́, obtenemos el siguiente resultado:
Proposición 4.1.1 Supongamos que h es convexa y sci.
1. Si 0 ∈ ri(dom h), entonces α = −β y el problema dual admite al
menos una solución optimal.
2. Si 0 ∈ int(domh) entonces el conjunto de soluciones es compacto.
Supongamos ahora que ϕ es convexa, s.c.i y propia, entonces el esquema
es simétrico, f = k ∗ y ϕ∗∗ = ϕ. El conjunto de las soluciones optimales de
(P ) es el subdiferencial de k ∗ en 0. Ası́, existe el análogo de la proposición
4.1.1.
55
Supongamos que u∗ es solución optimal de (Q), que ϕ = ϕ∗∗ y que α = −β.
Examinemos las caracteristicas de las soluciones optimales de (P ).
x es solución optimal de (P ) ⇔ f (x) = α = −β = −h∗ (u∗ )
Por consiguiente
x es solución optimal de (P ) ⇔ f (x) + h∗ (u∗ ) = 0
m
ϕ(x, 0) + ϕ∗ (0, u∗ ) = hx, 0i + h0, u∗ i
m
(x, 0) ∈ ∂ϕ∗ (0, u∗ ) ⇔ (0, u∗ ) ∈ ∂ϕ(x, 0)
Por consiguiente las soluciones optimales de (P ) se deducen de la subdiferencial de ϕ∗ en (0, u∗ ) donde u∗ es solución optimal de (Q). Se tiene el
análogo por las soluciones optimales de (Q).
4.1.1
Noción del Lagrangiano
Definamos
L(x, u∗ ) = − sup[hu, u∗ i − ϕ(x, u)] = inf [ϕ(x, u) − hu, u∗ i]
u
u
Puesto que
h∗ (u∗ ) = ϕ∗ (0, u∗ ) = sup[hu, u∗ i − ϕ(x, u)]
x,u
Se tiene que
h∗ (u∗ ) = sup[−L(x, u∗ )] = − inf L(x, u∗ )
x
x
y como
β = inf
h∗ (u∗ )
∗
u
se tiene
−β = sup inf L(x, u∗ )
u∗
x
56
(4.1)
Por otro lado
sup L(x, u∗ ) = sup inf [ϕ(x, u) + h0 − u, u∗ i]
u∗
u∗
u
Para x fijo definamos
θx (u) = ϕ(x, u)
entonces se tiene
sup L(x, u∗ ) = θx∗∗ (0) ≤ θx (0) = ϕ(x, 0) = f (x)
u∗
por lo tanto
inf sup L(x, u∗ ) ≤ inf f (x) = α
x
x
u∗
Por consiguiente, si ϕ es convexa, s.c.i y propia, entonces θx es convexa,
s.c.i y θx (u) > −∞ ∀u. Se tiene también:
θx∗∗ (0) = θx (0) = ϕ(x, 0) = f (x)
(4.2)
y por consiguiente
inf sup L(x, u∗ ) = inf f (x) = α
x
x
u∗
ası́
−β = sup inf L(x, u∗ ) ≤ inf sup L(x, u∗ ) = α
u∗
x
x
u∗
Se nota que si ϕ es convexa entonces para todo u∗ ,
x → L(x, u∗ ) = inf [ϕ(x, u) − hu, u∗ i]
u
es convexa porque la aplicación (x, u) → ϕ(x, u) − hu, u∗ i es convexa; por
otro lado para x fijo, la aplicación u∗ → L(x, u∗ ) es cóncava, sci como
ı́nfimo de funciones afı́nes.
Recuerde que (x, u∗ ) es llamado punto silla de L si:
L(x, u∗ ) ≤ L(x, u∗ ) ≤ L(x, u∗ ) ∀x, ∀u∗
En tal caso se tiene:
inf sup L(x, u∗ ) ≤ sup L(x, u∗ ) = L(x, u∗ )
x
u∗
u∗
57
L(x, u∗ ) = inf L(x, u∗ ) ≤ sup inf L(x, u∗ )
x
u∗
x
Por otro lado, se tiene siempre que:
inf sup L(x, u∗ ) ≥ sup inf L(x, u∗ )
x
u∗
u∗
x
Por lo que se tiene la igualdad
inf sup L(x, u∗ ) = sup inf L(x, u∗ )
x
u∗
u∗
x
Teorema 4.1.1 Si ϕ = ϕ∗∗ , entonces (x, u∗ ) es punto silla del lagrangiano
si y solo si se tiene que x es solución optimal de (P ), u∗ es solución optimal
de (Q) y α = −β
Demostración. Se sabe por (2) que supu∗ L(x, u∗ ) = f (x) y por (1) que
inf x [L(x, u∗ )] = −h∗ (u∗ ). Por consiguiente (x, u∗ ) es punto silla si y solo
si f (x) + h∗ (u∗ ) = 0 o f (x) ≥ α, h∗ (u∗ ) ≥ β y α + β ≥ 0
Se tiene entonces: (x, u∗ ) es punto silla si y solo si


α+β =0
(no existe salto de dualidad)

f (x) = α
x es solución optimal de (P )

 h∗ (u∗ ) = −β u∗ es solución optimal de (Q)
4.2
Dualidad en Programación Lineal
Sea
α = inf [ha, xi : Bx ≥ b]
x≥0
(P )
con la hipótesis siguiente
∃ x tal queBx ≥ b, x ≥ 0
que es equivalente a α < +∞.
Sea
(
ha, xi si Bx ≥ b, x ≥ 0,
f (x) =
+∞ en caso contrario.
58
(H0 )
(
ϕ(x, u) =
ha, xi si Bx ≥ b + u, x ≥ 0,
+∞ en caso contrario.
De esto se sigue que f y ϕ son funciones convexas, s.c.i, propias y f (x) =
ϕ(x, 0) ∀x
Sea h(u) = inf ϕ(x, u), entonces se tiene que α = h(0) y h convexa.
Por otro lado, se tiene
Sλ (ϕ) = {(x, u) : ha, xi ≤ λ, Bx − u ≥ 0, x ≥ 0}
y por lo tanto, Sλ (ϕ) es un poliedro convexo.
u ∈ Sλ (h) ⇐⇒ ∀µ > 0 ∃ x tal que ϕ(x, u) ≤ µ
Por lo tanto
Sλ (h) =
\
proju Sλ (ϕ)
µ>λ
como la proyección de un poliedro convexo sobre un subespacio es un
poliedro convexo entonces cerrado, se tiene que proju Sλ (ϕ) es cerrado ∀µ,
esto implica que Sλ (h) es cerrado ya que es intersección de cerrados, por
lo tanto h es s.c.i.
Por otro lado se sabe que h(0) = α < +∞. Por lo tanto debido a que h es
convexa y s.c.i se tiene h∗∗ = −β = α = h(0)
Calculemos ahora la conjugada de h
h∗ (u∗ ) = ϕ∗ (0, u∗ ) = sup[hu, u∗ i − ha, xi : Bx − u ≥ 0, x ≥ 0]
x,u
• Si u∗ tiene una componente < 0 digamos la componente i0 , tomando
x = x, ui = −(Bx−b)i ) si i 6= i0 , ui0 → −∞, entonces h∗ (u∗ ) = +∞.
• Si u∗ ≥ 0
h∗ (u∗ ) = supx≥0 [h−b + Bx, u∗ i − ha, xi] = h−b, u∗ i + suphx, B t u∗ − ai
x≥0
(
∗
∗
h (u ) =
h−b, u∗ i si B t u∗ − a ≤ 0,
+∞
en caso contrario.
59
Por lo tanto β = −α = inf[h−b, u∗ i : u∗ ≥ 0, B t u∗ ≤ a]
De esta manera
sup[hb, u∗ i : u∗ ≥ 0, B t u∗ ≤ a] = inf[ha, xi : x ≥ 0, Bx ≥ b].
4.3
Pertubación vertical con solo restricciones
de desigualdad
Sea el problema
α = inf[f (x) : gi (x) ≤ 0, i = 1, ..., p ]
Con las hipótesis siguientes:
• f , gi convexas, s.c.i y propias
(H0 )
• ∃ x tal que f (x) < +∞, gi (x) < 0 ∀i = 1, ..., p
• α > −∞
(H1 )
(H2 )
Observese que (H1 ) + (H2 ) → |α| < +∞
Definamos
(
fe(x) si gi (x) ≤ 0 ∀i
f (x) =
+∞ en caso contrario
(
f (x) si gi (x) + ui ≤ 0 ∀i
ϕ(x, u) =
+∞ en caso contrario
Se sigue que ϕ es convexa y s.c.i en razón de (H0 ) y (H1 ).
ϕ es propia en razón de (H0 ) y (H1 ), por consiguiente ϕ = ϕ∗∗ .
Por otro lado
h(u) = inf ϕ(x, u)
x
Es convexa, debido a que ϕ es convexa, además si se toma ui ≤ −gi (x) ∀i
se tiene h(u) ≤ f (x).
Dado
n
Y
V =
] − ∞, −gi (x)[ ⊂ dom(h)
i=1
60
Se tiene que V es una vecindad de 0, luego 0 ∈ int(dom(h)).
En consecuencia:
• h(0) = h∗∗ (0), no se tiene salto de desigualdad.
• ∂h(0) 6= ∅ y ∂h(0) es compacto, por consiguiente el problema dual
tiene un conjunto de soluciones optimales que se convexo, compacto
y no vacio.
−α = +β = inf
h∗ (u∗ )
∗
u
con
h∗ (u∗ ) = sup[hu, u∗ i − ϕ(x, u)]
x,u
∗
∗
h (u ) = sup[hu, u∗ i − f (x) : gi (x) + ui ≤ 0]
x,u
• Si u∗ tiene una componente menor que cero, digamos la componente
i0 , tomando x = x, ui = −gi (x) si i =
6 i0 , ui0 → −∞, entonces
∗ ∗
h (u ) = +∞.
• Si u∗ ≥ 0
h∗ (u∗ ) =
[−f (x) −
sup
X
u∗i gi (x)]
x∈[dom(f )∩(∩dom(gi ))]
Luego
−β = sup[−h∗ (u∗ )] = α
u∗
α = sup inf [f (x) +
X
u∗ ≥0 x
u∗i gi (x)] = sup inf L(x, u∗ )
u∗ ≥0 x
Esta es la dualidad lagrangiana. Sea u∗ solución optimal del problema dual,
entonces x es solución del problema primal si y solo si
X
X
f (x) +
u∗i gi (x) ≤ f (x) +
u∗i gi (x) ∀ x
(4.3)
y
f (x) +
X
u∗i gi (x) ≤ f (x) +
61
X
u∗i gi (x) ∀ u∗ ≥ 0
(4.4)
(4.4)
⇔ gi (x) ≤ 0 ∀i y u∗i gi (x) = 0 ∀i
En general 4.3 no es suficiente para obtener las soluciones del problema
primal.
Ejemplo.
α = inf[x : −x ≤ 0 ]
Aqui fe(x) = x y g(x) = −x
Cuya solución optimal es x = 0
El problema dual es
−α = inf
h∗ (u∗ )
∗
u
Donde
(
h∗ (u∗ ) = sup[−x + u∗ x] =
x
+∞ si u∗ 6= 1,
0
si u∗ = 1.
Luego la solución única del problema dual es u∗ = 1. El conjunto de
soluciones de (4.3) es R.
4.4
Perturbación Vertical - Caso General
Considerece el problema
α = inf[f (x) : gi (x) ≤ 0, i = 1, ..., p, Ax + a = 0]
Donde
[H1 ] f , gi son convexas, sci y propias sobre R n , A es una matriz q × n
de rango q, a ∈ R q
[H2 ] ∃ x
e ∈ intdom(f ) ∩ [∩pi=1 dom(gi )] tal que Ae
x + a = 0, gi (e
x) < 0
∀i = 1, ..., p
Se sigue de [H2 ] que α < +∞. Considere:
(
f (x) si gi (x) + ui ≤ 0, Ax + a + v = 0
ϕ(x, u, v) =
+∞ en caso contrario
62
h(u, v) = inf ϕ(x, u, v)
x
Entonces, α = h(0, 0). En razón de [H1 ] y [H2 ] ϕ es convexa, sci y propia,
ası́ h es convexa. Mostraremos que h es continua en (0, 0).
En razón de [H2 ] existe X ∈ V (e
x) tal que
f (x) ≤ f (e
x) + 1 < +∞ ∀x ∈ X
1
gi (e
x) < 0 ∀x ∈ X
2
Debido a que A es de rango maximal y Ae
x + a = 0, existe V ∈ V (0) en R p
tal que ∀v ∈ V , existe x ∈ X con Ax + a + v = 0.
∀i = 1, ..., p, gi (x) ≤
x) + ui ≤ 0 ∀ i.
Por otro lado existe U ∈ V (0) en R p tal que ∀u ∈ U , 21 gi (e
Se sigue que si (u, v) ∈ U × V entonces existe x ∈ X con Ax + a + v = 0,
gi (x) + ui ≤ 0 y f (x) ≤ f (e
x) + 1
Luego
h(u, v) = f (e
x) + 1 < +∞ ∀(u, v) ∈ U × V.
Por consiguiente (0, 0) ∈ int(dom(h)), h es continua en (0, 0) y α = −β. Si
α > −∞, el conjunto de soluciones optimales de (Q) es compacto no vacio.
h∗ (u∗ , v ∗ ) = sup [hu, u∗ i + hv, v ∗ i − f (x) : gi (x) + ui ≤ 0, Ax + a + v = 0]
u,v,x
• Si u∗i0 < 0, haciendo x = x
e, ui = 0 ∀i 6= i0 , vj = 0 ∀j y haciendo
variar ui0 en ] − ∞, −gi0 (e
x)], se obtiene que h∗ (u∗ , v ∗ ) = ∞
T Tp
• Si u∗ ≥ 0 poniendo D = dom(f ) ( i=1 dom(gi )), entonces
X
h∗ (u∗ , v ∗ ) = sup [−ha + Ax, v ∗ i −
u∗i gi (x) − f (x) ]
x∈D
y debido a que
β = −α = inf
h∗ (u∗ , v ∗ ) =
∗ ∗
u ,v
inf
u∗ ≥0,v ∗
h∗ (u∗ , v ∗ )
Se tiene
α=
sup
inf [ha + Ax, v ∗ i +
u∗ ≥0,v ∗ x∈D
63
X
u∗i gi (x) + f (x) ]
Es posible debilitar la hipótesis [H2 ] de la manera siguiente:
[H20 ] ∃ x
e ∈ ri(dom(f ))
p
\ \
x + a = 0, gi (e
x) < 0
( (dom(gi ))) : Ae
i=1
Se tiene entonces debido a [H20 ] que 0 ∈ ri(dom(h)). Nosotros probaremos
que [H20 ] implica que 0 ∈ int(dom(h)). Aqui α = −β y existen soluciones
optimales para el problema dual. Es suficiente demostrar que si (u, v) ∈
dom(h), entonces ∃ t > 0 tal que (−tu, −tv) ∈ dom(h).
Supongamos entonces que (u, v) ∈ dom(h), entonces ∃x ∈ dom(f ) tal que
Ax + vi + a = 0 y gi (x) + ui ≤ 0, esto implica que x ∈ dom(gi ).
T Tp
Recordemos que x
e ∈ ri(dom(f )) ( i=1 (dom(gi ))) entonces existe t > 0
tal que
x
e + t(e
x − x) ∈ ri(dom(f ))
p
\ \
( (dom(gi ))) ∀t ∈ [0, t]
i=1
Como los gi son continuas en [0, t] entonces debido a que gi (e
x) < 0, existe
e
e
e
t ∈ [0, t] tal que gi (e
x + t(e
x − x)) − tui ≤ 0 ∀i
Por otro lado A(e
x+e
t(e
x − x)) + a − e
tvi = 0 por lo tanto h(−e
tu, −e
tv) ≤
e
f (e
x + t(e
x − x)) < +∞.
4.5
Ejemplo de perturbaciones no Verticales
Considere el problema
α = infn [f (Ax) + g(Bx)]
x∈R
Donde
H1 ) A es una matriz de orden p × n, B es una matriz de orden q × n,
f : R p → R, g : R q → R; f , g son convexas, s.c.i y propias.
H2 ) ∃ x
e ∈ R n tal que Ae
x ∈ intdom(f ) y Be
x ∈ int(dom(g)).
64
Observe que H2 ) ⇒ α < +∞
Considere:
ϕ(x, u, v) = f (Ax + u) + g(Bx + v)
y
h(u, v) = inf ϕ(x, u, v)
x
Entonces ϕ es convexa, sci y propia, por lo tanto h es convexa y h(0, 0) = α.
Mostraremos que h es continua en (0, 0)
Ae
x ∈ int(dom(f )) ⇒ ∃U ∈ V (0) tal que u ∈ U ⇒ f (Ae
x +u) ≤ f (Ae
x)+1
Be
x ∈ int(dom(g)) ⇒ ∃V ∈ V (0) tal que v ∈ V ⇒ g(Be
x + v) ≤ g(Be
x) + 1
y por lo tanto
h(u, v) ≤ f (Ae
x) + g(Be
x) + 2 ∀ (u, v) ∈ U × V ∈ V (0, 0).
Por lo tanto h es continua en (0, 0) y α = −β. Si α > −∞, entonces
el problema dual admite soluciones optimales, ademas el conjunto de esas
soluciones es convexo y compacto.
h∗ (u∗ , v ∗ ) = sup [hu, u∗ i + hv, v ∗ i − f (Ax + u) − g(Bx + v)]
u,v,x
= sup [hAx+u, u∗ i−f (Ax+u)+hBx+v, v ∗ i−g(Bx+v)−hx, At u∗ +B t v ∗ i]
u,v,x
h∗ (u∗ , v ∗ ) = sup [hy, u∗ i − f (y) + hz, v ∗ i − g(z) − hx, At u∗ + B t v ∗ i]
x,y,z
(
∗
∗
∗
h (u , v ) =
[f ∗ (u∗ ) + g ∗ (v ∗ )] si At u∗ + B t v ∗ = 0
+∞
en caso contrario
y por consiguiente
−α = +β = inf
[f ∗ (u∗ ) + g ∗ (v ∗ ) : At u∗ + B t v ∗ = 0].
∗ ∗
u ,v
Aqui en este caso el Lagrangiano es:
l(x, u∗ , v ∗ ) = hx, At u∗ + B t v ∗ i − f ∗ (u∗ ) − g ∗ (v ∗ )
65
Si (u∗ , v ∗ ) es solución optimal del dual, entonces x es solución optimal del
primal si y solamente si
l(x, u∗ , v ∗ ) ≤ l(x, u∗ , v ∗ ) ≤ l(x, u∗ , v ∗ ) ∀x, u∗ v ∗
es decir, si Ax ∈ ∂f ∗ (u∗ ) y Bx ∈ ∂g ∗ (v ∗ ), porque AT u∗ + B T v ∗ = 0.
Casos Particulares: Si A = I, B = I, se obtiene:
α = infn [f (x) + g(x)] Problema primal
x∈R
β = inf
[f ∗ (x∗ ) + g ∗ (−x∗ )] Problema dual
∗
x
Observación:
Aun se puede reemplazar (H2 ) por
(H20 ) ∃e
x ∈ R n tal que Ae
x ∈ ri(dom(f )) y Be
x ∈ ri(dom(g))
Se tiene entonces que 0 ∈ ri(dom(h)), en consecuencia α + β = 0.
4.6
Inf convolución y el Sub diferencial de la
suma de dos funciones convexas
Sea f y g dos funciones convexas propias. Sea además A = epi(f ), B =
epi(g) y C = epi(f ) + epi(g), entonces C es convexa. Es facil de ver que
(x, λ) ∈ C y µ > λ ⇒ (x, µ) ∈ C
Definamos h(x) = inf[λ : (x, λ) ∈ C], debido a que C es convexo, se tiene
que h es convexa y C ⊂ epi(h) ⊂ C.
Observe que A, B cerrados no implica que C sea cerrado.
Se tiene también
h(x) = Inf [λ1 + λ2 : (x1 , λ1 ) ∈ A, (x2 , λ2 ) ∈ B],
o también
h(x) = Inf [f (x1 ) + g(x2 ) : x = x1 + x2 ]
66
Se escribe h = f ∇g
Facilmente se ve que: f ∇g = g∇f
h(x) = Infy [f (x − y) + g(y)]
h es convexa mas no necesariamente sci cuando f y g son sci.
Proposición 4.6.1 Sean f , g funciones convexas, propias y sci, entonces:
a) (f ∇g)∗ = f ∗ + g ∗
b) (f + g)∗ = f ∗ ∇g ∗
Demostración.
a) Pongamos h = f ∇g
h∗ (x∗ )
=
sup[hx, x∗ i − f (x − y) − g(y)]
=
sup[hx − y, x∗ i + hy, x∗ i − f (x − y) − g(y)]
x,y
x,y
= f ∗ (x∗ ) + g ∗ (x∗ )
b) Se deduce que
(f ∇g)∗∗ = (f ∗ + g ∗ )∗ = (f ∇g)
de donde se tiene b.
Nosotros usaremos este resultado para el calculo del subgradiente de la
suma. Antes consideraremos un resultado trivial.
Proposición 4.6.2 Sean f , g funciones convexas, propias, s = f + g
a ∈ dom(s) tal que ∂f (a) 6= ∅ y ∂g(a) 6= ∅, entonces:
∂s(a) ⊃ ∂f (a) + ∂g(a)
Demostración.
x∗ ∈ ∂f (a) ⇒ f (a) + hx∗ , x − ai ≤ f (x) ∀ x
67
x∗ ∈ ∂g(a) ⇒ g(a) + hy ∗ , x − ai ≤ g(x) ∀ x
por lo tanto
s(a) + hx∗ + y ∗ , x − ai ≤ s(x) ∀ x
y
x∗ + y ∗ ∈ ∂s(a)
Teorema 4.6.1 Sean f , g funciones convexas, sci y propias (Aqui s =
f + g es convexa, sci y propia). Supongamos que ∃ x
e ∈ ri(dom(f )) ∩
ri(dom(g)), entonces:
a) (f + g)∗ = f ∗ ∇g ∗
b) ∀a∗ ∈ f ∗ ∇g ∗ , ∃ x∗ , y ∗ tal que x∗ + y ∗ = a∗ y (f ∗ ∇g ∗ )(a∗ ) =
f ∗ (x∗ ) + g ∗ (y ∗ )
c) si ∂f (a) 6= ∅, ∂g(a) 6= ∅, entonces ∂f (a) + ∂g(a) = ∂s(a)
Demostración. Debido a que s = f + g, se tiene que s es convexa, s.c.i y
propia
−s∗ (a∗ ) = Inf [f (x) + g(x) − ha∗ , xi]
(D)
Debido a que s∗ es convexa, sci y propia, −s∗ (a∗ ) < +∞ ∀ a∗
Definamos:
ϕ(x, u) = f (x + u) + g(x) − ha∗ , xi
entonces ϕ es convexa, s.c.i, propia y ϕ∗∗ = ϕ
ϕ∗ (x∗ , u∗ ) = sup[hx, x∗ i + hu, u∗ i − f (x + u) − g(x) + ha∗ , xi]
= sup[hx + u, u∗ i − f (x + u) + hx, x∗ + a∗ − u∗ i − g(x)]
ϕ∗ (x∗ , u∗ ) = f ∗ (u∗ ) + g ∗ (x∗ + a∗ − u∗ )
68
Definamos h(u) = inf x ϕ(x, u), se va mostrar que 0 ∈ ri(dom(h))
Sea u ∈ dom(h) ⇒ ∃ x tal que x + u ∈ dom(f ), x ∈ dom(g)
Debido a que x
e ∈ ri(dom(f )) ∩ ri(dom(g)) ∃t > 0 tal que
x
e + t(e
x − x − u) ∈ dom(f )
x
e + t(e
x − x) ∈ dom(g)
se tiene entonces
h(−tu) ≤ f (e
x + t(e
x − x − u)) + g(e
x + t(e
x − x)) − ha∗ , x
e + t(e
x − x − u)i < +∞
Por consiguiente u ∈ dom(h) ⇒ ∃ t > 0 tal que −tu ∈ dom(h) y de
esta manera 0 ∈ ri(dom(h)). No hay salto de dualidad y el problema dual
admite soluciones cuando s∗ (a∗ ) es finita.
Por consiguiente +s∗ (a∗ ) = inf ϕ∗ (0, u∗ ).
s∗ (a∗ ) = inf[f ∗ (u∗ ) + g ∗ (a∗ − u∗ )] = (f ∗ ∇g ∗ )(a∗ )
C) a∗ ∈ ∂s(a) ⇒ s∗ (a∗ ) + s(a) = ha, a∗ i. Existen x∗ , y ∗ tal que
s∗ (a∗ ) = f ∗ (x∗ ) + g ∗ (y ∗ ) con x∗ + y ∗ = a∗ .
Por consiguiente
f ∗ (x∗ ) + f (a) + g ∗ (y ∗ ) + g(a) = hx∗ , ai + hy ∗ , ai
o
f ∗ (x∗ ) + f (a) ≥ ha, x∗ i
g ∗ (y ∗ ) + g(a) ≥ ha, y ∗ i
por consiguiente
f ∗ (x∗ ) + f (a) = ha, x∗ i ⇒ x∗ ∈ ∂f (a)
g ∗ (y ∗ ) + g(a) = ha, y ∗ i ⇒ y ∗ ∈ ∂g(a)
y
∂∇(a) ⊃ ∂f (a) + ∂g(a).
69
Contra ejemplo: Sean f, g : R → R definidos por:
(
1
x si x > 0
f (x) =
+∞
en caso contrario
y
(
g(x) =
− x1 si x < 0
+∞
en caso contrario
se tiene que f, g son convexas, sci y propias.
f ∇g(a) = 0 ∀ a
(
0
si x∗ = 0
∗ ∗
∗ ∗
f (x ) + g (x ) =
+∞ en otro caso
Aquı́ ri(dom(f ∗ )) ∩ ri(dom(g ∗ )) = ∅
4.7
Subdiferencial de una función máximo
de funciones
Sean fi , i = 1, ..., p, convexas, s.c.i y propias sobre R n . Considerese
Tp
h(x) = M axi=1,p fi (x) y supongase que dom(h) = i=1 dom(fi ) es no
vacio, entonces h es convexa, s.c.i y propia. Sea a ∈ dom(h). Calculemos
∂h(a). Se sabe que:
x∗ ∈ ∂h(a) ⇐⇒ hx∗ , x − ai + h(a) ≤ h(x)
o también
h(a) − hx∗ , ai ≤ h(x) − hx∗ , xi ∀ x
Por consiguiente x∗ ∈ ∂h(a) si y solo si a es solución optimal del problema
α = inf [h(x) − hx∗ , xi]
x
70
o también si a es solución optimal de
α = inf [t − hx∗ , xi : fi (x) − t ≤ 0]
x,t
(P )
Notemos que la condición de Slater tiene (haciendo t = 1 + h(a)) además
α > −∞ de donde ∂h(a) 6= ∅. Por consiguiente
x∗ ∈ ∂h(a) ⇐⇒ ∃ u∗ ≥ 0, u∗ ∈ R p
tal que (a, t = h(a), u∗ ) es punto silla del lagrangiano
X
l(x, t, u∗ ) = t − hx, x∗ i +
u∗i (fi (x) − t).
Se sigue que
(
∂h(a) =
)
P ∗
∗
X
u
≥
0,
u
=
1,
i
x∗ ∈ ∂(
u∗i fi (a)) :
.
u∗i (fi (a) − h(a)) = 0 ∀ i
Supongase que x
e∈
T
i=1,p
ri(dom(hi )) 6= ∅, entonces se tiene que

P ∗

u∗ ≥ 0,
ui = 1,

X
∂h(a) = x∗ ∈
u∗i x∗i : x∗i ∈ ∂fi (a)


u∗i (fi (a) − h(a)) = 0 ∀ i
71





.
Capı́tulo 5
Monótonia y continuidad
del subdiferencial
5.1
Nociones generales sobre las multiaplicaciones
Sean X e Y dos conjuntos, se dice que Γ es una multiaplicación de X en
Y , si a todo x ∈ X, Γ asocia un conjunto Γ(x) ⊂ Y . Se denotara por
→
Γ : X−
→Y .
La gráfica de Γ es el conjunto:
graph(Γ) = {(x, y) ∈ X × Y : y ∈ Γ(x)} ⊂ X × Y
Recı́procamente dada D ∈ X × Y podemos definir una multiaplicación Σ
a partir de D por Σ(x) = {y : (x, y) ∈ D}.
Se ve fácilmente que Γ(x) = {y : (x, y) ∈ graph(Γ)}.
Una multiaplicación entonces esta definida perfectamente por su gráfica.
De manera natural, definiremos Γ− la multiaplicación inversa de Γ por
Γ− (y) = {x : (x, y) ∈ graph(Γ)}. Entonces (Γ− )− = Γ.
72
Al contrario de las aplicaciones unı́vocas, cada multiaplicación tiene una
inversa. Por ejemplo:
→
Γ : R−
→R definida por Γ(x) = {x2 } ∀x,
(
√
√
{+ y, − y} si y ≤ 0
−
Γ (y) =
∅
si y < 0
Se llama dominio de Γ al conjunto
dom(Γ) = {x : Γ(x) 6= ∅}
Se ve entonces que
dom(Γ) = projX [graph(Γ)]
y
dom(Γ− ) = projY [graph(Γ)]
Sea f una función convexa, sci y propia sobre R n , entonces ∂f es una
multiaplicación de R n en R n . Por otro lado debido a que x∗ ∈ ∂f ⇔ x ∈
∂f ∗ (x∗ ). Se ve que ∂f ∗ es una multiaplicación inversa de ∂f .
5.2
Monotonı́a del subdiferencial
Si f es una función convexa diferenciable sobre un intervalo I de R, entonces
f 0 es creciente sobre I, es decir:
x1 < x2 ⇒ f 0 (x1 ) ≤ f 0 (x2 )
Se puede escribir entonces
(f 0 (x2 ) − f 0 (x1 ))(x2 − x1 ) ≥ 0 ∀x1 , x2 ∈ I
Generalicemos esto a una función convexa sobre R n .
Sea f una función convexa y propia sobre R n , x0 , x1 , ..., xp ∈ dom(∂f ) ⊂
dom(f ) y sea x∗i ∈ ∂(xi ) para i = 0, 1, ..., p se tiene entonces
73
hx∗0 , x1 − x0 i
hx∗1 , x2
− x1 i ≤ f (x2 ) − f (x1 ),
hx∗p−1 , xp − xp−1 i
hx∗p , x0
≤ f (x1 ) − f (x0 ),
− xp i
≤ f (xp ) − f (xp−1 ),
≤ f (x0 ) − f (xp ).
Poniendo xp+1 = x0 , se tiene al sumar:
p
X
hx∗i , xi+1 − xi i ≤ 0 ∀ x∗i ∈ ∂f (xi )
i=0
Se dirá que ∂f es una multiaplicación cı́clicamente monótona.
En particular se tiene
hx∗0 , x1 − x0 i + hx∗1 , x0 − x1 i ≤ 0
esto es:
hx∗1 − x∗0 , x1 − x0 i ≥ 0 ∀ x∗1 ∈ ∂f (x1 ), x∗0 ∈ ∂f (x0 )
que generaliza (f 0 (x2 ) − f 0 (x1 ))(x2 − x1 ) ≥ 0.
De manera que una función creciente sobre R sea la derivada de una función
convexa se tiene:
P
Si Γ es una multiaplicación maximal cı́clicamente monótona ( i.e. si
es
P
P
cı́clicamente monótona y graph( ) ⊃ graph(Γ), entonces Γ = ) entonces
existe f convexa, sci y propia tal que Γ = ∂f . Ver el libro de Rockafellar
(Convex Analysis) para la prueba.
5.3
Continuidad de una multiaplicación
→ , x ∈ X. Γ es llamado sci en x si ∀ Ω abierto de Y con
−
Sea Γ : X →Y
Ω ∩ Γ(x) 6= ∅
∃ V ∈ ϑ(x) tal que Ω ∩ Γ(x) 6= ∅ ∀ x ∈ V
74
Γ es llamado scs en x si ∀ Ω abierto de Y con Ω ⊃ Γ(x)
∃ V ∈ ϑ(x) tal que Ω ⊃ Γ(x) ∀ x ∈ V
Note que si Γ es una únivoca (ie. Γ es una función) y si x ∈ dom(f ) se
tiene
la funcion Γ es continua en x ssi la aplicación Γ es sci y scs en x.
Se dirá que Γ es scs sobre X si Γ es scs en todo x ∈ X y si Γ(x) es un
compacto en todo x. Se tiene entonces
→
Teorema 5.3.1 Sea Γ : X −
→Y scs sobre X. Si K es un compacto de X,
entonces Γ(K) es un compacto de Y con
Γ(K) = {y : ∃ x ∈ K e y ∈ Γ(x)}
Demostración. Sea {Wi }i∈I una familia de abiertos cubriendo Γ(K),
S
se va mostrar que existe J finito, J ⊂ I tal que j∈J Wj ⊃ Γ(K). Sea
S
x ∈ X, Γ(x) es un compacto ⊂ Γ(K) ⊂ j∈J Wj . Donde existe I(x) finito,
S
I(x) ⊂ I tal que Γ(x) ⊂ ( i∈I(x) Wi ) = W (x), donde W (x) es una unión
finita de abiertos, por lo tanto abierto, W (x) ⊃ Γ(x) y como Γ es s.c.s en
x, entonces ∃V (x) ∈ ϑ(x) tal que x0 ∈ V (x) ⇒ Γ(x0 ) ⊂ W (x) ahora como
S
S
x∈K V (x) ⊃ K entonces existen x1 , x2 , ...., xp tal que
i=1,2,..,p V (xi ) ⊃
K sea x ∈ K, ∃i ∈ {i = 1, 2, .., p} tal que x ∈ V (xi ) ⇒ Γ(x) ⊂ W (xi ) y por
S
S
S
lo tanto Γ(K) ⊂ i=1,...,p W (xi ) = i=1,...,p [ j∈I(xi ) Wj ] y en consecuencia Γ(K)es recubierto por un número finito de Wj .
Se dirá que la multiaplicación Γ es cerrado si su gráfica es cerrada.
→
Teorema 5.3.2 Sea Γ : X −
→Y X ⊂ R n , Y ⊂ R p
a) si Γ es scs en todo x y Γ(x) cerrado ∀x, entonces Γ es cerrado.
b) Si Y es compacto y Γ es cerrado, entonces Γ es scs.
Demostración.
75
a) Sea (x, y) ∈
/ graph(Γ) es decir y ∈
/ Γ(x) y debido a que es cerrado se
tiene que
∃ > 0 tal que Γ(x) ∩ B(y, ) = ∅
Por consiguiente Γ(x) ⊂ [B(y, )]c que es abierto. Luego como Γ es
scs en x, ∃V ∈ ϑ(x) tal que x ∈ V ⇒ Γ(x) ⊂ [B(y, )]c lo que implica
que
graph(Γ) ∩ [V × B(y, )] = ∅.
b) Note que {x} × Γ(x) = graph(Γ) ∩ {x} × Y por consiguiente Γ(x) es
cerrado ⊂ Y , Y es compacto, entonces Γ(x) es compacto. Si Γ no
es s.c.s en x, entonces ∃Ω abierto ⊃ Γ(x) tal que no existe V ∈ ϑ(x)
con x ∈ V ⇒ Γ(x) ⊂ Ω. Tomando Vn = B(x, n1 ), se tiene que
existe xn con kxn − xk < n1 y yn ∈ Γ(xn ) ⊂ Y tal que yn ∈
/ Ω.
Note que xn → x luego como Y es compacto se sigue que exists una
subsucesión {ynk } → y ∈ Y . Luego {ynk } ∈ Y ∩ Ωc por consiguiente
y ∈ Y ∩ Ωc ⇒ y ∈
/ Ω ⊃ Γ(x) Luego de (xnk , ynk ) ∈ graph(Γ) que es
cerrado y (xnk , ynk ) → (x, y), se tiene que (x, y) ∈ graph(Γ) y por
tanto y ∈ Γ(x) que es una contradicción con y ∈
/ Ω ⊃ Γ(x).
Teorema 5.3.3 Sea ϕ : X×Y → R sci y sea Γ(x) = {y ∈ Y : ϕ(x, y) ≤ 0},
entonces Γ es cerrado.
Demostración.
grph(Γ) = {(x, y) : ϕ(x, y) ≤ 0} es cerrado porque ϕ es sci
5.4
Continuidad del subgradiente
Teorema 5.4.1 Sea f convexa, sci y propia, entonces ∂f es scs sobre
int(domf ).
Demostración.
a) Se muestra fácilmente que ∂f es cerrada. Se sabe que
∂f (x) = {x∗ : f (x) + f ∗ (x∗ ) − hx, x∗ i ≤ 0}
76
Tomando ϕ(x∗ , x) = f (x) + f ∗ (x∗ ) − hx, x∗ i, ϕ es s.c.i.
b) Sea x ∈ int(dom(f )), entonces existe r > 0 tal que B(x, 2r) ⊂
int(dom(f )) f es continua sobre B(x, 2r) entonces existen m, M tal
que −∞ < m ≤ f (x) ≤ M < +∞ ∀ x tal que kx − xk ≤ 2r. Sea
x ∈ B(x, r) y x∗ ∈ ∂f (x) se tiene
hx∗ , y − xi ≤ f (y) − f (x) ∀ y ∈ B(x, 2r)
Por consiguiente
hx∗ , y − xi ≤ M − m ∀ y ∈ B(x, 2r)
∗
Si x∗ 6= 0, tomando y = x+r kxx∗ k se tiene entonces ky−xk ≤ kx−xk+
r ≤ 2r y por consiguiente y ∈ B(x, 2r) y rkx∗ k ≤ M − m. Se tiene
entonces kx∗ k ≤ M −m
∀ ∈ B(x, r), ∀ x∗ ∈ ∂f (x). Poniendo Y =
r
→
−
{x∗ : kx∗ k ≤ M −m
r } compacto y por consiguiente ∂f : B(x, r)→Y es
s.c.s sobre B(x, r).
Corolario 5.4.1 Sea f convexa y diferenciable sobre Ω abierta y convexa
da R n , entonces ∇f es continua sobre Ω.
Demostración. Aquı́ ∂f (x) = {∇f (x)} por consiguiente ∂f es unı́voca,
además por el teorema anterior ∂f es scs, en consecuencia continua, entonces ∇f es continua sobre Ω.
5.4.1
Aplicación a la sensibilidad
Consideremos el siguiente programa convexo:
α = inf [f (x) : gi (x) ≤ 0, i = 1, ..., p, Ax + a = 0 ]
x
(P )
Con las hipótesis siguientes:
1. f y gi son convexas, s.c.i y propias sobre R n . a ∈ R q , A es una matriz
q × n de rango q
77
2. ∃e
x ∈ R n tal que Ae
x + a = 0 y las funciones f y gi son finitas y
continuas en x
e, gi (e
x) < 0 para i = 1, ..., p
3. α > −∞
Nosotros sabemos del Capı́tulo 4 que
α=
sup inf [f (x) +
X
u∗ >0,v ∗ x
u∗i gi (x) + hAx + a, v ∗ i ],
(Q)
y el problema dual (Q) admite soluciones optimales. Se designa por S
el conjunto de soluciones optimales de (P ) y por T el conjunto de soluciones optimales de (Q). Se tiene entonces que T es compacto no vacı́o.
Consideremos ahora el problema perturbado
h(u, v) = inf [f (x) : gi (x) + ui ≤ 0, i = 1, ..., p, Ax + a + v = 0 ]. (Pu,v )
x
h es convexa y (0, 0) ∈ int(dom(h)). En consecuencia ∀ 0 > 0, ∃U0 ×
V0 ∈ ϑ(0, 0) tal que U0 × V0 ⊂ int(dom(h)) y |h(u, v) − α| < 0 ∀ (u, v) ∈
U0 × V0 . Por otro lado, h es continua en (u, v) ∈ U0 × V0 , por consiguiente
h(u, v) = h∗∗ (u, v) = sup [hu, u∗ i + hv, v ∗ i − h∗ (u∗ , v ∗ ) ]
u∗ ,v ∗
o
(
∗
∗
∗
−h (u , v ) =
inf x [f (x) +
P
u∗i gi (x) + hAx + a, v ∗ i ] si u∗ ≤ 0,
−∞
caso contrario
En consecuencia
h(u, v) =
sup inf [f (x) +
u∗ ≤0,v ∗ x
X
u∗i (gi (x) + ui ) + hAx + a + v, v ∗ i ],
que es el problema dual (Qu,v ). (u∗ , v ∗ ) es solución optimal de (Qu,v ) sii
(u∗ , v ∗ ) ∈ ∂h(u, v). Designemos por T (u, v) el conjunto de las soluciones
optimales de (Qu,v ) y sea 1 > 0 entonces
T + B((0, 0), 1 ) = {(u∗ + u∗ , v ∗ + v ∗ ) : k(u∗ , v ∗ )k < 1 , (u∗ , v ∗ ) ∈ T }
78
es un abierto conteniendo a T , debido a que ∂h es scs en el int(dom(h)) y
T = ∂h(0, 0), ∃ U1 × V1 ∈ ϑ(0, 0) tal que U1 × V1 ⊂ U0 × V0 y
T (u, v) ⊂ T + B((0, 0), 1 ) ∀ (u, v) ∈ U1 × V1 .
En consecuencia la multiaplicación T es scs at (0, 0).
Por último, notemos que
S(u, v) = {x : ϕ(x, u, v) − h(u, v) ≤ 0}
donde
(
ϕ(x, u, v) =
f (x)
+∞
si Ax + a + v = 0 y gi (x) + ui ≤ 0 ∀ i
en caso contrario
Luego ϕ es s.c.i., por otro lado h es continua sobre U1 × V1 , por consiguiente la aplicación (x, u, v) → ϕ(x, u, v) − h(u, v) es s.c.i y por lo tanto
la multiaplicación S es cerrada esto significa que si (un , vn ) → (0, 0) y
xn ∈ S(un , vn ) ∀n y xn → x, entonces x ∈ S(0, 0) = S.
Ahora, asumamos que S es compacto no vacı́o, se va mostrar que la
e ∈ ϑ(0), Ve ∈ ϑ(0)
multiaplicación S es scs en (0, 0). Se tiene que existe U
e
e
tal que (u, v) ∈ U × V ⇒ h(u, v) ≤ α + 1. Por consiguiente existe r > 0
e ⊃ [−r, r]p , Ve ⊃ [−r, r]q . Poniendo
tal que U




f (x) ≤ α + 1;


b
S= x:
gi (x) − r ≤ 0, i = 1, .., p;



−r ≤ (Ax + a)j ≤ r j = 1, ..., q 
e , v ∈ Ve implica Sb ⊃ S(u, v) ∀u ∈ U
e , v ∈ Ve Se va
h(u, v) ≤ α + 1 ∀u ∈ U
b
mostrar que S es compacto.
Sb∞ = {x : f (x) ≤ α+1}∞
p
\\
\
[ {x : gi (x) ≤ r}∞ ] {x : |(Ax+a)j | ≤ r}∞
i=1
Se obtiene entonces de esto
\
\
Sb∞ = {x : f (x) ≤ α}∞ {x : gi (x) ≤ 0}∞ {x : Ax = a}∞ = (S)∞ .
Pero (S)∞ = {0}, Sb es compacto, S es cerrado y Sb ⊃ S(u, v) en una
vecindad de (0, 0). Entonces S es scs en (0, 0).
79
5.4.2
Propiedades genéricas de las funciones convexas
Teorema 5.4.2 Las funciones convexas son localmente Lipschitz en el interior de su dominio.
Demostración. Recordemos la prueba hecha para mostrar que ∂f es
s.c.s. Sea x ∈ int(dom(f )), r > 0 tal que B = B(x, 2r) ⊂ int(dom(f ))
M = sup[f (x), x ∈ B], m = inf x∈B [f (x)]. Nosotros tenemos que
∀x ∈ B(x, r) ∀ x∗ ∈ ∂f (x) se tiene kx∗ k ≤ k =
M −m
r
Sean x, y ∈ B(x, r) y sean x∗ ∈ ∂f (x) y y ∗ ∈ ∂f (y), entonces f (y) − f (x) ≤
hx∗ , y−xi ≤ kky−xk y f (x)−f (y) ≤ hy ∗ , x−yi ≤ kky−xk por consiguiente
|f (y) − f (x)| ≤ kky − xk ∀ x, y ∈ B(x, r)
Por consiguiente f es lipschitz sobre B(x, r).
Un resultado debido a Rademacher dice que las funciones localmente Lipschitz son diferenciables en casi todas partes. Se sigue que las funciones
convexas son diferenciables en casi todas partes. En el caso de las funciones convexas existe una prueba directa, mucho mas simple que el de
Rademacher. Antes, nosotros probaremos algunos resultados.
Proposición 5.4.1 Sean X, Y dos espacios topológicos, ϕ : X × Y → R
→
sci sobre X × Y , Γ : X −
→Y s.c.s sobre X con Γ(x) 6= ∅ ∀x ∈ X. Sea
υ(x) = sup[ϕ(x, y) : y ∈ Γ(x)], entonces υ es scs sobre X
Demostración. Sea x0 ∈ X y λ > υ(x0 ) entonces ∀ y ∈ Γ(x0 ) se tiene
ϕ(x0 , y) < λ en consecuencia existe Vy abierto en ϑ(x), Wy abierto en ϑ(y)
tal que (x0 , y 0 ) ∈ Vy × Wy ⇒ ϕ(x0 , y 0 ) < λ. Siendo Γ(x0 )compacto y
S
W ⊃ Γ(x0 ) se tiene que existe y1 , ..., yp ∈ Γ(x0 ) tal que Γ(x0 ) ⊂
Sy∈Γ(x0 ) y
Tp
W
como inyi poniendoV =
i=1,..,p
i=1 Wyi , se tiene que V es abierto S
p
tersección finita de abiertos, V ∈ ϑ(x0 ). Por otro lado W = i=1 Wyi
es abierto incluyendo a Γ(x0 ). Debido a que Γ es s.c.s entonces existe
T
U ∈ ϑ(x0 ) tal que x ∈ U ⇒ Γ(x) ⊂ W . Sea ahora x ∈ U V , entonces
Γ(x) ⊂ W . Sea y ∈ Γ(x) entonces ∃i ∈ {1, ..., p} tal que y ∈ Wi . Debido
80
T
a que x ∈ U V ⊂ Vi y y ∈ Wi se tiene ϕ(x, y) < λ esto es verdad para
todo y. En consecuencia υ(x) ≤ λ.
Proposición 5.4.2 Sea f una función convexa, s.c.s. y propia, h fijo,
entonces x → f 0 (x, h) es s.c.s sobre int(dom(f ))
Demostración. Se sabe que f 0 (x, h) = supx∗ [hx∗ , hi : x∗ ∈ ∂f (x)].
Utilice la proposición precedente.
Observación, f 0 (x, h) es s.c.s pero no s.c.i. Considere por ejemplo
f : R → R con f (x) = |x|, se tiene
(
1 si x ≥ 0
0
f (x, h) =
−1
si x < 0
Proposición 5.4.3 Sea f una función convexa, sci y propia, x ∈ dom(f )
entonces f es diferenciable en x si y solo si f admite las derivadas parciales
en el punto x.
∂f
Demostración. Asumamos que las derivadas parciales ∂x
= f 0 (x, ei ) =
i
−f 0 (x, −ei ) existen. La función t → f (x + tei ) es derivable, entonces existe
ti > 0 tal que x ± ti ei ∈ dom(f ). El conjunto co(x ± ti ei ) ⊂ dom(f ) es una
vecindad de x, en consecuencia x ∈ int(dom(f )) entonces ∂f (x) 6= ∅. Si
∂f (x) es un singleton, acabó; en caso contrario existen x∗ , y ∗ ∈ ∂f (x) con
x∗ 6= y ∗ (existe i tal que x∗i 6= yi∗ ). Supongamos que x∗i < yi∗ , entonces
f 0 (x, ei ) =
sup hz ∗ , ei i ≥ yi∗
z ∗ ∈∂f (x)
f 0 (x, −ei ) =
sup hz ∗ , −ei i ≥ −x∗i
z ∗ ∈∂f (x)
f 0 (x, ei ) + f 0 (x, −ei ) ≥ yi∗ − x∗i > 0
que es una contradicción.
Teorema 5.4.3 Una función convexa en R n es en casi todas partes diferenciable sobre el interior de su dominio.
81
Demostración. El caso particular para n = 1 es simple. En efecto, si
f es convexa sobre un interval I ⊂ R, entonces podemos dividir I en dos
subintervalos I− , I+ donde f es creciente en I+ y decreciente en I− . Se
sabe que las funciones monótonas de una variable real son en casi todas
partes diferenciables (ver cualquier libro de análisis real).
Supongamos que n > 1. Sea C = int(dom(f ))
∂f
Di =
(x) existen ∀i = 1, · · · , n
∂xi
Tn
D = i=1 . Entonces D = {x ∈ C : ∇f (x) existe }.
D es medible. En efecto
Di = {x ∈ C : f 0 (x, ei ) + f 0 (x, −ei ) = 0}
La aplicación x → f 0 (x, ei ) + f 0 (x, −ei ) es scs, entonces es medible y por
lo tanto Di es también medible. Ası́ D es medible.
Sn
med(Dc ) = 0. En efecto, Dc = i=1 . Es suficiente mostrar que med(Dic ) =
0. Probemos para i = n. Es suficiente probar que es cierto para los
siguientes conjuntos:
Y
P =
[x̄i , x̄i + ] ⊂ C
vamos a mostrar que med(P ∩ Dnc ) = 0. En efecto, sea x = (y, xn ) con
R
Qn−1
y =h (x1 , · · · , xn−1 ), P̃i = i=1 [x̄i , x̄i + ], med(Dnc ∩ P ) = P 1Dnc (x)dx =
R R x̄n +
1Dnc (x)dxn dx1 · · · dxn . Esta ultima igualdad es posible usando
P̃
x̄n
R x̄ +
el Teorema de Fubini. Fijando y, x̄nn 1Dnc (x)dxn es la medida del conjunto D(y) = {xn ∈ R : (y, xn ) ∈ Dn }. Por definición, D(y) es el conjunto
de puntos donde la aplicación convexa t → f (y, x̄n + t) es derivable. Luego,
R x̄ +
el complemento es de medida cero, entonces x̄nn 1Dnc (x)dxn = 0. Finalmente med(P ∩ Dnc ) = 0.
Teorema 5.4.4 Sea f una función convexa sci y propia, x ∈ (dom(f )) y
= = {x : ∇f (x) existe } entonces ∂f (x) = co(S) con S = {e : ∃{xn } ⊂
= tal que xn → x y ∇f (xn ) → e}
82
Demostración.
a) co(S) ⊂ ∂f (x)
Debido a que ∂f (x) es convexo y cerrado es suficiente mostrar que
S ⊂ ∂f (x). Sea e ∈ S. Si e ∈
/ ∂f (x) entonces existe > 0 tal
que e ∈
/ ∂f (x) + B(0, ) abierto conteniendo a ∂f (x). ∂f scs en x
entonces ∃U ∈ ϑ(x) tal que x ∈ U entonces ∂f (x) ⊂ ∂f (x) + B(0, 3 ).
Si xn → x y ∇f (xn ) → e para n suficientemente grande xn ∈ U y en
consecuencia ∇f (xn ) ∈ ∂f (x) + B(0, 3 ) es decir k∇f (xn ) − ek ≤ 3
lo cual es contradictorio.
b) ∂f (x) ⊂ co(S)
Supongamos que x∗ ∈ ∂f (x) y x∗ ∈
/ co(S). Por el teorema de separación fuerte, existe d 6= 0 y α > 0 tal que kdk = 1 y
hl, di + α ≤ hx∗ , di ∀ l ∈ co(S)
En consecuencia
hl, di + α ≤ hx∗ , di ≤ f 0 (x, d) ∀ l ∈ S.
Sea la función convexa de una variable real θ(t) = f (x + td). Sea
n ∈ N, existe tn ∈]0, n1 [ tal que x+tn d ∈ int(dom(f )) y θ es derivable
en tn y θ0 (tn ) ≥ θ0 (0) ≥ hx∗ , di. Ahora, sea la multiaplicación Γ(x) =
{hx∗ , di : d ∈ ∂f (x)}, porque ∂f es scs en int(dom(f )), ası́ Γ es scs.
Se observa que Γ(x + tn d) = {θ0 (tn )}.
Puesto que Γ es scs en x̄ + tn d, entonces existe U ∈ ϑ(x̄ + tn d) tal
α
α
, θ0 (tn ) + 10
.
que x ∈ U , entonces Γ(x) ⊂ θ0 (tn ) − 10
Puesto que f es diferenciable en casi todas partes, entonces existe
{xn } ⊂ U tal que kxn − (x̄ + tn d)k ≤ n1 y ∇f (xn ) existe. Luego,
α
kxn − x̄k ≤ n1 + ktn dk ≤ n2 con xn → x y h∇f (xn ), di ≥ θ0 (tn ) − 10
≥
α
∗
hx , di − 10 .
Como f es localmente Lipschitz, entonces ∇f (x) es acotado en una
vecindad de x̄, en consecuencia existe una subsucesión {xnk } y ˜l tal
α
lo
que ˜l = lim ∇f (xnk ). Luego, ˜l ∈ S, es decir h˜l, di ≥ hx∗ , di − 10
cual es una contradicción.
83
5.5
-subdiferenciales
Sea f una función convexa propia, x ∈ dom(f ) y > 0. Se dice que x∗ es
un -subdiferencial de f en x si y solo si
f (x) + f ∗ (x∗ ) ≤ hx, x∗ i + Denotaremos por ∂ f (x) al conjunto de subdiferenciales de f en x.
Es fácil verificar que ∂ f (x) es un conjunto convexo y cerrado. En efecto,
la aplicación x∗ → f ∗ (x∗ ) − hx, x∗ i es convexa y sci y:
∂ f (x) = {x∗ : f ∗ (x∗ ) − hx, x∗ i ≤ − f (x)}
Otra propiedad de los - subdiferenciales es: Dados 0 < 1 < 2 , entonces ∂1 f (x) ⊂ ∂2 f (x). Esto implica que:
\
∂ f (x) = ∂f (x)
>0
∗
∗
Si reemplazamos f (x ) por su valor, obtendremos una definición equivalente para los -subdiferenciales, es decir:
x∗ ∈ ∂ f (x) si y solo si f (y) ≥ f (x) + hx∗ , y − xi − ∀y
Teorema 5.5.1 Si ∂f (x) es compacto y no vacı́o, entonces ∂ f (x) también
es compacto y no vacı́o ∀ > 0.
Demostración. Sabemos que ∂ f (x) = {x∗ : f ∗ (x∗ ) + f (x) − hx, x∗ i ≤ }.
Consideremos g : X ∗ → R definida por g(x∗ ) := f ∗ (x∗ ) + f (x) − hx, x∗ i.
Luego g es convexa sci y ∂ f (x) = S (g). Por hipótesis [S0 (g)]∞ = {0},
entonces [S (g)]∞ = {0}.
Teorema 5.5.2 Si f es convexa sci y propia, entonces ∂ f (x) 6= ∅ ∀x ∈
dom(f ) y ∀ > 0.
Demostración. Es consecuencia inmediata de la definición de supremo y
el hecho que:
f (x) = sup [hx, x∗ i − f ∗ (x∗ )]
x∗ ∈X ∗
84
Descargar