Análisis no-regular y teoremas de inversión global.

Anuncio
ANÁLISIS NO-REGULAR Y TEOREMAS DE
INVERSIÓN GLOBAL
Óscar Reynaldo Madiedo Castro
Universidad Complutense de Madrid
Facultad de Ciencias Matemáticas
Departamento de Análisis Matemático
Madrid
2010
ANÁLISIS NO-REGULAR Y TEOREMAS DE
INVERSIÓN GLOBAL
MSC 49J55, 46G05
Óscar Reynaldo Madiedo Castro
Trabajo de Máster presentado como
requisito parcial para optar al tı́tulo de
Máster en Investigación Matemática
Director
JESÚS ÁNGEL JARAMILLO
Universidad Complutense de Madrid
Facultad de Ciencias Matemáticas
Departamento de Análisis Matemático
Máster en Investigación Matemática
Madrid
2010
El abajo firmante, matriculado en el Máster en Investigación Matemática de la Facultad de
Ciencias Matemáticas, autoriza a la Universidad Complutense de Madrid (UCM) a difundir
y utilizar con fines académicos, no comerciales y mencionando expresamente a su autor el presente Trabajo Fin de Máster: “Análisis no-regular y Teoremas de Inversión Global”, realizado
durante el curso académico 2009-2010 bajo la dirección del Profesor Jesús Angel Jaramillo
en el Departamento de Análisis Matemático, y a la Biblioteca de la UCM a depositarlo en
el Archivo Institucional EPrints Complutense con el objeto de incrementar la difusión, uso e
impacto del trabajo en internet y garantizar su preservación y acceso a largo plazo.
Fdo. Óscar Reynaldo Madiedo Castro
Este trabajo está dedicado
a mi hija Laura Camila.
Agradecimientos
Agradezco en primer lugar a mis padres Reynaldo Madiedo y Martha Castro, por estar
siempre ahı́ apoyándome en todo proceso de mi vida y por tener fe en mı́.
A mi director de trabajo de fin de master Jesús Ángel Jaramillo Aguado, por todo el acompañamiento que me dio en el transcurso del máster, además fue quien aceptó la no muy
grata tarea de corregir mis innumerables errores, convirtiendo la lectura de este texto más
agradable.
Y en especial a mi hija Laura Camila y a mi compañera Norah Alexandra Torres, quienes
me han dado todo su apoyo y comprensión para poder realizar este sueño de ser Doctor.
TITLE:
NONSMOOTH ANALYSIS AND GLOBAL INVERTIBILITY THEOREMS*
AUTHOR: Óscar Reynaldo Madiedo Castro**
KEY
WORDS:
Generalized
Gradients,
Jacobian
Generalized,
Differentiability,
Subdifferential, Diffeomorphically locally, Global Invertibility, Lipschitz Function, Nonsmooth
Analysis, Homeomorphically.
DESCRIPTION
The classical theorem of Hadamard global invertibility provides conditions for a local
diffeomorphism f : Rn → Rn to be locally invertible, in terms of growth of the inverse of the
differential of the function f . This result has been stated in many different contexts, which have
led to interesting applications (see [9] which presents a brief history of the issue and provides
further contributions). The aim of this work is to study analogous results of global invertibility in
the context of nonsmooth analysis. In particular, we will study the work of Pourciau [20, 21], where
global invertibility conditions are obtained for a locally bi-Lipschitz homeomorphism in terms of the
generalized gradient of Clarke (see [3] for a recent treatment of this concept).
*
**
Initial work for research
FACULTY OF MATHEMATICAL SCIENCES, LICENCIATURA EN MATEMÁTICAS.
DIRECTOR JESÚS ÁNGEL JARAMILLO.
TITULO:
AUTOR:
ANÁLISIS NO-REGULAR Y TEOREMAS DE INVERSIÓN GLOBAL*
Óscar Reynaldo Madiedo Castro**
PALABRAS CLAVES: Gradiente Generalizado, Jacobiano Generalizado, Diferenciabilidad,
Subdiferencial, inversión Local, Inversión global, Función Lipschitz, Análisis no-regular,
Homeomorfismos.
DESCRIPCIÓN
El teorema clásico de inversión global de Hadamard proporciona condiciones para que un
difeomorfismo local f : Rn → Rn sea globalmente invertible, en términos del crecimiento de la
inversa de la diferencial de la función f . Este resultado ha sido objeto de un gran número de
modificaciones y variantes en distintos contextos, que han dado lugar a interesantes aplicaciones
(véase a este respecto [9], donde se presenta un breve resumen histórico del tema y se obtienen
nuevas aportaciones). El presente Trabajo se propone estudiar resultados análogos de inversión
global en el contexto del análisis no-regular. Se estudiarán en particular los artı́culos de Pourciau
[20, 21], donde se obtienen condiciones de inversión global para un homeomorfismo localmente
bi-Lipschitz f : Rn → Rn en términos del gradiente generalizado de Clarke (véase [3] para un
tratamiento reciente sobre este concepto).
*
**
Trabajo de Iniciación a la Investigación
FACULTAD DE CIENCIAS MATEMÁTICAS, DEPARTAMENTO DE ANÁLISIS MATEMÁTICO.
DIRECTOR JESÚS ÁNGEL JARAMILLO.
Contenido
INTRODUCCIÓN
II
1. GRADIENTE GENERALIZADO EN ESPACIOS DE BANACH
1
1.1. DEFINICIONES Y PROPIEDADES BÁSICAS . . . . . . . . . . . . . . . .
1
1.2. CÁLCULOS BÁSICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1.3. RELACIÓN CON LAS DERIVADAS . . . . . . . . . . . . . . . . . . . . . .
12
1.4. FUNCIONES CONVEXAS . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
2. JACOBIANO GENERALIZADO Y TEOREMA DE LA FUNCIÓN
INVERSA
20
2.1. JACOBIANO GENERALIZADO . . . . . . . . . . . . . . . . . . . . . . . .
20
2.2. TEOREMA DE LA FUNCIÓN INVERSA . . . . . . . . . . . . . . . . . . .
26
3. INVERSIÓN GLOBAL DE FUNCIONES NO-REGULARES
33
3.1. RESULTADOS PREVIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
3.2. INVERSIÓN LOCAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
3.3. LEMAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
3.4. INVERSIÓN GLOBAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
CONTENIDO
Bibliografı́a
i
43
INTRODUCCIÓN
Fenómenos No-regulares en Matemáticas y Optimización se producen de forma natural y con
frecuencia; en optimización un problema se resuelve maximizando o minimizando la función,
en tal caso su derivada se anula, pero para el caso No-regular tratamos con funciones que
no necesariamente son diferenciables. Por esto se ve la necesidad de estudiar propiedades de
diferenciabilidad de funciones no diferenciables a partir del Gradiente Generalizado propuesto
por Clarke (ver [4]).
En el Capı́tulo 1 se dan las nociones básicas sobre el Gradiente Generalizado de Clarke y se
muestran sus propiedades básicas.
En el capitulo 2 se define el Jacobiano Generalizado de Clarke y se muestra el teorema de la
función inversa para funciones que no necesariamente son diferenciables (ver [6]).
Por ultimo en el Capı́tulo 3, de acuerdo con el Teorema de Hadamard que establece un criterio
de inversion global para funciones C 1 , Pourciau (ver [23]) lo extiende a funciones localmente
Lipschitz utilizando el Jacobiano Generalizado de Clarke.
ii
Capı́tulo
1
GRADIENTE GENERALIZADO EN
ESPACIOS DE BANACH
La terminologı́a y notación de está sección es tomada de Clarke [4]. En este capı́tulo se reúnen
un conjunto de herramientas básicas que se utilizarán en el transcurso de todo el trabajo.
La teorı́a y el cálculo del gradiente generalizado se desarrollan en detalle, comenzando con el
caso general de funciones con valores reales localmente Lipschitz definidas en un espacio de
Banach y terminando con el caso de espacios de dimensión finita.
1.1.
DEFINICIONES Y PROPIEDADES BÁSICAS
Se va a trabajar en un espacio de Banach X, y cada elemento x ∈ X va hacer referencia a
un punto como vector, denotaremos por kxk, BX y BX la norma, bola de unidad abierta y
bola de unidad cerrada respectivamente.
LA CONDICIÓN DE LIPSCHITZ
Sea Y un subconjunto de X. Diremos que una función f : Y → R satisface la condición de
Lipschitz (en Y ), siempre que, para algún K no-negativo, y para todo par de puntos y, y 0 ∈ Y
satisface:
|f (y) − f (y 0 )| ≤ Kky − y 0 k
1
(1.1)
Gradiente Generalizado en Espacios de Banach
esto también es equivalente a la condición de Lipschitz de constante K.
Diremos que f es Lipschitz (de constante K) cerca de x si, para algún ε > 0,
f satisface la condición de Lipschitz (de constante K) en el conjunto x + εBX (es decir,
dentro de una ε - vecindad de x).
DERIVADA DIRECCIONAL GENERALIZADA
Definición 1.1.
Sean X un espacio de Banach, f : X −→ R una función Lipschitz cerca de un punto x
dado, y v un vector en X. La Derivada Direccional Generalizada de f en x en la dirección
v, denotada por f ◦ (x; v) se define:
f ◦ (x; v) = lı́m sup
y→x
t↓0
f (y + tv) − f (y)
,
t
donde y es un vector en X y t es un escalar positivo. En la definición nos podemos dar
cuenta que no se supone la existencia del lı́mite (solo del lı́mite superior). Esto implica solo
el comportamiento de f arbitrariamente muy proximo a x, y se diferencia de las definiciones
tradicionales de derivada direccional en que el punto base y del cociente de la diferencia
varı́a. De la utilidad de f ◦ se desprenden las siguientes propiedades básicas. Una función g es
Positivamente Homogénea si g(λv) = λg(v) para λ ≥ 0, y Subaditiva si g(v+w) ≥ g(v)+g(w).
Proposición 1.1.
Sea f una función Lipschitz de constante K cerca de x. Entonces:
(a) La función f ◦ (x; ·) : X → R donde a cada v 7→ f ◦ (x; v) es finita, positivamente
homogénea y subaditiva en X, y satisface
|f ◦ (x; v)| ≤ Kkvk
(b) f ◦ (x; v) es semicontinua superiormente en función de (x; v) y, como una función de solo
de v, es Lipschitz de constante K en X.
(c) f ◦ (x; −v) = (−f )◦ (x; v)
Demostración.
En vista de la condición de Lipschitz, el valor absoluto de la diferencia en el cociente de la
2
Gradiente Generalizado en Espacios de Banach
definición de f ◦ (x; v) esta acotado por Kkvk cuando y esta suficientemente cerca de x y t
suficientemente cerca a 0. De esto se deduce que |f ◦ (x; v)| admite la misma cota superior. El
hecho de que f ◦ (x; v) = λf ◦ (x, v) para cualquier λ > 0 es inmediato, ası́ que ahora miraremos
la subaditividad
f ◦ (x; v + w) = lı́m sup
y→x
t↓0
f (y + t(v + w)) − f (y)
t
f (y + tv + tw) − f (y)
t
f (y + tv + tw) − f (y − tw) + f (y + tw) − f (y)
lı́m sup
t
f (y + tw) − f (y)
f (y + tv + tw) − f (y + tw)
+ lı́m sup
lı́m sup
t
t
f (y + tw + tv) − f (y + tw)
f (y + tw) − f (y)
lı́m sup
+ lı́m sup
t
t
◦
◦
f (x; v) + f (x; w)
= lı́m sup
=
≤
≤
≤
(Donde el lı́mite superior de una suma esta acotado superiormente por la suma de los lı́mites
superiores). El primer lı́mite es la expresión f ◦ (x; v) donde el primer término y + tw → x
cuando y → x y t ↓ 0.
Por lo tanto
f ◦ (x; v + w) ≤ f ◦ (x; v) + f ◦ (x; w)
que es lo que se requiere en (a).
Ahora sean {xi } y {vi } sucesiones arbitrarias que convergen a x y v respectivamente. Para
cada i ∈ N, por definición de limite superior, existen yi en X y ti tales que
1
,
i
1
f (yi + ti vi ) − f (yi )
≤
f ◦ (xi ; vi ) −
i
ti
f (yi + ti v) − f (yi ) f (yi + ti vi ) − f (yi + ti v)
=
+
ti
ti
kyi − xi k + ti <
Nótese que este último término esta acotado en valor absoluto por Kkvi − vk (en vista de la
condición de Lipschitz). Tomando lı́mites superiores cuando i → ∞ tenemos que
lı́m sup f ◦ (xi ; vi ) ≤ f ◦ (x; v)
i→∞
Por lo tanto, se establece la semicontinuidad superior. Finalmente, dados cualesquiera v y w
en X, tenemos
f (y + tv) − f (y) ≤ f (y + tw) − f (y) + Kkv − wkt
3
Gradiente Generalizado en Espacios de Banach
4
para y cercano a x, y t > 0. Dividiendo por t y usando lı́mites superiores cuando y → x, t ↓ 0
tenemos,
f ◦ (x; v) ≤ f ◦ (x; w) + Kkv − wk
Dado que v y w son arbitrarios se obtiene (b). Para probar (c), calculamos
f ◦ (x; −v) := lı́m sup
x0 →x
t↓0
= lı́m sup
u→x
t↓0
f (x0 − tv) − f (x0 )
t
(−f )(u + tv) − (−f )(u)
, donde u := x0 − tv
t
= (−f )◦ (x; v)
Definición 1.2.
Dado un subconjunto no-vacı́o Σ de X ∗ , su función soporte
HΣ : X → (−∞, ∞] definida de manera única ası́:
es la función
HΣ (v) := sup{hζ, vi : ζ ∈ Σ},
donde X ∗ es el espacio dual de funcionales lineales y continuos en X. A continuación se
muestra algunas propiedades importantes sobre la función soporte.
Proposición 1.2.
(a) Sea Σ un subconjunto no-vacı́o de X ∗ . Entonces HΣ es positivamente homogénea,
subaditiva y semicontinua superiormente.
(b) Si Σ es convexo y w∗ - cerrado, entonces un punto ζ en X ∗ pertenece a Σ si, y solamente
si, se tiene HΣ (v) ≥ hζ, vi, para todo v ∈ X.
(c) De manera mas general, si Σ y Λ son dos conjuntos no-vacı́os, convexos, y w∗ - cerrados
de X ∗ , entonces, Σ ⊃ Λ si y solamente si, HΣ (v) ≥ HΛ , para todo v ∈ X.
(d) Si p : X → R es positivamente homogénea, subaditiva y acotada en la bola de unidad,
entonces hay un único subconjunto Σ de X ∗ que es no-vacı́o, convexo y
w∗ - compacto tal que p = HΣ .
Gradiente Generalizado en Espacios de Banach
5
Demostración.
El hecho que HΣ sea positivamente homogénea y subaditiva se sigue de su definición, ahora
HΣ es semicontinua superiormente por ser el supremo de funciones continuas, por lo tanto
obtenemos (a). Para obtener (c), resulta inmediato de acuerdo con (b); ahora probaremos
(d).
Dado p, definimos el conjunto
Σ := {ζ ∈ X ∗ : p(v) ≥ hζ, vi, para todo v ∈ X} .
Entonces Σ es convexo como consecuencia de p, y w∗ - cerrado como la intersección de una
familia de subconjuntos w∗ - cerrados. Si K es una cota para p en la BX (0; 1), entonces
tenemos hζ, vi ≤ K, para todo v ∈ BX (0; 1) y para cualquier elemento de ζ de Σ. De
acuerdo con el teorema de separación de Hahn-Banach (ver Rudin (1973, Teorema 3.4)) se
sigue que Σ es acotado y además w∗ - compacto. Ahora para mirar que p = HΣ , es claro que
p ≥ HΣ , por lo tanto pasaremos a probar la igualdad. Sea v ∈ X dado. Entonces por la forma
estándar del teorema de Hahn-Banach (ver Rudin (1973, Teorema 3.2)), existe ζ ∈ X ∗ tal
que hζ, wi ≤ p(w), para todo w ∈ X, y con hζ, vi = p(v). Por lo tanto ζ ∈ X ∗ de modo que
HΣ (v) = p(v). Por último la unicidad de Σ se obtiene de (c).
Ahora retornemos a nuestra función f , y tomando a la función p de la proposición anterior
como f ◦ (x; ·), definimos el Gradiente Generalizado de f en x, denotado por ∂f (x), como el
subconjunto (no-vacı́o) w∗ - compacto de X ∗ , cuya función soporte es f ◦ (x; ·). Ası́ ζ ∈ ∂f (x)
si y solamente si, f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X
GRADIENTE GENERALIZADO
Definición 1.3.
Sea f una función Lipschitz. El Gradiente Generalizado de Clarke de f en x, denotado por
∂f (x), es el subconjunto de X ∗ dado por
∂f (x) := {ζ ∈ X : f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X}
Denotamos por kζk la norma natural en X ∗ definida:
kζk := sup{hζ, vi : v ∈ X, kvk ≤ 1}
Gradiente Generalizado en Espacios de Banach
6
y B∗X denota la bola abierta de unidad en X ∗ . A continuación se resumen algunas propiedades
básicas del Gradiente Generalizado.
Proposición 1.3.
Sea f una función Lipschitz de rango K cerca de x. Entonces:
(a) ∂f (x) es un subconjunto de X ∗ , no-vacı́o, convexo y w∗ - compacto y kζk ≤ K, para
todo ζ ∈ ∂f (x).
(b) Para todo v ∈ X, se tiene
f ◦ (x, v) = máx{hζ, vi : ζ ∈ ∂f (x)}.
(c) ζ ∈ ∂f (x) si y solamente si, f ◦ (x; v) ≥ hζ, vi, para todo v ∈ X.
Demostración.
Ya hemos señalado que ∂f (x) es no-vacı́o y w∗ - compacto. Ahora cada ζ ∈ ∂f (x) satisface
hζ, vi ≤ f ◦ (x; v) ≤ Kkvk, para todo v ∈ X, donde kζk ≤ K con lo cual se obtiene (a). Las
afirmaciones (b) y (c) simplemente reiteran que f ◦ (x; ·) es la función soporte de ∂f (x).
Ejemplo 1.1.
Calcular el Gradiente Generalizado de Clarke para el caso de X = R y f (x) = |x|.
Como f es Lipschitz procedemos a calcular ∂f (x), para esto analizaremos tres casos. Para el
caso x > 0, calculamos
y + tv − y
= v,
f ◦ (x; v) = y→x
lı́m
t
t↓0
de modo que ∂f (x), es el conjunto de números ζ que satisfacen v ≥ ζv para todo v, de
esta manera ∂f (x) se reduce a {1}. El siguiente caso, si x < 0, similarmente a lo anterior se
deduce que ∂f (x) = {−1}. Y por último si x = 0 encontramos
(
v si v ≤ 0
f ◦ (0; v) =
−v si v < 0;
luego, f ◦ (0; v) = |v|. Ası́ ∂f (0) consiste en aquellos ζ que satisfacen |v| ≥ ζv para todo v,
por lo tanto, ∂f (0) = [−1, 1].
Gradiente Generalizado en Espacios de Banach
7
Definición 1.4.
Una función multivaluada f se dice que es semicontinua superiormente en x si para todo
ε > 0 existe δ > 0 tal que
kx − yk < δ =⇒ f (y) ⊂ f (x) + εBX
Proposición 1.4.
Sean {xi } y {ζi } sucesiones en X y X ∗ respectivamente, tales que ζi ∈ ∂f (xi ) para cada i ∈ N,
y si xi → x y ζ es un w∗ - punto de acumulación de la sucesión {ζi }, entonces ζ ∈ ∂f (x)
Demostración.
Fijamos v ∈ X, para cada i, tenemos f ◦ (xi ; v) ≥ hζi , vi, ahora la sucesión {hζi , vi} esta acotada en R y contiene términos arbitrariamente cerca de hζ, vi. Si extraemos una
subsucesión {ζi } tal que hζi , vi → hζ, vi, ahora tomando lı́mites en la desigualdad anterior tenemos que f ◦ (x; v) ≥ hζ, vi, por lo tanto f ◦ es semicontinua superiormente en x
(Proposición 1.1)
Proposición 1.5.
Si X es finito dimensional, entonces ∂f es semicontinua superiormente en x.
Demostración.
Dado un ε > 0, lo que queremos mostrar es que para todo y lo suficientemente cercano a x,
tenemos
∂f (y) ⊂ ∂f (x) + εB X
si este no es el caso, entonces existe una sucesión yi que converge a x y puntos ζi ∈ ∂f (yi )
tales que ζi 6∈ ∂f (x)+εB X . Por lo tanto podemos separar ζi del conjunto convexo y compacto
en cuestión; para algunos vi 6= 0 tenemos:
hζi , vi i ≥ máx{hζ, vi i : ζ ∈ ∂f (x) + εB X }
= f ◦ (x; vi ) + εkvi k
Debido a que es homogéneamente positiva, podemos tomar kvi k = 1, además se puede ver
que la sucesión {ζi } está acotada. Como estamos en dimensión finita, podemos extraer un
par de subsucesiones convergentes de {ζ} y {vi } tales que ζi → ζ y vi → v donde kvk = 1.
Por lo tanto, tomando lı́mites en la desigualdad anterior tenemos:
hζ, vi ≥ f ◦ (x; v) + ε
Gradiente Generalizado en Espacios de Banach
8
Por la Proposición 1.4 tenemos que ζ ∈ ∂f (x). Luego esto contradice la parte (b). Por lo
tanto se completa la prueba.
1.2.
CÁLCULOS BÁSICOS
En esta sección obtenemos una variedad de fórmulas que facilitan el cálculo de ∂f . Siempre
vamos asumir que las funciones dadas son Lipschitz cerca del punto de interés, como veremos.
Proposición 1.6.
Para cualquier escalar λ, tenemos ∂(λf )(x) = λ∂f (x)
Demostración.
Note que λf es Lipschitz cerca de x, de constante |λ|K. Cuando λ es no-negativo, (λf )◦ = λf ◦
y el resultado se sigue inmediatamente. Para completar la prueba es suficiente
considerar ahora el caso λ = −1. Un elemento ζ de X ∗ pertenece a ∂(−f )(x) si y
solamente si, (−f )◦ (x; v) ≥ hζ, vi, para todo v. Por las propiedades de la Derivada
Direccional Generalizada tenemos f ◦ (x; v) ≥ hζ, vi para todo v, esto es equivalente a
−ζ ∈ ∂f (x), por la Proposición 1.2 (c)
Ahora procedemos a examinar el gradiente generalizado de la suma de dos funciones f y g,
donde cada una de ellas es Lipschitz cerca de x, y por tanto f + g es Lipschitz cerca de x. Nos
gustarı́a relacionar ∂(f + g)(x) con ∂f (x) + ∂g(x). Para hacer esto introducimos una técnica
que se utiliza muchas veces: para probar la inclusión entre dos conjuntos convexos cerrados,
se hace probando la desigualdad equivalente entre sus funciones soportes.
La función soporte de ∂(f + g)(x) evaluada en v, por definición es (f + g)◦ (x; v), mientras
que la de ∂f (x) + ∂g(x) es f ◦ (x; v) + g ◦ (x; v) (la función soporte de la suma de conjuntos
es la suma de las funciones soportes). Dado que la suma de dos conjuntos w∗ - compactos es
w∗ - compacto, de esto deducimos la siguiente desigualdad general:
(f + g)◦ (x; v) ≤ f ◦ (x; v) + g ◦ (x; v)
y es equivalente a la inclusión
∂(f + g)(x) ⊂ ∂f (x) + ∂g(x),
Gradiente Generalizado en Espacios de Banach
9
como se puede observar en la Proposición 1.2 (c)
La extensión de esta inclusión (la regla de la suma) para combinaciones lineales finitas es
inmediata.
Proposición 1.7.
Sean fi (i = 1, . . . n) Lipschitz cerca de x y λi (i = 1 . . . n) escalares. Entonces f :=
n
P
λi f i
i=1
es Lipschitz cerca de x y se tiene que
∂
n
X
i=1
!
λi f i
(x) ⊂
n
X
λi ∂fi (x)
i=1
Teorema 1.1 (Teorema del Valor Medio de Lebourg).
Sean x, y ∈ X, y supongamos que f es Lipschitz en un conjunto abierto que contenga el
segmento [x, y]. Entonces existe un punto u en el segmento abierto (x, y) tal que
f (y) − f (x) ∈ h∂f (u), y − xi
Demostración.
Para probar este teorema primero mostraremos un caso especial de la regla de la cadena.
Denotemos por xt el punto x + t(y − x)
Lema 1.2.1.
La función g : [0, 1] → R definida por g(t) = f (xt ) es Lipschitz en (0, 1), y tenemos
∂g(t) ⊂ h∂f (xt ), y − xi
Demostración.
El hecho de que g es Lipschiz es fácil. Los dos conjuntos convexos cerrados que aparecen en
la ecuación son de hecho intervalos en R. Luego es suficiente con probar para v = ±1, por lo
que tenemos
máx{∂g(t)v} ≤ máx{h∂f (xt ), y − xiv}
Gradiente Generalizado en Espacios de Banach
10
Ahora el lado izquierdo es justamente g ◦ (t; v); esto es
lı́m sup
s→t
λ↓0
g(s + λv) − g(s)
λ
= lı́m sup
s→t
λ↓0
≤ lı́m sup
y 0 →xt
λ↓0
f (x + [s + λv](y − x)) − f (x + s(y − x))
λ
f (y 0 + λv(y − x)) − f (y 0 )
λ
= f ◦ (xt ; v(y − x))
= máxh∂f (xt ), v(y − x)i
Con lo cual queda demostrado el lema.
Ahora mostraremos el teorema. Consideremos la función θ en [0, 1] definida por
θ(t) = f (xt ) + t[f (x) − f (y)].
Se puede ver que θ(0) = θ(1) = f (x), luego existe un punto t en (0,1) en donde θ alcanza
un máximo o mı́nimo local (por la continuidad). Entonces 0 ∈ ∂θ(t). Ahora aplicando las
Proposiciones 1.6, 1.7 y el lema 1.2.1 calculamos ∂θ(t). Luego deducimos
0 ∈ f (x) − f (y) + h∂f (xt ), y − xi,
donde esto es precisamente lo que se afirma el teorema (tomando u = xt ).
Teorema 1.2 (La regla de la Cadena).
Sean F : X → Rn una función Lipschitz cerca de x, y g : Rn → R otra función Lipschitz cerca
de F (x). Entonces la función f (x0 ) := g(F (x0 )) es Lipschitz cerca de x, y además tenemos
∂f (x) ⊂ co∗ {∂hγ, F (·)i(x) : γ ∈ ∂g(F (x))},
donde co∗ significa la envoltura convexa y w∗ - cerrada.
Demostración.
El hecho de que f sea Lipschitz es fácil de ver. Nuevamente se trata de mostrar la inclusión
Derivadas
11
entre dos conjuntos convexos w∗ - compactos; la correspondiente desigualdad de la función
soporte equivale a decir: para un determinado v, existen γ ∈ ∂g(F (x)), y ζ en el gradiente generalizado en x de la función x0 7→ hγ, F (x0 )i, tales que f ◦ (x; v) ≤ hζ, vi. Vamos a
demostrar el teorema generando un par de funcionales γ y ζ.
Para empezar, tomamos sucesiones yi → x y ti ↓ 0 y desarrollando el lı́mite superior de la
definición de f ◦ (x; v) tenemos que:
f (yi + ti v) − f (yi )
= f ◦ (x; v).
i→∞
ti
Aplicando el Teorema del Valor Medio 1.1, para cada i ∈ N, existe un elemento γi ∈ ∂g(zi )
tal que:
lı́m
f (yi + ti v) − f (yi )
g(F (yi + ti v)) − g(F (yi ))
=
ti
ti
F (yi + ti v) − F (yi )
= ζ,
,
ti
donde zi se encuentra en el segmento de lı́nea que une a F (yi ) y F (yi + ti v). De esto se deduce
que zi → F (x) y que para una adecuada subsucesión tenemos que γi → γ ∈ ∂g(F (x)) luego
este es el γ requerido. Ahora buscaremos el ζ adecuado.
Nuevamente aplicando el Teorema del Valor Medio 1.1, existe ζi ∈ ∂hγ, F (·)i(wi ) tal que
F (yi + ti v) − F (yi )
γ,
= hζi , vi
ti
donde wi esta en el segmento de linea que une a yi y yi + ti v. De esto se deduce que wi → x y
que la sucesión {ζi } esta acotada en X ∗ , y que {hζi , vi} esta acotada en R. Si tomamos una
subsucesión hζi , vi y sea ζ un w∗ - punto de acumulación de {ζi } entonces hζi , vi → hζ, vi por
lo tanto ζ ∈ ∂hγ, F (·)i (Proposición 1.4). Combinando con lo anterior, llegamos a
f (yi + ti v) − f (yi )
F (yi + ti v) − F (yi )
= (γi − γ) + γ,
ti
ti
F (yi + ti v) − F (yi )
= (γi − γ),
+ hζi , vi.
ti
Ahora el término [F (yi + ti v) − F (yi )]/ti esta acotado ya que F es Lipschitz y sabemos que
γi → γ y ahora tomando el lı́mite tenemos
f (yi + ti v) − f (yi )
= hζ, vi,
i→∞
ti
lo que confirma que ζ cumple con las propiedades requeridas.
f ◦ (x; v) = lı́m
Derivadas
1.3.
12
RELACIÓN CON LAS DERIVADAS
La Derivada Direccional de f en x en la dirección de v ∈ X esta definida como
f 0 (x; v) = lı́m
t↓0
f (x + tv) − f (x)
t
(1.2)
cuando este lı́mite existe. Diremos que f es Gâteaux diferenciable en x siempre que el lı́mite
en (1.2) exista para todo v en X, si este lı́mite existe para todo v ∈ X hay un elemento
fG0 (x) ∈ X (llamado Derivada Gâteaux ) que satisface
f 0 (x; v) = hfG0 (x), vi para todov ∈ X.
(1.3)
Una función puede poseer derivada direccional en todas las direcciones y sin embargo no
posea una derivada Gâteaux, como se puede ver en f (x) = kxk en x = 0. En este caso,
tenemos que f 0 (0, v) = kvk.
Supongamos que (1.3) se tiene para un punto en x, y además, que la convergencia en (1.2)
es uniforme con respecto a v en un subconjunto acotado de X. Decimos que f es Fréchet
diferenciable en x, y en este caso se escribe f 0 (x) (la derivada de Fréchet) en lugar de fG0 (x).
Equivalentemente esto significa que para todo r > 0 y ε > 0, existe δ > 0 de modo que
f (x + tv) − f (x)
0
<ε
−
hf
(x),
vi
t
esto se tiene para todo |t| < δ y kvk ≤ r.
Las dos nociones de diferenciabilidad no son equivalentes, incluso en dimensión finita. Es fácil
ver que Fréchet diferenciable en x implica continuidad en x, que no es el caso de Gâteaux
diferenciable.
Diremos que f es continuamente (Gâteaux) diferenciable en x, siempre que en un entorno
de x la derivada Gâteaux fG0 exista y sea continua como función de X en L(X, Y ) (con la
topologı́a norma de operadores).
A continuación mostraremos la relación entre las diversas derivadas definidas en esta sección
y el Gradiente Generalizado.
Proposición 1.8.
Sea f Lipschitz cerca de x y admite una derivada Gâteaux (o Fréchet) fG0 (x). Entonces
fG0 (x) ∈ ∂f (x)
Si f es C 1 en x, entonces ∂f (x) = {f 0 (x)}
Derivadas
13
Demostración.
Por definición f 0 (x; v), existe para cada v, y equivale a hfG0 (x), vi, además por la definición de
f 0 tenemos que f 0 ≤ f ◦ luego f ◦ (x; v) ≥ hfG0 (x), vi para todo v ∈ X. Por lo tanto (Proposición
1.3 (c)) fG0 (x) ∈ ∂f (x).
Ahora supongamos que f es C 1 en una vecindad de x, y fijemos un v ∈ X. Para y cerca de
x y t > 0 cerca de x, tenemos
f (y + tv) − f (y)
= hf 0 (z), vi
t
para algunos z ∈ (y, y + tv), por el clásico Teorema del valor medio. Como y → x y t ↓ 0,
el punto z converge a x, y porque es f 0 (·) es continua (como una función entre espacios
de Banach X y X ∗ ), tenemos f ◦ (x; v) ≤ hf 0 (x), vi. Se sigue de la Proposición 1.3 (c) que
hζ, vi ≤ hf 0 (x), vi siempre que ζ ∈ ∂f (x). Ahora como v es arbitrario, concluimos que ∂f (x)
es {f 0 (x)}
Ejemplo 1.2.
Sea φ : [0, 1] → R que pertenece a L∞ [0, 1] y definimos la función (Lipschitz) f : [0, 1] → R
por
Z x
f (x) =
φ(t) dt.
0
−
Probar que ∂f (x) es el intervalo [φ (x), φ (x)], donde φ− (x) y φ+ (x) son el ı́nfimo esencial
y el supremo esencial, respectivamente, de φ en x. Definimos el supremo esencial por:
+
φ+ := ı́nf{M : ∃ε > 0 3 φ(x0 ) ≤ M a.e. para x0 ∈ [x − ε, x + ε]}
y el ı́nfimo esencial por:
φ− := sup{M : ∃ε > 0 3 φ(x0 ) ≥ M a.e. para x0 ∈ [x − ε, x + ε]}
Sabemos que f es diferenciable en casi todo x, con f 0 (x) = φ(x); para dicho x, se tiene
que φ(x) ∈ ∂f (x) por la Proposición 1.8. De esto y de la semicontinuidad superior (ver
Proposición 1.4) se sigue que todo punto de acumulación esencial (es decir, aquellos que
persisten al quitar conjuntos de medida cero) pertenece a ∂f (x). De lo anterior y del hecho
que ∂f (x) es convexo implica que ∂f (x) contiene el intervalo [φ− (x), φ+ (x)]. Ahora de la
igualdad
Z
y+t
f (y + t) − f (y) =
φ(s) ds
y
Funciones Convexas
14
se puede ver que f ◦ (x; 1) esta acotado por arriba por φ+ (x). Además, cualquier ζ en ∂f (x)
satisface f ◦ (x; v) ≥ 1ζ, por la Proposición 1.3(c), se obtiene ζ ≤ φ+ (x). De forma similar se
obtiene ζ ≥ φ− (x). Luego
∂f (x) = [φ− (x), φ+ (x)]
1.4.
FUNCIONES CONVEXAS
Una función real f definida en un subconjunto convexo U de X se denomina convexa siempre
que para cada par de puntos x, y ∈ U se tiene
f (tx + (1 − t)y) ≤ tf (x) + (1 − t)f (y) para todo t ∈ [0, 1]
Proposición 1.9.
Sea f una función convexa en U y Lipschitz cerca de x ∈ U . Entonces existe la derivada
direccional f 0 (x; v) = f ◦ (x; v). Un vector ζ pertenece a ∂f (x) si, y solamente si,
f (y) − f (x) ≥ hζ, y − xi para todo y ∈ U
Demostración.
Se sigue directamente de la definición de función convexa que para t > 0 pequeño, la función
t 7→
f (x0 + tv) − f (x0 )
t
es no-decreciente. Este hecho, junto con la hipótesis de Lipschitz, implica la existencia y la
finitud de de la derivada direccional para todo x0 cerca x, para todo v:
f (x0 + tv) − f (x0 )
t>0
t
f 0 (x; v) = ı́nf
Ahora si fijamos un δ > 0 se puede escribir f ◦ (x; v) de la siguiente forma
f ◦ (x; v) = lı́m
sup
ε↓0 kx0 −xk≤εδ
f (x0 + tv) − f (x0 )
t
0<t<ε
sup
De lo anterior se puede ver una expresión alternativa para f ◦ (x; v)
lı́m
ε↓0
f (x0 + εv) − f (x0 )
ε
kx0 −xk≤εδ
sup
Funciones Convexas
15
Si K es una constante Lipschitz de f cerca de x, entonces para todo x0 en x + εδBX y para
todo ε suficientemente pequeño, tenemos
f (x0 + εv) − f (x0 ) f (x + εv) − f (x) ≤ 2δK,
−
ε
ε
ası́ que
◦
f (x; v) ≤ lı́m
ε↓0
f (x + εv) − f (x)
+ 2δK
ε
= f 0 (x; v) + 2δK.
Como δ es arbitrario deducimos que f ◦ (x; v) ≤ f 0 (x; v), y por lo tanto la igualdad, ya que
naturalmente f ◦ ≥ f 0 . Finalmente observamos
ζ ∈ ∂f (x) ⇐⇒ f ◦ (x; v) ≥ hζ, vi para todo v,
⇐⇒ f 0 (x; v) ≥ hζ, vi para todo v,
f (x + tv) − f (x)
≥ hζ, vi para todo v,
t>0
t
⇐⇒ f (y) − f (x) ≥ hζ, y − xi para todo y ∈ U.
⇐⇒ ı́nf
La proposición anterior es equivalente a mostrar:
Proposición 1.10.
Si f es convexa en U y Lipschitz cerca de x, entonces ∂f (x) coincide con la subdiferencial
en x en el sentido del análisis convexo, y f ◦ (x; v) coincide con la derivada direccional f 0 (x; v)
para cada v.
Ejemplo 1.3.
Vamos a determinar el gradiente generalizado de la función f : Rn → R definido por
f (x1 , x2 , . . . xn ) = máx{xi : i = 1, 2, . . . , n}.
Podemos ver que f es convexa, por ser un máximo de funciones lineales; detonemos por I(x)
el conjunto de los indices i los cuales xi = f (x) es decir, los indices para el cual este máximo
Funciones Convexas
16
se alcanza. Ahora procedemos a calcular f 0 (x; v).
{xi + tvi } − f (x)
i
t↓0
t
{xi + tvi } − f (x)
= lı́m máx
t↓0 i ∈ I(x)
t
{xi + tvi − xi }
= lı́m máx
t↓0 i ∈ I(x)
t
f 0 (x; v) := lı́m máx
= máx vi .
i ∈ I(x)
Ya que f ◦ y f 0 coinciden (Proposición 1.10), ∂f (x) consiste en los vectores ζ en Rn que
satisfacen
máx vi ≥ ζ · v, para todo v en Rn
i ∈ I(x)
Por lo tanto ∂f (x) consiste en todos los vectores (ζ1 , ζ2 , . . . , ζn ) tales que ζi ≥ 0,
P
ζi = 1, ζi = 0 si i ∈
/ I(x)
CÁLCULO DEL GRADIENTE EN DIMENSIÓN FINITA
Recordemos el celebre Teorema de Rademacher.
Teorema 1.3 (Teorema de Rademacher ).
Sea U un subconjunto cerrado y no-vacı́o de Rn y supongamos que f : U → Rm es localmente
Lipschitz. Entonces f es (Fréchet) diferenciable en casi todo punto de U (en el sentido de la
medida de Lebesgue).
El siguiente teorema facilita el cálculo de ∂f (x) en dimensión finita.
Teorema 1.4.
Sean f Lipschitz cerca de x y Ωf el conjuntos de puntos donde f no es diferenciable y
supongamos que S es cualquier subconjunto de medida Lebesgue cero en Rn entonces
∂f (x) := co{lı́m ∇f (xi ) : xi → x, xi ∈
/ S, xi ∈
/ Ωf }.
El significado de esto es considerar cualquier sucesión {xi } que converge a x y donde
xi ∈
/ S ∪ Ωf tal que la sucesión {∇f (xi )} converge; entonces la envoltura convexa de todos estos lı́mites es ∂f (x).
Funciones Convexas
17
Demostración.
Tengamos en cuenta en primer lugar que hay “muchas” sucesiones {xi } que convergen a x
y no pertenecen a S ∪ Ωf puesto que este conjunto tiene medida cero cerca de x. Además,
como ∂f (x) es localmente acotada cerca de x (Proposición 1.3) y como f es Lipschitz y
admite derivada entonces ∇f (xi ) ∈ ∂f (xi ) (Proposición 1.8) para cada i, por el teorema de
Bolzano-Weierstrass la sucesión {∇f (xi )} admite una subsucesión convergente. Por lo tanto
el limite de cualquier sucesión de este tipo debe pertenecer a ∂f (x) por la propiedad de cierre
de ∂f . Por lo tanto el conjunto
{lı́m ∇f (xi ) : xi → x, xi ∈
/ S, xi ∈
/ Ωf }
está contenido en ∂f (x) y es no-vacı́o y acotado, y como es cerrado tenemos que es compacto.
Por otro lado como ∂f (x) es convexo, deducimos que la parte izquierda esta contenida en la
parte derecha. Ahora como la envoltura convexa de un conjunto compacto en Rn es compacto,
para completar la prueba debemos demostrar que la función soporte de la izquierda nunca
excede a la de la parte derecha. Esto se sigue a partir del siguiente lema.
Lema 1.4.1.
Para cualquier v 6= 0 en Rn , y para cualquier ε > 0 tenemos
f ◦ (x; v) − ε ≤ lı́m sup{∇f (y) · v : y → x, y ∈
/ S ∪ Ωf }
Para demostrar esto, denotaremos por α el lado derecho. Entonces por definición, existe δ > 0
tal que si
y ∈ x + δBX , y ∈
/ S ∪ Ωf
implica que ∇f (y) · v ≤ α + ε. Ahora sea N = S ∩ Ωf y elegimos un δ suficientemente
pequeño
y µ(N ) = 0 en x + δBX , consideremos el segmento de lı́nea
o
n para que f sea Lipschitz
δ
Ly = y + tv : 0 < t < 2|v| y el conjunto A = y ∈ B x, 2δ : λ(Ly ∩ N ) = 0 . Tenemos que
ver que λ(Ly ∩N ) = 0, para lo cual mostraremos que A es denso B(x, δ/2). Supondremos que
A no es denso, entonces existe BX ⊂ B(x, δ/2)rA, donde BX es una bola abierta, y BX 6= ∅.
Consideremos el hiperplano H ⊂ Rn y es perpendicular a v. Si definimos B0 = H ∩ BX una
bola abierta en H y B0 6= ∅, luego µn−1 (H ∩ BX ) > 0, y H ∩ BX es una bola (n − 1)
Funciones Convexas
18
dimensional. Ahora para todo y ∈ B0 , {y} × Ly ⊂ B(x, δ/2) se tiene que:
"
#!
[
µ(N ) >µ N ∩
{y} × Ly
y∈B0

Z
=

Z


B0

λ(Ly ∩ N ) dλ  dµn−1
Ly
Z
≥
λ(Ly ∩ N ) dµn−1 > 0
B0
como µ(N ) = 0 y
R
λ(Ly ∩ N ) dµn−1 > 0 tenemos que λ(Ly ∩ N ) = 0. Ahora como sabemos
B0
que para casi todo y ∈ x + (δ/2)BX el segmento de lı́nea Ly interseca a N en un conjunto
de medida cero uno-dimensional. Sean y cualquier punto en x + (δ/2)BX con la propiedad
anterior, y t ∈ (0, δ/2|v|), entonces
Z
f (y + tv) − f (y) =
t
∇f (y + sv) · vds,
0
f 0 existe almenos casi siempre en Ly . Ahora como tenemos ky + sv − xk < δ para 0 < δ < t,
se sigue que ∇f (y + sv) · v ≤ α + ε por consiguiente
f (y + tv) − f (y) ≤ t(α + ε).
Dado que esto es cierto para todo y que diste δ/2 de x excepto en un conjunto de medida
cero, y para todo t ∈ (0, δ/2|v|), y como f es continua, esto es verdadero para todo y y t. Luego
f ◦ (x; v) ≤ α + ε
Ejemplo 1.4.
Sea f : R2 → R dada por
f (x, y) = máx{mı́n[x, −y], y − x}.
Funciones Convexas
19
Calcular ∂f (0, 0).
Definamos
C1 ={(x, y) : y ≤ 2x e y ≤ −x}
C2 ={(x, y) : y ≤ x/2 e y ≥ −x}
C3 ={(x, y) : y ≥ 2x o y ≥ x/2}.
Luego C1 ∪ C2 ∪ C3 = R2 , y obtenemos



x, para (x, y) ∈ C1
f (x, y) =
−y, para (x, y) ∈ C2


y − x, para (x, y) ∈ C3
Se puede ver que el lı́mite de estos tres conjuntos forman un conjunto S de medida 0, y que si
(x, y) no esta en S, entonces f es diferenciable y ∇f (x, y) es uno de los puntos (1, 0), (0, −1),
o (−1, 1). Por lo tanto, del Teorema 1.4 se sigue que ∂f (0, 0) es la envoltura convexa de estos
tres puntos.
Capı́tulo
2
JACOBIANO GENERALIZADO Y
TEOREMA DE LA FUNCIÓN INVERSA
En este capı́tulo estudiaremos el clásico Teorema de función inversa, el cual nos proporciona
condiciones para que una función f admita (localmente) una inversa. Nuestro propósito
está en buscar condiciones para que una función Lipschitz (no necesariamente diferenciable)
admita (localmente) una función inversa y que sea Lipschitz. Una forma conveniente para el
cálculo de esta función inversa, es el Gradiente Generalizado propuesto por Clarke [6].
2.1.
JACOBIANO GENERALIZADO
Consideremos una función vectorial f : Rn −→ Rm , escrita en componentes de la forma
f (x) = [f 1 (x), f 2 (x), . . . , f m (x)]. Ası́ mismo asumimos que cada f i es Lipschitz cerca de
un punto de interés x. Al igual que antes el Teorema de Rademacher nos dice que f es
diferenciable (es decir cada f i es diferenciable) en casi todo punto en donde f es Lipschitz.
Denotamos por Ωf el conjuntos de puntos donde f no es diferenciable y f 0 (y) la matriz jacobiana usual n × m de derivadas parciales siempre que y sea un punto donde la derivada
parcial exista.
Definición 2.1.
El Jacobiano Generalizado de Clarke de f en x, denotado ∂f (x), es la envoltura convexa de
todas las matrices M obtenidas como el lı́mite de una sucesión de la forma f 0 (xi ) cuando
20
Jacobiano Generalizado en Espacios de Banach
xi → x y xi ∈
/ Ωf
De esta manera, tenemos que:
∂f (x) = co{lı́m f 0 (xi ) : xi → x, xi ∈
/ Ωf }.
Ahora denotamos por M el espacio vectorial de matices de m × n dotado por la norma
( m
) 21
X
kM km×n =
|ri |2 : ri es la i − esima fila de M
,
i=1
y Bm×n la bola de unidad abierta en Rm×n . A continuación damos algunas propiedades de
∂f (x).
Proposición 2.1.
(a) ∂f (x) es un subconjunto de Rm×n no-vacı́o, convexo y compacto.
(b) ∂f es cerrado en x; estos es, si xi → x, Mi → M, entonces M ∈ ∂f (x).
(c) ∂f es semicontinua superiormente en x, esto es, para cualquier ε > 0 existe un δ > 0
tal que, para todo y ∈ x + δBX ,
∂f (y) ⊂ ∂f (x) + εBm×n
(d) Si cada función componente f i es Lipschitz de constante Ki en x, entonces f es Lipschitz
en x de constante K = |(K1 , K2 , . . . , Km )|, y ∂f (x) ⊂ K Bm×n
(c) ∂f (x) ⊂ ∂f 1 (x) × ∂f 2 (x) × · · · × ∂f m (x), donde este último representa el conjunto de
todas las matrices cuya i- esima fila pertenece a ∂f i (x) para cada i.
Si m = 1, entonces ∂f (x) = ∂f 1 (x) (es decir, el Gradiente Generalizado y el
Jacobiano Generalizado coinciden)
Ahora se debe hacer notar que ∂f (x) no es en realidad un subconjunto de Rn (cuando
f : Rn → R) como se ha pretendido hasta ahora. Para ser coherente con el Jacobiano
Generalizado, ∂f esta conformada por matrices de 1×n (i.e., vectores filas). Por otra parte, la
convención habitual que tiene los operadores lineales de Rn en Rm son de la forma f (x) = Ax,
y son representados por multiplicación, en donde A es una matrix de m×n, esto es lo que nos
hace ver a Rn como matrices de n × 1 (i.e., vectores columna), y ası́ obtenemos ∂f (x) = {A}
como nosotros desearı́amos. Esta distinción es irrelevante, siempre y cuando permanezcamos
en el caso m = 1, pero debe respetarse en la interpretación.
21
Jacobiano Generalizado en Espacios de Banach
22
Demostración.
Las afirmaciones (a) y (b) se siguen fácilmente, de la primera parte de la prueba del teorema
1.4. Ahora, podemos notar que la parte (c) incluye a (b). Por lo tanto procedemos a demostrar
(c), supongamos que, para un ε dado, no existe δ. Entonces (como la parte izquierda es
convexa), para cada i ∈ N, existe necesariamente un elemento f 0 (yi ) tal que yi ∈ x + (1/i)BX
aunque f 0 (yi ) ∈
/ ∂f (x) + εBm×n . Ahora como ∂f es acotado localmente podemos suponer
que ∂f (yi ) converge a un elemento M , y por definición, M ∈ ∂f (x), lo que nos lleva a una
contradicción. Para la afirmación (e) es consecuencia inmediata de la definición de ∂f y el
Teorema 1.4
Este termino es introducido por Clarke [6] para estudiar el control óptimo y problemas variacionales con datos No-regulares, esta noción y variaciones de la misma se han utilizado en los
últimos años para ampliar los resultados en programación lineal, control óptimo y análisis
global. Se puede consultar por ejemplo Clarke [5, 6], Halkin [11, 12], Hiriart-Urruty [14, 15]
o Pourciau [20, 23]. Las cuentas en detalle de las propiedades básicas se pueden encontrar en
Clarke [6] o Pourciau [20].
A continuación mostraremos una extensión del teorema del valor medio vectorial.
Proposición 2.2.
Sea f una función lipschitz en un conjunto abierto convexo U en Rn , y sean x e y dos puntos
de U . Entonces
f (y) − f (x) ∈ co ∂f ([x, y])(y − x)
Demostración.
Cabe recordar que la parte derecha denota la envoltura convexa, de todos los puntos de
la forma Z(y − x), donde Z ∈ ∂f (u) para algún punto u ∈ [x, y] y se puede hacer (esto
no es una anbigüedad) [co ∂f ([x, y])] (y − x) = co [∂f ([x, y])(y − x)]. Ahora fijemos un x.
Basta con probar esta inclusión para puntos y teniendo la propiedad que el segmento de
linea [x, y] interseca al conjunto Ωf en un conjunto de medida cero uno-dimensional, por un
argumento utilizado en la demostración del lema 1.4.1, casi todo y tiene esta propiedad y por
la continuidad de f y la semicontinuidad de ∂f , para tal y, podemos escribir
Z 1
f (y) − f (x) =
f 0 (x + t(y − x))(y − x) dt,
0
Jacobiano Generalizado en Espacios de Banach
23
que expresa directamente a f (y) − f (x) como una (por la continuidad) combinación convexa
de puntos de la forma ∂f ([x, y])(y − x).
Comparando el enunciado del Teorema 1.4 y la definición de el Jacobiano Generalizado
de Clarke, nos podemos dar cuenta que podemos quitar el conjunto S. De hecho, aunque
el gradiente generalizado Clarke es “ciego” a conjuntos de medida cero, como se prueba
en el teorema 1.4, esto también es cierto para el Jacobiano Generalizado de Clarke (en el
caso de m = 1). Clarke habı́a pensado que para m > 1 no funcionarı́a para el
Jacobiano Generalizado, y hacia la observación que, posiblemente (aunque no estaba seguro) que alterando la definición en donde los puntos xi también estén restringidos a estar
fuera del conjunto nulo S, pero esto nos conducirı́a a un Jacobiano Generalizado diferente.
M. Fabian y D. Preiss son quienes muestran que también se cumple para m > 1.
Lema 2.1.
Supongamos que U es un subconjunto de Rn , que h es una función Lipschitz continua de
U en Rn , y que S es un subconjunto de U con n- medida Lebesgue dimensional µ(S) = 0.
Entonces,
µ(hS) = 0
Demostración.
Denotemos por M la constante Lipschitz de la función h, y fijemos un ε > 0. Como
µ(S) = 0
y S esta contenido en la unión
S∞
Cj de una sucesión de cubos Cj con
!
∞
∞
\
X
Cj ≤
µ(Cj ) < ε.
j=1
µ
j=1
j=1
Se puede ver fácilmente que h(S ∩ Cj ) esta contenido en un cubo Dj satisfaciendo
µ(Dj ) ≤ M n µ(Cj )
S
de este modo h(S) esta cubierto por la union ∞
j=1 Dj de cubos Dj tal que
!
∞
∞
∞
[
X
X
µ
Dj ≤
µ(Dj ) ≤
M n µ(Cj ) < M n ε.
j=1
j=1
j=1
Jacobiano Generalizado en Espacios de Banach
24
Como ε es arbitrario, tenemos que
µ(hS) = 0
Sea f : Rn −→ Rm una función localmente Lipschitz, se sabe que por el Teorema de
Rademacher que existe un conjunto Ωf ⊂ Rn de medida Lebesgue cero tal que la derivada
Gâteaux fG0 (y) existe siempre que y ∈
/ Ωf . Si reemplazamos al conjunto Ωf por un conjunto
nulo E ∈ Rn conteniendo a Ωf se obtiene el siguiente teorema
Teorema 2.1. (M. Fabian y D. Preiss)
Sean f : Rn −→ Rm una función localmente Lipschitz y ∂E f (x) el Jacobiano Generalizado
de f en x con respecto a E definido por
∂E f (x) = co{lı́m f 0 (xi ) : xi → x, xi ∈
/ E},
entonces
∂E f (x) = ∂f (x)
para todo m y para todo conjunto nulo E incluyendo a Ωf
Demostración.
Todo los espacios Rk son considerados con la norma Euclı́dea k · k. Denotamos por h·, ·i el
producto interior usual. El espacio de las funciones lineales de Rn en Rm ası́ como su dual
será identificado con Rnm . Claramente tenemos que ∂E f (x) ⊂ ∂f (x), luego procedemos a
demostrar la otra inclusión. Lo haremos por contradicción, supongamos que esta inclusión es
propia. Entonces existe un funcional A en Rnm y α ∈ R tal que
sup{hA, Li : L ∈ ∂E f (x)} < α < sup{hA, Li : L ∈ ∂f (x)},
de la definición de ∂E f (x) tenemos que existe un ε > 0 tal que:
hA, fG0 (y)i < α cuando y ∈ B(x, ε) r E.
De lo contrario, podrı́a ocurrir que yi ∈ B(x, 1/i) r E donde hA, fG0 (yi )i ≥ α y por lo tanto
existirı́a un L ∈ ∂E f (x) tal que hA, Li ≥ α, que es imposible. Además, si recordamos la
definición de ∂f (x), existe y = (y 1 , . . . , y n ) ∈ B(x, ε) r S donde
α < hA, fG0 (y)i.
Jacobiano Generalizado en Espacios de Banach
25
Uniendo las dos últimas desigualdades obtenemos
hA, fG0 (y)i < α < hA, fG0 (y)i donde y ∈ B(x, ε) r E.
Denotando por A = (aij ), i = 1, . . . , m, j = 1, . . . , n y gj = a1j f1 + . . . + akj fk ,
j = 1, . . . , n, podemos escribir la anterior desigualdad de la siguiente forma
n
X
∂gj (y)
j=1
∂yj
<α<
n
X
∂gj (y)
j=1
∂yj
,
donde y ∈ B(x, ε) r E.
Sea C(s) el cubo n- dimensional con vertices (y 1 ± s, . . . , y n ± s). Como s > 0 es tan pequeño
se tiene que C(s) ⊂ B(x, ε), luego la desigualdad anterior se mantiene en casi toda punto de
C(s) y, en consecuencia,
Z
n
n
X
X
∂gj (y)
∂gj (y)
n
n
dy1 . . . dyn < (2s) α < (2s)
.
∂yj
∂yj
j=1
j=1
C(s)
Ahora denotemos por
0
δj (s) = sup |gj (y) − gj (y) − gGj (y)(y − y)| : máx |yi − y i | ≥ s
i=1,...,n
y
Cj (s) = (y1 , . . . , yj−1 , yj+1 , . . . , yn ) : (y1 , . . . , yj−1 , y j , yj+1 . . . , yn ) ∈ C(s) ,
j = 1, . . . , n,
s > 0.
(2.1)
Teorema de la Función Inversa
26
Usando el teorema de Fubini, obtenemos lo siguiente
Z
∂gj (y)
dy1 . . . dyn =
∂yj
C(s)
Z X
σgj (y1 . . . , yj−1 , y j + σs, yj+1 , . . . , yn ) × dy1 . . . dyj−1 dyj+1 . . . dyn =
Cj (s)
Z
Cj (s)
σ=±1
X
σ gj (y1 . . . , yj−1 , y j + σs, yj+1 , . . . , yn ) − gj (y)−
σ=±1
0
(y)(y1
gG
j
− y 1 , . . . , yj−1 − y j−1 , σs, yj+1 − y j+1 , . . . yn − y n
dy1 . . . dyj−1 dyj+1 . . . dyn ≥ −2(2s)n−1 δj (s) + 2s
i
∂gj (y)
+ 2s
∂yj
×
∂gj (y)
(2s)n−1 .
∂yj
Por lo tanto de 2.1 tenemos
2(s)n
n
X
∂gj (y)
j=1
∂yj
− (2s)n
n
X
δj (s)/s < (2s)n α < (2s)n
j=1
n
X
∂gj (y)
j=1
∂yj
si s > 0 es suficientemente pequeño. Tengamos en cuenta que δj (s)/s → 0 cuando s ↓ 0 ya
que para funciones Lipschitz en espacios de dimensión finita, Gâteaux y Fréchet diferenciable
coinciden. Ahora, dividiendo la desigualdad anterior por (2s)n y dejando que s se acerque a
cero, obtenemos una contradicción.
2.2.
TEOREMA DE LA FUNCIÓN INVERSA
Sea f : Rn −→ Rn y denotemos como M al espacio vectorial de matrices n × n dotado de
la norma kM k = máx |mij | siendo M = (mij )i,j=1,...n ∈ M. El conjunto M(0, 1) es la bola
centrada en la matriz 0 ∈ M de radio 1 con la norma anterior. El Jacobiano Generalizado
de f en x0 , es el convexo más pequeño que contiene a todas las matrices M de la forma
M = lı́m f 0 (xt )
t→∞
donde {xt } es una sucesión de puntos en los que existe f 0 (xt ) y converge a x0 . La existencia de
xt es una consecuencia del teorema de Rademacher, aplicándolo a las funciones componentes
de f . Además, como f es K-Lipschitz entonces f 0 (x) está acotado cerca de x0 .
Teorema de la Función Inversa
27
Proposición 2.3.
Sea h : R → R una función Lipschitz, si para algún ζ ∈ Rn y para todo v ∈ Rn se tiene
ζ · v ≤ lı́m sup
δ→0
h(x + δv) − h(x)
δ
entonces ζ ∈ ∂h(x)
Demostración.
Véase el corolario 1.10 de [6]
Definición 2.2.
Sean f : Rn → R y x0 ∈ Rn . Se dice que ∂f (x0 ) es de rango máximo si cada M ∈ ∂f (x0 ) es
de rango máximo.
Ahora procedemos a mostrar el Teorema principal de este capı́tulo.
Teorema 2.2. (Teorema de la Función Inversa)
Sean f : Rn → R y x0 ∈ Rn . Si ∂f (x0 ) es de rango máximo, entonces existen entornos U y
V de x0 y f (x0 ) respectivamente, y una función g : V → Rn Lipschitz tal que
(a) g(f (u)) = u para todo u ∈ U
(b) f (g(v)) = v para todo v ∈ V.
Cuando f es C 1 , ∂f (x0 ) se reduce a f 0 (x0 ), y la función g es necesariamente C 1 . Con esto se
recupera el teorema clásico. Para mostrar este teorema mostraremos primero 5 lemas.
Lema 2.2.1.
Sea ε > 0, entonces existe δ > 0 para todo x tal que kx − x0 k < δ se tiene que
∂f (x) ⊂ ∂f (x0 ) + εM(0, 1),
siendo M(0, 1) la bola de centro 0 ∈ M y radio 1.
Demostración.
Supongamos que la tesis no es cierta, entonces existe ε > 0 tal que para todo i ∈ N existe xi
(para el que existe f 0 (xi )) tal que kxi − x0 k < 1i de modo que
f 0 (xi ) ∈
/ ∂f (x0 ) + εM(0, 1)
Teorema de la Función Inversa
28
Como f es Lipschitz entonces ∂f es localmente acotado y por lo tanto f 0 (xi ) converge a cierto
M que por definición debe pertenecer a ∂f (x0 ).
Luego esto contradice que f 0 (xi ) ∈
/ ∂f (x0 ) + εM(0, 1), por lo tanto se verifica el lema.
Lema 2.2.2.
Si h : Rn → Rn es una función C 1 entonces ∂(h ◦ f )(x) ⊂ ∇h(f (x))∂f (x)
Demostración.
Por la definición 2.1 podemos escribir que ∂(h ◦ f )(x) es el convexo más pequeño que contiene
a los lı́mites
L = lı́m ∇(h ◦ f )(xn )
n→∞
siendo {xn } una sucesión convergente a x para la que existe ∇(h ◦ f ). Ası́ pues, se tiene
L = lı́m ∇(h ◦ f )(xn ) = lı́m ∇(h(f (xn ))f 0 (xn ) = ∇h(f (x)) lı́m f 0 (xn ) = ∇h(f (x))M
n→∞
n→∞
n→∞
donde M = lı́m f 0 (xn ) ∈ ∂f (x), por lo que se concluye que L ∈ ∇h(f (x))∂f (x) y por lo
n→∞
tanto se concluye que ∂(h ◦ f )(x) ⊂ ∇h(f (x))∂f (x).
Lema 2.2.3.
Existen r > 0 y δ > 0 que verifican que dado cualquier vector unitario v ∈ Rn , existe w ∈ Rn
unitario tal que si x ∈ x0 + rBX y M ∈ ∂f (x0 ) entonces
w · (M v) ≥ δ
Demostración.
Como S y ∂f (x0 ) son compactos, entonces el conjunto
∂f (x0 )S = {u = M z ∈ Rn : M ∈ ∂f (x0 ), z ∈ S}
es compacto ya que es la imagen mediante la aplicación continua
M × Rn → Rn
(M, z) 7→ M z
como ∂f (x0 ) es de rango máximo, entonces si M ∈ ∂f (x0 ) entonces M v 6= 0 para todo v ∈ Rn con v =
6 0, y ası́ ∂f (x0 )S no contiene al vector 0 ∈ Rn . Como ∂f (x0 )S es
Teorema de la Función Inversa
29
compacto, la norma euclı́dea en Rn restringida a ∂f (x0 )S alcanza su máximo y su mı́nimo.
Sea δ0 = mı́n kzk, entonces tomamos δ tal que 0 < δ < δ20 . Por otro lado, si consideramos
z∈∂f (x0 )S
M0 = (mij )i,j=1...n ∈ M(0, 1) y ε > 0, tenemos que cualquier v ∈ S
 n

P
m
v
 j=1 1j j 




..
M0 v = 

.
 n

 P

mnj vj
j=1
y por lo tanto
v
v
v

2

2
u
u
u n
uX
uX
n
n
n
n
X
X
uX
√
u
u




t
t
mij vj
≤ε
|vj |
≤ εt
n2 = εn n
kεM0 vk = εkM0 vk = ε
i=1
j=1
i=1
j=1
(2.2)
i=1
donde hemos utilizado que |mij | ≤ 1 y |vj | ≤ 1. Ası́ tomando ε <
M ∈ ∂f (x0 ), M0 ∈ M(0, 1) y v ∈ S entonces
δ
√
n n
kεM0 vk + kM v + εM0 vk ≥ kM vk ≥ δ0 > 2δ
tenemos que si
(2.3)
y aplicando la desigualdad (2.2) tenemos que
√
δ √
kεM0 vk ≤ εn n < √ n n = δ
n n
Ası́, combinándolo con la desigualdad (2.3)
δ + kM v + εM0 vk ≤ kεM0 vk + kM v + εM0 vk > 2δ
y por tanto
kM v + εM0 vk > 2δ − δ = δ.
Hemos visto que existe ε > 0 tal que kM v +εM0 vk > δ para todo M ∈ ∂f (x0 ), M0 ∈ M(0, 1)
y v ∈ S, por tanto, esto implica que si llamamos G = ∂f (x0 ) + εM(0, 1), entonces GS está a
una distancia mayor que δ del vector 0 ∈ Rn .
Por el lema 2.2.1 tenemos que existe un entorno U de x0 tal que para todo x ∈ U se verifica
que
∂f (x) ⊂ ∂f (x0 ) + εM(0, 1) = GS,
y podemos considerar otro entorno V de x0 tal que V ⊂ U y además tal que
V = x0 + rBX = {x0 + ru : u ∈ BX }
Teorema de la Función Inversa
30
para cierto r > 0. Podemos suponer, sin perdida de generalidad tomando r más pequeño si
fuese necesario, que ∂f (x) ⊂ G para todo x ∈ V . Consideramos v ∈ S, entonces como Gv es
convexoentonces por el teorema de Hand-Banach, existe un vector w ∈ Rn − Gv tal que Gv
está en un semiplano cerrado asociado a w, es decir que
w · γv ≥ δ
para todo γv ∈ Gv. Como hemos visto que ∂f (x) ⊂ G cuando x ∈ V = x0 + rBX entonces,
si M ∈ ∂f (x) tenemos que w · (M v) ≤ δ.
En esta demostración se ve claramente que el vector w ∈ Rn − Gv no depende del punto x
sino únicamente del vector v.
Lema 2.2.4.
Sean x, y ∈ x0 + rBX , entonces
kf (x) − f (y)k ≤ δkx − yk
Demostración.
Sean x, y ∈ Rn distintos y supongamos que x, y ∈ rBX .
Denotemos por
y−x
v=
ky − xk
λ = ky − xk
por consiguiente podemos escribir que
y = x + λv
Ahora considerando el hiperplano π perpendicular al vector v que pasa por x. Por el teorema
de Rademacher nos lleva a que el conjunto de puntos P = {z ∈ x0 + rBX : no existe f 0 (z)}
es un conjunto de medida cero, y por el teorema de Fubini para casi todo x0 ∈ π los puntos
x0 + tv con t ≤ 0 interseca a P en un conjunto de medida 0. Tomando un punto cualquiera de
estos x0 suficientemente cercano a x tal que x0 + tv pertenezca a x0 + rBX para todo t ∈ [0, λ]
y consideramos la función dada por
t 7−→ f (x0 + tv)
se puede ver fácilmente que es K-Lipschitz (por ser f K-Lipschitz y v unitario), en efecto
kf (x0 + tv) − f (x0 + sv)k ≤ K · kx0 + tv − x0 − svk = K · k(t − s)vk ≤
Teorema de la Función Inversa
31
K · k(t − s)k · kvk = K · k(t − s)k
además la derivada de esta función es f 0 (x0 +tv)v en casi todo punto, y por lo tanto, integrando
se tiene que
Z
λ
0
0
f 0 (x0 + tv)v dt
f (x + λv) − f (x ) =
0
n
Por el lema 2.2.3 existe un vector unitario w ∈ R tal que
w · [f 0 (x0 + tv)v] ≥ δ
y por tanto
0
0
Z
w · [f (x + tv) − f (x )] =
λ
0
0
Z
λ
w · [f (x + tv)v] dt ≥
0
δ dt = δλ = δ ky − xk
0
es decir
w · [f (x0 + tv) − f (x0 )] ≥ δ ky − xk
y como
w · [f (x0 + tv) − f (x0 )] ≥ kwk kf (x0 + tv) − f (x0 )k = kf (x0 + tv) − f (x0 )k
entonces tenemos que
kf (x0 + tv) − f (x0 )k ≥ δ ky − xk
esto es cierto para todo x0 suficientemente cerca a x. Ahora por la continuidad de f se tiene
que también será cierto para x = x0 , ası́
kf (x0 + tv) − f (x)k ≥ δ ky − xk
y como y = x + tv entonces se concluye que
kf (y) − f (x)k ≥ δ ky − xk
Lema 2.2.5.
W = f (x0 ) +
rδ
BX ⊂ f (x0 + rBX )
2
Teorema de la Función Inversa
32
Demostración.
Consideremos un y ∈ W y sea x ∈ x0 + rBX el punto donde la función ky − f (·)k alcanza su
mı́nimo. Ahora supongamos que x ∈ x0 + rS, entonces por el lema 2.2.4 se tiene que
rδ
> ky − f (x0 )k ≥ kf (x) − f (x0 )k − ky − f (x)k ≥
2
rδ
rδ
=
2
2
lo que es una contradicción, por lo que entonces se debe verificar que x ∈ x0 + rBX
δ kx − x0 k − ky − f (x)k ≥ δ − ky − f (x0 )k ≥ δr −
Con la ayuda de estos cinco teoremas procedemos a demostrar el teorema 2.2
Demostración. (Teorema 2.2)
Sea x el mı́nimo de ky − f (·)k2 luego sus derivadas parciales son nulas y por lo tanto, por
la proposición 2.3, tenemos que 0 ∈ ∂ (ky − f (·)k2 ). Luego por el lema 2.2.2, tenemos que
0 ∈ 2ky − f (x)k∂f (x). Y por el lema 2.2.3, implica que las matrices de ∂f (x) son invertible,
por lo tanto y = f (x). Ası́ podemos definir en W = f (x0 ) + rδ2 BX la función g tal que para
cada v, g(v) es el único x ∈ x0 + rBX tal que f (x) = v. Y por el lema 2.2.4 tenemos
kf (y) − f (x)k ≥ δ ky − xk
y esto es equivalente a
ku − vk ≥ δ kg(u) − g(v)k
luego
1
kg(u) − g(v)k ≤ ku − vk
δ
por lo tanto concluimos que g es Lipschitz.
Capı́tulo
3
INVERSIÓN GLOBAL DE FUNCIONES
NO-REGULARES
Hadamard en 1906 establece el criterio de inversion global de funciones f continuamente
diferenciables de Rn en Rn :
Teorema 3.1. Teorema de Hadamard
Sea f : Rn → Rn de clase C 1 tal que f 0 (x) es invertible para cada x en Rn y supongamos que
Z ∞
ı́nf (1/kf 0 (x)−1 k) dt = ∞
0
|x|≤t
Entonces la función f es un difeomorfismo de Rn en Rn
En el presente capı́tulo, se establece la generalización del teorema de Hadamard donde
es valido para cierto tipo de funciones no-regulares de Rn en Rn . Si f es solo localmente
Lipschitz, (esta clase de funciones incluye, por supuesto, funciones continuamente
diferenciables) entonces la derivada f 0 (x) puede que no exista, pero podemos reemplazarla
por el Jacobiano Generalizado de Clarke. Usando el concepto anterior mencionado de ∂f (x),
extendemos el teorema de Hadamard a la clase de funciones localmente Lipschitz.
33
Inversión Local
3.1.
34
RESULTADOS PREVIOS
El siguiente teorema es probado por Hadamard en [10]. En el enunciado de este teorema, se
utiliza la siguiente notación //A//, donde A es una transformación lineal de Rn , en el sentido
de la co-norma //A// = ı́nf kuk=1 |Au|.
Con esta notación, podemos reformular la condición Integral de Hadamard como sigue:
Teorema 3.2. Teorema de Hadamard
Supongamos que f es una función de clase C 1 de Rn en Rn y supongamos que la derivada
f 0 (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //f 0 (x)//. Si
Z ∞
m(t) dt = ∞
0
entonces la función f es un difeomorfismo de Rn en Rn .
Como resultado básico sobre inversión global, este teorema ha atraı́do una cierta
atención. Variaciones y corolarios se han descubierto, se han encontrado diferentes pruebas, y
extensiones a funciones C 1 en espacios de Banach se han estabilizado. Consultar en Gutú y
Jaramillo [9], Hermann [13], John [16], Levy [18] y Meyer [19], entre otros.
Ahora, cuando cada transformación A en ∂f (x) es invertible (para abreviar decimos que ∂f (x)
es invertible) resulta que la función f es un homeomorfismo local en x. Si //∂f (x)// representa
el número ı́nf A∈∂f (x) //A//, Pourciau prueba la siguiente generalización de el
teorema de Hadamard
Teorema 3.3.
Supongamos que la función f es continua localmente Lipschitz de Rn en Rn , y además la
derivada generalizada ∂f (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //∂f (x)//. Si
Z ∞
m(t) = ∞,
0
entonces la función f es un homeomorfismo de Rn en Rn .
Inversión Local
3.2.
INVERSIÓN LOCAL
Ahora para el caso no-regular, obtenemos el siguiente Teorema de inversión local, recordemos que decir que ∂f (x) es invertible, significa que cada transformación lineal en ∂f (x) es
invertible.
Teorema 3.4. (Teorema de Inversión Local )
Si f es continua localmente Lipschitz y la derivada generalizada ∂f (x) es invertible, entonces
la función f es un homeomorfismo de una vecindad de x en una vecindad de y = f (x).
Ahora, consideremos un punto particular x y usando el teorema 3.5, obtenemos que la
función f es un homeomorfismo de un entorno U de x en un entorno V de y = f (x).
Ahora, si nos restringimos a U , entonces f tiene una función inversa continua g definida
en V . Realmente lo que buscamos es establecer criterios que garanticen la existencia de un
inversa global, y el interés está en si, y hasta dónde se puede extender esta inversa local
más allá de su dominio original V . Muchos autores, ya sea directa o indirectamente, han
estudiado este problema para homeomorfismo locales. por ejemplo ver Hermann [13] o John
[16] entre otros. Por ejemplo, el enfoque que hace John es particularmente directo. Daremos
una idea adaptada a nuestra situación. Supongamos que f : Rn → Rn es un homeomorfismo
local, para simplificar un poco la notación, asumimos que f (0) = 0, entonces debe existir
una bola BX al rededor de 0 y una inversa local g : BX → Rn con g(0) = 0.
Definición 3.1.
Denotemos por [w, y] el segmento de linea {(1 − t)w + ty : 0 ≤ t ≤ 1} para cada par de
puntos w, y en Rn , y definimos el co-dominio D de f como: D es el conjunto de todos los
puntos y en Rn tales que existe una función inversa continua g definida en el segmento [0, y]
y satisfaciendo g(0) = 0.
Cabe resaltar que el valor de g(y) depende únicamente de f e y. Ahora, definimos la función
f −1 en D por f −1 (y) = g(y), y se obtienen los siguientes lemas.
Lema 3.2.1. Lema de Continuidad
D es un conjunto abierto, f −1 es una inversa de f definida en D, y f −1 es continua en D
Demostración.
Consideremos D = {y ∈ Rn / ∃ py : [0, 1] −→ Rn camino continuo tal que f ◦ py = qy } donde
35
Inversión Local
36
qy (t) = ty para 0 ≤ t ≤ 1. Sea y ∈ D, ahora como f es un homeomorfismo local e Im py , Im
qy son compactas, podemos considerar un recubrimiento finito V1 ∪ V2 ∪ . . . ∪ Vm de Im qy y
un recubrimiento finito U1 ∪ U2 ∪ . . . ∪ Um de Im py tal que Uk es una bola y f |Vk : Vk −→ Uk
m
S
es un homeomorfismo, para k = 1 . . . m. Obsérvese que Im Py ⊂
Uk . Sea sk la inversa de
k=1
f |Vk y sea ρ > 0 el número Lebesgue de [0, 1] para el cubrimiento finito {qy−1 (Vk ∩ Impq )}m
k=1 .
Sea 0 = t0 < t1 < . . . < tn = 1 una partición de [0,1] tal que tj − tj−1 < ρ. Ahora, para cada
j = 1, . . . , n existe kj ∈ {1, . . . , m} tal que qy [tj−1 , tj ] ⊂ Vkj . Sea Ṽj = Vkj ∩ Vkj+1 . Podemos
ver que qy (tj ) ∈ Ṽj , Ṽj es abierto, f |Vk es un homeomorfismo y f (Ṽj ) es abierto. Si tomamos
z ∈ f (Ṽj ) existe un camino r : [tj , 1] −→ f (Ṽj ) uniendo py (tj ) y z. Sean q1 , q2 caminos
continuos definidos ambos por qy sobre [0, tj ] y skj ◦ r y skj+1 ◦ r en [tj , 1] respectivamente.
Entonces, como f es un homeomorfismo local, por la unicidad del levantamiento de caminos
se tiene q1 ≡ q2 , en particular, skj (z) = skj+1 (z), en otras palabras skj ≡ skj+1 en f (Ṽj ). Por
S
lo tanto podemos definir una aplicación F sobre la unión σ = nj=1 f (Ṽj ) con skj en cada
f (Ṽj ). Podemos ver que para z ∈ σ, f (F (z)) = z y para z ∈ Im py , F (z) = f −1 (z). Luego
el conjunto σ es abierto y contiene el camino py . Además, F es continua en σ pues en un
entorno de cualquier punto z ∈ σ, la aplicación F coincide con alguna de las skj , que son
continuas.
Lema 3.2.2. Lema de Maximalidad
Supongamos que {yj } es una sucesión en D que se encuentra en un rayo fijado en 0 y converge
/ D. Entonces la sucesión {f −1 (yj )} es no-acotada.
a algunos y ∈
Demostración.
Sean y = 0 y la sucesión yn de la forma yn = tn ζ, donde ζ ∈ Rn , ζ ∈
/ 0, tn ≥ 0, lı́mn→∞ tn = t
existen y y = tζ.
Supongamos que, para Yn = f −1 (yn ),
lı́m Yn = Y ∈ Rn .
Como f es continua en Y , tenemos
f (Y ) = lı́m f (Yn ) = lı́m yn = y
n→∞
n→∞
Ahora como {yn } ∈ D, existe una función inversa F de f definida en una ε- vecindad de el
punto y para que F (y) = Y . Por la continuidad de F , tenemos
lı́m F (yn ) = F (y) = Y
n→∞
Lemas
37
Además como |yn − y| < ε para n suficientemente grande, podemos ver que
f (F (yn )) = yn = f (Yn ).
Como f es inyectiva cerca de Y tenemos que, para todo n suficientemente grande,
F (yn ) = Yn = f −1 (Yn )
(3.1)
Sea n uno de estos valores para los que se tiene (3.1). Entonces tenemos en F una inversa de
f definida en el segmento [yn , y] y coincidiendo con f −1 en yn . Podrı́amos definir una inversa
G de f en el segmento [0, y] y G = F en [yn , y]. Como G(0) = f −1 (0) = Y = 0, se sigue de
la definición de D que y ∈ D. Luego contradice lo supuesto.
3.3.
LEMAS
Para la prueba del teorema sobre inversión global, debemos ser capaces de estimar el tamaño
del co-dominio natural D. Para ello sera necesario de dos lemas que se establecen en esta
sección. Pero antes procedemos a denotar ciertos aspectos que son necesarios para obtener
estos lemas.
Denotemos con I la transformación identidad en Rn , y sea A cualquier transformación lineal
de Rn en Rn y definamos
kAk = sup |Au|,
//A// = ı́nf |Au|,
|u|=1
|u|=1
la norma y co-norma de A, respectivamente. Si A y B son inversas, entonces tenemos que
kBk =
1
//A//
y
kAk =
1
//B//
Ahora bien, si A es una colección de transformaciones lineales de Rn en Rn , definimos
kA k = sup kAk,
A∈A
//A // = ı́nf //A//,
A∈A
la norma y la co-norma de A , respectivamente. Decimos que A es invertible, si cada
transformación lineal A en A es invertible, y en este caso A −1 representa la colección de
todas las inversas A−1 para A ∈ A . Por ultimo, coA denota la envoltura convexa de la
colección A .
Lemas
38
Vamos a recordar que asumimos que f es una función localmente Lipschitz de Rn en sı́
mismo. Si f fuera C 1 en un entorno de un punto particular x, entonces por supuesto f
tendrı́a una inversa local g y de clase C 1 definida en una vecindad de y = f (x). Esta inversa
local g debe satisfacer
g 0 (y) ◦ f 0 (x) = I
y por tanto también
kg 0 (y)k =
1
//∂f 0 (x)//
(∗)
Lo que se pretende es buscar un análogo de (∗) para el Jacobiano Generalizado de Clarke.
Pero para esto requerimos primero el siguiente lema.
Lema 3.3.1. (Lema de la co-norma)
Sea A una colección de transformaciones lineales de Rn . Sı́ A es compacta e invertible,
entonces
1
kcoA −1 k ≤
//A //
Demostración.
La colección coA −1 es compacta, porque A −1 es compacta y (en un espacio finito-dimensional)
la envoltura convexa de un compacto es compacta. La función k · k, asumirá un valor máximo
en coA −1 . Como coA −1 es un conjunto convexo de un espacio finito-dimensional, la función
convexa kk asumirá su valor máximo en algún punto extremo B de coA −1 . Sabemos que
B ∈ A −1 . Sea A la inversa de B. Entonces la desigualdad requerida se sigue fácilmente:
kcoA −1 k = kBk
1
=
//A//
1
≤
//A //
Para obtener un análogo de (∗), vamos a utilizar el lema anterior [3.3.1] y reemplazaremos A
por el Jacobiano Generalizado de Clarke ∂f (x). Para hacer esto primero mostraremos una
versión más detalla del Teorema de inversión local hecha por Pourciau.
Teorema 3.5. (Teorema de Inversión Local )
Si f es localmente Lipschitz y la ∂f (x) es invertible, entonces la función f es un homeomorfismo de una vecindad U de x en una vecindad V de y = f (x) y tenemos que:
Lemas
39
(a) La inversa local g definida en W = f (V ) con valores en V es Lipschitz.
(b) Para casi todo z ∈ U , f y g son diferenciables en z y f (z) respectivamente, y además
tenemos que
g 0 [f (z)] ◦ f 0 (z) = I
(∗∗)
Demostración.
La parte (a) es justamente el teorema de la función inversa (Teorema 2.2). Solo nos queda
por mostrar la parte (b). Recordando del lema 2.1 que:
µ[h(S)] = 0
se sigue siempre que S es un subconjunto µ-medible de Rn y que h es una función Lipschitz
de un conjunto abierto conteniendo a S en Rn .
Por el Teorema de Rademacher (1.3) existen Ωf y Ωg , y definimos
T = (dom f 0 ) ∩ (dom g 0 )
como los dominios de f 0 y g 0 son µ- medibles; se tiene que
V r T ⊂ (V r dom f 0 ) ∪ g(W r dom g 0 );
{z
}
{z
}
|
|
Ωf
Ωg
como
µ(V r dom f 0 ) = 0 y µg(W r dom g 0 ) = 0
concluimos que
µ(V r T ) = 0.
Por lo tanto, siempre que z ∈ T tenemos
g 0 [f (z)] ◦ f 0 (z) = 1
De (∗∗) queremos inferir la inclusión
∂g(y) ⊂ co ∂f (x)−1 ,
ya que con esto solo quedarı́a por aplicar el lema de la co-norma Lema 3.3.1 para obtener
k∂g(y)k ≤
1
.
//∂f (x)//
Inversión Global
40
Pero desafortunadamente no es ası́. Por lo tanto, sea V , g e y como las del teorema de
inversión local Teorema 3.5. Asumamos que T ⊂ V y tomando T = (domg 0 ) ∩ f (domf 0 )
tenemos que T es medible y V r T tiene medida cero, si definimos el Jacobiano generalizado
de Clarke de g en y con respecto a T , del Teorema 2.1 tenemos que ∂T g(y) = ∂g(y) ya que
siempre podemos quitar conjuntos de medida cero, ahora como para cada w en T tenemos
que f 0 [g(w)] ◦ g 0 (w) = I y usando el Teorema de inversion local Teorema 3.5 obtenemos que
∂T g(y) ⊂ co∂f (x)−1 .
Luego por el lema de la co-norma Lema 3.3.1, obtenemos el siguiente lema
k∂g(y)k = k∂T g(y)k
1
≤
//∂f (x)//
De acuerdo con esto obtenemos el siguiente lema
Lema 3.3.2.
Sea ∂f (x) invertible y supongamos que g es la función inversa local. Entonces
k∂g(y)k ≤
1
,
//∂f (x)//
cuando y = f (x).
El segundo lema que necesitamos es una consecuencia de la Proposición 2.2. Luego tenemos
el siguiente lema
Lema 3.3.3.
Si a y b pertenecen a un conjunto convexo C, tenemos
|f (b) − f (a)| ≤ |b − a| sup k∂f (x)k.
x∈C
3.4.
INVERSIÓN GLOBAL
Ahora con todas las herramientas expuestas en las anteriores secciones procedemos a mostrar
la siguiente extensión del teorema de Hadamard.
Teorema 3.6. Sean f : Rn → Rn una función localmente Lipschitz y supongamos que el
Jacobiano generalizado de Clarke ∂f (x) es invertible para cada x. Sea m(t) = ı́nf |x|≤t //∂f (x)//.
Si
Z ∞
m(t) dt = ∞,
0
Inversión Global
41
entonces la función f es un homeomorfismo de Rn en Rn .
Demostración.
Utilizando el teorema de inversión local Teorema 3.5, tenemos que la función f es un
homeomorfismo local. Sea D el co-dominio natural de f . Para mostrar este teorema es
suficiente con mostrar que se cumple que D = Rn . Vamos a suponer que este no es el
/ D. Sea f −1
caso. Entonces la frontera de D contiene algún punto y. Como D es abierto, y ∈
la inversa definida en D, y para y ∈ [0, y) definimos
n(y) = sup |f −1 (w)|.
w∈[0,y]
por el lema de maximalidad, como y → y en el segmento [0, y), f −1 debe ser no acotada.
Inferimos que la función continua n : [0, y) → R asume todos los números no negativos. Por
lo tanto para cualquier partición
0 = t0 < t1 < . . . < tJ < ∞
de [0, ∞), entonces existen puntos y0 , y1 , . . . , yJ en el segmento [0, y) tal que n(yi ) = tj e yj
es el punto más cercano de 0 para lo que se tiene la siguiente igualdad.
Haciendo la suma de Riemann
J−1
X
j=0
m(tj+1 )(tj+1 − tj ) =
J−1
X
m [n(yj+1 )] [n(yj+1 ) − n(yj )] .
j=0
Ahora estimamos la diferencia que aparece en cada termino de la segunda suma y para
y ∈ [0, y) y x = f −1 (y) tenemos por el lema 3.3.2,
k∂f −1 (y)k ≤
1
1
.
//∂f (x)// m[n(y)]
Pero aplicando ahora por el Lema 3.3.3 en el conjunto convexo [0, y), vemos que
|f −1 (yj+1 ) − f −1 (yj )| ≤
|yj+1 − yj |
m[n(yj+1 )]
y esto implica que
n(yj+1 ) − n(yj ) ≤
|yj+1 − yj |
m[n(yj+1 )]
Inversión Global
42
Ahora, volviendo a la suma de Riemann obtenemos
J−1
X
m(tj+1 )(tj+1 − tj ) =
j=0
J−1
X
m [n(yj+1 )] [n(yj+1 ) − n(yj )]
j=0
≤
J−1
X
|yj+1 − yj | = |yJ |
j=0
< |y|
Por lo tanto esto contradice nuestra suposición que
debe ser en realidad Rn
R∞
0
m(t) dt = ∞. De esto ne sigue que D
Como corolario obtenemos el siguiente resultado
Corolario 3.1.
Supongamos que ∂f (x) es invertible para cada x. Si existe una constante C tal que
//∂f (x)// ≥ C > 0 para cada x, entonces la función f es un homeomorfismo de Rn en
Rn .
Demostración.
Como ∂f (x) es invertible en cada punto x, entonces existe un c > 0 tal que
ı́nf k∂f (x)−1 k−1 ≥ c > 0,
x∈X
luego
sup k∂f (x)−1 k <
x∈X
1
< +∞,
c
por lo tanto
Z
0
+∞
ı́nf k∂f (x)−1 k−1 dt = ∞
kxk=t
Bibliografı́a
[1] D. Azagra, J. Ferrera, F. López-Mesas, Approximate Rolle’s theorems for the proximal
subgradient and the generalized gradient. J. Math. Anal. Appl. 283 (2003) 180-191.
[2] J. M. Ball, Gloval invertibility of Sobolev functions and the interpenetration of
matter. Proc. Royal Soc. Eddinburgh Sect. A88 (1981), 315 - 328.
[3] F. H. Clarke, Y. S. Ledyaev, R. J. Stern, P. R. Wolenski, Nonsmooth Analysis and
Control Theory. Springer-Verlag, GTM. 178 (1998) 69-136.
[4] F. H. Clarke, Optimization and Nonsmooth Analysis Society for Industrial and
Applied Mathematics (SIAM). 1990 25-75
[5] F. H. Clarke, Generalized Gradients and Applications. Transactions of the
american Matematical Society. Vol.205, (1975), 247 - 263.
[6] F. H. Clarke, On the Inverse Function theorem. Pacific Journal of mathematics.
Vol.64, No 1, 1976.
[7] M. Fabian and D. Preiss, On the Clarke’s generalized jacobian. Rend. Circ. Mat.
Palermo (2) Suppl. 14 (1987), 305-307.
[8] D. Gale y H. Nikaido, The Jacobian matrix and Global univalence of mappings. Math.
Ann. 159 (1965), 81 - 93.
[9] O. Gutú, J. A. Jaramillo, Global homeomorphisms and covering projections on metric
spaces. Math. Ann. 338 (2007) 75-95.
[10] J. Hadamard, Sur les transformations ponctuelles. Bull. Soc. Math. France. 34
(1906), 71 - 84.
43
Bibliografı́a
[11] H. Halkin, Interior mapping theorem with set-valued derivatives. J. Analyse Math.
30 (1976), 200 - 207.
[12] H. Halkin, Mathematical programming without differentiability, in “Calculus of
Variations and COntrol Theory”. D. Rusell, Ed., Academic Press, New York (1976).
[13] R. Hermann, Differential Geometry and the Calculus of Variations. Math. in Sci.
and Eng. Vol 49, Academic Press, New York, (1968).
[14] J.-B. Hiriart-Urruty, On necesary optimality conditions in nondifferentiable
programming. Math. Programming. 14, No 1 (1978), 73 - 86.
[15] J.-B. Hiriart-Urruty, Mean valued theorems in nonsmooth analysis. Numer. Funct.
Anal. Optim. 2, (1980), 1 - 30.
[16] F. Jhon, On quasi-isometric mapping, I. Comm. Pure Appl. Math. 21 (1968), 77
- 110.
[17] Y. Kawamura, Invertibility of Lipschitz continuous mappings and applications to
electrical network equations. SIAM J. Math. Anal. 10 No.2 (1979), 235 - 265.
[18] P. Levy, Sur les fonctions des lignes implicités. Bull. Soc. Math France. 48 (1920),
13 - 27.
[19] G. Meyer, On solving nonlinear equations with a one parameter imbedding. SIAM J.
Numer. Anal. 5 (1968), 739 - 752.
[20] B. H. Pourciau, Analysis and optimization of Lipschitz continuous mappings,
J. Optim. Theory. Appl. 22, No. 3 (1977) 311-351.
[21] B. H. Pourciau, Hadamard’s Theorem for Locally Lipschitzian Maps. J. Math.Anal.
Appl. 85 (1982) 279-285.
[22] B. H. Pourciau, Global properties Lipschitzian maps. SIAM J. Math. Anal. 14 (1983)
796-799.
[23] B. H. Pourciau, Global Invertibility of Nonsmooth Mappings. J. Math.Anal. Appl.
131 (1988) 170-179.
[24] M. Radulescu y S. Radulescu, Global inversion theorems and applications to differential
equations. Nonlinear Anal. 4 (1980), 951 - 965.
44
Bibliografı́a
[25] Robert R. Phelps, Convex functions, monotone operators and differentiability,
Lecture Notes in Mathematics, Springer-Verlag. 1364 (1993) 10-11.
45
Descargar