en otra ventana

Anuncio
Capítulo 2
Marco Teórico
En este capítulo encontraremos las deniciones y notaciones que usaremos a lo largo de
la tesis, así como también algunos lemas y teoremas que nos serán de gran ayuda.
2.1 Deniciones y Conceptos Básicos
A continuación presentaremos la denición de conjunto factible esencial para el resto
de la tesis.
Denición 2.1.
Sea
M = {x ∈ Rn | hi (x) = 0, i ∈ I = {1, . . . , m} ,
gj (x) ≥ 0, j ∈ J = {1, . . . , p}}
donde hi , gj ∈ C 1 (Rn , R), i ∈ I , j ∈ J . A M se le conoce como conjunto factible,
a las funciones hi se les llama restricciones igualdad (o ecuaciones) y a las funciones
gj , restricciones desigualdad. Cuando hablemos de restricciones, estaremos hablando
indistintamente de las restricciones de igualdad o desigualdad.
Cabe mencionar que es posible que el problema sólo tenga restricciones desigualdad,
es decir m = 0, o viceversa (p = 0).
6
CAPÍTULO 2.
7
MARCO TEÓRICO
A continuación veremos algunas deniciones que nos ayudarán a comprender la
teoría básica de la optimización no lineal.
Denición 2.2.
El problema (P ) se expresa de la siguiente manera:
(P ) mı́n {f (x) | x ∈ M }
Al punto x ∈ M se le conoce como punto factible.
A f se le llama función objetivo, es decir, la función que se busca minimizar.
Usualmente se habla de minimizar y no de maximizar. Claramente maximizar f
puede obtenerse de minimizar −f .
Denición 2.3.
Sea M como en la Denición 2.1. A x̄ ∈ M se le llama mínimo local
del problema (P ), si existe una vecindad U(x̄) de x̄ tal que f (x̄) ≤ f (x) para toda
x ∈ U(x̄) ∩ M .
Denición 2.4.
Un punto x̄ ∈ M es mínimo global del problema (P ), si f (x̄) ≤ f (x)
para toda x ∈ M .
Denición 2.5.
Sea x̄ mínimo local del problema (P ). Una restricción desigualdad se
dice que es activa cuando cumple la igualdad. Denotemos J0 (x̄) = {j ∈ J | gj (x̄) = 0}.
A J0 (x̄) se le llama conjunto de índices activos de x̄.
n
Ejemplo 2.1. En este ejemplo consideremos M = x = xx12 ∈ R2 | g1 (x) = x31 + x2 ≥
o
3
0, g2 (x) = −x1 + x2 ≥ 0 y f (x) = x1 2 + x2 , entonces el problema (P ) de minimizar
f (x) sujeto a x ∈ M se escribe como:
(P ) mı́n {f (x) | x ∈ M } .
Si x =
0
0
0
, entonces g1 y g2 son activas, y por lo tanto J0 (x ) = {1, 2}. En x =
0
1
1
1
CAPÍTULO 2.
8
MARCO TEÓRICO
Figura 2.1: La región sombreada es el conjunto factible M .
sólo g2 es activa y J0 (x ) = {2}. Finalmente, en x =
1
2
0
1
, ninguna restricción es activa,
y por lo tanto J0 (x2 ) = ∅ (Véase Figura 2.1).
Además x̄ = 00 es mínimo local y global del problema (P ).
Denición 2.6.
Sean u ∈ Rm , v ∈ Rp . La función Lagrangiana asociada al problema
(P ) se dene de la siguiente manera:
L(x, u, v) = f (x) −
X
i∈I
ui hi (x) −
X
vj gj (x)
j∈J
y sean Dx L(x, u, v) y Dxx L(x, u, v) las derivadas parciales de primer y segundo orden
de L con respecto a x, respectivamente.
Esta función es importante ya que en base a ella podemos establecer cómo encontrar
mínimos locales del problema (P ).
Al problema (P ) se le conoce como problema de programación (u optimización) no
lineal si alguna de las restricciones que hemos establecido o la función objetivo son
funciones no lineales. A lo largo de esta tesis consideraremos que (P ) es un problema
de optimización no lineal.
CAPÍTULO 2.
9
MARCO TEÓRICO
El conjunto factible M puede poseer ciertas propiedades o cualidades locales, es
decir, que dichas cualidades se cumplen para cierto punto factible. En la literatura
encontraremos una gran variedad de este tipo de cualidades, las cuales son llamadas
constraint qualications. En esta tesis, nos enfocaremos principalmente en dos de ellas:
Linear Independence constraint qualication (LICQ) y Mangasarian-Fromovitz constraint qualication (M F CQ).
Antes de explicar estos dos conceptos ((LICQ) y (M F CQ)), se dará una denición
que ayudará al lector a comprenderlos mejor.
Denición 2.7.
Sean x1 , x2 , . . ., xm ∈ Rn . Se dice que x1 , x2 , . . . , xm son linealmente
independientes si la ecuación:
m
X
(2.1)
αi xi = 0n
i=1
tiene como única solución α1 = α2 = . . . = αm = 0, donde 0n = (0, 0, . . . , 0)T (0n
representa el origen de Rn ). Por otro lado, si no son linealmente independientes, son lim
X
nealmente dependientes, esto es, que existen αi , i = 1, . . . , m,
|αi | > 0 que resuelven
i=1
la ecuación (2.1).
Ahora ya podemos denir, en términos de independencia lineal, los conceptos de
(M F CQ) y (LICQ).
Denición 2.8.
Se dice que (LICQ) se cumple en x̄ ∈ M si y sólo si los gradientes
Dhi (x̄), Dgj (x̄), i ∈ I , j ∈ J0 (x̄) son linealmente independientes.
Denición 2.9.
Se dice que (M F CQ) se cumple en x̄ ∈ M si y sólo si:
i) Dhi (x̄), i ∈ I son linealmente independientes.
ii) Existe un vector z ∈ Rn tal que:
Dhi (x̄)z = 0, i ∈ I
Dgj (x̄)z > 0, j ∈ J0 (x̄).
CAPÍTULO 2.
10
MARCO TEÓRICO
A tal vector z ∈ M que cumple con las condiciones anteriores, le llamaremos MF-vector
en x̄.
A continuación se presenta un lema que será de gran apoyo de aquí en adelante.
Lema 2.1 ([4], Teorema 10.4.7). Dados los vectores ai , bj , ck ∈ Rn , con i = 1, . . . , ma ,
j = 1, . . . , mb y k = 1, . . . , mc . Una y sólo una de las siguientes armaciones se cumple:
1. El sistema
ξ T ai < 0, i = 1, . . . , ma , ma ≥ 1
ξ T bj ≤ 0, j = 1, . . . , mb ,
ξ T ck = 0, k = 1, . . . , mc .
es soluble con ξ ∈ Rn .
2. Existen números reales αi ≥ 0, i = 1, . . . , ma , βj ≥ 0, j = 1, . . . , mb , y γk , k =
1, . . . , mc , tales que:
ma
X
i
αi a +
i=1
con
mb
X
j
βj b +
j=1
ma
X
mc
X
γk ck = 0
k=1
αi > 0.
i=1
Enseguida se presenta un teorema que relaciona (LICQ) y (M F CQ), en cuya demostración se utiliza el lema anterior.
Teorema 2.1. Sea x̄ ∈ M . Si (LICQ) se cumple en x̄, entonces (M F CQ) se cumple
en x̄.
Demostración. Si (LICQ) se cumple en x̄, entonces los vectores Dhi (x̄), Dgj (x̄), i ∈
I, j ∈ J0 (x̄) son linealmente independientes. Veamos que entonces Dhi (x̄), i ∈ I deben
ser linealmente independientes.
CAPÍTULO 2.
11
MARCO TEÓRICO
Si fueran linealmente dependientes, existirían αi ∈ R, i ∈ I donde no todos son
ceros, de tal manera que:
X
αi Dhi (x̄) = 0
i∈I
y por lo tanto
X
X
αi Dhi (x̄) +
i∈I
0 · Dgj (x̄) = 0
j∈J0 (x̄)
lo cual indicaría que Dhi (x̄), Dgj (x̄), i ∈ I , j ∈ J0 (x̄) son linealmente dependientes,
contradiciendo el supuesto inicial.
Entonces Dhi (x̄), i ∈ I son linealmente independientes, y se cumple i) de la Denición 2.9.
Antes de seguir con la demostración, veamos lo siguiente:
Sean wk ∈ Rn , k = 1, . . . , mw vectores linealmente independientes, entonces también lo son los vectores −wk , k = 1, . . . , mw , ya que de lo contrario existirían números
reales ck , k = 1, . . . , mw no todos cero tales que:
mw
X
ck (−wk ) = 0
k=1
y cambiando de lugar el signo, obtenemos
mw
X
−ck wk = 0
k=1
lo cual indicaría que los vectores wk , k = 1, . . . , mw son linealmente dependientes,
llegando a una contradicción.
Sigamos con la demostración.
Sabemos que al ser Dhi (x̄), Dgj (x̄), i ∈ I , j ∈ J0 (x̄) vectores linealmente independientes, también lo son −Dhi (x̄), −Dgj (x̄), i ∈ I , j ∈ J0 (x̄) por lo anterior; por lo tanto
no se puede dar el caso de que existan números reales αj ≥ 0, j ∈ J0 (x̄), βi , i ∈ I con:
X
j∈J0 (x̄)
αj > 0
CAPÍTULO 2.
12
MARCO TEÓRICO
de modo que:
X
αj (−Dgj (x̄)) +
X
βi (−Dhi (x̄)) = 0.
i∈I
j∈J0 (x̄)
Por el Lema 2.1 el sistema
−Dhi (x̄)ξ = 0, i ∈ I
−Dgj (x̄)ξ < 0, j ∈ J0 (x̄)
tiene solución con ξ ∈ Rn . Multiplicando ambos lados de las expresiones anteriores por
menos uno, tenemos que el sistema:
Dhi (x̄)ξ = 0, i ∈ I
Dgj (x̄)ξ > 0, j ∈ J0 (x̄)
es soluble con ξ ∈ Rn cumpliéndose así la parte ii) de la Denición 2.9.
Por lo tanto, si (LICQ) se cumple en x̄, entonces (M F CQ) se cumple en x̄.
Ejemplo 2.2.
Donde se cumplen (M F CQ) y (LICQ) en x̄.
n
o
x1
n
4
Consideremos M = x = x2 ∈ R | g1 (x) = x1 − x2 ≥ 0, g2 (x) = −x1 + x2 ≥ 0
y x̄ = 00 .
Figura 2.2: (LICQ) y (M F CQ) se cumplen en x̄ =
0
0
.
CAPÍTULO 2.
13
MARCO TEÓRICO
Como ambas restricciones son activas en x̄, entonces J0 (x̄) = {1, 2}. Los gradientes
de g1 y g2 son:
Dg1 (x) = (1, −1)
Dg2 (x) = (−4x31 , 1)
y evaluados en x̄ tenemos
Dg1 (x̄) = (1, −1)
Dg2 (x̄) = (0, 1)
además existe z =
1
1
2
tal que:
Dg1 (x)z = (1, −1) 11 = 12 > 0
2
Dg2 (x)z = (0, 1) 11 = 21 > 0,
2
por lo tanto se cumple (M F CQ) en x̄.
Veamos que también se cumple (LICQ) en x̄. Para esto consideremos
α1 Dg1 (x̄) + α2 Dg2 (x̄) = (0, 0),
y resolviendo el sistema de ecuaciones llegamos a que la única solución es α1 = 0 y
α2 = 0, entonces Dg1 (x̄) y Dg2 (x̄) son linealmente independientes y por lo tanto se
cumple (LICQ) en x̄.
Ejemplo 2.3.
Donde se cumple (M F CQ) y no se cumple (LICQ) en x̄.
n
o
x1
2
3
3
Sean M = x = x2 ∈ R | g1 (x) = x1 + x2 ≥ 0, g2 (x) = −x1 + x2 ≥ 0 y
x̄ = 00 .
Notemos que J0 (x̄) = {1, 2}. Las derivadas de g1 , g2 son:
Dg1 (x) = (3x21 , 1)
Dg2 (x) = (−3x21 , 1)
y evaluadas en x̄:
Dg1 (x̄) = (0, 1)
Dg2 (x̄) = (0, 1)
CAPÍTULO 2.
14
MARCO TEÓRICO
Figura 2.3: Sólo (M F CQ) se cumple en x̄ =
por lo tanto existe z =
0
1
0
0
con Dj (x̄)z = (0, 1) 01 = 1 > 0, j ∈ J0 (x̄) = {1, 2}, y por
esto se cumple (M F CQ) en x̄. Sin embargo, si resolvemos la ecuación
α1 Dg1 (x̄) + α2 Dg2 (x̄) = (0, 0),
entonces existen innitas soluciones, en particular α1 = 1 y α2 = −1 resuelven la
ecuación, entonces Dg1 (x̄) y Dg2 (x̄) no son linealmente independientes, por lo que no
se cumple (LICQ) en x̄.
Ejemplo 2.4.
Donde no se cumplen (M F CQ) ni (LICQ) en x̄.
n
o
Sean M = x = xx12 ∈ R2 | g1 (x) = −x21 +4x1 −x22 ≥ 0, g1 (x) = x21 −2x1 +x22 ≥ 0
y x̄ = 00 .
Las derivadas de g1 y g2 son:
Dg1 (x) = (−2x1 + 4, −2x2 )
Dg2 (x) = (2x1 − 2, 2x2 )
y evaluadas en x̄:
Dg1 (x̄) = (4, 0)
Dg2 (x̄) = (−2, 0)
CAPÍTULO 2.
15
MARCO TEÓRICO
Figura 2.4: Ni (LICQ) ni (M F CQ) se cumplen en x̄ =
0
0
por lo tanto no existe z ∈ R2 con Dj (x̄)z > 0, j ∈ J0 (x̄) = {1, 2}, y entonces no se
cumple (M F CQ) en x̄. Tampoco se cumple (LICQ) en x̄ ya que si α1 = 1 y α2 = 2
entonces se resuelve la ecuación
α1 Dg1 (x̄) + α2 Dg2 (x̄) = (0, 0).
Cabe recalcar que por el Teorema 2.1 tenemos que si (LICQ) se cumple en x̄,
entonces también se cumple (M F CQ) en x̄, pero el recíproco no se cumple, pues el
ejemplo 2.3 nos sirve de contraejemplo.
2.2 Teoremas de Necesidad y Suciencia de Primer y
Segundo Orden
En esta sección daremos a conocer los teoremas que relacionan x̄ ∈ M como mínimo
local del problema (P ).
Teorema 2.2 (([3], Teorema 1) Condición necesaria de optimalidad de primer orden).
Si x̄ es un mínimo local del problema (P ), entonces existen coecientes reales α ≥
CAPÍTULO 2.
16
MARCO TEÓRICO
0, λi , µj ≥ 0, i ∈ I, j ∈ J0 (x̄), no todos cero, tales que:
αDf (x̄) −
X
λi hi (x̄) −
i∈I
X
µj gj (x̄) = 0
j∈J
Hagamos ahora una combinación entre (M F CQ) y la condición necesaria de primer
orden.
Teorema 2.3
([2], Teorema 2). Sea x̄ mínimo local del problema (P ). Si (M F CQ) se
cumple en x̄, entonces existen reales λi , i ∈ I y µj ≥ 0, j ∈ J0 (x̄) tales que:
Df (x̄) −
X
λi Dhi (x̄) −
i∈I
X
µj Dgj (x̄) = 0.
j∈J0 (x̄)
Por el momento hemos establecido la condición necesaria para que x̄ sea mínimo
local del problema (P ), en donde se pide que todas las funciones en el problema (P )
pertenezcan a C 1 (Rn , R). La condición suciente que veremos a continuación, exige un
poco más, ya que considera las derivadas de segundo orden de dichas funciones.
Teorema 2.4 ([3], Teorema 4) Condición suciente de optimalidad de segundo orden).
Supongamos f , hi , gj ∈ C 2 (Rn , R), i ∈ I , j ∈ J .
Si existen vectores λ̄ ∈ Rm y µ̄ ∈ Rp tales que (x̄, λ̄, µ̄) cumplan:
I)
hi (x̄) = 0, i ∈ I,
(2.2)
gj (x̄) ≥ 0, j ∈ J,
(2.3)
µ̄j gj (x̄) = 0, j ∈ J,
(2.4)
µ̄j ≥ 0, j ∈ J,
(2.5)
Dx L(x̄, λ̄, µ̄) = 0.
(2.6)
II) y que para cada z ∈ Rn r {0n } con:
CAPÍTULO 2.
MARCO TEÓRICO
17
i) Dhi (x̄)z = 0, i ∈ I ,
ii) Dgj (x̄)z = 0, j ∈ B(x̄, µ̄) := {j ∈ J | µ̄j > 0} y
iii) Dgj (x̄)z ≥ 0, j ∈ J0 (x̄) r B(x̄, µ̄),
tenemos que:
h
i
2
z T Dxx
L(x̄, λ̄, µ̄) z > 0.
(2.7)
Entonces x̄ es un mínimo local del problema (P ).
En este capítulo hemos denido el típico problema de optimización no lineal así
como las herramientas que nos ayudarán a saber si algún punto x̄ es o no un mínimo
local de dicho problema.
En el siguiente capítulo perturbaremos la condición suciente de segundo orden y,
en base a ello, deniremos las funciones que usaremos para resolver el problema de
minimización.
Descargar