resolución del problema mcp mediante una función d-gap

Anuncio
RESOLUCIÓN DEL PROBLEMA MCP MEDIANTE UNA
FUNCIÓN D-GAP
Blanco Louro, A., Lema Fernández, Carmen S., Pedreira Andrade, Luis P.
Departamento de Economía Aplicada II. Universidad de A Coruña.
Facultad de CC. Económicas y Empresariales.
Campus da Zapateira s/n. 15071 A Coruña.
Telf. 981167000
Fax 981167070
e-mail: [email protected], [email protected], [email protected]
Resumen
En este trabajo estudiamos un ejemplo de equilibrio en una red de tráfico (MCP).
Estudiado ya por Dirkse y Ferris (1995) y posteriormente por Billups y Murty (2000)
nos ilustra la conexión entre el equilibrio y la complementariedad. En particular el
problema de complementariedad no lineal puede ser reformulado como un problema de
desigualdades variacionales (VIP). Nosotros introducimos un método (Kanzow y
Fukushima (1998)) para resolver el problema de desigualdades variacionales. Este es
básicamente un método Newton globalizado que utiliza, en vez de una función merit
normal para resolver el VIP, una función D-gap. También el algoritmo que se propone
es global y rápidamente local convergente.
Palabras clave: problemas de complementariedad mixta, residuo natural, función
D-gap, método de Newton nonsmooth, convergencia Q-cuadrática, equilibrio.
1. INTRODUCCIÓN
El problema de complementariedad no lineal (NCP), introducida en su tesis doctoral por
Cottle en 1964, se puede plantear como:
encontrar
z ∈ IR n
verificando
z≥0
F(z) ≥ 0
z T F(z) ≥ 0
donde tomamos F:IRn→IRn continuamente diferenciable.
Una generalización de este problema es el de desigualdades variacionales (VIP),
introducido por Hartman y Stampacchia en 1966, con el objetivo de encontrar los
puntos que cumplen la condición necesaria de primer orden de Kuhn-Tucker para
programas de optimización no lineal. El VIP se puede plantear como:
Sea una función F:IRn→IRn continuamente diferenciable y sea K⊆IRn convexo no
vacío,
encontrar
z* ∈ K
verificando ( y − z*) T F(z*) ≥ 0 ∀y ∈ K
y denotarlo por VI(F,K).
Consideremos ahora el problema anterior en un caso especial de conjunto factible,
B=[l,u]={z∈IRn / l≤z≤u}, siendo u y l dos vectores n-dimensionales con componentes
li∈IR∪{-∞} y ui∈IR∪{∞} verificando l<u, donde las desigualdades de vectores las
consideramos componente a componente. En este caso el problema de desigualdades
variacionales se llama problema de complementariedad mixta (MCP).
Además si li=0 y ui=+∞, i=1, ..., n, MCP es equivalente al NCP, esto es, tienen el
mismo conjunto de soluciones.
En este artículo resolvemos un problema MCP que utiliza un tipo especial de función
merit, las D-gap, que serán introducidas en la sección 2. En la sección 3 planteamos el
problema de equilibrio de tráfico cuya algoritmo de resolución presentamos en la
sección 4. Finalizamos el estudio presentando resultados sobre la convergencia de éste.
La obtención de resultados numéricos aplicando este algoritmo a nuestro problema será
objeto de posteriores trabajos de los autores.
2. LAS FUNCIONES D-GAP
Para resolver los problemas planteados es habitual buscar reformulaciones de los
mismos que los conviertan en problemas de optimización o de resolución de sistemas de
ecuaciones vía funciones merit.
Definición.- Una función ψ:IRn→IR se llama función merit para el NCP
(respectivamente, MCP) si cumple las siguientes propiedades:
ψ(x)≥0 ∀x∈IRn
i)
ψ(x)=0 ⇔ x es solución de NCP (respectivamente, MCP)
ii)
Si tenemos definida una función merit para el problema, entonces buscar soluciones se
reduce a resolver el sistema
ψ(x)=0
o el problema de optimización sin restricciones
min ψ(x), x∈IRn
Así mismo, para los problemas de complementariedad mixta se han utilizado funciones
que generalizan las funciones merit, como puede ser la función gap definida por
g(x)= sup{F( x ) T ( x − y)}
y∈B
Claramente g es una función no negativa sobre el conjunto factible B y tal que g(x)=0 si
y sólo si x resuelve el MCP. Ello nos permite reescribir el problema como uno de
optimización con restricciones del siguiente modo
min g(x)
s.a.
x∈B
Sin embargo, la resolución de este problema no resulta sencilla ya que no se pueden
utilizar los teoremas clásicos de optimización al no ser, en general, la función gap
diferenciable. Este inconveniente se subsana definiendo la función gap regularizada
α

2
g α ( x ) = max F( x ) T ( x − y) − x − y 
2

y∈B 
donde α es un parámetro positivo.
Como la expresión entre llaves es una función cuadrática estrictamente cóncava en la
variable y, tiene un único máximo que coincidirá con el punto crítico,
1


y α ( x ) = ∏ B  x − F( x )  ,
α


donde ∏ B ( z) denota la proyección euclídea del vector z sobre el conjunto B. Usando
esto se puede escribir la función gα como
α
2
x − y α (x)
2
gα es también no negativa sobre B y las soluciones del MCP coinciden con los puntos
de B donde se anula. Así el MCP es equivalente al problema de optimización con
restricciones
min gα(x)
s.a.
x∈B
donde la función objetivo es ahora continuamente diferenciable.
Yamashita, Taji y Fukushima (1997), extendiendo una idea de Peng (1997), definen la
función D-gap
g αβ ( x ) = g α ( x ) − g β ( x )
g α ( x ) = F( x ) T ( x − y α ( x )) −
donde 0<α<β, que obviamente es también continuamente diferenciable, pero que tiene
la ventaja de ser una función merit y de permitirnos, por tanto, transformar nuestro
problema en uno de optimización sin restricciones
min gαβ(x)
o en un sistema de ecuaciones
gαβ(x) = 0.
3. PLANTEAMIENTO DE UN PROBLEMA DE EQUILIBRIO
El problema que tratamos de resolver en este trabajo es un ejemplo de equilibrio en una
red de tráfico que ha sido estudiado por Dirkse y Ferris (1995) y más tarde por Billups
y Murty (2000). Involucra a cinco ciudades conectadas por una red de carreteras de un
solo sentido (ver la figura).
1
2
5
3
4
Observemos en el dibujo que hay cuatro tipos de enlaces:
(a) Autopistas
(b) Carreteras de circunvalación
(c) Accesos a la ciudad
(d) Salidas de la ciudad
Cada ciudad i ha de enviar una cantidad di de mercancía a la tercera ciudad si nos
movemos en el sentido contrario a las agujas del reloj, es decir, a la ciudad i+3 módulo
5. Los posibles trayectos para hacerlo son únicamente dos: por el camino interior o por
el exterior.
El objetivo es enviar las mercancías en el menor tiempo posible, teniendo en cuenta que
el tiempo de viaje por un camino dado viene determinado por el flujo total de trafico en
los enlaces que se recorren.
Denotamos por xi la cantidad de mercancía enviada desde al ciudad i a la ciudad i+3
módulo 5 por el camino exterior y denotamos por yi la cantidad enviada por el camino
interior. Entonces, claramente, los vectores x=(xi) e y=(yi) determinan los flujos a través
de los caminos. Así, por ejemplo, el flujo de tráfico por la circunvalación exterior de la
ciudad 4 se corresponde con la suma de los flujos exteriores que han de pasar por esta
ciudad pero que no la tienen como destino u origen, esto es, x2+x3.
Diremos que un conjunto de flujos x, y es factible si satisface la demanda d=(di), es
decir, si x+y≥d, x,y≥0.
Denotaremos por Oi el retraso ocasionado por el envío de mercancías por el camino
exterior desde la ciudad i, que obviamente depende de todo el flujo por las vías
exteriores y por tanto de x. Análogamente Ii denota retraso ocasionado por el envío de
mercancías por el camino interior desde la ciudad i. De este modo tenemos definidas
dos funciones O(x) = (Oi(x)) y I(y) = (Ii(y)).
El retraso en cada tipo de enlace depende, evidentemente, del flujo por la propia vía,
pero además a veces influye el flujo por carreteras cercanas. En todo caso la demora por
una vía viene dada en términos de una función convexa g y de un parámetro positivo γ
por:
(a)
Autopista: 10 g(flujo de la vía) + 2 γ g(flujo de salida de la vía)
(b)
Carreteras de circunvalación: g(flujo de la vía)
(c)
(d)
Acceso a la ciudad: g(flujo de la vía)
Salida de la ciudad: g(flujo de la vía) + γ g(flujo por la circunvalación
correspondiente)
Por supuesto que estamos suponiendo que aquellos trayectos que no tienen por destino
una ciudad la circunvalan en lugar de entrar en ella. Siguiendo a Dirkse y Ferris (1995)
tomaremos g(x) = 1+x+x2.
Definimos el retraso efectivo entre dos ciudades como el mayor retraso con flujo no
nulo entre las dos ciudades. Cada población elige su estrategia de transporte con el
objetivo de minimizar el retraso efectivo, suponiendo que las estrategias de transporte
del resto de las ciudades no varían. Este mínimo se alcanza siempre cuando se envía
toda la mercancía por el camino con menor retraso, o cuando los dos posibles trayectos
para el transporte tienen el mismo retraso. Para ver esto hemos de darnos cuenta de que
si el retraso por el camino interior es menor que por el exterior y la cantidad de
mercancía enviada por el exterior no es nula, el transportista puede mejorar el retraso
efectivo enviando más cantidad por el camino interior. De este modo se reduce también
el flujo a través del camino exterior, y por tanto el retraso efectivo, y podríamos
concluir que ésta no era una estrategia óptima.
Por tanto un modelo de equilibrio de tráfico surge cuando las cinco ciudades están
cumpliendo la estrategia óptima suponiendo que la de las demás permanezca constante.
De la discusión anterior se deduce que el problema viene dado por las siguientes
condiciones de complementariedad:
u-O(x)≥0
x ≥0
xT (u-O(x)) =0
u-I(y)≥0
y ≥0
yT (u-I(y)) =0
x+y-d≥0
u ≥0
uT (x+y-d) =0
en las que hemos introducido una variable adicional u∈IR5 que representa el retraso
efectivo.
Es decir, nuestro problema lo podemos plantear como un NCP considerando la función
 x   u − O( x ) 
  

G  y  =  u − I( y ) 
u x + y − d
  

Si consideramos además que la demanda no puede excederse, es decir, x+y=d el
problema se puede reformular como uno de desigualdades variacionales VI(T,X), donde
 x   O( x ) 

G  = 
 y   I( y) 
 x 

y donde X=   / x + y = d, x ≥ 0, y ≥ 0 .
 y 

Obsérvese que con el primer planteamiento el número de variables es 15, cantidad que
se ha reducido a 10 en el segundo. Podemos, sin embargo, considerar una formulación
más compacta percatándonos de que si B={z∈IR5 / 0≤z≤d} entonces, X={a+Az / z∈B}
0
 I 
siendo a =   y A =   .
d
− I
Expresando VI(T,X) en términos de z, tenemos la condición
T(a+Az*)T [(a+Az)- (a+Az*)] = [AT T(a+Az*)]T (z-z*) ≥ 0 ∀z∈B.
Entonces para
F(z) = AT T(a+Az) = O(z)-I(d-z),
VI(T,X) es equivalente a VI(F,B), que es el MCP de 5 variables que trataremos de
resolver.
4. ALGORITMO DE RESOLUCIÓN
Una conocida reformulación del MCP es la resolución del sistema de ecuaciones no
lineales
r(x)=0
(1)
n
n
donde r:IR → IR , es la función residuo natural del MCP:
r(x)= x − ∏ B ( x − F( x )) .
Resolveremos este sistema para solucionar el problema de equilibrio. Para esto,
usaremos la variante del método de Newton nonsmooth propuesta por Kanzow y
Fukushima (1998), que usa la función D-gap como control de convergencia.
Debido a la especial estructura del conjunto B=[0,d] la i-ésima componente del residuo
natural es
ri(z) = zi – mid{0,di,zi-Fi(z)}
= mid{zi, zi-di, Fi(z)}
donde mid denota la mediana del conjunto.
Como F(z)=O(z)-I(d-z) es polinómica, y por tanto continuamente diferenciable, el
residuo es piecewise smooth. Así la B-subdiferencial (Qi (1993))
∂ B r (z) = {H ∈ M n / ∃z k tal que z = lim z k , ∃JF(z k ) ∀ k y H = lim JF(z k )} ,
k →∞
k →∞
(donde JF denota la matriz jacobiana de F) y la jacobiana generalizada de Clarke
∂r (z) = conv{∂ B r (z)} ,
(donde por conv entendemos la envolvente convexa del conjunto) están bien definidas.
Además r es semismooth, i.e., existe
lim
Hd'
H∈∂r ( z + td ')
d '→ d , t → 0 +
para cada x,d∈IRn. Como además JF es localmente lipschitziana podemos afirmar que
el residuo natural r es fuertemente semismooth (Kanzow y Fukushima (1998)).
El algoritmo propuesto para resolver el sistema de ecuaciones fuertemente semismooth
(1) toma como dirección de Newton una solución, si existe, de la ecuación lineal
H k d = -r(zk )
(2)
k
donde Hk es un elemento arbitrario de ∂Br(z ). Esta ecuación la podemos escribir de un
modo más sencillo si nos fijamos en la estructura que, en esta situación particular,
tienen los elementos de la B-subdiferencial.
Sea H un elemento de ∂Br(z) y sea Hi· la i-ésima fila de H. Obviamente, si tomamos
α = α(z) = {i/0<zi-Fi(z)<di}
β = β(z) = {i/zi-Fi(z)=0 o zi-Fi(z)=di}
γ = γ(z) = {i / zi-Fi(z)<0 o zi-Fi(z)>di}
entonces
Hi·= ∇Fi(z)T
si i∈α
Hi·= ∇Fi(z)T o Hi·= eiT
si i∈β
T
Hi·= ei
si i∈γ
Por tanto H es de la forma
 JF(z) α ∪ δ, α ∪ δ JF(z) α ∪ δ, δ ∪ γ 

H= 
 0 δ ∪ γ, α ∪ δ
I δ ∪ γ, δ ∪ γ 


donde ∅⊆δ⊆β y δ =β\δ. Así el sistema de ecuaciones (2) se puede escribir de forma
más explícita como
JF(z k ) α ∪ δ, α ∪ δ d α ∪ δ
dδ∪γ
= − rα ∪ δ (z k ) + JF(z k ) α ∪ δ, δ ∪ γ r δ ∪ γ (z k )
=
− r δ ∪ γ (z k )
Algoritmo 1 (Kanzow y Fukushima (1998))
Paso 0 Escoger x0∈IRn, 0<α<1<β, ρ>0, λ,η∈(0,1),σ∈(0,1/2), p>1, ε>0
Sea k=0
Paso 1 (control de convergencia)
Si ∇g αβ (z k ) ≤ ε , STOP.
Paso 2 Seleccionar un elemento Hk∈∂Br(zk)
Paso 3 (búsqueda de la dirección de Newton)
Resolver la ecuación de newton Hkd=-r(zk)
Si tiene solución le llamamos dk
En otro caso dk= - ∇g αβ (z k ) . GO TO Paso 6
Paso 4 Si g αβ (z k + d k ) ≤ η g αβ (z k ) entonces tk=1 GO TO Paso 7
Paso 5 (condición de descenso)
Si dk no verifica ∇g αβ (z k ) T d k ≤ −ρ d k
p
entonces dk=- ∇g αβ (z k )
Paso 6 (longitud del paso)
Sea t k = max {λn / g αβ (z k + t k d k ) ≤ g αβ (z k ) + σ t k ∇g αβ (z k ) T d k }
n = 0,1,...
Paso 7 zk+1=zk+tkdk
k=k+1
GO TO Paso 1
5. ANALISIS DE CONVERGENCIA
En este apartado presentamos algunos resultados sobre las propiedades de convergencia
del algoritmo.
Teorema 2.- (Kanzow y Fukushima (1998)) Todo punto de acumulación de la sucesión
generada por el algoritmo anterior es un punto estacionario de la función D-gap gαβ.
En Kanzow y Fukushima (1998) se asegura además que este punto estacionario z* de
gαβ es la única solución del MCP, siempre que la matriz jacobiana JF(z*) sea una Pmatriz. Esta condición no es válida para nuestro problema de equilibrio, por lo que en
trabajos posteriores trataremos de encontrar una condición aplicable a nuestro problema
que nos garantice las mismas conclusiones.
Bajo ciertas condiciones que definimos a continuación vamos a ver que la convergencia
del algoritmo es Q-cuadrática.
Definición.- Diremos que una solución z* del MCP es b-regular si las submatrices
JF (z*) α ∪ δ, α ∪ δ
son no singulares para todos los conjuntos ∅⊆δ⊆β.
Obsérvese que si z* es una solución b-regular del MCP entonces todos los elementos de
la B-subdiferencial son no singulares.
El resultado anunciado sobre velocidad de convergencia del Algoritmo 1 se obtiene
usando la observación anterior, el Teorema 2, la lipschitzianidad local de la matriz
jacobiana JF y la relación entre el crecimiento de la función D-gap y del residuo natural
que viene dada por la proposición siguiente.
Proposición 3.- (Kanzow y Fukushima (1998)) Sean 0<α<1<β. Existen entonces
constantes c1>0 y c2>0 tales que
c1 r (z)
2
≤ g αβ (z) ≤ c 2 r (z)
2
∀z∈IRn.
Teorema 4.- (Kanzow y Fukushima (1998))
Sea {zk} una sucesión generada por el algoritmo. Supongamos que z* es un punto de
acumulación de {zk} tal que z* es una solución b-regular del MCP. Entonces:
i)
ii)
iii)
iv)
lim z k = z*
k →∞
La dirección de Newton dk es, para casi todo k, la solución de la ecuación
(2).
El test del Paso 4 es casi siempre afirmativo, y así tk=1 para todo k
suficientemente grande.
La convergencia de la sucesión es Q-cuadrática.
El principal problema del Algoritmo 1 es el gran número de evaluaciones que se
necesitan en el cálculo de la longitud del paso. Sin embargo el teorema anterior, además
de aportarnos información sobre la velocidad de convergencia, asegura que el Paso 6
hay que realizarlo solamente en un número limitado de iteraciones, lo que aminora el
inconveniente.
Referencias
Billups, S.C. y Murty, K.G. (2000). Complementarity problems. Journal of
Computational and Applied Mathematics, 124, pp 303-318.
Dirkse, S.P. y Ferris, M.C. (1995) MCPLIB: A Collection of Nonlinear Mixed
Complementarity Problems. Optimization Methods and Software, 5, pp 319-345.
Kanzow, C. y Fukushima, M. (1998). Solving box constrained variational inequalities
by using the natural residual with D-gap function globalization. Operations Research
Letters, 23, pp 45-51.
Peng, J.M. (1997). Equivalence of variational inequality problems to unconstrained
minimization. Mathematical Programming, 78, pp 347-355.
Qi, L. (1993). Convergence analysis of some algorithms for solving nonsmooth
equations. Mathematics of Operations Research, 18, pp 227-244.
Yamashita, N.; Taji, K. y Fukushima, K. (1997). Unconstrained optimization
reformulations of variational inequality problems. Journal of Optimization Theory and
Applications, 92, pp 439-456.
Descargar