Extremos Relativos

Anuncio
Capı́tulo 12
Extremos Relativos
Una aplicación clásica del Teorema Local de Taylor, que vimos en el capı́tulo
anterior, es el estudio de los extremos relativos de una función escalar. Aunque la analogı́a con el caso de una variable es total, hay algunas diferencias
que surgen de manera natural por el paso a una dimensión superior.
En lo sucesivo trabajaremos con funciones escalares, definidas sobre un
conjunto A ⊂ Rn . Se dirá que una tal función presenta un extremo relativo
o
en un punto a ∈ A, si existe un entorno V de a contenido en A, tal que la
diferencia f (x) − f (a) no cambia de signo cuando x ∈ V :
Máximo Si f (x) − f (a) ≤ 0.
Mı́nimo Si f (x) − f (a) ≥ 0.
Condiciones necesarias de extremo
Cuando f es una función diferenciable se obtiene la siguiente condición necesaria de extremo, totalmente análoga a la de funciones de una variable.
Proposición 12.1 Si f es diferenciable en a y presenta un extremo relativo
en ese punto, entonces Df (a) = 0.
Demostración. Supongamos, para concretar, que f presenta un mı́nimo en
a. Sea entonces h un vector cualquiera y sea δ > 0 tal que para cada
t ∈ [−δ, δ]
f (a + th) − f (a) ≥ 0.
Sea F = f ◦ λ, donde λ es la aplicación de [−δ, δ] en A, λ(t) = a + th.
Entonces F es una aplicación de una variable, derivable en 0 y que presenta
123
124
Extremos Relativos
12.1
un mı́nimo relativo en ese punto. Luego su derivada en 0, F 0 (0) debe ser
igual a 0. Se tiene pues:
0 = F 0 (0) = Df (a) · h.
12.2 Por tanto, el proceso para encontrar los puntos de extremo relativo
para una función diferenciable comienza con el planteamiento del sistema
Df (x) = 0 ⇔
∂f
(x1 , · · · , xn ) = 0, i = 1, 2, · · · , n.
∂xi
Los puntos solución de este sistema de n ecuaciones con n incógnitas se
denominan puntos crı́ticos . Después de la proposición 12.1, una condición
necesaria para que la función f presente un extremo relativo en un punto x
es que x sea un punto crı́tico.
Es bien conocido que para funciones de una variable, una condición necesaria y suficiente para que una función suficientemente derivable presente
un extremo relativo en un punto crı́tico, es que la primera derivada que no se
anule en ese punto (supuesta que hay alguna) sea de orden par. Para funciones de varias variables, las cosas son menos simples y esta condición, aunque
necesaria, no será suficiente para garantizar la existencia de extremo.
Proposición 12.3 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el
o
orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1 y
Dr f (a) 6= 0. Entonces, las siguientes condiciones son necesarias para que f
presente un extremo relativo en el punto a:
1. r sea par.
2. Dr f (a)hr tenga signo constante. Concretamente Dr f (a)hr ≥ 0 para
todo h (≤ 0), si en a hay un mı́nimo (máximo).
Demostración. Sea
ε(h) =
f (a + h) − Pr f (a)h
(ε(0) = 0).
khkr
Entonces
(12.1)
f (a + h) − f (a) −
1 r
D f (a)hr = ε(h) · khkr ,
r!
donde, por el teorema local de Taylor, ε(h) → 0 cuando h → 0.
12.4
Extremos Relativos
125
Supongamos, por ejemplo, que f presenta un mı́nimo en a y sea h un
vector no nulo arbitrario. Existe entonces un número real δ > 0 tal que
f (a + th) − f (a) ≥ 0 si | t |≤ δ.
De la ecuación 12.1 se sigue que para | t |≤ δ
1 r
D f (a) (th)r + ε(th) · khkr ≥ 0
r!
⇒
tr r
D f (a)hr + | t |r ε(th) · khkr ≥ 0,
r!
y dividiendo por | t |r la expresión anterior, se tiene que para | t |≤ δ
µ
¶
1
t r r
(12.2)
D f (a)hr + ε(th) · khkr ≥ 0.
r! | t |
Pasando al lı́mite cuando t → 0+ en 12.2 y teniendo en cuenta que ε(th) →
0 , cuando t → 0, se deduce que
(12.3)
1 r
D f (a)hr ≥ 0 Para todo h ∈ Rn .
r!
Si r fuese impar, lo anterior sólo serı́a posible si Dr f (a)hr = 0, ya que
la condición 12.3 implica también que 0 ≤ Dr f (a)(−h)r = (−1)r Dr f (a).
Entonces, al ser h arbitrario, la aplicación r-lineal Dr f (a) deberı́a ser nula
(ver fórmula 11.4), lo que contradice la hipótesis. Por lo tanto r es par y
Dr f (a)hr ≥ 0.
Nota. Como hemos visto la condición r par de la proposición anterior no es
preciso exigirla de modo explı́cito, ya que se deduce de la condición Dr f (a)
tiene signo constante
Condición suficiente de extremo
Proposición 12.4 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el
o
orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1.
Entonces, una condición suficiente para que f presente un extremo relativo
en a es que Dr f (a)hr > 0 para todo h 6= 0 (mı́nimo) o que Dr f (a)hr <
0 para todo h 6= 0 (máximo)
Demostración. Consideremos la aplicación Φ : h → Dr f (a)hr . Se trata de
una aplicación continua que toma sus valore en R, luego alcanza un mı́nimo
sobre cada compacto, en particular sobre la esfera unidad S . Ası́ pues, existe
algún punto u0 con ku0 k = 1 tal que cualquiera que sea u ∈ S, Dr f (a)ur ≥
126
Extremos Relativos
12.4
Dr f (a)ur0 = λ. La hipótesis de esta proposición implica que el número λ
debe ser estrictamente positivo.
Sea ahora h 6= 0 un vector cualquiera. Entonces
µ
¶
h
h
1
Dr f (a)
,··· ,
≥λ ⇒
Dr f (a)hr ≥ λ
khk
khk
khkr
⇒ Dr f (a)hr ≥ λkhkr .
(12.4)
Veamos ya que en las condiciones de esta proposición la función f presenta un mı́nimo relativo en el punto a.
1 r
D f (a)hr + ε(h)khkr
r!
µ
¶
λ
λ
r
r
≥ khk + ε(h)khk =
+ ε(h) khkr .
r!
r!
f (a + h) − f (a) =
Como ε(h) → 0 cuando h → 0 y λ > 0, de lo anterior se deduce que
f (a + h) − f (a) ≥ 0 para h suficientemente pequeño, luego f presenta un
mı́nimo en a.
Nota. En la proposición anterior puede sustituirse la hipótesis “Dr f (a)hr >
0 para todo h 6= 0 (resp. < 0)” por “r es par y Dr f (a)hr 6= 0 para todo h 6=
0”. Además que r sea par sólo hay que exigirlo en el caso de que f sea una
función de una variable, en cuyo caso la demostración es trivial. Supongamos
que se trabaja en dimensión estrictamente mayor que 1 y que Dr f (a)hr 6= 0
para todo h 6= 0. Consideremos de nuevo la aplicación Φ : h → Dr f (a)hr .
Entonces P = Rn \ {0} es un conjunto conexo y por tanto su imagen por
la aplicación continua Φ, Φ(P ), es un conjunto conexo de R. Este conjunto
conexo, si suponemos que Dr f (a)hr 6= 0 para todo h 6= 0, debe ser un
intervalo que no contenga a 0, lo que sólo es posible si Dr f (a)hr > 0 para
todo h 6= 0 o bien Dr f (a)hr < 0 para todo h 6= 0.
12.5 En resumen, el procedimiento general para la obtención de los puntos
de extremos relativos es el siguiente:
1. Obtención de los Puntos Crı́ticos
∂f
(x1 , · · · , xn ) = 0, i = 1, 2, · · · , n
∂xi
Supongamos que a es un punto crı́tico y la primera derivada de la
función f que no se anula en a es la de orden r, entonces:
12.7
Extremos Relativos
127
2. r impar La función f no tiene extremos en a
3. r par y Dr f (a)hr 6= 0 para todo h 6= 0. La función presenta un
extremo en a:
• Mı́nimo si Dr f (a)hr > 0 para todo h 6= 0.
• Máximo si Dr f (a)hr < 0 para todo h 6= 0.
4. r par, pero existe algún h 6= 0 tal que Dr f (a)hr = 0.
• Dr f (a)hr no tiene signo constante. La función f no tiene extremos en a
• Dr f (a)hr tiene signo constante. Caso Dudoso.
Hessiano
En esta sección vamos a estudiar la existencia de extremos en un punto en
el caso particular de que la primera derivada que no se anule en ese punto
sea la de orden 2, es decir Df (a) = 0 y D2 f (a) 6= 0. Para ello vamos a
apoyarnos en la teorı́a de las formas cuadráticas.
12.6 Una forma cuadrática φ sobre un espacio vectorial E es una aplicación
de E en R que coincide con la restricción a la diagonal de una forma bilineal
simétrica ϕ, es decir para cada x ∈ E
φ(x) = ϕ(x, x).
La forma cuadrática φ se dirá definida si φ(x) 6= 0, para cada x 6= 0 y se
dirá positiva (resp. negativa) si para todo x, φ(x) ≥ 0 (resp. φ(x) ≤ 0).
Como es bien conocido, en dimensión finita, la forma cuadrática φ está
determinada por una matriz cuadrada y simétrica, la matriz (aij ) con aij =
ϕ(ei , ej ), ei = (0, . . . , 1, . . . , 0). Por definición llamaremos Menor Principal
de esta matriz a cada menor cuya diagonal principal esté formada por elementos de la diagonal principal de φ. Denotaremos por ∆i , i = 1, 2, . . . , n al
menor principal de orden i formado con las i primeras filas y las i primeras
columnas.
Los siguientes resultados sobre formas cuadráticas pueden verse en [13]
Proposición 12.7 Para una forma cuadrática φ sobre Rn se tiene:
(i) φ es positiva si y sólo si todos los menores principales de la matriz
asociada son no negativos.
128
Extremos Relativos
12.7
(ii) φ es negativa si y sólo si los menores principales de orden par son no
negativos y los menores principales de orden impar no positivos.
(iii) φ es definida positiva si y sólo si ∆i > 0 para todo i.
(iv) φ es definida negativa si y sólo si (−1)i ∆i > 0 para todo i.
Para aplicar esto al estudio de los extremos relativos, supongamos pues que f
es una función escalar de n variables reales tal que Df (a) = 0 y D2 f (a) 6= 0.
Consideremos entonces la forma cuadrática
X ∂2f
(a)hi hj
φ(h) = D2 f (a)h2 =
∂xi ∂xj
i,j
La matriz asociada a esta particular forma cuadrática se conoce con el nombre de Hessiano de f en a y se trata, obviamente, de la matriz de las derivadas
parciales segundas en a






H(a) = 





∂2f
(a)
∂x21
∂2f
∂x1 ∂x2 (a)
∂2f
∂2f
∂x2 ∂x1 (a)
∂x22
···
(a)
···
···
···
···
∂2f
∂xn ∂x1 (a)
∂2f
∂xn ∂x2 (a)
···
∂2f
∂x1 ∂xn (a)





∂x2 ∂xn (a) 



···



∂2f
(a)
∂x2
∂2f
n
Según veı́amos en las secciones anteriores, en el caso que estamos considerando una condición necesaria de mı́nimo relativo en a es que D2 f (a)h2 ≥ 0
para cada h, es decir que φ sea positiva. Y una condición suficiente que
D2 f (a)h2 > 0 para todo h 6= 0, es decir que φ sea definida positiva. La proposición anterior nos da pues un criterio práctico para reconocer, a partir
del Hessiano, la existencia, en algunos casos, de extremos relativos.
12.8 Cuando f es una función de dos variables, el criterio del Hessiano
tiene mayor alcance, es decir son menos los casos en los este criterio no nos
permite decidir si existe o no un extremo en el punto. Concretamente, sea
z = f (x, y) y (a, b) un punto crı́tico de f . Formemos el Hessiano de f en (a, b)


H(a, b) = 
∂2f
(a, b)
∂x2
∂2f
∂x∂y (a, b)
∂2f
∂x∂y (a, b)
∂2f
(a, b)
∂y 2



12C
Extremos Relativos
129
Entonces, si denotamos por ∆ al determinante de H(a, b), resulta
1. ∆ > 0 ⇒ Extremo: Mı́nimo si ∆1 > 0. Máximo si ∆1 < 0
2. ∆ < 0 ⇒ No hay extremo
3. ∆ = 0 ⇒ Caso Dudoso
Lo anterior se obtiene fácilmente como consecuencia del criterio general:
Si ∆ > 0 es inmediato comprobar que ∆1 6= 0, luego según el criterio del
hessiano, habrá un mı́nimo si ∆1 > 0 y un máximo si ∆1 > 0.
Si ∆ < 0, la forma cuadrática φ no es ni positiva ni negativa, pues tanto
para una cosa como para la otra es preciso que los menores principales de
orden par sean no negativos y ∆ es un menor de orden 2.
Ejercicios
12A Sea f : U ⊂ Rn → R una función r-veces diferenciable en el abierto U (r > 1)
y supongamos que para algún punto a ∈ U se tiene
1. todas las derivadas de orden menor que r se anulan en a;
2. para cada x de alguna bola centrada en a, Dr f (x)hr ≥ 0 para todo h ∈ Rn .
Probar que entonces f presenta un mı́nimo relativo en a.
12B Estudiar la existencia de extremos relativos para las funciones
1. f (x, y) = x4 + y 4 − 2(x − y)2
2. f (x, y) = x3 + y 2 − xy 2
3. f (x, y) = x3 + y 3 − 3x2 y 2 + 1
4. f (x, y, z) = x4 + y 4 − 3x2 y 2 xz
5. f (x, y, z) = 2x4 + 2y 4 + z 4 − 4x2 y 2 z
6. f (x, y) = 2x4 + 3y 4 − 4x2 y 3
7. f (x, y) = x2 y + x2 + 2xy + xy 2 + y 2
8. f (x, y) = x4 + y 4 − xy 3 + 1
9. f (x, y) = x4 + y 4 − xy 4 + 1
10. f (x, y) = y 2 − 3x2 y + 2x4
11. f (x, y) = x3 + 3x2 y − xy 2 + 1
12. f (x, y) = x2 y 2 + xy 4
12C Demostrar que los siguientes enunciados son equivalentes
(a) x2 + y 2 + z 2 ≥ α(xy + xz + yz), para todos x, y, z.
(b) La función f (x, y, z) = x2 + y 2 + z 2 − α(xy + xz + yz), presenta un mı́nimo
relativo en el punto (0, 0, 0).
(c) α ∈ [−2, 1].
130
Extremos Relativos
12D
12D Estudiar la existencia de extremos relativos para las funciones
f (x, y) = sen |xy|,
ax+y 2
0 < x ≤ π/2,
0 < y ≤ π/2.
+ b sen(x + by ) − y 2 .
µ
¶
1
1
f (x1 , . . . , xn ) = x1 x2 · · · xn + an+1
+ ... +
, (a > 0) , x ∈ Ω = (0, ∞)n
x1
xn
X
2
2
f (x1 , . . . , xn ) = (
ai xi )e−(x1 +...+xn )
f (x, y) = e
2
2
12E Demostrar que entre los polı́gonos convexos de n lados inscritos en una circunferencia, el polı́gono regular es el de mayor perı́metro y también el de mayor
área.
12F (T.de Rolle) Sea A un conjunto abierto de Rn de adherencia compacta, y
sea f una función escalar diferenciable en A y continua en Ā. Entonces, si f es
constante sobre la frontera de A existe un punto a ∈ A tal que Df (a) = 0.
Descargar