Capı́tulo 12 Extremos Relativos Una aplicación clásica del Teorema Local de Taylor, que vimos en el capı́tulo anterior, es el estudio de los extremos relativos de una función escalar. Aunque la analogı́a con el caso de una variable es total, hay algunas diferencias que surgen de manera natural por el paso a una dimensión superior. En lo sucesivo trabajaremos con funciones escalares, definidas sobre un conjunto A ⊂ Rn . Se dirá que una tal función presenta un extremo relativo o en un punto a ∈ A, si existe un entorno V de a contenido en A, tal que la diferencia f (x) − f (a) no cambia de signo cuando x ∈ V : Máximo Si f (x) − f (a) ≤ 0. Mı́nimo Si f (x) − f (a) ≥ 0. Condiciones necesarias de extremo Cuando f es una función diferenciable se obtiene la siguiente condición necesaria de extremo, totalmente análoga a la de funciones de una variable. Proposición 12.1 Si f es diferenciable en a y presenta un extremo relativo en ese punto, entonces Df (a) = 0. Demostración. Supongamos, para concretar, que f presenta un mı́nimo en a. Sea entonces h un vector cualquiera y sea δ > 0 tal que para cada t ∈ [−δ, δ] f (a + th) − f (a) ≥ 0. Sea F = f ◦ λ, donde λ es la aplicación de [−δ, δ] en A, λ(t) = a + th. Entonces F es una aplicación de una variable, derivable en 0 y que presenta 123 124 Extremos Relativos 12.1 un mı́nimo relativo en ese punto. Luego su derivada en 0, F 0 (0) debe ser igual a 0. Se tiene pues: 0 = F 0 (0) = Df (a) · h. 12.2 Por tanto, el proceso para encontrar los puntos de extremo relativo para una función diferenciable comienza con el planteamiento del sistema Df (x) = 0 ⇔ ∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n. ∂xi Los puntos solución de este sistema de n ecuaciones con n incógnitas se denominan puntos crı́ticos . Después de la proposición 12.1, una condición necesaria para que la función f presente un extremo relativo en un punto x es que x sea un punto crı́tico. Es bien conocido que para funciones de una variable, una condición necesaria y suficiente para que una función suficientemente derivable presente un extremo relativo en un punto crı́tico, es que la primera derivada que no se anule en ese punto (supuesta que hay alguna) sea de orden par. Para funciones de varias variables, las cosas son menos simples y esta condición, aunque necesaria, no será suficiente para garantizar la existencia de extremo. Proposición 12.3 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1 y Dr f (a) 6= 0. Entonces, las siguientes condiciones son necesarias para que f presente un extremo relativo en el punto a: 1. r sea par. 2. Dr f (a)hr tenga signo constante. Concretamente Dr f (a)hr ≥ 0 para todo h (≤ 0), si en a hay un mı́nimo (máximo). Demostración. Sea ε(h) = f (a + h) − Pr f (a)h (ε(0) = 0). khkr Entonces (12.1) f (a + h) − f (a) − 1 r D f (a)hr = ε(h) · khkr , r! donde, por el teorema local de Taylor, ε(h) → 0 cuando h → 0. 12.4 Extremos Relativos 125 Supongamos, por ejemplo, que f presenta un mı́nimo en a y sea h un vector no nulo arbitrario. Existe entonces un número real δ > 0 tal que f (a + th) − f (a) ≥ 0 si | t |≤ δ. De la ecuación 12.1 se sigue que para | t |≤ δ 1 r D f (a) (th)r + ε(th) · khkr ≥ 0 r! ⇒ tr r D f (a)hr + | t |r ε(th) · khkr ≥ 0, r! y dividiendo por | t |r la expresión anterior, se tiene que para | t |≤ δ µ ¶ 1 t r r (12.2) D f (a)hr + ε(th) · khkr ≥ 0. r! | t | Pasando al lı́mite cuando t → 0+ en 12.2 y teniendo en cuenta que ε(th) → 0 , cuando t → 0, se deduce que (12.3) 1 r D f (a)hr ≥ 0 Para todo h ∈ Rn . r! Si r fuese impar, lo anterior sólo serı́a posible si Dr f (a)hr = 0, ya que la condición 12.3 implica también que 0 ≤ Dr f (a)(−h)r = (−1)r Dr f (a). Entonces, al ser h arbitrario, la aplicación r-lineal Dr f (a) deberı́a ser nula (ver fórmula 11.4), lo que contradice la hipótesis. Por lo tanto r es par y Dr f (a)hr ≥ 0. Nota. Como hemos visto la condición r par de la proposición anterior no es preciso exigirla de modo explı́cito, ya que se deduce de la condición Dr f (a) tiene signo constante Condición suficiente de extremo Proposición 12.4 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1. Entonces, una condición suficiente para que f presente un extremo relativo en a es que Dr f (a)hr > 0 para todo h 6= 0 (mı́nimo) o que Dr f (a)hr < 0 para todo h 6= 0 (máximo) Demostración. Consideremos la aplicación Φ : h → Dr f (a)hr . Se trata de una aplicación continua que toma sus valore en R, luego alcanza un mı́nimo sobre cada compacto, en particular sobre la esfera unidad S . Ası́ pues, existe algún punto u0 con ku0 k = 1 tal que cualquiera que sea u ∈ S, Dr f (a)ur ≥ 126 Extremos Relativos 12.4 Dr f (a)ur0 = λ. La hipótesis de esta proposición implica que el número λ debe ser estrictamente positivo. Sea ahora h 6= 0 un vector cualquiera. Entonces µ ¶ h h 1 Dr f (a) ,··· , ≥λ ⇒ Dr f (a)hr ≥ λ khk khk khkr ⇒ Dr f (a)hr ≥ λkhkr . (12.4) Veamos ya que en las condiciones de esta proposición la función f presenta un mı́nimo relativo en el punto a. 1 r D f (a)hr + ε(h)khkr r! µ ¶ λ λ r r ≥ khk + ε(h)khk = + ε(h) khkr . r! r! f (a + h) − f (a) = Como ε(h) → 0 cuando h → 0 y λ > 0, de lo anterior se deduce que f (a + h) − f (a) ≥ 0 para h suficientemente pequeño, luego f presenta un mı́nimo en a. Nota. En la proposición anterior puede sustituirse la hipótesis “Dr f (a)hr > 0 para todo h 6= 0 (resp. < 0)” por “r es par y Dr f (a)hr 6= 0 para todo h 6= 0”. Además que r sea par sólo hay que exigirlo en el caso de que f sea una función de una variable, en cuyo caso la demostración es trivial. Supongamos que se trabaja en dimensión estrictamente mayor que 1 y que Dr f (a)hr 6= 0 para todo h 6= 0. Consideremos de nuevo la aplicación Φ : h → Dr f (a)hr . Entonces P = Rn \ {0} es un conjunto conexo y por tanto su imagen por la aplicación continua Φ, Φ(P ), es un conjunto conexo de R. Este conjunto conexo, si suponemos que Dr f (a)hr 6= 0 para todo h 6= 0, debe ser un intervalo que no contenga a 0, lo que sólo es posible si Dr f (a)hr > 0 para todo h 6= 0 o bien Dr f (a)hr < 0 para todo h 6= 0. 12.5 En resumen, el procedimiento general para la obtención de los puntos de extremos relativos es el siguiente: 1. Obtención de los Puntos Crı́ticos ∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n ∂xi Supongamos que a es un punto crı́tico y la primera derivada de la función f que no se anula en a es la de orden r, entonces: 12.7 Extremos Relativos 127 2. r impar La función f no tiene extremos en a 3. r par y Dr f (a)hr 6= 0 para todo h 6= 0. La función presenta un extremo en a: • Mı́nimo si Dr f (a)hr > 0 para todo h 6= 0. • Máximo si Dr f (a)hr < 0 para todo h 6= 0. 4. r par, pero existe algún h 6= 0 tal que Dr f (a)hr = 0. • Dr f (a)hr no tiene signo constante. La función f no tiene extremos en a • Dr f (a)hr tiene signo constante. Caso Dudoso. Hessiano En esta sección vamos a estudiar la existencia de extremos en un punto en el caso particular de que la primera derivada que no se anule en ese punto sea la de orden 2, es decir Df (a) = 0 y D2 f (a) 6= 0. Para ello vamos a apoyarnos en la teorı́a de las formas cuadráticas. 12.6 Una forma cuadrática φ sobre un espacio vectorial E es una aplicación de E en R que coincide con la restricción a la diagonal de una forma bilineal simétrica ϕ, es decir para cada x ∈ E φ(x) = ϕ(x, x). La forma cuadrática φ se dirá definida si φ(x) 6= 0, para cada x 6= 0 y se dirá positiva (resp. negativa) si para todo x, φ(x) ≥ 0 (resp. φ(x) ≤ 0). Como es bien conocido, en dimensión finita, la forma cuadrática φ está determinada por una matriz cuadrada y simétrica, la matriz (aij ) con aij = ϕ(ei , ej ), ei = (0, . . . , 1, . . . , 0). Por definición llamaremos Menor Principal de esta matriz a cada menor cuya diagonal principal esté formada por elementos de la diagonal principal de φ. Denotaremos por ∆i , i = 1, 2, . . . , n al menor principal de orden i formado con las i primeras filas y las i primeras columnas. Los siguientes resultados sobre formas cuadráticas pueden verse en [13] Proposición 12.7 Para una forma cuadrática φ sobre Rn se tiene: (i) φ es positiva si y sólo si todos los menores principales de la matriz asociada son no negativos. 128 Extremos Relativos 12.7 (ii) φ es negativa si y sólo si los menores principales de orden par son no negativos y los menores principales de orden impar no positivos. (iii) φ es definida positiva si y sólo si ∆i > 0 para todo i. (iv) φ es definida negativa si y sólo si (−1)i ∆i > 0 para todo i. Para aplicar esto al estudio de los extremos relativos, supongamos pues que f es una función escalar de n variables reales tal que Df (a) = 0 y D2 f (a) 6= 0. Consideremos entonces la forma cuadrática X ∂2f (a)hi hj φ(h) = D2 f (a)h2 = ∂xi ∂xj i,j La matriz asociada a esta particular forma cuadrática se conoce con el nombre de Hessiano de f en a y se trata, obviamente, de la matriz de las derivadas parciales segundas en a H(a) = ∂2f (a) ∂x21 ∂2f ∂x1 ∂x2 (a) ∂2f ∂2f ∂x2 ∂x1 (a) ∂x22 ··· (a) ··· ··· ··· ··· ∂2f ∂xn ∂x1 (a) ∂2f ∂xn ∂x2 (a) ··· ∂2f ∂x1 ∂xn (a) ∂x2 ∂xn (a) ··· ∂2f (a) ∂x2 ∂2f n Según veı́amos en las secciones anteriores, en el caso que estamos considerando una condición necesaria de mı́nimo relativo en a es que D2 f (a)h2 ≥ 0 para cada h, es decir que φ sea positiva. Y una condición suficiente que D2 f (a)h2 > 0 para todo h 6= 0, es decir que φ sea definida positiva. La proposición anterior nos da pues un criterio práctico para reconocer, a partir del Hessiano, la existencia, en algunos casos, de extremos relativos. 12.8 Cuando f es una función de dos variables, el criterio del Hessiano tiene mayor alcance, es decir son menos los casos en los este criterio no nos permite decidir si existe o no un extremo en el punto. Concretamente, sea z = f (x, y) y (a, b) un punto crı́tico de f . Formemos el Hessiano de f en (a, b) H(a, b) = ∂2f (a, b) ∂x2 ∂2f ∂x∂y (a, b) ∂2f ∂x∂y (a, b) ∂2f (a, b) ∂y 2 12C Extremos Relativos 129 Entonces, si denotamos por ∆ al determinante de H(a, b), resulta 1. ∆ > 0 ⇒ Extremo: Mı́nimo si ∆1 > 0. Máximo si ∆1 < 0 2. ∆ < 0 ⇒ No hay extremo 3. ∆ = 0 ⇒ Caso Dudoso Lo anterior se obtiene fácilmente como consecuencia del criterio general: Si ∆ > 0 es inmediato comprobar que ∆1 6= 0, luego según el criterio del hessiano, habrá un mı́nimo si ∆1 > 0 y un máximo si ∆1 > 0. Si ∆ < 0, la forma cuadrática φ no es ni positiva ni negativa, pues tanto para una cosa como para la otra es preciso que los menores principales de orden par sean no negativos y ∆ es un menor de orden 2. Ejercicios 12A Sea f : U ⊂ Rn → R una función r-veces diferenciable en el abierto U (r > 1) y supongamos que para algún punto a ∈ U se tiene 1. todas las derivadas de orden menor que r se anulan en a; 2. para cada x de alguna bola centrada en a, Dr f (x)hr ≥ 0 para todo h ∈ Rn . Probar que entonces f presenta un mı́nimo relativo en a. 12B Estudiar la existencia de extremos relativos para las funciones 1. f (x, y) = x4 + y 4 − 2(x − y)2 2. f (x, y) = x3 + y 2 − xy 2 3. f (x, y) = x3 + y 3 − 3x2 y 2 + 1 4. f (x, y, z) = x4 + y 4 − 3x2 y 2 xz 5. f (x, y, z) = 2x4 + 2y 4 + z 4 − 4x2 y 2 z 6. f (x, y) = 2x4 + 3y 4 − 4x2 y 3 7. f (x, y) = x2 y + x2 + 2xy + xy 2 + y 2 8. f (x, y) = x4 + y 4 − xy 3 + 1 9. f (x, y) = x4 + y 4 − xy 4 + 1 10. f (x, y) = y 2 − 3x2 y + 2x4 11. f (x, y) = x3 + 3x2 y − xy 2 + 1 12. f (x, y) = x2 y 2 + xy 4 12C Demostrar que los siguientes enunciados son equivalentes (a) x2 + y 2 + z 2 ≥ α(xy + xz + yz), para todos x, y, z. (b) La función f (x, y, z) = x2 + y 2 + z 2 − α(xy + xz + yz), presenta un mı́nimo relativo en el punto (0, 0, 0). (c) α ∈ [−2, 1]. 130 Extremos Relativos 12D 12D Estudiar la existencia de extremos relativos para las funciones f (x, y) = sen |xy|, ax+y 2 0 < x ≤ π/2, 0 < y ≤ π/2. + b sen(x + by ) − y 2 . µ ¶ 1 1 f (x1 , . . . , xn ) = x1 x2 · · · xn + an+1 + ... + , (a > 0) , x ∈ Ω = (0, ∞)n x1 xn X 2 2 f (x1 , . . . , xn ) = ( ai xi )e−(x1 +...+xn ) f (x, y) = e 2 2 12E Demostrar que entre los polı́gonos convexos de n lados inscritos en una circunferencia, el polı́gono regular es el de mayor perı́metro y también el de mayor área. 12F (T.de Rolle) Sea A un conjunto abierto de Rn de adherencia compacta, y sea f una función escalar diferenciable en A y continua en Ā. Entonces, si f es constante sobre la frontera de A existe un punto a ∈ A tal que Df (a) = 0.