Extremos Relativos

Capı́tulo 12 Extremos Relativos Una aplicación clásica del Teorema Local de Taylor, que vimos en el capı́tulo anterior, es el estudio de los extremos relativos de una función escalar. Aunque la analogı́a con el caso de una variable es total, hay algunas diferencias que surgen de manera natural por el paso a una dimensión superior. En lo sucesivo trabajaremos con funciones escalares, definidas sobre un conjunto A ⊂ Rn . Se dirá que una tal función presenta un extremo relativo o en un punto a ∈ A, si existe un entorno V de a contenido en A, tal que la diferencia f (x) − f (a) no cambia de signo cuando x ∈ V : Máximo Si f (x) − f (a) ≤ 0. Mı́nimo Si f (x) − f (a) ≥ 0. Condiciones necesarias de extremo Cuando f es una función diferenciable se obtiene la siguiente condición necesaria de extremo, totalmente análoga a la de funciones de una variable. Proposición 12.1 Si f es diferenciable en a y presenta un extremo relativo en ese punto, entonces Df (a) = 0. Demostración. Supongamos, para concretar, que f presenta un mı́nimo en a. Sea entonces h un vector cualquiera y sea δ > 0 tal que para cada t ∈ [−δ, δ] f (a + th) − f (a) ≥ 0. Sea F = f ◦ λ, donde λ es la aplicación de [−δ, δ] en A, λ(t) = a + th. Entonces F es una aplicación de una variable, derivable en 0 y que presenta 123 124 Extremos Relativos 12.1 un mı́nimo relativo en ese punto. Luego su derivada en 0, F 0 (0) debe ser igual a 0. Se tiene pues: 0 = F 0 (0) = Df (a) · h. 12.2 Por tanto, el proceso para encontrar los puntos de extremo relativo para una función diferenciable comienza con el planteamiento del sistema Df (x) = 0 ⇔ ∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n. ∂xi Los puntos solución de este sistema de n ecuaciones con n incógnitas se denominan puntos crı́ticos . Después de la proposición 12.1, una condición necesaria para que la función f presente un extremo relativo en un punto x es que x sea un punto crı́tico. Es bien conocido que para funciones de una variable, una condición necesaria y suficiente para que una función suficientemente derivable presente un extremo relativo en un punto crı́tico, es que la primera derivada que no se anule en ese punto (supuesta que hay alguna) sea de orden par. Para funciones de varias variables, las cosas son menos simples y esta condición, aunque necesaria, no será suficiente para garantizar la existencia de extremo. Proposición 12.3 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1 y Dr f (a) 6= 0. Entonces, las siguientes condiciones son necesarias para que f presente un extremo relativo en el punto a: 1. r sea par. 2. Dr f (a)hr tenga signo constante. Concretamente Dr f (a)hr ≥ 0 para todo h (≤ 0), si en a hay un mı́nimo (máximo). Demostración. Sea ε(h) = f (a + h) − Pr f (a)h (ε(0) = 0). khkr Entonces (12.1) f (a + h) − f (a) − 1 r D f (a)hr = ε(h) · khkr , r! donde, por el teorema local de Taylor, ε(h) → 0 cuando h → 0. 12.4 Extremos Relativos 125 Supongamos, por ejemplo, que f presenta un mı́nimo en a y sea h un vector no nulo arbitrario. Existe entonces un número real δ > 0 tal que f (a + th) − f (a) ≥ 0 si | t |≤ δ. De la ecuación 12.1 se sigue que para | t |≤ δ 1 r D f (a) (th)r + ε(th) · khkr ≥ 0 r! ⇒ tr r D f (a)hr + | t |r ε(th) · khkr ≥ 0, r! y dividiendo por | t |r la expresión anterior, se tiene que para | t |≤ δ µ ¶ 1 t r r (12.2) D f (a)hr + ε(th) · khkr ≥ 0. r! | t | Pasando al lı́mite cuando t → 0+ en 12.2 y teniendo en cuenta que ε(th) → 0 , cuando t → 0, se deduce que (12.3) 1 r D f (a)hr ≥ 0 Para todo h ∈ Rn . r! Si r fuese impar, lo anterior sólo serı́a posible si Dr f (a)hr = 0, ya que la condición 12.3 implica también que 0 ≤ Dr f (a)(−h)r = (−1)r Dr f (a). Entonces, al ser h arbitrario, la aplicación r-lineal Dr f (a) deberı́a ser nula (ver fórmula 11.4), lo que contradice la hipótesis. Por lo tanto r es par y Dr f (a)hr ≥ 0. Nota. Como hemos visto la condición r par de la proposición anterior no es preciso exigirla de modo explı́cito, ya que se deduce de la condición Dr f (a) tiene signo constante Condición suficiente de extremo Proposición 12.4 Sea f : A ⊂ Rn −→ R una aplicación derivable hasta el o orden r > 1 en el punto a ∈ A y supongamos que Dk f (a) = 0, k ≤ r − 1. Entonces, una condición suficiente para que f presente un extremo relativo en a es que Dr f (a)hr > 0 para todo h 6= 0 (mı́nimo) o que Dr f (a)hr < 0 para todo h 6= 0 (máximo) Demostración. Consideremos la aplicación Φ : h → Dr f (a)hr . Se trata de una aplicación continua que toma sus valore en R, luego alcanza un mı́nimo sobre cada compacto, en particular sobre la esfera unidad S . Ası́ pues, existe algún punto u0 con ku0 k = 1 tal que cualquiera que sea u ∈ S, Dr f (a)ur ≥ 126 Extremos Relativos 12.4 Dr f (a)ur0 = λ. La hipótesis de esta proposición implica que el número λ debe ser estrictamente positivo. Sea ahora h 6= 0 un vector cualquiera. Entonces µ ¶ h h 1 Dr f (a) ,··· , ≥λ ⇒ Dr f (a)hr ≥ λ khk khk khkr ⇒ Dr f (a)hr ≥ λkhkr . (12.4) Veamos ya que en las condiciones de esta proposición la función f presenta un mı́nimo relativo en el punto a. 1 r D f (a)hr + ε(h)khkr r! µ ¶ λ λ r r ≥ khk + ε(h)khk = + ε(h) khkr . r! r! f (a + h) − f (a) = Como ε(h) → 0 cuando h → 0 y λ > 0, de lo anterior se deduce que f (a + h) − f (a) ≥ 0 para h suficientemente pequeño, luego f presenta un mı́nimo en a. Nota. En la proposición anterior puede sustituirse la hipótesis “Dr f (a)hr > 0 para todo h 6= 0 (resp. < 0)” por “r es par y Dr f (a)hr 6= 0 para todo h 6= 0”. Además que r sea par sólo hay que exigirlo en el caso de que f sea una función de una variable, en cuyo caso la demostración es trivial. Supongamos que se trabaja en dimensión estrictamente mayor que 1 y que Dr f (a)hr 6= 0 para todo h 6= 0. Consideremos de nuevo la aplicación Φ : h → Dr f (a)hr . Entonces P = Rn \ {0} es un conjunto conexo y por tanto su imagen por la aplicación continua Φ, Φ(P ), es un conjunto conexo de R. Este conjunto conexo, si suponemos que Dr f (a)hr 6= 0 para todo h 6= 0, debe ser un intervalo que no contenga a 0, lo que sólo es posible si Dr f (a)hr > 0 para todo h 6= 0 o bien Dr f (a)hr < 0 para todo h 6= 0. 12.5 En resumen, el procedimiento general para la obtención de los puntos de extremos relativos es el siguiente: 1. Obtención de los Puntos Crı́ticos ∂f (x1 , · · · , xn ) = 0, i = 1, 2, · · · , n ∂xi Supongamos que a es un punto crı́tico y la primera derivada de la función f que no se anula en a es la de orden r, entonces: 12.7 Extremos Relativos 127 2. r impar La función f no tiene extremos en a 3. r par y Dr f (a)hr 6= 0 para todo h 6= 0. La función presenta un extremo en a: • Mı́nimo si Dr f (a)hr > 0 para todo h 6= 0. • Máximo si Dr f (a)hr < 0 para todo h 6= 0. 4. r par, pero existe algún h 6= 0 tal que Dr f (a)hr = 0. • Dr f (a)hr no tiene signo constante. La función f no tiene extremos en a • Dr f (a)hr tiene signo constante. Caso Dudoso. Hessiano En esta sección vamos a estudiar la existencia de extremos en un punto en el caso particular de que la primera derivada que no se anule en ese punto sea la de orden 2, es decir Df (a) = 0 y D2 f (a) 6= 0. Para ello vamos a apoyarnos en la teorı́a de las formas cuadráticas. 12.6 Una forma cuadrática φ sobre un espacio vectorial E es una aplicación de E en R que coincide con la restricción a la diagonal de una forma bilineal simétrica ϕ, es decir para cada x ∈ E φ(x) = ϕ(x, x). La forma cuadrática φ se dirá definida si φ(x) 6= 0, para cada x 6= 0 y se dirá positiva (resp. negativa) si para todo x, φ(x) ≥ 0 (resp. φ(x) ≤ 0). Como es bien conocido, en dimensión finita, la forma cuadrática φ está determinada por una matriz cuadrada y simétrica, la matriz (aij ) con aij = ϕ(ei , ej ), ei = (0, . . . , 1, . . . , 0). Por definición llamaremos Menor Principal de esta matriz a cada menor cuya diagonal principal esté formada por elementos de la diagonal principal de φ. Denotaremos por ∆i , i = 1, 2, . . . , n al menor principal de orden i formado con las i primeras filas y las i primeras columnas. Los siguientes resultados sobre formas cuadráticas pueden verse en [13] Proposición 12.7 Para una forma cuadrática φ sobre Rn se tiene: (i) φ es positiva si y sólo si todos los menores principales de la matriz asociada son no negativos. 128 Extremos Relativos 12.7 (ii) φ es negativa si y sólo si los menores principales de orden par son no negativos y los menores principales de orden impar no positivos. (iii) φ es definida positiva si y sólo si ∆i > 0 para todo i. (iv) φ es definida negativa si y sólo si (−1)i ∆i > 0 para todo i. Para aplicar esto al estudio de los extremos relativos, supongamos pues que f es una función escalar de n variables reales tal que Df (a) = 0 y D2 f (a) 6= 0. Consideremos entonces la forma cuadrática X ∂2f (a)hi hj φ(h) = D2 f (a)h2 = ∂xi ∂xj i,j La matriz asociada a esta particular forma cuadrática se conoce con el nombre de Hessiano de f en a y se trata, obviamente, de la matriz de las derivadas parciales segundas en a       H(a) =       ∂2f (a) ∂x21 ∂2f ∂x1 ∂x2 (a) ∂2f ∂2f ∂x2 ∂x1 (a) ∂x22 ··· (a) ··· ··· ··· ··· ∂2f ∂xn ∂x1 (a) ∂2f ∂xn ∂x2 (a) ··· ∂2f ∂x1 ∂xn (a)      ∂x2 ∂xn (a)     ···    ∂2f (a) ∂x2 ∂2f n Según veı́amos en las secciones anteriores, en el caso que estamos considerando una condición necesaria de mı́nimo relativo en a es que D2 f (a)h2 ≥ 0 para cada h, es decir que φ sea positiva. Y una condición suficiente que D2 f (a)h2 > 0 para todo h 6= 0, es decir que φ sea definida positiva. La proposición anterior nos da pues un criterio práctico para reconocer, a partir del Hessiano, la existencia, en algunos casos, de extremos relativos. 12.8 Cuando f es una función de dos variables, el criterio del Hessiano tiene mayor alcance, es decir son menos los casos en los este criterio no nos permite decidir si existe o no un extremo en el punto. Concretamente, sea z = f (x, y) y (a, b) un punto crı́tico de f . Formemos el Hessiano de f en (a, b)   H(a, b) =  ∂2f (a, b) ∂x2 ∂2f ∂x∂y (a, b) ∂2f ∂x∂y (a, b) ∂2f (a, b) ∂y 2    12C Extremos Relativos 129 Entonces, si denotamos por ∆ al determinante de H(a, b), resulta 1. ∆ > 0 ⇒ Extremo: Mı́nimo si ∆1 > 0. Máximo si ∆1 < 0 2. ∆ < 0 ⇒ No hay extremo 3. ∆ = 0 ⇒ Caso Dudoso Lo anterior se obtiene fácilmente como consecuencia del criterio general: Si ∆ > 0 es inmediato comprobar que ∆1 6= 0, luego según el criterio del hessiano, habrá un mı́nimo si ∆1 > 0 y un máximo si ∆1 > 0. Si ∆ < 0, la forma cuadrática φ no es ni positiva ni negativa, pues tanto para una cosa como para la otra es preciso que los menores principales de orden par sean no negativos y ∆ es un menor de orden 2. Ejercicios 12A Sea f : U ⊂ Rn → R una función r-veces diferenciable en el abierto U (r > 1) y supongamos que para algún punto a ∈ U se tiene 1. todas las derivadas de orden menor que r se anulan en a; 2. para cada x de alguna bola centrada en a, Dr f (x)hr ≥ 0 para todo h ∈ Rn . Probar que entonces f presenta un mı́nimo relativo en a. 12B Estudiar la existencia de extremos relativos para las funciones 1. f (x, y) = x4 + y 4 − 2(x − y)2 2. f (x, y) = x3 + y 2 − xy 2 3. f (x, y) = x3 + y 3 − 3x2 y 2 + 1 4. f (x, y, z) = x4 + y 4 − 3x2 y 2 xz 5. f (x, y, z) = 2x4 + 2y 4 + z 4 − 4x2 y 2 z 6. f (x, y) = 2x4 + 3y 4 − 4x2 y 3 7. f (x, y) = x2 y + x2 + 2xy + xy 2 + y 2 8. f (x, y) = x4 + y 4 − xy 3 + 1 9. f (x, y) = x4 + y 4 − xy 4 + 1 10. f (x, y) = y 2 − 3x2 y + 2x4 11. f (x, y) = x3 + 3x2 y − xy 2 + 1 12. f (x, y) = x2 y 2 + xy 4 12C Demostrar que los siguientes enunciados son equivalentes (a) x2 + y 2 + z 2 ≥ α(xy + xz + yz), para todos x, y, z. (b) La función f (x, y, z) = x2 + y 2 + z 2 − α(xy + xz + yz), presenta un mı́nimo relativo en el punto (0, 0, 0). (c) α ∈ [−2, 1]. 130 Extremos Relativos 12D 12D Estudiar la existencia de extremos relativos para las funciones f (x, y) = sen |xy|, ax+y 2 0 < x ≤ π/2, 0 < y ≤ π/2. + b sen(x + by ) − y 2 . µ ¶ 1 1 f (x1 , . . . , xn ) = x1 x2 · · · xn + an+1 + ... + , (a > 0) , x ∈ Ω = (0, ∞)n x1 xn X 2 2 f (x1 , . . . , xn ) = ( ai xi )e−(x1 +...+xn ) f (x, y) = e 2 2 12E Demostrar que entre los polı́gonos convexos de n lados inscritos en una circunferencia, el polı́gono regular es el de mayor perı́metro y también el de mayor área. 12F (T.de Rolle) Sea A un conjunto abierto de Rn de adherencia compacta, y sea f una función escalar diferenciable en A y continua en Ā. Entonces, si f es constante sobre la frontera de A existe un punto a ∈ A tal que Df (a) = 0.

Extremos Relativos

Documentos relacionados

Productos

Apoyo

Extremos Relativos

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib