Capı́tulo 3 Diferenciabilidad 1. Derivada Recordemos que si f : R → R es diferenciable en x 0 y f 0 (x0 ) es su derivada en x0 , entonces f (x) ≈ f (x0 ) + f 0 (x0 )(x − x0 ) es una aproximación lineal de f cerca de x 0 . Esta observación nos motiva a definir diferenciabilidad de una función en R n de la siguiente manera. Definición 3.1. Sea D abierto en Rn y f : D → Rm . Decimos que f es diferenciable en x0 ∈ D si existe una transformación lineal T : R n → Rm tal que, para todo ε > 0, existe δ > 0 tal que si |x − x 0 | < δ entonces (3.1) |f (x) − f (x0 ) − T (x − x0 )| < ε|x − x0 |. En otras palabras, f es diferenciable en x 0 si lı́m x→x0 o, de forma equivalente, |f (x) − f (x0 ) − T (x − x0 )| = 0, |x − x0 | |f (x + h) − f (x) − T h| = 0. h→0 |h| lı́m Teorema 3.2. Si f es diferenciable en x 0 , entonces la función lineal T en (3.1) es única. Demostración. Supongamos que S : R n → Rm es lineal y |f (x0 + h) − f (x0 ) − Sh| = 0. h→0 |h| lı́m 25 26 3. Diferenciabilidad Demostraremos primero que |T h − Sh| →0 |h| cuando h → 0. Ahora bien |T h − Sh| |T h − (f (x0 + h) − f (x0 )) + (f (x0 + h) − f (x0 )) − Sh| = |h| |h| |T h − (f (x0 + h) − f (x0 ))| |(f (x0 + h) − f (x0 )) − Sh| + ≤ |h| |h| →0 cuando h → 0. Ahora, sea x ∈ Rn y x 6= 0. Si hacemos h = tx, t ∈ R, entonces lı́m t→0 Como T y S son lineales, ası́ que T x = Sx. |T (tx) − S(tx)| = 0. |tx| |T (tx) − S(tx)| |T x − Sx| = , |tx| |x| La función lineal T es llamada la derivada de f en x 0 , y se denota por Df (x0 ). Ejemplo 3.3. Sea f : R2 → R dada por f (x, y) = sen x y (x0 , y0 ) ∈ R2 . Demostraremos que f es diferenciable en (x 0 , y0 ) y la función lineal T está dada por T (x, y) = x cos x0 . Sea (h, k) ∈ R2 , con (h, k) 6= (0, 0). Entonces |f ((x0 , y0 ) + (h, k)) − f (x0 , y0 ) − T (h, k)| |(h, k)| | sen(x0 + h) − sen x0 − h cos x0 | →0 ≤ |h| porque sen(x0 + h) − sen x0 lı́m = cos x0 . h→0 h Como todas las transformaciones lineales se pueden expresar como multiplicación por una matriz, lo mismo sucede para la transformación Df (x 0 ). En el ejemplo anterior, x , Df (x0 )(x, y) = (x cos x0 ) = (cos x0 , 0) y ası́ que Df (x0 ) induce la matriz, de 1 × 2, dada por (cos x 0 , 0). 27 1. Derivada A la matriz inducida por la transformación Df (x 0 ) se le llama Jacobiano, y se denota por f 0 (x0 ). En el ejemplo anterior, f 0 (x0 ) = (cos x0 , 0). La siguiente proposición establece la diferenciabilidad de las funciones básicas. Proposición 3.4. 1. Si f : Rn → Rm es constante, entonces Df (x0 ) = 0 para cada x0 ∈ Rn . 2. Si f : Rn → Rm es lineal, entonces Df (x0 ) = f para cada x0 ∈ Rn . 3. Si sum : R2 → R está dada por sum(x, y) = x + y, entonces D sum(x0 , y0 ) = sum para cada (x0 , y0 ) ∈ R2 . 4. Si mult : R2 → R está dada por mult(x, y) = xy, entonces D mult(x0 , y0 )(x, y) = y0 x + x0 y para cada (x0 , y0 ) ∈ R2 . 1. Si f es constante, |f (x0 + h) − f (x0 )| =0 |h| para todo x0 , h ∈ Rn . Demostración. 2. Si f es lineal, f (x0 + h) = f (x0 ) + f (h), ası́ que |f (x0 + h) − f (x0 ) − f (h)| =0 |h| para todo x0 , h ∈ Rn . 3. Se sigue inmediatamente de la anterior. 4. Tenemos, | mult(x0 + h, y0 + k) − mult(x0 , y0 ) − (y0 h + x0 k)| = |(h, k)| |(x0 + h)(y0 + k) − x0 y0 − y0 h − x0 k| |hk| √ =√ h2 + k 2 h2 + k 2 2 1/2(h + k 2 ) = |(h, k)| → 0 ≤ √ h2 + k 2 cuando (h, k) → 0. 28 3. Diferenciabilidad Proposición 3.5. Sea f : Rn → Rm y x0 ∈ Rn . Entonces f es diferenciable en x0 si y sólo si cada f i : Rn → R, i = 1, ..., m, es diferenciable en x 0 . En tal caso, Df (x0 )(x) = Df 1 (x0 )(x), ..., Df m (x0 )(x) . Demostración. Supongamos primero que f es diferenciable en x 0 , y sea, para cada i, Ti = π i ◦ Df (x0 ). Entonces |f (x0 + h) − f (x0 ) − Df (x0 )(h)| |f i (x0 + h) − f i (x0 ) − Ti h| ≤ →0 |h| |h| cuando h → 0, ası́ que cada f i es diferenciable en x0 . Supongamos ahora que cada f i es diferenciable en x0 y sea T : Rn → Rm la transformación T x = (Df 1 (x0 )(x), ..., Df m (x0 )(x)). Entonces v um X |f (x0 + h) − f (x0 ) − T h| 1 u t (f i (x0 + h) − f i (x0 ) − Df i (x0 )(h))2 = |h| |h| i=1 ≤ cuando h → 0. Ejemplo 3.6. Si f : R2 m √ X |f i (x0 + h) − f i (x0 ) − Df i (x0 )(h)| m →0 |h| → i=1 R2 está dada por f (x, y) = (sen x, xy), entones Df (x0 , y0 )(x, y) = (x cos x0 , y0 x + x0 y), es decir, el vector cuyas coordenadas son las derivadas de sen x y xy en (x0 , y0 ), respectivamente. El Jacobiano está dado por cos x0 0 0 f (x0 , y0 ) = . y0 x0 Si queremos, sin embargo, calcular la derivada de f (x, y) = sen xy en algún punto (x0 , y0 ), si es que existe, entonces ya sea utilizamos la definición de la derivada, u observamos que sen xy = sen(mult(x, y)) = sen ◦ mult(x, y), es decir, (x, y) 7→ sen xy es la composición de sen con la multiplicación mult. Teorema 3.7 (Regla de la cadena). Sea f : R n → Rm diferenciable en x0 , g : Rm → Rp diferenciable en f (x0 ). Entonces g ◦ f : Rn → Rp es diferenciable en x0 y D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 ). 29 1. Derivada Es decir, la derivada de la composición de dos funciones está dada por la composición de las derivadas. Esto implica, desde luego, que (g ◦ f )0 (x0 ) = g 0 (f (x0 ))f 0 (x0 ), expresión familiar en el cáculo en R. Demostración. Definimos y0 = f (x0 ), T = Df (x0 ) y S = Dg(y0 ). Sean ϕ(x) = f (x) − f (x0 ) − T (x − x0 ), ψ(y) = g(y) − g(y0 ) − S(y − y0 ), ρ(x) = g ◦ f (x) − g(y0 ) − S ◦ T (x − x0 ). Como f y g son diferenciables en x0 y y0 , respectivamente, lı́m x→x0 |ϕ(x)| = 0, |x − x0 | y queremos demostrar que lı́m x→x0 Observemos primero que lı́m y→y0 |ψ(y)| = 0, |y − y0 | |ρ(x)| = 0. |x − x0 | ρ(x) = g(f (x)) − g(y0 ) − S(T (x − x0 )) = g(f (x)) − g(y0 ) − S(f (x) − y0 ) + S(ϕ(x)) = ψ(f (x)) + Sϕ(x). Por ser lineales, existen M1 , M2 > 0 tales que |T x| ≤ M1 |x| y |Sy| ≤ M2 |y| para todo x ∈ Rn y y ∈ Rm . Ası́ que, primero, |ϕ(x)| |Sϕ(x)| ≤ M1 →0 |x − x0 | |x − x0 | cuando x → x0 . También tenemos que, para todo ε > 0, existe δ > 0 tal que |ψ(y)| ≤ ε|y − y0 | para |y − y0 | < δ. Además, existe η tal que |x − x0 | < η implica que |f (x) − y0 | < δ. Entonces, si |x − x0 | < η, |ψ(f (x))| ≤ ε|f (x) − y0 | = ε|ϕ(x) + T (x − x0 )| ≤ ε|ϕ(x)| + εM1 |x − x0 |, ası́ que, para 0 < |x − x0 | < η, Por lo tanto |ψ(f (x))| |ϕ(x)| ≤ε + εM1 . |x − x0 | |x − x0 | lı́m x→x0 |Ψ(f (x))| = 0. |x − x0 | 30 3. Diferenciabilidad Ejemplo 3.8. Si f : R2 → R está dada por f (x, y) = sen xy, entonces f = sen ◦ mult, ası́ que Df (x0 , y0 )(x, y) = D sen(x0 y0 )(xy0 + yx0 ) = (xy0 + yx0 ) cos(x0 y0 ). El Jacobiano está dado por f 0 (x0 , y0 ) = cos(x0 y0 )(y0 , x0 ) = (y0 cos(x0 y0 ), x0 cos(x0 y0 )). Corolario 3.9. Sean f, g : Rn → R diferenciables en x0 . Entonces 1. f + g es diferenciable en x0 y D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ). 2. f g es diferenciable en x0 y D(f g)(x0 ) = f (x0 )Dg(x0 ) + g(x0 )Df (x0 ). Demostración. 1. Si F (x) = (f (x), g(x)), f +g = sum ◦F . Entonces D(f + g)(x0 ) = D sum(F (x0 )) ◦ DF (x0 ). Es decir, como DF (x0 )(x) = (Df (x0 )(x), Dg(x0 )(x)), D(f + g)(x0 )(x) = Df (x0 )(x) + Dg(x0 )(x). 2. f g = mult ◦F , ası́ que D(f g)(x0 )(x) = D mult(f (x0 ), g(x0 ))(Df (x0 )(x), Dg(x0 )(x)) = g(x0 )Df (x0 )(x) + f (x0 )Dg(x0 )(x). Ejemplo 3.10. Sea f : R+ × R → R dada por f (x, y) = xy . Entonces f (x, y) = ey log x . Si F (x, y) = (log x, y), Entonces f = exp ◦ mult ◦F x DF (x0 , y0 )(x, y) = ,y , x0 D mult(log x0 , y0 ) = xy0 + ylogx0 , 0 F (x0 , y0 ) = 1 x0 0 0 , 1 mult0 (log x0 , y0 ) = (y0 , log x0 ), y D exp(y0 log x0 )(x) = xey0 log x0 = xxy00 , exp0 (y0 log x0 ) = xy00 . Entonces Df (x0 )(x, y) = D exp(y0 log x0 ) ◦ D mult(log x0 , y0 )(x/x0 , y) = D exp(y0 log x0 )(xy0 /x0 + y log x0 ) = xy00 (xy0 /x0 + y log x0 ) = xy0 xy00 −1 + yxy00 log x0 , 31 2. Derivadas parciales y el Jacobiano está dado por 0 f (x0 , y0 ) = xy00 (y0 , log x0 ) = xy00 2. y 0 x0 1 x0 0 0 1 , log x0 = (y0 xy00 −1 , xy00 log x0 ). Derivadas parciales Definición 3.11. Sean f : Rn → R, x0 , u ∈ Rn . Si el lı́mite f (x0 + tu) − f (x0 ) , t ∈ R, t→0 t existe, le llamamos la derivada direccional en la dirección u y se denota por Du f (x0 ). lı́m Si u = ei , Dei f (x0 ) es llamada la i-ésima derivada parcial de f en x 0 , y se denota por Di f (x0 ). Ejemplo 3.12. Si f : R2 → R está dada por f (x, y) = sen xy, entonces f (x0 + t, y0 ) − f (x0 , y0 ) = y0 cos(x0 y0 ). t→0 t D1 f (x0 , y0 ) = lı́m Como lo muestra el ejemplo anterior, las derivadas parciales son esencialmente derivadas en R, asumiendo las demás variables como constantes. No es sorpresa, entonces, que las derivadas parciales satisfagan las propiedades de la derivada en R. Decimos que f : Rn → R tiene un mı́nimo local en x0 si existe un rectángulo abierto R que contiene a x 0 y f (x0 ) ≤ f (x) para todo x ∈ R. De manera similar, decimos que f tiene un máximo local en x 0 si existe un rectángulo abierto R que contiene a x 0 y f (x0 ) ≥ f (x) para todo x ∈ R. Proposición 3.13. Si f : Rn → R tiene un mı́nimo o máximo local en x 0 y sus derivadas parciales existen, entonces D i f (x0 ) = 0, i = 1, . . . , n. Proposición 3.14 (Teorema del Valor Medio). Si las derivadas parciales de f : Rn → R existen, x0 ∈ Rn y t ∈ R, entonces existe c entre xi0 y xi0 + t tal que f (x10 , . . . , xi0 + t, . . . , xn0 ) − f (x10 , . . . , xi0 , . . . , xn0 ) = tDi f (x10 , . . . , c, . . . , xn0 ). 32 3. Diferenciabilidad Las demostraciones de estas proposiciones se siguen directamente de sus versiones en una variable, y las dejamos como ejercicio (ejercicios 4 y 5). Si una función es diferenciable, entonces sus derivadas parciales existen, como lo enuncia el siguiente teorema. Teorema 3.15. Sea f : Rn → R diferenciable en x0 . Entonces cada Di f (x0 ) existe y f 0 (x0 ) = (D1 f (x0 ), ..., Dn f (x0 )). Demostración. Para demostar que D i f (x0 ) existe, sea h : R → Rn dada por h(t) = f (x10 , . . . , xi0 + t, . . . , xn0 ) = x0 + tei . Entonces f (x0 + tei ) = f ◦ h(t). Como h es diferenciable en 0 y f es diferenciable en x0 = h(0), la regla de la cadena implica que f ◦ h es diferenciable en 0. Pero (f ◦ h)0 (0) es Di f (x0 ) y (f ◦ h)0 (0) = f 0 (x0 )h0 (0) = f 0 (x0 )ei , ası́ que Di f (x0 ) es la i-ésima componente de f 0 (x0 ). Nota que la inversa de este teorema es falsa, como lo muestra el siguiente ejemplo. Ejemplo 3.16. Sea f : R2 → R dada por ( 1 si 0 < y < x2 ; f (x, y) = 0 de otra forma. Entonces f (x, 0) = f (0, y) = 0 para todo x, y, por lo que D 1 f (0, 0) = D2 f (0, 0) = 0. Sin embargo, f ni siquiera es continua en (0, 0). De hecho, para cualquier u ∈ R2 , f (tu) = 0 para un intervalo alrededor de 0, ası́ que Du f (0, 0) = 0. Corolario 3.17. Si f : Rn → Rm es diferenciable en x0 , entonces cada Dj f i (x0 ) existe y f 0 (x0 ) es la matriz de m × n con entradas Dj f i (x0 ). Ejemplo 3.18. Consideremos de nuevo f (x, y) = (sen xy, x y ). Del corolario se obtiene inmediatamente y0 cos(x0 y0 ) x0 cos(x0 y0 ) 0 . f (x0 , y0 ) = y0 xy00 −1 xy00 log x0 Teorema 3.19. Sea f : Rn → R tal que cada una de las Di f (x) existen en un rectángulo abierto que contiene a x 0 y son continuas en x0 . Entonces f es diferenciable en x0 y f 0 (x0 ) = (D1 f (x0 ), ..., Dn f (x0 )). 33 2. Derivadas parciales Si las derivadas parciales de f existen un rectángulo alrededor de x 0 y son continuas en x0 , se dice que f es continuamente diferenciable en x 0 . Demostración. Supongamos que las derivadas parciales D i f (x) existen para x ∈ R, donde R es un recatángulo abierto que contiene a x 0 . Si h es tal que x0 + h ∈ R, por la proposición 3.14, f (x10 + h1 , x20 + h2 , . . . , xn0 + hn ) − f (x10 , x20 , . . . , xn0 ) = f (x10 + h1 , x20 + h2 , . . . , xn0 + hn ) − f (x10 , x20 + h2 , . . . , xn0 + hn ) + f (x10 , x20 + h2 , . . . , xn0 + hn ) − f (x10 , x20 , x30 + h3 , . . . , xn0 + hn ) + . . . + f (x10 , x20 , ..., xn0 + hn ) − f (x10 , x20 , . . . , xn0 ) = D1 f (c1 )h1 + . . . + Dn f (cn )hn , donde cada uno de los ci ∈ R están entre xi0 y hi , por lo que ci → xi0 cuando |h| → 0. Entonces P n |f (x0 + h) − f (x0 ) − i Di f (x0 )hi | X |hi | |Di f (ci ) − Di f (x0 )| ≤ |h| |h| i=1 ≤ y |f (x0 + h) − f (x0 ) − lı́m h→0 |h| porque las Di f son continuas en x0 . P n X i=1 i |Di f (ci ) − Di f (x0 )|, Di f (x0 )hi | = 0, Definición 3.20. Decimos que f : Rn → Rm es continuamente diferenciable en x0 si cada una de las derivadas parciales D j f i (x) existe en un rectángulo abierto alrededor de x0 y es continua en x0 . Corolario 3.21. Si f : Rn → Rm es continuamente diferenciable en x 0 , entonces es diferenciable en x0 . La inversa a este corolario es falsa, como lo muestra el siguiente y bien conocido ejemplo. Ejemplo 3.22. Sea f : R → R dada por ( 0 f (x) = x2 sen x1 x = 0; x 6= 0. Entonces f es diferenciable en R, pero D 1 f (x) no es continua en 0. Para terminar esta sección, establecemos la siguiente versión, clásica, de la regla de la cadena. 34 3. Diferenciabilidad Corolario 3.23. Sea g : Rn → Rm continuamente diferenciable en x0 , y f : Rm → R diferenciable en g(x0 ). Entonces Di (f ◦ g)(x0 ) = (3.2) m X Dj f (g(x0 ))Di g j (x0 ). j=1 Demostración. Como g es continuamente diferenciables en x 0 , g es diferenciable en x0 y por la regla de la cadena f ◦ g es diferenciable en x 0 . Además (f ◦ g)0 (x0 ) = f 0 (g(x0 ))g 0 (x0 ) D1 g 1 (x0 ) 2 D1 g (x0 ) = D1 f (g(x0 )) . . . Dm f (g(x0 )) .. . D1 g m (x0 ) de donde la ecuación (3.2) se sigue inmediatamente. 3. ... ... .. . Dn g 1 (x0 ) Dn g 2 (x0 ) , .. . . . . Dn g m (x0 ) Teorema de la función inversa Si f : R → R es continuamente diferenciable en una vecindad de x 0 ∈ R y 0 ) 6= 0, sabemos que existe una vecindad de x 0 , digamos U , tal que f es invertible en U , f −1 es diferenciable en f (U ) y f 0 (x (f −1 )0 (f (x)) = 1 f 0 (x) . A continuación estableceremos la versión de este resultado para funciones en Rn . Teorema 3.24 (Función Inversa). Sea f : R n → Rn continuamente diferenciable en una vecindad de x0 ∈ Rn , tal que det(f 0 (x0 )) 6= 0. Entonces existe una vecindad V de x0 y una vecindad W de f (x0 ) tales que f : V → W tiene inversa f −1 : W → V , es diferenciable y, para cada y ∈ W , (f −1 )0 (y) = [f 0 (f −1 (y))]−1 . Es decir, la inversa f −1 es diferenciable y su matriz Jacobiana es la inversa la matriz Jacobiana de f . Para la demostración del Teorema de la Función Inversa haremos uso del siguiente lema, el cual se sigue del Teorema del Valor Medio. Lema 3.25. Sea R ⊂ Rn un rectángulo, f : R → Rn continuamente diferenciable y M > 0 tal que |Dj f i (x)| ≤ M para i, j = 1, . . . , n, x ∈ R. Entonces |f (x) − f (y)| ≤ n2 M |x − y|, x, y ∈ R. 35 3. Teorema de la función inversa Demostración. Por el Teorema del Valor Medio, existen z 1 , . . . , zn ∈ R tal que f i (x1 , x2 , ..., xn ) − f i (y 1 , y 2 , ..., y n ) = f i (x1 , x2 , ..., xn ) − f i (y 1 , x2 , ..., xn ) + f i (y 1 , x2 , ..., xn ) − f i (y 1 , y 2 , ..., xn ) + ... + f i (y 1 , y 2 , ...y n−1 , xn ) − f i (y 1 , y 2 , ..., y n ) = D1 f i (z1 )(x1 − y 1 ) + D2 f i (z2 )(x2 − y 2 ) + ... + Dn f i (zn )(xn − y n ), ası́ que i i |f (x) − f (y)| ≤ n X j=1 |Dj f i (zj )||xj − y j | ≤ nM |x − y|. Por lo tanto |f (x) − f (y)| 6= n2 M |x − y|. Demostración del Teorema de la Función Inversa. Sea T = Df (x 0 ). Para la demostración empezaremos por observar que podemos asumir que T es la identidad. Como det(f 0 (x0 )) 6= 0, T es invertible. Por la regla de la cadena, D(T −1 ◦ f )(x0 ) = DT −1 (f (x0 ))Df (x0 ) = T −1 ◦ T = Id. Es claro que, si el teorema es cierto para T −1 ◦ f , entonces será cierto para f . De ahora en adelante, asumimos que T es la transformación identidad. Dividiremos la demostración en una serie de pasos. Paso 1. Existe un rectángulo cerrado R tal que x 0 ∈ R0 y, para todo x ∈ R, x 6= x0 , f (x) 6= f (x0 ). Esto es cierto porque, si f (x) = f (x0 ), |f (x) − f (x0 ) − T (x − x0 )| |x − x0 | = = 1. |x − x0 | |x − x0 | Pero el lı́mite cuando x → x0 es cero, lo cual inmediatamente implica el paso 1. De hecho, podemos escoger R tal que 1. det(f 0 (x)) 6= 0 para x ∈ R; y 2. |Dj f i (x1 ) − Dj f i (x2 )| ≤ 1 2n2 para x1 , x2 ∈ R, porque f es continuamente diferenciable en una vecindad de x 0 . Paso 2. Para x1 , x2 ∈ R, |x1 − x2 | ≤ 2|f (x1 ) − f (x2 )|. 36 3. Diferenciabilidad Sea g : R → Rn dada por g(x) = f (x) − x. Entonces g es continuamente diferenciable y Dj g i (x0 ) = 0, porque ( 1 i = j, Dj f i (x0 ) = 0 i 6= j. Entonces |Dj g i (x)| = |Dj g i (x) − Dj g i (x0 )| = |Dj f i (x) − Dj f i (x0 )| ≤ 1 2n2 para todo x ∈ R. Entonces, por el lema 3.25, 1 1 |g(x1 ) − g(x2 )| =≤ n2 2 |x1 − x2 | = |x1 − x2 |. 2n 2 Ahora bien, si x1 , x2 ∈ R, 1 |x1 − x2 | − |f (x1 ) − f (x2 )| ≤ |x1 − x2 − (f (x1 ) − f (x2 ))| ≤ |x1 − x2 |, 2 1 y por lo tanto |x1 − x2 | ≤ |f (x1 ) − f (x2 )|. 2 Paso 3. Existe un abierto W ⊂ Rn , f (x0 ) ∈ W , tal que, si x ∈ ∂R, entonces |y − f (x0 )| < |y − f (x)| para todo y ∈ W . Como x0 ∈ R0 , entonces f (x) 6= f (x0 ) para x ∈ ∂R. Como ∂R es compacto, f (∂R) es compacto, por lo que existe r > 0 tal que |f (x0 ) − f (x)| ≥ r 0 (f (x )). Entonces, si y ∈ W y x ∈ ∂R, para todo x ∈ ∂R. Sea W = Br/2 0 |y − f (x)| ≥ |f (x) − f (x0 )| − |f (x0 ) − y| > r − r/2 > |f (x0 ) − y|. Paso 4. Para cada y ∈ W existe un único x ∈ R tal que f (x) = y. Dado y ∈ W , sea h : R → R dada por h(x) = |y − f (x)| 2 . Mostraremos que h toma un mı́nimo y que este mı́nimo es 0. Como R es compacto, h tiene un mı́nimo y, digamos, lo toma en x̄. Por el paso 3, x̄ ∈ / ∂R, ya que h(x0 ) < h(x) para x ∈ ∂R. Ası́ que x̄ ∈ R0 , y entonces, por la proposición 3.13, Dj (h(x̄)) = 0 para todo j. Esto significa que n X i=1 2(y i − f i (x̄))Dj f i (x̄) = 0 37 3. Teorema de la función inversa para cada j = 1, . . . , n. Pero, como la matriz (D j f i (x̄)) es no singular, y i − f i (x̄) = 0 para todo i. Por lo tanto, f (x̄) = y. La unicidad se sigue del paso 2. Paso 5. Para y1 , y2 ∈ W , |f −1 (y1 ) − f −1 (y2 )| ≤ 2|y1 − y2 |. Se sigue fácilmente del paso 2. Además, cuando restringimos f a V = f −1 (W ) ∩ R0 , f −1 : W → V . Llegamos entonces al final de la demostración. Paso 6. f −1 : W → V es diferenciable y, para y ∈ W , D(f −1 )(y) = Df (f −1 (y))−1 . Sean y ∈ W , x = f −1 (y) y S = Df (x). Queremos demostrar que f −1 es diferenciable en y y que Df −1 (y) = S −1 , es decir |f −1 (z) − f −1 (y) − S −1 (z − y)| = 0. z→y |z − y| lı́m Sea u = f −1 (z), y definimos ϕ(u) = f (u) − f (x) − S(u − x). Entonces |ϕ(u)| = 0. u→x |u − x| lı́m Pero S −1 ϕ(u) = S −1 (z − y) − (f −1 (z) − f −1 (y)), es decir, f −1 (z) − f −1 (y) − S −1 (z − y) = −S −1 ϕ(u). Lo que queremos mostrar entonces es que |S −1 ϕ(f −1 (z))| = 0. z→y |z − y| lı́m Sea M > 0 tal que |S −1 v| ≤ M |v| para todo v ∈ Rn . Entonces, por el paso 5, |S −1 ϕ(f −1 (z))| M |ϕ(f −1 (z))| |f −1 (z) − f −1 (y)| ≤ −1 |z − y| |f (z) − f −1 (y)| |z − y| ≤ 2M |ϕ(f −1 (z))| |f −1 (z) − f −1 (y)| para todo z ∈ R, z 6= y, lo cual converge a 0 cuando z → y. 38 4. 3. Diferenciabilidad Teorema de la función implı́cita Teorema 3.26 (Función Implı́cita). Sea f : R n × Rm → Rm continuamente diferenciable alrededor de (x0 , y0 ) ∈ Rn × Rm y f (x0 , y0 ) = 0. Sea M la matriz de m × m dada por (Dn+j f i (x0 , y0 )), i, j = 1, . . . m, y suponemos que det M 6= 0. Entonces existe un abierto U ⊂ R n × Rm , x0 ∈ U , y un abierto V ⊂ Rm , y0 ∈ V , tales que, para cada x ∈ U , existe un único g(x) ∈ V tal que f (x, g(x)) = 0. Más aún, g es diferenciable. Es decir, la ecuación f (x, y) = 0 define implı́citamente y como función de x, siempre y cuando las derivadas en y formen una matriz no singular. La demostración del Teorema de la Función Implı́cita se sigue del Teorema de la Función Inversa. Demostración. Sea F : Rn × Rm → Rn × Rm la función definida por F (x, y) = (x, f (x, y)). Entonces la matriz Jacobiana F 0 (x0 , y0 ) está dada por 1 ... 0 0 ... 0 0 ... 0 0 ... 0 .. .. .. .. .. .. . . . . . . , 0 ... 1 0 ... 0 D1 f 1 (x0 , y0 ) . . . Dn f 1 (x0 , y0 ) Dn+1 f 1 (x0 , y0 ) . . . Dn+m f 1 (xo , y0 ) .. .. .. .. . . . . . . . . . . D1 f m (x0 , y0 ) . . . Dn f m (x0 , y0 ) Dn+1 f m (x0 , y0 ) . . . Dn+m f m (xo , y0 ) es decir, es de la forma F 0 (x0 , y0 ) = Id 0 ? M , ası́ que det F 0 (x0 , y0 ) = det M 6= 0. Por el teorema de la función inversa, existe un abierto U × V alrededor de (x0 , y0 ) y un abierto W alrededor de F (x0 , y0 ) tales que F : U × V → W tiene inversa F −1 : W → U × V y es diferenciable. No es difı́cil ver que esta inversa es de la forma F −1 (u, v) = (u, h(u, v)), Para (u, v) ∈ W , y h : W → V es diferenciable. 39 4. Teorema de la función implı́cita Como F −1 (x, y) = (x, h(x, y)), (x, y) = F (x, h(x, y)) = (x, f (x, h(x, y))), por lo que (3.3) f (x, h(x, y)) = y. Ası́ que f (x, h(x, 0)) = 0, y por lo tanto podemos escoger g(x) = h(x, 0). Es fácil calcular Dg(x) para cada x ∈ U : Como f (x, g(x)) = 0, f i (x, g(x)) = 0 para cada i = 1, 2, ..., m. Calculando la j-ésima derivada parcial utilizando la regla de la cadena, m X Dn+l f i (x, g(x))Dj g l (x) = 0. (3.4) Dj f i (x, g(x)) + l=1 Ahora bien, 3.4 es un sistema lineal con m ecuaciones y m variables, y, además, det Dn+l f i (x, g(x)) i,l 6= 0. Ası́ que podemos resolver, de forma unı́voca, para cada D j g l (x). Veamos esto a través de un ejemplo. Ejemplo 3.27. Consideremos la ecuación x2 y + 2xy 2 = 0, alrededor del punto (1, 1). Como D2 f (1, 1) = x2 + 4xy (1,1) 6= 0, la ecuación define implı́citamente y como función de x, digamos y = g(x), en una vecindad de (1, 1). Sean f (x, y) = x2 y + 2xy 2 y F (x) = f (x, g(x)). Entonces F 0 (x) = D1 f (x, g(x)) + D2 f (x, g(x))g 0 (x) = 0, es decir (2xg(x) + 2g(x)2 + (x2 + 4xg(x))g 0 (x) = 0, de donde obtenemos que g 0 (x) = − Usualmente se escribe 2xg(x) + 2g(x)2 . x2 + 4xg(x) dy 2xy + 2y 2 =− 2 . dx x + 4xy 40 3. Diferenciabilidad El Teorema de la Función Implı́cita, a través de la ecuación (3.3), implica que la función f es localmente una proyección sobre el espacio R m . Este resultado es conocido como el Teorema del Rango. Recordemos que, si M es una matriz de n × m, su rango ρ(M ) es el número máximo de columnas linealmente independientes de M . Es decir, la dimensión de su imagen en Rm . Teorema 3.28 (Rango). Sea f : Rn → Rm continuamente diferenciable alrededor de x0 y f (x0 ) = 0. Suponemos que m ≤ n y que f 0 (x0 ) tiene rango igual a m. Entonces existe un abierto U ⊂ R n , x0 ∈ U , y una función Ψ : U → Rn diferenciable tal que f ◦ Ψ(x1 , . . . , xn ) = (xn−m+1 , . . . , xn ). Demostración. Como ρ(f 0 (x0 )) = m, f 0 (x0 ) tiene m columnas linealmente independientes, digamos las columnas j 1 < j2 < . . . < jm . Sea g : Rn → Rn una permutación tal que (x1 , x2 , . . . , xn ) = g(. . . , xj1 , . . . , xjm ). Es decir, g manda las últimas m coordenadas de cada punto en R n a las coodernadas j1 , . . . , jm . Entonces f ◦ g : Rn−m × Rm → Rm satisface las hipótesis del Teorema de la Función Implı́cita, ası́ que existe H : R n → Rn tal que f ◦ g ◦ H(x1 , . . . , xn ) = (xn−m+1 , . . . , xn ). Nota que H es de la forma (x0 , x00 ) 7→ (x0 , h(x0 , x00 )), como en la ecuación (3.3). Entonces tomamos Ψ = g ◦ H. 5. Derivadas de orden mayor Si la función f : Rn → Rm es diferenciable, las derivadas parciales Di f (x) existen, y pueden ser ellas mismas diferenciables. Si cada D i f (x) es diferenciable, entonces sus derivadas parciales existen y se denominan derivadas parciales de segundo orden de f . Éstas se denotan por Dij f (x) = Dj (Di f )(x). Similarmente, las derivadas parciales de orden k se denotan por Di1 i2 ...ik f (x) = Dik · · · (Di2 (Di1 f ))(x). En general, Dij f (x) 6= Dji f (x), como lo muestra el siguiente ejemplo. Ejemplo 3.29. Sea f : R2 → R dada por 2 2 xy(x − y ) (x, y) 6= (0, 0) f (x, y) = x2 + y 2 0 (x, y) = (0, 0). 41 5. Derivadas de orden mayor Sus derivadas parciales están dadas por 4 2 3 5 x y + 4x y − y (x2 + y 2 )2 D1 f (x, y) = 0 5 3 2 4 x − 4x y − xy (x2 + y 2 )2 D2 f (x, y) = 0 Para (x, y) 6= (0, 0), D12 f (x, y) = D21 f (x, y) = (x, y) 6= (0, 0) (x, y) = (0, 0), (x, y) 6= (0, 0) (x, y) = (0, 0). x6 + 9x4 y 2 − 9x2 y 4 − y 6 . (x2 + y 2 )3 Sin embargo, D12 f (0, 0) = lı́m h→0 D1 f (0, h) − D1 f (0, 0) = −1, h y D2 f (h, 0) − D2 f (0, 0) = 1, h por lo que D12 f (0, 0) 6= D21 f (0, 0). D21 f (0, 0) = lı́m h→0 Nota que, en el ejemplo anterior, D12 f y D21 f no son continuas en (0, 0). De hecho, ni siquiera tienen limite en (0, 0). Sin embargo, tenemos el siguiente el teorema. Teorema 3.30. Si Dij f y Dji f existen en una vecindad de x0 y son continuas en x0 , entonces Dij f (x0 ) = Dji f (x0 ). Demostración. Suponemos primero que f : R 2 → R, i = 1, j = 2, y definimos F : R2 → R, por F (x) = f (x0 + x). Tenemos entonces que D1 F (0) = D1 f (x0 ), D12 F (0) = D12 f (x0 ), D2 F (0) = D2 f (x0 ) D21 F (0) = D21 f (x0 ). Si definimos G : R2 → R por G(x1 , x2 ) = F (x2 , x1 ), D1 G(0) = D2 F (0) y D12 G(0) = D21 F (0). Queremos demostrar entonces que D12 G(0) = D12 F (0). En búsqueda de una contradicción, suponemos que es falso y, sin pérdida de generalidad, D12 F (0) > D12 G(0). 42 3. Diferenciabilidad Como ambas derivadas son continuas en (0, 0), existe un rectángulo R = [−ε, ε] × [−ε, ε] tal que D12 F (x) − D12 G(x) > 0 para x ∈ R. Entonces D2 (D1 (F − G))(x1 , x2 ) > 0 para (x1 , x2 ) ∈ [−ε, ε] × [−ε, ε], ası́ que x2 7→ D1 (F − G)(x1 , x2 ) es estrictamente creciente en [−ε, ε] para cada x 1 ∈ [−ε, ε]. En particular, tenemos que D1 (F − G)(x1 , ε) > D1 (F − G)(x1 , −ε). Si definimos H : [−ε, ε] → R por H(x1 ) = (F − G)(x1 , ε) − (F − G)(x1 , −ε), H 0 (x) > 0 en [−ε, ε], por lo que es estrictamente creciente en [−ε, ε] y entonces (3.5) H(ε) > H(−ε). Pero y H(ε) = F (ε, ε) − G(ε, ε) − F (ε, −ε) + G(ε, −ε) H(−ε) = F (−ε, ε) − G(−ε, ε) − F (−ε, −ε) + G(−ε, −ε), y, como G(x1 , x2 ) = F (x2 , x1 ), H(ε) = −F (ε, −ε) + F (−ε, ε) = H(−ε) = F (−ε, ε) − F (ε, −ε), por lo que H(ε) = H(−ε), lo cual es una contradicción con (3.5). En el caso general, definimos φ : R2 → R por i-ésimo φ(u, v) = f (x10 , . . . , jésimo z}|{ z}|{ u , . . . , v , . . . , xn0 ). Entonces Dij f (x0 ) = D12 φ(xi0 , xj0 ) y Dji f (x0 ) = D21 φ(xi0 , xj0 ), y el teorema se sigue. Definición 3.31. Decimos que f : Rn → R es de clase C k , k = 1, 2, . . ., y escribimos f ∈ C k , si las derivadas parciales de orden k Di1 i2 ...ik f (x) existen y son continuas. Decimos que f es de clase C 0 , o simplemente de clase C, y escribimos f ∈ C 0 (f ∈ C, respectivamente), si f es continua. Decimos que f es de clase C ∞ , denotado f ∈ C ∞ , si todas las derivadas parciales de cualquier orden existen. Es decir, f ∈ C k para todo k ≥ 1. 43 5. Derivadas de orden mayor Ejemplo 3.32. Sea, para k = 0, 1, 2, . . ., xk sen 1 fk (x) x 0 x 6= 0 x = 0. La diferenciabilidad de cada fk es descrita por la siguiente tabla. k En 0, fk es Clase 0 discontinua ninguna 1 continua C 0 2 diferenciable, fk no continua C 3 diferenciable con fk0 continua C1 4 fk0 diferenciable, fk00 no continua C1 5 fk00 continua, pero no diferenciable C2 (n−1) (n) 2n fk diferenciable, pero fk no continua C n−1 (n) 2n + 1 fk continua, pero no diferenciable Cn Sea f : Rn → R una función de clase C k . Definimos φ : R → R por φ(t) = f (x0 + t(x − x0 )) = f (x10 + t(x1 − x10 ), . . . , xn0 + t(xn − xn0 )). Entonces φ(0) = f (x0 ) y φ(1) = f (x). Como f ∈ C k (Rn ), φ ∈ C k (R) y φ (k) (t) = n X i1 ,i2 ,...,ik =1 Di1 i2 ...ik f (x0 + t(x − x0 )) Por el teorema de Taylor, existe c ∈ [0, 1] tal que φ(1) = φ(0) + φ0 (0) + ... + donde k Y l=1 (xil − xi0l ). φk−1 (0) + Rk , (k − 1)! φk (c) . k! Estas observaciones implican el siguiente teorema. Rk = Teorema 3.33. Si f ∈ C k , x0 , x ∈ Rn , entonces existe y entre x0 y x tal que (3.6) f (x) = f (x0 ) + n X i=1 + ... + 1 (k − 1)! donde Rk (x) = 1 k! Di f (x0 )(xi − xi0 ) n X Di1 i2 ...ik−1 f (x0 ) i1 ,i2 ,...,ik =1 n X i1 ,i2 ,...,ik =1 k−1 Y l=1 Di1 i2 ...ik f (y) k Y l=1 (xil − xi0l ) + Rk (x), (xil − xi0l ). 44 3. Diferenciabilidad Al polinomio de la ecuación (3.6) se le llama polinomio de Taylor alrededor de x0 de f . Si f ∈ C ∞ , podemos calcular tantos sumandos como queramos, y a la serie ası́ obtenida se le llama expansión de Taylor alrededor de x0 . Si esta serie converge a f (x), es decir R k (x) → 0, en una vecindad de x0 , entonces decimos que f es analı́tica real en x 0 . Ejemplo 3.34. Sea f (x, y) = sen xy. Entonces f (0, 0) = 0, y D1 f (x, y) = y cos xy, D1 f (0, 0) = 0 D2 f (x, y) = x cos xy, D2 f (0, 0) = 0 2 D11 f (x, y) = −y sen xy, D11 f (0, 0) = 0 D12 f (x, y) = cos xy − xy sen xy, D21 f (x, y) = cos xy − xy sen xy, 2 D22 f (x, y) = −x cos xy, D12 f (0, 0) = 1 D21 f (0, 0) = 1 D22 f (0, 0) = 0. Entonces, los primeros términos de la expansión de Taylor alrededor de (0, 0) de sen xy son 1 (1(x − 0)(y − 0) + 1(y − 0)(x − 0)) = xy. 2 Nota que coinciden con el primer término de la expansión de sen w, con w = xy. Si una función es de clase C ∞ , entonces no necesariamente es analı́tica. De hecho, es posible que la expansión converja a un lı́mite distinto de f (x), como lo muestra que el siguiente ejemplo. Ejemplo 3.35. Consideremos la función f : R → R dada por f (x) = ( 1 e − x2 0 x 6= 0 x = 0. Entonces f es de clase C ∞ , pero f (k) (0) para todo k. Entonces la expansión Taylor de f alrededor de 0 es idénticamente 0, pero f (x) 6= 0 para todo x 6= 0. 45 Ejercicios Ejercicios 1. Demuestra que las derivadas direccionales de f : R n → R en x0 satisfacen Dtu f (x0 ) = tDu f (x0 ), Du+v f (x0 ) = Du f (x0 ) + Dv f (x0 ) si f es diferenciable en x0 . 2. Decimos que f : Rn → R es homogénea de grado α si f (tx) = t α f (x), para x ∈ Rn , t > 0. Si además f es diferenciable, muestra la fórmula de Euler n X xi Di f (x) = αf (x). i=1 3. Si f : Rn → R es diferenciable y f (0) = 0, demuestra que existen gi : Rn → R tal que n X f (x) = xi gi (x). i=1 4. Demuestra la proposición 3.13. 5. Demuestra la proposición 3.14. 6. Sea A ⊂ Rn abierto y f : A → Rn inyectiva y continuamente diferenciable tal que det f 0 (x) 6= 0 para todo x ∈ A. Muestra que f (A) es abierto y f −1 : f (A) → A es diferenciable. Muestra además que f (B) es abierto para todo B ⊂ A abierto. 7. 8. a) Sea f : R2 → R continuamente diferenciable. Muestra que f no es inyectiva. (Sugerencia: Considera la función g(x, y) = f (x, y), y .) b) Generaliza este resultado a funciones continuamente diferenciables f : Rn → Rm , con m < n. a) Muestra que si f : R → R satisface f 0 (x) 6= 0 para todo x ∈ R, entonces f es inyectiva. b) Sin embargo, muestra que f : R2 → R2 dada por f (x, y) = (ex cos y, ey sen y) satisface det f 0 (x, y) 6= 0 para todo (x, y) ∈ R2 , pero no es inyectiva. 9. Sea f : Rn → Rn continuamente diferenciable tal que existe c > 0 tal que |f (x) − f (y)| ≥ c|x − y| n para todo x, y ∈ R . Muestra que a) f es inyectiva; b) det f 0 (x) 6= 0 para todo x ∈ Rn ; y 46 3. Diferenciabilidad c) f (Rn ) = Rn . (Sugerencia: Como en la demostración del Teorema de la Función Inversa, considera la función g(x) = |y − f (x)| 2 .) 10. Sea f : R → R dada por f (x) = ( 1 e − x2 0 x 6= 0 x = 0. Muestra por inducción que, para x 6= 0, k = 1, 2, . . ., Pk (x) − 12 f (k) (x) = e x , Qk (x) donde Pk y Qk son polinomos. Concluye que f ∈ C ∞ y f (k) (0) = 0 para todo k.