Lección 19 Función inversa 19.1. Diferencial de la función inversa En la demostración del teorema principal usaremos la proposición siguiente, que es la regla para estudiar la diferenciabilidad de la inversa de una función diferenciable e inyectiva. Proposición. Sean X,Y espacios normados, Ω un abierto de X , f : Ω → Y una función inyectiva y consideremos la función inversa f −1 : f (Ω) → X . Si a ∈ Ω y b = f (a) , supongamos que f es diferenciable en el punto a y que b ∈ f (Ω)◦ . Entonces, las siguientes afirmaciones son equivalentes: (i) f −1 es diferenciable en el punto b . (ii) f −1 es continua en b , D f (a) es biyectiva y D f (a)−1 ∈ L(Y, X) . En caso de que se cumplan (i) y (ii) se tiene: D f −1 (b) = D f (a)−1 . En el caso particular X = Y = RN , del teorema de Hausdorff deducimos que D f (a)−1 es continua, siempre que D f (a) sea biyectiva, puesto que D f (a)−1 es una aplicación lineal definida en un espacio normado de dimensión finita. Por tanto, para asegurarnos que f −1 es diferenciable en b bastará comprobar que es continua en b y que D f (a) es biyectiva. Por otra parte, para cada T ∈ L(RN , RN ) podemos considerar la matriz AT ∈ MN×N que representa a T en la base usual de RN , así que, cuando T = D f (a) tenemos AT = J f (a) . Sabemos que T ∈ L(RN , RN ) es biyectiva si, y sólo si, el determinante de la matriz cuadrada AT no se anula: det AT 6= 0 . Es fácil ver que la aplicación T 7→ det AT , de L(RN , RN ) en R , es continua, por tratarse de una suma de productos de funciones continuas. Por tanto, el conjunto T ∈ L(RN , RN ) : det AT 6= 0 de todas la aplicaciones lineales biyectivas de RN en sí mismo, es un subconjunto abierto del espacio normado L(RN , RN ) . 122 19. Función inversa 123 Teorema de la función inversa. Sea Ω un abierto de RN y sea f : Ω → RN una función diferenciable en todo punto de Ω . Supongamos además que la función D f : Ω → L(RN , RN ) es continua en un punto a ∈ Ω y que D f (a) es biyectiva, es decir, det J f (a) 6= 0 . Entonces existe un abierto U de RN con a ∈ U ⊂ Ω , que verifica las siguientes afirmaciones: (i) (ii) (iii) (iv) f es inyectiva en U. V = f (U) es un abierto de RN . det J f (x) 6= 0 para todo x ∈ U. Denotando por ϕ a la restricción de f a U, con lo que ϕ : U → V es biyectiva,−1para −1 −1 f (x) = D f (x) . todo x ∈ U se tiene que ϕ es diferenciable en f (x) con Dϕ Demostración. Empezamos reduciendo el problema, en dos pasos, a una situación más cómoda. Concretamente, salvo dos traslaciones, podemos suponer que a = f (a) = 0 . En otro caso, bastaría sustituir f por la función f0 : Ω0 → RN , donde Ω0 = {x ∈ RN : a + x ∈ Ω} f0 (x) = f (a + x) − f (a) ∀ x ∈ Ω0 y que evidentemente verifican 0 ∈ Ω0 y f0 (0) = 0 . Las hipótesis sobre f se trasladan fácilmente a f0 y, una vez demostrado el teorema para f0 , sus afirmaciones se trasladan de vuelta a f . Para simplificar aún más la situación, admitido que a = f (a) = 0 , podemos además suponer que D f (0) = Id es la identidad en RN . Esta vez la reducción se consigue considerando la función f1 : Ω → RN dada por f1 = D f (0)−1 ◦ f . Es claro que seguimos teniendo f1 (0) = 0 y la regla de la cadena nos asegura que f1 es diferenciable en todo punto de Ω con D f1 (x) = D f (0)−1 ◦ D f (x) ∀ x ∈ Ω , y en particular, D f1 (0) = Id También es claro que D f1 es continua en 0 , pues para todo x ∈ Ω se tiene k D f1 (x) − D f1 (0) k 6 k D f (0)−1 k k D f (x) − D f (0) k Así pues f1 verifica las mismas hipótesis que f , pero con la ventaja de que D f1 (0) = Id . Demostrado el teorema para f1 , todas sus afirmaciones se traducen de vuelta a f , como se puede comprobar rutinariamente, sin ninguna dificultad. Así pues, suponemos en adelante que: a = f (a) = 0 y D f (0) = Id La idea intuitiva es que, en un entorno del origen, la función f debe parecerse mucho a la función identidad, para la cual, todas las afirmaciones del teorema son evidentes. Para comparar ambas funciones, consideramos la diferencia, es decir, la función g : Ω → RN dada por g(x) = x − f (x) ∀x ∈ Ω Es claro que g(0) = 0 , así como que g es diferenciable en todo punto de Ω con Dg(x) = Id − D f (x) ∀x ∈ Ω Por tanto, Dg es continua en 0 con Dg(0) = 0 , luego existe δ1 > 0 tal que B(0, δ1 ) ⊂ Ω y k Dg(x) k 6 1/2 ∀ x ∈ B(0, δ1 ) 19. Función inversa 124 Por otra parte, sabemos que el conjunto W de todas las aplicaciones lineales biyectivas, es un abierto de L(RN , RN ) , luego un entorno de Id . Por ser D f continua en 0 con D f (0) = Id , tenemos que la imagen inversa por D f del conjunto W es un entorno de cero en Ω . Existe por tanto δ2 > 0 tal que B(0, δ2 ) ⊂ Ω y, para todo x ∈ B(0, δ2 ) se tiene D f (x) ∈ W , es decir, det J f (x) 6= 0 ∀ x ∈ B(0, δ2 ) Tomamos ahora r = (1/3) mı́n{δ1 , δ2 } con lo cual tenemos: x ∈ RN , k x k < 3 r =⇒ x ∈ Ω , k Dg(x) k 6 1/2 y det J f (x) 6= 0 (1) Puesto que B(0, 3r) es un subconjunto abierto y convexo de RN , el primer corolario del teorema del valor medio nos asegura que g es lipschitziana en dicho abierto con constante de Lipschitz menor o igual que 1/2 , es decir: x, z ∈ B(x, 3r) =⇒ k g(x) − g(z) k 6 (1/2) k x − z k (2) En particular, tomando z = 0 tenemos x ∈ B(x, 3r) =⇒ k g(x) k 6 (1/2) k x k (3) Llegamos al paso clave de la demostración: usando el teorema del punto fijo de Banach, probaremos lo siguiente: (*) Para todo y0 ∈ B (0, r) existe un único x0 ∈ B (0, 2r) tal que f (x0 ) = y0 . Además, si k y0 k < r , se tiene también k x0 k < 2r . Para probarlo observamos que, fijado y0 ∈ B (0, r) , para x ∈ B (0, 2r) se tiene f (x) = y0 ⇐⇒ g(x) = x − y0 ⇐⇒ g(x) + y0 = x (4) lo que nos hace pensar en un punto fijo de la aplicación x 7→ g(x) + y0 . Así pues, tomamos E = B (0, 2r) , que es un espacio métrico completo, por ser un subconjunto cerrado de RN , y definimos h(x) = g(x) + y0 ∀x ∈ E También para todo x ∈ E , usando (3) tenemos k h(x) k 6 k g(x) k + k y0 k 6 (1/2)k x k + k y0 k 6 2r luego h(E) ⊂ E . Además, h es contractiva, pues de (2) deducimos claramente que, k h(x) − h(z) k = k g(x) − g(z) k 6 (1/2) k x − z k ∀ x, z ∈ E Por el teorema del punto fijo, existe un único x0 ∈ E tal que h(x0 ) = x0 y, en vista de (4) , x0 es el único punto de B (0, 2r) tal que f (x0 ) = y0 . Por último, si k y0 k < 2r , razonando como antes tenemos k x0 k = k h(x0 ) k 6 (1/2) k x0 k + k y0 k 6 r + k y0 k < 2r . Queda así comprobada la afirmación (*) , y el resto de la demostración se obtendrá ya sin dificultad. 19. Función inversa 125 Concretamente tomamos V = B(0, r) y U = B(0, 2r) ∩ f −1 (V ) con lo que obviamente V es abierto, 0 ∈ U ⊂ RN y U también es abierto, ya que f es continua. Comprobamos ahora toda las afirmaciones del teorema. (i) . Si x, z ∈ U verifican que f (x) = f (z) , tomando y0 = f (x) ∈ V , de (*) deducimos que x = z = x0 , luego f es inyectiva en U. (ii) . Es obvio que f (U) ⊂ V pero, para todo y0 ∈ V , usando la última parte de (*) tenemos x0 ∈ U tal que f (x0 ) = y0 , luego V ⊂ f (U) y concluimos que f (U) = V es un abierto de RN . (iii) . Para x ∈ U tenemos k x k < 3r y (1) nos dice que det J f (x) 6= 0 . (iv) . En vista de (iii) y la proposición anterior, basta probar que ϕ−1 es continua. De hecho veremos que es lipschitziana con constante de Lipschitz menor o igual que 2 . Fijados y1 , y2 ∈ V , escribimos x1 = ϕ−1 (y1 ) y x2 = ϕ−1 (y2 ) con lo que tenemos x1 , x2 ∈ U , f (x1 ) = y1 y f (x2 ) = y2 . Por definición de g , deducimos x1 = y1 + g(x1 ) y x2 = y2 + g(x2 ) . Por tanto, usando (3) obtenemos k x1 − x2 k 6 k y1 − y2 k + k g(x1 ) − g(x2 ) k 6 k y1 − y2 k + (1/2) k x1 − x2 k Deducimos claramente que k ϕ−1 (y1 ) − ϕ−1 (y2 ) k = k x1 − x2 k 6 2 k y1 − y2 k ∀ y1 , y2 ∈ V En resumen, tenemos en primer lugar que ϕ es inyectiva. Además, fijado x ∈ U , tenemos que ϕ es diferenciable en x y que ϕ(x) ∈ ϕ(U)◦ = V . Por último, sabemos que ϕ−1 es continua en ϕ(x) , así como que Dϕ(x) = D f (x) es biyectiva. La regla de diferenciación de la función inversa nos dice que ϕ−1 es diferenciable en f (x) con Dϕ−1 f (x) = Dϕ(x)−1 = D f (x)−1 ∀x ∈ U Esto concluye la demostración de (iv) y, por tanto, la del teorema.