1. Funciones diferenciables Volvamos sobre el significado de la derivada de una función real de una variable real, Como vimos en el capı́tulo anterior, f : (a, b) −→ R derivable en x0 , equivale a que Funciones Diferenciables. Regla de la Cadena lim x→x0 lo que a su vez equivale a que lim x→x0 Funciones . . . f (x) − f (x0 ) = f 0 (x0 ) x − x0 f (x) − f (x0 ) − f 0 (x0 )(x − x0 ) f (x) − y(x) = lim =0 x→x x − x0 x − x0 0 donde y(x) = f (x0 ) + f 0 (x0 )(x − x0 ) es la ecuación de la recta tangente a la gráfica de f en x0 . Regla de la Cadena JJ II J I f (x) Funciones Diferenciables. Regla de la Cadena f (x0 ) x0 Funciones . . . Regla de la Cadena x→x0 II J I x Con cualquier recta y(x) = f (x0 ) + m(x − x0 ) que pase por el punto (x0 , f (x0 ) y tenga pendiente m, el lı́mite lim JJ y(x) f (x) − y(x) x − x0 es una indeterminación del tipo 0/0, pero sólo en el caso de la recta tangente, el valor del lı́mite es cero. En el caso de funciones de dos variables, para que el plano generado por las rectas tangentes en las direcciones de los ejes sea de verdad un plano tangente a la gráfica de f en x0 se necesita que lim f (x, y) − f (x0 , y0 ) − (x,y)→(x0 ,y0 ) df (x0 , y0 )(x dx − x0 ) − df (x0 , y0 )(y dy k(x, y) − (x0 , y0 )k − y0 ) =0 y Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I df df (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) dx dy es la ecuación del plano tangente Esta fórmula se puede generalizar para funciones vectoriales de n variables, buscando la ecuación de un subespacio afı́n de dimensión n en Rm , que pase por F (x~0 ) que sea“tangente” a F. Llamando {v~1 , . . . , v~n } a la familia de los vectores directores del subespacio, su ecuación es de la forma ~ 0 ) + h1 v~1 + · · · + hn v~n ~x = F (x z(x, y) = f (x0 , y0 ) + donde h1 , . . . , hn son números reales. Escribiendo las coordenadas de cada vector, ponemos v~i = (vi1 , . . . , vim ) para cada i entre 1 y n, y la ecuación anterior queda h1 x1 f1 (x0 ) v11 . . . vn1 .. .. .. .. .. .. + . . = . . . . fm (x0 ) v1m . . . vnm hn xm La aplicaciónL : Rn −→ Rm definida por v11 . . . vn1 .. .. L(h1 , . . . , hn ) = ... . . v1m . . . vnm Funciones Diferenciables. Regla de la Cadena h1 .. . hn es una aplicación lineal de Rn en Rm , asociada al espacio afı́n, de modo que la ecuación del subespacio se puede escribir ~ 0 ) + L(~h); ~h ∈ Rn ~x = F (x La descripción analı́tica del hecho de que este subespacio afı́n sea tangente a la imagen de F en x0 se expresa de la siguiente manera Funciones . . . Regla de la Cadena F (x~0 + ~h) − F (x~0 ) − L(~h) ~ =0 ~h→0 k~hk lim JJ II J I o para que se parezca más a las ecuaciones anteriores de la recta y el plano tangente, llamando x = x0 + h lim ~ x→x~0 F (~x) − F (x~0 ) − L(~x − x~0 ) ~ =0 k~x − x~0 k Definición (Función diferenciable). Sea U un abierto de Rn , F : U −→ Rm una función, y x0 ∈ U un punto de U . Se dice que F es diferenciable en x0 si existe una aplicación lineal Lx0 : Rn −→ Rm que verifica Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I F (x~0 + ~h) − F (x~0 ) − Lx0 (~h) ~ = 0 (∈ Rm ) ~ ~h→0 khk lim Esta aplicación lineal se denomina ”diferencial de F en x0 ”, y se denota por dF (x0 ) Observaciones: 1. dF (x0 ) está bien definida, en el sentido de que si existe alguna aplicación lineal cumpliendo la condición de arriba, es única. Funciones Diferenciables. Regla de la Cadena En efecto, supongamos que además de Lx0 hay otra aplicación lineal L de Rn en Rm , L 6= Lx0 , que verifica también F (x0 + h) − F (x0 ) − L(h) =0 h→0 khk lim Entonces Funciones . . . Regla de la Cadena JJ II J I F (x0 + h) − F (x0 ) − L(h) F (x0 + h) − F (x0 ) − Lx0 (h) = lim =0 h→0 h→0 khk khk lim y pasando todo al mismo lado de la igualdad F (x0 + h) − F (x0 ) − L(h) F (x0 + h) − F (x0 ) − Lx0 (h) lim − =0 h→0 khk khk de donde, operando, queda L(h) − Lx0 (h) =0 h→0 khk lim Ahora bien, si L 6= Lx0 , existe algún vector v 6= 0 en Rn tal que L(v) 6= Lx0 (v). Consideramos la sucesión vn = v/n, que es una sucesión que tiende a cero, y L(vn ) − Lx0 (vn ) = kvn k Funciones Diferenciables. Regla de la Cadena − n1 Lx0 (v) L(v) − Lx0 (v) = 1 kvk kvk n es constante, y no tiende a cero cuando n tiende a infinito, lo que es una contradicción. Ası́ que necesariamente tienen que ser L y Lx0 iguales. 2. Llamando x = x0 + h, la condición de diferenciabilidad es equivalente a lim ~ x→x~0 Funciones . . . 1 L(v) n F (~x) − F (x~0 ) − L(~x − x~0 ) ~ =0 k~x − x~0 k Regla de la Cadena 3. Si n = m = 1, f : R −→ R es diferenciable en x0 si y sólo si es derivable. La aplicación lineal df (x0 ) en una aplicación de R en R, que tiene asociada una matriz 1 × 1. El único coeficiente de la matriz de df (x0 ) es exactamente la derivada f 0 (x0 ) JJ II J I En efecto, si f es diferenciable en x0 , la aplicación df (x0 ) es una aplicación lineal de R en R, que tiene una matriz 1 × 1 con un sólo elemento a, de modo que df (x0 ) : R −→ R h −→ (a)(h) = ah Entonces al escribir la condición de diferenciabilidad, queda f (x0 + h) − f (x0 ) − df (x0 )(h) f (x0 + h) − f (x0 ) − ah = lim =0 h→0 h→0 |h| |h| lim Funciones Diferenciables. Regla de la Cadena Esto equivale a que f (x0 + h) − f (x0 ) − ah =0 lim h→0 h es decir, f es derivable en x0 y f 0 (x0 ) = a Funciones . . . Regla de la Cadena JJ II J I 4. En el caso general f : Rn −→ Rm , la matriz asociada a dF (x0 ) es una matriz (m × n) de m filas y n columnas. Las columnas de la matriz son los transformados de los elementos de la base canónica de Rn . De otra forma, escribiendo las componentes de la aplicación dF (x0 )(h) = (l1 (h), . . . , lm (h)), las funciones componentes li : Rn −→ R son lineales, y tienen asociadas matrices (1 × n) de una sola fila, que se corresponden con las filas de la matriz de dF (x0 ) Ejemplo 1. Una función constante F : U −→ Rm , F (x) = y0 para todo x ∈ U es diferenciable, y dF (x) = 0 en cualquier punto de U En efecto, si calculamos el cociente Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I F (x + h) − F (x) − dF (x)(h) y0 − y0 − 0 = =0 khk khk luego trivialmente el lı́mite tiende a cero cuando h tiende a 0 Ejemplo 2. Una función lineal F : Rn −→ Rm es diferenciable en todo punto x ∈ Rn , y dF (x) = F En este caso, si utilizamos que F es lineal en el numerador del cociente F (x + h) − F (x) − dF (x)(h) F (x) + F (h) − F (x) − F (h) = =0 khk khk y también tiende a cero cuando h tiende a 0. Por ejemplo, F (x, y) = (x + y, 3x, 2y − x), F es una función lineal de R2 en R3 , que se puede escribir en forma matricial como 1 1 x f (x, y) = 3 0 y −1 2 F es diferenciable en cualquier punto, y 1 1 dF (x, y) = 3 0 −1 2 Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I para todo (x, y) en R2 N En general, será más difı́cil saber si una función es o no diferenciable en un punto. En primer lugar, serı́a necesario saber cuál podrı́a ser la aplicación lineal que cumpla la condición de diferenciabilidad, y en segundo lugar, comprobar que de verdad cumple esa condición. Para dar el primer paso, y calcular cuál puede ser la diferencial de una función en un punto, utilizaremos los teoremas siguientes. Teorema. Sea U un conjunto abierto de Rn , x0 un punto de U y F : U −→ Rm una función. F es diferenciable en x0 si y sólo si cada una de sus funciones componentes fi es diferenciable en x0 . Además entonces para cada i entre 1 y m, dfi (x0 ) = dF (x0 )i (la diferencial de la componente i-ésima de F es la componente i-ésima de la diferencial de F ) Funciones Diferenciables. Regla de la Cadena Funciones . . . Demostración: Si L es una aplicación lineal de Rn en Rm , de componentes L = (l1 , . . . , lm ), tenemos F (x) − F (x0 ) − L(x − x0 ) = kx − x0 k f1 (x) − f1 (x0 ) − l1 (x − x0 ) fm (x) − fm (x0 ) − lm (x − x0 ) = ,..., kx − x0 k kx − x0 k Regla de la Cadena JJ II J I Si F es diferenciable en x0 , existe una aplicación L = dF (x0 ) de modo que ese cociente tiende a cero cuando x tiende a x0 , con lo que cada una de sus coordenadas tiende a cero, y por tanto cada función fi es diferenciable en x0 , y su diferencial es dfi (x0 ) = li = dF (x0 )i Recı́procamente, si cada fi es diferenciable, existen aplicaciones li = dfi (x0 ) de modo que en el cociente anterior cada una de las coordenadas tiende a cero cuando x tiende a x0 . Entonces F es diferenciable en x0 , y su diferencial es la aplicación L = (df1 (x0 ), . . . , dfm (x0 )) N Teorema (Funciones diferenciables y derivadas direccionales). Sea U un conjunto abierto de Rn , x0 un punto de U y F : U −→ Rm . Si F es diferenciable en x0 , entonces existen todas las derivadas direccionales de F en x0 , y dv F (x0 ) = dF (x0 )(v) Funciones Diferenciables. Regla de la Cadena para todo v ∈ Rn \ {0} Demostración: Sabemos que F (x0 + h) − F (x0 ) − dF (x0 )(h) =0 h→0 khk lim Funciones . . . Regla de la Cadena JJ II J I Sea entonces v ∈ Rn \ {0}, y consideremos los vectores h = tv. Cuando t tiende a cero, se tiene F (x0 + tv) − F (x0 ) − dF (x0 )(tv) = t→0 ktvk kF (x0 + tv) − F (x0 ) − dF (x0 )(tv)k lim = t→0 ktvk 1 kF (x0 + tv) − F (x0 ) − dF (x0 )(tv)k lim = kvk t→0 |t| F (x0 + tv) − F (x0 ) − tdF (x0 )(v) 1 = lim kvk t→0 t F (x0 + tv) − F (x0 ) 1 lim − dF (x )(v) 0 kvk t→0 t 0 = lim = Funciones Diferenciables. Regla de la Cadena = = = Funciones . . . Regla de la Cadena luego F (x0 + tv) − F (x0 ) = dF (x0 )(v) t→0 t es decir, existe la derivada de F en x0 en la dirección de v, y vale dv F (x0 ) = dF (x0 )(v) lim JJ II J I N Observaciones: El recı́proco del teorema anterior no es cierto: puede ocurrir que una función no sea diferenciable en un punto x0 , pero sı́ existan todas las derivadas direccionales en ese punto. Como consecuencia de los teoremas anteriores, podemos saber para una función F cuál es la única aplicación que puede ser su diferencial, si es que es diferenciable: Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I Funciones Diferenciables. Regla de la Cadena Teorema. Sea U un conjunto abierto de Rn , x0 un punto de U , y F : U −→ Rm . Si F es diferenciable en x0 , la matriz asociada a dF (x0 ) es df1 df1 (x ) . . . (x ) 0 0 dx1 dxn .. .. .. . . . dfm (x0 ) dx1 ... dfm (x0 ) dxn Demostración: La matriz asociada a dF (x0 ) está formada por las imágenes de los vectores de la base canónica de Rn , colocados en columnas, dF (x0 )(ei ). Ahora bien, según el teorema anterior, Funciones . . . Regla de la Cadena dF (x0 )(ei ) = dei F (x0 ) = dF df1 dfm (x0 ) = ( (x0 ), . . . , (x0 )) dxi dxi dxi N JJ II J I Definición (Matriz Jacobiana y Gradiente). La matriz df1 df1 (x0 ) . . . dx (x0 ) dx1 n .. .. .. . . . dfm (x0 ) dx1 ... dfm (x0 ) dxn Funciones Diferenciables. Regla de la Cadena se llama Matriz Jacobiana de F en x0 . Como una aplicación lineal tiene unı́vocamente asociada una matriz, suele identificarse la aplicación lineal dF (x0 ) con la matriz Jacobiana, aunque hay que tener cierta precaución, ya que puede ocurrir que exista la matriz (que existan las derivadas direccionales en las direcciones de los ejes de coordenadas) pero que la función no sea diferenciable, en cuyo caso la aplicación lineal definida por esa matriz no serı́a la diferencial de F en x0 . En el caso m = 1, la matriz tiene una sola fila, ya que F tiene una única componente, y df (x0 ) = ( df df (x0 ), . . . , (x0 )) dx1 dxn es un vector, que se llama Gradiente de f en x0 , y se denota por ∇f (x0 ) Funciones . . . Regla de la Cadena Mirando otra vez la matriz Jacobiana de F en x0 , las columnas son los vectores derivadas parciales de F en x0 , y las filas son los gradientes de las funciones componentes de F JJ II J I df1 (x0 ) dx1 ... .. .. . . dfm (x0 ) . . . dx1 df1 (x0 ) dxn .. = . dfm (x0 ) dxn dF (x0 ) dx1 ... ∇f1 (x0 ) .. dF (x0 ) = . dxn ∇fm (x0 ) Ejemplo 3. Calcular las derivadas parciales de la función xy si x2 + y 2 6= 0 x2 +y 2 f x, y) = 0 si x2 + y 2 = 0 Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I y estudiar si es diferenciable en (0, 0) Calculamos las derivadas de f en (0, 0) Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena df f ((0, 0) + t(1, 0)) − f (0, 0) (0, 0) = lim = t→0 dx t f (t, 0) − f (0, 0) 0−0 = lim =0 = lim t→0 t→0 t t df f ((0, 0) + t(0, 1)) − f (0, 0) (0, 0) = lim = t→0 dy t 0−0 f (0, t) − f (0, 0) = lim =0 = lim t→0 t→0 t t Si f es diferenciable en (0, 0), la diferencial tiene que ser df df df (0, 0) = (0, 0), (0, 0) = (0, 0) dx dy Hay que comprobar que JJ II J I f (x, y) − f (0, 0) − df (0, 0)(x, y) =0 (x,y)→(0,0) k(x, y)k lim Ahora bien f (x, y) − f (0, 0) − df (0, 0)(x, y) = k(x, y)k xy x2 +y 2 p −0−0 x2 + y2 = (x2 xy + y 2 )3/2 no tiene lı́mite cuando (x, y) tiende a (0, 0): por ejemplo, si tomamos puntos de la recta y = x con x → 0 queda x2 1 = 23/2 |x|3 23/2 |x| Funciones Diferenciables. Regla de la Cadena Funciones . . . que tiende a infinito cuando x tiende a cero. Por tanto f no es diferenciable en (0, 0) N En muchos casos, no será necesario estudiar directamente la diferenciabilidad de una función utilizando la definición, sino que podremos utilizar la estructura del conjunto de las funciones diferenciables; como ocurre con el estudio de la continuidad de funciones, el conjunto de las funciones diferenciables forma un espacio vectorial: la suma de funciones diferenciables en un punto, o el producto de una función diferenciable por un número, es también diferenciable. Regla de la Cadena JJ II J I Proposición. Sea U un conjunto abierto de Rn , x0 un punto de U , y F : U −→ Rm , G : U −→ Rm dos funciones diferenciables en x0 . Entonces F + G es diferenciable en x0 , y d(F + G)(x0 ) = dF (x0 ) + dG(x0 ), y para todo a ∈ R, aF es diferenciable en x0 y d(aF )(x= ) = adF (x0 ) La demostración se deja como ejercicio. Además en el caso de funciones escalares (de U en R), el producto de funciones diferenciables es diferenciables, y si el denominador no se anula, el cociente es diferenciable. Estos dos resultados se demuestran como casos particulares de un teorema más general, y más importante: la composición de funciones diferenciables es diferenciable. Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I 2. Regla de la Cadena Funciones Diferenciables. Regla de la Cadena Lema 1. Sea U un abierto de Rn , y F : U −→ Rm diferenciable en un punto x0 ∈ U . a) Existe una constante M0 > 0 tal que kdF (x0 )(~h)k ≤ M0 k~hk para todo ~h ∈ Rn . b) Para cada > 0 existe δ > 0 tal que si k~hk < δ entonces kF (x0 + ~h) − F (x0 ) − dF (x0 )(~h)k ≤ k~hk c) Existen dos constantes M1 > 0 y δ1 > 0 tal que si k~hk < δ1 entonces kF (x0 + ~h) − F (x0 )k ≤ M1 k~hk Funciones . . . Regla de la Cadena JJ II J I Demostración: El apartado (a) es consecuencia de que dF (x0 ) es una aplicación lineal de Rn en Rm , y por tanto continua. Para el apartado (b), de la definición de función diferenciable se deduce que para cada > 0 existe un δ > 0 tal que si 0 < k~hk ≤ δ entonces kF (x~0 + ~h) − F (x~0 ) − dF (x~0 )(~h)k ≤ k~hk luego kF (x0 + ~h) − F (x0 ) − dF (x0 )(~h)k ≤ k~hk si 0 < k~hk < δ, y evidentemente también si k~hk = 0 Ahora, de (a) y (b) se deduce tomando por ejemplo = 1, que existe δ1 > 0 tal que Funciones Diferenciables. Regla de la Cadena kF (x0 + ~h) − F (x0 )k ≤ kF (x0 + ~h) − F (x0 ) − dF (x0 )(~h)k + kdF (x0 )(~h)k ≤ ≤ k~hk + kdF (x0 )(~h)k ≤ (1 + M0 )k~hk = M1 k~hk si k~hk < δ1 Funciones . . . Regla de la Cadena JJ II J I N Observaciones: Si llamamos x = x0 + h, las desigualdades anteriores quedarı́an de la forma a) Existe una constante M0 > 0 tal que kdF (x0 )(x − x0 )k ≤ M0 kx − x0 k para todo x ∈ Rn . b) Para cada > 0 existe δ > 0 tal que si kx − x0 k < δ entonces kF (x) − F (x0 ) − dF (x0 )(x − x0 )k ≤ kx − x0 k c) Existen dos constantes M1 > 0 y δ1 > 0 tal que si kx − x0 k < δ1 entonces kF (x) − F (x0 )k ≤ M1 kx − x0 k Como consecuencia se obtiene de forma inmediata otro importante resultado: Teorema. Sea U un abierto de Rn , x0 un punto de U y F : U −→ Rm . Si F es diferenciable en x0 , entonces es continua en x0 . Funciones Diferenciables. Regla de la Cadena Demostración: Aplicando el lema anterior, sabemos que existen dos constantes δ1 y M1 tales que si kx−x0 k ≤ δ1 . kF (x) − F (x0 )k ≤ M1 kx − x0 k Entonces dado > 0 basta tomar δ = min{δ1 , /M1 }, y evidentemente si kx − x0 k ≤ δ entonces Funciones . . . Regla de la Cadena kF (x) − F (x0 )k ≤ M1 kx − x0 k ≤ M1 luego F es continua en x0 JJ II J I = M1 N Observaciones: El recı́proco de este resultado es falso: hay funciones continuas en un punto, que no son diferenciables en ese punto, como hay funciones continuas de una variable real que no son derivables en un punto. Hay incluso funciones continuas en un intervalo que no son derivables en ningún punto del intervalo. Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I Funciones Diferenciables. Regla de la Cadena Teorema (Regla de la Cadena). Sea U abierto de Rn, F : U −→ Rm diferenciable en x~0 ∈ U ; sea V abierto en Rm tal que F (x~0) ∈ V ; y sea G : V −→ Rp diferenciable en F (x~0). Entonces H = G ◦ F : U −→ Rp es diferenciable en x~0, y dH(x~0) = dG(F (x~0)) ◦ dF (x~0) Demostración: Hay que demostrar que Funciones . . . Regla de la Cadena I (Saltar al final de la demostración) H(x~0 + ~h) − H(x~0 ) − dG(F (x~0 )) ◦ dF (x~0 )(~h) =0 ~h→0 k~hk lim Operando en el numerador, podemos escribir JJ II J I kH(x~0 + ~h) − H(x~0 ) − dH(x~0 )(~h)k = = kG(F (x~0 + ~h)) − G(F (x~0 )) − dG(F (x~0 )) ◦ dF (x~0 )(~h)k = = kG(F (x~0 ) + [F (x~0 + ~h) − F (x~0 )]) − G(F (x~0 )) − dG(F (x~0 )) ◦ dF (x~0 )(~h)k = ~ = F (x~0 + ~h) − F (x~0 ), sumando y restando dG(F (x~0 ))(K), ~ aplicando la desigualdad poniendo K triangular de las normas, y la linealidad de dG(F (x~0 )), Funciones Diferenciables. Regla de la Cadena ~ − G(F (x~0 )) − dG(F (x~0 ))(K)+ ~ = kG(F (x~0 ) + K) ~ − dG(F (x~0 ))(dF (x~0 (~h))k ≤ +dG(F (x~0 ))(K) ~ − G(F (x~0 )) − dG(F (x~0 ))(K)k+ ~ ≤ kG(F (x~0 ) + K) ~ − dG(F (x~0 )) ◦ dF (x~0 )(~h)k = +kdG(F (x~0 ))(K) ~ − G(F (x~0 )) − dG(F (x~0 ))(K)k ~ + = kG(F (x~0 ) + K) | {z } N1 ~ − dF (x~0 )(~h)]k = kdG(F (x~0 ))[K {z } | N2 = N1 + N2 = N Funciones . . . Regla de la Cadena JJ II J I Sea ahora > 0. Como F es diferenciable en x~0 , por la propiedad (c) del lema anterior existen δ1 > 0, M1 > 0, tales que si k~hk < δ1 , entonces (i) kF (x~0 + ~h) − F (x~0 )k ≤ M1 k~hk Como G es diferenciable en F (x~0 ), existe una constante M0 > 0 tal que para todo ~j ∈ Rm (apartado (a) del lema anterior aplicado a G en F (x0 )) (ii) kdG(F (x0 ))(~j)k ≤ M0 k~jk y existe δ2 > 0 tal que si k~jk < δ2 , entonces (apartado (b) del lema anterior aplicado a G en F (x0 )) ~ kjk (iii) kG(F (x~0 ) + ~j) − G(F (x~0 )) − dG(F (x~0 ))(~j)k ≤ 2M1 Funciones Diferenciables. Regla de la Cadena También por ser F diferenciable en x~0 existe δ3 > 0 tal que si k~hk < δ3 , entonces (apartado (b) del lema anterior) ~ (iv) kF (x~0 + ~h) − F (x~0 ) − dF (x~0 )(~h)k ≤ khk 2M0 Definimos δ0 = min{δ1 , Mδ21 , δ3 }. Si 0 < k~hk < δ0 , se tiene: Por (i), Funciones . . . Regla de la Cadena JJ II J I ~ = kF (x~0 + ~h) − F (x~0 )k ≤ M1 k~hk ≤ M1 δ2 = δ2 kKk M1 ~ en el primer sumando de (N )obtenemos Por (iii) aplicado a ~j = K, ~ − G(F (x~0 )) − dG(F (x~0 ))(K)k ~ ≤ kKk ~ ≤ N1 = kG(F (x~0 ) + K) 2M1 (por (i) otra vez) ≤ M1 k~hk = k~hk 2M1 2 Y por (ii) y (iv), en el segundo sumando de (N ) queda ~ − dF (x~0 )(~h))k ≤ N2 = kdG(F (x~0 ))(K ~ − dF (x~0 )(~h)k = ≤ M 0 kK Funciones Diferenciables. Regla de la Cadena = M0 kF (x~0 + ~h) − F (x~0 ) − dF (x~0 )(~h)k ≤ ≤ M0 k~hk ≤ k~hk 2M0 2 Luego si 0 < k~hk < δ0 se tiene kH(x~0 + ~h) − H(x~0 ) − dG(F (x~0 )) ◦ dF (x~0 )(~h)k ≤ k~hk Funciones . . . Regla de la Cadena JJ II J I lo que prueba el resultado. J(Volver al enunciado) N Utilizando la regla de la cadena podemos demostrar fácilmente el siguiente resultado: Funciones Diferenciables. Regla de la Cadena Teorema. Sea U abierto de Rn , y f : U −→ R, g : U −→ R dos funciones diferenciables en un punto x0 ∈ U . Entonces a) el producto f g es diferenciable en x0 , y d(f g)(x0 ) = g(x0 )df (x0 ) + f (x0 )dg(x0 ) b) y si g(x0 ) 6= 0, entonces el cociente f /g es diferenciable en x0 , y d(f /g)(x0 ) = Funciones . . . Regla de la Cadena JJ II J I g(x0 )df (x0 ) − f (x0 )dg(x0 ) g 2 (x0 ) Demostración: a) En primer lugar, consideremos la función h : R −→ R definida por h(a) = a2 . Sabemos que esta función es derivable, y que h0 (a) = 2a para todo a ∈ R. Entonces h es diferenciable, y dh(a) : R −→ R está definida por dh(a)(t) = (h0 (a))(t) = 2at para todo t ∈ R Sea ahora k(x) = h ◦ f (x) = f 2 (x). Aplicando la regla de la cadena, k(x) es diferenciable, y dk(x) = dh(f (x)) ◦ df (x), es decir, dk(x) = 2f (x)df (x) Por último, como f g(x) = Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I (f (x) + g(x))2 − (f (x) − g(x))2 4 f + g, f − g son diferenciables, como acabamos de ver sus cuadrados (f + g)2 = h ◦ (f + g) y (f − g)2 = h ◦ (f − g) son diferenciables, y por tanto el producto f g es diferenciable. Además aplicando las reglas de derivación de la suma y el producto por un número, y la derivación del cuadrado, d(f g)(x0 ) = 1 = {2(f (x0 ) + g(x0 ))d(f + g)(x0 ) − 2(f (x0 ) − g(x0 ))d(f − g)(x0 )} = 4 1 = {f (x0 )df (x0 ) + f (x0 )dg(x0 ) + g(x0 )df (x0 ) + g(x0 )dg(x0 )− 2 −f (x0 )df (x0 ) + f (x0 )dg(x0 ) + g(x0 )df (x0 ) − g(x0 )dg(x0 )} = f (x0 )dg(x0 ) + g(x0 )df (x0 ) b) Se demuestra razonando análogamente utilizando la función h : R \ {0} −→ R definida N por h(x) = x1 Veamos para terminar algunos ejemplos y aplicaciones de la regla de la cadena: F g Ejemplo 4. Sean Rn −→ Rm −→ R Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I diferenciables, y sea h = g ◦ F . Calcular dh , para dxi 1≤i≤n Aplicando la regla de la cadena, dh(x) = dg(F (x)) ◦ dF (x). Aquı́ g es una función de Rm en R, es decir tiene un única componente y m variables, y = (y1 , . . . , ym ), de modo que la matriz de dg(F (x0 )) tiene una sola fila (es el gradiente ∇g(F (x0 )) dg dg dg dg(F (x0 )) = (F (x0 )), (F (x0 )), . . . , (F (x0 )) dy1 dy2 dym La función F : Rn −→ Rm tiene en cambio m componentes y n variables. Si ponemos x = (x1 , . . . , xn ) y F = (f1 , . . . , fm ), la matriz de dF (x0 ) tiene m filas y n columnas: df1 df1 df1 (x0 ) dx (x0 ) . . . dx (x0 ) dx1 n 2 .. .. .. .. dF (x0 ) = . . . . dfm (x0 ) dx1 dfm (x0 ) dx2 ... dfm (x0 ) dxn La matriz de la diferencial de h en (x0 ) es el producto de las dos matrices: dh(x0 ) = Funciones Diferenciables. Regla de la Cadena = = dg dg (F (x0 )), . . . , (F (x0 )) dy1 dym df1 (x0 ) dx1 ... .. .. . . dfm (x0 ) . . . dx1 df1 (x0 ) dxn .. . dfm (x0 ) dxn ! m m X X dfj dfj dg dg (F (x0 )) (x0 ), . . . , (F (x0 )) (x0 ) dyj dx1 dyj dxn j=1 j=1 La coordenada i-ésima es la derivada parcial de h respecto de xi en x0 Funciones . . . Regla de la Cadena JJ II J I m X dg dh dfj (x0 ) = (F (x0 )) (x0 ) dxi dyj dxi j=1 Para recordar esta fórmula, puede utilizarse el siguiente criterio: la función g es función del vector y de m coordenadas y = (y1 , . . . , ym ). Al hacer la composición, la variable y se define como función a su vez de x = (x1 , . . . , xn ), y = F (x), de modo que la composición h = g ◦ F es función de x. Para obtener las derivadas parciales de h, la función g debe derivarse respecto de sus variables y = (y1 , . . . , ym ), y esas variables, expresadas como función de x, y = F (x), o yj = fj (x1 , . . . , xn ), son las que se deben derivar respecto de las variables x1 , . . . , xn Ejemplo 5. Sea f : R2 −→ R una función diferenciable, y definamos la función g(x) = f (x, f (x, f (x, x))). Calcular g 0 (x) Como f es una función de dos variables, escribimos f (u, v), de modo que Funciones Diferenciables. Regla de la Cadena df (u, v) = ( df df (u, v), (u, v)) du dv Ahora definimos una función de R en R2 , que a cada x ∈ R asocia un punto (u(x), v(x)), y consideramos la composición g(x) = f (u(x), v(x)); entonces df du df dv (u(x), v(x)) (x) + (u(x), v(x)) (x) du dx dv dx du (x) = 1, y v(x) = f (x, f (x, x)), y sustituyendo en la En nuestro caso u(x) = x, luego dx ecuación queda g 0 (x) = Funciones . . . Regla de la Cadena df df dv (x, f (x, f (x, x))) + (x, f (x, f (x, x))) (x) du dv dx dv Ahora tenemos que calcular (x); repitiendo la misma idea: dx dv df df df df (x) = (x, f (x, x)) + (x, f (x, x)) (x, x) + (x, x) dx du dv du dv g 0 (x) = JJ II J I Luego Funciones Diferenciables. Regla de la Cadena df g 0 (x) = (x, f (x, f (x, x)))+ du df df df df df + (x, f (x, f (x, x))) (x, f (x, x)) + (x, f (x, x)) (x, x) + (x, x) dv du dv du dv F G Ejemplo 6. Sean Rn −→ Rm −→ Rp 1 ≤ i ≤ n y 1 ≤ j ≤ p. diferenciables, y sea H = G ◦ F . Calcular dhj , para dxi Basta tener en cuenta que la coordenada j-ésima de h, es hj = gj ◦ F , donde gj es la componente j-ésima de G. Entonces se puede aplicar la fórmula del ejemplo anterior. Funciones . . . Regla de la Cadena JJ II J I Ejemplo 7. Relación entre las transformaciones F : R3 −→ R3 y las curvas en R3 Sea c : R −→ R3 la trayectoria de un móvil en el espacio, c es una función continua y diferenciable. Y sea F : R3 −→ R3 una función diferenciable. La composición g = F ◦ c es una nueva trayectoria en R3 El vector tangente a g = F ◦ c en un punto t0 es g 0 (t0 ) = (F ◦ c)0 (t0 ) (matriz de la diferencial de g en t0 ) y viene dado según la regla de la cadena por g 0 (t0 ) = dF (c(t0 ))(c0 (t0 )) c(t0 ) c (t0 ) Funciones Diferenciables. Regla de la Cadena F c a Funciones . . . Regla de la Cadena JJ II J I F ◦ c(t0 ) = F (c(t0 )) t0 b (F ◦ c) (t0 ) = dF (c(t0 ))(c (t0 )) Es decir, la aplicación lineal dF (c(t0 )) transforma en vector derivada de c en t0 , en el vector derivada de F ◦ c en t0 Ejemplo 8. Gradientes Hay dos propiedades de los gradientes que queremos destacar en este tema. En primer lugar, sea f : U −→ R una función diferenciable en un punto x0 de un abierto U ⊆ Rn . Consideremos las derivadas direccionales de f en x0 según vectores de norma uno, dv f (x0 ), con kvk = 1 Funciones Diferenciables. Regla de la Cadena Funciones . . . Regla de la Cadena JJ II J I dv f (x0 ) = df (x0 )(v) =< ∇f (x0 ), v >= k∇f (x0 )k kvk cos α donde α es el ángulo que forman ∇f (x0 ) y v. Entonces, la derivada direccional según vectores de norma uno será máxima cuando cos α = 1, es decir, cuando v tiene la misma dirección y el mismo sentido que ∇f (x0 ). Y será mı́nima cuando cos α = −1, es decir, cuando v y ∇f (x0 ) tengan la misma dirección y sentidos opuestos. Si estudiamos el módulo de las derivadas direccionales, será máxima en la dirección del gradiente ∇f (x0 ), en los dos sentidos, y será mı́nima en la dirección perpendicular al gradiente, en cuyo caso la derivada direccional valdrá cero. En segundo lugar, si Nk = {(x, y, z) : f (x, y, z) = k} es un conjunto de nivel de f , y x0 ∈ Nk , entonces ∇f (x0 ) es ortogonal a Nk , en el sentido de que para toda curva contenida en Nk , que pase por x0 , el vector ∇f (x0 ) es perpendicular al vector tangente a la curva en x0 (Mas adelante en el curso veremos que el conjunto de todos los vectores tangentes a las curvas contenidas en Nk , en el punto x0 , es un espacio vectorial, el núcleo de df (x0 ), que llamaremos “espacio tangente a Nk en x0 ”) En efecto, si G : (a, b) −→ R3 describe una curva contenida en Nk , y t0 es un punto de (a, b) tal que G(t0 ) = x0 , entonces la composición h(t) = f ◦ G(t) = k de (a, b) en R, y aplicando la regla de la cadena 0 = h0 (t0 ) = df (G(t0 )) ◦ G0 (t0 ) =< ∇f (x0 ), G0 (t0 ) > Funciones Diferenciables. Regla de la Cadena G (t0 ) Nk G(t0 ) Funciones . . . Regla de la Cadena JJ II J I ∇f (G(t0 ))