Teorema del valor medio

Anuncio
Tema
10
Teorema del valor medio
Podría decirse que hasta ahora sólo hemos sentado las bases para el estudio del cálculo
diferencial en varias variables. Hemos introducido el concepto general o abstracto de función
diferenciable y comprobado algunas propiedades básicas, como su carácter local o su relación
con la continuidad. También hemos visto cómo se concreta dicho concepto en los tres casos
particulares que más nos interesan, vector derivada, vector gradiente y matriz jacobiana, viendo
al mismo tiempo diversas interpretaciones geométricas y físicas. Por último disponemos de
algunos métodos para estudiar la diferenciabilidad de una función y calcular su diferencial,
entre los que destaca la regla de la cadena.
Ha llegado ya el momento de estudiar los teoremas fundamentales del cálculo diferencial,
empezando como es lógico por intentar generalizar el teorema del valor medio, que es sin duda
el resultado más importante del cálculo diferencial en una variable. Obtendremos fácilmente
una versión del teorema para funciones que parten de un espacio normado arbitrario y toman
valores reales, que en particular se aplica a los campos escalares en RN . Para funciones con
valores vectoriales las cosas se complican, la versión literal del teorema es falsa, incluso para
funciones de una variable real con valores en R2 . Sin embargo, probaremos una versión más
débil, que sí es cierta a plena generalidad y permite deducir algunas consecuencias interesantes.
Completamos este tema con una consecuencia del teorema del valor medio para funciones reales
de una variable real, útil para comprobar la diferenciabilidad de ciertos campos escalares en RN .
10.1.
Preliminares
La hipótesis de que una función sea diferenciable solamente en un punto, no es suficiente
para deducir ningún resultado relevante. Al estudiar los teoremas fundamentales del cálculo
diferencial, trabajaremos casi siempre con funciones diferenciables en todos los puntos de un
conjunto abierto, verificando incluso condiciones más exigentes, así que conviene disponer de
una nomenclatura adecuada a esta situación. De entrada, si X e Y son espacios normados, y Ω
es un subconjunto abierto no vacío de X , diremos simplemente que una función f : Ω → Y es
diferenciable, cuando f sea diferenciable en todo punto de Ω .
115
10. Teorema del valor medio
116
A cada punto x ∈ Ω podemos entonces asociar la diferencial D f (x) ∈ L(X,Y ) , que es una
aplicación lineal y continua de X en Y . Obtenemos así una función D f : Ω → L(X,Y ) que
será la función diferencial de f . Obsérvese que D f está en una situación similar, pero no
exactamente la misma, que la función de partida f . Ambas son funciones definidas en Ω y
con valores en un espacio normado pero, mientras f toma valores en Y , los valores de D f
pertenecen al espacio normado L(X,Y ) .
Tiene perfecto sentido decir, por ejemplo, que D f está acotada en un conjunto A ⊂ Ω ,
cuando existe M ∈ R tal que k D f (a) k 6 M para todo a ∈ A , o decir que D f es continua en
un punto a ∈ Ω , lo que significa que
∀ ε > 0 ∃ δ > 0 : x ∈ Ω , k x − a k < δ =⇒ k D f (x) − D f (a) k < ε
Pues bien, se dice que f es una función de clase C1 en Ω cuando f es diferenciable y D f
es continua en todo punto de Ω . Se denota por C 1 (Ω,Y ) al conjunto de todas las funciones de
clase C 1 de Ω en Y . En el caso Y = R abreviamos escribiendo C 1 (Ω) en lugar de C 1 (Ω, R) .
10.2.
Caso escalar
Recordemos el teorema del valor medio para funciones reales de variable real, enunciado
de una forma adecuada para pensar en su posible generalización. Si f : J → R es una función
derivable en un intervalo abierto J ⊂ R , entonces, para cualesquiera a, b ∈ J se tiene
f (b) − f (a) = f 0 (c) (b − a)
(1)
donde c es un punto intermedio entre a y b . Multiplicar por f 0 (c) es tanto como aplicar a
b − a la diferencial D f (c) . Por tanto, si sustituimos J por un abierto Ω de un espacio normado
X , cabría esperar la igualdad análoga a (1) , que sería
f (b) − f (a) = D f (c)(b − a)
donde el punto c debería estar en el segmento de extremos a y b , que supondremos contenido
en Ω . Usaremos para los segmentos una notación intuitiva: si X es un espacio normado y
a, b ∈ X , el conjunto
[ a, b ] = (1 − t) a + t b : t ∈ [ 0, 1 ] }
es precisamente el segmento de extremos a y b . Probamos ya el teorema, exactamente en la
forma que hemos conjeturado:
Teorema del valor medio escalar. Sea Ω un subconjunto abierto de un espacio normado
X y f : Ω → R una función diferenciable. Para a, b ∈ X con [ a, b ] ⊂ Ω se tiene:
(i) Existe c ∈ [ a, b ] tal que f (b) − f (a) = D f (c)(b − a)
(ii) Como consecuencia, si M ∈ R+
0 verifica que k D f (x) k 6 M para todo x ∈ [ a, b ] , se
tendrá: | f (b) − f (a) | 6 M k b − a k
10. Teorema del valor medio
117
Demostración. La función ϕ : [ 0, 1 ] → R , definida por ϕ(t) = f (1−t) a + t b para todo
t ∈ [ 0, 1 ] , es continua en [ 0, 1 ] y, por la regla de la cadena, derivable en ] 0, 1[ con
ϕ 0 (t) = D f (1 − t) a + t b (b − a)
El teorema del valor medio para funciones reales de variable real nos da un t0 ∈] 0, 1 [ tal que
f (b) − f (a) = ϕ(1) − ϕ(0) = ϕ 0 (t0 ) = D f (1 − t0 ) a + t0 b (b − a)
Tomando c = (1−t0 ) a + t0 b ∈ [ a, b ], obtenemos (i) . Para deducir (ii) basta usar la definición
de la norma en L(X, R) :
| f (b) − f (a) | = | D f (c)(b − a) | 6 k D f (c) k k b − a k 6 M k b − a k
En el caso particular de un campo escalar en RN , usando la desigualdad de Cauchy-Schwartz
obtenemos:
Sea Ω un abierto de RN y f : Ω → R un campo escalar diferenciable. Para a, b ∈ RN
con [ a, b ] ⊂ Ω se tiene:
(i) Existe c ∈ [ a, b ] tal que f (b) − f (a) = ∇ f (c) b − a
(ii) Como consecuencia, considerando en RN la norma euclídea, si M ∈ R+
0 verifica
que k ∇ f (x) k 6 M para todo x ∈ [ a, b ] , se tendrá: | f (b) − f (a) | 6 M k b − a k
Como se habrá podido observar, la demostración del teorema del valor medio escalar ha
consistido en una aplicación muy inmediata del ya conocido para funciones de una variable.
De hecho, como sólo se trabaja con la función f en un segmento [ a, b ] , en esencia tenemos
una función de una variable. Los resultados anteriores, generalizan formalmente el teorema
del valor medio que ya conocíamos, pero en realidad sólo consisten en darse cuenta de que
dicho teorema puede aplicarse fácilmente en situaciones más generales. Tendrá mayor interés
generalizar el teorema, de forma que pueda aplicarse a campos vectoriales, o incluso a una
función entre espacios normados arbitrarios, como enseguida vamos a intentar.
10.3.
Caso general
Observamos inmediatamente que la primera afirmación del teorema del valor medio escalar
no es cierta para funciones con valores en R2 , incluso aunque sean funciones de una variable
real. Concretamente, basta considerar la función f : R → R2 dada por f (t) = (cos t, sen t)
para todo t ∈ R , que claramente es derivable en todo punto de R con
f 0 (t) = − sent , cost 6= ( 0, 0 )
∀t ∈ R
Tomando a ∈ R arbitrario y b = a+2π se tiene f (b) = f (a) . Si existiese c ∈ [ a, b ] verificando
que f (b) − f (a) = D f (c)(b − a) = 2 π f 0 (c) , se tendría f 0 (c) = (0, 0) , lo cual es imposible.
Sin embargo, probaremos a plena generalidad la segunda de las afirmaciones del teorema del
valor medio escalar. Ciertamente es más débil que la primera, pero será suficiente para deducir
interesantes consecuencias.
10. Teorema del valor medio
118
Debe pues quedar claro que, al hablar de una versión general del teorema del valor medio,
no nos referimos a una generalización literal de dicho teorema, sino de una versión más débil.
La dificultad para probarlo se concentra en el caso de funciones de una variable real, que es el
que resolvemos previamente.
Lema. Sea Y un espacio normado y sean g : [ 0, 1] → Y y α : [ 0, 1] → R dos funciones
continuas en [ 0, 1] y derivables en ] 0, 1[ , verificando que
k g 0 (t) k 6 α 0 (t)
∀t ∈ ] 0, 1[
(2)
Se tiene entonces la siguiente desigualdad:
k g(1) − g(0) k 6 α(1) − α(0)
(3)
Demostración. Fijado ε > 0 , consideramos el conjunto
Λ = t ∈ [ 0, 1] : k g(t) − g(0) k 6 α(t) − α(0) + ε t + ε
y a poco que se piense, la demostración estará casi concluida si probamos que 1 ∈ Λ .
Por ser g y α continuas, la función ϕ : [ 0, 1] → R definida por
ϕ(t) = k g(t) − g(0) k − α(t) − α(0) − ε t
∀t ∈ [ 0, 1]
también es continua, de lo que deduciremos dos consecuencias:
En primer lugar, como ϕ(0) = 0 , la continuidad de ϕ en 0 nos permite encontrar η ∈] 0, 1[
tal que, para t ∈ [ 0, η ] se tenga ϕ(t) < ε , con lo que [ 0, η ] ⊂ Λ .
Por otra parte, como Λ = {t ∈ [ 0, 1] : ϕ(t) 6 ε} , de ser ϕ continua deducimos también que
Λ es un subconjunto cerrado de [ 0, 1] , luego es compacto, y en particular tiene máximo. Sea
pues t0 = máx Λ y anotemos que t0 > η > 0 .
Nuestro objetivo es probar que t0 = 1, así que supondremos que t0 < 1 para llegar a una
contradicción. Al ser 0 < t0 < 1, tenemos que g y α son derivables en t0 , luego existe δ > 0
tal que, para t ∈ [ 0, 1] con |t − t0 | 6 δ , se tiene
ε
|t − t0 |
2
ε
| α(t) − α(t0 ) − α 0 (t0 ) (t − t0 ) | 6 |t − t0 |
2
k g(t) − g(t0 ) − g 0 (t0 ) (t − t0 ) k 6
y también
Obviamente podemos suponer que t0 + δ < 1 , para tomar t = t0 + δ , obteniendo
ε
δ
2
ε
| α(t0 + δ) − α(t0 ) − δ α 0 (t0 ) | 6 δ
2
k g(t0 + δ) − g(t0 ) − δ g 0 (t0 ) k 6
así como
(4)
Llegaremos a contradicción viendo que t0 + δ ∈ Λ . Para ello, usando la primera desigualdad de
(4) , la hipótesis (2) con t = t0 , y el hecho de que t0 ∈ Λ , tenemos:
k g(t0 + δ) − g(0) k 6 k g(t0 + δ) − g(t0 ) − δ g 0 (t0 ) k + δ k g 0 (t0 ) k + k g(t0 ) − g(0) k
ε
6 δ + δ α 0 (t0 ) + α(t0 ) − α(0) + εt0 + ε
2
(5)
10. Teorema del valor medio
119
Por otra parte, usando la segunda desigualdad de (4) tenemos también
ε
δ α 0 (t0 ) + α(t0 ) = α(t0 + δ) − α(t0 + δ) − α(t0 ) − δ α 0 (t0 ) 6 α(t0 + δ) + δ
2
(6)
De (5) y (6) deducimos claramente que
ε
ε
δ + α(t0 + δ) + δ − α(0) + εt0 + ε
2
2
= α(t0 + δ) − α(0) + ε (t0 + δ) + ε
k g(t0 + δ) − g(0) k 6
es decir, que t0 + δ ∈ Λ . Esto es una clara contradicción, ya que t0 + δ > t0 = máx Λ . Así pues
hemos comprobado que t0 = 1 y en particular 1 ∈ Λ , es decir
k g(1) − g(0) k 6 α(1) − α(0) + 2 ε
Como esto es válido para todo ε ∈ R+ , tenemos (3) , como queríamos.
En el caso Y = R2 , aunque también se podría hacer en general, el resultado anterior tiene
una interpretación física que lo hace muy plausible. Pensemos que g describe un movimiento
curvilíneo en el plano y α un movimiento rectilíneo, durante el mismo intervalo de tiempo.
La hipótesis (2) significa que la celeridad del primer móvil nunca supera a la del segundo.
Entonces k g(1) − g(0) k es la distancia entre las posiciones inicial y final del móvil más lento,
que será menor o igual que la longitud de la trayectoria recorrida, pero esta longitud ha de ser a
su vez menor o igual que α(1) − α(0) , que es la distancia recorrida por el móvil más rápido.
Teorema del valor medio. Sean X e Y espacios normados, Ω un subconjunto abierto de
X y f : Ω → Y una función diferenciable. Dados a, b ∈ X tales que [ a, b ] ⊂ Ω , supongamos
que existe M ∈ R+
0 tal que k D f (x) k 6 M para todo x ∈ [ a, b ] . Se tiene entonces:
k f (b) − f (a) k 6 M k b − a k
Demostración. Basta aplicar el lema anterior a las funciones g : [ 0, 1 ] → Y y α : [ 0, 1 ] → R
definidas, para todo t ∈ [ 0, 1 ] , por
g(t) = f (1 − t) a + t b
y
α(t) = M k b − a kt
Es claro que g y α son continuas en [ 0, 1 ] y derivables en ] 0, 1 [ con
k g 0 (t) k = k D f (1 − t) a + t b (b − a) k
6 k D f (1 − t) a + t b k k (b − a) k 6 M k b − a k = α 0 (t)
∀t ∈] 0, 1 [
Aplicando pues el lema anterior, obtenemos la desigualdad buscada:
k f (b) − f (a) k = k g(1) − g(0) k 6 α(1) − α(0) = M k b − a k
Como primera aplicación de este teorema, es natural ponerse en una situación que permita
aplicarlo a cualquier par de puntos a, b ∈ Ω , lo cual es bien fácil:
10. Teorema del valor medio
120
Corolario 1. Sean X e Y espacios normados, Ω un subconjunto abierto y convexo de X y
f : Ω → Y una función diferenciable. Supongamos que existe M ∈ R+
0 tal que k D f (x) k 6 M
para todo x ∈ Ω . Entonces f es lipschitziana, o más concretamente:
k f (b) − f (a) k 6 M k b − a k
∀ a, b ∈ Ω
Obsérvese que, en caso de que podamos tomar M = 0 , esto es, cuando la función diferencial
D f es idénticamente nula, obtenemos que f (b) = f (a) para cualesquiera a, b ∈ Ω , es decir,
que f es constante. Pero podemos conseguir el mismo resultado con una hipótesis más débil
que la convexidad de Ω :
Corolario 2. Sean X e Y espacios normados, Ω un subconjunto abierto y conexo de X
y f : Ω → Y una función diferenciable tal que D f (x) = 0 para todo x ∈ Ω . Entonces f es
constante.
Demostración. Fijado a ∈ Ω , consideramos el conjunto A = {x ∈ Ω : f (x) = f (a)} y
se trata de probar que A = Ω . Por ser f continua, A es un subconjunto cerrado de Ω , pero
vamos a comprobar que también es abierto. Dado x ∈ A , como Ω es abierto, existe r ∈ R+
tal que B(x, r) ⊂ Ω . Podemos entonces aplicar el corolario anterior, a la restricción de f al
abierto convexo B(x, r) , cuya función diferencial es idénticamente nula, obteniendo que f es
constante en B(x, r) . Por tanto tenemos que f (y) = f (x) = f (a) para todo y ∈ B(x, r) , es
decir, B(x, r) ⊂ A . Como x ∈ A era arbitrario, hemos probado que A es abierto. Puesto que Ω
es conexo y A 6= 0/ , porque a ∈ A , concluimos que A = Ω como se quería.
Destacamos una consecuencia obvia: con las mismas hipótesis sobre Ω , si f y g son dos
funciones diferenciables en Ω tales que D f = Dg , entonces f − g es constante. Dicho de otra
forma, una función diferenciable en un subconjunto abierto y conexo de un espacio normado,
queda determinada por su función diferencial, salvo adición de una constante.
10.4.
Una condición suficiente para la diferenciabilidad
Completamos este tema con una útil aplicación del teorema del valor medio, pero no de las
versiones aquí probadas, sino de la que ya conocíamos para funciones reales de variable real.
Se trata de un resultado que permite probar la diferenciabilidad de un campo escalar, trabajando
solamente con sus derivadas parciales. Deduciremos una cómoda caracterización de los campos
escalares de clase C 1 . Estos resultados también son útiles para campos vectoriales, sin más que
aplicarlos a sus componentes, que son campos escalares.
Sea pues Ω un abierto de RN y supongamos que queremos estudiar la diferenciabilidad de
un campo escalar f : Ω → R en un punto a ∈ Ω . Sabemos que ello equivale a comprobar que
f es parcialmente derivable en el punto a y que
f (x) − f (a) − ∇ f (a) x − a
=0
(7)
lı́m
x→a
kx−ak
La idea es evitar el cálculo de este límite, que puede ser laborioso, pero a cambio debemos
trabajar un poco más con las derivadas parciales.
10. Teorema del valor medio
121
En la práctica f suele ser parcialmente derivable, no sólo en el punto a , sino en todo un
entorno abierto de a . En tal caso, por el carácter local de la diferenciabilidad, podemos sustituir
f por su restricción a dicho entorno, así que no perdemos generalidad suponiendo que f es
parcialmente derivable en todo punto de Ω . Entonces, en vez de comprobar la igualdad (7) ,
puede ser más fácil comprobar la continuidad en el punto a de las derivadas parciales, es decir,
comprobar que
∂f
∂f
(x) =
(a)
∀ j ∈ IN
(8)
lı́m
x→a ∂ x j
∂xj
Pues bien, vamos a probar que (7) es consecuencia de (8) , y de hecho, que una condición
ligeramente más débil que (8) ya es suficiente para deducir (7) . Concretamente, fijado k ∈ IN ,
podemos suponer solamente la existencia de la derivada parcial de f con respecto a la k-ésima
variable en el punto a , mientras que las demás derivadas parciales sí se suponen definidas
en todo punto de Ω y continuas en a . Esta hipótesis, obviamente más débil que (8) , es ya
suficiente para la diferenciabilidad de f en a :
Sea Ω un abierto de RN , f : Ω → R un campo escalar, a ∈ Ω y k ∈ IN . Supongamos
que se verifican las dos condiciones siguientes:
(i) f es parcialmente derivable con respecto a la k-ésima variable en el punto a
(ii) Para j ∈ IN \ {k} , f es parcialmente derivable con respecto a la j-ésima variable
∂f
en todo punto x ∈ Ω y la función derivada parcial
: Ω → R es continua en a .
∂xj
Entonces f es diferenciable en el punto a .
Para que se comprenda mejor, hacemos la demostración en el caso N = 2 , y comentaremos
después los cambios necesarios para cubrir el caso general, que es enteramente análogo. En el
caso N = 2 , salvo intercambio de las variables, que obviamente no afecta a la diferenciabilidad
de f , podemos suponer sin perder generalidad que k = 2 . Por tanto, escribiendo a = (x0 , y0 )
∂f
la hipótesis (i) nos dice que existe la derivada parcial
(x0 , y0 ) , mientras en (ii) estamos
∂y
∂f
suponiendo la existencia de
(x, y) para todo (x, y) ∈ Ω y que la función derivada parcial
∂x
∂f
: Ω → R es continua en (x0 , y0 ) .
∂x
Usando en R2 la norma del máximo, tomamos r ∈ R+ de forma que la bola abierta de
centro (x0 , y0 ) y radio r , que denotaremos simplemente por B , esté contenida en Ω , y se trata
de probar (7) en nuestro caso. Para abreviar, escribimos
R(x, y) = f (x, y) − f (x0 , y0 ) − ∇ f (x0 , y0 ) (x, y) − (x0 , y0 )
∀ (x, y) ∈ B
Fijado ε > 0 debemos encontrar δ ∈] 0, r [ verificando que, para x, y ∈ R con | x − x0 | < δ y
| y − y0 | < δ , se tenga
| R(x, y) | 6 ε k (x, y) − (x0 , y0 ) k
(9)
10. Teorema del valor medio
122
Observamos que, para (x, y) ∈ B , se tiene R(x, y) = R1 (x, y) + R2 (y) donde
∂f
(x0 , y0 )
∂x
∂f
R2 (y) = f (x0 , y) − f ((x0 , y0 ) − (y − y0 ) (x0 , y0 )
∂y
R1 (x, y) = f (x, y) − f (x0 , y) − (x − x0 )
∀ (x, y) ∈ B
∀ y ∈ ] y0 − r , y0 + r [
así que trabajaremos por separado con los dos sumandos que han aparecido.
Por definición de derivada parcial, podemos tomar δ ∈] 0, r [ de forma que, para y ∈ R con
| y − y0 | < δ , se tenga
∂
f
f (x0 , y) − f (x0 , y0 ) − (y − y0 ) (x0 , y0 ) 6 ε | y − y0 |
(10)
∂y
2
Además, la continuidad de ∂ f /∂ x en (x0 , y0 ) permite conseguir que el mismo δ verifique
también que, para u, v ∈ R con | u − x0 | < δ y | v − y0 | < δ , se tenga:
∂f
∂
f
(u, v) −
6 ε
(x
,
y
)
(11)
0
0
∂x
∂x
2
Para comprobar (9) y concluir así la demostración, fijamos x, y ∈ R con | x − x0 | < δ y
| y − y0 | < δ . Es importante tener presente que, en todo lo que sigue, x e y están fijos. En virtud
de (10) tenemos directamente
| R2 (y) | 6
ε
ε
| y − y0 | 6 k (x, y) − (x0 , y0 ) k
2
2
(12)
Para conseguir la misma desigualdad con R1 , consideramos la función
ψ:J→R
donde
J = ] x0 − δ , x0 + δ [
y
ψ(z) = f (z, y)
∀z ∈ J
Para todo z ∈ J , que f sea derivable con respecto a la primera variable en el punto (z, y) ∈ Ω ,
∂f
significa precisamente que ψ es derivable en el punto z con ψ 0 (z) =
(z, y) . Aplicamos a
∂x
ψ el teorema del valor medio obteniendo un punto u ∈ J tal que
f (x, y) − f (x0 , y) = ψ(x) − ψ(x0 ) = (x − x0 ) ψ 0 (u) = (x − x0 )
∂f
(u, y)
∂x
∂f
∂f
de donde deducimos que R1 (x, y) = (x − x0 )
(u, y) −
(x0 , y0 ) . Por ser | u − x0 | < δ
∂x
∂x
y | y − y0 | < δ , podemos usar (11) con v = y obteniendo:
| R1 (x, y) | 6
ε
ε
| x − x0 | 6 k (x, y) − (x0 , y0 ) k
2
2
(13)
De las desigualdades (12) y (13) , deducimos directamente (9) :
| R(x, y) | 6 | R1 (x, y) | + | R2 (y) | 6 ε k (x, y) − (x0 , y0 ) k
10. Teorema del valor medio
123
Para entender la forma de tratar el caso N > 2 , conviene resaltar la diferente naturaleza de
los sumandos R1 y R2 , pues R2 sólo es función de la variable y , mientras R1 depende también
de la variable x . Ello hace que la acotación de R2 pueda deducirse directamente de la definición
de la derivada parcial de f respecto de y en el punto (x0 , y0 ) . En cambio, para R1 hemos tenido
que usar la existencia de la derivada parcial de f con respecto a x en todos los puntos de un
segmento, para poder aplicar el teorema del valor medio, y después la acotación de R1 se ha
deducido de la continuidad de dicha derivada parcial en el punto (x0 , y0 ) .
En el caso general, se supone de nuevo sin perder generalidad que k = N , es decir, que la
derivada parcial de la que sólo se sabe su existencia en el punto a , es la última. La definición
de la bola B y de la función R : B → R son análogas al caso N = 2 :
R(x) = f (x) − f (a) − ∇ f (x) x − a
∀x ∈ B
pero R se descompone ahora en N sumandos. Concretamente, en vez de la igualdad
f (x, y) − f (x0 , y0 ) = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 )
usada en el caso N = 2 , si ahora x = (x1 , x2 , . . . , xN ) y a = (a1 , a2 , . . . , aN ) , tendremos la
igualdad
f (x) − f (a) = f (x) − f (a1 , x2 , . . . , xN )
+ f (a1 , x2 , . . . , xN ) − f (a1 , a2 , x3 , . . . , xN )
+ . . . + f (a1 , . . . , aN−1 , xN ) − f (a)
N
=
∑
f (a1 , . . . , a j−1 , x j , . . . , xN ) − f (a1 , . . . , a j x j+1 , . . . , xN )
j=1
y descomponemos R en la forma
N
R(x) =
∑ R j (x j , x j+1, . . . xN )
∀x ∈ B
j=1
donde, para cada j ∈ IN estamos escribiendo
R j (x j , x j+1 , . . . , xN ) = f (a1 , . . . , a j−1 , x j , . . . , xN ) − f (a1 , . . . , a j , x j+1 , . . . , xN )
∂f
(a)
− (x j − a j )
∂xj
siempre que xi ∈ ] ai − r , ai + r [ para i = j, j + 1, . . . , N .
Vemos que RN sólo es función de la variable xN y puede estimarse usando solamente la
existencia de la derivada parcial de f con respecto a xN en el punto a , como hemos hecho con
R2 en el caso N = 2 . Para j ∈ IN−1 la función R j depende de N − j + 1 variables y se maneja
como se ha hecho con R1 en el caso N = 2 . Primero se usa la existencia de la derivada parcial
de f con respecto a x j en todos los puntos de un segmento, para poder aplicar el teorema del
valor medio. Entonces la estimación de R j se consigue usando la continuidad de dicha derivada
parcial en el punto a .
El principal interés del resultado anterior estriba en que nos proporciona una caracterización
de los campos escalares de clase C 1 en términos de sus derivadas parciales:
10. Teorema del valor medio
124
Si Ω es un abierto de RN y f : Ω → R un campo escalar, las siguientes afirmaciones
son equivalentes:
(i) f ∈ C 1 (Ω)
(ii) f es parcialmente derivable en todo punto x ∈ Ω y, para todo j ∈ IN , la función
derivada parcial ∂ f /∂ x j es continua en Ω .
(i) ⇒ (ii) . De entrada, f es diferenciable, luego parcialmente derivable, en todo punto de
Ω . Además, la función diferencial D f : Ω → L(RN , R) es continua. Pero recordemos que,
usando en RN la norma euclídea, el espacio normado L(RN , R) se identifica totalmente con
RN . Además, mediante dicha identificación, D f (x) ∈ L(RN , R) se convierte en ∇ f (x) para
todo x ∈ Ω . Por tanto, la continuidad de la función diferencial D f : Ω → RN equivale a la
de la función gradiente ∇ f : Ω → RN , que a cada x ∈ Ω asocia el vector gradiente ∇ f (x) .
Basta ahora observar que ∇ f es un campo vectorial cuyas componentes son las N funciones
derivadas parciales de f . En resumen, tenemos
D f continua ⇐⇒ ∇ f continua ⇐⇒
∂f
continua ∀ j ∈ IN
∂xj
(ii) ⇒ (i) . Del resultado anterior deducimos que f es diferenciable en todo punto de Ω y la
equivalencia recién comentada nos dice que D f es continua en Ω , luego f ∈ C 1 (Ω) .
Tomemos por ejemplo Ω = R × R∗ y sea f : Ω → R la función dada por
f (x, y) =
x
y
∀ (x, y) ∈ Ω
Es claro que f es parcialmente derivable en todo punto (x, y) ∈ Ω con
∂f
1
(x, y) =
∂x
y
y
∂f
x
(x, y) = − 2
∂y
y
luego ambas funciones derivadas parciales son continuas en Ω y deducimos que f ∈ C 1 (Ω) .
Probar directamente que f es diferenciable en todo punto de Ω , usando la definición de función
diferenciable, es bastante laborioso. Se pone así de manifiesto la utilidad práctica de la condición
suficiente para la diferenciabilidad de campos escalares que hemos obtenido.
Descargar