Subido por Ruffi Uzumaki

notas1 (1)

Anuncio
Notas de Cálculo 3
Raybel A. Garcı́a A., Antonio O. Vega E., Orlando R. Martı́nez M.
27 de octubre de 2013
Contenido
1. Espacios normados
1.1. Vectores . . . . . . . . . . . . . . . . .
1.2. Espacios vectoriales . . . . . . . . . .
1.3. Espacios normados . . . . . . . . . . .
1.3.1. Producto escalar en R3 . . . .
1.3.2. Productos interiores y normas .
1.4. Espacios métricos . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
6
9
9
10
22
2. Elementos básicos de topologı́a
2.1. Conjuntos abiertos . . . . . . .
2.2. Conjuntos cerrados . . . . . . .
2.3. Sucesiones . . . . . . . . . . . .
2.4. Compacidad . . . . . . . . . . .
2.5. Conexidad . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
29
29
36
41
49
57
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
dimensionalmente finitos
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
63
73
83
87
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
93
93
101
101
106
118
118
124
128
130
135
3. Limites y continuidad.
3.1. Lı́mites . . . . . . . . . . . .
3.2. Funciones continuas . . . . .
3.3. Continuidad uniforme . . . .
3.4. Espacios vectoriales normados
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4. Diferenciación.
4.1. Funciones vectoriales de variable escalar. . . . . . . . .
4.2. Funciones escalares de variable vectorial . . . . . . . .
4.2.1. Derivada y diferencial . . . . . . . . . . . . . .
4.2.2. Derivadas direccionales y parciales. . . . . . .
4.3. Aplicaciones de la diferencial y la derivada parcial . .
4.3.1. Plano tangente y recta normal a una superficie
4.3.2. Diferenciales exactas . . . . . . . . . . . . . . .
4.4. Teorı́a básica de curvas . . . . . . . . . . . . . . . . . .
4.4.1. Longitud de arco . . . . . . . . . . . . . . . . .
4.4.2. Aparato de Frenet-Serret . . . . . . . . . . . .
iii
.
.
.
.
.
.
.
.
.
.
Capı́tulo 1
Espacios normados
En general, estamos acostumbrados a trabajar con diversas cantidades como,
por ejemplo, el volumen de un cuerpo, el área de un terreno, la temperatura de
un objeto, etcétera. Ası́ pues, decimos que hemos comprado un litro de leche o
que un niño tiene 38o de temperatura. En estos ejemplos, las cantidades citadas
quedan totalmente determinadas cuando especificamos su magnitud, esto es, su
valor numérico y la unidad que hemos utilizado para medirlas. A este tipo de
cantidades las llamaremos magnitudes escalares. Sin embargo, existen otras que
no pueden clasificarse como escalares, pues no quedan unicamente determinadas
al proporcionar su magnitud. En este capı́tulo estudiaremos las nociones de
vector, producto interior y norma.
1.1.
Vectores
Muchas nociones fı́sicas tan familiares como la fuerza, la velocidad y la aceleración involucran dos conceptos fundamentales: magnitud y dirección. A este
tipo de entidades las llamaremos vectores.
B
A
Figura 1.1: Vector con origen en A y extremo en B
Definición 1 Un vector es una entidad matemática que tiene magnitud, dirección y sentido.
Para representar un vector graficamente, utilizaremos una flecha que va de
un punto A a un punto B (véase la Figura 1.1).Al punto A lo llamaremos
origen y al punto B extremo del vector. La longitud del segmento AB, medida
en unidades adecuadas, representa la magnitud del vector, la dirección del vector
1
2
1.1. Vectores
es la de la recta que lo contiene, mientras que su sentido es el que va de su origen
a su extremo. Si dos vectores son colineales, es claro que quiere decir que dos
−−→
−−→
vectores tienen o no el mismo sentido; dos vectores AB y CD son paralelos
entre sı́, si los segmentos AB y CD son paralelos, más aún, diremos que dichos
vectores tienen el mismo sentido si los segmentos AC y BD no se cortan y
tienen sentidos contrarios si estos segmentos se cortan (véase la Figura 1.2).
B
C
A
D
Figura 1.2: Vectores con sentido opuesto
−−→ −−→
Definición 2 Dos vectores AB y CD son iguales si y sólo si tienen la misma
magnitud, dirección y sentido.
(x, y)
(x − a, y − b)
(a, b) = O′
O
Figura 1.3: Traslación en el plano
3
1. Espacios normados
Consideremos un par de ejes rectangulares con origen en un punto O; si el
eje y se moviera a unidades a la derecha, es claro que la abscisa de todo punto
disminuirı́a en a unidades. Análogamente, si el eje y se moviera a unidades a
la izquierda, la abscisa incrementarı́a en a unidades para todo punto en el eje
rectangular. Algo similar sucederı́a con las ordenadas si movemos el eje x, b
unidades hacia arriba o hacia abajo. En consecuencia, es claro que si movemos
el origen al punto (a, b), de manera que los nuevos ejes sean paralelos y tengan
la misma orientación que los ejes originales, las nuevas coordenadas (x0 , y 0 ) del
punto (x, y) serán
x0 = x − a
y 0 = y − b,
(1.1)
(Figura 1.3). A este tipo de cambio de coordenadas, lo llamaremos traslación
con ecuaciones (1.1). No es difı́cil extender estas ideas al espacio tridimensional: mover el plano yz hacia la derecha o hacia la izquierda a unidades, es
restar o sumar a unidades a la abscisa de todo punto; si movemos el plano xz
hacia adelante o hacia atrás, significa quitar o añadir unidades a la ordenada;
finalmente desplazar hacia arriba o hacia abajo el plano xy modificará la cota
(coordenada z) de todo punto. De esta forma, las ecuaciones de traslación para
el caso tridimensional quedan descritas de la forma
x0 = x − a
y0 = y − b
z 0 = z − c.
Z′
B
γ
α
β
Y′
O
A
X′
Figura 1.4: Ángulos directores para un vector en el espacio
Ahora, todo punto P = (x, y) en un sistema rectangular de coordenadas,
podemos pensarlo como un vector, cuyo origen se encuentra en el origen del
sistema coordenado y su extremo se encuentra en el punto P . Para cada punto
en el plano (o en el espacio), el vector asociado de la forma antes descrita
lo llamaremos vector posición. A menos que haya confusión, denotaremos por
→
−
−−→
(x, y) al punto P y al vector posición P indistintamente. Sea AB un vector
con origen A = (x1 , y1 ) y extremo B = (x2 , y2 ). Si hacemos una traslación
con A como nuevo origen, las nuevas coordenadas de B serán (x2 −x1 , y2 −y1 ).
−−→
Ası́, hemos encontrado una forma de representar al vector AB en un sistema
de coordenadas rectangular. Para el caso del espacio tridimensional se puede
realizar un proceso similar. Además, tanto en el caso bidimensional como en el
4
1.1. Vectores
tridimensional, un vector queda determinado por los ángulos que forman sus
proyecciones con los ejes coordenados. La Figura 1.4 muestra el caso de un
vector en el espacio. Los ángulos BAX 0 , BAY 0 y BAZ 0 se llaman ángulos
directores y los respresentamos por α, β y γ respectivamente. Nótese que dos
vectores tienen la misma dirección y el mismo sentido si y sólo si tienen los
mismos ángulos directores. Además, obsérvese que α, β, γ ∈ [0, π]. Como la
función coseno es uno a uno en el intervalo [0, π], un ángulo en este intervalo
queda determinado de forma única por su coseno, por tanto, la orientación de un
vector está definida por los cosenos de sus ángulos directores, los cuales reciben
el nombre de cosenos directores del vector. La proyección de B sobre el eje
X 0 tiene coordenadas (x2 − x1 , 0, 0) con relación a los ejes trasladados, donde
x2 − x1 es positivo, nulo o negativo, dependiendo de si α es menor, igual o
−−→
mayor a π2 . De esta forma, si r es la magnitud del vector AB, se obtiene que
x2 − x1
=
r cos α
=
r cos β
z2 − z3
=
r cos γ.
y2 − y1
Se sigue que, por la definición de igualdad, dos vectores son iguales si tienen
la misma magnitud y los mismos cosenos directores.
Proposición 1.1.1 Si A = (x1 , y1 , z1 ), B = (x2 , y2 , z2 ), C = (x3 , y3 , z3 ) y
−−→
−−→
D = (x4 , y4 , z4 ) son puntos en el espacio, los vectores AB y CD si y sólo si
x2 − x1 = x4 − x3 , y2 − y1 = y4 − y3 y z2 − z1 = z4 − z3 .
−−→
−−→
Demostración. Por las ecuaciones anteriores, si AB = CD, entonces se tiene
la igualdad de las diferencias de las coordenadas. Ahora, si las diferencias de las
coordenadas son iguales, entonces las magnitudes de cada uno de los vectores
son iguales, por tanto los dos vectores tienen los mismos cosenos directores.
−−→
−−→
No es difı́cil probar que todo vector AB es igual a un vector OP con origen
−−→
en el del sistema coordenado y con las componentes de AB como coordenadas
de su extremos. También, nótese que la suma de los cuadrados de los cosenos
directores de cualquier vector es igual a 1.
Ahora, sean ~x = (x1 , y1 , z1 ) y ~y = (x2 , y2 , z2 ) dos vectores cualesquiera.
Definimos la suma ~x + ~y como el vector
−−−→
x + y := (x1 + x2 , y1 + y2 , z1 + z2 ).
Al vector cuyo origen coincide con su extremo lo llamaremos vector cero o nulo.
Este vector tiene magnitud nula, no tiene orientación y lo representaremos por
~0. Además, obsérvese que ~0 = (0, 0, 0), de donde se sigue que, para cualquier
vector ~x,
~x + ~0 = ~0 + ~x = ~x.
El vector (−x1 , −y1 , −z1 ) se llama negativo del vector ~x y se denota por
−~x. Se tiene que
~x + (−~x) = −~x + ~x = ~0.
5
1. Espacios normados
Es claro que, a partir de estas definiciones, la suma de vectores satisface las
mismas propiedades básicas que las de la suma de números reales, es decir, es
cerrada, asociativa y conmutativa, además de que existe un elemento neutro y
para cada vector, existe un elemento inverso bajo esta operación.
El siguiente resultado, proporciona una interpretación geométrica de la adición
de vectores.
Proposición 1.1.2 Si A, B y C son tres puntos cualesquiera, entonces
−→
−−→
−−→
AC = AB + BC
Demostración. Sin pérdida de generalidad, podemos elegir un sistema coordenado con origen en A. Sean B = (x1 , y1 , z1 ) y C = (x2 , y2 , z2 ). Entonces
−−→
AB = (x1 , y1 , z1 )
−−→
BC = (x2 − x1 , y2 − y1 , z2 − z1 ),
−→
−−→
−−→
de donde se obtiene que AC = (x2 , y2 , z2 ) = AB + BC.
C
A
D
B
Figura 1.5: Regla del paralelogramo
−−→ −→
Corolario 1.1.3 Si AB y AC son vectores con el mismo origen A, entonces
−−→ −→
−−→
AB + AC = AD, donde D es el cuarto vértice del paralelogramo del cual AB
y AC son lados adyacentes.
Demostración. Consideremos el paralelogramo ABCD (véase la Figura 1.5).
−→
−−→
Como AC = BD, se sigue que
−−→
−→
−−→
−−→
−−→
AB + AC = AB + BD = AD
Nótese que las demostraciones de estos dos últimos resultados funcionan
tanto para el plano como para el espacio. Ahora, consideremos un vector de la
6
1.2. Espacios vectoriales
forma ~x = (x1 , y1 , z1 ) y k un número real al que llamaremos escalar. Definimos
el producto del vector ~x por el escalar k de la siguiente forma
k ~x := (k x1 , k y1 , k z1 )
Obsérvese que se cumplen reglas distributivas para la suma de vectores y el
producto por escalares como sucede en los reales. En la siguiente sección profundizaremos en este aspecto. Para finalizar con esta sección, analizamos la
geometrı́a del producto de vectores por escalares. De la fórmula de la distancia,
la magnitud de un vector ~x = (x1 , y1 , z1 ), que denotaremos por ||~x||, está dada
por
q
||~x|| =
x21 + y12 + z12 .
Por otra parte, si k ∈ R, entonces
q
q
||k ~x|| = k (x21 + y12 + z12 ) = |k| x21 + y12 + z12 = |k| ||~x||.
Nótese que la orientación de k ~x será la misma o contraria a la de ~x, dependiendo de si k es mayor o menor a cero respectivamente. Se dirá que dos vectores
~x y ~y son paralelos si y sólo si ~y = k ~x, donde k 6= 0 y tendrán la misma
dirección si y sólo si k > 0.
1.2.
Espacios vectoriales
En la sección anterior observamos que con las definiciones dadas para la suma
de vectores y el producto de un vector por un escalar, estas operaciones satisfacen ciertas propiedades. En esta pequeña sección analizaremos otros sistemas
algebraicos que le resultarán familiares al lector, en donde se pueden definir
operaciones de adición y producto similares a las de los vectores en el plano y
el espacio, y que satisfacen las mismas reglas. A continuación definimos formalmente estas estructuras algebraicas.
Definición 3 Un espacio vectorial V sobre un campo K es una estructura
algebraica que consiste de un conjunto, distinto del vacı́o, sobre el cual se definen
dos operaciones
+ : V × V −→ V
y
· : K × V −→ V
que satisfacen las siguientes condiciones:
S1) Para cualesquiera x, y ∈ V , x + y = y + x.
S2) Para cualesquiera x, y, z ∈ V , x + (y + z) = (x + y) + z.
S3) Existe un único elemento 0 ∈ V tal que x + 0 = x para cada x ∈ V .
S4) Para cada elemento x ∈ V , existe un único elemento y ∈ V tal que
x + y = 0.
7
1. Espacios normados
P1) Para cada elemento x ∈ V , 1 · x = x.
P2) Para cualesquiera a, b ∈ K y para cualquier elemento x ∈ V ,
(ab) · x = a · (b · x).
D1) Para todo a ∈ K y para cualesquiera x, y ∈ V ,
a · (x + y) = a · x + a · y.
D2) Para cualesquiera a, b ∈ K y para cualquier x ∈ V ,
(a + b) · x = a · x + b · x.
A los elementos del campo los llamaremos escalares y a los del espacio vectorial,
vectores. El lector debe tener precaución al referirse, por un lado, a los elementos de un espacio vectorial y, por otro lado, a la entidad fı́sica discutida en la
sección anterior.
Ejemplos
1. En la sección anterior, vimos que
R2 = {(x1 , x2 ) | x1 , x2 ∈ R}
y
R3 = {(x1 , x2 , x3 ) | x1 , x2 , x3 ∈ R}
forman espacios vectoriales sobre R. Más aún, si en
Rn = {(x1 , ..., xn ) | xi ∈ R, i ∈ {1, 2, ..., n}}
definimos las operaciones + y · de la forma
(x1 , ..., xn ) + (y1 , ..., yn )
=
(x1 + y1 , ..., xn + yn )
c · (x1 , ..., xn )
=
(c x1 , ..., c xn ), c ∈ R,
se tiene que Rn es un espacio vectorial sobre R.
2. Una matriz de m × n con entradas en
la forma

a11 a12
 a21 a22

A =  .
..
 ..
.
am1
am2
R, es un arreglo rectangular de

· · · a1n
· · · a2n 

..
.. 
.
. 
···
amn
y
(cA)ij = c Aij ,
donde cada entrada aij ∈ R, i ∈ {1, 2, ..., m}, j ∈ {1, 2, ..., n}. Si
definimos la suma de dos matrices A y B y el producto por escalares de
la forma
(A + B)ij = Aij + Bij
8
1.3. Espacios vectoriales
donde Aij denota la entrada de la matriz que se encuentra en el i-ésimo
renglón y la j-ésima columna, entonces el conjunto de matrices Mm × n (R)
es un espacio vectorial sobre R.
3. Un polinomio con coeficientes en un campo K es una expresión de la
forma
n
X
p (x) =
ak xk ,
(1.2)
k=0
donde n ∈ N y cada ak , llamado coeficiente de xk , está en K. Si
p (x) = 0, esto es, si ak = 0, para toda k ∈ N ∪ {0}, entonces a p (x)
lo llamaremos el polinomio nulo o cero. El grado de un polinomio se define
como el exponente más grande de la indeterminada x que aparece en la
representación (1.2). Por convención, el polinomio nulo tiene grado −1.
Diremos que dos polinomios son iguales si tienen el mismo grado y sus
coeficientes son iguales, esto es, si
p (x) =
n
X
ak xk
q (x) =
y
k=0
m
X
bk xk ,
k=0
entonces son iguales si m = n y ai = bi , i ∈ {1, ...., n}. Por otra parte,
si m < n podemos definir
bm +1 = bm + 2 = · · · = bn = 0,
de tal forma que q (x) se puede escribir como
q (x) =
n
X
bk x k .
k=0
Ası́, podemos definir la suma de dos polinomios como
p (x) + q (x) =
n
X
(ak + bk ) xk
k=0
y el producto por escalares de la forma
c p (x) =
n
X
k=0
c ak xk ,
c ∈ K.
Con estas operaciones, el conjunto de polinomios de grado n con coeficientes en un campo K (que denotaremos por Pn [K]). es un espacio
vectorial.
4. Consideremos R2 con las siguientes operaciones
(x1 , y1 ) ⊕ (x2 , y2 ) = (x1 + x2 , y1 − y2 )
y
c
2
Obsérvese que (R , ⊕,
(x1 , y1 ) = (c x1 , c y1 ).
) no es un espacio vectorial (¿Por qué?).
9
1. Espacios normados
1.3.
Espacios normados
El concepto de medida es fundamental en las aplicaciones. En esta sección trataremos la idea de distancia o longitud en los espacios vectoriales, vı́a una estructura más rica llamada espacio con producto interior. Los espacios con producto
interior tienen diversas aplicaciones en la geometrı́a,la fı́sica, el estudio de los
mı́nimos cuadrados y las formas cuadráticas, por ejemplo. Iniciamos esta sección
con el estudio del producto punto para vectores en R3 (la construcción para R2
es análoga).
1.3.1.
Producto escalar en R3
−−→
−→
Consideremos dos vectores AB y AC. Denotaremos por θ al ángulo entre
ellos. Eligiendo un sistema de coordenadas rectangular, podemos suponer que
los vectores tienen el mismo punto inicial y éste último se encuentra en el origen
del sistema. De esta forma, podemos pensar que sus extremos son los puntos
P1 = (x1 , y1 , z1 ) y P2 = (x2 , y2 , z2 ) respectivamente. Ahora, obsérvese que
θ ∈ [0, π] (véase la Figura 1.6). Nuestro objetivo es encontrar una forma de
calcular el ángulo entre estos vectores.
P1
P2
r1
r2
θ
Figura 1.6: Ángulo entre dos vectores
Aplicando la fórmula de la distancia y la ley de cosenos, obtenemos
r12 + r22 − 2 r1 r2 cos θ = (d (P1 , P2 ))2 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 ,
−−→
−→
donde r1 y r2 denotan las magnitudes de los vectores AB y AC respectivamente. Usando el hecho de que ri = x2i + yi2 + zi2 , i = 1, 2, se sigue
que
x1 x2 + y1 y2 + z1 z2 = r1 r2 cos θ.
(1.3)
10
1.3. Espacios normados
El lado izquierdo de esta última expresión lo llamamos producto escalar de
los vectores P1 y P2 (recordemos que usamos indistintamente, a menos que
haya confusión, la notación para puntos y vectores posición). Denotamos al
producto escalar por P1 · P2 . El lado derecho de la ecuación (1.3) establece que
el producto escalar no depende de la elección del sistema de coordenadas, sino
de la magnitud de los vectores y el ángulo comprendido entre éstos. Se deja al
lector verificar que el producto escalar satisface las siguientes condiciones:
Para 3 vectores cualesquiera x, y, z y un escalar arbitrario c,
1. x · (y + z) = x · y + x · z.
2. (cx) · y = c (x · y).
3. x · y = y · x.
4. x · x ≥ 0 y x · x = 0 ⇔ x = 0
Obsérvese que de esta última propiedad se deduce que ||x|| =
que, de la ecuación (1.3), se sigue que
cos θ =
1.3.2.
√
x · x, por lo
x·y
.
||x|| ||y||
Productos interiores y normas
Muchas ideas geométricas tales como la longitud de vectores, los ángulos comprendidos entre ellos y la perpendicularidad en R2 y R3 , se pueden extender
a espacios vectoriales más generales. Estas ideas estan relacionadas con el concepto de producto interior.
Definición 4 Sea V un espacio vectorial sobre R. Un producto interior sobre
V es una función h, i : V × V −→ R, tal que para cualesquiera elementos
x, y, z ∈ V y para todo c ∈ R, se satisfacen las siguientes propiedades
1. hcx + y, zi = c hx, zi + hy, zi.
2. hx, yi = hy, xi.
3. hx, xi > 0 si x 6= 0
Ejemplos
1. Como vimos en la subsección anterior, el producto escalar en R3 (y en
R2 ) es un producto interior. Más aún, podemos definir en Rn la siguiente
función
n
X
hX, Y i =
xi yi ,
(1.4)
i=1
11
1. Espacios normados
donde X = (x1 , ...xn ) y Y = (y1 , ..., yn ). Para ver que esta función es
un producto interior, tenemos que verificar las propiedades dadas en la
definición 14. Si Z = (z1 , ..., zn ) y c ∈ R, entonces
n
X
hcX + Y, Zi =
(cxi + yi )zi
i=1
n
X
=
c xi zi + yi zi
i=1
n
X
=
c
xi zi +
i=1
n
X
yi zi
i=1
c hX, Zi + hY, Zi.
=
Ahora, por la conmutatividad de los números reales, es claro que
hX, Y i = hY, Xi.
Finalmente si X 6= 0, entonces al menos una entrada del vector X es
distinta de cero, en consecuencia
n
X
hX, Xi =
x2i > 0.
i=1
Por tanto, la función dada en la expresión (1.4) es unproducto interior
sobre Rn .
2. Sea V = C[a,b] el espacio de funciones continuas definidas sobre el intervalo [a, b] y definimos la función
b
Z
hf, gi =
f (t) g(t) dt
(1.5)
a
Como la integral abre sumas y saca escalares, la primera propiedad de
la definición 14 se cumple, además la segunda propiedad se cumple por
la conmutatividad de los números reales. Ahora si f (t) 6= 0 para toda
t ∈ [a, b], entonces (f (t))2 > 0. Como f es continua, se sigue que
hf, f i =
Z
b
(f (t))2 dt > 0,
a
en consecuencia, la función definida en (1.5) es un producto interior.
Como consecuencias inmediatas de la definición 14, tenemos las siguientes propiedades.
Proposición 1.3.1 Sea V un espacio vectorial sobre R con producto interior.
Entonces para cualesquiera x, y, z ∈ V y c ∈ R se tiene que
12
1.3. Espacios normados
1. hx, cy + zi = c hx, yi + hx, zi
2. hx, 0i = h0, xi = 0.
3. hx, xi = 0 si y sólo si x = 0.
4. Si hx, yi = hx, zi para todo x ∈ V , entonces y = z
Demostración.
1. Obsérvese que
hx, cy + zi = hcy + z, xi
= chy, xi + hz, xi
= chx, yi + hx, zi.
2. Nótese que
hx, 0i = hx, y − yi
para y ∈ V . Luego, por la afirmación anterior,
hx, y − yi = hx, yi + hx, −yi
= hx, yi − hx, yi = 0.
3. Si x = 0, por la afirmación anterior se sigue que hx, xi = 0. Ahora si
hx, xi = 0, como por definición se tiene que hx, xi > 0 si x 6= 0, se
sigue que x = 0.
4. Si hx, yi = hx, zi, entonces se tiene que
hx, yi − hx, zi = hx, y − zi = 0,
para todo x ∈ V , en particular para y − z, esto es
hy − z, y − zi = 0,
por la afirmación anterior, y − z = 0, es decir y = z.
Esta última proposición nos permite generalizar la noción de magnitud de
un vector a espacios vectoriales con producto interior.
Definición 5 Sea V un espacio vectorial sobre R con producto interior. Para
x ∈ V definimos la norma o longitud de x como
p
||x|| = hx, xi
El siguiente resultado muestra que las propiedades para la norma euclidiana
en R3 se cumplen en general para espacios vectoriales con producto interior.
13
1. Espacios normados
Proposición 1.3.2 Sea V un espacio vectorial sobre R con producto interior.
Entonces para todo x, y ∈ V y c ∈ R, se cumplen las siguientes afirmaciones
1. ||c x|| = |c| ||x||.
2. ||x|| ≥ 0 y ||x|| = 0 si y sólamente si x = 0.
3. |hx, yi| ≤ ||x|| ||y|| (Desigualdad de Cauchy - Schwarz).
4. ||x + y|| ≤ ||x|| + ||y|| (Desigualdad del triángulo).
Demostración.
1. Por la definición se tiene que
p
p
hc x, c xi = c2 hx, xi
p
= |c| hx, xi = |c| ||x||.
||c x|| =
2. Por la definición 14, se sigue que ||x|| > 0 si x 6= 0 y, por la proposición
1.3.1, se sigue que ||x|| = 0 si y sólamente si x = 0.
3. Si y = 0 el resultado es inmediato. Supongamos que y 6= 0. Para todo
α ∈ R, se tiene que
0 ≥ ||α x + y|| = hα x + y, α x + yi = α2 ||x||2 + 2 α hx, yi + ||y||2 .
Sea ||x||2 = a, 2 hx, yi = b y ||y||2 = c. Entonces, se tiene que
a α2 + 2b α + c ≥ 0 ∀ α ∈ R.
Ahora, si f (α) = a α2 + 2b α + c, se sigue que
b
f0 −
= 0,
2a
b
esto es, α = − 2a
es un mı́nimo para la función f . Además, como
f (α) ≥ 0
se obtiene que
a
b2
4a2
para toda α ∈ R,
+b
de donde se sigue que
c ≥
−b
2a
+ c ≥ 0,
b2
,
4a
por lo tanto
b2 ≤ 4ac,
es decir
|hx, yi|2 ≤ ||x||2 ||y||2
14
1.3. Espacios normados
4. Por la definición de norma y las propiedades de producto interior, se tiene
que
||x + y||2
=
=
=
hx + y, x + yi
hx, xi + 2 hx, yi + hy, yi
||x||2 + 2 hx, yi + ||y||2 .
Por la desigualdad de Cauchy - Schwarz, se sigue que
||x + y||2 ≤ ||x||2 + ||x|| ||y|| + ||y||2 = (||x|| + ||y||)2 ,
lo cual concluye la demostración.
Proposición 1.3.3 (Ley del paralelogramo). Sea V un espacio vectorial
sobre R con producto interior. Entonces, se cumple que
||x + y||2 + ||x − y||2 = 2 (||x||2 + ||y||2 )
Demostración. Por la definición de norma en un espacio conproducto interior,
se tiene que
||x + y||2 + ||x − y||2
= hx + y, x + yi + hx − y, x − yi
=
+
=
(hx, xi + 2 hx, yi + hy, yi)
(hx, xi − 2 hx, yi + hy, yi)
2||x||2 + 2 ||y||2 .
Ahora definimos el concepto de norma en general.
Definición 6 Sea V un espacio vectorial sobre R. Definimos una norma como
una función || · || : V −→ R+ ∪ {0} que satisface las siguientes condiciones
1. Para todo x ∈ V , ||x|| ≥ 0. Además, ||x|| = 0 si y sólamente si
x = 0.
2. Para todo x ∈ V y c ∈ R, ||c x|| = |c| ||x||.
3. Para cualesquiera x, y, z ∈ V , ||x + y|| ≤ ||x|| + ||y||.
A un espacio vectorial en donde se ha definido una norma || · || lo llamaremos
simplemente espacio normado.
Hemos visto que a partir de un producto interior se puede generar una norma,
pero no toda norma proviene de un producto interior. Sin embargo, se puede
verificar que si una norma satisface la ley del paralelogramo, se puede construir
un producto interior que la induzca.
15
1. Espacios normados
Proposición 1.3.4 Sea V un espacio normado sobre R, con norma || · || tal
que satisface la ley del paralelogramo y defı́nase
1
hx, yi =
||x + y||2 − ||x − y||2 .
4
Entonces h, i es un producto interior tal que ||x||2 = hx, yi para todo x ∈ V .
Demostración. Para ver que h, i es un producto interior, tenemos que verificar las condiciones establecidas en la definición 14. Obsérvese que
1
hx, yi =
||x + y||2 − ||x − y||2
4
1
=
||y + x||2 − ||y − x||2 = hy, xi.
4
Además,
1
||2 x||2 − ||0||2 = ||x||2 > 0,
hx, xi =
4
si x 6= 0.
Por otro lado, como la norma satisface la ley del paralelogramo, se tiene que
||x + 2y||2 + ||x||2
=
=
||(x + y) + y||2 + ||(x + y) − y||2
2 (||x + y||2 + ||y||2 )
y
||x − 2y||2 + ||x||2
de donde se sigue que
por lo que
=
=
||(x − y) − y||2 + ||(x − y) + y||2
2 (||x − y||2 + ||y||2 ),
||x + 2y||2 − ||x − 2y||2 = 2(||x + y||2 − ||x − y||2 )
1
(||x + 2y||2 − ||x − 2y||2 )
4
1
(2(||x + y||2 − ||x − y||2 )) = 2 hx, yi.
=
4
Ası́, para probar que hx + y, zi = hx, zi + hy, zi, verificamos que
hx, 2yi =
hx + y, 2zi = 2 (hx, zi + hy, zi).
De manera similar al argumento anterior, por la ley del paralelogramo se tiene
que
||x + y + 2z||2 + ||x − y||2
=
2(||x + z||2 + ||y + z||2 )
y
||x + y − 2z||2 + ||x − y||2
=
2 (||x − z||2 + ||y − z||2 ),
16
1.3. Espacios normados
de donde se obtiene que
||x + y + 2z||2 − ||x + y − 2z||2 = 2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 ).
En consecuencia, se sigue que
1
(||x + y + 2z||2 − ||x + y − 2z||2 )
4
1
(2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 ))
4
2 (hx, zi + hy, zi).
hx + y, 2zi =
=
=
Inductivamente, para n ∈ N se tiene que
hn x, yi = h(n − 1)x, yi + hx, yi = · · · = n hx, yi.
Ahora, por el argumento anterior, obtenemos
1
1
hx, yi = hm
x , yi = m h x, zi,
m
m
de donde se concluye que
h
Ası́, si r =
p
q,
1
1
x, zi =
hx, yi.
m
m
donde p, q ∈ N, entonces
hr x, yi = hp
=
1
1
x, yi = p h
x, yi
q
q
p
hx, yi = r hx, yi.
q
Ahora, si r = 0, se sigue que
h0, yi =
1
(||y||2 − ||y||2 ) = 0 = 0 hx, yi.
4
Finalmente, si r es negativo, nótese que
hrx, yi = h(−r) (−x), yi = −r h−x, yi,
pero
ya que
h−x, yi + hx, yi =
h−x, yi = −hx, yi
1
(|| − x + y||2 − || − x − y||2 + ||x + y||2 − ||x − y||2 ) = 0.
4
Por lo tanto
hrx, yi = −r h−x, yi = r hx, yi.
17
1. Espacios normados
Por otra parte, obsérvese que
hx, xi =
1
(||x + x||2 − ||0||2 ) = ||x||2 ,
4
(1.6)
para todo x ∈ V . Consecuentemente, por la desigualdad del triángulo y el
argumento anterior, tenemos que
||x||2 + 2 hx, yi + ||y||2
= ||x + y||2
≤ (||x|| + ||y||)2 = ||x||2 + 2 ||x|| ||y|| + ||y||2 .
De manera similar, tomando ||x − y||2 , se obtiene que
||x||2 − 2 hx, yi + ||y||2 ≤ ||x||2 + 2 ||x|| ||y|| + ||y||2 ,
de donde se concluye que
|hx, yi| ≤ ||x|| ||y||.
(1.7)
Finalmente, sea c ∈ R y r ∈ Q. Como
(c − r) hx, yi = c hx, yi − rhx, yi
y
h(c − r)x, yi = hcx − rx, yi = hcx, yi − r hx, yi,
es claro que
|c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi|.
Ahora, por la desigualdad (1.7), se sigue que
−|c − r| ||x|| ||y|| ≤ (c − r) hx, yi
y
y por tanto
h(c − r)x, yi ≤ |c − r| ||x|| ||y||
|c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi| ≤ 2 |c − r| ||x|| ||y||.
(1.8)
Por la propiedad arquimediana, para todo c ∈ R, se puede encontrar r ∈ Q
tal que |c − r| < ε, donde ε > 0. Por la desigualdad (2), se concluye que
hcx, yi = c hx, yi
para todo c ∈ R. Ası́, h, i es un producto interior y por la ecuación (34), se
sigue el resultado.
Regresando al estudio de las normas en Rn , hemos visto que el producto
escalar genera una norma, a saber, la función dada por
v
u n
uX
x2i ,
||X||2 = t
i=1
18
1.3. Espacios normados
donde X = (x1 , ..., xn ). A esta norma la llamaremos norma euclidiana. Sin
embargo, podemos definir otras funciones que resultan ser normas en Rn . Por
ejemplo, podemos definir la función
||X||1 =
n
X
i=1
|xi |.
Para ver que es una norma, debemos verificar que se cumplen las condiciones de
la definición 15. En efecto, nótese que ||X||1 ≥ 0 ya que estamos considerando
los valores absolutos de las entradas del vector X, además, esta función toma
el valor cero si y sólo si cada una de las entradas del vector es cero. Por otra
parte, si c ∈ R, se tiene que
||c X||1 =
n
X
i=1
n
X
|c xi | = |c|
i=1
|xi | = |c| ||X||1 .
Finalmente, por la desigualdad del triángulo para el valor absoluto, si Y =
(y1 , ..., yn ), se sigue que
||X + Y ||1 =
n
X
i=1
|xi + yi | ≤
n
X
i=1
(|xi | + |yi |) = ||X||1 + ||Y ||1 .
Por tanto se sigue que ||X||1 define una norma. Por otro lado, podemos definir
la siguiente función
! 31
n
X
3
||X||3 =
|xi |
.
i=1
Esta función también es una norma. En general, para p ≥ 1, si definimos la
función
! p1
n
X
p
||X||p =
|xi |
,
i=1
ésta resulta ser una norma. Para demostrar esta afirmación, requerimos de un
par de desigualdades que demostraremos a continuación
Proposición 1.3.5 (Desigualdad de Hölder). Sean p > 1 y q > 1 tales
que p1 + 1q = 1, X = (x1 , ..., xn ) y Y = (y1 , ..., yn ). Sea X 0 = (|x1 |, ..., |xn |)
y Y 0 = (|y1 |, ..., |yn |). Entonces

! p1   n
! q1 
n
X
X


|xi |p
|yi |q
(1.9)
X0 · Y 0 ≤ 
i=1
i=1
Demostración. Para empezar, recordemos la desigualdad de Bernoulli, esto
es, si t ≥ 0, entonces
(1 + t)p ≥ 1 + pt,
19
1. Espacios normados
alcanzándose la igualdad cuando t = 0. Ahora, sean a ≥ 0 y b > 0 tales que
a
1+t =
.
q
bp
Sustituyendo este valor en la desigualdad de Bernoulli, obtenemos
−q
ap
≥ 1 + p a b p − p,
q
b
donde la igualdad se alcanza cuando ap = bq . Multiplicando por bq ambos
lados de la desigualdad y realizando las operaciones correspondientes, se obtiene
que
p−1
(1.10)
ap ≥ bq (1 − p) + p a bq ( p ) .
p
p−1 ,
Como p1 + 1q = 1, se tiene que q =
desigualdad (4.2) obtenemos que
por lo que, sustituyendo en la
ap ≥ bq (1 − p) + p a b,
luego, multiplicando por
1
p,
se obtiene la siguiente desigualdad
bq
ap
+
≥ ab,
p
q
(1.11)
alcanzando la igualdad cuando ap = bq . Por otro lado, tómese
aj =
|xj |
n
X
i=1
! p1
p
|xi |
y
bj =
|yj |
n
X
i=1
! q1 ,
|yi |q
sustituyendo en la desigualdad (4.3) y sumando sobre todas las j ∈ {1, ..., n},
obtenemos


n
X
j=1
aj bj
≤
n 
X



j=1
p
|xj |p
! +
n
X
p
|xi |
q
i=1
n
X
=
p
|xi |p
i=1
n
X
i=1
=
n
X
! +
p
|xi |
1
1
+
= 1,
p
q
q


|yj |q

!

n
X
q 
|yi |
i=1
|yi |q
i=1
n
X
i=1
!
|yi |
q
20
1.3. Espacios normados
es decir
n
X
j=1
aj bj ≤ 1,
de donde se sigue el resultado.
Proposición 1.3.6 (Desigualdad de Minkowski) Sean xi , yi ∈ R, i ∈
{1, ..., n} y p ≥ 1. Entonces
! p1
n
X
i=1
|xi + yi |
p
! p1
n
X
≤
|xi |
i=1
p
! p1
n
X
+
p
|yi |
i=1
(1.12)
Demostración. Por la desigualdad del triángulo para el valor absoluto, se
tiene que
n
n
X
X
|xi + yi |p ≤
(|xi | + |yi |)p .
i=1
i=1
Por otra parte, el lado derecho de esta última desigualdad, se puede escribir
como
n
X
i=1
(|xi | + |yi |)p
=
=
n
X
i=1
n
X
i=1
(|xi | + |yi |)p − 1 (|xi | + |yi |)
(|xi | + |yi |)p − 1 |xi | +
n
X
i=1
(|xi | + |yi |)p − 1 |yi |.
Luego, definiendo |zi | = (|xi | + |yi |)p − 1 y aplicando la desigualdad (4.3) a
cada uno de los sumandos de la expresión anterior, obtenemos
n
X
i=1
|zi | |xi | +
n
X
i=1
|zi | |yi | ≤
n
X
=
i=1
n
X
=
i=1
como
1
p
+
1
q
n
X
i=1
=
!1
n
X
i=1
! q1 
|zi |q
n
X
q
|zi |q
i=1
n
X

i=1
q
(|xi | + |yi |)p − 1
!1
+
! q1 
n
X
+
i=1

i=1
|xi |p
i=1
|yi |p
n
X
i=1
! q1 

i=1
! q1 
(|xi | + |yi |)p
n
X
+
! p1 
n
X
i=1
n
X

i=1
! p1
|xi |p
+
|xi |p
n
X
i=1
! p1
+
p

|yi |p
,
= 1, entonces p = q (p − 1), de donde se obtiene que
q
(|xi | + |yi |)p − 1
!1
|yi |p
! p1 
! p1
n
X
n
X
q
|zi |q
i=1
! p1
|xi |p
!1
n
X
p
|xi |p
n
X
i=1
! p1 
|yi |p

! p1 
|yi |p
,
21
1. Espacios normados
lo cual implica que
n
X
i=1
p
(|xi | + |yi |)
≤
n
X
i=1
!1  n
!1
q
p
X
p

(|xi | + |yi |)
|xi |
+
i=1
n
X
i=1
tiene que
i=1
p
!1 − q1
(|xi | + |yi |)
n
X
≤
i=1
n
X
=
i=1
! p1
p
|xi |
n
X
+
i=1
i=1
!1 
p
,
|yi |
p
1
por lo que, multiplicando esta desigualdad por
n
X
n
X
p
! q1 se ob-
(|xi | + |yi |)p
! p1
p
(|xi | + |yi |)
! p1
|yi |
p
,
pero, por la desigualdad del triángulo para los valores absolutos, tenemos que
! p1
! p1
n
n
X
X
p
p
(|xi + yi |)
≤
(|xi | + |yi |)
,
i=1
i=1
de donde se concluye que
n
X
i=1
! p1
(|xi + yi |)
p
≤
n
X
i=1
! p1
|xi |
p
+
n
X
i=1
! p1
p
|yi |
,
que era justo lo que se querı́a demostrar.
De esta forma, la función definida por
||X||p =
n
X
i=1
! p1
|xi |p
,
donde X = (x1 , ..., xn ) define una norma, ya que, es claro que ||X||p ≥ 0,
alcanzándose la igualdad si y sólamente si cada una de las entradas del vector
X es igual a cero. Además, si c ∈ R, se tiene que
! p1
! p1
n
n
X
X
= |c|
|xi |p
|c| ||X||.
||c X||p =
|c xi |p
i=1
i=1
Finalmente, la desigualdad del triángulo se sigue de la desigualdad (1.12).
Por otra parte, podemos definir la siguiente función en Rn
||X||∞ = máx {|xi | | i ∈ {1, ..., n}},
donde X = (x1 , ..., xn ). Se afirma que esta función es una norma en Rn . Para
ver esto, nótese que ||X|| ≥ 0 alcanzando la igualdad si y sólamente si cada
entrada del vector X es cero. Ahora, si c ∈ R, entonces
||c X||∞ = máx {|c xi | | i ∈ {1, ..., n}} = |c| máx {|xi | | i ∈ {1, ..., n}} = |c| ||X||∞ .
22
1.4. Espacios métricos
Finalmente, se tiene que
||X + Y ||∞ = máx {|xi + yi | | i ∈ {1, ..., n}} = |xj + yj |,
para alguna j ∈ {1, ..., n}. Por la desigualdad del triángulo para el valor absoluto, se tiene que
|xj + yj | ≤ |xj | + |yj | ≤ máx {|xi | | i ∈ {1, ..., n}} + máx {|yi | | i ∈ {1, ..., n}},
de donde se concluye que
||X + Y ||∞ ≤ ||X||∞ + ||Y ||∞
Se pueden dar otros ejemplos de espacios vectoriales normados: el espacio
de funciones continuas definidas en un intervalo [a, b] con la función dada por
||f ||p =
Z
! p1
b
p
(|f (x)|) dx
a
p ≥ 1
es un espacio normado; el espacio de funciones acotadas con la funcón
||f || = sup {|f (x)| | x ∈ [a, b]}
también es un espacio normado. Nuestro estudio en la siguiente sección, se
centrará en cómo mediremos distancias a partir de las estructuras que hemos
construido hasta el momento.
1.4.
Espacios métricos
Entre las propiedades de Rn , una de las más importantes es la propiedad
métrica, es decir, la forma en que se mide la distancia entre puntos. Un espacio métrico es un conjunto X equipado con una función d : X × X −→ R
que proporciona una forma razonable de medir distancias entre dos elementos
de X . Este concepto nos permitirá definir más adelante el concepto de conjunto
abierto y a partir de éste último estudiar una serie de propiedades y conceptos
como, por ejemplo, el de convergencia.
Definición 7 Un espacio métrico es una estructura que consta de un conjunto
X 6= ∅ y de una función d : X × X −→ R+ ∪ {0}, llamada métrica, que
satisface los siguientes axiomas
1. d (x, y) = 0 ⇔ x = y.
2. d (x, y) = d (y, x) ∀ x, y ∈ X .
3. d (x, y) ≤ d (x, z) + d (z, y) ∀ x, y, z ∈ X .
Ejemplos.
23
1. Espacios normados
1. Sea (V, || · ||) un espacio normado. Para x, y ∈ V , definimos
d (x, y) = ||x − y||.
Esta función, en efecto, define una métrica. Nótese que, por las propiedades
de la norma, se tiene que d (x, y) ≥ 0, además d (x, y) = 0 si y sólamente
si ||x − y|| = 0, esto pasa si y sólamente si x − y = 0, lo cual sucede
si y sólamente si x = y, con lo que se satisface el primer axioma. Luego
d (x, y) = ||x − y|| = || − (y − x)|| = ||y − x|| = d (y, x).
Finalmente, por la desigualdad del triángulo para las normas, se tiene que
d (x, y) = ||x − y|| = ||(x − z) + (z − y)|| ≤ ||x − z|| + ||z − y|| = d (x, z) + d (z, y),
de donde se concluye que (V, d) es un espacio métrico. De esta forma,
hemos construido varios ejemplos de espacios métricos:
a) (Rn , d) donde d : Rn × Rn −→ R+ ∪ {0} está dada por
! p1
n
X
p
p ≥ 1.
d (x, y) =
|xi − yi |
i=1
En particular, cuando p = 2 se tiene la distancia euclidiana.
b) (Rn , d), definiendo a d como
d (x, y) = ||x − y||∞
c) (C[a,b] , d) donde d está definida como
Z
d (f, g) =
a
! 21
b
|f (x) − g (x)|2 dx
,
por mencionar algunos.
2. Sea X =
6 ∅ un conjunto arbitrario y defı́nase la función d como

si x =
6 y
 1
d (x, y) =

0
si x = y.
Entonces (X , d) es un espacio métrico. La verificación de los detalles se
dejan al lector. Nótese que este ejemplo nos dice que cualquier conjunto
distinto del vacı́o, se puede equipar con una métrica.
3. Sea X = {0, 1} y considérese el conjunto Y = X 9 , es decir, las 9-adas
en cuyas entradas hay sólo 0’s y 1’s. Defı́nase d como
d (x, y) = número de lugares en los cuales x y y son diferentes.
Entonces (Y, d) es un espacio métrico (de hecho, nótese que
d (x, y) =
9
X
i=1
|xi − yi |).
24
1.4. Espacios métricos
4. Sea
X = {x = {xi }i ∈ N | xi ∈ R,
X
i∈N
x2i < ∞}
y defı́nase
d (x, y) =
sX
i∈N
(xi − yi )2 .
Antes de verificar que esta función es una métrica, recordemos que dos
sucesiones x y y son iguales si xi = yi para toda i ∈ N. Ahora, es claro
que d (x, y) ≥ 0, alcanzando la igualdad si y solamente si xi − yi = 0
para toda i ∈ N. Por otra parte, obsérvese que
sX
sX
2
d (x, y) =
(xi − yi ) =
(yi − xi )2 = d (y, x).
i∈N
i∈N
Finalmente, para la desigualdad del triángulo, si x, y, z ∈ X , entonces
las series
X
X
X
(xi − yi )2 ,
(xi − zi )2 ,
(zi − yi )2 ,
i∈N
i∈N
i∈N
convergen. Luego
n
X
i=1
! 21
(xi − yi )
2
≤
n
X
i=1
! 21
2
(xi − zi )
+
n
X
i=1
! 12
2
(zi − yi )
por la desigualdad de Minkowski. Haciendo tender n a infinito, se tiene
el resultado. A este espacio se le conoce como espacio de Hilbert (real) y
suele denotarse como l2 .
5. Sean (Xi , di ), i ∈ {1, ..., n} espacios métricos. Tómese
X = X1 × X2 × · · · × Xn .
Defı́nase para x, y ∈ X la función
d (x, y) =
n
X
di (xi , yi ),
i=1
donde x = (x1 , ..., xn ) y y = (y1 , ..., yn ). Se afirma que (X , d) es un
espacio métrico. Para demostrar esta afirmación, verificamos los axiomas
de la definición de métrica. Como di es métrica para toda i ∈ {1, ..., n},
se sigue que d (x, y) ≥ 0, alcanzando la igualdad cuando cada uno de los
sumandos se anula. Esto último sucede si y sólamente si xi = yi para
toda i ∈ {1, ..., n}, ya que di es métrica. Además
d (x, y) =
n
X
i=1
di (xi , yi ) =
n
X
i=1
di (yi , xi ) = d (y, x).
25
1. Espacios normados
Finalmente, como cada di es métrica, se tiene que
d (x, y) =
n
X
i=1
di (xi , yi ) ≤
n
X
di (xi , zi ) +
i=1
n
X
di (zi , yi )
i=1
= d (x, z) + d (z, y),
donde z = (z1 , ..., zn ).
6. Sea (X , d) un espacio métrico y Y ⊆ X . Entonces, la restricción
dI = d|Y × Y : Y × Y −→ R+ ∪ {0},
es una métrica en Y. Al espacio (Y, dI ) se le conoce como subespacio
métrico. (Recuerde que si f : A −→ B y g : C −→ B tal que A ⊆ C y
f (x) = g (x) para toda x ∈ A, entonces se dice que f es la restricción
de g sobre A).
En un espacio métrico es posible hablar de vecindades de un punto.
Definición 8 Sean (X , d) un espacio métrico, x ∈ X y ε > 0. Definimos la
bola abierta de radio ε con centro en x como
Bε (x) = {y ∈ X | d (x, y) < ε}
Definición 9 Una vecindad de x es un conjunto U ⊂ X , tal que existe ε > 0
de tal forma que Bε (x) ⊂ U .
Se dice que dos métricas son equivalentes si para cada punto en el espacio
métrico, ambas determinan las mismas vecindades de dicho punto, es decir, dos
métricas d y d0 son equivalentes si y sólo si para cada punto x ∈ X se cumple
lo siguiente:
Dada ε > 0 existe ε0 > 0 tal que si d0 (x, y) < ε0 , entonces d (x, y) < ε; y
dada δ 0 > 0 existe δ > 0 tal que si d (x, y) < δ, entonces d0 (x, y) < δ 0 .
Para cerrar este capı́tulo, resulta interesante describir geométricamente las
bolas generadas en R2 y R3 por las normas || · ||p . Consideremos los conjuntos
Bε(p) = {y ∈ Rn | ||y||p < 1}
p ≥ 1, n = 2, 3.
Primero consideremos el caso n = 2.
Si p = 1, el conjunto anterior se puede escribir como
{y ∈ R2 | |y1 | + |y2 | < 1}.
Para describir geométricamente este conjunto, parecerı́a natural analizar el conjunto de puntos cuyas entradas satisfacen la siguiente igualdad
|y1 | + |y2 | = 1.
26
1.4. Espacios métricos
(0, 1)
(1, 0)
Figura 1.7: Bola generada por la norma || · ||1 en R2
Nótese que como se está tratando con valores absolutos, basta con analizar lo
que sucede en el cuadrante positivo. El resto del conjunto se obtiene reflejando
con respecto al origen y al eje y. De esta forma, trataremos la igualdad
y1 + y2 = 1,
que es equivalente a la igualdad
y2 = 1 − y1 ,
la cual describe una recta que pasa por los puntos (1, 0) y (0, 1). Reflejando con
respecto al eje de las ordenadas y con respecto al origen, obtenemos el conjunto
descrito en la Figura 1.7. Obsérvese que los puntos que quedan debajo de la
recta, satisfacen que
y1 + y2 < 1,
(1)
por lo que los puntos que conforman al conjunto Bε en R2 son los que se
encuentran ”adentro”del cuadrado descrito en la Figura 1.7. Si p = 2, nótese
que se tiene una circunferencia con centro en el origen.
(0, 1)
(1, 0)
Figura 1.8: Bola generada por la norma || · ||∞ en R2
Por otra parte, el conjunto B definido como
B = {y ∈ R2 | ||y||∞ < 1},
27
1. Espacios normados
genera un lugar geométrico como el descrito en la Figura 1.8, esto debido a que
si consideramos el conjunto de puntos (y1 , y2 ) tales que
máx {|y1 |, |y2 |} = 1,
tanto sus abscisas como sus ordenadas no podrán exceder 1, es decir, se tiene que
y1 , y2 ∈ [0, 1]. Si y1 ∈ [0, 1) entonces, necesariamente, y2 = 1 y viceversa, si
y2 ∈ [0, 1), entonces, forzosamente y1 = 1.
Ahora, si x1 ∈ (0, 1), entonces, para 1 ≤ p ≤ q, se cumple que xq1 ≤ xp1 ,
de donde se obtiene que
1 − xp1 ≤ 1 − xq ,
de donde se concluye que la bola generada con la norma || · ||p está contenida
en la bola generada por la norma || · ||q , para p < q, obteniendo una situación
como la descrita en la Figura 1.9
(0, 1)
||X||1
||X||2
(1, 0)
||X||4
||X||∞
Figura 1.9: Comparativo de las bolas generadas por diferentes normas
Se puede hacer un análisis similar para el caso de R3 . Para el caso de la
norma || · ||1 , obsérvese que la ecuación
x1 + x2 + x3 = 1,
x1 , x2 x3 ≥ 0,
describe un plano que pasa por los puntos (0, 0, 1), (0, 1, 0) y (1, 0, 0). Luego,
al reflejar con respecto a los ejes y al origen, obtenemos un octaedro (véase la
Figura 1.10). La norma || · ||2 genera una esfera, la norma || · ||∞ un cubo y,
por un argumento similar al del caso bidimensional, la bola generada por || · ||p
está contenida en la generada por || · ||q , si p ≤ q.
Figura 1.10: Norma || · ||1 en R3
Capı́tulo 2
Elementos básicos de
topologı́a
Existen dos conceptos fundamentales en el desarrollo del cálculo diferencial y,
en general, en el análisis real: la convergencia de sucesiones y la continuidad
de funciones. Más adelante, definiremos funciones sobre subconjuntos de puntos
contenidos en espacios de dimensiones superiores y es conveniente conocer ciertas propiedades de conjuntos que llamaremos abiertos, cerrados y compactos.
Estos conjuntos generalizan las ideas de intervalos abiertos y cerrados en la recta
real y constituyen las ideas básicas de la topologı́a. Gran parte de los resultados
que desarrollamos en este capı́tulo dependen únicamente de las propiedades de
la función distancia por lo que, en algunas ocasiones, haremos un análisis de estos conjuntos en espacios métricos más generales. A menos que haya confusión,
denotaremos unicamente por X a un espacio métrico (X , d).
2.1.
Conjuntos abiertos
El concepto de conjunto abierto es crucial en el estudio del cálculo y el análisis
real.
Definición 10 Sea X un espacio métrico y A ⊆ X . Se dice que A es un
conjunto abierto en X , si para todo x ∈ A, existe ε > 0 tal que Bε (x) ⊂ A.
Nótese que, por la definición 9, un conjunto es abierto si y solamente si es
vecindad de todos sus puntos. A partir de la definición se puede demostrar que
Bε (x), ε > 0, es un conjunto abierto.
Proposición 2.1.1 Sean X un espacio métrico, ε > 0 y x ∈ X . Entonces
Bε (x) es un conjunto abierto.
Demostración. Sea y ∈ Bε (x). Debemos exhibir un valor ε0 > 0 tal que
Bε0 (y) ⊂ Bε (x). La Figura 2.1 sugiere que al tomar ε0 = ε − d(x,y)
, que es
2
29
30
2.1. Conjuntos abiertos
x
y
ε − d (x,y)
2
Figura 2.1: Idea para la demostración de la Proposición 2.1.1
estrictamente positivo ya que d (x, y) < ε, Bε0 (y) ⊂ Bε (x). En efecto, si
z ∈ Bε0 (y), entonces
d (x, z) ≤ d (z, y) + d (y, x) < ε0 + d (x, y) =
d (x, y) + ε
< ε.
2
Por tanto, z ∈ Bε (x).
En la demostración de la Proposición 2.1.1, obsérvese que ε0 depende de
la elección de y, esto es, Bε0 (y) será más pequeña si y está más cerca del
contorno de la bola.
Ejemplos.
1. Sea X = R2 con la métrica generada por la norma euclidiana. Consideremos el conjunto dado por
A = {(x, y) ∈ R2 | x ∈ (a, b)}.
Se afirma que A es abierto. La Figura 2.2 nos da una idea para la elección
de ε. Para un punto s = (x, y) ∈ A, proponemos
ε = mı́n {|x − a|, |x − b|}.
Sin pérdida de generalidad, podemos suponer que 0 < a < b. Tómese
un punto z = (z1 , z2 ) ∈ Bε (s), es claro que
|z1 − x| ≤ d (z, s) < ε.
Si ε = x − a, entonces se tiene que
|z1 − x| < x − a
⇔
a − x < z1 − x < x − a
⇔ a < z1 < 2x − a = x + (x − a) < b,
de donde se sigue que z ∈ A.
Si ε = b − x, entonces
|z1 − x| < b − x
⇔ x − b < z1 − x < b − x
⇔ 2x − b < z1 < b.
31
2. Elementos básicos de topologı́a
Ahora, 2x − b > a ya que, de lo contrario, se tendrı́a que x <
esto implica que
a+b
2 ,
b−a
b−a
y x−a <
,
2
2
de donde se concluye que x − a < b − x, lo cual es una contradicción.
Por tanto, 2x − b > a de donde se concluye que z ∈ A y por lo tanto
A es abierto.
b−x >
x
a
b
Figura 2.2: El conjunto A = {(x, y) ∈ R2 | x ∈ (a, b)} es abierto
2. Sean A y B subconjuntos abiertos de Rn . Definimos
A + B = {x + y ∈ Rn | x ∈ A, y ∈ B}.
Se afirma que A + B es un conjunto abierto. Para ver esto, consideremos
un punto arbitrario z ∈ A + B, entonces existen elementos x ∈ A y
y ∈ B tales que z = x + y. Como A es abierto, existe ε > 0 tal que
Bε (x) ⊂ A. Demostraremos que Bε (z) ⊂ A + B. Sea w ∈ Bε (z),
entonces
||w − z|| = ||w − (x + y)|| < ε.
Ahora, obsérvese que w − (x + y) = (w − y) − x, en consecuencia,
w − y ∈ Bε (x) ⊂ A. Como y ∈ B y w = (w − y) + y, se sigue que
w ∈ A + B. Por tanto A + B es abierto.
3. Sea X un conjunto arbitrario, distinto del vacı́o y equipado con la métrica
discreta. Si A ⊆ X , entonces para todo punto x ∈ A tomamos ε = 21 .
Luego, Bε (x) = {x} ⊂ A. Por tanto, todo subconjunto de X es abierto
con la métrica discreta.
32
2.1. Conjuntos abiertos
4. Sea X un espacio normado y x ∈ X . Entonces el conjunto {x} no es
abierto.
Nótese que si tomamos la unión de una colección arbitraria de intervalos
abiertos en R, obtendremos un conjunto abierto. Sin embargo, la intersección arbitraria de intervalos abiertos no siempre da como resultado un conjunto abierto.
A saber, considérese la colección de intervalos dada por
In = (x0 −
1
1
, x0 + ),
n
n
n ∈ N,
para alguna x0 ∈ R. Obsérvese que
\
In = {x0 }.
n∈N
Este ejemplo nos sugiere la siguiente propiedad de los conjuntos abiertos.
Proposición 2.1.2 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de
abiertos en X , entonces
[
1. Para cualquier conjunto de ı́ndices Λ,
Aα es abierto en X .
α∈Λ
2. Si Λ es un conjunto de ı́ndices finito, entonces
En particular, si Λ = ∅, por definición
[
α∈Λ
\
α∈Λ
Aα es abierto en X .
Aα = ∅ y
\
α∈Λ
Aα = X .
Demostración.
[
1. Sea x ∈
Aα , entonces existe α ∈ Λ tal que x ∈ Aα . Como Aα es
α∈Λ
abierto, existe ε > 0 tal que
Bε (x) ⊂ Aα ⊂
por tanto
[
[
Aα ,
α∈Λ
Aα es abierto.
α∈Λ
2. Sea x ∈
\
α∈Λ
Aα , entonces x ∈ Aα para toda α ∈ Λ. Como cada Aα
es abierto, existe εα > 0 tal que Bεα ⊂ Aα . Como Λ es finito, podemos
tomar
ε = {εα | α ∈ Λ};
ε > 0 y claramente Bε (x) ⊂ Bεα (x) para toda α ∈ Λ. Por tanto,
\
Bε ⊂
Aα ,
α∈Λ
33
2. Elementos básicos de topologı́a
de donde se concluye que
\
Aα es abierto.
α∈Λ
Finalmente, como X contiene a todas las bolas, entonces es abierto y ∅,
por vacuidad, es abierto.
En general, un conjunto con una colección de subconjuntos (llamados por
definición abiertos) que satisfacen las condiciones de la proposición 2.1.2 y contiene al vacı́o y al conjunto total, se le llama espacio topológico y a la colección
de subcojuntos se le llama topologı́a.
Definición 11 Dos normas definidas sobre un mismo espacio vectorial V se
dicen equivalentes, cuando inducen la misma topologı́a sobre V , esto es, definen
los mismos abiertos en V .
Esta definición es equivalente a la siguiente definición.
Definición 12 Dos normas || · || y || · ||∗ sobre V son equivalentes si y sólo si
existen dos constantes a, b > 0 tales que
a||x|| ≤ ||x||∗ ≤ b||x||
∀ x ∈ V.
Diremos que dos normas están relacionadas (|| · || ∼ || · ||∗ ) si y sólo si son
equivalentes. Es claro que esta relación es de equivalencia.
Proposición 2.1.3 En Rn , las normas dadas por
! p1
n
X
p
||X||p =
|xi |
i=1
y
||X||∞ = máx {|xi | | i ∈ {1, ...., n}},
X = (x1 , ..., xn ), son equivalentes.
Demostración. Obsérvese que ||X||∞ = |xj | para alguna j ∈ {1, ..., n}.
Luego, se tiene que

 p1
X
1
(|xj |p ) p = |xj | ≤ 
|xi |p + |xj |p  ,
i 6= j
por tanto ||X||∞ ≤ ||X||p . Por otro lado, nótese que
|xi |
≤
||X||∞ ∀ i ∈ {1, ..., n}
n
X
⇒
|xi |p ≤ n (||X||∞ )p
i=1
⇒
||X||p ≤
√
p
n ||X||∞ .
34
2.1. Conjuntos abiertos
Este resultado nos permite trabajar indistintamente con cualquier norma.
Más adelante demostraremos que cualquier norma en Rn es equivalente a la
norma || · ||p , por lo que basta analizar las propiedades de los abiertos en Rn
con la norma euclidiana.
Presentamos ahora otra noción topológica básica que caracteriza a los conjuntos abiertos.
Definición 13 Sean X = (X, d) un espacio métrico y A un subconjunto de
X. Se dice que un punto x ∈ A es interior, si existe U ⊂ X abierto tal que
x ∈ U ⊂ A.
A la colección de todos los puntos interiores se le llamará interior de A y se
denota por Ao .
Ejemplos.
1. Considérese el conjunto
A = {(x, y) ∈ R2 | x ∈ (a, b)}.
Ya se verificó que este conjunto es abierto, es decir, para todo x ∈ A,
existe ε > 0 tal que
Bε (x) ⊂ A.
También, hemos demostrado que para todo punto x en un espacio métrico,
Bε (x) es un conjunto abierto. En consecuencia, es claro que Ao = A.
2. Sea A = [a, b]. Se afirma que Ao = (a, b). Si x ∈ (a, b), como éste
último es un conjunto abierto, se sigue que existe un valor ε > 0 tal que
Bε (x) ⊂ A, esto es, existe un conjunto abierto totalmente contenido en
(a, b) que contiene al punto x. Por otro lado, si x ∈ Ao , entonces existe
U ⊂ R abierto, tal que x ∈ U ⊂ A. Ahora,
x 6∈ (−∞, a) ∪ (b, ∞),
ya que de lo contrario, como (−∞, a) ∪ (b, ∞) es un conjunto abierto,
se puede construir un intervalo centrado en x de radio ε > 0, tal que
esté totalmente contenido en (−∞, a) ∪ (b, ∞). Por otra parte, x 6= a,
ya que para toda ε > 0, (a − ε, a + ε) interseca al complemento de A,
es decir, no existe una vecindad de a que esté totalmente contenida en
(a, b). Un argumento similar demuestra que b tampoco es punto interior.
Por tanto, x ∈ (a, b), de donde se sigue que Ao = (a, b).
El siguiente resultado proporciona otras descripciones equivalentes del interior de un conjunto.
Proposición 2.1.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces, las siguientes afirmaciones son equivalentes.
35
2. Elementos básicos de topologı́a
a) x es un punto interior de A.
b) Existe ε > 0 tal que Bε (x) ⊂ A.
c) x ∈
S
{B ⊆ A | B es un conjunto abierto}
Demostración.
a) ⇒ b)
Si x ∈ Ao , entonces existe un abierto U tal que
x ∈ U ⊂ A.
Como U es abierto, existe ε > 0 tal que Bε ⊂ U ⊂ A.
b) ⇒ a)
Ya se demostró que Bε (x) es un conjunto abierto, por lo que es claro que x es
un punto interior de A.
a) ⇒ c)
S
Sea G =
{B ⊆ A | B es un conjunto abierto}. Se tiene que x ∈ G, si y
sólamente si x ∈ B, para algún abierto B ⊆ A, esto es, x ∈ Ao .
c) ⇒ a)
Si x ∈ Ao , entonces existe un abierto U tal que x ∈ U ⊂ A. Por tanto
x ∈ G.
La proposición 2.1.4 muestra que el interior de un conjunto es abierto. Más
aún, un conjunto A es abierto si y sólamente si A = Ao . Nótese que el interior
de un conjunto es el abierto más grande contenido en A. El siguiente resultado
muestra algunas propiedades para los interiores de conjuntos en un espacio
métrico. La demostración de estos hechos se le deja al lector.
Proposición 2.1.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos
de X. Entonces
1. X o = X.
2. Ao ⊆ A.
3. (Ao )o = Ao .
4. (A ∩ B)o = Ao ∩ B o .
5. Si A ⊆ B, entonces Ao ⊆ B o .
6. Ao ∪ B o ⊆ (A ∪ B)o .
36
2.2. Conjuntos cerrados
2.2.
Conjuntos cerrados
Los conjuntos que se conocen como cerrados, al igual que los abiertos, determinan la topologı́a de los espcaios métricos. Sin embargo, sus propiedades son
diferentes a las de los abiertos, por lo que resulta importante estudiarlos por
separado.
Definición 14 Sean X = (X, d) un espacio métrico y B ⊂ X. Se dice que
B es un conjunto cerrado si B c es abierto.
Ejemplos.
1. Sea x ∈ Rn . Se afirma que {x} es un conjunto cerrado en Rn . Para ver
esto, considérese Rn − {x} y tómese un punto y ∈ Rn − {x}. Definimos
ε = d (x,y)
y construı́mos la bola con centro en y y radio ε. Luego, si
2
z ∈ Bε (y), entonces
d (x, z) ≥ d (x, y) − d (z, y) ≥ d (x, y) − ε = d (x, y) −
d (x, y)
d (x, y)
=
> 0,
2
2
de donde se sigue que d (x, z) > 0, por lo que z ∈ Rn − {x}. Ası́,
Rn − {x} es abierto y, por lo tanto {x} es cerrado en Rn . Más aún, por
la proposición 2.2.1, se sigue que un conjunto finito en Rn es cerrado.
y
Figura 2.3: El complemento de la bola unitaria es un conjunto abierto
2. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Se afirma que C es cerrado. Para demostrar esta afirmación, nótese que si y ∈ C c , se tiene que
||y||2 > 1, por lo que tomamos ε = ||y||2 − 1 (véase la Figura 2.3). Sea
z ∈ Bε (y). Aplicando la desigualdad del triángulo se tiene que
||y||2 − ||z||2 ≤ ||y − z||2 < ε ⇔ 1 = ||y||2 − ε < ||z||2 ,
es decir, z ∈ C c . En consecuencia, Bε (y) ⊂ C c , esto es, C c es abierto,
de donde se concluye que C es cerrado.
37
2. Elementos básicos de topologı́a
3. El conjunto dado por
R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]},
no es un conjunto cerrado. Nótese que el conjunto Rc no es abierto, ya
que para toda ε > 0, la bola de radio ε centrada en un punto de la forma
(a, y), donde y ∈ (c, d), no está totalmente contenida en Rc (véase la
Figura 2.4).
d
c
a
b
Figura 2.4: El conjunto R no es cerrado
De la definición 14 y la proposición 2.1.2, se obtiene el siguiente resultado.
Proposición 2.2.1 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de
cerrados en X , entonces
\
1. Para cualquier conjunto de ı́ndices Λ,
Aα es cerrado en X .
α∈Λ
2. Si Λ es un conjunto de ı́ndices finito, entonces
X.
[
Aα es cerrado en
α∈Λ
Otro concepto topológico básico que nos ayudará a determinar si un conjunto
es cerrado es el de punto de acumulación.
Definición 15 Sean X = (X, d) un espacio métrico y A ⊂ X. Se dice que
un punto x ∈ X es un punto de acumulación de A si existe un abierto U ⊂ X
tal que x ∈ U y (U − {x}) ∩ A 6= ∅. Al conjunto de puntos de acumulación
de A se le conoce como conjunto derivado y se denota por A0 .
38
2.2. Conjuntos cerrados
Obsérvese que esta definición nos dice que un punto es de acumulación de un
conjunto A, si está arbitrariamente cercano a los puntos de A. Por la proposición 2.1.1, podemos reformular la definición 15 de la siguiente manera:
Se dice que un punto x ∈ X es un punto de acumulación de A si para toda
ε > 0, (Bε (x) − {x}) ∩ A 6= ∅.
Se dice que un punto x ∈ A es aislado si existe un valor ε > 0 tal que
(Bε (x) − {x}) ∩ A = ∅.
Ejemplos.
1. Sea A = (0, 1). Si x ∈ [0, 1], es claro que para toda ε > 0 se cumple
que
((x − ε, x + ε) − {x}) ∩ (0, 1) =
6 ∅.
Si x < 0, como (−∞, 0) es un conjunto abierto, existe un valor ε > 0
tal que (x − ε, x + ε) ⊂ (−∞, 0), es decir, existe un valor ε tal que el
intervalo centrado en x de radio ε no interseca al conjunto A, de donde
se concluye que x no es punto de acumulación para el conjunto A. Un
argumento similar prueba que ningún punto en (1, ∞) es de acumulación
de A.
2. Considérese el conjunto dado por
A = {(x, y) ∈ R2 | x ∈ [0, 1], y ∈ Q ∩ (0, 1)}.
Se afirma que A0 = [0, 1] × [0, 1]. Para ver esto, sea
w = (x, y) ∈ [0, 1] × [0, 1].
Por la propiedad arquimediana, para todo valor ε > 0, se satisface que
(y − ε, y + ε) ∩ Q 6= ∅,
donde y ∈ [0, 1]. De esta forma, para toda ε > 0 se tiene que
(Bε (w) − {w}) ∩ A 6= ∅,
de donde se sigue que w ∈ A0 . Finalmente, si w ∈ A0 , por la parte
anterior se sigue que w ∈ [0, 1] × [0, 1].
3. Sea {xn }n ∈ N ⊂ R, una sucesión de puntos distintos, acotada. Por el teorema de Bolzano-Weierstrass para sucesiones en R, existe una subsucesión
{xnk } convergente, digamos a x0 . Luego, x0 es un punto de acumulación
para la sucesión {xn }, ya que para toda ε > 0, existe N ∈ N tal que
|xnk − x0 | < ε, si nk > N . Esto quiere decir que para toda ε > 0,
(Bε (x0 ) − {x0 }) ∩ {xn } 6= ∅.
2. Elementos básicos de topologı́a
39
4. Tómese la bola A = Bε (x) ⊂ R2 . Se puede ver que el conjunto
Bε (x) = {y ∈ R2 | d (x, y) ≤ ε}
es el conjunto de puntos de acumulación de A (la verificación de los detalles se le dejan al lector). Sin embargo, este resultado es falso en general.
Si consideramos X un conjunto arbitrario, distinto del vacı́o, equipado
con la métrica discreta, nótese que, para x ∈ X,
B1 (x) = {x} ⇒ (B1 (x))0 = ∅.
Por otro lado
B1 (x) = {y ∈ R2 | d (x, y) ≤ 1} = X.
Las nociones de punto de acumulación y conjunto cerrado están fuertemente
relacionadas, tal y como lo muestra el siguiente resultado.
Teorema 2.2.2 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces A
es cerrado si y sólamente si A0 ⊆ A.
Demostración. Supongamos que A es un conjunto cerrado. Si x ∈ Ac ,
entonces existe un valor ε > 0 tal que Bε (x) ⊂ Ac . Luego Be (x) ∩ A = ∅,
de donde se sigue que x 6∈ A0 . Por tanto, A contiene a todos sus puntos de
acumulación.
Por otro lado, supongamos que A0 ⊆ A. Si x ∈ Ac , entonces x 6∈ A0 , de
donde se sigue que existe ε > 0 tal que Bε (x) ∩ A = ∅, es decir, Bε (x) ⊂ Ac ,
por lo que se concluye que Ac es abierto, lo cual prueba el resultado.
En la sección anterior vimos que el interior de un conjunto A es el abierto
más grande contenido en A. De manera similar, podemos construir el conjunto
cerrado más pequeño que contiene a A.
Definición 16 Sean X = (X, d) un espacio métrico y A ⊂ X. Se define la
cerradura de A, denotada por A, como el conjunto
\
A =
{B ⊂ X | A ⊂ B, B cerrado}
Como la intersección arbitraria de cerrados es un conjunto cerrado, se sigue que A es cerrado. Nótese que A ⊂ A. El siguiente resultado muestra la
conexión entre los puntos de acumulación y la cerradura de un conjunto.
Proposición 2.2.3 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces
A = A0 ∪ A.
Demostración. Sea B = A ∪ A0 . Por el Teorema 2.2.2, se sigue que cualquier
conjunto cerrado que contiene a A, debe contener a B. Por tanto, basta con
demostrar que B es cerrado. Para ver esto, sea y ∈ B 0 , esto es, para ε > 0
(Bε (y) − {y}) ∩ B 6= ∅.
40
2.2. Conjuntos cerrados
Tómese z ∈ (Bε (y) − {y}) ∩ B; luego z ∈ A ó z ∈ A0 . En este último caso,
tomando ε0 = ε − d (z, y), se tiene que
(Bε0 (z) − {z}) ∩ A 6= ∅
donde Bε0 (z) − {z} contiene puntos distintos de y, es decir, y ∈ A0 y, en
consecuencia, y ∈ B. De esta forma, B es el cerrado más pequeño que contiene
a A, como se querı́a demostrar.
Como consecuencia de esta proposición se tiene que un conjunto A es cerrado si y sólo si A = A. El siguiente resultado muestra otra forma de definir
la cerradura de un conjunto.
Proposición 2.2.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces
x ∈ A si y sólamente si
λ = ı́nf {d (x, y) | y ∈ A} = 0.
Demostración. Si x ∈ A, por la proposición 2.2.3, x ∈ A ó x ∈ A0 . Si
x ∈ A, tomando x = y se sigue que λ = 0. Si x ∈ A0 , entonces para toda
ε > 0 existe y ∈ A tal que d (x, y) < ε, de donde se concluye nuevamente
que λ = 0.
Por otro lado, si λ = 0 y x 6∈ A, como λ es el ı́nfimo, se tiene que para
cualquier valor ε > 0, existe y ∈ A tal que d (x, y) < ε, de donde se obtiene
que x ∈ A0 , que era lo que se querı́a demostrar.
En forma análoga a los interiores de conjuntos, el siguiente resultado presenta
algunas propiedades para la cerradura de conjuntos. Dejamos la verificación de
los detalles al lector.
Proposición 2.2.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos
de X. Entonces
1. ∅ = ∅.
2. A ⊆ A.
3. A = A.
4. A ∪ B = A ∪ B.
5. Si A ⊆ B, entonces A ⊆ B.
6. A ∩ B ⊆ A ∩ B.
Para cerrar esta sección, presentamos el concepto de frontera de un conjunto.
Definición 17 Sean X = (X, d) un espacio métrico y A ⊂ X. Definimos la
frontera de A, denotada por ∂ A, como el conjunto
∂ A = A ∩ Ac .
41
2. Elementos básicos de topologı́a
Como la intersección de conjuntos cerrados es un conjunto cerrado, se sigue que
la frontera de A es un conjunto cerrado. Además, n’otese que ∂ A = ∂ Ac .
Proposición 2.2.6 Sea A ⊂ X. Entonces x ∈ ∂ A si y sólo si para toda
ε > 0,
Bε (x) ∩ A 6= ∅ 6= Bε (x) ∩ Ac
(2.1)
Demostración. Si x ∈ X tal que se satisface la condición (2.1), entonces
Bε (x) contiene puntos de A y de Ac distintos de x. Ası́, x ∈ ∂ A.
Por otra parte, supongamos que x ∈ ∂ A. Obsérvese que x ∈ A ó x ∈ Ac .
Si x ∈ A, como x ∈ ∂ A, por el Teorema 2.2.2, se sigue que x ∈ (Ac )0 . Un
argumento similar muestra que si x ∈ Ac , entonces x ∈ A0 .
2.3.
Sucesiones
El concepto de convergencia es uno de los más importantes en diversas áreas
de la matemática. En esta sección, estudiaremos la noción de convergencia de
una sucesión en espacios métricos, en particular, en Rn . Recordemos que una
sucesión en un conjunto X 6= ∅, es una función que asocia un número natural
a un elemento de X, esto es, una correspondencia de la forma S : N −→ R,
donde R ⊆ X. Normalmente, cuando nos referimos a la imagen de un elemento
n en el dominio, bajo una función S, la denotamos por S(n). Sin embargo, en
el caso de las sucesiones, denotaremos por Sn a la imagen del natural n; a la
sucesión con los elementos Sn la denotaremos por {Sn }∞
n=1 . Por otra parte, al
conjunto R lo llamaremos recorrido de la sucesión. Según la propia definición,
una sucesión contiene una infinidad de elementos.
Recordemos la definición de convergencia en R. Si los términos de una sucesión {xn } se acercan a un número L, se dice que la sucesión tiende al lı́mite
L (también suele decirse que xn converge a L) y se denota por
lı́m xn = L
n→∞
este sı́mbolo se lee: el lı́mite de la sucesión xn cuando n tiende a infinito es L.
L
xN + 1
Figura 2.5: Convergencia en R
xN
42
2.3. Sucesiones
Definición 18 Sea {xn } una sucesión contenida en R. Se dice que {xn } converge a un valor L si dada ε > 0 existe N ∈ N tal que
|xn − L| < ε
para cualquier n > N .
Intuitivamente, esta definición nos dice que la sucesión converge a un cierto
valor si a partir de cierto momento los elementos de la sucesión y ese valor se
parecen mucho. Gráficamente, el concepto de convergencia significa que para
una N suficientemente grande, los elementos de la sucesión
xN +1 , xN +2 , xN +3 , .....
pertenecen a un intervalo de radio ε con centro en el valor L. Nótese que los
elementos xN +1 , xN +2 , xN +3 , ....., xN quedan fuera de este intervalo, es decir,
en el intervalo de convergencia se encuentra una infinidad de elementos de la
sucesión, mientras que fuera del intervalo quedan sólo un número finito (véase
la Figura 2.5)
La definición de convergencia en un espacio métrico es muy parecida.
Definición 19 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una sucesión. Se dice que {xn } converge a x0 ∈ X, si para todo abierto U ⊂ X que
contiene a x0 , existe N ∈ N tal que xn ∈ U , si n ≥ N .
El siguiente resultado presenta una definición equivalente, con la que el lector
puede estar más familiarizado.
Proposición 2.3.1 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una
sucesión. {xn } converge a x0 ∈ X si y sólo si dada ε > 0 existe N ∈ N tal
que si n ≥ N , entonces d (xn , x0 ) < ε.
Demostración. Supongamos que xn −→ x0 y sea ε > 0. Por la proposición
2.1.1, sabemos que Bε (x0 ) es abierto; luego, existe un valor N ∈ N tal que
xn ∈ Bε (x0 ), esto es, d (xn , x0 ) < ε.
Por otro lado, sea U una vecindad de x0 y supóngase que dada ε > 0
existe N ∈ N tal que si n ≥ N , entonces d (xn , x0 ) < ε. Como U es una
vecindad de x0 , se puede encontrar un valor ε > 0 tal que Bε (x0 ) ⊂ U . De
esta forma, existe N ∈ N tal que si n ≥ N , entonces xn ∈ Bε (x0 ) ⊂ U y,
por tanto, xn −→ x0 , como se querı́a demostrar.
Ejemplos.
1. Sea xn = n1 . Verificamos que {xn } converge a 0. Sea ε > 0, entonces
se tiene que
1
1
1
=
< ε ⇔ n > ,
n
n
ε
como ε > 0, esta última desigualdad está bien definida, por lo que se
sigue que la sucesión {xn } converge a cero.
43
2. Elementos básicos de topologı́a
2. Considérese la sucesión de números complejos dada por zn = 1 + ni .
2
Recordemos que existe una biyección
entre C y R 2. De esta forma, {zn }
1
converge, si y sólo si xn = 1, n converge en R . Se afirma que {xn }
converge a x0 = (1, 0). En efecto, obsérvese que
1
1
0,
=
< ε,
||xn − x0 ||2 =
n 2
n
para ε > 0 y n suficientemente grande. Ası́, zn −→ z0 , donde z0 = 1.
3. Tómese X un conjunto arbitrario, no vacı́o y equipado con la métrica
discreta. Nótese que en este espacio, las sucesiones convergentes son las
casi constantes, es decir, aquellas sucesiones tales que xn = x0 para
n ≥ N.
4. Sea X = (0, 1] y considérese la métrica usual de R restringida a X.
Sabemos que en R, la sucesión xn = n1 es convergente y converge a
0. Sin embargo, esta sucesión en X no converge, ya que 0 6∈ X. Este
ejemplo muestra que el concepto de convergencia depende de la métrica y
el espacio que estemos considerando.
Una propiedad fundamental del lı́mite de una sucesión es la unicidad.
Proposición 2.3.2 Sea {xn } una sucesión convergente contenida en un espacio métrico, entonces su lı́mite es único.
Demostración. Supongamos que xn −→ x0 y xn −→ y0 , esto es, dada
ε > 0, existe N ∈ N tal que
d (xn , x0 ) <
ε
2
y
d (xn , y0 ) <
ε
,
2
si n ≥ N . Luego
d (x0 , y0 ) ≤ d (x0 , xn ) + d (xn , yo ) < ε,
si n ≥ N .
Sabemos que en R, una sucesión convergente es acotada. Para ver este hecho
en general, requerimos el concepto de conjunto acotado en espacios métricos.
Definición 20 Sea X = (X, d) un espacio métrico y A ⊆ X. Se dice que A
es acotado si existen x ∈ X y un valor M > 0 tal que A ⊂ BM (x).
Proposición 2.3.3 Sean X un espacio métrico, {xn } una sucesión convergente, digamos a x0 y R el recorrido de la sucesión. Entonces
a) R es acotado.
b) x0 ∈ R0
44
2.3. Sucesiones
Demostración. a) Sea ε = 1 y N ∈ N correspondiente a este valor.
Entonces, si n ≥ N , xn ∈ B1 (x0 ). Tomando
s = máx {d (x0 , xi ) | i ∈ {1, 2, ..., N − 1}} + 1,
se sigue que xn ∈ Bs (x0 ) para toda xn ∈ R.
b) Como para toda ε > 0, la bola Bε (x0 ) contiene un punto de R, se concluye
que x0 ∈ R0 .
Proposición 2.3.4 Sean X = (X, d) un espacio métrico y A un subconjunto
de X. Si x0 ∈ A, entonces existe una sucesión {xn } ⊂ A tal que xn −→ x0 .
Demostración. Como x0 ∈ A, para cada n ∈ N, existe un punto xn ∈ A
tal que d (xn , x0 ) < n1 . Luego d (xn , x0 ) −→ 0, es decir, xn −→ x0 .
Por otra parte, tómese la sucesión xn = (−1)n . Si suponemos que 1 es el
punto de convergencia, nótese que para n = 2k − 1, k ∈ N, |xn − 1| = 2 > 1,
por lo que 1 no puede ser lı́mite de la sucesión xn ; de forma análoga se puede
verificar que −1 no es lı́mite de la sucesión xn .
En el ejemplo anterior, si tomamos las subsucesiones
{x2k }k ∈ N
y
{x2k − 1 }k ∈ N ,
observamos que convergen a 1 y a −1 respectivamente. Este hecho nos hace
pensar en el siguiente resultado: Una sucesión converge a un número real α si
y sólamente si todas sus subsucesiones convergen a α. Este resultado también
es cierto para espacios métricos en general.
Proposición 2.3.5 Una sucesión {xn } en un espacio métrico converge a x0
si y sólamente si todas sus subsucesiones convergen a x0 .
Demostración. Supongamos que xn −→ x0 . Esto quiere decir que dada
ε > 0, existe N ∈ N tal que d (xn , x0 ) , ε si n ≥ N . Sea {xnk } ⊆ {xn }
una subsucesión. Entonces, existe M ∈ N tal que nk ≥ N para k ≥ M .
Luego, si k ≥ M , se sigue que d (xnk , x0 ) < ε, como se querı́a demostrar.
Por otra parte, si cada subsucesión de xn converge, en particular, la sucesión
completa es subsucesión de sı́ misma, por lo que se sigue el resultado.
Existe un tipo de sucesiones de particular interés: las sucesiones de Cauchy.
Definición 21 Sean X un espacio métrico y {xn } un sucesión. Se dice que
{xn } es de Cauchy, si dada ε > 0 existe N ∈ N tal que d (xn , xm ) < ε, si
n, m ≥ N .
45
2. Elementos básicos de topologı́a
De manera intuitiva, decimos que una sucesión es de Cauchy cuando, a partir
de cierto momento, los elementos de la sucesión son prácticamente iguales. Otra
propiedad de las sucesiones de Cauchy es que son acotadas. La demostración
de este hecho es muy parecida al caso de sucesiones de Cauchy en R, por lo
que la prueba se le deja al lector. El siguiente resultado presenta una condición
necesaria para la convergencia de sucesiones en espacios métricos.
Teorema 2.3.6 Sean X un espacio métrico y {xn } una sucesión convergente,
digamos a x0 . Entonces {xn } es de Cauchy.
Demostración. Como xn −→ x0 , entonces para toda ε > 0, existen
N1 , N2 ∈ N, de tal forma que
d (xn , x0 ) <
ε
si n > N1
2
y
d (xm , x0 ) <
ε
si m > N2 .
2
Tomando N = máx {N1 , N2 }, se tiene que
d (xn , x0 ) <
ε
2
y
d (xm , x0 ) <
ε
,
2
si n, m > N . En consecuencia, se sigue que
d (xn , xm ) ≤ d (xn , x0 ) + d (xm , x0 ) < ε,
esto es, {xn } es una sucesión es de Cauchy.
La implicación inversa en general es falsa. Tomando X = (0, 1] y la sucesión
xn = n1 , se tiene un ejemplo de una sucesión de Cauchy que no es convergente
en X. A los espacios métricos que satisfacen la doble implicación los llamaremos completos. Demostraremos que Rn es un espacio métrico completo. Para
demostrar este hecho, necesitamos algunos resultados previos.
Definición 22 Sean (ai , bi ) ⊂ R, i ∈ {1, ...n}, una colección de intervalos abiertos. Se define una n-celda abierta como el producto cartesiano de los
intervalos (ai , bi ), esto es, una n-celda abierta es el conjunto de la forma
I n = {(x1 , ..., xn ) ∈ Rn | xi ∈ (ai , bi ), i ∈ {1, ...n}}.
De forma similar, definimos la n-celda cerrada como el conjunto dado por
J n = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}}.
Obsérvese que un conjunto A ⊂ Rn es acotado si está contenido en una ncelda.
Teorema 2.3.7 (de las celdas anidadas.) Sea {Jk }k ∈ N una sucesión de
celdas cerradas en Rn \
tales que J1 ⊇ J2 ⊇ .... Entonces existe un punto
x0 ∈ Rn tal que x0 ∈
Jk .
k∈N
46
2.3. Sucesiones
Demostración. Sea Jk el conjunto dado por
(k)
(k)
Jk = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}}
(k)
(k − 1)
(k)
Nótese que [a1 , b1 ] ⊂ [a1
2.6).
(k − 1)
, b1
], donde k > 1 (véase la Figura
(1)
b2
(2)
b2
(2)
a2
(1)
a2
(1) (2)
a1 a1
(3)
a1
(3) (2) (1)
b1 b1 b1
Figura 2.6: 2-celdas anidadas
Por la completez de R, existe y1 ∈ R tal que
\ (k) (k)
y1 ∈
[a1 , b1 ];
k∈N
aplicando el mismo argumento para las demás componentes, existe x0 ∈ Rn
tal que x0 = (y1 , ..., yn ), donde
yj ∈
En consecuencia, x0 ∈
(k)
\
k∈N
\
k∈N
(k)
[aj , bj ],
j ∈ {1, ..., n}.
Jk .
Este resultado se puede generalizar a espacios métricos. Para ver la generalización, requerimos la siguiente definición.
47
2. Elementos básicos de topologı́a
Definición 23 Sea X un espacio métrico. Definimos el diámetro de un conjunto A en el espacio métrico como
diam (A) = sup{d (x, y) | x, y ∈ A}.
Teorema 2.3.8 (del encaje de Cantor). Sean X = (X, d) un espacio
métrico completo y {Ai }i ∈ N una sucesión de conjuntos tales que
1. An + 1 ⊆ An , n ∈ N.
2. Ai es cerrado para toda i ∈ N.
3.
lı́m
n −→ ∞
diam (An ) = 0.
entonces, existe x0 ∈ X tal que
\
i∈N
Ai = {x0 }.
Demostración. Sean xn ∈ An , y ε > 0. Como
lı́m
n −→ ∞
diam (An ) = 0,
entonces existe N ∈ N tal que diam (An ) < ε, si n ≥ N . Como la sucesión
de conjuntos es decreciente, se tiene que diam (An ) ≤ diam (AN ) si n > N .
Ahora
d (xn , xm ) ≤ diamAN < ε.
Por tanto, la sucesión {xn } es de Cauchy y como el espacio es completo, se
sigue que {xn } converge, digamos a un punto x0 . Por otra parte, como Ai es
cerrado para toda i, se sigue que Ai = Ai . Nótese que
{xn | n ≥ k} ⊂ Ak
Se afirma que
\
ni ∈ N
Si existe a0 ∈ X tal que a0 ∈
Ai = {x0 }.
\
Ai , entonces
ni ∈ N
0 ≤ d (x0 , a0 ) ≤ diam (An ) < ε,
para n suficientemente grande. Por tanto, x0 = a0 .
El siguiente resultado generaliza el teorema de Bolzano-Weierstrass de R.
Teorema 2.3.9 (Bolzano-Weierstrass). Todo subconjunto A ⊆ Rn acotado infinito, tiene un punto de acumulación.
48
2.3. Sucesiones
Demostración. Sea A un subconjunto acotado con una cantidad infinita de
elementos. Entonces existe una n-celda cerrada, digamos J1 , tal que A ⊂ J1 .
Bisecando cada una de sus aristas, dividimos a J1 en 2n celdas cerradas. Como
A tiene una infinidad de puntos, entonces existe una n-celda cerrada J2 , tal que
J2 ⊂ J1 y que contiene una infinidad de elementos de A. Nuevamente, bisecando cada una de las aristas de J2 , encontraremos una celda cerrada J3 ⊂ J2
tal que contenga una infinidad de puntos de A. Repitiendo el proceso, obtenemos una sucesión de n-celdas cerradas que satisface las hipótesis\del Teorema
2.3.7. En consecuencia, existe un punto x0 ∈ Rn tal que x0 ∈
Jk .
k∈N
Por otro lado, si J1 = [a1 , b1 ] × · · · × [an , bn ], definimos la medida de J1
como
0 < l (J1 ) = sup {bi − ai | i ∈ {1, ..., n}}.
Luego
0 < l (Jk ) =
l (J1 )
2k − 1
k ∈ N.
(2)
Sea U una vecindad de x0 y supongamos que Br (x0 ) ⊂ U , donde
Br(2) (x0 ) = {x ∈ Rn | ||x − x0 ||2 < r}.
Sea k ∈ N tal que Jk ⊂ U ; esto lo podemos hacer ya que
√
|xi | ≤ ||x||2 ≤ n sup {|xi | | i ∈ {1, ..., n}},
ası́, si w ∈ Jk , entonces
||x0 − w||2 ≤
√
n l (Jk ) =
√
n l (J1 )
.
2k − 1
Luego, por propiedad arquimediana, existe k ∈ N suficientemente grande, tal
que
√
n l (J1 )
< r.
2k − 1
Por tanto, para cada k ∈ N, se tiene que Jk ⊂ U . Como Jk tiene una
cantidad infinita de elementos de A, se concluye que U contiene al menos un
elemento de A distinto de x0 , es decir, x0 ∈ A0 , con lo que queda demostrado
el teorema.
Teorema 2.3.10 Rn es un espacio métrico completo.
Demostración. Sea {xn } una sucesión de Cauchy y sea R su recorrido. Si R
es finito, entonces todos los términos de la sucesión, salvo una cantidad finita,
son iguales y, por tanto, {xn } converge. Por otra parte, si R es infinito, como
una sucesión de Cauchy es acotada (¿Por qué?), se sigue que R es infinito y
acotado y, por el teorema 2.3.9, R tiene un punto de acumulación, digamos
49
2. Elementos básicos de topologı́a
x0 . Esto último quiere decir que para toda ε > 0 B 2ε (x0 ) contiene un punto
xm ∈ R. Finalmente, como {xn } es de Cauchy, se obtiene que
d (xn , x0 ) ≤ d (xn , xm ) + d (xm , x0 ) < ε
si n, m ≥ N,
para alguna N ∈ N. Por tanto, xn −→ x0 . El Teorema 2.3.6 concluye la
prueba.
2.4.
Compacidad
La compacidad es otra de las condiciones más importantes para resultados fundamentales en muchas áreas como la topologı́a, el análisis y el cálculo. En esta
sección estudiaremos los conceptos básicos relacionados con la compacidad. Se
analizarán condiciones equivalentes a la compacidad. Estudiaremos los teoremas fundamentales sobre compacidad en Rn y sus generalizaciones a espacios
métricos. Para empezar, presentamos la definición de cubierta.
Definición 24 Sean X = (X, d) un espacio métrico, A ⊆ X y C = {Uα }α ∈ Λ
una colección de subconjuntos de X, donde Λ es un conjunto de ı́ndices. Se
dice que C es una cubierta de A en X si
[
A ⊂
Uα .
α∈Λ
Diremos que la cubierta es abierta (o cerrada), si Uα es abierto (o cerrado)
para toda α ∈ Λ.
Si C 0 ⊆ C y C 0 también es una cubierta, diremos que C 0 es una subcubierta de
C para A. Diremos que una cubierta es finita (o numerable), si como conjunto
es finito (o numerable). A continuación, presentamos la definición de conjuntos
compactos en espacios métricos.
Definición 25 Sean X = (X, d) y A ⊆ X. Se dice que A es compacto si
toda cubierta abierta de A contiene una subcubierta finita.
Ejemplos.
a) Sea X un espacio métrico y consid́erese un punto x en el espacio. Es
claro que el conjunto {x} es compacto.
b) Sea [a, b] un intervalo cerrado en R. Se afirma que [a, b] es compacto.
Para ver esto, sea C = {Cα }α ∈ Λ una cubierta de [a, b] y defı́nase el
conjunto
B = {x ∈ [a, b] | [a, x] se puede cubrir con una cantidad finita de elementos de C}.
Nótese que B 6= ∅, ya que al menos a ∈ B. Además, para todo x ∈ B,
se tiene que b > x. Por la propiedad del supremo, existe s ∈ R tal que
50
2.4. Compacidad
s = sup B. Como a ∈ B y b > x para toda x ∈ B, se sigue que
s ∈ [a, b]. En consecuencia, existe α0 ∈ Λ tal que s ∈ Cα0 . Luego,
existe ε > 0 tal que (s − ε, s + ε) ⊂ Cα0 . También, existe x ∈ B tal
que x ∈ (s − ε, s), es decir, [a,
una subcubierta finita, digamos
x] tiene
{C1 , ..., Cn , Cα0 } Por tanto, a, s + 2ε tiene una subcubierta finita, a
saber, {C1 , ..., Cn , }. Ası́,
se concluye que s ∈ B. Se afirma que s = b.
Si no, como a, s + 2ε tiene una subcubierta finita, entonces existe un
elemento r ∈ B tal que r > s, lo cual es una contradicción. De esta
forma, hemos demostrado que [a, b] es compacto.
c) Si A ⊂ Rn es compacto y x ∈ Rm , entonces R = A × {x} es un
subconjunto compacto en Rn × Rm . Para verificar esta afirmación, considérese una cubierta abierta C de R y defina la colección
B = {B ⊂ Rn | B = {y ∈ A | (y, x) ∈ C}, para alguna C ∈ C}.
Es claro que B es una cubierta abierta de A. Como A es compacto, existe
una subcubierta de B para A, digamos B 0 = {B1 , ..., Bl }. Obsérvese
cada Bi se corresponde con un elemento Ci de C, i ∈ {1, ..., n}, generando ası́ una subcubierta finita para R. Por tanto, R es compacto. Se
puede demostrar, de manera inductiva que si
n − 1 veces
}|
{
z
[−M, M ] × · · · × [−M, M ] ⊂ Rn − 1
es un conjunto compacto, entonces
n veces
z
}|
{
[−M, M ] × · · · × [−M, M ] ⊂ Rn
es compacto.
d) Sea X = (X, d) el espacio métrico discreto y considérese un subconjunto
A en este espacio. Si A es finito, como los abiertos en este espacio son subconjuntos de X, se sigue que A es compacto. Ahora, si A es compacto,
entonces toda cubierta abierta de A tiene una subcubierta finita. Como
los abiertos en X son subconjuntos de X, se sigue que A es finito. Ası́,
los únicos conjuntos compactos en el espacio métrico discreto son aquellos
subconjuntos finitos de X.
Obsérvese que en la definición 25, podemos tomar A = X, en cuyo caso, estarı́amos hablando de espacios métricos compactos. Por otro lado, los ejemplos
anteriores muestran que trabajar con cubiertas, en ocasiones, es complicado.
Veremos que existen relaciones importantes entre la compacidad y algunas propiedades de numerabilidad. Un resultado importante, es el teorema de Lindelöf,
el cual usaremos para demostrar el teorema de Heine-Borel. Para esto, necesitamos un resultado previo.
51
2. Elementos básicos de topologı́a
Proposición 2.4.1 Sea
B = {Br (x) ⊂ Rn | r ∈ Q, x = (x1 , ..., xn ), xi ∈ Q para toda i ∈ {1, ..., n}}.
Sean y ∈ Rn y A ⊂ Rn un conjunto abierto tal que y ∈ S. Entonces, existe
una bola Br (x) ∈ B tal que y ∈ Br (x) ⊂ A.
Demostración. Sea y = (y1 , ..., yn ). Una primera observación es que la colección B es numerable. Si y ∈ Rn y A es un abierto tal que x ∈ A, entonces
existe ε > 0 tal que Bε (y) ⊂ A. Luego, por la propiedad arquimediana, existe
un valor wk ∈ Q tal que
ε
|yk − wk | <
para cada k ∈ {1, ..., n},
4n
tomando w = (w1 , ..., wn ), se sigue que
||y − w||2 ≤ ||y − w||1 <
ε
.
4
Nuevamente, aplicando la propiedad arquimediana, existe r ∈ Q tal que
ε
ε
< r < .
4
2
En consecuencia, existe r ∈ Q tal que
y ∈ Br (w) ⊂ Bε (x) ⊂ A,
como se querı́a demostrar.
Teorema 2.4.2 (de Lindelöf). Sean A ⊆ Rn y C una cubierta de A. Entonces, existe una subcubierta de C numerable para A.
Demostración. Sea B la colección de todas las bolas definida en la Proposición 2.4.1. Sea x ∈ A, entonces existe C ∈ C tal que x ∈ C. Por la
Proposición 2.4.1, existe r ∈ Q y y ∈ Rn con coordenadas racionales, tal que
x ∈ Br (y) ⊆ C. Como B es numerable, podemos pensar que B = {Ai }i ∈ N .
Luego, para cada C ∈ C existe una infinidad numerable de elementos de B que
cubren a C. Luego, existe m = m(x) ∈ N, x ∈ A, tal que x ∈ Am ⊂ A.
Por tanto, {Am (x) }x ∈ A es una colección numerable de subconjuntos de Rn tal
que
[
A ⊂
Am (x) .
Tomando la correspondencia
x∈A
Am (x) −→ C ∈ C
tal que Am (x) ⊂ C, se sigue el resultado.
Los siguientes resultados relacionan los conjuntos compactos con los cerrados
en espacios métricos.
52
2.4. Compacidad
Lema 2.4.3 Sean X = (X, d) un espacio métrico y A ⊂ X compacto. Entonces A es cerrado.
Demostración. Sea x ∈ Ac y considérese la colección
1
An = y ∈ X | d (x, y) >
.
n
Como d (x, y) > 0, para toda y ∈ X − {x}, entonces y ∈ An , para alguna
n ∈ N. Se sigue que
[
A ⊂
An ,
n∈N
como A es compacto, entonces existe una subcubierta finita, a saber
A ⊂
l
[
An k .
k=1
Tómese N = máx {nk | k ∈ {1, ..., l}}. Si ε =
1
N,
por construcción,
Bε (x) ⊂ Ac .
En conclusión, Ac es abierto.
Lema 2.4.4 Si X es un espacio métrico compacto y A es un conjunto cerrado
en X , entonces A es compacto.
Demostración. Sea {Cα }α ∈ Λ una cubierta abierta de A. Como A es cerrado, entonces {{Cα }α ∈ Λ , Ac } es una cubierta abierta de X. Como X es
compacto , entonces existe una subcubierta finita, digamos {C1 , ..., Cn , Ac }.
Luego, {C1 , ..., Cn } es una cubierta para A, concluyendo ası́ la prueba.
El siguiente teorema es uno de los resultados centrales acerca de la compacidad de subconjuntos de Rn .
Teorema 2.4.5 (Heine-Borel). Sea A ⊂ Rn . A es compacto si y sólo si es
cerrado y acotado.
Demostración. Supongamos que A es compacto. Por el lema 2.4.3, A es
cerrado. Por otra parte, por el Teorema 2.4.2, existe una cubierta numerable de
bolas para A. Como A es compacto, existe una subcubierta finita de bolas,
n
X
digamos, {Bεi (xi )}i ∈ {1,...,n} . Considerando M =
εi se sigue que A es
i=1
acotado.
Ahora, supongamos que A es cerrado y acotado. Consideremos una cubierta
C de A. Por el Teorema 2.4.5, existe una subcubierta numerable R = {Ak }k ∈ N
53
2. Elementos básicos de topologı́a
para A. Sea m ≥ 1 y tómese Sm
m
[
k=1
A ⊂
Ak . Obsérvese que Sm ⊆ Sm + 1 y que
[
Sm .
m∈N
c
Como Sm es abierto, entonces Sm
es cerrado. Constrúyase la sucesión de conjuntos dada por
Q1 = A,
c
Qm = A ∩ Sm
, m > 1.
Hacemos las siguientes observaciones
1. Qm = {puntos en A fuera de Sm }.
2. Qm es cerrado para toda m ∈ N.
3. Qm + 1 ⊆ Qm .
4. Qm ⊂ A, para toda m ∈ N y, por tanto, Qm es acotado.
5. diam (Qm ) −→ 0 conforme m −→ ∞.
Aplicando el Teorema 2.3.8, se sigue que existe x ∈ A, tal que x ∈ Qm para
toda m ∈ N, esto es, x 6∈ Sm para toda m ∈ N, lo cual es una contradicción
al hecho de que {Sm } es una cubierta de A. Por tanto, existe m ∈ N, tal que
Qm = ∅, de donde se conlcuye que A es compacto.
Una segunda prueba de que un conjunto cerrado y acotado en Rn es compacto, es la siguiente: Como A es acotado, existe una n-celda cerrada J n , tal
que A ⊂ J n . Por el ejemplo c) posterior a la definición 25, J n es compacto.
Como A es cerrado, por el Lema 2.4.4, se sigue que A es compacto.
Este resultado falla en general. Si consideramos un espacio discreto X y
tomamos un subconjunto M infinito, éste no es compacto como se vió en el
ejemplo d) posterior a la definición 25. Sin embargo, M es cerrado y acotado,
ya que
M ⊂ B2 (x0 )
∀ x0 ∈ M
Ejemplos.
1. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Ya vimos que C es cerrado y
claramente es acotado. Por tanto C es compacto
2. Ya vimos que el conjunto dado por
R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]},
no es un conjunto cerrado. Ası́, R no es compacto.
54
2.4. Compacidad
3. Tómese el conjunto
R = {(x, y) ∈ R2 | y ∈ [c, d]}.
Este conjunto, aunque es cerrado, no es compacto ya que no es acotado.
Para ver esto, observe que la recta y = c está contenida en R.
Se puede dar otra descripción de los conjuntos compactos, vı́a sucesiones.
Definición 26 Sea X un espacio métrico. Se dice que un subconjunto A es
secuencialmente compacto si toda sucesión {xn } en A tiene una subsucesión
que converge a un punto x0 en A.
No es difı́cil ver que un conjunto A en un espacio métrico es cerrado si y
sólamente si, toda sucesión contenida en A convergente, converge dentro de
A. La verificación de este hecho se deja como ejercicio al lector. Ası́, se afirma
que si A es secuencialmente compacto, entonces A es cerrado. En efecto, sea
{xn } ⊂ A tal que xn −→ x0 ∈ X. Como A es secuencialmente compacto,
se sigue que existe una subsucesión {xnk } tal que xnk −→ x00 , pero por la
Proposición 2.3.5, se sigue que x0 = x00 , de donde se concluye que A es cerrado.
También, si A es secuencialmente compacto, entonces es acotado, ya que, de
lo contrario, entonces existe x0 ∈ A y una sucesión {xn } ⊂ A tales que
d (x − n, x0 ) ≥ n, de donde se concluirı́a que no existe una subsucesión de
{xn } convergente, lo cual es una contradicción.
Ahora, probaremos otro teorema central para conjuntos compactos en espacios métricos: el teorema de Bolzano-Weierstrass. Ya hemos probado una
versión de este resultado en la sección anterior, pero fue para Rn . Presentamos
su generalización. Necesitamos algunos resultados previos.
Lema 2.4.6 Sean X un espacio métrico, A un conjunto secuencialmente compacto en X y {Aα }α ∈ Λ una cubierta abierta de A. Entonces, existe r > 0
tal que para cada x ∈ A, Br (x) ⊂ Aα para alguna α ∈ Λ. Al ı́nfimo de los
números r se le conoce como número de Lebesgue para la cubierta.
Demostración. Supongamos que no existe dicho número. Entonces, para
toda n ∈ N existe un punto xn ∈ A tal que B n1 (xn ) no está contenida en
Aα , para cualquier α ∈ Λ. Como A es secuencialmente compacto, existe una
subsucesión {xnk } ⊂ {xn } de tal forma que xnk −→ x0 ∈ A. Dado que {Aα }
es una cubierta de A, se tiene que x0 ∈ Aα0 para alguna α0 ∈ Λ. Luego,
existe ε > 0 tal que Bε (x) ⊂ Aα0 . Ası́, para n suficientemente grande,
obtenemos que
ε
1
ε
d (xn , x0 ) <
y
< ,
2
n
2
de donde se concluye que B n1 (xn ) ⊂ Aα0 , lo cual es una contradicción que
surge de suponer que no existe el número de Lebesgue.
55
2. Elementos básicos de topologı́a
Definición 27 Sea X un espacio métrico. Se dice que un conjunto A es totalmente acotado si para cada ε > 0, existe un subconjunto {x1 , ..., xn } ⊂ X
tal que
n
[
A ⊂
Bε (xi ).
i=1
Lema 2.4.7 Si A es secuencialmente compacto, entonces A es totalmente acotado.
Demostración. Si A no es totalmente acotado, entonces para alguna ε > 0,
A no puede ser cubierto por una cantidad finita de bolas. Sea x1 ∈ A. Como
A no es totalmente acotado, eso implica que existe x2 ∈ (Bε (x1 ))c , luego
considérese un punto x3 ∈ (Bε (x1 ) ∪ Bε (x2 ))c y ası́ sucesivamente, generando
una sucesión {xn } tal que
!c
n[
−1
xn ∈
Bε (xi ) .
i=1
De esta forma, hemos construido una sucesión tal que d (xn , xm ) ≥ ε para
cualesquiera n, m ∈ N. Ası́, {xn } no tiene subsucesiones convergentes, lo cual
es una contradicción al hecho de que A es secuencialmente compacto. Por tanto,
A es totalmente acotado.
Ahora, estamos en condiciones de probar el teorema de Bolzano-Weierstrass.
Teorema 2.4.8 (Bolzano-weierstrass). Sea X un espacio métrico. Un subconjunto A es compacto si y sólo si es secuencialmente compacto.
Demostración. Supongamos que A es compacto y que existe una sucesión
{xn } ⊂ A de tal manera que no tiene subsucesiones convergentes. Esto implica
que {xn } tiene recorrido R infinito. Además, existe una vecindad Un para cada
xn , n ∈ N, de tal forma que xm 6∈ Un si n 6= m, esto se sigue ya que de lo
contrario, podemos elegir vecindades de la forma B k1 (xn ), k ∈ N y seleccionar
una subsucesión que converja a xn . Ahora, R es cerrado, esto debido a que no
tiene puntos de acumulación (no hay subsucesiones convergentes) y por tanto
R = R. Como R es cerrado y A es compacto, por el Lema 2.4.4, se obtiene
que R es compacto, lo cual es una contradicción, ya que Un no tiene una
subcubierta finita. En consecuencia, {xn } tiene una subsucesión convergente y,
dado que A es cerrado, el lı́mite yace en A.
Por otra parte, supongamos que A es secuencialmente compacto. Sea r
como en el Lema 2.4.6; luego, por el Lema 2.4.7, obtenemos que
A ⊂
n
[
i=1
Bε (xi ),
donde xi ∈ A.
Además, por el Lema 2.4.6, Bε (xj ) ⊂ Aαj , j ∈ {1, ...n}, donde {Aαj } es
una colección de abiertos. Por tanto, hay una subcubierta finita para A, como
se querı́a demostrar.
56
2.5. Compacidad
Para cerrar esta sección, presentamos un resultado que relaciona los conceptos de completez y compacidad.
Teorema 2.4.9 Un espacio métrico es compacto si y sólo si es completo y
totalmente acotado.
Demostración. Supongamos que X es compacto. Por el Teorema 2.4.8, X
es secuencialmente compacto y por el Lema 2.4.7, es totalmente acotado. Ahora,
para ver que es completo, consideremos una sucesión de Cauchy {xn }. Como
X es secuencialmente compacto, se satisface, por un lado, que
d (xn , xm ) <
ε
2
si n, m > N para alguna N ∈ N
y por otro lado
d (xnk , x0 ) <
ε
2
si nk > N para alguna N ∈ N,
donde {xnk } es una subsucesión de {xn } y x0 ∈ X.
Ası́, obtenemos lo siguiente:
d (xn , x0 ) < d (xnk , xn ) + d (xnk , x0 ) < ε,
si nk , n > N .
Por otra parte, supongamos que X es completo y totalmente acotado. Demostraremos que X es secuencialmente compacto. Sean {xn } una sucesión
contenida en X y R su recorrido. Si R es finito, entonces hay una subsucesión
convergente y si hay una cantidad finita de repeticiones las eliminamos. Ahora,
supongamos que R es infinito. Como X es secuencialmente compacto, dado
N ∈ N existen elementos yL1 , ..., yLM ∈ X tales que
X ⊆
M
[
B N1 (yLi ).
i=1
Para N = 1, sea
X ⊆
M
[
B1 (yLi ).
i=1
De esta forma, existe una subsucesión de {xn } que cae en una de estas bolas.
Tomando N = 2, podemos construir otra subsucesión que yace en una de las
bolas de la forma B 21 (yLi ). Finalmente, eligiendo la subsucesión cuyo primer
elemento es el primero de la primera subsucesión, el segundo es el segundo de
la segunda subsucesión, etcétera, generamos una sucesión de Cauchy, que por
ser el espacio completo, es convergente. Ası́, X es secuencialmente compacto y,
por el Teorema 2.4.8, se sigue el resltado.
57
2. Elementos básicos de topologı́a
2.5.
Conexidad
Cerramos este capı́tulo con otro concepto importante que es el de conexidad.
Intuitivamente, es claro que significa que un conjunto sea conexo. Uno pensarı́a
que un conjunto es conexo si es de una sola pieza. Sin embargo, existen conjuntos
en donde nuestra intuición puede fallar. Veremos que existen dos nociones de
conexidad y estudiaremos la relación entre ellas. Iniciamos esta sección con la
definición de desconexión.
Definición 28 Sea X = (X, d) un espacio métrico. Se dice que un subconjunto
A ⊆ X es inconexo, si existen B, C subconjuntos de A, abiertos, tales que se
cumplen las siguientes condiciones
1. B 6= ∅ 6= C.
2. B ∩ C = ∅.
3. A ∩ B 6= ∅ 6= A ∩ C
4. A = B ∪ C.
A la pareja (B, C) se le conoce como desconexión de A. Se dice que A es
conexo si no es inconexo.
Obsérvese que en esta definición, se puede tomar A = X y tenemos espacios
métricos inconexos. Si X es un espacio inconexo, como X = B ∪ C, donde
B, C son abiertos, se tiene que B, C también son cerrados, ya que B c = C y
viceversa. Ası́, tenemos el siguiente resultado.
Proposición 2.5.1 Las siguientes afirmaciones son equivalentes
1. X es inconexo.
2. Existen dos subconjuntos A, B de X, cerrados, no vacı́os, tales que
X = A ∪ B.
3. Existe un subconjunto propio de X, no vacı́o, que es abierto y cerrado.
También, si X es inconexo y (A, B) es la desconexión para X, cualquier
subconjunto Y de X tendrá por desconexión a (A, B) si A ∩ Y 6= ∅ 6= B ∩ Y .
Proposición 2.5.2 R es conexo
Demostración. Supongamos que R no es conexo. Esto implica que existen
abiertos A, B de R no vacı́os y ajenos, tales que R = A ∪ B. Sean
a ∈ A, b ∈ B
y supongamos, sin pérdida de generalidad que a < b. Definimos
α = sup {x ∈ A | x < b}.
58
2.5. Conexidad
Luego, existen dos opciones para α. Si α ∈ A, como A es abierto, existe ε > 0
tal que (a − ε, a + ε) ⊂ A. De esta forma, podemos elegir ε suficientemente
pequeña de tal manera que α + ε < b, lo cual contradice que α sea el supremo.
De esta forma, α 6∈ A. Ası́ α ∈ B. Sin embargo, como B es abierto, existe
ε > 0 tal que (a − ε, a + ε) ⊂ B, luego α − ε > a, para a ∈ A, lo cual
genera una contradicción, de donde se concluye que α 6∈ B, lo cual contradice
la completez de R. Por tanto, R es conexo.
Obsérvese que la unión y la intersección de conexos no necesariamente es un
conjunto conexo. El siguiente resultado, muestra bajo que condiciones, la unión
de conexos es un conexo.
Proposición 2.5.3 Sean X = (X, d) un espacio métrico
[ y Xλ ⊂ X, λ ∈ Λ,
Xλ . Si existe λ0 ∈ Λ
una colección de conjuntos conexos tales que X =
λ∈Λ
de tal forma que Xλ0 ∩ Xλ 6= ∅, entonces X es conexo.
Demostración. Supongamos que X es inconexo. Se afirma que Xλ0 es inconexo. Para verificar esto, consideremos una desconexión (A, B) para X. Sin
pérdida de generalidad, supongamos que A ∩ Xλ0 6= ∅. Como Xλ es conexo
para toda λ 6= λ0 , entonces Xλ ⊂ A o Xλ ⊂ B. Tómese
ΛB = {λ ∈ Λ | Xλ ⊂ B}.
Obsérvese que ΛB 6= ∅, ya que[
de lo contrario, Xλ ⊂ A para toda λ ∈ Λ, lo
cual implicarı́a que B = B ∩
Xλ = ∅, lo cual no es posible. Sea λ ∈ ΛB ,
entonces se tiene que
λ∈Λ
∅ 6= Xλ ∩ Xλ0 ⊂ B ∩ Xλ0 ,
de donde se sigue que (A, B) es una desconexión para Xλ0 .
Como consecuencia de esta proposición, tenemos que la unión de conexos es
un conjunto conexo si tienen al menos un punto en común.
Teorema 2.5.4 Sean X = (X, d) un espacio métrico y C ⊂ X. Si C es
conexo, entonces C es conexo.
Demostración. Supongamos que (C) es inconexo y sea (A, B) una desconexión para C. Como A y B son abiertos, se sigue que (A, B) es también
una desconexión para C.
Ejemplo.
Sea [a, b] ⊂ R. Demostraremos que es un conjunto conexo. Supongamos que
no, esto quiere decir que existen abiertos A, B en R, ajenos, no vacı́os, tales
que A ∩ [a, b] 6= ∅ B ∩ [a, b] y A ∪ B ⊃ [a, b]. Supongamos que b ∈ B y
definimos α = sup (A ∩ [a, b]). Obsérvese que A ∩ [a, b] es cerrado, ya que
B ∪ ([a, b])c es abierto, en consecuencia, α ∈ A ∩ [a, b]. Ahora, α 6= b ya
2. Elementos básicos de topologı́a
59
que α 6∈ B y b ∈ B. Se sigue que, para toda vecindad W de α, W 6⊂ A y
por tanto W ∩ (B ∩ [a, b]) 6= ∅. Nótese que α es punto de acumulación de
B ∩ [a, b] y como este conjunto es cerrado, se sigue que α ∈ B ∩ [a, b], lo cual
es una contradicción al hecho de que (A, B) es una desconexión.
Claramente, en un espacio métrico X , el conjunto {x} es conexo. Consideremos el conjunto dado por
[
Cx =
{C ⊂ X | x ∈ C, C conexo}.
Por la observación posterior a la Proposición 2.5.3, se sigue que Cx es conexo.
De hecho, es el conexo más grande que contiene a x. A este conjunto se le conoce
como componente conexa correspondiente a x. Nótese que Cx es cerrado y que
si y ∈ Cx , entonces Cx = Cy .
La otra noción, quizás más intuitiva, de conexidad es la de conexidad por
trayectorias. Para estudiar esta propiedad, necesitamos definir el concepto de
trayectoria entre dos puntos. Para esto, introducimos el concepto de continuidad,
el cual se estudiará con más detalle en el siguiente capı́tulo.
Definición 29 Sea σ : [a, b] −→ X una función que va del intervalo cerrado
[a, b] a un espacio métrico X. Decimos que σ es continua si para toda sucesión
{xn } ⊂ [a, b] tal que xn −→ x0 , se cumple que σ (xn ) −→ σ (x0 )
Definición 30 Sea X un espacio métrico. Decimos que x, y ∈ X están conectados por una trayectoria, si existe una función σ : [a, b] −→ X continua,
tal que σ (a) = x y σ (b) = y. Si x y y están unidos por σ, lo denotaremos
por σ : x ' y. Se dice que la trayectoria σ yace en un conjunto A ⊂ X si
para todo t ∈ [a, b], σ (t) ∈ A.
Diremos que dos puntos x, y ∈ X están relacionados (x ∼ y) si existe una
trayectoria σ que los une. Esta relación es de equivalencia. Para probar esta
afirmación, nótese que x ∼ x, ya que podemos tomar la función σ (t) = x
para toda t ∈ [a, b]. Por otra parte, si x ∼ y, entonces, existe una función
σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y. Si definimos
σ 0 (t) = σ (a + b − t), donde t ∈ [a, b], esta función es continua y además
σ 0 (a) = y y σ 0 (b) = x, de donde se sigue que y ∼ x. Finalmente, si x ∼ y
y y ∼ z, entonces existen una funciones τ, σ : [a, b] −→ X continuas, tales
que σ (a) = x, σ (b) = y = τ (a) y τ (b) = z. Definiendo

b
si x ∈ a, a +
 σ(2t − a)
2
ρ (t) =
b 
τ (2t − b)
si x ∈ a +
2 ,b ,
obtenemos que ρ une x con z. Ası́, (∼) es una relación de equivalencia. A las
clases de equivalencia se les llama componentes por trayectorias del espacio X.
Definición 31 Se dice que un subconjunto A ⊂ X es conectable por trayectorias si cualesquiera dos puntos de A pueden ser unidos mediante una trayectoria
que se encuentra totalmente contenida en A.
60
2.5. Conexidad
El siguiente resultado, relaciona las dos nociones de conexidad.
Teorema 2.5.5 Un conjunto conectable por trayectorias es conexo.
Demostración. Sea A un conjunto conectable por trayectorias. Supongamos que A es inconexo y sea (U, V ) su desconexión. Tómese x ∈ U y
y ∈ V . Como A es conectable por trayectorias, entonces, existe una función
σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y; sea C = σ −1 (U )
y D = σ −1 (V ). Obsérvese que C, D ⊂ [a, b]. Consideremos una sucesión
{xn } ⊂ C tal que xn −→ x0 , como [a, b] es cerrado, x0 ∈ [a, b]. Además,
dado que σ es continua, se tiene que σ (xn ) −→ σ (x0 ). Se afirma que
σ (x0 ) ∈ U.
De lo contrario, σ (x0 ) ∈ V , pero V es abierto y se tendrı́a que σ (xn ) ∈ V
lo cual es una contradicción al hecho de que (U, V ) es desconexión. De esta
forma, hemos probado que C es cerrado. Un argumento similar prueba que D
es cerrado. Nótese que C 6= ∅ 6= D, ya que σ −1 (x) ∈ C y σ −1 (y) ∈ D.
También, tenemos que
C ∩ D = σ −1 (U ) ∩ σ −1 (V ) = σ −1 (U ∩ V ) = ∅
y
C ∪ D = σ −1 (U ) ∪ σ −1 (V ) = σ −1 (U ∪ V ) = σ −1 (A) = [a, b],
es decir, [a, b] es inconexo, lo cual es una contradicción que surge de suponer
que A es inconexo. Por tanto, A es conexo.
Capı́tulo 3
Limites y continuidad.
En la mayorı́a de los problemas fı́sicos, sucede que una variable depende de
otras. Por ejemplo, el voltaje en una resistencia eléctrica, de acuerdo a la Ley
de Ohm, depende de la resistencia y corriente eléctrica, es decir,
V = RI.
Es por esta razón que se hace necesario el estudio de las funciones reales de
variable vectorial. Por otro lado, supóngase que se desea estudiar el viento en
una región del planeta. Para esto, medimos la magnitud y dirección de la velocidad del viento, donde ésta última depende de la posición de cada punto. Ası́,
asociamos a cada punto P de una región, una y sólo una velocidad. Una regla
como ésta es un ejemplo de las llamadas funciones vectoriales de variable
vectorial. También se les conoce con el nombre de campos vectoriales. En este
capı́tulo, desarrollaremos la teorı́a de lı́mites y continuidad para funciones que
toman valores en Rn y cuya variable x es un punto de Rm .
Denotamos por F(C, Rm ), donde C ⊂ Rn , al conjunto de funciones f, cuyo
dominio es el conjunto C (se dice que hay n variables) y f (x) ∈ Rm , x ∈ C.
Se dice que la función f es real o vectorial según sea m = 1 ó m ≥ 2. Si m ≥ 2 y
si f (x) = (y1 , ...., ym ), se llaman coordenadas o componentes de f a las funciones
reales fi : C −→ R, donde fi (x) = yi , i ∈ {1, 2, ...., m}.
Cuando una función de n variables está expresada en forma analı́tica, esto es,
en una expresión de la forma
z = f (x1 , ...., xn ),
donde a cada vector (x1 , ...., xn ) se le asigna un valor z, se suele entender que el
campo de definición o dominio de dicha función es el conjunto más amplio de
puntos (x1 , ..., xn ) ∈ R para el que existe un valor para z.
61
62
3.0. Limites y continuidad.
Ejemplos
1. Sea f (x, y) = √ ln(x,y)
2
1−(x +y 2 )
; Observese que la función “ ln ” está bien
definida para todos los valores positivos; en consecuencia, se debe pedir que
x y y tengan el mismo signo. Además x2 +y 2 debe ser menor estrictamente
que 1. Por lo tanto, el dominio para esta función tiene la forma
D(f ) = {(x, y) | xy > 0, x2 + y 2 < 1}
(véase la Figura 3.1)
= D (f )
Figura 3.1: Dominio de la función f (x, y) = p
ln(x, y)
1 − (x2 + y 2 )
1
2. Considérese la función g(x, y) = e x2 +y2
Obsérvese que la única condición que se les pide a las coordenadas (x, y)
es que x2 + y 2 6= 0; esto sucede para todo (x, y) ∈ R2 − {(0, 0)}. Ası́,
D(g) = R2 − {(0, 0)}
El conjunto F (C, Rm ) es un espacio vectorial respecto de las operaciones
usuales de suma de funciones y de producto de un escalar λ ∈ R por una
función; esto es,
3. Limites y continuidad.
63
(f + g)(x) = f (x) + g(x) y (λf )(x) = λf (x).
Observe que para el caso particular m = 1, f (C, Rm ) resulta ser un campo
respecto de las operaciones usuales de suma y producto de funciones, a
saber,
(f + g)(x) = f (x) + g(x) y (f g)(x) = f (x)g(x),
donde además, se puede establecer una relación de orden parcial dada por
f ≤ g ⇔ f (x) ≤ g(x) para toda x ∈ C
Si 0 es la función nula, es decir, 0(x) = 0, para toda x ∈ C, entonces se
dice que una función f es positiva si P ≤ f y se dice que es negativa si
f ≤ P.
Diremos que f ∈ F (C, Rm ) es una función acotada si el conjunto f (C)
es acotado. Mas precisamente, f ∈ F (C, Rm ) es acotada, sı́ existe M > 0
tal que kf (x)k ≤ M ∀ x ∈ C
3.1.
Lı́mites
El concepto de lı́mite es uno de los más importantes en el estudio del cálculo y
el análisis, quizá sea uno de los mas difı́ciles de comprender. El lector estará familiarizado con el concepto de convergencia de sucesiones y con el concepto de
lı́mite para funciones reales de variable real.
Definición 32 (condición ε − δ). Sean f : C −→ Rm una función definida
en C ⊂ Rn y a ∈ C 0 . Se dice que f tiende a L ∈ Rm conforme x tiende a a (en
otras palabras, L es el lı́mite de f en el punto a), si dada ε > 0, existe δ > 0
tal que si x ∈ C − {a} y d(x, a) < δ, entonces d(f (x), L) < ε
Al igual que en el caso real, existe una definición de lı́mite por medio de sucesiones.
Definición 33 Sean f : C −→ Rm una función definida en C ⊂ Rn y a ∈ C 0 .
Si {xn }n∈N ⊂ C − {a} es una sucesión de puntos tal que xn −→ a, se dice que
f tiende a L ∈ Rm si f (xn ) −→ L.
Proposición 3.1.1 Las definiciones (32) y (33) son equivalentes
Demostración. Supongamos que la condición ε − δ se satisface y sea
{xn }n∈N ⊂ C − {a} una sucesión tal que xn −→ a; entonces, dada δ > 0,
existe N ∈ N tal que kxn − ak < δ si n > N . Como xn ∈ C − {a}, se sigue
que kf (xn ) − Lk < ε , para ε > 0 y n > N . Por lo tanto f (xn ) −→ L. Por
otra parte, si la condición (ε − δ) no se satisface, existe ε > 0 tal que para toda
δ > 0, existe x ∈ C − {a} de tal forma que kx − ak < δ y kf (x) − Lk ≥ ε.
64
3.1. Lı́mites
Luego, para cada n ∈ N, si δ = n1 , existe xn ∈ {a} tal que kxn − ak <
kf (xn ) − Lk ≥ ε esto es, xn −→ a, pero f (xn ) no converge a L.
1
n
y
Obsérvese que la definición 32 se puede reescribir de la siguiente forma:
“Se dice que f tiende a L ∈ Rn conforme x tiende a a, si dada ε > 0,
existe δ > 0 tal que si x ∈ Bδ∗ (a) ∩ C entonces f (x) ∈ Bε (L) (donde
x ∈ Bδ∗ (a) = Bδ (a) − {a}.) ”
Otra observación importante es la necesidad de que a sea un punto de acumulación de C. Si no fuera ası́, existirı́a δ > 0 tal que x ∈ Bδ∗ (a) ∩ C = ∅, por lo
que se cumplı́ria la condición ε − δ con cualquier L ∈ Rm .
Ejemplos
1. Sea f (x, y) =
2x2 (y + 1) + y 2
. Se afirma que
2x2 + y 2
2x2 (y + 1) + y 2
=1
2x2 + y 2
(x,y)→0
lı́m
(2)
(2)
En efecto, si (x, y) ∈ Bδ (0), donde Bδ (0) = {x ∈ R2 kxk2 < δ}, se tiene
que
2x2 (y + 1) + y 2
−1
2x2 + y 2
=
≤
2x2 y
2x2
=
|y|
2
2
2
2x + y
2x + y 2
1
|y| ≤ (x2 + y 2 ) 2 < δ = ε.
x2 y
,
x2 − y
x2 6= y El lı́mite de esta función
1 1
cuando (x, y) −→ 0 no existe, ya que si se considera la sucesión
,
, n∈
n n
1
1 1
,
=
−→ 0
N − {1}, obtenemos que g
n n
n(1 − n)
2. Considérese la función g(x, y) =
cuando n −→ ∞. Por otro lado si se toma la sucesión
1
n−1
1 1
√ , − 2 =
−→ 1 cuando n −→ ∞.
n
n n n
x−y
. Nuevamente, lı́m h(x) no existe, ya
x + y
x→0
1
1
que si consideramos las sucesiones
, 0 y 0,
, los valores lı́mite no
n
n
coinciden.
3. Tómese la función h(x, y) =
65
3. Limites y continuidad.
El lector habrá notado la complejidad de la noción de lı́mite. En el caso de
las funciones reales de variable real, podemos aproximarnos a un valor por 2
trayectorias. En el caso de funciones que involucran 2 o más variables, tenemos
una infinidad de formas para aproximarnos a un cierto punto. El siguiente resultado muestra un criterio de convergencia análogo al criterio de Cauchy para
sucesiones.
Proposición 3.1.2 Sean f : C ⊂ Rn −→ Rm y a ∈ C 0 . Entonces, f tiene lı́mite
en a si y solamente si, para toda ε > 0, existe δ > 0 tal que si x, x0 ∈ C − {a}
de tal forma que kx − ak < δ y kx0 − ak < δ, entonces kf (x) − f (x0 )k < ε
Demostración. Si lı́m f (x) = L, entonces, dada > 0, existe δ1 , δ2 > 0
x→a
tales que si kxk − a < δ1 y kx0 − ak < δ2 , donde x, x0 ∈ C − {a}, entonces
kf (x) − Lk < ε/2
y
kf (x0 ) − Lk < ε/2
tomando δ = min{δ1 , δ2 }, se sigue que
kf (x) − f (x0 )k ≤ kf (x) − Lk + kf (x0 ) − Lk < ε
para x, x0 ∈ Bδ∗ (a). Por otro lado, si para toda ε > 0, existe δ > 0 tal que
si x, x0 ∈ C − {a} de tal forma que kx − ak < δ y kx0 − ak < δ implica
que kf (x) − f (x0 )k < ε, debemos mostrar que el lı́mite de f en a existe. Para
demostrar esto, sea {xn } ⊂ C −{a} una sucesión tal que xn −→ a. Por hipótesis,
se sigue que {f (xn )} es un sucesión de Cauchy y por lo tanto, convergente. Falta
demostrar que si {xn 0 } es otra sucesión que converge a a, entonces
lı́m f (xn ) = lı́m f (xn 0 )
n→∞
n→∞
. Supongamos que lı́m f (xn ) = L y que lı́m f (xn 0 ) = L0 donde L 6= L0 .
n→∞
n→∞
Obsérvese que la sucesión {x1 , x01 , x2 , x02 , ....} converge a a, sin embargo, la sucesión {f (x1 ), f (x01 ), f (x2 ), f (x02 ), ...} no converge, lo cual es una contradicción
por lo tanto, f (xn ) −→ L, para toda sucesión {xn } ⊂ C −{a} tal que xn −→ a
Hasta el momento, hemos trabajado con la noción de lı́mite de funciones con
sucesiones que tienen lı́mite finito. Falta definir el caso para sucesiones que no
son acotadas, es decir, falta definir el concepto de lı́mite en el infinito. Además,
puede suceder que la imagen de una sucesión {xn } bajo una función f , sea un
conjunto que no es acotado.
Definición 34 Sean f : C ⊂ Rn → Rm una función y a ∈ C 0 .
a) Se dice que f tiene lı́mite infinito en a, si para M > 0, existe δ > 0 tal que
para todo x ∈ Bδ∗ (a) ∩ C se tiene que kf (x)k ≥ M. Cuando esto ocurre, lo
denotaremos por el sı́mbolo
lı́m f (x) = ∞
x→a
66
3.1. Lı́mites
b) Si
no acotado, diremos que f tiene lı́mite L en el infinito
C es un conjunto
lı́m f (x) = L , si para cada > 0, existe N > 0 tal que si kxk > N ,
x→∞
entonces kf (x) − Lk < .
c) Si C es un conjunto no acotado, se dice que f tiene lı́mite infinito en el
infinito, denotado por
lı́m f (x) = ∞
x→∞
Si para cada M > 0, existe N > 0 tal que si kxk > N , entonces se cumple
que kf (x)k ≥ M .
Ahora, como el lı́mite de una sucesión es único, por la definición (33), se sigue
que el lı́m f (x), si existe, es único. También, de la definición (32) se tiene que
x→a
lı́m f (x) = L si y solo si lı́m f (x) − L = 0.
x→a
x→a
Otra consecuencia inmediata de la definición (32) es que si f tiene lı́mite en el
punto a, entonces f es acotada en una vecindad de a. Por otra parte, si
lı́m f (x) = L D ⊂ C y a ∈ D0 ,
x→a
es claro que la función g = f |D tiene lı́mite en a, de hecho lı́m g(x) = L. Finalx→a
mente si f : C ⊂ Rn → Rm , es una función de la forma f (x) = (f1 (x), ..., fn (x)),
donde fi : C ⊂ Rn → R, i ∈ {1, ..., n} y L = (l1 , ..., ln ), entonces no es difı́cil ver
que
lı́m f (x) = L ⇔ lı́m f (x) = li
x→a
x→a
La verificación de los detalles se deja como ejercicio al lector. Por otra parte,
si existe una función ϕ : C ⊂ Rn → R tal que ϕ(x) > 0 para toda x ∈ C y
lı́m ϕ(x) = 0 de tal forma que
x→a
kf (x) − Lk < ϕ(x),
para toda x ∈ Bδ∗ (x), para alguna δ > 0 entonces se tiene que lı́m f (x) = L
x→a
Para ver esto, podemos aplicar la condición (ε − δ) a las función ϕ y dado que
ϕ(x) > 0 para toda x ∈ C, |ϕ(x)| = ϕ(x). Luego, para toda > 0, existe δ > 0
tal que si x ∈ Bδ∗ (a), se tiene que
kf (x − Lk ≤ ϕ(x) = |ϕ(x)| < ,
de donde se sigue la observación
67
3. Limites y continuidad.
Ejemplos
x3 − y 7
. Se afirma que lı́m f (x) = 0. Para ver esto, si
x2 + y 4
x→0
x ∈ Bδ∗ (0) con δ > 0 se tiene que
a) Defı́nase f (x, y) =
|f (x, y)| =
x3
y7
−
x2 + y 4
x2 + y 4
x2
y4
3
+
|y|
x2 + y 4
x2 + y 4
≤
|x|
≤
|x| + |y| .
3
3
Luego definiendo ϕ(x, y) = |x| + |y| , por la observación anterior, se sigue
que lı́m f (x) = 0.
x→0
a+1 b+1
b) Sea g(x, y) = xx2 +y2y−xy , donde a, b > 0. Demostraremos que un vector
(x, y) ∈ R2 , tiene una representación en coordenadas polares de la forma
(rcosθ, rsenθ). De esta forma sustituyendo lo valores de x y y, se tiene
que
|g(x, y)| = xa y b
r2
r2 cosθsenθ
= xa y b
− r2 senθcosθ
cosθsenθ
< xa y b −→ 0
sen2θ
1−
2
si (x, y) −→ (0, 0).
Hemos visto que si lı́m f (x) = L B ⊂ C y a ∈ D0 , entonces lı́m g(x) = L,
x →a
x→a
donde g = f |D .
Pues bien, respondiendo a este hecho, se dice que f tiene lı́mite L en a según la
dirección de la recta L (o que f tiene lı́mite direccional en a según la recta L) si
a ∈ L y lı́m g(x) = L, donde g = f |L . Diremos únicamente que f tiene lı́mite
x→a
direccional L en a, si f tiene lı́mite en a según la recta L para toda recta L que
contenga a a y lı́m f |L (x) = L para toda L.
x→0
Ya se demostró que si f tiene lı́mite en a, entonces para cualquier trayectoria
que contiene a a, en particular para las rectas L que pasan por a, el lı́mite
existe. Sin embargo, tenemos ejemplos donde el lı́mite direccional existe pero el
lı́mite de f en a no.
68
3.1. Lı́mites
Ejemplos
xy + y 3
. Se afirma que el lı́mite direccional de f en (0, 0)
x3 − y 2
existe. Para ver esto, sea y = mx, luego
mx2 + m3 x3
1 + m2 x
f (x, mx) = 2
=
m
.
x − m2 x2
1 − m2
1. Sea f (x, y) =
m
, |m| =
6 1, esto es,
1 − m2
el lı́mite direccional depende de la pendiente de la recta que se tome. En
consecuencia, f no tiene lı́mite direccional en a
Tomando x −→ 0, se sigue que f (x, y) −→
2. Defı́nase g(x, y) =
x3
. Si y = mx, entonces
x2 − y
g(x, mx) =
m 3 x2
m3 x3
=
−→ 0,
− mx
x−m
x2
x −→ 0
es decir, g tiene lı́mite direccional en 0. Sin embargo, g no tiene lı́mite en
0 ya que, si y = x2 − x3 , se sigue que
.
g(x, x2 − x3 ) =
x3
= 1 −→ 1 si x −→ 0
x3
La siguiente proposición extiende algunas propiedades de lı́mites de funciones
reales de variable real para el caso de funciones reales de variable vectorial.
Proposición 3.1.3 Sean f,g y h tres funciones definidas en un mismo conjunto
C ⊂ Rn y a ∈ c0 . Supóngase que lı́m f (x) = L y lı́m g(x) = M , para algún
x→a
x→a
par de valores L, M ∈ R. Sean K ∈ R y Bδ∗ (a) = Bδ (a) − {a}, donde δ > 0 es
el valor correspondiente a la definición de lı́mite.
a) K < L (respectivamente, K ≥ L) si y solo si K < f (x)
para toda x ∈ C ∩ Bδ∗ (a).
(K ≥ f (x))
b) L ≤ M si y solamente si, f (x) < g(x) para cualquier x ∈ C ∩ Bδ∗ (a).
c) Si L = M y f (x) ≤ g(x) ≤ g(x) para toda x ∈
lı́m h(x) = L
C ∩ Bδ∗ (a), entonces
x→a
Demostración.
a) Sea ε = L − K > 0. Como lı́m f (x) = L, entonces existe δ > 0 tal que
x→a
para toda x ∈ C ∩ Bδ∗ (a), |f (x) − L| < ε; luego, por la definición de
valor absoluto, se sigue que
K − L < f (x) − L
69
3. Limites y continuidad.
Es decir, K < f (x).Por otro lado, si K < f (x) para toda x ∈ C ∩ Bδ∗ (a),
para alguna δ > 0, se sigue que
K − L < f (x) − L
Tomando el lı́mite en ambos lados cuando x −→ a, obtenemos que
K − L < 0,
esto es, K < L.
b) Supongamos que L < M y sea ε = 21 (M − L). Entonces existe δ > 0 tal
que si x ∈ Bδ∗ (a), se tiene que f (x) ∈ Bε (L) y g(x) ∈ Bε (M ) es decir,
|f (x) − L| < ε y
|g(x) − M | < ε
de donde se obtiene que
f (x) <
1
(M + L) < g(x)
2
Por tanto, f (x) < g(x) para toda x ∈ Bδ∗ (a). Ahora, si L ≥ M , por
la parte anterior, f (x) ≥ g(x), de donde se concluye que f (x) < g(x)
implica que L < M
c) Sea ε > 0; entonces, existe δ > 0 tal que f (x) , g(x) ∈ Bδ∗ (a) Tómese
δ0 > 0 tal que para toda x ∈ Bδ0 (a), f (x) ≤ h(x) ≤ g(x).
Si δ = mín {δ , δ0 } es claro que para toda x ∈ Bδ0 (a)
L ≤ lı́m h(x) ≤ M = L,
x→a
de donde se concluye que lı́m h(x) = L.
x→a
El siguiente resultado establece las propiedades aritméticas para lı́mites de funciones reales de variable vectorial. La prueba de este hecho es muy similar al
caso de las funciones de variable real, por lo que su prueba se deja como ejercicio
al lector.
Proposición 3.1.4 Sean f : C ⊂ Rn −→ R y g : C ⊂ Rn −→ R. funciones
y a ∈ C 0.
a) Si lı́m f (x) = 0 y para toda x ∈ C ∩ Bδ∗ (a), δ > 0, |g(x)| < M, para
x→a
alguna M > 0 , entonces lı́m f (x)g(x) = 0
x→a
b) Si lı́m f (x) = L y lı́m g(x) = M ,
x→a
x→a
i) lı́m [f (x) + g(x)] = L + M
x→a
L, M ∈ R entonces:
70
3.1. Lı́mites
ii) lı́m [f (x) g(x)] = L M
x→a
f (x)
L
iii) si M 6= 0, lı́m
=
x→a g(x)
M
Otra forma de calcular lı́mites es de manera reiterada. El análisis que se hace en
este texto, se puede hacer extensivo a funciones escalares con cualquier número
de variables independientes.
Si f : C ⊂ R2 −→ R y a = (x0 , y0 ) ∈ C 0 , podemos calcular el lı́mite
“reiterado” en a , aproximándonos por separado a x0 y a y0 (véase la figura
3.2).
f(X2 , Y2)
L
Y2
Y0
f(X1 , Y1)
Y1
X2
X1
Figura 3.2: Lı́mites reiterados
Ejemplos
1. Sea f (x, y) = x + y. Calcularemos los lı́mites reiterados de la función f
cuando (x, y) → (1, 1). Calculamos
lı́m f (x, y) = lı́m x + y = 1 + x.
y→1
y→1
Luego
lı́m
x→1
lı́m f (x, y) = (1 + x) = 2
y→1
Nótese que en este caso:
lı́m
x→1
lı́m f (x, y) = lı́m lı́m f (x, y)
y→1
En general, esto no sucede.
y→1
x→1
71
3. Limites y continuidad.
2. Sea g(x, y) = x λ(y) donde


1
λ(y) = 0


−1
si y > 0
si y = 0
si y < 0
Observe que los lı́mites reiterados no coinciden en (0, 0) , ya que, por un
lado,
lı́m g(x, y) = lı́m = x
y→0+
y
y→0+
lı́m g(x, y) = lı́m = −x
y→0−
y→0−
Luego, lı́m ( lı́m g(x, y)) no existe; por otra parte , lı́m g(x, y) = 0 de
x→0 y→0
x→0
donde se sigue que lı́m ( lı́m g(x, y)) = 0. Ahora, nótese que
y→0 x→0
|g(x, y)| = |x| → 0 cuando x → 0 , por lo que el lı́mite existe.
xy
tiene lı́mites reiterados iguales en (0, 0),
3. La función f (x, y) = 2
x + y2
sin embargo no tiene lı́mite en (0, 0) (se le recomienda al lector verificar
los detalles).
1
, donde x ∈ R+ ∪ {0} y y ∈ R+ . Nótese
4. Sea h(x, y) = x sen
y
1
1
que lı́m lı́m sen
= 0 pero lı́m lı́m sen
no existe.
y→0 x→0
x→0 y→0
y
y
2
4
Para ver esto, tómese las sucesiones yn =
y yn0 =
.
(2n − 1)π
(8n + 1)π
Sin embargo, como
x sen
siempre que
p
1
1
= |x||sen | ≤ |x| ≤ x2 + y 2 < ε
y
y
p
x2 + y 2 < δ = ε, se sigue que
lı́m
(x,y)→(0,0)
h(x, y) = 0
El siguiente resultado relaciona los conceptos de lı́mite y lı́mite reiterado.
Teorema 3.1.5 Sean f : C ⊂ R2 → Rm y a = (x0 , y0 ) ∈ C o .
Si lı́m f (x) = L y si para cada y ∈ Bδ∗ (y0 ), δ > 0, lı́m f (x, y) existe,
x→x0
x→a
entonces el lı́mite reiterado
lı́m
y→y0
existe y es igual a L.
lı́m f (x, y)
x→x0
72
3.1. Lı́mites
Demostración. Dado ε > 0 , como L es el lı́mite de f en a , existe δ > 0
tal que si kx − ak < δ entonces kf (x) − Lk < 2ε . Sea U ∗ = Bδ∗ (y0 ) la bola
perforada de la que habla el enunciado. Luego por hipótesis, existe una función
ϕ(y) tal que ϕ(y) = lı́m f (x) para y ∈ U ∗ es decir, para cada ε > 0,
x→x0
existe δy > 0, tal que si |x − x0 | < δy entonces kf (x, y) − ϕ(y)k < 2ε para
y ∈ U ∗ . Ası́ para todo y ∈ U ∗ tal que |y − y0 | < δ si x ∈ Bδ∗0 (x0 ) donde
δ 0 = mín{δ, δy } se tiene que:
kϕ(y) − Lk ≤ kϕ(y) − f (x, y)k + kf (x, y) − Lk < ε
por lo tanto lı́m ϕ(y) = L como se querı́a probar.
y→y0
Ya hemos visto anteriormente casos en los que:
a) La función tiene lı́mite en un punto, pero los lı́mites reiterados (o uno de
ellos) no existe.
b) La función tiene lı́mites reiterados en un punto, son iguales, pero su lı́mite
en dicho punto no existe
c) La función tiene lı́mites reiterados en un punto, pero son distintos.
Esto nos proporciona un criterio para asegurar que la función no tiene lı́mite
en un punto. En general, para espacios métricos, el concepto de lı́mite se extiende
de manera natural.
Definición 35 Sean (X, d) y (Y, ρ) espacios métricos, D ⊂ X, f : D −→ Y
una función, b ∈ Y y a ∈ D0 . Decimos que b es el lı́mite de la función f en
el punto a, si para cada ε > 0 existe δ > 0 tal que si d(x, a) < δ entonces
e(f (x), b) < ε.
Como siempre, si b es el lı́mite de f en a, lo denotaremos por lı́m f (x) = b,
x→a
x∈ D
Teorema 3.1.6 Sea X un espacio métrico. Entonces
lı́m f (x) = b,
x −→ a
si y sólamente si
donde xn −→ a.
Demostración.
lı́m
n −→ ∞
x ∈ D,
f (xn ) = b, para toda sucesión {xn } ⊂ D − {a},
Supongamos que
lı́m f (x)
x −→ a
=
b,
x
∈
D y sea
{xn } ⊂ D − {a}, tal que xn −→ a, cuando n −→ ∞. Sea ε > 0, entonces existe δ > 0 tal que
ρ (f (x), b) < ε
si x ∈ D y d (x, a) < δ.
73
3. Limites y continuidad.
Además, existe N ∈ N tal que si n ≥ N , entonces d (xn , a) < δ. Ası́, para
n > N , ρ (f (xn ), b) < ε.
Por otro lado, si existe ε > 0 tal que para todo δ > 0 existe x ∈ D, que
depende de δ, tal que ρ (f (x), b) ≥ ε, pero d (x, a) < δ, entonces, tomando
δn = n1 , n ∈ N, hemos encontrado una sucesión en D para la cual f (xn )
no converge a b. Ası́, si lı́m f (x) = b, entonces lı́m f (xn ) = b, si
x −→ a
n −→ ∞
xn −→ a.
Corolario 3.1.7 Si f tiene lı́mite en a, éste es único.
Demostración. Es consecuencia del Teorema 3.1.6 y la unicidad del lı́mite
para sucesiones.
Al igual que para funciones definidas sobre Rn , se tiene que el espacio de
funciones con lı́mite en un punto a es cerrado bajo la suma, el producto y el cociente, es decir, si
lı́m f (x) = b y
lı́m g (x) = c, donde
x −→ a
x −→ a
f, g : D ⊂ X −→ R, X espacio métrico y a ∈ D0 , entonces
1.
2.
lı́m f (x) + g (x) = b + c,
x −→ a
lı́m (f (x) g (x)) = b c,
x −→ a
3. Si c 6= 0, entonces
lı́m
x −→ a
b
f (x)
= .
g (x)
c
La verificación de los detalles se le dejan al lector.
3.2.
Funciones continuas
En este capı́tulo estudiaremos las funciones continuas en espacios métricos en
general, analizando ejemplos de funciones en Rn . Básicamente, la continuidad
de una función x −→ f (x) significa que incrementos pequeños en la variable
x, implica pequeños en el valor de f (x). Las propiedades de lı́mites estudiadas
en la sección anterior, conducen de manera natural a propiedades análogas para
las funciones continuas. Además, existen otras propiedades importantes, que se
refieren a la continuidad global.
Definición 36 Sean (X, d) y (Y, ρ) espacios métricos. Se dice que una función
f : X 0 , −→ Y es continua en un punto a ∈ X, si dado ε > 0, existe δ > 0
tal que si d (a, x) < δ, entonces ρ (f (a), f (x)) < ε.
Obsérvese que esta definición se puede reformular en términos de bolas. A saber,
f es continua en el punto a si dada cualquier bola con centro en f (a) ∈ Y ,
digamos BεY (f (a)), existe una bola con centro en a ∈ X, BδX (a), de tal
forma que
f BδX (a) ⊂ BεY (f (a)).
74
3.2. Funciones continuas
Si f no es continua en a, decimos que f es discontinua en a, o que tiene
una discontinuidad en a. Obsérvese que la definición de continuidad es local, es
decir, está definida sobre cada punto de X. Si f es continua en a, para todo
punto a ∈ A ⊆ X decimos que f es continua en A. Si f es continua en X,
decimos simplemente que f es continua.
f
f (Bδ (a))
a δ
ε
f (a)
Figura 3.3: Continuidad de f en a
No es difı́cil demostrar (se deja como ejercicio al lector), que la definición 36
se puede reescribir de la siguiente forma:
“f es continua en x si y sólo si dada ε > 0, existe δ > 0 tal que se cumple
que Bδ (x) ⊂ f −1 (Bε (f (x))).”
Esta caracterización afirma que f es continua en x si y sólo si para toda ε > 0,
f −1 Bε (f (x)) es una vecindad de x. Esto nos da la pauta para formular una
definición más general de continuidad.
Definición 37 Sean X y Y espacios métricos y sea f : X −→ Y una
función. Se dice que f es continua en x ∈ X, si dada una vecindad V de
f (x), f −1 (V ) es una vecindad de x.
Esta definición es muy útil, ya que se puede cambiar la palabra “métricos” por
“topológicos”.
Ejemplos.
1. Sea f : R2 −→ R, definida como
 2
 x + 2y − 1
f (x, y) =

3x + y 2
si x ≥ 0
si x < 0.
Analicemos la continuidad de f en todos los puntos (x0 , y0 ) ∈ R2 . Si
x0 > 0, entonces
lı́m
(x,y) −→ (x0 , y0 )
f (x, y) =
lı́m
(x,y) −→ (x0 , y0 )
(x2 + 2y − 1) = x20 + 2 y0 − 1 = f (x0 , y0 ).
75
3. Limites y continuidad.
Si x0 < 0, entonces f es continua en (x0 , y0 ) ya que
lı́m
(x,y) −→ (x0 , y0 )
f (x, y) =
lı́m
(x,y) −→ (x0 , y0 )
3x + y 2 = 3 x0 + y02 = f (x0 , y0 ).
Ahora, si x0 = 0, tomando los semiplanos
P = {(x, y) ∈ R2 | x ≥ 0}
N = {(x, y) ∈ R2 | x < 0},
f tendrá el lı́mite en (0, y0 ) si y sólamente si f |P y f |N tienen el mismo
lı́mite, es decir, si
lı́m
(x,y) −→ (0, y0 )
f |P (x, y) = 2 y0 − 1 = f (0, y0 )
y
lı́m
(x,y) −→ (0, y0 )
f |N (x, y) =
lı́m
(x,y) −→ (0, y0 )
3x + y 2 = y02
son iguales. Esto sucede si y sólo si, 2 y0 − 1 = y02 , es decir, si y0 = 1. Por
tanto, f es continua en (0, 1) y discontinua en (0, y0 ), donde y0 =
6 1.
2. Sea la función
f (x, y) =
 3
 x + 2y

5
si (x, y) 6= (1, 3)
si (x, y) = (1, 3).
Obsérvese que esta función no es continua en (1, 3) ya que
lı́m
(x,y) −→ (1,3)
f (x, y) =
lı́m
(x,y) −→ (1,3)
3. Considérese la función f dada por
 y
 x
f (x, y) =

0
x3 + 2y =0 , 7 6= 5 = f (1, 3).
si x 6= 0
si x = 0.
Esta función no es continua en (0, y0 ), y0 ∈ R ya que
lı́m
(x,y) −→ (0,y0
f (x, y)
no existe; una forma de verificar esta afirmación es notar que
y0
lı́m
lı́m f (x, y) = lı́m
y −→ y0
x −→ 0
x −→ 0 x
no existe. De esta forma, la función es discontinua a lo largo de la recta
x = 0.
4. Hay que ser cuidadosos al discutir la continuidad de una función
f : X −→ Y en un subconjunto de X. Si A ⊂ X hay que distinguir entre decir que f es continua en A y considerar la restricción de f
a A y afirmar que f |A es continua con la métrica d|A . En el primer caso,
76
3.2. Funciones continuas
el dominio de la función es X y estamos diciendo que en todos los puntos
de A se satisface la definición con la métrica d. En el segundo caso, la
función f |A está definida sobre el espacio A = (A0 , d|A ).
La primera afirmación implica la segunda. Para verificar esto, considerando un punto x ∈ A y ε > 0, entonces para algún valor δ > 0,
f (BδX (x)) ⊂ BεY (f (x)). Luego, recordando que
f |A (x) = f (x), x ∈ A,
y que en el espacio A Bδ (x) es A ∩ BδX (x), se tiene que
f |A (A ∩ BδX (x)) ⊂ f (BδX (x)) ⊂ BεY (f (x)) = BεY (f |A (x)).
La otra implicación es falsa, ya que la función f : R −→ R, dada por

si x ∈ I
 0
f (x) =

1
si x ∈ Q,
es discontinua en todo punto de R. Sin embargo, las funciones f |Q y f |I
son funciones constantes y, por lo tanto, continuas.
En resumen, la continuidad de f |A en X sólo toma en cuenta el comportamiento de la función f en puntos del conjunto A, mientras que la
continuidad de f en x ∈ A también toma en cuenta el comportamiento
de f en puntos fuera de A.
El siguiente resultado establece la relación entre lı́mites y continuidad.
Teorema 3.2.1 Sean f : X −→ Y y x ∈ X. f es continua en X si y sólo
si se cumple una de las siguientes condiciones.
a) x es punto aislado de X.
b) x es punto de acumulación de X y
lı́m f (y) = f (x).
y −→ x
Demostración. La demostración de que f sea continua implica una de las
afirmaciones a) o b), se deja como ejercicio par el lector. Si x ∈ X es un punto
aislado, entonces para alguna δ > 0, BδX (x) = {x} y
f (BδX (x)) = {f (x)} ⊂ BεY (f (x))
para toda ε > 0. Si x es un punto de acumulación, el resultado es inmediato
comparando las definiciones de lı́mite y continuidad.
Corolario 3.2.2 Sea f : X −→ Y es continua en x ∈ X si y sólo si para
cualquier sucesión {xn }n ∈ N ⊂ X tal que xn −→ x se tiene que la sucesión
{f (xn )}n ∈ N ⊂ Y converge a f (x).
77
3. Limites y continuidad.
Demostración. Si x es un punto aislado, consideramos la sucesión constante
xn = x (ya que es la única sucesión de puntos de X que tiene lı́mite en X).
Si x es un punto de acumulación, por el Teorema 3.2.1 se sigue el resultado.
Veamos ahora que la composición de funciones continuas es continua.
Teorema 3.2.3 Si (X, d1 ), (Y, d2 ) y (Z, d3 ) son espacios métricos de la forma
f : X −→ Y , g : Y −→ Z son funciones continuas en x y f (x) respectivamente, entonces g ◦ f : X −→ Z es continua en x. En consecuencia, si f y
g son continuas, entonces g ◦ f también lo es.
Demostración. Sea W una vecindad de (g ◦ f ) (x) = g (f (x)) en Z. Como
g es continua en f (x), g −1 (W ) es vecindad de f (x) en Y ; de esta forma,
como f es continua en X, f −1 (g −1 (W )) = (g ◦ f )−1 (W ) es vecindad de
x ∈ X.
Otra forma de demostrar el resultado es la siguiente: tómese una sucesión
{xn } ⊂ X tal que xn −→ x. Como f es continua en x, se tiene que
f (xn ) −→ f (x). Ahora, debido a que g es continua en f (x), se sigue que
(g ◦ f ) (xn ) = g (f (xn )) −→ g (f (x)) = (g ◦ f ) (x).
Dado que {xn }n ∈ N fue una sucesión arbitraria, se sigue el resultado.
El siguiente resultado establece la relación entre continuidad y conectabilidad
por trayectorias.
Corolario 3.2.4 Sean X y Y espacios métricos, f : X −→ Y una función
continua y supóngase que X es conectable por trayectorias, entonces f (X) es
conectable por trayectorias.
Demostración. Si f (x), f (y) ∈ f (X), considérese la trayectoria σ : x ' y.
Luego, por el Teorema 3.2.3, la función f ◦ σ es una trayectoria que une f (x)
con f (y).
Por otra parte, por el corolario 3.2.2 y la definición 36 es claro que si
f : X −→ R
y g : X −→ R
son funciones continuas, entonces f + g, f g son continuas y si g (x) 6= 0
para toda x ∈ X entonces f /g es continua.
Teorema 3.2.5 Sea (X , d) un espacio métrico, n ∈ N, fi : X −→ Rn y
definase F como
F (x) = ( f1 (x), .... fn (x)).
Entonces, F es continua en x ∈ X si y sólo si fi es continua en x ∈ X,
para cada i ∈ {1, ..., n}
78
3.2. Funciones continuas
Demostración. Consideremos la función πk : Rn −→ R, definida como
πk (z1 , ...., zn ) = zk
(proyección sobre la k-ésima coordenada) y supongamos que F es continua en
x. Nótese que πk ◦ F = fk . Se afirma que πk es continua en Rn . En efecto
obsérvese que
|πk (z) − πk (w) | = |zk − wk | ≤ kzk − wk k2 < ε = δ.
Por el teorema 3.2.3, se sigue que fk es continua. Ahora, si fk es continua
en x ∈ X, dado ε > 0, existe un δk > 0 tal que si d (x, y) < δk , entonces
|fk (x) − fk (y)| < ε/n. Tomando δ = min {δ1 , ..., δn }, si d (x, y) < δ, se
tiene que
! 21
n
X
2
≤ ε
k F (x) − F (y) k2 =
|fk (x) − fk (y)|
k=1
de donde se concluye que F es continua en x
El siguiente resultado presenta una generalización a espacios métricos
Proposición 3.2.6 Si (X, d), (Y, d1 ) y (Z, d2 ) son espacios métricos y
f : X −→ Y , g : Y −→ Z son funciones continuas. Definimos sobre Y × Z
la métrica D : (Y × Z) × (Y × Z) −→ R+ ∪ {0} dada por
D((y1 , z1 ) , (y2 , z2 )) = d1 (y1 , y2 ) + d2 (z1 , z2 ).
Entonces, la función F : X −→ Y × Z dada por F (x) = (f (x), g(x)) es
continua
Demostración. Sean x0 ∈ X y ε > 0; entonces, existen δ1 , δ2 > 0 tales
que si d (x, x0 ) < δ1 y d (x, x0 ) < δ2 , entonces
d1 (f (x), f (x0 )) <
ε
2
y
d2 (g(x), g(x0 )) <
ε
.
2
Tomando δ = min{δ1 , δ2 } y d(x, x0 ) < δ, se sigue que
D (f (x), f (x0 )) = d1 (f (x), f (x0 )) + d2 (g(x), g(x0 )) <
ε
ε
+
= ε.
2
2
Es fácil ver que este resultado se puede generalizar para funciones de la
forma F : X −→ X , donde X = X1 × ... × Xn equipando a este espacio con
n
X
la métrica producto, D =
di donde di es la métrica del espacio Xi , i ∈ N.
i=0
Como ya hemos visto anteriormente, la topologı́a de un espacio queda determinado por la descripción de sus conjuntos abiertos o sus cerrados, por el
interior o la cerradura de sus conjuntos, etcétera. De la misma forma, la continuidad puede caracterizarse utilizando estos conceptos.
79
3. Limites y continuidad.
Teorema 3.2.7 Sean X y Y espacios métricos y f : X −→ Y una función.
Las siguientes afirmaciones son equivalentes
a) f es continua
b) Para todo abierto A en Y , f −1 (A) es abierto en X.
c) Para todo subconjunto A de Y, f −1 (Ao ) ⊂ (f −1 (A))◦
d) Para todo subconjunto C de X f (C) ⊂ f (C).
e) Para todo cerrado C en Y, f −1 (C) es cerrado en X.
Demostración.
a) ⇒ b)
Sea A abierto en Y y sea x ∈ f −1 (A). Por definición de imagen inversa,
f (x) ∈ A y como A es abierto, A es vecindad de f (x). Dado que f
es continua en x, f −1 (A) es vecindad de x y dado que éste último fue
arbitrario, f −1 (A) es abierto.
b) ⇒ c)
Sea A ⊂ Y ya que Ao es abierto, por b), se sigue que f −1 (Ao ) es
abierto y f −1 (Ao ) ⊂ f −1 (A). Ya que (f −1 (A))◦ es el abierto más grande
contenido en f −1 (A) se concluye que
f −1 (Ao ) ⊂ (f −1 (A))◦ .
c) ⇒ d)
Sea C ⊂ X, por c),
f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ .
Por otro lado, nótese que para un espacio métrico X, se satisface que
X − A = (X − A)◦ para todo A ⊂ X
(Se deja como ejercicio al lector). Ası́, resulta que:
X − f −1 (f (C)) = f −1 (Y − f (C)) = f −1 ((Y − f (C))◦ )
⊂ (f −1 (Y − f (C)))◦ = (X − f −1 (f (C)))◦ = X − f −1 (f (C)).
También, nótese que C ⊂ f −1 (f (C)), de donde se sigue que
C ⊂ f −1 (f (C)). Se puede verificar que si X es un espacio métrico,
C = X − (X − C)◦ , C ⊂ X.
De esta forma
f −1 (f (C)) = X − (X − f −1 (f (C)))◦ = X − (f −1 (Y − f (C)))◦ ;
80
3.2. Funciones continuas
como f cumple con c), se sigue que
f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ ,
luego
X − (f −1 (Y − f (C)))◦
⊂
X − f −1 ((Y − f (C))◦ )
= X − f −1 (Y − f (C))
= f −1 (f (C)),
de donde se concluye que
C ⊂ f −1 (f (C)).
Aplicando f a ambos extremos, obtenemos
f (C) ⊂ f [f −1 (f (C))] ⊂ (f (C))
.
d) ⇒ e)
Sea C cerrado en Y . Dado que se cumple d) y ya que f (f −1 (C)) ⊂ C,
se sigue que
f (f −1 (C)) ⊂ f (f −1 (C)) ⊂ C = C.
Tomando imágenes inversas, tenemos que f −1 (f (f −1 (C))) ⊂ f −1 (C),
pero f −1 (C) ⊂ f −1 (f (f −1 (C))) por lo que f −1 (C) ⊂ f −1 (C). Por lo
tanto f −1 (C) = f −1 (C) es cerrado.
e) ⇒ a)
Sean x ∈ X y V una vecindad de f (x) en Y . Supongamos que V es
abierto. Por e) se tiene que f −1 (Y − V ) = X − f −1 (V ) es cerrado,
debido a que Y − V es cerrado- Luego, f −1 (V ) es abierto y como contiene
a x, es vecindad abierta de x ∈ X. En consecuencia, f es continua en
x y por ser éste último arbitrario, se tiene el resultado
Corolario 3.2.8 Si f : X −→ Y es continua y K un subconjunto conexo de
X, entonces f (K) es un subconjunto conexo de Y
Demostración. Supongamos que f (K) es inconexo y sea (A, B) una desconexión de dicho conjunto. Por el Teorema 3.2.7, se sigue que (f −1 (A), f −1 (B))
es una pareja de abiertos, no vacı́os, ajenos y tales que su unión es K, es decir,
K es inconexo.
Teorema 3.2.9 Si f : X −→ Y es continua y K un subconjunto compacto
de X, entonces f (K) es un subconjunto compacto de Y
81
3. Limites y continuidad.
Demostración. Sea C = {V : i : i ∈ I} una cubierta abierta de f (K) en
Y . Como f es continua, f −1 (Vi ) es abierto en X. Por lo tanto
C 0 = {f −1 (Vi ) : i ∈ I}
es una cubierta abierta de K en X y como K es compacto existen
{f −1 (Vi )....f −1 (Vim )} ∈ C 0
tales que K ⊂ f −1 (Vi1 ) ∪ ... ∪ f −1 (Vim ). Luego
f (K) ⊂ Vi1 ∪ ... ∪ Vim ,
por lo que f (K) es compacto.
Ejemplos
1. Sea f : Rn −→ Rm continua. Se afirma que el conjunto
S = {x ∈ Rn | kf (x)k < 1},
es abierto. Para ver esto, basta con observar que el conjunto S es igual
al conjunto dado por
f −1 ({y ∈ Rm |kyk < 1}) ,
que es la imagen inversa de un abierto. Como f es continua, S es abierto.
2. Nótese que si f es una función continua de la forma f : X −→ Y y
U ⊂ X es abierto, f (U ) no necesariamente es abierto. A saber, tómese
la función f : R −→ [0, 1] dada por


 0 si x ≤ 0



x si x ∈ (0, 1)
f (x) =





1 si x ≥ 0,
Si se considera U = (−7, 2), f (U ) = [0, 1] que es un conjunto cerrado.
A las funciones que satisfacen que mandan abiertos en abiertos, las llamaremos aplicaciones propias.
3. Si f : X −→ Y es continua y K ⊂ Y es compacto, no se cumple en
general que f −1 (K) sea compacto en X. A saber, si se toma f : R −→ R
dada por f (x) = 1, para toda x ∈ R, K = {1} es compacto, pero
f −1 (1) = R no lo es. Si K es conexo, tampoco se puede asegurar que
f −1 (K) sea conexo en X. Para ver esto, tómese f (x) = x2 y K = {1}.
Luego f −1 (K) = {−1, 1} que claramente no es conexo.
82
3.2. Funciones continuas
Para funciones reales de variable real, se sabe que una función continua
no necesariamente tiene un máximo ni un mı́nimo absoluto. Sin embargo, si
tenemos una función continua definida sobre un intervalo cerrado, dicha función
alcanza su máximo y su mı́nimo. Para el caso de funciones reales de variable
vectorial, tenemos un resultado similar.
Proposición 3.2.10 Si C ⊂ Rn es un conjunto compacto y f : C −→ R
es una función continua en C, entonces existen puntos x0 , x1 ∈ C tales que
f (x0 ) ≤ f (x) ≤ f (x1 ) para toda x ∈ C, esto es, f alcanza su máximo y su
mı́nimo en C.
Demostración. Por el Teorema 3.2.9 se sigue que f (C) es compacto, por
el Teorema 2.4.5, se sigue que este conjunto es cerrado y acotado, por lo que
existen valores α, β ∈ R tales que α = sup f (C) y β = ı́nf f (C). Demostraremos que α, β ∈ f (C). Verificamos que α ∈ f (C), el caso de β se
demuestra de manera
análoga. Consideremos la colección de intervalos de la
forma α − n1 , α , n ∈ N. Como α es el supremo, entonces existe un punto
1
xn ∈ f (C) ∩ α − , α .
n
Nótese que xn −→ α. Por ser f (C) compacto y {xn } ⊂ f (C), existe una
subsucesión {xnk } tal que xnk −→ x0 ∈ f (C). Por la unicidad del lı́mite, se
concluye que x0 = α.
Recordemos que una función inyectiva f : X −→ Y tiene inversa izquierda,
es decir, existe una función g : f (X) −→ X tal que g ◦ f = IdX . Denotaremos a la función g como f −1 .
Proposición 3.2.11 Sean C ⊂ Rn un conjunto compacto y f : C −→ Rm
una función continua en C e inyectiva. Entonces, f −1 es continua en f (C).
Demostración. Sea una sucesión {yn } ⊂ f (C) tal que yn −→ y0 . Obsérvese
que la sucesión {yn } genera una sucesión {xn } en C, a saber xn = f −1 (yn ).
Como C es compacto, entonces existe una subsucesión {xnk } de {xn } tal que
xnk −→ x0 ∈ C. Se afirma que x0 = f −1 (y0 ). Para ver esto, dado que f es
continua en C y xnk −→ x0 en C, se sigue que ynk = f (xnk ) −→ f (x0 ).
Ası́, por la unicidad del lı́mite, se sigue que y0 = f (x0 ), de donde se concluye,
por inyectividad, que x0 = f −1 (y0 ), como se querı́a demostrar.
Un espacio métrico (y en general, un espacio topológico), tiene una estructura dada por sus conjuntos abiertos y cerrados. Cuando hablamos, por ejemplo,
de estructuras algebraicas (anillos,grupos, etcétera), decimos que dos objetos
“no se distinguen” si son isomorfos, esto es, si existe una biyección entre sus
conjuntos subyacentes que respeta su estructura. De manera similar, se puede
definir una relación entre espacios métricos (en general, espacios topológicos)
que respeta la estructura topológica.
83
3. Limites y continuidad.
Definición 38 Sean X y Y espacios métricos (en general, espacios topológicos). Se dice que X y Y son homeomorfos y se denota como X ∼
= Y , si
existe una función f : X −→ Y continua y biyectiva tal que su inversa es
también continua.
Nótese que la Proposición 3.2.11 muestra que una función f inyectiva y
continua sobre un conjunto C ⊂ Rn , es un homemorfismo entre C y f (C). El
siguiente resultado muestra que, en efecto, un homeomorfismo es una biyección
que respeta la estructura topológica.
Proposición 3.2.12 Sean X y Y espacios métricos y f : X −→ Y una
función. Las siguientes afirmaciones son equivalentes.
a) f es un homeomorfismo.
b) f es biyectiva y f (A) es abierto en Y si y sólo si A es abierto en X.
c) f es biyectiva y f (C) es cerrado en Y si y sólo si C es cerrado en X.
Demostración. Supongamos que f es un homemorfismo. Por definición, f
es biyectiva y continua, con inversa continua. Si f (A) es abierto, entonces por
el Teorema 3.2.7, se sigue que f −1 (f (A)) = A es abierto. Ahora, si A es
abierto, como f −1 es continua, la imagen inversa de A bajo la función f −1
es un conjunto abierto. Pero este conjunto es justamente f (A). Por otro lado,
supongamos que se satisface b). Sea A un abierto en Y , como f es biyectiva,
existe un subconjunto B ⊂ X tal que f (B) = A. Luego, dado que f (B) es
abierto, se sigue que B es abierto y como fue arbitrario, se concluye que f es
continua. Un argumento análogo muestra que f −1 es continua. Por tanto, f
es un homeomorfismo. La equivalencia entre a) y c) se demuestra de una forma
similar.
Nótese que este resultado afirma que f no sólo establece una biyección
entre los puntos de X y de Y , sino también establece una equivalencia entre
los abiertos (respectivamente, cerrados) de uno y otro espacio. En general, una
función continua y biyectiva, no necesariamente define un homeomorfismo. A
saber, la función f : [0, 1) −→ S1 , dada por
f (t) = (cos 2 π t, sin 2 π t),
es continua y biyectiva, pero no es un homeomorfismo (ejercicio).
3.3.
Continuidad uniforme
Nuestra definición de continuidad de una función f en un punto x0 , establece una propiedad local, es decir, es una propiedad que depende de lo valores
que toma f en una vecindad de x0 suficientemente pequeña. Se dice que una
función es continua sobre un conjunto C si es continua en todo punto de dicho
84
3.3. Continuidad uniforme
conjunto. De esta forma, para cada punto x0 ∈ C encontraremos un módulo
de continuidad δ, el cual varı́a dependiendo del punto x0 . Sin embargo, existen funciones para las cuales, el módulo de continuidad no depende del punto
x0 ∈ C. A este tipo de funciones las llamaremos uniformemente continuas.
Definición 39 Sean (X, d) y (Y, d0 ) espacios métricos. Se dice que una función
f : X −→ Y es uniformemente continua en X si dado ε > 0 existe δ > 0 tal
que si d (x, y) < δ, entonces d0 (f (x), f (y)) < ε, para cualesquiera x, y ∈ X
Es una consecuencia inmediata de esta definición que si f es uniformemente
continua en X entonces es continua en todo punto x ∈ X. La afirmación contraria es falsa en general. La diferencia entre ambos conceptos radica en que,
en la definición de continuidad, el valor δ puede depender tanto de ε como
del punto x, mientras que para tener continuidad uniforme δ depende sólo de
ε. Obsérvese además que la definición 39 se puede enunciar de la siguiente forma:
f es uniformemente continua si f (Bδ (x)) ⊂ Bε (f (x)) para toda x ∈ X.
Ejemplos.
1. Sea f : (0, 1) −→ R dada por f (x) = x1 . Observemos que esta función
es continua, ya que para un intervalo abierto (a, b) ⊂ R, donde a > 0,
se tiene que
1 1
f
,
= (a, b),
b a
de donde se concluye que si V ⊂ R es un conjunto abierto, entonces
f −1 (V ) es abierto. Sin embargo, f no es uniformemente continua, ya
que si ε = 1, para cualquier δ > 0, tal que δ < 31 , si x = 2 δ,
entonces
1 1
1
f (Bδ (x)) = f ((δ, 3 δ)) =
,
6⊂ B1
.
3δ δ
2δ
Una función f : C ⊂ X −→ Y , donde (X, d) y (Y, d0 ) son espacios
métricos, no es uniformemente continua en un conjunto C, si se verifican
una de las siguientes dos condiciones:
a) Existe un valor ε > 0 tal que para cada δ > 0, existen puntos
x, x0 ∈ C tales que d (x, x0 ) < δ, pero d0 (f (x), f (x0 )) > ε.
b) Existen ε > 0 y dos sucesiones {xn } y {x0n } en C, tales que
lı́m
n −→ ∞
d (xn , x0n ) = 0,
pero d0 (f (xn ), f (x0n )) > ε, donde n ∈ N.
85
3. Limites y continuidad.
2. Tomando la función f del ejemplo anterior definida en el conjunto [a, ∞),
donde a > 0, resulta ser una función uniformemente continua. Para ver
esto, nótese que, para x, y ∈ [a, ∞) arbitrarios, x1 < a1 y y1 < a1 .
Luego, para toda ε > 0, tomando δ = ε a2 y |x − y| < δ, se tiene que
|f (x) − f (y)| =
y −x
1
|y − x|
ε a2
1
=
<
<
= ε.
−
x
y
xy
a2
a2
Como el valor δ no depende de la elección del punto, se sigue que la
función es uniformemente continua.
3. Sea g : (a, b) −→ R una función diferenciable tal que |g 0 (x)| ≤ M , para
toda x ∈ (a, b). Se afirma que g es uniformemente continua. En efecto,
por el teorema del valor medio, si x, y ∈ (a, b) de tal forma que x < y,
entonces existe un punto x0 ∈ [x, y] de tal modo que se cumple que
g (y) − g (x) = g 0 (x0 ) (y − x).
Por tanto, obtenemos que
|g (y) − g (x)| ≤ M |y − x|.
ε
Ası́, para cada ε > 0 definimos δ = M
y si |y − x| < δ, se sigue que
|g (x) − g (y)| < ε, quedando demostrada la afirmación.
4. Sea h (x) = sin x, donde x ∈ R. Como |h0 (x)| = | cos x| ≤ 1, por el
ejemplo anterior, se sigue que h es uniformemente continua.
5. Sea r (x) = sin (x2 ), tomando x ∈ R. Esta función no es uniformemente
continua ya que, por el teorema del valor medio, suponiendo que x < y,
se tiene que
| sin (x2 ) − sin (y 2 )| = |2x0 cos (x20 )| |x − y|,
donde x0 ∈ [x, y]. De esta forma, la elección del valor δ dependerá del
punto x0 . Este ejemplo muestra que, en general, una función continua y
acotada en todo R no es uniformemente continua.
1
2
6. Sea f (x, y) = x2 +
y 2 definida en D = R − {(0, 0)}. Esta función
es continua en D, sin embargo, no es uniformemente
continua.
A saber,
tómese ε = 1 y las sucesiones xn = √1n , 0 y x0n = 0, √n1+ 2 . Es
claro que d (xn , x0n ) −→ 0 cuando n −→ ∞, sin embargo
|f (xn ) − f (x0n )| = |n − (n + 2)| = 2 > 1.
El siguiente resultado establece una condición suficiente para la continuidad
uniforme para funciones definidas en Rn .
86
3.4. Continuidad uniforme
Definición 40 Sea f : C ⊆ Rn −→ Rm . Se dice que f es una función de
Lipschitz en C, si existe una constante k > 0 (constante de Lipschitz para f )
tal que para cualesquiera x, y ∈ C, se satisface que
||f (x) − f (y)|| ≤ k ||x − y||.
Proposición 3.3.1 Sea una función f : C ⊆ Rn −→ Rm una función de
Lipschitz en C. Entonces f es uniformemente continua en C.
Demostración. Sea k > 0 la constante de Lipschitz para f . Dado ε > 0,
definimos δ = kε y tomando x, y ∈ C tal que ||x − y|| < δ, obtenemos que
||f (x) − f (y)|| ≤ k ||x − y|| < ε.
Si consideramos la función f (x) =
tomando x ∈ (0, a), a > 0, resulta
que esta función no es uniformemente continua y no se puede extender a una
función continua en el intervalo [0, a] ya que f no es acotada. Sin embargo,
vimos que al tomar un intervalo de la forma [a, b], donde a > 0, la función se
vuelve uniformemente continua (de hecho, si consideramos el intervalo [a, ∞) la
función es uniformemente continua). El siguiente resultado establece la relación
entre funciones continuas definidas sobre compactos y la continuidad uniforme.
1
x,
Teorema 3.3.2 Sean (X, d) y (Y, d0 ) espacios métricos, f : X −→ Y una
función continua y supóngase que X es compacto. Entonces f es uniformemente continua en X
Demostración. Sea ε > 0. Como f es continua, para cada x ∈ X, existe
δx > 0 tal que
f (Bδx (x)) ⊂ B 2ε (f (x)).
Por otra parte, la colección de conjuntos {Bδx }x ∈ X es una cubierta de X. Dado
que X es un conjunto compacto, entonces X es secuencialmente compacto, por
lo que, aplicando el Lema 2.4.6, existe un valor δ > 0 tal que para cada x ∈ X,
Bδ (x) ⊂ Bδy0 (y0 ),
para alguna y0 ∈ X. Nótese que el número δ no depende de x, sino de la
cubierta. De esta forma, si z ∈ Bδ (x), entonces z ∈ Bδy0 (y0 ), por lo que
d0 (f (z), f (x)) ≤ d0 (f (z), f (y0 )) + d0 (f (y0 ), f (x)) <
Por tanto, f (Bδ (x)) ⊂ Bε (f (x)).
ε
ε
+
= ε.
2
2
87
3. Limites y continuidad.
3.4.
Espacios vectoriales normados dimensionalmente finitos
En el capı́tulo anterior, vimos que para Rn se pueden definir diferentes funciones
que resultan ser normas. También vimos que estas normas son equivalentes, es
decir, la estructura topológica de Rn es la misma. En general, una norma sobre
un espacio vectorial dimensionalmente finito depende de la elección de la base.
En esta sección analizaremos la equivalencia entre diferentes normas en espacios
vectoriales dimensionalmente finitos.
Sea V un espacio vectorial y sean ||·|| y ||·||0 dos normas sobre V . Diremos
que || · || es equivalente a || · ||0 (lo cual denotamos por || · || ∼ || · ||0 ), si existen
valores a, b > 0 tales que, para toda v ∈ V ,
a ||v||0 ≤ ||v|| ≤ b ||v||0 .
Recordemos que una norma induce una métrica, a saber, para cualesquiera
v, w ∈ V , definimos la función d : V × V −→ R+ ∪ {0} como
d (v, w) = ||v − w||.
Gracias a la teorı́a de sucesiones que desarrollamos en el capı́tulo anterior para
espacios métricos y las propiedades de funciones continuas, observamos que la
función || · || : V −→ R+ ∪ {0} es continua. Esto se sigue ya que, si vn −→ v
en V , entonces por la desigualdad del triángulo para la norma, se sigue que
|||vn || − ||v||| ≤ ||vn − v|| < ε,
para n suficientemente grande. Ası́, ||vn || −→ ||v||, de donde se concluye que
|| · || es continua.
El siguiente resultado muestra que en un espacio vectorial con dos normas
equivalentes, las propiedades de espacio métrico son las mismas.
Proposición 3.4.1 Sean V un espacio vectorial, ||·|| y ||·||0 normas sobre V
y d y d0 respectivamente las métricas inducidas por estas normas. Supóngase
que existe K > 0 tal que ||v|| ≤ K ||v||0 para todo v ∈ V y sea {vn } una
sucesión en V .
a) Si {vn } converge a v en el espacio métrico (V, d0 ), entonces {vn } converge a v en el espacio métrico (V, d).
b) Si {vn } es de Cauchy en el espacio métrico (V, d0 ), entonces {vn } es de
Cauchy en el espacio métrico (V, d).
Demostración. Demostraremos a), dejando la demostración de la otra afirmación como ejercicio para el lector. Sea ε > 0. Entonces, existe N ∈ N tal
ε
, si n ≥ N . Ası́, si n ≥ N , se tiene que
que ||vn − v||0 < K
||vn − v|| ≤ K ||vn − v||0 < ε.
Por tanto, {vn } converge a v en (V, d).
88
3.4. Espacios vectoriales normados dimensionalmente finitos
Corolario 3.4.2 Sean V un espacio vectorial, ||·|| y ||·||0 normas equivalentes
sobre V , d y d0 respectivamente las métricas inducidas por estas normas y
{vn } una sucesión en V .
a) {vn } converge a v en el espacio métrico (V, d0 ), si y sólo si {vn } converge
a v en el espacio métrico (V, d).
b) {vn } es de Cauchy en el espacio métrico (V, d0 ), si y sólo si {vn } es de
Cauchy en el espacio métrico (V, d).
c) (V, d) es completo si y sólo si (V, d0 ) es completo.
Demostración. Demostraremos a) y c), dejando b) como ejercicio. Como
|| · || ∼ || · ||0 , entonces existen m, M > 0 tales que m ||v|| ≤ ||v||0 ≤ M ||v||,
para toda v ∈ V .
De esta forma, dado que ||v||0 ≤ M ||v|| para toda v ∈ V , si vn −→ v
en (V, d), por la Proposición 3.4.1, vn −→ v en (V, d0 ). Obsérvese que ||v|| ≤
1
0
m ||v|| para todo v ∈ V , por lo que, aplicando un argumento similar, queda
demostrado a).
Ahora, supongamos que (V, d) es completo y sea {vn } una sucesión de
Cauchy en el espacio métrico (V, d0 ). Por b), {vn } es de Cauchy en (V, d) y,
por tanto, convergente. Por a), se sigue que {vn } es convergente en (V, d0 ), de
donde se concluye que (V, d0 ) es completo. El converso es cierto por simetrı́a.
Si V es un espacio vectorial dimensionalmente finito sobre R (o sobre C),
con base β = {v1 , ..., vn }, entonces la función || · ||∗ : V −→ R+ ∪ {0} dada
por
! 12
∗
n
n
X
X
λi vi
=
|λi |2
||v||∗ =
,
i=1
i=1
es una norma (ejercicio), donde λi ∈ R (o en C) son los escalares que expresan
a v en términos de la base β. Esto muestra que V tiene al menos una norma.
El siguiente resultado muestra que cualquier otra norma sobre V es equivalente
a esta norma.
Teorema 3.4.3 Sean V un espacio vectorial dimensionalmente finito sobre R
(o C), β = {v1 , ..., vn } una base para V y || · || una norma definida en V .
Entonces, || · || ∼ || · ||∗ .
Demostración. Sea
M =
n
X
i=1
! 12
2
||vi ||
.
89
3. Limites y continuidad.
Como β es una base, se sigue que M > 0. Luego
n
X
λ i vi
i=1
≤
=
n
X
i=1
n
X
i=1
≤
||λi vi ||
|λi | ||vi ||
n
X
i=1
= M
! 12
n
X
2
|λi |
n
X
i=1
! 21
2
||vi ||
∗
.
λ i vi
i=1
Ahora, sea f : Rn −→ R (se puede sustituir R por C), definida como
f (λ1 , ..., λn ) =
n
X
λi vi .
i=1
Nótese que esta función es continua. Por otra parte, el conjunto
S = {(λ, ..., λn ) ∈ Rn |
n
X
i=1
|λi |2 = 1},
es compacto, por lo que, por la Proposición 3.2.10, existe un punto
(µ1 , ..., µn ) ∈ S
tal que
m = f (µ1 , ..., µn ) ≤ f (λ1 , ..., λn ),
para todo (λ1 , ..., λn ) ∈ S. Si m = 0, entonces
n
X
µi vi
= 0,
i=1
de donde se concluye que
n
X
µi vi = 0,
i=1
lo cual es una contradicción al hecho de que β es una base. Por tanto, m > 0.
Además, por la definición de || · ||∗ , si ||v||∗ = 1, entonces ||v|| ≥ m. Ası́, si
x ∈ V − {0}, como
concluye que
x
||x||∗
∗
= 1, se obtiene que
||x|| ≥ m ||x||∗ ,
x
||x||∗
≥ m, de donde se
90
3.4. Espacios vectoriales normados dimensionalmente finitos
quedando demostrado el teorema.
La equivalencia de normas, en efecto, define una relación de equivalencia,
por lo que el siguiente resultado es inmediato.
Corolario 3.4.4 Sean V un espacio vectorial dimensionalmente finito sobre
R (o sobre C) y || · ||, || · ||0 dos normas definidas sobre V . Entonces, dichas
normas son equivalentes.
Ahora que ya hemos demostrado que todas las normas sobre un espacio
vectorial dimensionalmente finito son equivalentes, basta con estudiar las propiedades de espacio métrico asociadas con una norma en particular.
Nótese que si V es un espacio vectorial dimensionalmente finito sobre R, se
n
X
n
λi vi , entonces
puede crear una biyección entre V y R , a saber, si v =
i=1
v ↔ (λ1 , ..., λn ).
Como Rn es completo, se sigue que V también lo es, ya que una sucesión de
Cauchy en V define una sucesión de Cauchy en Rn y, por tanto, ésta última
será una sucesión convergente a un vector (x1 , ..., xn ) ∈ Rn . Luego, este vector
determina un elemento v0 ∈ V . De esta forma, hemos demostrado que todo
espacio vectorial dimensionalmente finito, normado, es completo.
Resulta interesante verificar el concepto de continuidad para transformaciones lineales. Para esto, definimos el concepto de transformación acotada.
Definición 41 Sea T : V → W una transformación lineal, donde V y W
son normados. Se dice que T es acotada si existe c ∈ R+ tal que para todo
v ∈ V, kT (v)kW ≤ k vkV .
Teorema 3.4.5 Sea T : V → W una transformación lineal, donde V, W son
espacios normados. Entonces las siguientes afirmaciones son equivalentes
a) T es acotada.
b) T es continua.
c) T es continua en v0 ∈ V.
Demostración. Supongamos que T es acotada; entonces, existe c ∈ R+ tal
que, para toda v ∈ V, kT (v)kW ≤ kvkV , Ası́, para cualquier v0 ∈ V y ε > 0,
tomando δ = εc se tiene que
kT (v) − T (v0 )kW = kT (v − v0 )kW ≤ ckv − v0 kV < c δ
si kv − v0 kV < δ. Por lo tanto a) implica b).
Por otra parte, b) implica c) trivialmente, por lo que demostramos c) implica
91
3. Limites y continuidad.
a). Supongamos que T es continua en v0 . Tomando ε = 1, existe δ > 0 tal
que si
kv − v0 kV < δ,
entonces kT (v) − T (v0 )kW < 1. Escribiendo N = v − v0 , se obtiene que,
si kN kV < δ, entonces kT (N )kW < 1 (T es lineal). Ahora, consideremos
δ
w; luego,
w ∈ V − {0} y definimos v = v0 + 2kwk
V
N = v − v0 =
donde kN kV =
δw
2kwkV ,
δ
2
< δ. Ası́,
δ w
δ
kT (N )kW = kT
kW =
kT (w)kW < 1,
2 kwkV
2kwkV
de donde se concluye que
kT (w)kW <
como se querı́a demostrar.
2
kwkV = ckwkV
δ
Capı́tulo 4
Diferenciación.
4.1.
Funciones vectoriales de variable escalar.
Recordemos que en el cálculo de funciones de variable real, la derivada de una
función f , se define como la función que denotaremos por f 0 , cuya regla de
correspondencia queda determinada por
f (x0 + h) − f (x0 )
h −→ 0
h
y cuyo conjunto de definición es la colección de todos los valores para los que el
lı́mite existe.
Por otra parte, al considerar una función vectorial de variable real, estamos
pensando en la representación gráfica del movimiento de una partı́cula al tiempo
t0 en R3 , por ejemplo. Es decir, una función F : R −→ Rn representa la
posición de un vector (x1 (t), ..., xn (t)) ∈ Rn , dependiendo del parámetro t.
Veamos que si F : R −→ Rn es una función vectorial de variable real, la
derivada se define de manera similar al caso real.
f 0 (x0 ) = lı́m
Definición 42 Sea F : A ⊂ R −→ Rn , una función vectorial de variable real.
Se dice que F es diferenciable en t0 ∈ A si
F (t0 + h) − F(t0 )
,
h−→0
h
existe. En este caso, lo denotaremos por F0 (t0 ) y le llamaremos la derivada de
F en t0 . Diremos únicamente que F es diferenciable, si F es diferenciable en
t0 , para toda t0 ∈ A.
lı́m
No es difı́cil ver (Ejercicio) que si se tiene una sucesión {xm }m∈ N ⊂ Rn , de
tal forma que xm −→ x ∈ Rm , donde
(n)
(n)
xm = x(1)
y
x = x(1)
m , ..., xm
m , ..., xm
(i)
entonces xm −→ xi , i ∈ {1, ..., u}. La implicación inversa también es cierta.
De esta forma, tenemos el siguiente resultado.
93
94
4.1. Funciones vectoriales de variable escalar.
Teorema 4.1.1 Si F = (f1 , ..., fn ), donde las funciones fi : A ⊂ R −→ R,
i ∈ {1, ..., n}, son diferenciables en un punto t0 ∈ A y
F0 (t0 ) = (f 0 (t0 ), ..., fn0 (t0 )).
Demostración. Por la observación anterior se tiene que
lı́m
h−→0
F (t0 + h) − fi (t0 ))
h
existe si y sólo si
fi (t0 + h) − fi (t0 ))
, i ∈ {1, ..., n}
h
existe. Por hipótesis, fi es diferenciable en t0 ∈ A. Ası́,
lı́m
h−→0
lı́m
h−→0
F (t0 + h) − fi (t0 ))
h
=
lı́m
h−→0
=
=
lı́m
h−→0
f1 (t0 + h) − f (t0 )
fn (t0 + h) − f (t0 )
, ...,
h
h
f1 (t0 + h) − f (t0 )
fn (t0 + h) − f (t0 )
, ....., lı́m
h−→0
h
h
f10 (t0 ), ....., fn0 (t0 )
Ejemplos
a) Sea f (t) = (cos t, sen t) t ∈ R. Las funciones cos t y sen t son diferenciables en todo R, ası́
f 0 (t) = (−sen t, cos t)
b) Considérese g(t) = et (1, cos t, sen t). Nótese que
g(t) = (et , et cos t, et sen t)
por lo que
g 0 (t) = (et , et (cos t − sen t), et (sen t + cos t)).
De hecho, nótese que si F (t) = (f1 (t), ....., fn (t)) es diferenciable en un
punto t0 ∈ A, entonces
F(t0 + h) − F(t0 )
h−→0
h
existe. Además, este lı́mite existe si y sólo si
lı́m
95
4. Diferenciación.
fi (t0 + h) − fi (t0 )
, i ∈ {1, ...., n}
h
existe, de donde se sigue que fi : A ⊂ R −→ R es diferenciable, para cada
i ∈ {1, ....., n}. Geométricamente, una función F : A ⊂ R −→ Rn define una
curva C en Rn . Si t0 , t0 + h ∈ D(F), donde h 6= 0, entonces el vector
lı́m
h−→0
1
F( t0 + h) − F (t0 ) = F(t0 )
h
tiene la misma dirección que el vector F(t0 + h) − F(t0 ). Cuando h −→ 0,
F0 (t0 ) se aproxima a un vector que cae en la recta tangente a la curva C en
F (t0 ) (Véase la Figura 4.1)
F (t0 )
F ′ (t
F
0)
(t 0
+
h)
−
F
)
(t 0
F (t0 + h)
Figura 4.1: Vector tangente
Definición 43 Si C es una curva descrita por la función
F : A ⊂ R −→ Rn
diferenciable en t0 y F0 (t0 ) 6= 0, entonces llamaremos a F0 (t0 ) vector tangente a la curva C en el punto F(t0 ) y a la recta
L = {F(t0 ) + aF0 (t0 )|a ∈ R}
se le conoce como recta tangente a la curva C en F(t0 ).
Esta definición de recta tangente a una curva extiende el concepto de recta
tangente a la gráfica de una función real de variable real. En efecto, para una
función f : A ⊂ R −→ R diferenciable en un punto t0 ∈ A, los puntos en su
gráfica quedan descritos por coordenadas de la forma (t, f (t)), donde t ∈ A.
Ası́, definimos una función F : A ⊂ R −→ R2 dada por F(t) = (t, f (t)), la
cual es diferenciable en t0 y
96
4.1. Funciones vectoriales de variable escalar.
F0 (t0 ) = (1, f 0 (t0 )),
por lo que la recta tangente a la curva en F(t0 ) queda descrita por el conjunto
{F(t0 ) + aF0 (t0 )| a ∈ R} = {(t0 + a, f (t0 ) + af 0 (t0 ))| a ∈ R}
Nótese que la pendiente de esta recta es f 0 (t0 ). Esto se sigue ya que los
puntos (x, y) en la recta quedan descritos por las ecuaciones paramétricas
x = t0 + a
(4.1)
y = f (t0 ) + af 0 (t0 )
(4.2)
donde a ∈ R. Despejando el parámetro a en la ecuación (4.1) y sustituyendo
en (4.2), obtenemos que
y = f (t0 ) + f 0 (t0 ) (x − t0 ),
que es la ecuación rectangular de una recta con pendiente f 0 (t0 ).
Por otro lado, sabemos que si una función f : A ⊂ R −→ R es diferenciable
en A, entonces es continua en A. Ası́, por el teorema 4.1.1 y la definición de
diferenciabilidad, se tiene el siguiente resultado.
Proposición 4.1.2 Si la función F : A ∈ R −→ Rn es diferenciable en A,
entonces F es continua en A.
Otra forma para denotar la derivada de una función F : A ⊂ R −→ Rn en
dF
(t0 ). Al igual que en cálculo real de variable real, existen
un punto t0 es
dt
reglas para la derivada de una suma y productos por escalares.
Proposición 4.1.3 Sean F, G : A ⊂ R −→ Rn y f : A ⊂ R −→ R
funciones diferenciables sobre A. Entonces F±G, F·G, f F son diferenciables
sobre A, donde
a)
d(F ± G)
dF dG
=
±
dt
dt
∂t
dG
dF
d(F · G)
= F·
+G
dt
dt
dt
d(f F)
dF
df
c)
= f
+
(F)
dt
dt
dt
b)
d) Además, si n = 3, F × G es diferenciable y
d(F × G)
dG
dF
= F×
+
×G
dt
dt
dt
97
4. Diferenciación.
Demostración. Probaremos b) y d), dejando la demostración de los demás
incisos como ejercicio para el lector. Si
F(t) = (f1 (t), ....., fn (t))
G(t) = g1 (t), ...., gn (t)
y
entonces
(F · G)(t) =
n
X
fi (t) gi (t).
i=1
Como F y G son diferenciables sobre A, entonces fi y gi son diferenciables
sobre A, i ∈ {1, ....., n}. Ası́
d (F · G)(t)
dt
=
n
X
fi0 (t) gi0 (t) + gi0 (t) fi (t)
i=1
=
n
X
fi0 (t) gi (t) +
i=1
=
n
X
gi0 (t)fi (t)
i=1
dG
dF
· G (t) + F ·
(t)
dt
dt
como se querı́a demostrar. Ahora si F = (f1 , f2 , f3 ) y G = (g1 , g2 , g3 )
entonces
F × G = (f2 g3 − f3 g2 , f3 g1 − f1 g3 , f1 g2 − f2 g1 ),
de donde se sigue que
d(F × G)
=
dt
(f2 g30 + f20 g3 − f30 g2 − f3 g20 , f3 g10 + f30 g1 − f10 g3 − f1 g30 , f1 g20 + f10 g2 − f2 g10 − f20 g1 )
=
(f2 g30 − f3 g20 , f3 g10 − f1 g30 , f1 g20 − f2 g10 )
+
(g3 f20 − g2 f30 , g1 f30 − g3 f10 , g2 f10 − g1 f20 )
=
dG
dF
F×
+
×G
dt
dt
Recordemos que si f : A ⊂ R −→ R y g : B ⊂ R −→ R son funciones diferenciables en A y en B respectivamente y f (A) ⊆ B, entonces la composición
(g ◦ f ) es diferenciable en A y
df
dg
d(g ◦ f )
=
(t) (f (t)).
dt
dt
dt
A este resultado se le conoce como regla de la cadena. Pues bien, si
F : B ⊂ R −→ Rn
y
f (A) ⊆ B,
98
4.1. Funciones vectoriales de variable escalar.
donde F es diferenciable en B, se tiene un resultado análogo, cuya prueba se
deja como ejercicio al lector.
Teorema 4.1.4 (Regla de la cadena) Sean
F : B ⊂ R −→ Rn
y
f : A ⊂ R −→ R
funciones diferenciables sobre B y A respectivamente, de tal forma que f (A) ⊆
B. Entonces F ◦ f es diferenciable sobre A y
df
dF
d(F ◦ f )
=
(t)
(f (t)) .
dt
dt
dt
Figura 4.2: Gráfica de f (x) = ±
q
x3
1−x
Ejemplos
a) Considérese la función F(t) =
t2
t3
1+t2 , 1+t2 .
t3
f2 (t) = 1+t
2
Nótese que f1 =
t2
t2 +1
es
una función par, mientras que
es impar. De esta forma,
podemos concluir que la curva definida por la función F es simétrica con
respecto al eje x. Ahora, los vectores tangentes a la curva quedan descritos
por la ecuación
2t
t4 + 3t2
t
F0 (t) =
,
=
(2, t3 + 3t).
(1 + t2 )2 (1 + t2 )2
(1 + t2 )2
99
4. Diferenciación.
Si t < 0, entonces, el vector tangente tiene la misma dirección que el
vector (−2, −(t3 + 3t)), mientras que si t > 0, F 0 (t) tiene la misma
dirección que el vector (2, t3 + 3t). Obsérvese que
lı́m (−2, −(t3 + 3t)) = (−2, 0) y
t −→ 0−
lı́m (2, t3 + 3t) = (2, 0)
t −→ 0+
esto es, en (0, 0) la gráfica de la función presenta una cúspide. Además
nótese que lı́m f1 (t) = 1 y lı́m f2 (t) = ∞, por lo que la gráfica
t−→∞
t−→∞
de la función es como lo muestra la Figura 4.2. De hecho, podemos da la
ecuación rectangular de esta curva observando que
y =
t3
= t
1 + t2
t2
1 + t2
= xt,
de donde se sigue que
2
x =
t
=
1 + t2
1
y 2
x
2
+ xy
s
⇔ y= ±
x3
1−x
b) Sea F : A ⊂ R −→ Rn una función diferenciable y supongamos que
kFk = c, c ∈ R constante, para toda t ∈ A. Luego, obsérvese que
F · F = kFk2 = c2 , por lo que aplicando la proposición 4.1.3 se sigue que
F · F0 = 0,
es decir F(t) y F0 (t) son ortogonales
2
t3
t
,
c) Sean F(t) =
y f (t) = cos t, t ∈ R. Por el Teorema
1 + t2 1 + t2
4.1.4, se sigue que
d(F ◦ f )
(t)
dt
df
dF
(t)
(f (t))
dt
dt
2 cos t
cos4 t + 3 cos2 t
= (− sin t)
,
(1 + cos2 t)2
(1 + cos2 t)2
−2sen t cos t −sen t (cos4 t + 3cos2 t)
,
=
(1 + cos2 t)2
(1 + cos2 t)2
=
El siguiente resultado generaliza el teorema del valor medio para funciones vectoriales de variable real.
Teorema 4.1.5 (Del Valor Medio I) Sea F : [a, b] −→ Rn una función
continua sobre [a, b] y diferenciable sobre (a, b). Entonces existen valores ci ∈
(a, b) i ∈ {1, ..., n} tales que
F(b) − F(a) = (b − a) (f10 (c1 ), ...., fn0 (cn ))
100
4.1. Funciones vectoriales de variable escalar.
Demostración. Como F es continua en [a, b] y diferenciable en (a, b), entonces fi es continua en [a, b] y diferenciable en (a, b). Luego, por el teorema
del valor medio para funciones reales de variable real, se sigue que existen valores
ci ∈ (a, b) tal que
fi (b) − fi (a) = (b − a)(fi0 (ci )),
de donde se sigue el resultado.
Para una función F : A ⊂ R −→ Rn y puntos t0 , t0 + h ∈ A, llamaremos
incremento de F en t0 correspondiente al valor h al vector de la forma
∆h F(t0 ) = F(t0 + h) − F(t0 ).
Ası́, si F es diferenciable en t0 , se tiene que
∆h F(t0 ) = F(t0 + h) − F(t0 ) = hF0 (t0 ) + hϕh (t0 ),
donde
ϕh (t0 ) =
F(t0 + h) − F(t0 )
− F0 (t0 ).
h
Como ϕh (t0 ) −→ 0 conforme h −→ 0, se concluye que ∆h F(t0 ) ≈ hF0 (t0 )
cuando h es suficientemente pequeño.
F (t0 )
Dh F
(t0 )
∆h
F
)
(t 0
h ϕh (t0 )
F (t0 + h)
0
Figura 4.3: Diferencial de F en t0
Definición 44 Sea F : A ⊂ R −→ Rn una función diferenciable. Se define
la diferencial de F en t0 correspondiente al incremento de h, denotado por
Dh F(t0 )
Dh F(t0 ) = hF 0 (t0 ).
101
4. Diferenciación.
De esta forma, para h suficientemente pequeño, se tiene que
F(t0 + h) = F(t0 ) + ∆h F(t0 ) ≈ F(t0 ) + Dh F(t0 ).
(4.3)
Nótese que si F0 (t0 ) 6= 0, entonces Dh F(t0 ) es un vector paralelo al vector
tangente a la curva C, descrita por F(t), en el punto F(t0 ) (Véase la Figura
4.3)
Una forma de simplificar la notación, es escribir dt en lugar de h, lo cual
representa un incremento en el parámetro t y en lugar de Dh F(t), abreviar
por d F, de donde obtenemos la notación reveladora
dF = F0 (t) dt,
de donde se sigue que F0 (t) = dF
dt .
Con esta notación tenemos que
dF = F0 (t)dt = (f1 (t)dt, ....., fn (t)dt),
esto es
dF = (df1 , ....., dfn ).
Por la definición de diferencial y las reglas (ya demostradas) para la derivada,
se tienen las siguiente propiedades:
a) d(F ± G) = dF ± dG
b) d(F · G) = (dF · G) + (G · dF)
c) d(F × G) = (dF × G) + (F × dG)
d) ∂(f F) = f (∂F) + (∂f )F
e) d(F ◦ f ) = (F0 ◦ f ) df
4.2.
4.2.1.
Funciones escalares de variable vectorial
Derivada y diferencial
En esta sección, estudiaremos la derivada y la diferencial de las funciones escalares de variable vectorial. Para esto, recordemos nuevamente la idea de la
diferenciabilidad para funciones escalares de variable real. Si f es una función
diferenciable en un punto t0 , entonces
f 0 (t0 ) = lı́m
h−→0
existe. Definiendo ϕh (t0 ) =
f (t0 + h) − (t0 )
,
h
f (t0 +h) − (t0 )
h
− f 0 (t0 ), h 6= 0 se obtiene que
f (t0 + h) = f (t0 ) + f 0 (t0 )h + h ϕ(t0 ),
102
4.2. Funciones escalares de variable vectorial
donde
lı́m h ϕh (t0 ) = 0
h−→0
Nótese la similitud con la ecuación (4.3). Nuevamente, al valor f 0 (t0 )h lo
llamaremos diferencial de f en t0 con incremento h. En general, diremos que
f : A ⊂ R −→ R es diferenciable en t0 si existe r > 0 tal que Br (t0 ) ⊂ A y
existe a ∈ R (independientemente de h ) tal que para todo punto
t0 + h ∈ Br (t0 )
se cumple que
f (t0 + h) = f (t0 ) + ah + ϕh (t0 )h,
donde lı́m ϕh (t0 ) = 0; al término ah lo llamaremos la diferencial de f en t0
h−→0
con respecto al incremento h.
Tomando estas ideas como base, podremos extender el concepto de diferenciabilidad a funciones de Rn a R.
Definición 45 Sea F : A ⊂ Rn −→ R una función. Decimos que F es
diferenciable en t0 ∈ A si existe un vector a ∈ Rn (independientemente de
h) tal que para toda t0 + h ∈ Br (t0 ), r > 0
F (t0 + h) = F (t0 ) + a · h + ϕh (to ) · h
donde lı́m ϕh (t0 ) = 0. Al valor a · h lo llamaremos diferencial de F en t0
h−→0
con respecto a h y lo denotaremos por Dh F (t0 ) o simplemente por D F (t0 ).
Al vector a se le conoce como derivada de F en t0 y se denotará por D F (t0 ).
Nótese que D F (t0 ) · h = DF (t0 ), ası́ que en muchas ocasiones, cambiaremos
h por la notación (más sugerente) dt. Por tanto, D F (t0 ) · dt = DF (t0 ).
Ejemplos
a) Sea F (x, y) = x2 + xy y tómese un vector h = (h1 , h2 ) ∈ R2 ; entonces
F (x + h)
=
F (x + h1 , y + h2 )
=
(x + h1 )2 + (x + h1 )(y + h2 )
=
x2 + 2xh1 + h21 + xy + h1 y + h2 x + h1 h2
=
x2 + xy + [(2x + y)h1 + xh2 ] + h1 h1 + h1 h2
=
x2 + xy + (2x + y, x) · h + (h1 , h1 ) · h
103
4. Diferenciación.
Definiendo a = (2x + y, x) y ϕh (x) = (h1 , h1 ), se tiene que F es
diferenciable ya que
lı́m ϕh (x) = lı́m (h1 , h1 ) = (0, 0)
h−→0
h−→0
p
b) Considérese la función G(x, y) = |xy|. Se afirma que G no es diferenciable en 0. Para ver esto, nótese que, si h = (h1 , h2 ). Para ver esto,
nótese que, si h = (h1 , h2 ),
p
p
|h1 h2 | h1
|h1 h2 | h1
= G(0) +
G(h) = |h1 h2 | = 0 +
h1
h1
!
p
|h1 h2 |
Definiendo ϕh =
, 0 . Obtenemos que
h1
p
G(h) − G(0) = h · ϕh (0),
por lo que, al parecer, G es diferenciable en 0; sin embargo,
lı́m ϕh (0) = lı́m
h−→0
h−→0
!
p
|h1 h2 |
,0
h1
no existe.
Teorema 4.2.1 Si F : A ⊂ Rn −→ R es diferenciable en t0 ∈ A, entonces
F es continua en t0 .
Demostración. Como F es diferenciable, existe un vector a ∈ Rn tal que
para cualquier punto t0 + h ∈ Br (t0 ), r > 0, se tiene que
F (t0 + h) = F (t0 ) + a · h + ϕh (t0 ) · h,
luego cuando h −→ 0 se tiene que
lı́m F (t0 + h) = F (t0 ),
h−→0
de donde se sigue el resultado
El siguiente resultado muestra que la suma y el producto de funciones diferenciables, es diferenciable
Teorema 4.2.2 Si F y G son funciones diferenciables en un punto t0 ∈ Rn ,
entonces F ± G y F G son diferenciables en t0 . Además
a) D(F ± G)(t0 ) = DF (t0 ) ± DG(t0 )
b) D(F G)(t0 ) = G(t0 ) (DF (t0 )) + F (t0 )(DG(t0 ))
104
4.2. Funciones escalares de variable vectorial
Demostración. Verificamos la validez del teorema para el producto, dejando
la verificación de la suma como ejercicio para el lector. Como F y G son
diferenciables, existen vectores a1 y a2 y un valor r > 0, tales que para todo
t0 + h ∈ Br (t0 ), se cumple que
F (t0 + h) = F (t0 ) + a1 · h + ϕh (t0 ) · h
y
G(t0 + h) = G(t0 ) + a2 · h + ψh (t0 ) · h
donde lı́m ψh (t0 ) = 0 = lı́m ϕh (t0 ). Luego,
h−→0
(F G)(t0 + h)
h−→0
=
(F (t0 ) + a1 · h + ϕh (t0 ) · h)(G(t0 ) + a2 · h + ψh (t0 ) · h)
=
(F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h
+
[F (t0 )ψh (t0 ) + (a1 · h)a2 + (a1 · h) ψh (t0 ) + G(t0 )ϕh (t0 ))
+
(a2 · h) ϕh (t0 ) + ϕh (t0 ) ψh (t0 )] · h
=
(F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h + τh (t0 ) · h.
Nótese que lı́m τh (t0 ) = 0, de donde se sigue que f g es diferenciable en t0 y
h−→0
D(F G)(t0 ) = )G(t0 )(DF (t0 ) + F (t0 )(DG(t0 ))
que era lo que se querı́a demostrar.
Falta ver que la composición de funciones diferenciables, es una función
diferenciable.
Teorema 4.2.3 (Regla de la cadena II) Si G : A ⊂ R −→ Rn es una
función diferenciable en t0 y F : Rn −→ R es diferenciable en G (t0 ), entonces F ◦ G es diferenciable en t0 y
d
dG
(F ◦ G)(t0 ) = DF (G(t0 )) ·
(t0 )
dt
dt
Demostración. Como G es diferenciable en t0 , para alguna r > 0 y para
cualquier (t0 + h) ∈ Br (t0 ), se tiene que
G(t0 + h) = G(t0 ) + v(t0 , h),
105
4. Diferenciación.
donde v(t0 , h) = hG0 (t0 ) + hψh (t0 ). Por otro lado, como F es diferenciable
en G(t0 ), existe s > 0 tal que para todo (G(t0 ) + h) ∈ Bs (G(t0 )) existe un
vector a = D F (G(t0 )) de tal forma que
F (G(t0 ) + h) = F (G(t0 )) + a · h + ϕh (G(t0 )) · h
Como G es continua, se puede elegir r de tal manera que
G(Br (t0 )) ⊂ Bs (G(t0 )).
Ası́ tenemos que
(F ◦ G)(t0 + h)
=
F [G(t0 ) + v(t0 , h)]
=
F (G(t0 )) + DF (G(t0 )) · v(t0 , h)
+
v(t0 , h) · ϕv(t0 , h) (G(t0 ))
=
F (G(t0 )) + hG0 (t0 ) · DF (G(t0 )) + hτh (t0 ),
donde
τh (t0 ) = ψh (t0 ) · DF (t0 ) + [G0 (t0 ) + ψh (t0 )] · ϕv(t0 , h) (G(t0 ))
Obsérvese que lı́m τh (t0 ) = 0, de donde se obtiene que F ◦ G es diferenciable
h−→0
en t0 y
d(F ◦ G)
(t0 ) = G0 (t0 ) · DF (G(t0 ))
dt
Corolario 4.2.4 Si F, G : A ⊂ Rn −→ R son diferenciables en t0 ∈ A y
F
G(t0 ) 6= 0, entonces G
es diferenciable en t0 y
F
G(t0 )DF (t0 ) − F (t0 )DG(t0 )
D
(t0 ) =
G
G2 (t0 )
F
1
1
Demostración. Como G
= F G
y G
= (f ◦ G) donde f (y) = y1 ,
tenemos que
1
1
F
(t0 ) = (DF (t0 ))
(t0 ) + F (t0 ) D
(t0 )
D
G
G
G
=
=
=
1
+ F (t0 ) f 0 (G(t0 )) DG(t0 )
G(t0 )
1
DF (t0 )
+ −
F (t0 ) DG(t0 )
G(t0 )
(G(t0 ))2
(DF (t0 ))
G(t0 ) DF (t0 ) − F (t0 )DG(t0 )
,
(G(t0 ))2
106
4.2. Funciones escalares de variable vectorial
como se querı́a demostrar
Usando el Teorema 4.2.3 y el teorema del valor medio para funciones escalares de variable escalar, se obtiene un generalización del teorema del valor medio
para funciones reales de variable vectorial.
Teorema 4.2.5 (Del valor medio II) Si F : A ⊂ Rn −→ R es una función
diferenciable en A, donde A es un conjunto abierto que contiene un segmento
rectilı́neo que va de t0 a v 0 , entonces existe ξ0 ∈ (0, 1) tal que
F (v 0 ) − F (t0 ) = (v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 ))
Demostración. Sea G(ξ) = t0 + ξ(v 0 − t0 ) y H = F ◦ G Entonces
F (v 0 ) − F (t0 ) = F (G(1)) − F (G(0)) = H(1) − H(0).
Por el Teorema 4.2.3, H es diferenciable en (0, 1). Luego, por el Teorema del
valor medio para funciones escalares de variable escalar, se sigue que
H(1) − H(0) = H 0 (ξ0 )
para algún ξ0 ∈ (0, 1), de donde se obtiene que
F (v 0 ) − f (t0 )
=
d(F ◦ G)
dG
(ξ0 ) =
(ξ0 ) · DF (G(ξ0 ))
dξ
dξ
=
(v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 ))
4.2.2.
Derivadas direccionales y parciales.
Considérese una función escalar de variable vectorial F (x). Para disponer de
una imagen geométrica, iniciamos nuestra discusión para funciones definidas
en R2 , aunque los resultados se presentan en su versión general. En principio,
supóngase que en la función F (x, y) se efectúa un cambio en las variables
independientes. La primera pregunta que viene a la mente es:
“¿Cuál es la razón de cambio de la función respecto a dichas variaciones? ”
En general, en un punto de su dominio, la función F no tendrá una razón
de cambio única, sino que cambiará en proporciones distintas dependiendo de la
dirección en que el punto (x, y) se mueva. Ası́, para la función F en el punto
t0 y dado un vector unitario u, la razón de cambio de F en la dirección u,
está dada por
lı́m
h−→0
F (t0 + h u) − F (t0 )
,
h
107
4. Diferenciación.
F ( t0 + h u )
F ( t0 )
t0
u
t0 + h u
Figura 4.4: Concepto de derivada direccional
Dada una función f (x1 , ..., xn ), supongamos que se realiza un cambio arbitrario en los valores de sus variables independientes. Luego, uno se preguntarı́a
sobre cuál es la razón de cambio de la función respecto a dicha variación. No
debe ser dificil para el lector observar que la razón de cambio de una función
F : A ⊆ Rn −→ R en la dirección v, en el punto t0 ∈ A, donde v, es un
vector vector unitario, está dada por
lı́m
h−→0
F (t0 + hv) − F (t0 )
.
h
Véase la Figura 4.5.
Esta razón de cambio se conoce como derivada direccional de F en t0 en
la dirección del vector v.
Definición 46 La derivada direccional de F : A ⊆ Rn −→ R en t0 ∈ A en
la dirección de un vector unitario v ∈ Rn es la función, que denotaremos por
Dv F , dada por
Dv F (t0 ) = lı́m
h−→0
F (t0 + hv) − F (t0 )
,
h
108
4.2. Funciones escalares de variable vectorial
cuyo dominio son todos aquellos puntos donde este lı́mite existe.
Obsérvese que Dv F (t0 ) depende de los valores de la función F sobre el
conjunto
L = {t0 + hv|h ∈ R}.
F (t0 + h u)
F (t0 + h u) − F (t0 )
F (t0 )
h
F (t0 )
t0
υ
u
A
F (t0 + h u)
t0 + h u
t0 + h u
Figura 4.5: Razón de cambio en la dirección de un vector u para una función
F : R2 −→ R
Ası́, si definimos f (h) = F (t0 + hv), se tiene una función real de variable
real, cuya gráfica corresponde a la intersección de la función F con un plano
que contiene la recta que pasa por t0 y es paralela a v. Luego
Dv F (t0 ) =
=
=
lı́m
F (t0 + hv) − F (t0 )
h
lı́m
f (h) − f (0)
= f 0 (0)
h
h−→0
h−→0
109
4. Diferenciación.
Ejemplos
a) Consideremos la función 3xy + x2 y 3 . Se requiere calcular la
derivada
direccional de F en el punto (3, 2) y en la dirección v = √12 , √12 .
Para esto, consideremos el siguiente lı́mite.
F ((3, 2) + h
lı́m
1
√1 , √
2
2
− F (3, 2)
h
h−→0
3
h2
2
=
=
+
5h
√
2
+ 6
+
9 +
6h
√
2
+
h2
2
8 +
12h
√
2
+
6h2
2
+
h3
3
22
− 90
h
171
√
2
b) Considérese la función g(x, y) = 9x2 sin y. Se quiere encontrar la razón
de cambio de G en elpunto x0 = (−1, 6) en la dirección del vector uni-
tario v = √334 , √534 . Para realizar este cálculo consideremos la función
escalar f : R −→ R dada por
5h
3h
√
√
, x2 +
= F x1 +
34
34
2
3h
5h
= 9 x1 + √
sin x2 + √
34
34
f (h) = F (x + hv)
Luego, calculando la derivada de esta función, se sigue que
0
3h
5h
54
√
x1 + √
sin x2 + √
34
34
34
2
45
3h
5h
√
√
√
x1 +
cos x2 +
,
34
34
34
f (h)
=
+
Por lo que, evaluando en 0 se obtiene
54
45
f 0 (0) = √ x1 sin x2 + √ x21 + cos x2
34
34
Evaluando en x0 , obtenemos
54
45
Dv F (x0 ) = − √ sin 6 + √ cos 6.
34
34
110
4.2. Funciones escalares de variable vectorial
c) Sea
H(x) =







x2 y
+ x4
y2
0
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
Calcularemos la derivada direccional de H en (0, 0) en la dirección de un
vector v arbitrario, digamos v = (v1 , v2 ). Entonces
Dv H(0, 0)
=
=
=
F (hv1 , hv2 ) − F (0, 0)
h−→0
h
lı́m
lı́m
h3 v12 v2
v 2 v2
= lı́m 2 1 2 4
4
4
h−→0 v2 + h v1
+ h v1 )
2
h−→0 h(h2 v2
v12
.
v2
Este lı́mite existe para todo vector de la forma (v1 , v2 ), donde v2 6= 0.
Por otra parte, nótese que para vectores de la forma (v1 , 0), se tiene que
F (v1 , 0) = 0, por lo que se puede definir la derivada direccional de H
en cualquier dirección como
 2
v


 1
v2
Dv H(0, 0) =



0
si v2 6= 0
si v2 = 0
Por otro lado, nótese que esta función no es diferenciable, ya que ni siquiera
es continua (considere las trayectorias y = x2 y y = 0).
Este ejemplo muestra que puede suceder que las derivadas direccionales existan en cualquier dirección, pero la función no sea diferenciable. El recı́proco se
cumple en general.
Teorema 4.2.6 Ses F : A ⊂ Rn −→ R una función diferenciable en t0 ∈ A.
Entonces la derivada direccional de F en t0 para cualquier vector v ∈ Rn
existe y
Dv F (t0 ) = DF (t0 ) · v
Demostración. Sea la función G : R −→ Rn , dada por
G(h) = t0 + hv,
111
4. Diferenciación.
y considérese la función H = F ◦ G. Entonces, H(h) = F (t0 + hv), de donde
se sigue que Dv f (t0 ) = H 0 (0). Por la regla de la cadena, se sigue que
H 0 (0)
=
d
dG
(F ◦ G)(0) =
(0) · DF (G(0))
dt
dt
=
v · DF (t0 )
Es importante hacer notar que la máxima razón de cambio de F se encuentra
en la dirección del vector DF (t0 ) y esta máxima razón es la longitud de este
vector. Esto se sigue ya que el producto escalar de dos vectores alcanza su valor
máximo cuando éstos están en la misma dirección. El siguiente resultado es un
teorema de valor medio para derivadas direccionales.
Teorema 4.2.7 (DEL VALOR MEDIO III) Sea F : A ⊆ Rn −→ R.
Supóngase que A contiene el segmento de recta que va de t0 a t0 + hv, donde
kvk = 1 y supóngase que Dv F (t0 ) existe para todo t ∈ A. Entonces existe
un valor ξ0 ∈ (0, 1) tal que
F (t0 + hv) − F (t0 ) = hDv F (t0 + ξ0 h v).
Demostración. Considérese la función
f (x) = F (t0 + xv), donde x ∈ [0, h].
Luego por la definición de derivada direccional se sigue que
f 0 (x) = Dv F (t0 + xv).
Ası́, f es continua en [0, h] y diferenciable en (0, h), por lo que aplicando el
teorema del valor medio para funciones reales de variable real, se tiene que
f (h) − f (0) = hf 0 (ξh)
para alguna ξ ∈ (0, 1). Por lo tanto
F (t0 + xv) − F (t0 ) = hDv F (t0 + ξ hv)
Ahora, en la definición de derivada direccional podemos considerar el vector
unitario que tiene un uno en la i-ésima entrada y ceros en las demás, es decir,
uno de los vectores de la base canónica. Cuando tomamos la derivada direccional
en la dirección del k-ésimo elemento de la base canónica, la llamaremos derivada
∂F
parcial de F con respecto a la k-ésima coordenada y la denotaremos por ∂x
k
∂F
ó Fxk . Ası́ la función ∂xk está dada por
112
4.2. Funciones escalares de variable vectorial
∂F
F (x1 , ..., xk−1 , xk + h, xk+1 , ...., xn ) − F (x1 , ..., xn )
(x) = lı́m
,
h−→0
∂xk
h
cuyo dominio es el conjunto de puntos para los que este lı́mite existe. Para calcular las derivadas parciales de una función F , podemos emplear los métodos
desarrollados para las derivadas direccionales, o bien, como el valor de la derivada parcial depende solamente de los valores de F en puntos sobre la recta
paralela al eje Xk que pasa por el punto x, podemos considerar la función
f (x) = F (x1 , ..., xk−1 , x, xk+1 , ...., xn ),
de donde se sigue que
f 0 (x) =
∂F
,
∂xk
es decir, tomamos las entradas xi , i 6= j como constantes.
Ejemplos
a) Sea F (x1 , x2 ) = x21 + x22 . Definimos f (x) = x2 + x22 y g(y) = x21 + y 2 ,
de donde se sigue que
∂F
(x1 , x2 ) = f 0 (x1 ) = 2x1
∂x1
y
∂F
(x1 , x2 ) = g 0 (x2 ) = 2x2 .
∂x2
b) Considérese G(x, y) = sin xy. Tomando a y como constante, se tiene
que
∂G
= y cos xy.
∂x
Análogamente, se obtiene que
∂G
= x cos xy
∂y
Las derivadas parciales proveen una forma sencilla para demostrar que una
función es diferenciable. Ya hemos visto que la existencia de las derivadas parciales no es suficiente para garantizar la diferenciabilidad de una función. El
siguiente resultado establece que la continuidad de las derivadas parciales es la
pieza faltante.
Teorema 4.2.8 Sea F : A ⊆ Rn −→ R una función cuyas derivadas parciales existen y son continuas sobre A, un conjunto abierto de Rn . Entonces F
es diferenciable sobre A.
113
4. Diferenciación.
Demostración. Sean t0 ∈ A y r > 0. Considérese h ∈ Br (0). Por el
Teorema 4.2.7, si t0 = (t1 , ...., tn ) y h = (h1 , ..., hn ) se tiene que
F (t0 + h) − F (t0 )
= F (t1 + h1 , ....., tn + hn ) − F (t1 , ...., tn )
= F (t1 + h1 , ....., tn + hn )
− F (t1 , t2 + h2 , ...., tn + hn )
+ F (t1 , t2 + h2 , ....., tn + hn ) − F (t1 , t2 , t3 + h3 , ...., tn + hn )
+ F (t1 , t2 , t3 + h3 , ....., tn + hn ) − F (t1 , t2 , t3 , t4 + h4 , ..., tn + hn )
..
.
F (t1 , ..., tn−1 , tn + hn ) − F (t1 , ..., tn )
= h1
+ h2
∂F
(t1 + θ1 h1 + t2 + h2 , ...., tn + hn )
∂x1
∂F
(t1 , t2 + θ2 h2 , t3 + h3 , ...., tn + hn )
∂x2
+... + hn
Como
∂F
∂xi ,
∂F
(t1 , ...., tn−1 , tn + θn hn )
∂xn
i ∈ {1, ...., n}, son funciones continuas, se tiene que
∂F
∂F
(t1 , ..., ti−1 , ti + θi hi , ti+1 + hi+1 , ..., tn + hn ) =
(t1 , ..., tn ) + ϕi h (t0 ),
∂xi
∂xi
donde
lı́m ϕi h (t0 ) = 0.
h−→0
Ası́
F (t0 + h) − F (t0 ) =
∂F
∂F
(t0 ), ...,
(t0 ) · h + ϕh (t0 ) · h,
∂x1
∂xn
donde ϕh (t0 ) = (ϕ1 h (t0 ), ..., ϕn h (t0 )), por lo que se concluye que F es diferenciable y más aún
∂F
∂F
DF (t0 ) =
(t0 ), ....,
(t0 )
x1
∂xn
Si F tiene derivadas parciales continuas, al vector derivada en t0 lo denotaremos por ∇ F (t0 ) y lo llamaremos vector gradiente de F en t0 . Si al vector
114
4.2. Funciones escalares de variable vectorial
h lo denotamos por dt, obtenemos la siguiente notación (más sugerente) para
la diferencial de F
dF (t0 )
= D F (t0 ) · dt
= ∇ F (t0 ) · dt
=
n
X
∂F
(t0 ) dxi .
∂xi
i=1
Por el Teorema 4.2.6, se sigue que la derivada direccional de F en la dirección
de un vector unitario v, si F es diferenciable, está dada por
Dv F (t0 ) = ∇ F (t0 ) · v
Ejemplos
a) Sea F (x, y, z) = exy + sin z − xyz. Nótese que
∂F
= xexy − xz
∂y
∂F
= yexy − yz,
∂x
y
∂F
= cos z − xy
∂z
son funciones continuas, por lo que la función es diferenciable y
D F = ∇F.
Más aún, la diferencial de F tiene la forma
dF
=
∂F
∂F
∂F
dx +
dy +
dz
∂x
∂y
∂z
=
(yexy − yz)dx + (xexy − xz)dy + (cos z − xy)dz
b) Como DF (t0 ) es el vector en la dirección de la máxima razón de cambio
de F , donde ésta es la longitud de DF (t0 ), se sigue que el gradiente es el
vector que tiene la dirección y la magnitud de la razón de cambio máxima
de la función. Ası́, si F (x, y, z) = sin xy + x2 z, en el punto (2, 3, 1), la
razón de cambio máxima está en la dirección del vector gradiente en el
punto (2, 3, 1). Esto es
∇ F(2,3,1)
=
(y cos xy + 2xz, x cos xy, x2 )|(2,3,1)
=
(3 cos 6 + 4, 2 cos 6, 4) = u
115
4. Diferenciación.
La magnitud de la razón de cambio está dada por kuk.
∂F
Como la derivada parcial ∂x
es una función de Rn , se pueden tomar
k
∂F
con respecto a la i-ésima coordenada, la cual
las derivadas parciales de ∂x
k
denotaremos por
∂2F
∂xi ∂xk
De esta forma, se pueden tomar derivadas parciales de órdenes más altos.
En general,
∂2F
∂2F
(t0 ) 6=
(t0 ), i 6= k.
∂xi ∂xk
∂xk ∂xi
Para convencerse de esto, tomése la función

x2 − y 2


 xy 2
x + y2
Dv F(x, y) =



0
Luego
si (x, y) 6= (0, 0)
si (x, y) = (0, 0)
∂2F
∂2F
(0, 0) 6=
(0, 0) (Ejercicio)
∂x∂y
∂y∂x
2
∂ F
Lema 4.2.9 Sea F : A ⊆ R2 −→ R una función. Si ∂y∂x
existe en el
interior de un rectángulo R con vértices en los puntos (x0 , y0 ), (x0 + h, y0 ),
(x0 + h, y0 + k) y (x0 , y0 + k), entonces
[F (x0 + h, y0 + k) − F (x0 + h, y0 )] − [F (x0 , y0 + k) − F (x0 , y0 )] = hk
∂2F
(x, y)
∂y∂x
para algún punto (x, y) ∈ R
Demostración. Considérese la función g(x) = F (x, y0 + k) − F (x, y). Luego
g 0 (x) =
∂F
∂F
(x, y0 + k) −
(x, y)
∂x
∂x
existe sobre R. De esta forma, por el teorema del valor medio para funciones
reales de variable real se sigue que
[F (x0 + h, y0 + k) − F (x0 + h, y0 )]
− [F (x0 , y0 + k) − F (x0 , y0 )]
= g(x0 + h) − g(x0 )
= hg 0 (x)
= h
∂F
∂F
(x, y0 + k) −
(x, y0 ),
∂x
∂x
116
4.2. Funciones escalares de variable vectorial
para algún x ∈ (x0 , x0 + h). Nuevamente, por el teorema del valor medio
aplicado a ∂F
∂x , existe y ∈ (y0 , y0 + k) tal que
∂F
∂F
∂2F
h
(x, y0 + k) −
(x, y0 ) = hk
(x, y)
∂x
∂x
∂y∂x
El siguiente resultado establece la igualdad de derivadas parciales mixtas de
un función de R2 a R.
Teorema 4.2.10 Sean F : A ⊆ R2 −→ R, r > 0 y t0 ∈ A. Si
∂2F
y
∂y∂x
∂F
∂2F
∂2F
existen en Br (t0 ) y
es continua en t0 , entonces
existe en
∂y
∂x∂y
∂x∂y
t0 y
∂F
∂2F
=
.
∂x∂y
∂y∂x
Demostración. Por definición se tiene que
∂2F
(t0 )
∂x∂y
=
=
∂F
∂F
(t0 + he1 ) −
(t0 )
∂y
∂y
lı́m
h−→0
h
lı́m
lı́m
h−→0 k−→0
[F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )]
,
hk
si este lı́mite existe, donde u = (h, k). Denotaremos por T (h, k) a la función
[F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )]
hk
∂F
existe en Br (t0 ), tomando 0 < |h| < r, lı́m T (h, k) existe. Sea
k−→0
∂y
∂2F
g(h) = lı́m T (h, k). Como
es continua en t0 , dada ε > 0, existe δ > 0,
k−→0
∂y∂x
tal que si δ ≤ r y kt − t0 k < δ, entonces
como
∂2F
∂2F
ε
(t) −
(t0 ) <
∂y∂x
∂y∂x
2
Sea
√ h ∈ R tal que 0 < |h| < δ y considérese k 6= 0 de tal forma que
h2 + k 2 < r y
|g(h) − T (h, k)| < .
2
∂2F
Por el lema 4.2.9, existe t ∈ R tal que T (h, k) =
(t). Nótese que
∂y∂x
t ∈ Bδ (t0 ),
117
4. Diferenciación.
de donde se sigue que
g(h) −
∂2F
∂2F
∂2F
(t0 ) ≤ |g(h) − T (h, k)| +
(t) −
(t0 )
∂y∂x
∂y∂x
∂y∂x
<
Por lo tanto, lı́m g(h) =
h−→0
ε
ε
+
= ε
2
2
∂2F
(t0 ), como se querı́a probar.
∂y∂x
Definición 47 Se dice que una función F es de clase C n sobre A ⊆ R2
abierto, si todas las derivadas parciales de orden n de F continuas sobre A.
Como siempre el Teorema 4.2.10 y la definición anterior se pueden generalizar
para funciones F : Rn −→ R.
Ahora, en general, para una función diferenciable, F : Rn −→ R, la derivada direccional en la dirección de un vector unitario u = (u1 , ..., un ) está dada
por
n
X
∂F
Du F (x1 , ..., xn ) = ∇ F (x1 , ..., xn ) · u =
ui .
∂
xi
i=1
Si ∇ F (x1 , ..., xn ) · u es una función diferenciable, la segunda derivada direccional tendrá la forma
Du2 F (x1 , ..., xn )
= ∇ (∇ F (x1 , ..., xn ) · u) · u
= Du
=
n
X
∂F
ui
∂ xi
i=1
n X
n
X
i=1 j=1
!
∂2 F
ui uj .
∂ xi ∂ xj
Nótese que está expresión se puede escribir en forma matricial. Esto es


∂2 F
∂2 F
∂2 F
·
·
·
2
∂ x2 ∂ x1
∂ xn ∂ x1
 ∂ x1



 ∂2 F

2
2
∂ F
∂ F

· · · ∂ xn ∂ x2 
∂ x22
 ∂ x1 ∂ x2



Du2 F (x1 , ..., xn ) = (u1 , ..., un ) 



..
..
..
..


.
.
.
.






∂2 F
∂2 F
∂2 F
·
·
·
∂ x1 ∂ xn
∂ x2 ∂ xn
∂ x2
n
u1
u2
..
.
un





118
4.3. Aplicaciones de la diferencial y la derivada parcial
Por otro lado, considérese F : Rn −→ R una función diferenciable. Su diferencial total está dada por la expresión
dF =
n
X
∂F
dxi .
∂ xi
i=1
Si se considera a d F como una función diferenciable, entonces se puede calcular
su diferencial total. Ası́, se tiene la segunda diferencial de la función F, a saber
d (d F)
n
X
∂ dF
dxj
= d (F) =
∂ xj
j=1
2
=
=
n
X
n
X
j=1
i=1
∂2 F
dxi
∂ xj ∂ xi
!
dxj
n
X ∂2 F
X
∂2 F
2
.
(dx
)
+
2
i
∂ x2i
∂ xj ∂ xi
i=1
i 6= j
De forma similar, se pueden calcular diferenciales de orden superior.
4.3.
Aplicaciones de la diferencial y la derivada
parcial
Ya hemos visto que, al igual que en el caso de funciones escalares de variable
real, la derivada direccional es la razón de cambio de una función en una dirección determinada. En el caso de las derivadas parciales, éstas representan la
razón de cambio en una dirección paralela a uno de los ejes. Las aplicaciones
de las derivadas parciales son diversas. En esta sección, nos enfocaremos en su
aplicación a la geometrı́a de superficies y algunas aplicaciones sencillas en la
fı́sica.
4.3.1.
Plano tangente y recta normal a una superficie
Considérese la superficie definida por la ecuación
z2 =
x2
+ y 2 + 1.
4
Se desea encontrar un vector normal a la superficie en el punto (−2, 3). Nótese
que la expresión anterior es equivalente a la ecuación
r
x2
z =
+ y 2 + 1.
4
Calculando las derivadas parciales de esta función y al evaluar en el punto dado,
se obtienen las pendientes de dos rectas tangentes a la superficie, las que a su vez
119
4. Diferenciación.
definen dos direcciones que son tangentes a la superficie. El producto vectorial
de estas direcciones dará como resultado un vector que será perpendicular a las
direcciones y, por tanto, a la superficie. Ası́, las derivadas parciales tienen la
forma
∂z
x
(x, y) = q
,
∂x
x2
2 + 1
4
+
y
4
∂z
y
(x, y) = q
,
∂y
x2
2 + 1
+
y
4
evaluando en el punto (−2, 3) obtenemos
∂z
−1
(−2, 3) = √ ,
∂x
2 11
∂z
3
(−2, 3) = √ ,
∂y
11
por lo que las direcciones
tangentes
a la superficiequedan determinadas
por los
1
3
√
√
vectores v1 = 1, 0, − 2 11 , en y = 3 y v2 = 0, 1, 11 , en x = −2. Ası́,
v1 × v2 =
i
j
k
1
0
− 2 √111
0
1
√3
11
=
1
3
− √ , −√ , 1 .
2 11
11
q
x2
4
+ y 2 + 1,
√
calculamos sus derivadas parciales y evaluamos en el punto (−2, 3, 11), se
tiene que
Por otra parte, si consideramos la función F (x, y, z) = z −
∂F
(x, y, z)
∂x
√
x
∂F
1
= − q
(−2, 3, 11) = − √
⇒
∂
x
x2
2
11
2
4
4 + y + 1
∂F
(x, y, z)
∂y
=
y
q
x2
4
∂F
(x, y, z)
∂x
Luego,
=
+ y2 + 1
⇒
√
∂F
3
(−2, 3, 11) = √
∂y
11
1.
√
√
√
∂F
∂F
∂F
(−2, 3, 11),
(−2, 3, 11),
(−2, 3, 11) = v1 × v2 .
∂x
∂y
∂z
Ası́, surge la siguiente pregunta:
¿Se cumple, en general, que el vector ∇ F es un vector normal a la superficie F (x, y, z) = 0?
La respuesta es afirmativa. Primero mostramos el resultado para el caso de
una función de la forma F (x, y, z) = z − f (x, y).
120
4.3. Aplicaciones de la diferencial y la derivada parcial
Proposición 4.3.1 Sea z = f (x, y) una función continua con primeras derivadas parciales continuas en una región R del plano XY . Si S es la superficie
descrita por la función f , entonces un vector normal a la superficie en el punto
(x0 , y0 , z0 ) ∈ S es ∇ F (x0 , y0 , z0 ), donde F (x, y, z) = z − f (x, y).
Demostración. La derivada parcial de f (x, y) con respecto a x en el punto
(x0 , y0 ) representa la pendiente de la recta tangente a la curva que resulta de
la intersección entre la superficie S y el plano y = y0 . Ası́, la ecuación de la
recta tiene la forma

 z − z0 = ∂∂ xz (x0 , y0 ) (x − x0 )
L1 =

y = y0 .
Por tanto, la dirección de L1 es
∂z
v1 = 1, 0,
(x0 , y0 ) .
∂x
De manera análoga, la ecuación de la recta tangente a la curva que resulta de
la intersección entre la superficie S y el plano x = x0 es

 z − z0 = ∂∂ yz (x0 , y0 ) (y − y0 )
L2 =

x = x0 ,
de donde se sigue que la dirección de L2 es
∂z
v2 = 0, 1,
(x0 , y0 ) .
∂y
Como los vectores v1 y v2 son tangentes a la superficie en el punto (x0 , y0 , z0 ),
entonces un vector normal a la superficie se puede obtener haciendo el producto
vectorial v1 × v2 . Ası́
N = v1 × v2
=
=
i
j
k
1
0
∂z
∂x
(x0 , y0 )
0
1
∂z
∂y
(x0 , y0 )
∂z
∂z
−
(x0 , y0 ), −
(x0 , y0 ), 1 = ∇ F (x0 , y0 , z0 ).
∂x
∂y
Ahora, para una superficie S descrita por la ecuación z = f (x, y) se pretende obtener las ecuaciones del plano tangente y la recta normal en el punto
121
4. Diferenciación.
P0 = (x0 , y0 , z0 ). Se sabe que la ecuación de un plano que pasa por v0 y es
ortogonal a un vector N está dada por
N · (v − v0 ) = 0.
Como N = ∇ F (x0 , y0 , z0 ) es normal a S en el punto P0 , entonces el plano
tangente a S en el punto P0 queda determinado por la expresión
∇ F (x0 , y0 , z0 ) · (v − v0 ) = −
∂z
∂z
(x0 , y0 ) (x − x0 ) −
(x0 , y0 ) (y − y0 ) + (z − z0 ) = 0.
∂x
∂y
∇ F (P0 )
P0
G′ (P0 )
Figura 4.6: Plano tangente a una superficie
Por otra parte, la ecuación de una recta en el espacio se puede calcular dando
un punto sobre la recta y la dirección de ésta última. Ası́, la ecuación de la recta
normal, en su forma vectorial, es
LN = {P0 + t ∇ F (x0 , y0 , z0 ) | t ∈ R}.
De esta forma, la ecuación del plano tangente a la superficie
z2 =
es
x2
+ y2 + 1
4
√
1
3
− √ (x + 2) + √ (y − 3) + (z − 11) = 0
2 11
11
y la recta normal queda descrita por la expresión
√
1
3
(−2, 3, 11) + t − √ , √ , 1 .
2 11
11
122
4.3. Aplicaciones de la diferencial y la derivada parcial
Ahora, considérese una función F : R3 −→ R diferenciable sobre un conjunto abierto A y S la superficie dada por
S = {(x, y, z) ∈ A | F (x, y, z) = r}.
Sean P0 (x0 , y0 , z0 ) ∈ S y P = G (t), t ∈ (a, b) la ecuación de una curva C
sobre S que pasa por P0 . De esta forma, P0 = G (t0 ), para alguna t0 ∈ (a, b).
Por otra parte, como C está contenida en S, se sigue que, para toda t ∈ (a, b),
F (G (t)) = c. Si G es diferenciable en (a, b), entonces F ◦ G es diferenciable
en (a, b) y
∇ F (G (t)) · G0 (t) = 0,
en particular, si t = t0
∇ F (P0 ) · G0 (t0 ) = 0.
Ası́, hemos demostrado que, en P0 , el gradiente de F es ortogonal al vector
tangente a cualquier curva que se encuentre sobre la superficie S y que pase
por P0 . Por tanto, si ∇ F (P0 ) 6= 0, las tangentes de todas las curvas sobre
S en el punto P0 se encuentran en el mismo plano. En consecuencia, el plano
tangente a S en el punto P0 tiene la ecuación
∇ F (P0 ) · (P − P0 ) = 0,
donde P = (x, y, z) (véase la Figura 4.6).
Ejemplo.
Sea S la superficie determinada por la ecuación
y2
x2
+
− z 2 = 1.
9
4
Calcularemos el plano tangente a S en el punto 2, 2, 32 . Para esto, consideramos la función
x2
y2
F (x, y, z) =
+
− z2,
9
4
y
la cual tiene vector gradiente 2x
9 , 2 , −2z , de donde se tiene que
2
4
4
∇ F 2, 2,
=
, 1, −
.
3
9
3
Por tanto, la ecuación del plano tangente es
4
2
4
4
4
, 1, −
· x − 2, y − 2, z −
= x + y − z − 2 = 0.
9
3
3
9
3
En otro contexto, en la práctica, el experimentador comete errores de observación que se ven reflejados en los datos que ha capturado. El error absoluto,
123
4. Diferenciación.
establece la diferencia, en valor absoluto, entre el incremento de una función
F y el valor que se obtiene por medio de la diferencial. Es decir, se tiene una
expresión de la forma
Ea = |(F (x + h) − F (x)) − dF |.
El error relativo se obtiene calculando el producto de 100 por el cociente de
el error absoluto entre el incremento de la función, a saber
Ea
Er = 100
.
F (x + h) − F (x)
Sin embargo, en la mayor parte de los casos, no se conoce el valor del incremento
exacto de F , por lo que se hace necesario redefinir el error relativo como
er = 100
dF
F
Ejemplos.
1. Supóngase que se quiere calcular el volumen aproximado del material necesario para fabricar un vaso cilı́ndrico cuyo radio interior es de 7 cm,
tiene una altura interior de 13 cm y con espesor de fondo y paredes de
0,3 cm. Nótese que el volumen exacto del material, es la diferencia entre
el volumen exterior y el volumen interior. Esto es
V (x + h) − V (x)
=
π ((x + h1 )2 (y + h2 ) − x2 y)
=
π ((7,3)2 (13,3) − (7)2 (13)) = π(71,757) cm3 .
Ahora, para calcular el volumen en forma aproximada, se requiere de la
diferencial total de la función volumen. Es decir
dV =
∂V
∂V
dx +
dy
∂x
∂y
=
π (2xy dx + x2 dy)
=
π (2 (7)(13)(0,3) + (7)2 (0,3))
≈
217,7123 cm3 .
De esta forma, los errores absoluto y relativo que se obtienen al usar la
diferencial en lugar del incremento exacto son
Ea = |π(71,757) − 217,7123| ≈ 7,7189
y
Er = 100
7,7189
225,4312
≈ 3,42
124
4.3. Aplicaciones de la diferencial y la derivada parcial
2. Se desea calcular el valor aproximado de 3,254,13 . Para resolver este
problema, consideramos la función f (x, y) = xy , tomando los valores
x = 3, y = 4, dx = 0,25 y dy = 0,13. Ahora, f (3, 4) = 81. A
este valor se le sumará el valor de la diferencial como aproximación del
incremento. Luego
df =
∂f
∂f
dx +
dy
∂x
∂y
= y xy − 1 dx + xy ln x dy
4 (3)3 (0,25) + (3)4 ln (3) (0,13) ≈ 38,568387.
=
Por tanto, 3,254,13 ≈ 119,568387.
3. Un estudiante de la facultad de ciencias está apurado (caso totalmente
hipotético) porque quiere calcular el valor de sin 35o cos 69o y no cuenta
con calculadora. En este caso, considera la función f (x, y) = sin x cos y
π
y
tomando los valores x = 30o = π6 , y = 60o = π3 , dx = 5o = 36
π
dy = 9o = 20 . Luego,
√
π π
1
3π
f
,
y df = cos x cos y dx − sin x sin y dy = −
,
=
6 3
4
180
de donde se sigue que sin 35o cos 69o ≈
4.3.2.
√
45 − 3 π
.
180
Diferenciales exactas
Si se tiene una expresión de la forma M (x, y) dx + N (x, y) dy el lector podrı́ preguntarse si existirá una función G : R2 −→ R tal que
d G = M (x, y) dx + N (x, y) dy,
es decir, ∇ G (x, y) = (M (x, y), n (x, y)). La respuesta es que en general no
siempre existe dicha función. En esta sección analizaremos las condiciones bajo
las cuales dicha función existe y proporcionar un procedimiento para obtenerla.
Definición 48 Se dice que la expresión M (x, y) dx + N (x, y) dy es una diferencial exacta sobre un conjunto abierto A ⊂ R2 , si existe una función
G : R2 −→ R tal que ∇ G (x, y) = (M (x, y), N (x, y)) para todo punto
(x, y) ∈ A.
El siguiente resultado establece una condición necesaria y suficiente para que
una forma diferencial sea exacta. En la prueba de este teorema utilizaremos un
hecho muy conocido en la teorı́a de integración múltiple, el teorema de Fubini,
cuya prueba omitimos pero se puede consultar en [8], pp. 322-324.
Teorema 4.3.2 Sea F : R2 −→ R una función continua con dominio rectangular R = [a, b] × [c, d]. Entonces
Z bZ d
Z dZ b
Z
F (x, y) dy dx =
F (x, y) dx dy =
F (x, y) dA.
a
c
c
a
R
125
4. Diferenciación.
Teorema 4.3.3 Sean M, N : A ⊂ R2 −→ R funciones tales que tienen
primeras derivadas parciales continuas en un rectángulo abierto R ⊂ R2 , con
lados paralelos a los ejes. Entonces M (x, y) dx + N (x, y) dy es una diferencial
∂N
exacta si y sólamente si ∂∂M
y (x, y) = ∂ x (x, y) para toda (x, y) ∈ R.
Demostración. Para mayor sencillez en la notación, escribiremos M y N
sólamente. Supongamos que la diferencial es exacta, esto es, existe una función
G : R2 −→ R tal que
d G = M dx + N dy,
luego
∂G
= M
∂x
y
∂G
= N,
∂y
∂M
∂2 G
=
∂y∂x
∂y
y
∂2 G
∂N
=
,
∂ x∂ y
∂x
de donde se sigue que
como las derivadas parciales son continuas, aplicando el teorema se concluye
que
∂M
∂N
=
.
∂y
∂x
∂N
Por otra parte, si ∂∂M
y = ∂ x en R, entonces, integrando de x0 a x y manteniendo constante a la variable y y aplicando el Teorema fundamental del
cálculo, se tiene que
Z x
Z x
∂M
∂N
(t, y) dt =
(t, y) dt = N (x, y) − N (x0 , y).
∂
y
x0
x0 ∂ t
Dado que la región R es rectangular, ésta es convexa y, por tanto, la igualdad
anterior se da para todo par de puntos dentro de R. Ahora, integrando con
respecto a y de y0 a y, se tiene que
Z y Z x
Z y
Z y
∂M
(t, s) dt ds =
N (x, s) ds −
N (x0 , s) ds.
y0
x0 ∂ s
y0
y0
Aplicando el Teorema 4.3.2, se obtiene que
Z y
Z y
Z xZ y
∂M
(t, s) ds dt =
N (x, s) ds −
N (x0 , s) ds,
y0
y0
x0 y0 ∂ s
de donde se sigue, por el Teorema fundamental del cálculo, que
Z x
Z x
Z y
Z y
M (t, y) dt −
M (t, y0 ) dt =
N (x, s) ds −
N (x0 , s) ds.
x0
x0
y0
y0
Por tanto,
Z
x
G (x, y) =
Z
y
M (t, y) dt +
x0
Z
y
N (x0 , s) ds =
y0
Z
x
N (x, s) ds +
y0
M (t, y0 ) dt.
x0
126
4.3. Aplicaciones de la diferencial y la derivada parcial
Ası́, derivando con respecto a x los primeros dos términos y derivando con
respecto a y los otros dos, se sigue el resultado.
Este resultado se puede generalizar para regiones convexas o regiones simplemente conexas (cf. [4], capı́tulo 6). Más aún, se puede generalizar este resultado
para expresiones de la forma
n
X
Mi dxi .
i=1
Diremos que esta forma diferencial es exacta si y sólo si se cumple que
∂ Mi
∂ Mj
=
∂ xj
∂ xi
Ejemplos.
1. Considérese la forma diferencial dada por
x
p
y
dx + p
dy.
x2 + y 2
x2 + y 2
Se afirma que es una forma exacta. En efecto, nótese que si
x
y
M (x, y) = p
y N (x, y) = p
,
2
2
2
x +y
x + y2
entonces
xy
∂M
∂N
= −
,
3 =
2
2
∂y
∂x
2
(x + y )
donde (x, y) 6= (0, 0). Ası́, integrando M con respecto a x se obtiene
que
Z
p
x
p
G (x, y) =
dx = x2 + y 2 + ϕ (y).
x2 + y 2
Derivando esta última expresión con respecto a y e igualando con la
función N (x, y) se concluye que ϕ0 (y) = 0 y por tanto,
p
G = x2 + y 2 + c,
donde c es una constante.
2. Tómese la expresión 2x cos y dx − x2 sin y + 2yz dy + y 2 dz. Si
M1 (x, y, z) = 2x cos y, M2 (x, y, z) = − x2 sin y + 2yz
y
M3 (x, y, z) = y 2 ,
127
4. Diferenciación.
verificamos si esta forma diferencial es exacta. Nótese que
∂ M1
=
∂y
−2x sin y
=
∂ M2
∂x
∂ M2
=
∂x
2y
=
∂ M3
∂y
∂ M1
∂ M3
=
0
=
.
∂x
∂z
Luego, por el Teorema 4.3.3 en su versión generalizada, se sigue que es
una diferencial exacta. Integrando M1 con respecto a x, obtenemos
Z
2x cos y dx = x2 cos y + ϕ1 (y, z) = F (x, y, z).
Derivando esta última expresión con respecto a y se sigue que
−x2 sin y +
∂ ϕ1
= − x2 sin y + 2yz,
∂y
de donde se concluye que
∂ ϕ1
= 2yz,
∂y
por lo que, integrando con respecto a y se obtiene que
ϕ (y, z) = y 2 z + ϕ2 (z).
Ası́, F (x, y, z) = x2 cos y + y 2 z + ϕ2 (z). Finalmente, derivando esta
última igualdad con respecto a z, tenemos que ϕ02 (z) = 0 y, por tanto
F (x, y, z) = x2 cos y + y 2 z + c
c = constante.
3. La diferencial dada por
−
x2
x
y
dx + 2
dy
2
+y
x + y2
satisface que, si
M (x, y) = −
entonces
x2
y
x
y N (x, y) = 2
, (x, y) 6= (0, 0),
2
+y
x + y2
∂M
∂N
(x, y) =
(x, y),
∂y
∂x
para todo punto en el plano, salvo el origen. Sin embargo, no es una
diferencial exacta, ya que al integrar las funciones
M y N se obtiene la
función multivaluada G (x, y) = arctan xy . Si se restringe el codominio
al intervalo [0, 2π) para tener una función univaluada, la función tiene
una discontinuidad sobre el eje X. Por tanto, no existe su gradiente y de
esta forma se ha demostrado que la expresión M dx + N dy no determina
una diferencial exacta.
128
4.4. Teorı́a básica de curvas
4. La forma diferencial
x
3
(x2 + y 2 ) 2
dx +
y
3
(x2 + y 2 ) 2
dy,
donde (x, y) 6= (0, 0) es exacta (ejercicio).
4.4.
Teorı́a básica de curvas
Los puntos en plano se representan con paras ordenados de números reales (a, b)
y en R3 se pueden representar como ternas de ordenadas reales. Al igual que en
R2 , se eligen tres rectas perpendiculares que se corten en un punto del espacio.
Para representar vectores en el espacio, es conveniente introducir tres vectores
especiales. A saber
i = e1 = (1, 0, 0),
j = e2 = (0, 1, 0),
y
k = e3 = (0, 0, 1).
A estos vectores se les conoce como base canónica de R3 . Luego, si
a = (a1 , a2 , a3 ) ∈ R3 ,
se tiene que
a =
n
X
ai ei .
i=1
Por otra parte, hasta el momento, hemos trabajado con curvas en donde una
de las variables queda en función de las demás. Sin embargo, hay ocasiones en
las que es más útil y cómodo pensar en los puntos de una curva en el plano (o en
el espacio), dependiendo de un parámetro t, es decir, pensar en una curva como
la trayectoria que describe un punto al tiempo hipotético t. Si las coordenadas
de un punto sobre la curva C en R3 son (x1 , x2 , x3 ), entonces se pueden
expresar como funciones de un parámetro t ∈ [a, b], esto es
x1 = x1 (t),
x2 = x2 (t),
x3 = x3 (t),
t ∈ [a, b].
Ejemplos.
a) Queremos encontrar la ecuación de una recta L que pasa por el extremo
de un vector a y tiene la dirección del vector v. Si t ∈ R, los puntos de la
forma t v son múltiplos de v y, por tanto, recorren todos los puntos por el
origen y tiene la dirección v. Como cada punto de L es el final de la diagonal
del paralelogramo con lados a y t v, para alguna t, entonces
L = {u ∈ R3 | u = a + t v},
129
4. Diferenciación.
es decir, la recta L se puede expresar mediante la ecuación (paramétrica)
L = a + tv
b) Las ecuaciones
x = r cos θ,
θ ∈ [0, 2π],
y = r sin θ,
representan los puntos sobre una circunferencia. Esto se sigue, ya que al dejar
fijo el valor r y variar el ángulo θ, obtenemos el movimiento de una partı́cula
que se encuentra a una distancia constante de un punto de la circunferencia.
y
r
θ
x
Figura 4.7: Circunferencia
c) Considérese las ecuaciones
x (t) = a cos t,
y (t) = b sin t
t ∈ [0, 2π]
Estas ecuaciones representan los puntos sobre una elipse con eje mayor a y eje
menor b (a > b), con centro en el origen, θ denota el ángulo en el centro de la
elipse que se asocia al punto de la circunferencia circunscrita que se encuentra
verticalmente por encima o por debajo del punto P = (a cos t, b sin t).
P
t
Figura 4.8: Elipse
d) Las ecuaciones
x (t) = a cos t,
y (t) = a sin t
z (t) = bt
t ∈ R
130
4.4. Teorı́a básica de curvas
donde a, b son constantes, describen una curva que yace en el cilindro
x2 + y 2 = a2
y se enrolla alrededor de éste de tal forma que cuando t toma el valor 2 k π, k ∈
Z, las coordenadas x y y regresan a su valor original mientras que z incrementa
a un valor 2 π b (véase la Figura 4.9).
a
t
Figura 4.9: Hélice enrollada en un cilindro
Algunas veces, puede resultar conveniente tomar como parámetro t a la
variable x y describir la curva mediante las funciones x = t, y = f (t). Por
ejemplo, si se tiene la ecuación de una parábola de la forma y = x2 , podemos
tomar las ecuaciones de la forma x(t) = t, y(t) = t2 .
4.4.1.
Longitud de arco
Ahora, supóngase que una curva C está descrita por las ecuaciones paramétricas (x(t), y(t), z(t)), t ∈ [a, b]. Supóngase que C es suave en el sentido
de que x0 (t), y 0 (t) y z 0 (t) son continuas y no se anulan simultáneamente. A los
puntos que cumplan esta última condición los llamaremos puntos regulares y a
los puntos donde todas las derivadas se anulan los llamaremos puntos singulares.
Esta condición, asegura que C no cambia repentinamente de dirección. Tomamos una partición del intervalo [a, b] en n subintervalos de la forma (ti + 1 , ti ),
i ∈ {1, ..., n}; de esta forma los puntos cuyas coordenadas son
xi = x (ti ),
yi = y (ti ),
z − i = z (ti ),
caen sobre C y forman un polı́gono que aproxima a C y que tiene por vértice
a los puntos Pi , i ∈ {1, ..., n}, (véase la Figura 4.10).
Ahora, nótese que la longitud l de C se puede aproximar por la longitud de
la poligonal y esta aproximación mejora conforme hacemos tender n a infinito.
Obsérvese que la distancia de Pi − 1 a Pi está dada por
p
d (Pi − 1 , Pi ) = (xi − xi − 1 )2 + (yi − yi − 1 )2 + (zi − zi − 1 )2 .
131
4. Diferenciación.
P1
P2
P0
Pn − 1
Pn
Figura 4.10: Aproximación de una curva mediante una poligonal
Como x (t), y (t) y z (t) son diferenciables, se tiene que
x0 (t) ≈
Luego
xi − xi − 1
ti − ti − 1
y 0 (t) ≈
yi − yi − 1
ti − ti − 1
z 0 (t) ≈
zi − zi − 1
.
ti − ti − 1
p
d (Pi − 1 , Pi ) ≈ (ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 .
Por tanto
l (C) ≈
n
X
i=1
p
(ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 ,
ésta útlima es una suma de Riemann para la función
p
(x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 ,
por lo que tomando el lı́mite cuando n −→ ∞, se tiene que
Z bp
l (C) =
(x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 dt.
a
Esta fórmula se conoce como longitud de arcoa de la curva C. Nótese que si
F : R −→ R3 es la función F (t) = (x (t), y (t), z (t)), entonces
Z b
Z bp
l (C) =
||F0 (t)|| dt =
F0 (t) · F0 (t) dt.
a
a
132
4.4. Teorı́a básica de curvas
Ejemplo.
Sea C una curva descrita por la función F (t) = (et sin t, et cos t), donde
t ∈ [0, 2 π]. Para calcular la longitud de esta curva consideramos
x (t) = et sin t
⇒ x0 (t) = et (sin t + cos t)
y (t) = et cos t
⇒ y 0 (t) = et (cos t − sin t),
de donde se sigue que
(x0 (t))2 + (y 0 (t))2
= e2t ((sin2 t + 2 cos t sin t + cos2 t)
+
(sin2 t − 2 cos t sin t + cos2 t))
=
2 e2t .
Luego
Z
0
2π
||F0 (t)|| dt =
Z
0
2π
√
2 et dt =
√
2 (e2 π − 1).
En general hay una cantidad infinita de representaciones paramétricas. El
siguiente teorema establece la relación que hay entre las representaciones paramétricas.
Teorema 4.4.1 Sea C una curva suave representada por las ecuaciones paramétricas x(t), y(t), z(t), t ∈ [a, b]. Esta curva puede ser reparametrizada
en términos de un parámetro u ∈ [c, d] mediante una expresión de la forma
t = f (u), si f : R −→ R satisface que
1. a = f (c) y b = f (d).
2. f 0 (u) > 0 para toda u ∈ [c, d] (ó f 0 (u) < 0 para toda u ∈ [c, d]).
3. f ∈ C 1 ([c, d]).
Demostración. El nuevo parámetro u que describirá a la curva C debe ser
tal que a cada valor de u le corresponda uno y solo uno de t . Ası́, t = f (u)
debe ser una función creciente o decreciente, de donde se sigue que f debe tener
derivada positiva o negativa respectivamente. Además, como C es una curva
133
4. Diferenciación.
suave, las funciones x0 (t), y 0 (t) y z 0 (t) deben ser continuas. También dado que
dx
(f (u)) =
du
dx dt
dt du
= x0 (t) f 0 (u)
dy
(f (u)) =
du
dy dt
dt du
= y 0 (t) f 0 (u)
dz
(f (u)) =
du
dz dt
dt du
= z 0 (t) f 0 (u),
dx dy
dz
y como f 0 (u) es continua, entonces du
, du y du
son funciones continuas en
[c, d], de donde se sigue que la curva parametrizada por u es una curva suave.
Por otro lado, si en la expresión para la longitud de arco, el extremo final
de la curva se deja variable, entonces se obtiene la longitud de arco en función
del parámetro t0 . A saber
Z t
s (t) =
||F0 (u)|| du.
a
Ası́, s = s (t) define un nuevo parámetro para la curva C, denominado parámetro de longitud de arco. En efecto, s satisface las hipótesis del Teorema 4.2.7,
ya que
Z t
d
ds
=
||F0 (u)|| du = ||F0 (t)|| > 0,
dt
dt a
de donde se sigue que existe una relaci’on biunı́voca entre s y t. También, si
C es una curva suave, ||F0 (t)|| es continua en [a, b].
Ejemplo.
Considérese la hélice circular con ecuaciones paramétricas dadas por
F (t) = (a cos t, a sin t, bt), t > 0.
Luego
t
Z
s (t)
=
0
t
Z
=
||F0 (u)|| du
p
a2 sin2 u + a2 cos2 u + b2 du
0
=
p
de donde se sigue que t =
la longitud de arco serı́a
F (s) = a cos √
a2 + b2 t,
√
s
.
a2 + b2
s
a 2 + b2
Luego, la parametrización con respecto a
, a sin
√
s
a2 + b2
, √
bs
a2 + b2
134
4.4. Teorı́a básica de curvas
Ya hemos visto con anterioridad que F0 (t) representa un vector tangente a
la curva C en todos los puntos regulares. Entonces, un vector unitario tangente
a la curva en un punto regular queda descrito por la expresión
T =
dF
dt
dF
dt
=
dF
dt
ds
dt
=
dF
,
ds
esto es, si se tiene la parametrización con respecto a la longitud de arco, el
vector tangente a la curva en un punto s0 está dado por la derivada de la
parametización evaluada en s0 .
Proposición 4.4.2
a) Un vector u (t) tiene magnitud constante si y sólo si
u (t) · u0 (t) = 0.
b) Un vector u (t) es siempre paralelo a una dirección dada si y sólo si
u (t) × u0 (t) = 0.
Demostración.
a) Sea u (t) un vector de magnitud constante c. Entonces
||u (t)||2 = u (t) · u (t) = c2 ,
luego
u (t) · u (t)
= 2 u0 (t) · u (t) = 0,
dt
por lo que se concluye que u0 (t) · u (t) = 0. Por otro lado, si ||u (t)|| no
es constante, por la parte anterior u0 (t) · u (t) 6= 0, por lo que se sigue
a)
b) Si u (t) tiene dirección constante, digamos v, entonces
u (t) = ||u (t)|| v,
ası́
u0 (t) =
d ||u (t)||
v.
dt
Por lo tanto
0
u (t) × u (t)
=
(||u (t)|| v) ×
= ||u (t)||
d ||u (t)||
v
dt
d ||u (t)||
(v × v) = 0.
dt
Por otra parte, si u (t) no tiene dirección constante, entonces
u0 (t) =
d ||u (t)||
d v (t)
v (t) + ||u (t)||
,
dt
dt
135
4. Diferenciación.
de donde se obtiene que
"
d v (t)
d ||u (t)||
u (t) × u (t) = ||u (t)|| v (t) ×
v (t) + ||u (t)||
dt
dt
"
#
d v (t)
= ||u (t)||2 v (t) ×
.
dt
#
0
Como v(t) es de magnitud constante (podemos tomarlo unitario), entonces v(t) y
resultado.
d v (t)
dt
son ortoganales, por lo que aplicando a) se sigue el
4.4.2.
Aparato de Frenet-Serret
Ahora, dada una curva con ecuaciones paramétricas x(t), y(t) y z(t), nos preguntamos ¿Cómo obtener el plano normal a la curva C en un punto P ? Esto
es, se quiere obtener el plano perpendicular al vector T. Para resolver este
problema, consideremos un punto Q arbitrario en el plano normal, con coordenadas (x, y, z). Sea P0 = (x0 , y0 , z0 ) ∈ C. Luego, el vector Q − P0 pertenece
al plano (véase la Figura 4.11).
P0
T
Q
Figura 4.11: Plano normal
136
4.4. Teorı́a básica de curvas
Como T es normal al plano, se tiene que
(Q − P0 ) · T = 0.
Si se toma la parametrización con respecto a la longitud de arco, (si no, normalizamos el vector F0 (t)) obtenemos la ecuación para el plano normal, dada
por
x0 (s) (x − x0 ) + y 0 (s) (y − y0 ) + z 0 (s) (z − z0 ) = 0.
Ahora, como T tiene magnitud constante (es unitario) por la Proposición
4.4.2 se sigue que
dT
T·
= 0.
ds
Esto nos permite definir un vector unitario N que es perpendicular a T y
por lo tanto, perpendicular a C (incluso, N es un vector que yace en el plano
normal). A este vector se le conoce como normal y está dado por la expresión
T = κN
(4.4)
A la expresión (4.4) se le conoce como primera fórmula de Frenet- Serret y al
escalar κ = ddsT se le llama curvatura de C. A su recı́proco de le denomina
radio de curvatura. Finalmente, al vector unitario
B = T×N
(4.5)
se le llama vector binormal que, debido a las propiedades del producto vectorial,
es perpendicular a T y a N (véase la Figura 4.12).
Los vectores T, N, B determinan un sistema coordenado ortogonal local
en cada punto de la curva C. Al plano que contiene a los vectores T y N lo
llamaremos plano osculador, el plano que contiene a N y B es el plano normal
y el plano generado por T y B lo llamaremos plano rectificador. Como B es
unitario se tiene que ddsB , en caso de ser diferente de cero, será ortogonal a B.
Luego derivando (4.5) con respecto a s, se tiene que
dT
dN
dB
=
×N + T×
ds
ds
ds
dado que
dT
ds
= κ N , se sigue que ddsT × N = 0, por lo que
dB
=
ds
dN
T×
ds
de donde se sigue que ddsB es perpendicular a T y, por lo tanto, paralelo a N.
En consecuencia, se puede escribir como
dB
= −τ N
ds
(4.6)
137
4. Diferenciación.
B
N
T
Figura 4.12: Aparato de Frenet-Serret
A la expresión (4.6) se le conoce como segunda fórmula de Frenet-Serret, donde
al número
dB
|τ | =
ds
se le conoce como factor de torsión o simplemente torsión. El signo menos en la
expresión (4.6) acontece ya que describe la dirección hacia la que gira el vector
B en torno de T hacia −N. Si τ > 0, B girará en el mismo sentido que
un tornillo de rosca derecha. Lo contrario sucede cuando τ < 0. Uno puede
observar que si B sufre un cambio al ir recorriendo la curva, esto es, si ddsB 6= 0,
el cambio sólo puede ser en su dirección (ya que el vector binormal es unitario),
la cual siempre es perpendicular al vector tangente. Esto es, el vector binormal
gira alrededor de la curva en un plano perpendicular al vector tangente. Por otro
lado, si se multiplica vectorialmente la ecuación que define al vector binormal
por −N, obtenemos que
B × (−N) = T,
que nos indica que si B gira hacia el vector −N, se obtiene el vector T. Ası́,
si τ > 0, ddsB y el incremento del vector binormal tienen la dirección de −N
y por lo tanto B gira alrededor de T hacia −N, es decir, gira en sentido
positivo. Lo contrario ocurre cuando τ < 0.
Por otro lado, multiplicando vectorialmente la ecuación que define al vector
binormal por T, obtenemos que N = B × T, por lo que, derivando esta
138
4.4. Teorı́a básica de curvas
expresión se tiene que
dN
ds
dB
dT
×T+B×
ds
ds
=
= −τ N × T + κ B × N,
de donde se obtiene la llamada tercera fórmula de Frenet-Serret
dN
= τ B − κT
ds
Ejemplo. Considérese la curva definida por la ecuación vectorial
s
bs
s
, a sin √
, √
.
a cos √
a2 + b2
a2 + b2
a 2 + b2
Se puede verificar (ejercicio) que esta curva está parametrizada en términos de
la longitud de arco. Ası́
−√
T =
a
a2 + b2
√
sin
s
, √
a2 + b2
a
a2 + b2
√
cos
s
, √
a2 + b2
b
,
a2 + b2
luego, derivando con respecto a s se obtiene que
dT
s
a
s
a
= − 2
cos √
sin √
,− 2
,0 ,
ds
a + b2
a + b2
a2 + b2
a2 + b2
de donde se sigue que
dT
a
= 2
,
ds
a + b2
κ =
por lo que
N =
dT
ds
κ
√
− cos
=
s
2
a + b2
√
, − sin
s
2
a + b2
,0
y como B = T × N, se tiene que
i
B =
j
− √a2a+ b2 sin
− cos
√
√
s
+ b2
a2
s
a2 + b2
√ a
a2 + b2
cos
− sin
√
k
√
s
+ b2
a2
s
a2 + b2
√
b
a2 + b2
,
0
de donde se obtiene
B =
−√
b
a2 + b2
sin
√
s
a2 + b2
, √
b
a2 + b2
cos
√
s
a2 + b2
,√
a
a2 + b2
.
139
4. Diferenciación.
Luego
dB
=
ds
−
b
cos
a2 + b2
por tanto,
√
s
a2 + b2
,−
b
sin
a2 + b2
dB
b
N,
= 2
ds
a + b2
de donde se concluye que
τ = −
a2
b
.
+ b2
√
s
a2 + b2
,0 ,
Bibliografı́a
[1] Friedberg, S. et Al, Linear Algebra, New Jersey, Prentice Hall, 2003.
[2] Cardenas, H. et Al, Álgebra superior, México, Trillas, 1982.
[3] Courant, R., Fritz, J., Introduction to Calculus and Analysis Vol. 2,
New York, Interscience, 1965.
[4] Haaser, N. et Al, Análisis matemático 2, México, Trillas, 1971.
[5] Lascurain, A., Álgebra superior I, México, Facultad de Ciencias, UNAM,
2012.
[6] Lehmann, C., Geometrı́a analı́tica, México, Limusa, 1994.
[7] Marsden, J., Hoffman, M. Elementary Classical Analysis, New York,
W. H. Freeman and Company, 1993.
[8] Marsden, J., Tromba, A. Vector Calculus, Third Edition, New York,
W. H. Freeman and Company, 1988
[9] Murdoch, D. C., Geometrı́a analı́tica con vectores y matrices, México,
Limusa, 1981.
141
Descargar