notas1 (1)

Notas de Cálculo 3 Raybel A. Garcı́a A., Antonio O. Vega E., Orlando R. Martı́nez M. 27 de octubre de 2013 Contenido 1. Espacios normados 1.1. Vectores . . . . . . . . . . . . . . . . . 1.2. Espacios vectoriales . . . . . . . . . . 1.3. Espacios normados . . . . . . . . . . . 1.3.1. Producto escalar en R3 . . . . 1.3.2. Productos interiores y normas . 1.4. Espacios métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 6 9 9 10 22 2. Elementos básicos de topologı́a 2.1. Conjuntos abiertos . . . . . . . 2.2. Conjuntos cerrados . . . . . . . 2.3. Sucesiones . . . . . . . . . . . . 2.4. Compacidad . . . . . . . . . . . 2.5. Conexidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 36 41 49 57 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dimensionalmente finitos . . . . . . . . . . . . . . . . . . . . 61 63 73 83 87 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 101 101 106 118 118 124 128 130 135 3. Limites y continuidad. 3.1. Lı́mites . . . . . . . . . . . . 3.2. Funciones continuas . . . . . 3.3. Continuidad uniforme . . . . 3.4. Espacios vectoriales normados . . . . . . . . . . . . . . . . . . . . 4. Diferenciación. 4.1. Funciones vectoriales de variable escalar. . . . . . . . . 4.2. Funciones escalares de variable vectorial . . . . . . . . 4.2.1. Derivada y diferencial . . . . . . . . . . . . . . 4.2.2. Derivadas direccionales y parciales. . . . . . . 4.3. Aplicaciones de la diferencial y la derivada parcial . . 4.3.1. Plano tangente y recta normal a una superficie 4.3.2. Diferenciales exactas . . . . . . . . . . . . . . . 4.4. Teorı́a básica de curvas . . . . . . . . . . . . . . . . . . 4.4.1. Longitud de arco . . . . . . . . . . . . . . . . . 4.4.2. Aparato de Frenet-Serret . . . . . . . . . . . . iii . . . . . . . . . . Capı́tulo 1 Espacios normados En general, estamos acostumbrados a trabajar con diversas cantidades como, por ejemplo, el volumen de un cuerpo, el área de un terreno, la temperatura de un objeto, etcétera. Ası́ pues, decimos que hemos comprado un litro de leche o que un niño tiene 38o de temperatura. En estos ejemplos, las cantidades citadas quedan totalmente determinadas cuando especificamos su magnitud, esto es, su valor numérico y la unidad que hemos utilizado para medirlas. A este tipo de cantidades las llamaremos magnitudes escalares. Sin embargo, existen otras que no pueden clasificarse como escalares, pues no quedan unicamente determinadas al proporcionar su magnitud. En este capı́tulo estudiaremos las nociones de vector, producto interior y norma. 1.1. Vectores Muchas nociones fı́sicas tan familiares como la fuerza, la velocidad y la aceleración involucran dos conceptos fundamentales: magnitud y dirección. A este tipo de entidades las llamaremos vectores. B A Figura 1.1: Vector con origen en A y extremo en B Definición 1 Un vector es una entidad matemática que tiene magnitud, dirección y sentido. Para representar un vector graficamente, utilizaremos una flecha que va de un punto A a un punto B (véase la Figura 1.1).Al punto A lo llamaremos origen y al punto B extremo del vector. La longitud del segmento AB, medida en unidades adecuadas, representa la magnitud del vector, la dirección del vector 1 2 1.1. Vectores es la de la recta que lo contiene, mientras que su sentido es el que va de su origen a su extremo. Si dos vectores son colineales, es claro que quiere decir que dos −−→ −−→ vectores tienen o no el mismo sentido; dos vectores AB y CD son paralelos entre sı́, si los segmentos AB y CD son paralelos, más aún, diremos que dichos vectores tienen el mismo sentido si los segmentos AC y BD no se cortan y tienen sentidos contrarios si estos segmentos se cortan (véase la Figura 1.2). B C A D Figura 1.2: Vectores con sentido opuesto −−→ −−→ Definición 2 Dos vectores AB y CD son iguales si y sólo si tienen la misma magnitud, dirección y sentido. (x, y) (x − a, y − b) (a, b) = O′ O Figura 1.3: Traslación en el plano 3 1. Espacios normados Consideremos un par de ejes rectangulares con origen en un punto O; si el eje y se moviera a unidades a la derecha, es claro que la abscisa de todo punto disminuirı́a en a unidades. Análogamente, si el eje y se moviera a unidades a la izquierda, la abscisa incrementarı́a en a unidades para todo punto en el eje rectangular. Algo similar sucederı́a con las ordenadas si movemos el eje x, b unidades hacia arriba o hacia abajo. En consecuencia, es claro que si movemos el origen al punto (a, b), de manera que los nuevos ejes sean paralelos y tengan la misma orientación que los ejes originales, las nuevas coordenadas (x0 , y 0 ) del punto (x, y) serán x0 = x − a y 0 = y − b, (1.1) (Figura 1.3). A este tipo de cambio de coordenadas, lo llamaremos traslación con ecuaciones (1.1). No es difı́cil extender estas ideas al espacio tridimensional: mover el plano yz hacia la derecha o hacia la izquierda a unidades, es restar o sumar a unidades a la abscisa de todo punto; si movemos el plano xz hacia adelante o hacia atrás, significa quitar o añadir unidades a la ordenada; finalmente desplazar hacia arriba o hacia abajo el plano xy modificará la cota (coordenada z) de todo punto. De esta forma, las ecuaciones de traslación para el caso tridimensional quedan descritas de la forma x0 = x − a y0 = y − b z 0 = z − c. Z′ B γ α β Y′ O A X′ Figura 1.4: Ángulos directores para un vector en el espacio Ahora, todo punto P = (x, y) en un sistema rectangular de coordenadas, podemos pensarlo como un vector, cuyo origen se encuentra en el origen del sistema coordenado y su extremo se encuentra en el punto P . Para cada punto en el plano (o en el espacio), el vector asociado de la forma antes descrita lo llamaremos vector posición. A menos que haya confusión, denotaremos por → − −−→ (x, y) al punto P y al vector posición P indistintamente. Sea AB un vector con origen A = (x1 , y1 ) y extremo B = (x2 , y2 ). Si hacemos una traslación con A como nuevo origen, las nuevas coordenadas de B serán (x2 −x1 , y2 −y1 ). −−→ Ası́, hemos encontrado una forma de representar al vector AB en un sistema de coordenadas rectangular. Para el caso del espacio tridimensional se puede realizar un proceso similar. Además, tanto en el caso bidimensional como en el 4 1.1. Vectores tridimensional, un vector queda determinado por los ángulos que forman sus proyecciones con los ejes coordenados. La Figura 1.4 muestra el caso de un vector en el espacio. Los ángulos BAX 0 , BAY 0 y BAZ 0 se llaman ángulos directores y los respresentamos por α, β y γ respectivamente. Nótese que dos vectores tienen la misma dirección y el mismo sentido si y sólo si tienen los mismos ángulos directores. Además, obsérvese que α, β, γ ∈ [0, π]. Como la función coseno es uno a uno en el intervalo [0, π], un ángulo en este intervalo queda determinado de forma única por su coseno, por tanto, la orientación de un vector está definida por los cosenos de sus ángulos directores, los cuales reciben el nombre de cosenos directores del vector. La proyección de B sobre el eje X 0 tiene coordenadas (x2 − x1 , 0, 0) con relación a los ejes trasladados, donde x2 − x1 es positivo, nulo o negativo, dependiendo de si α es menor, igual o −−→ mayor a π2 . De esta forma, si r es la magnitud del vector AB, se obtiene que x2 − x1 = r cos α = r cos β z2 − z3 = r cos γ. y2 − y1 Se sigue que, por la definición de igualdad, dos vectores son iguales si tienen la misma magnitud y los mismos cosenos directores. Proposición 1.1.1 Si A = (x1 , y1 , z1 ), B = (x2 , y2 , z2 ), C = (x3 , y3 , z3 ) y −−→ −−→ D = (x4 , y4 , z4 ) son puntos en el espacio, los vectores AB y CD si y sólo si x2 − x1 = x4 − x3 , y2 − y1 = y4 − y3 y z2 − z1 = z4 − z3 . −−→ −−→ Demostración. Por las ecuaciones anteriores, si AB = CD, entonces se tiene la igualdad de las diferencias de las coordenadas. Ahora, si las diferencias de las coordenadas son iguales, entonces las magnitudes de cada uno de los vectores son iguales, por tanto los dos vectores tienen los mismos cosenos directores. −−→ −−→ No es difı́cil probar que todo vector AB es igual a un vector OP con origen −−→ en el del sistema coordenado y con las componentes de AB como coordenadas de su extremos. También, nótese que la suma de los cuadrados de los cosenos directores de cualquier vector es igual a 1. Ahora, sean ~x = (x1 , y1 , z1 ) y ~y = (x2 , y2 , z2 ) dos vectores cualesquiera. Definimos la suma ~x + ~y como el vector −−−→ x + y := (x1 + x2 , y1 + y2 , z1 + z2 ). Al vector cuyo origen coincide con su extremo lo llamaremos vector cero o nulo. Este vector tiene magnitud nula, no tiene orientación y lo representaremos por ~0. Además, obsérvese que ~0 = (0, 0, 0), de donde se sigue que, para cualquier vector ~x, ~x + ~0 = ~0 + ~x = ~x. El vector (−x1 , −y1 , −z1 ) se llama negativo del vector ~x y se denota por −~x. Se tiene que ~x + (−~x) = −~x + ~x = ~0. 5 1. Espacios normados Es claro que, a partir de estas definiciones, la suma de vectores satisface las mismas propiedades básicas que las de la suma de números reales, es decir, es cerrada, asociativa y conmutativa, además de que existe un elemento neutro y para cada vector, existe un elemento inverso bajo esta operación. El siguiente resultado, proporciona una interpretación geométrica de la adición de vectores. Proposición 1.1.2 Si A, B y C son tres puntos cualesquiera, entonces −→ −−→ −−→ AC = AB + BC Demostración. Sin pérdida de generalidad, podemos elegir un sistema coordenado con origen en A. Sean B = (x1 , y1 , z1 ) y C = (x2 , y2 , z2 ). Entonces −−→ AB = (x1 , y1 , z1 ) −−→ BC = (x2 − x1 , y2 − y1 , z2 − z1 ), −→ −−→ −−→ de donde se obtiene que AC = (x2 , y2 , z2 ) = AB + BC. C A D B Figura 1.5: Regla del paralelogramo −−→ −→ Corolario 1.1.3 Si AB y AC son vectores con el mismo origen A, entonces −−→ −→ −−→ AB + AC = AD, donde D es el cuarto vértice del paralelogramo del cual AB y AC son lados adyacentes. Demostración. Consideremos el paralelogramo ABCD (véase la Figura 1.5). −→ −−→ Como AC = BD, se sigue que −−→ −→ −−→ −−→ −−→ AB + AC = AB + BD = AD Nótese que las demostraciones de estos dos últimos resultados funcionan tanto para el plano como para el espacio. Ahora, consideremos un vector de la 6 1.2. Espacios vectoriales forma ~x = (x1 , y1 , z1 ) y k un número real al que llamaremos escalar. Definimos el producto del vector ~x por el escalar k de la siguiente forma k ~x := (k x1 , k y1 , k z1 ) Obsérvese que se cumplen reglas distributivas para la suma de vectores y el producto por escalares como sucede en los reales. En la siguiente sección profundizaremos en este aspecto. Para finalizar con esta sección, analizamos la geometrı́a del producto de vectores por escalares. De la fórmula de la distancia, la magnitud de un vector ~x = (x1 , y1 , z1 ), que denotaremos por ||~x||, está dada por q ||~x|| = x21 + y12 + z12 . Por otra parte, si k ∈ R, entonces q q ||k ~x|| = k (x21 + y12 + z12 ) = |k| x21 + y12 + z12 = |k| ||~x||. Nótese que la orientación de k ~x será la misma o contraria a la de ~x, dependiendo de si k es mayor o menor a cero respectivamente. Se dirá que dos vectores ~x y ~y son paralelos si y sólo si ~y = k ~x, donde k 6= 0 y tendrán la misma dirección si y sólo si k > 0. 1.2. Espacios vectoriales En la sección anterior observamos que con las definiciones dadas para la suma de vectores y el producto de un vector por un escalar, estas operaciones satisfacen ciertas propiedades. En esta pequeña sección analizaremos otros sistemas algebraicos que le resultarán familiares al lector, en donde se pueden definir operaciones de adición y producto similares a las de los vectores en el plano y el espacio, y que satisfacen las mismas reglas. A continuación definimos formalmente estas estructuras algebraicas. Definición 3 Un espacio vectorial V sobre un campo K es una estructura algebraica que consiste de un conjunto, distinto del vacı́o, sobre el cual se definen dos operaciones + : V × V −→ V y · : K × V −→ V que satisfacen las siguientes condiciones: S1) Para cualesquiera x, y ∈ V , x + y = y + x. S2) Para cualesquiera x, y, z ∈ V , x + (y + z) = (x + y) + z. S3) Existe un único elemento 0 ∈ V tal que x + 0 = x para cada x ∈ V . S4) Para cada elemento x ∈ V , existe un único elemento y ∈ V tal que x + y = 0. 7 1. Espacios normados P1) Para cada elemento x ∈ V , 1 · x = x. P2) Para cualesquiera a, b ∈ K y para cualquier elemento x ∈ V , (ab) · x = a · (b · x). D1) Para todo a ∈ K y para cualesquiera x, y ∈ V , a · (x + y) = a · x + a · y. D2) Para cualesquiera a, b ∈ K y para cualquier x ∈ V , (a + b) · x = a · x + b · x. A los elementos del campo los llamaremos escalares y a los del espacio vectorial, vectores. El lector debe tener precaución al referirse, por un lado, a los elementos de un espacio vectorial y, por otro lado, a la entidad fı́sica discutida en la sección anterior. Ejemplos 1. En la sección anterior, vimos que R2 = {(x1 , x2 ) | x1 , x2 ∈ R} y R3 = {(x1 , x2 , x3 ) | x1 , x2 , x3 ∈ R} forman espacios vectoriales sobre R. Más aún, si en Rn = {(x1 , ..., xn ) | xi ∈ R, i ∈ {1, 2, ..., n}} definimos las operaciones + y · de la forma (x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn ) c · (x1 , ..., xn ) = (c x1 , ..., c xn ), c ∈ R, se tiene que Rn es un espacio vectorial sobre R. 2. Una matriz de m × n con entradas en la forma  a11 a12  a21 a22  A =  . ..  .. . am1 am2 R, es un arreglo rectangular de  · · · a1n · · · a2n   .. ..  . .  ··· amn y (cA)ij = c Aij , donde cada entrada aij ∈ R, i ∈ {1, 2, ..., m}, j ∈ {1, 2, ..., n}. Si definimos la suma de dos matrices A y B y el producto por escalares de la forma (A + B)ij = Aij + Bij 8 1.3. Espacios vectoriales donde Aij denota la entrada de la matriz que se encuentra en el i-ésimo renglón y la j-ésima columna, entonces el conjunto de matrices Mm × n (R) es un espacio vectorial sobre R. 3. Un polinomio con coeficientes en un campo K es una expresión de la forma n X p (x) = ak xk , (1.2) k=0 donde n ∈ N y cada ak , llamado coeficiente de xk , está en K. Si p (x) = 0, esto es, si ak = 0, para toda k ∈ N ∪ {0}, entonces a p (x) lo llamaremos el polinomio nulo o cero. El grado de un polinomio se define como el exponente más grande de la indeterminada x que aparece en la representación (1.2). Por convención, el polinomio nulo tiene grado −1. Diremos que dos polinomios son iguales si tienen el mismo grado y sus coeficientes son iguales, esto es, si p (x) = n X ak xk q (x) = y k=0 m X bk xk , k=0 entonces son iguales si m = n y ai = bi , i ∈ {1, ...., n}. Por otra parte, si m < n podemos definir bm +1 = bm + 2 = · · · = bn = 0, de tal forma que q (x) se puede escribir como q (x) = n X bk x k . k=0 Ası́, podemos definir la suma de dos polinomios como p (x) + q (x) = n X (ak + bk ) xk k=0 y el producto por escalares de la forma c p (x) = n X k=0 c ak xk , c ∈ K. Con estas operaciones, el conjunto de polinomios de grado n con coeficientes en un campo K (que denotaremos por Pn [K]). es un espacio vectorial. 4. Consideremos R2 con las siguientes operaciones (x1 , y1 ) ⊕ (x2 , y2 ) = (x1 + x2 , y1 − y2 ) y c 2 Obsérvese que (R , ⊕, (x1 , y1 ) = (c x1 , c y1 ). ) no es un espacio vectorial (¿Por qué?). 9 1. Espacios normados 1.3. Espacios normados El concepto de medida es fundamental en las aplicaciones. En esta sección trataremos la idea de distancia o longitud en los espacios vectoriales, vı́a una estructura más rica llamada espacio con producto interior. Los espacios con producto interior tienen diversas aplicaciones en la geometrı́a,la fı́sica, el estudio de los mı́nimos cuadrados y las formas cuadráticas, por ejemplo. Iniciamos esta sección con el estudio del producto punto para vectores en R3 (la construcción para R2 es análoga). 1.3.1. Producto escalar en R3 −−→ −→ Consideremos dos vectores AB y AC. Denotaremos por θ al ángulo entre ellos. Eligiendo un sistema de coordenadas rectangular, podemos suponer que los vectores tienen el mismo punto inicial y éste último se encuentra en el origen del sistema. De esta forma, podemos pensar que sus extremos son los puntos P1 = (x1 , y1 , z1 ) y P2 = (x2 , y2 , z2 ) respectivamente. Ahora, obsérvese que θ ∈ [0, π] (véase la Figura 1.6). Nuestro objetivo es encontrar una forma de calcular el ángulo entre estos vectores. P1 P2 r1 r2 θ Figura 1.6: Ángulo entre dos vectores Aplicando la fórmula de la distancia y la ley de cosenos, obtenemos r12 + r22 − 2 r1 r2 cos θ = (d (P1 , P2 ))2 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 , −−→ −→ donde r1 y r2 denotan las magnitudes de los vectores AB y AC respectivamente. Usando el hecho de que ri = x2i + yi2 + zi2 , i = 1, 2, se sigue que x1 x2 + y1 y2 + z1 z2 = r1 r2 cos θ. (1.3) 10 1.3. Espacios normados El lado izquierdo de esta última expresión lo llamamos producto escalar de los vectores P1 y P2 (recordemos que usamos indistintamente, a menos que haya confusión, la notación para puntos y vectores posición). Denotamos al producto escalar por P1 · P2 . El lado derecho de la ecuación (1.3) establece que el producto escalar no depende de la elección del sistema de coordenadas, sino de la magnitud de los vectores y el ángulo comprendido entre éstos. Se deja al lector verificar que el producto escalar satisface las siguientes condiciones: Para 3 vectores cualesquiera x, y, z y un escalar arbitrario c, 1. x · (y + z) = x · y + x · z. 2. (cx) · y = c (x · y). 3. x · y = y · x. 4. x · x ≥ 0 y x · x = 0 ⇔ x = 0 Obsérvese que de esta última propiedad se deduce que ||x|| = que, de la ecuación (1.3), se sigue que cos θ = 1.3.2. √ x · x, por lo x·y . ||x|| ||y|| Productos interiores y normas Muchas ideas geométricas tales como la longitud de vectores, los ángulos comprendidos entre ellos y la perpendicularidad en R2 y R3 , se pueden extender a espacios vectoriales más generales. Estas ideas estan relacionadas con el concepto de producto interior. Definición 4 Sea V un espacio vectorial sobre R. Un producto interior sobre V es una función h, i : V × V −→ R, tal que para cualesquiera elementos x, y, z ∈ V y para todo c ∈ R, se satisfacen las siguientes propiedades 1. hcx + y, zi = c hx, zi + hy, zi. 2. hx, yi = hy, xi. 3. hx, xi > 0 si x 6= 0 Ejemplos 1. Como vimos en la subsección anterior, el producto escalar en R3 (y en R2 ) es un producto interior. Más aún, podemos definir en Rn la siguiente función n X hX, Y i = xi yi , (1.4) i=1 11 1. Espacios normados donde X = (x1 , ...xn ) y Y = (y1 , ..., yn ). Para ver que esta función es un producto interior, tenemos que verificar las propiedades dadas en la definición 14. Si Z = (z1 , ..., zn ) y c ∈ R, entonces n X hcX + Y, Zi = (cxi + yi )zi i=1 n X = c xi zi + yi zi i=1 n X = c xi zi + i=1 n X yi zi i=1 c hX, Zi + hY, Zi. = Ahora, por la conmutatividad de los números reales, es claro que hX, Y i = hY, Xi. Finalmente si X 6= 0, entonces al menos una entrada del vector X es distinta de cero, en consecuencia n X hX, Xi = x2i > 0. i=1 Por tanto, la función dada en la expresión (1.4) es unproducto interior sobre Rn . 2. Sea V = C[a,b] el espacio de funciones continuas definidas sobre el intervalo [a, b] y definimos la función b Z hf, gi = f (t) g(t) dt (1.5) a Como la integral abre sumas y saca escalares, la primera propiedad de la definición 14 se cumple, además la segunda propiedad se cumple por la conmutatividad de los números reales. Ahora si f (t) 6= 0 para toda t ∈ [a, b], entonces (f (t))2 > 0. Como f es continua, se sigue que hf, f i = Z b (f (t))2 dt > 0, a en consecuencia, la función definida en (1.5) es un producto interior. Como consecuencias inmediatas de la definición 14, tenemos las siguientes propiedades. Proposición 1.3.1 Sea V un espacio vectorial sobre R con producto interior. Entonces para cualesquiera x, y, z ∈ V y c ∈ R se tiene que 12 1.3. Espacios normados 1. hx, cy + zi = c hx, yi + hx, zi 2. hx, 0i = h0, xi = 0. 3. hx, xi = 0 si y sólo si x = 0. 4. Si hx, yi = hx, zi para todo x ∈ V , entonces y = z Demostración. 1. Obsérvese que hx, cy + zi = hcy + z, xi = chy, xi + hz, xi = chx, yi + hx, zi. 2. Nótese que hx, 0i = hx, y − yi para y ∈ V . Luego, por la afirmación anterior, hx, y − yi = hx, yi + hx, −yi = hx, yi − hx, yi = 0. 3. Si x = 0, por la afirmación anterior se sigue que hx, xi = 0. Ahora si hx, xi = 0, como por definición se tiene que hx, xi > 0 si x 6= 0, se sigue que x = 0. 4. Si hx, yi = hx, zi, entonces se tiene que hx, yi − hx, zi = hx, y − zi = 0, para todo x ∈ V , en particular para y − z, esto es hy − z, y − zi = 0, por la afirmación anterior, y − z = 0, es decir y = z. Esta última proposición nos permite generalizar la noción de magnitud de un vector a espacios vectoriales con producto interior. Definición 5 Sea V un espacio vectorial sobre R con producto interior. Para x ∈ V definimos la norma o longitud de x como p ||x|| = hx, xi El siguiente resultado muestra que las propiedades para la norma euclidiana en R3 se cumplen en general para espacios vectoriales con producto interior. 13 1. Espacios normados Proposición 1.3.2 Sea V un espacio vectorial sobre R con producto interior. Entonces para todo x, y ∈ V y c ∈ R, se cumplen las siguientes afirmaciones 1. ||c x|| = |c| ||x||. 2. ||x|| ≥ 0 y ||x|| = 0 si y sólamente si x = 0. 3. |hx, yi| ≤ ||x|| ||y|| (Desigualdad de Cauchy - Schwarz). 4. ||x + y|| ≤ ||x|| + ||y|| (Desigualdad del triángulo). Demostración. 1. Por la definición se tiene que p p hc x, c xi = c2 hx, xi p = |c| hx, xi = |c| ||x||. ||c x|| = 2. Por la definición 14, se sigue que ||x|| > 0 si x 6= 0 y, por la proposición 1.3.1, se sigue que ||x|| = 0 si y sólamente si x = 0. 3. Si y = 0 el resultado es inmediato. Supongamos que y 6= 0. Para todo α ∈ R, se tiene que 0 ≥ ||α x + y|| = hα x + y, α x + yi = α2 ||x||2 + 2 α hx, yi + ||y||2 . Sea ||x||2 = a, 2 hx, yi = b y ||y||2 = c. Entonces, se tiene que a α2 + 2b α + c ≥ 0 ∀ α ∈ R. Ahora, si f (α) = a α2 + 2b α + c, se sigue que b f0 − = 0, 2a b esto es, α = − 2a es un mı́nimo para la función f . Además, como f (α) ≥ 0 se obtiene que a b2 4a2 para toda α ∈ R, +b de donde se sigue que c ≥ −b 2a + c ≥ 0, b2 , 4a por lo tanto b2 ≤ 4ac, es decir |hx, yi|2 ≤ ||x||2 ||y||2 14 1.3. Espacios normados 4. Por la definición de norma y las propiedades de producto interior, se tiene que ||x + y||2 = = = hx + y, x + yi hx, xi + 2 hx, yi + hy, yi ||x||2 + 2 hx, yi + ||y||2 . Por la desigualdad de Cauchy - Schwarz, se sigue que ||x + y||2 ≤ ||x||2 + ||x|| ||y|| + ||y||2 = (||x|| + ||y||)2 , lo cual concluye la demostración. Proposición 1.3.3 (Ley del paralelogramo). Sea V un espacio vectorial sobre R con producto interior. Entonces, se cumple que ||x + y||2 + ||x − y||2 = 2 (||x||2 + ||y||2 ) Demostración. Por la definición de norma en un espacio conproducto interior, se tiene que ||x + y||2 + ||x − y||2 = hx + y, x + yi + hx − y, x − yi = + = (hx, xi + 2 hx, yi + hy, yi) (hx, xi − 2 hx, yi + hy, yi) 2||x||2 + 2 ||y||2 . Ahora definimos el concepto de norma en general. Definición 6 Sea V un espacio vectorial sobre R. Definimos una norma como una función || · || : V −→ R+ ∪ {0} que satisface las siguientes condiciones 1. Para todo x ∈ V , ||x|| ≥ 0. Además, ||x|| = 0 si y sólamente si x = 0. 2. Para todo x ∈ V y c ∈ R, ||c x|| = |c| ||x||. 3. Para cualesquiera x, y, z ∈ V , ||x + y|| ≤ ||x|| + ||y||. A un espacio vectorial en donde se ha definido una norma || · || lo llamaremos simplemente espacio normado. Hemos visto que a partir de un producto interior se puede generar una norma, pero no toda norma proviene de un producto interior. Sin embargo, se puede verificar que si una norma satisface la ley del paralelogramo, se puede construir un producto interior que la induzca. 15 1. Espacios normados Proposición 1.3.4 Sea V un espacio normado sobre R, con norma || · || tal que satisface la ley del paralelogramo y defı́nase 1 hx, yi = ||x + y||2 − ||x − y||2 . 4 Entonces h, i es un producto interior tal que ||x||2 = hx, yi para todo x ∈ V . Demostración. Para ver que h, i es un producto interior, tenemos que verificar las condiciones establecidas en la definición 14. Obsérvese que 1 hx, yi = ||x + y||2 − ||x − y||2 4 1 = ||y + x||2 − ||y − x||2 = hy, xi. 4 Además, 1 ||2 x||2 − ||0||2 = ||x||2 > 0, hx, xi = 4 si x 6= 0. Por otro lado, como la norma satisface la ley del paralelogramo, se tiene que ||x + 2y||2 + ||x||2 = = ||(x + y) + y||2 + ||(x + y) − y||2 2 (||x + y||2 + ||y||2 ) y ||x − 2y||2 + ||x||2 de donde se sigue que por lo que = = ||(x − y) − y||2 + ||(x − y) + y||2 2 (||x − y||2 + ||y||2 ), ||x + 2y||2 − ||x − 2y||2 = 2(||x + y||2 − ||x − y||2 ) 1 (||x + 2y||2 − ||x − 2y||2 ) 4 1 (2(||x + y||2 − ||x − y||2 )) = 2 hx, yi. = 4 Ası́, para probar que hx + y, zi = hx, zi + hy, zi, verificamos que hx, 2yi = hx + y, 2zi = 2 (hx, zi + hy, zi). De manera similar al argumento anterior, por la ley del paralelogramo se tiene que ||x + y + 2z||2 + ||x − y||2 = 2(||x + z||2 + ||y + z||2 ) y ||x + y − 2z||2 + ||x − y||2 = 2 (||x − z||2 + ||y − z||2 ), 16 1.3. Espacios normados de donde se obtiene que ||x + y + 2z||2 − ||x + y − 2z||2 = 2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 ). En consecuencia, se sigue que 1 (||x + y + 2z||2 − ||x + y − 2z||2 ) 4 1 (2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 )) 4 2 (hx, zi + hy, zi). hx + y, 2zi = = = Inductivamente, para n ∈ N se tiene que hn x, yi = h(n − 1)x, yi + hx, yi = · · · = n hx, yi. Ahora, por el argumento anterior, obtenemos 1 1 hx, yi = hm x , yi = m h x, zi, m m de donde se concluye que h Ası́, si r = p q, 1 1 x, zi = hx, yi. m m donde p, q ∈ N, entonces hr x, yi = hp = 1 1 x, yi = p h x, yi q q p hx, yi = r hx, yi. q Ahora, si r = 0, se sigue que h0, yi = 1 (||y||2 − ||y||2 ) = 0 = 0 hx, yi. 4 Finalmente, si r es negativo, nótese que hrx, yi = h(−r) (−x), yi = −r h−x, yi, pero ya que h−x, yi + hx, yi = h−x, yi = −hx, yi 1 (|| − x + y||2 − || − x − y||2 + ||x + y||2 − ||x − y||2 ) = 0. 4 Por lo tanto hrx, yi = −r h−x, yi = r hx, yi. 17 1. Espacios normados Por otra parte, obsérvese que hx, xi = 1 (||x + x||2 − ||0||2 ) = ||x||2 , 4 (1.6) para todo x ∈ V . Consecuentemente, por la desigualdad del triángulo y el argumento anterior, tenemos que ||x||2 + 2 hx, yi + ||y||2 = ||x + y||2 ≤ (||x|| + ||y||)2 = ||x||2 + 2 ||x|| ||y|| + ||y||2 . De manera similar, tomando ||x − y||2 , se obtiene que ||x||2 − 2 hx, yi + ||y||2 ≤ ||x||2 + 2 ||x|| ||y|| + ||y||2 , de donde se concluye que |hx, yi| ≤ ||x|| ||y||. (1.7) Finalmente, sea c ∈ R y r ∈ Q. Como (c − r) hx, yi = c hx, yi − rhx, yi y h(c − r)x, yi = hcx − rx, yi = hcx, yi − r hx, yi, es claro que |c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi|. Ahora, por la desigualdad (1.7), se sigue que −|c − r| ||x|| ||y|| ≤ (c − r) hx, yi y y por tanto h(c − r)x, yi ≤ |c − r| ||x|| ||y|| |c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi| ≤ 2 |c − r| ||x|| ||y||. (1.8) Por la propiedad arquimediana, para todo c ∈ R, se puede encontrar r ∈ Q tal que |c − r| < ε, donde ε > 0. Por la desigualdad (2), se concluye que hcx, yi = c hx, yi para todo c ∈ R. Ası́, h, i es un producto interior y por la ecuación (34), se sigue el resultado. Regresando al estudio de las normas en Rn , hemos visto que el producto escalar genera una norma, a saber, la función dada por v u n uX x2i , ||X||2 = t i=1 18 1.3. Espacios normados donde X = (x1 , ..., xn ). A esta norma la llamaremos norma euclidiana. Sin embargo, podemos definir otras funciones que resultan ser normas en Rn . Por ejemplo, podemos definir la función ||X||1 = n X i=1 |xi |. Para ver que es una norma, debemos verificar que se cumplen las condiciones de la definición 15. En efecto, nótese que ||X||1 ≥ 0 ya que estamos considerando los valores absolutos de las entradas del vector X, además, esta función toma el valor cero si y sólo si cada una de las entradas del vector es cero. Por otra parte, si c ∈ R, se tiene que ||c X||1 = n X i=1 n X |c xi | = |c| i=1 |xi | = |c| ||X||1 . Finalmente, por la desigualdad del triángulo para el valor absoluto, si Y = (y1 , ..., yn ), se sigue que ||X + Y ||1 = n X i=1 |xi + yi | ≤ n X i=1 (|xi | + |yi |) = ||X||1 + ||Y ||1 . Por tanto se sigue que ||X||1 define una norma. Por otro lado, podemos definir la siguiente función ! 31 n X 3 ||X||3 = |xi | . i=1 Esta función también es una norma. En general, para p ≥ 1, si definimos la función ! p1 n X p ||X||p = |xi | , i=1 ésta resulta ser una norma. Para demostrar esta afirmación, requerimos de un par de desigualdades que demostraremos a continuación Proposición 1.3.5 (Desigualdad de Hölder). Sean p > 1 y q > 1 tales que p1 + 1q = 1, X = (x1 , ..., xn ) y Y = (y1 , ..., yn ). Sea X 0 = (|x1 |, ..., |xn |) y Y 0 = (|y1 |, ..., |yn |). Entonces  ! p1   n ! q1  n X X   |xi |p |yi |q (1.9) X0 · Y 0 ≤  i=1 i=1 Demostración. Para empezar, recordemos la desigualdad de Bernoulli, esto es, si t ≥ 0, entonces (1 + t)p ≥ 1 + pt, 19 1. Espacios normados alcanzándose la igualdad cuando t = 0. Ahora, sean a ≥ 0 y b > 0 tales que a 1+t = . q bp Sustituyendo este valor en la desigualdad de Bernoulli, obtenemos −q ap ≥ 1 + p a b p − p, q b donde la igualdad se alcanza cuando ap = bq . Multiplicando por bq ambos lados de la desigualdad y realizando las operaciones correspondientes, se obtiene que p−1 (1.10) ap ≥ bq (1 − p) + p a bq ( p ) . p p−1 , Como p1 + 1q = 1, se tiene que q = desigualdad (4.2) obtenemos que por lo que, sustituyendo en la ap ≥ bq (1 − p) + p a b, luego, multiplicando por 1 p, se obtiene la siguiente desigualdad bq ap + ≥ ab, p q (1.11) alcanzando la igualdad cuando ap = bq . Por otro lado, tómese aj = |xj | n X i=1 ! p1 p |xi | y bj = |yj | n X i=1 ! q1 , |yi |q sustituyendo en la desigualdad (4.3) y sumando sobre todas las j ∈ {1, ..., n}, obtenemos   n X j=1 aj bj ≤ n  X    j=1 p |xj |p ! + n X p |xi | q i=1 n X = p |xi |p i=1 n X i=1 = n X ! + p |xi | 1 1 + = 1, p q q   |yj |q  !  n X q  |yi | i=1 |yi |q i=1 n X i=1 ! |yi | q 20 1.3. Espacios normados es decir n X j=1 aj bj ≤ 1, de donde se sigue el resultado. Proposición 1.3.6 (Desigualdad de Minkowski) Sean xi , yi ∈ R, i ∈ {1, ..., n} y p ≥ 1. Entonces ! p1 n X i=1 |xi + yi | p ! p1 n X ≤ |xi | i=1 p ! p1 n X + p |yi | i=1 (1.12) Demostración. Por la desigualdad del triángulo para el valor absoluto, se tiene que n n X X |xi + yi |p ≤ (|xi | + |yi |)p . i=1 i=1 Por otra parte, el lado derecho de esta última desigualdad, se puede escribir como n X i=1 (|xi | + |yi |)p = = n X i=1 n X i=1 (|xi | + |yi |)p − 1 (|xi | + |yi |) (|xi | + |yi |)p − 1 |xi | + n X i=1 (|xi | + |yi |)p − 1 |yi |. Luego, definiendo |zi | = (|xi | + |yi |)p − 1 y aplicando la desigualdad (4.3) a cada uno de los sumandos de la expresión anterior, obtenemos n X i=1 |zi | |xi | + n X i=1 |zi | |yi | ≤ n X = i=1 n X = i=1 como 1 p + 1 q n X i=1 = !1 n X i=1 ! q1  |zi |q n X q |zi |q i=1 n X  i=1 q (|xi | + |yi |)p − 1 !1 + ! q1  n X + i=1  i=1 |xi |p i=1 |yi |p n X i=1 ! q1   i=1 ! q1  (|xi | + |yi |)p n X + ! p1  n X i=1 n X  i=1 ! p1 |xi |p + |xi |p n X i=1 ! p1 + p  |yi |p , = 1, entonces p = q (p − 1), de donde se obtiene que q (|xi | + |yi |)p − 1 !1 |yi |p ! p1  ! p1 n X n X q |zi |q i=1 ! p1 |xi |p !1 n X p |xi |p n X i=1 ! p1  |yi |p  ! p1  |yi |p , 21 1. Espacios normados lo cual implica que n X i=1 p (|xi | + |yi |) ≤ n X i=1 !1  n !1 q p X p  (|xi | + |yi |) |xi | + i=1 n X i=1 tiene que i=1 p !1 − q1 (|xi | + |yi |) n X ≤ i=1 n X = i=1 ! p1 p |xi | n X + i=1 i=1 !1  p , |yi | p 1 por lo que, multiplicando esta desigualdad por n X n X p ! q1 se ob- (|xi | + |yi |)p ! p1 p (|xi | + |yi |) ! p1 |yi | p , pero, por la desigualdad del triángulo para los valores absolutos, tenemos que ! p1 ! p1 n n X X p p (|xi + yi |) ≤ (|xi | + |yi |) , i=1 i=1 de donde se concluye que n X i=1 ! p1 (|xi + yi |) p ≤ n X i=1 ! p1 |xi | p + n X i=1 ! p1 p |yi | , que era justo lo que se querı́a demostrar. De esta forma, la función definida por ||X||p = n X i=1 ! p1 |xi |p , donde X = (x1 , ..., xn ) define una norma, ya que, es claro que ||X||p ≥ 0, alcanzándose la igualdad si y sólamente si cada una de las entradas del vector X es igual a cero. Además, si c ∈ R, se tiene que ! p1 ! p1 n n X X = |c| |xi |p |c| ||X||. ||c X||p = |c xi |p i=1 i=1 Finalmente, la desigualdad del triángulo se sigue de la desigualdad (1.12). Por otra parte, podemos definir la siguiente función en Rn ||X||∞ = máx {|xi | | i ∈ {1, ..., n}}, donde X = (x1 , ..., xn ). Se afirma que esta función es una norma en Rn . Para ver esto, nótese que ||X|| ≥ 0 alcanzando la igualdad si y sólamente si cada entrada del vector X es cero. Ahora, si c ∈ R, entonces ||c X||∞ = máx {|c xi | | i ∈ {1, ..., n}} = |c| máx {|xi | | i ∈ {1, ..., n}} = |c| ||X||∞ . 22 1.4. Espacios métricos Finalmente, se tiene que ||X + Y ||∞ = máx {|xi + yi | | i ∈ {1, ..., n}} = |xj + yj |, para alguna j ∈ {1, ..., n}. Por la desigualdad del triángulo para el valor absoluto, se tiene que |xj + yj | ≤ |xj | + |yj | ≤ máx {|xi | | i ∈ {1, ..., n}} + máx {|yi | | i ∈ {1, ..., n}}, de donde se concluye que ||X + Y ||∞ ≤ ||X||∞ + ||Y ||∞ Se pueden dar otros ejemplos de espacios vectoriales normados: el espacio de funciones continuas definidas en un intervalo [a, b] con la función dada por ||f ||p = Z ! p1 b p (|f (x)|) dx a p ≥ 1 es un espacio normado; el espacio de funciones acotadas con la funcón ||f || = sup {|f (x)| | x ∈ [a, b]} también es un espacio normado. Nuestro estudio en la siguiente sección, se centrará en cómo mediremos distancias a partir de las estructuras que hemos construido hasta el momento. 1.4. Espacios métricos Entre las propiedades de Rn , una de las más importantes es la propiedad métrica, es decir, la forma en que se mide la distancia entre puntos. Un espacio métrico es un conjunto X equipado con una función d : X × X −→ R que proporciona una forma razonable de medir distancias entre dos elementos de X . Este concepto nos permitirá definir más adelante el concepto de conjunto abierto y a partir de éste último estudiar una serie de propiedades y conceptos como, por ejemplo, el de convergencia. Definición 7 Un espacio métrico es una estructura que consta de un conjunto X 6= ∅ y de una función d : X × X −→ R+ ∪ {0}, llamada métrica, que satisface los siguientes axiomas 1. d (x, y) = 0 ⇔ x = y. 2. d (x, y) = d (y, x) ∀ x, y ∈ X . 3. d (x, y) ≤ d (x, z) + d (z, y) ∀ x, y, z ∈ X . Ejemplos. 23 1. Espacios normados 1. Sea (V, || · ||) un espacio normado. Para x, y ∈ V , definimos d (x, y) = ||x − y||. Esta función, en efecto, define una métrica. Nótese que, por las propiedades de la norma, se tiene que d (x, y) ≥ 0, además d (x, y) = 0 si y sólamente si ||x − y|| = 0, esto pasa si y sólamente si x − y = 0, lo cual sucede si y sólamente si x = y, con lo que se satisface el primer axioma. Luego d (x, y) = ||x − y|| = || − (y − x)|| = ||y − x|| = d (y, x). Finalmente, por la desigualdad del triángulo para las normas, se tiene que d (x, y) = ||x − y|| = ||(x − z) + (z − y)|| ≤ ||x − z|| + ||z − y|| = d (x, z) + d (z, y), de donde se concluye que (V, d) es un espacio métrico. De esta forma, hemos construido varios ejemplos de espacios métricos: a) (Rn , d) donde d : Rn × Rn −→ R+ ∪ {0} está dada por ! p1 n X p p ≥ 1. d (x, y) = |xi − yi | i=1 En particular, cuando p = 2 se tiene la distancia euclidiana. b) (Rn , d), definiendo a d como d (x, y) = ||x − y||∞ c) (C[a,b] , d) donde d está definida como Z d (f, g) = a ! 21 b |f (x) − g (x)|2 dx , por mencionar algunos. 2. Sea X = 6 ∅ un conjunto arbitrario y defı́nase la función d como  si x = 6 y  1 d (x, y) =  0 si x = y. Entonces (X , d) es un espacio métrico. La verificación de los detalles se dejan al lector. Nótese que este ejemplo nos dice que cualquier conjunto distinto del vacı́o, se puede equipar con una métrica. 3. Sea X = {0, 1} y considérese el conjunto Y = X 9 , es decir, las 9-adas en cuyas entradas hay sólo 0’s y 1’s. Defı́nase d como d (x, y) = número de lugares en los cuales x y y son diferentes. Entonces (Y, d) es un espacio métrico (de hecho, nótese que d (x, y) = 9 X i=1 |xi − yi |). 24 1.4. Espacios métricos 4. Sea X = {x = {xi }i ∈ N | xi ∈ R, X i∈N x2i < ∞} y defı́nase d (x, y) = sX i∈N (xi − yi )2 . Antes de verificar que esta función es una métrica, recordemos que dos sucesiones x y y son iguales si xi = yi para toda i ∈ N. Ahora, es claro que d (x, y) ≥ 0, alcanzando la igualdad si y solamente si xi − yi = 0 para toda i ∈ N. Por otra parte, obsérvese que sX sX 2 d (x, y) = (xi − yi ) = (yi − xi )2 = d (y, x). i∈N i∈N Finalmente, para la desigualdad del triángulo, si x, y, z ∈ X , entonces las series X X X (xi − yi )2 , (xi − zi )2 , (zi − yi )2 , i∈N i∈N i∈N convergen. Luego n X i=1 ! 21 (xi − yi ) 2 ≤ n X i=1 ! 21 2 (xi − zi ) + n X i=1 ! 12 2 (zi − yi ) por la desigualdad de Minkowski. Haciendo tender n a infinito, se tiene el resultado. A este espacio se le conoce como espacio de Hilbert (real) y suele denotarse como l2 . 5. Sean (Xi , di ), i ∈ {1, ..., n} espacios métricos. Tómese X = X1 × X2 × · · · × Xn . Defı́nase para x, y ∈ X la función d (x, y) = n X di (xi , yi ), i=1 donde x = (x1 , ..., xn ) y y = (y1 , ..., yn ). Se afirma que (X , d) es un espacio métrico. Para demostrar esta afirmación, verificamos los axiomas de la definición de métrica. Como di es métrica para toda i ∈ {1, ..., n}, se sigue que d (x, y) ≥ 0, alcanzando la igualdad cuando cada uno de los sumandos se anula. Esto último sucede si y sólamente si xi = yi para toda i ∈ {1, ..., n}, ya que di es métrica. Además d (x, y) = n X i=1 di (xi , yi ) = n X i=1 di (yi , xi ) = d (y, x). 25 1. Espacios normados Finalmente, como cada di es métrica, se tiene que d (x, y) = n X i=1 di (xi , yi ) ≤ n X di (xi , zi ) + i=1 n X di (zi , yi ) i=1 = d (x, z) + d (z, y), donde z = (z1 , ..., zn ). 6. Sea (X , d) un espacio métrico y Y ⊆ X . Entonces, la restricción dI = d|Y × Y : Y × Y −→ R+ ∪ {0}, es una métrica en Y. Al espacio (Y, dI ) se le conoce como subespacio métrico. (Recuerde que si f : A −→ B y g : C −→ B tal que A ⊆ C y f (x) = g (x) para toda x ∈ A, entonces se dice que f es la restricción de g sobre A). En un espacio métrico es posible hablar de vecindades de un punto. Definición 8 Sean (X , d) un espacio métrico, x ∈ X y ε > 0. Definimos la bola abierta de radio ε con centro en x como Bε (x) = {y ∈ X | d (x, y) < ε} Definición 9 Una vecindad de x es un conjunto U ⊂ X , tal que existe ε > 0 de tal forma que Bε (x) ⊂ U . Se dice que dos métricas son equivalentes si para cada punto en el espacio métrico, ambas determinan las mismas vecindades de dicho punto, es decir, dos métricas d y d0 son equivalentes si y sólo si para cada punto x ∈ X se cumple lo siguiente: Dada ε > 0 existe ε0 > 0 tal que si d0 (x, y) < ε0 , entonces d (x, y) < ε; y dada δ 0 > 0 existe δ > 0 tal que si d (x, y) < δ, entonces d0 (x, y) < δ 0 . Para cerrar este capı́tulo, resulta interesante describir geométricamente las bolas generadas en R2 y R3 por las normas || · ||p . Consideremos los conjuntos Bε(p) = {y ∈ Rn | ||y||p < 1} p ≥ 1, n = 2, 3. Primero consideremos el caso n = 2. Si p = 1, el conjunto anterior se puede escribir como {y ∈ R2 | |y1 | + |y2 | < 1}. Para describir geométricamente este conjunto, parecerı́a natural analizar el conjunto de puntos cuyas entradas satisfacen la siguiente igualdad |y1 | + |y2 | = 1. 26 1.4. Espacios métricos (0, 1) (1, 0) Figura 1.7: Bola generada por la norma || · ||1 en R2 Nótese que como se está tratando con valores absolutos, basta con analizar lo que sucede en el cuadrante positivo. El resto del conjunto se obtiene reflejando con respecto al origen y al eje y. De esta forma, trataremos la igualdad y1 + y2 = 1, que es equivalente a la igualdad y2 = 1 − y1 , la cual describe una recta que pasa por los puntos (1, 0) y (0, 1). Reflejando con respecto al eje de las ordenadas y con respecto al origen, obtenemos el conjunto descrito en la Figura 1.7. Obsérvese que los puntos que quedan debajo de la recta, satisfacen que y1 + y2 < 1, (1) por lo que los puntos que conforman al conjunto Bε en R2 son los que se encuentran ”adentro”del cuadrado descrito en la Figura 1.7. Si p = 2, nótese que se tiene una circunferencia con centro en el origen. (0, 1) (1, 0) Figura 1.8: Bola generada por la norma || · ||∞ en R2 Por otra parte, el conjunto B definido como B = {y ∈ R2 | ||y||∞ < 1}, 27 1. Espacios normados genera un lugar geométrico como el descrito en la Figura 1.8, esto debido a que si consideramos el conjunto de puntos (y1 , y2 ) tales que máx {|y1 |, |y2 |} = 1, tanto sus abscisas como sus ordenadas no podrán exceder 1, es decir, se tiene que y1 , y2 ∈ [0, 1]. Si y1 ∈ [0, 1) entonces, necesariamente, y2 = 1 y viceversa, si y2 ∈ [0, 1), entonces, forzosamente y1 = 1. Ahora, si x1 ∈ (0, 1), entonces, para 1 ≤ p ≤ q, se cumple que xq1 ≤ xp1 , de donde se obtiene que 1 − xp1 ≤ 1 − xq , de donde se concluye que la bola generada con la norma || · ||p está contenida en la bola generada por la norma || · ||q , para p < q, obteniendo una situación como la descrita en la Figura 1.9 (0, 1) ||X||1 ||X||2 (1, 0) ||X||4 ||X||∞ Figura 1.9: Comparativo de las bolas generadas por diferentes normas Se puede hacer un análisis similar para el caso de R3 . Para el caso de la norma || · ||1 , obsérvese que la ecuación x1 + x2 + x3 = 1, x1 , x2 x3 ≥ 0, describe un plano que pasa por los puntos (0, 0, 1), (0, 1, 0) y (1, 0, 0). Luego, al reflejar con respecto a los ejes y al origen, obtenemos un octaedro (véase la Figura 1.10). La norma || · ||2 genera una esfera, la norma || · ||∞ un cubo y, por un argumento similar al del caso bidimensional, la bola generada por || · ||p está contenida en la generada por || · ||q , si p ≤ q. Figura 1.10: Norma || · ||1 en R3 Capı́tulo 2 Elementos básicos de topologı́a Existen dos conceptos fundamentales en el desarrollo del cálculo diferencial y, en general, en el análisis real: la convergencia de sucesiones y la continuidad de funciones. Más adelante, definiremos funciones sobre subconjuntos de puntos contenidos en espacios de dimensiones superiores y es conveniente conocer ciertas propiedades de conjuntos que llamaremos abiertos, cerrados y compactos. Estos conjuntos generalizan las ideas de intervalos abiertos y cerrados en la recta real y constituyen las ideas básicas de la topologı́a. Gran parte de los resultados que desarrollamos en este capı́tulo dependen únicamente de las propiedades de la función distancia por lo que, en algunas ocasiones, haremos un análisis de estos conjuntos en espacios métricos más generales. A menos que haya confusión, denotaremos unicamente por X a un espacio métrico (X , d). 2.1. Conjuntos abiertos El concepto de conjunto abierto es crucial en el estudio del cálculo y el análisis real. Definición 10 Sea X un espacio métrico y A ⊆ X . Se dice que A es un conjunto abierto en X , si para todo x ∈ A, existe ε > 0 tal que Bε (x) ⊂ A. Nótese que, por la definición 9, un conjunto es abierto si y solamente si es vecindad de todos sus puntos. A partir de la definición se puede demostrar que Bε (x), ε > 0, es un conjunto abierto. Proposición 2.1.1 Sean X un espacio métrico, ε > 0 y x ∈ X . Entonces Bε (x) es un conjunto abierto. Demostración. Sea y ∈ Bε (x). Debemos exhibir un valor ε0 > 0 tal que Bε0 (y) ⊂ Bε (x). La Figura 2.1 sugiere que al tomar ε0 = ε − d(x,y) , que es 2 29 30 2.1. Conjuntos abiertos x y ε − d (x,y) 2 Figura 2.1: Idea para la demostración de la Proposición 2.1.1 estrictamente positivo ya que d (x, y) < ε, Bε0 (y) ⊂ Bε (x). En efecto, si z ∈ Bε0 (y), entonces d (x, z) ≤ d (z, y) + d (y, x) < ε0 + d (x, y) = d (x, y) + ε < ε. 2 Por tanto, z ∈ Bε (x). En la demostración de la Proposición 2.1.1, obsérvese que ε0 depende de la elección de y, esto es, Bε0 (y) será más pequeña si y está más cerca del contorno de la bola. Ejemplos. 1. Sea X = R2 con la métrica generada por la norma euclidiana. Consideremos el conjunto dado por A = {(x, y) ∈ R2 | x ∈ (a, b)}. Se afirma que A es abierto. La Figura 2.2 nos da una idea para la elección de ε. Para un punto s = (x, y) ∈ A, proponemos ε = mı́n {|x − a|, |x − b|}. Sin pérdida de generalidad, podemos suponer que 0 < a < b. Tómese un punto z = (z1 , z2 ) ∈ Bε (s), es claro que |z1 − x| ≤ d (z, s) < ε. Si ε = x − a, entonces se tiene que |z1 − x| < x − a ⇔ a − x < z1 − x < x − a ⇔ a < z1 < 2x − a = x + (x − a) < b, de donde se sigue que z ∈ A. Si ε = b − x, entonces |z1 − x| < b − x ⇔ x − b < z1 − x < b − x ⇔ 2x − b < z1 < b. 31 2. Elementos básicos de topologı́a Ahora, 2x − b > a ya que, de lo contrario, se tendrı́a que x < esto implica que a+b 2 , b−a b−a y x−a < , 2 2 de donde se concluye que x − a < b − x, lo cual es una contradicción. Por tanto, 2x − b > a de donde se concluye que z ∈ A y por lo tanto A es abierto. b−x > x a b Figura 2.2: El conjunto A = {(x, y) ∈ R2 | x ∈ (a, b)} es abierto 2. Sean A y B subconjuntos abiertos de Rn . Definimos A + B = {x + y ∈ Rn | x ∈ A, y ∈ B}. Se afirma que A + B es un conjunto abierto. Para ver esto, consideremos un punto arbitrario z ∈ A + B, entonces existen elementos x ∈ A y y ∈ B tales que z = x + y. Como A es abierto, existe ε > 0 tal que Bε (x) ⊂ A. Demostraremos que Bε (z) ⊂ A + B. Sea w ∈ Bε (z), entonces ||w − z|| = ||w − (x + y)|| < ε. Ahora, obsérvese que w − (x + y) = (w − y) − x, en consecuencia, w − y ∈ Bε (x) ⊂ A. Como y ∈ B y w = (w − y) + y, se sigue que w ∈ A + B. Por tanto A + B es abierto. 3. Sea X un conjunto arbitrario, distinto del vacı́o y equipado con la métrica discreta. Si A ⊆ X , entonces para todo punto x ∈ A tomamos ε = 21 . Luego, Bε (x) = {x} ⊂ A. Por tanto, todo subconjunto de X es abierto con la métrica discreta. 32 2.1. Conjuntos abiertos 4. Sea X un espacio normado y x ∈ X . Entonces el conjunto {x} no es abierto. Nótese que si tomamos la unión de una colección arbitraria de intervalos abiertos en R, obtendremos un conjunto abierto. Sin embargo, la intersección arbitraria de intervalos abiertos no siempre da como resultado un conjunto abierto. A saber, considérese la colección de intervalos dada por In = (x0 − 1 1 , x0 + ), n n n ∈ N, para alguna x0 ∈ R. Obsérvese que \ In = {x0 }. n∈N Este ejemplo nos sugiere la siguiente propiedad de los conjuntos abiertos. Proposición 2.1.2 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de abiertos en X , entonces [ 1. Para cualquier conjunto de ı́ndices Λ, Aα es abierto en X . α∈Λ 2. Si Λ es un conjunto de ı́ndices finito, entonces En particular, si Λ = ∅, por definición [ α∈Λ \ α∈Λ Aα es abierto en X . Aα = ∅ y \ α∈Λ Aα = X . Demostración. [ 1. Sea x ∈ Aα , entonces existe α ∈ Λ tal que x ∈ Aα . Como Aα es α∈Λ abierto, existe ε > 0 tal que Bε (x) ⊂ Aα ⊂ por tanto [ [ Aα , α∈Λ Aα es abierto. α∈Λ 2. Sea x ∈ \ α∈Λ Aα , entonces x ∈ Aα para toda α ∈ Λ. Como cada Aα es abierto, existe εα > 0 tal que Bεα ⊂ Aα . Como Λ es finito, podemos tomar ε = {εα | α ∈ Λ}; ε > 0 y claramente Bε (x) ⊂ Bεα (x) para toda α ∈ Λ. Por tanto, \ Bε ⊂ Aα , α∈Λ 33 2. Elementos básicos de topologı́a de donde se concluye que \ Aα es abierto. α∈Λ Finalmente, como X contiene a todas las bolas, entonces es abierto y ∅, por vacuidad, es abierto. En general, un conjunto con una colección de subconjuntos (llamados por definición abiertos) que satisfacen las condiciones de la proposición 2.1.2 y contiene al vacı́o y al conjunto total, se le llama espacio topológico y a la colección de subcojuntos se le llama topologı́a. Definición 11 Dos normas definidas sobre un mismo espacio vectorial V se dicen equivalentes, cuando inducen la misma topologı́a sobre V , esto es, definen los mismos abiertos en V . Esta definición es equivalente a la siguiente definición. Definición 12 Dos normas || · || y || · ||∗ sobre V son equivalentes si y sólo si existen dos constantes a, b > 0 tales que a||x|| ≤ ||x||∗ ≤ b||x|| ∀ x ∈ V. Diremos que dos normas están relacionadas (|| · || ∼ || · ||∗ ) si y sólo si son equivalentes. Es claro que esta relación es de equivalencia. Proposición 2.1.3 En Rn , las normas dadas por ! p1 n X p ||X||p = |xi | i=1 y ||X||∞ = máx {|xi | | i ∈ {1, ...., n}}, X = (x1 , ..., xn ), son equivalentes. Demostración. Obsérvese que ||X||∞ = |xj | para alguna j ∈ {1, ..., n}. Luego, se tiene que   p1 X 1 (|xj |p ) p = |xj | ≤  |xi |p + |xj |p  , i 6= j por tanto ||X||∞ ≤ ||X||p . Por otro lado, nótese que |xi | ≤ ||X||∞ ∀ i ∈ {1, ..., n} n X ⇒ |xi |p ≤ n (||X||∞ )p i=1 ⇒ ||X||p ≤ √ p n ||X||∞ . 34 2.1. Conjuntos abiertos Este resultado nos permite trabajar indistintamente con cualquier norma. Más adelante demostraremos que cualquier norma en Rn es equivalente a la norma || · ||p , por lo que basta analizar las propiedades de los abiertos en Rn con la norma euclidiana. Presentamos ahora otra noción topológica básica que caracteriza a los conjuntos abiertos. Definición 13 Sean X = (X, d) un espacio métrico y A un subconjunto de X. Se dice que un punto x ∈ A es interior, si existe U ⊂ X abierto tal que x ∈ U ⊂ A. A la colección de todos los puntos interiores se le llamará interior de A y se denota por Ao . Ejemplos. 1. Considérese el conjunto A = {(x, y) ∈ R2 | x ∈ (a, b)}. Ya se verificó que este conjunto es abierto, es decir, para todo x ∈ A, existe ε > 0 tal que Bε (x) ⊂ A. También, hemos demostrado que para todo punto x en un espacio métrico, Bε (x) es un conjunto abierto. En consecuencia, es claro que Ao = A. 2. Sea A = [a, b]. Se afirma que Ao = (a, b). Si x ∈ (a, b), como éste último es un conjunto abierto, se sigue que existe un valor ε > 0 tal que Bε (x) ⊂ A, esto es, existe un conjunto abierto totalmente contenido en (a, b) que contiene al punto x. Por otro lado, si x ∈ Ao , entonces existe U ⊂ R abierto, tal que x ∈ U ⊂ A. Ahora, x 6∈ (−∞, a) ∪ (b, ∞), ya que de lo contrario, como (−∞, a) ∪ (b, ∞) es un conjunto abierto, se puede construir un intervalo centrado en x de radio ε > 0, tal que esté totalmente contenido en (−∞, a) ∪ (b, ∞). Por otra parte, x 6= a, ya que para toda ε > 0, (a − ε, a + ε) interseca al complemento de A, es decir, no existe una vecindad de a que esté totalmente contenida en (a, b). Un argumento similar demuestra que b tampoco es punto interior. Por tanto, x ∈ (a, b), de donde se sigue que Ao = (a, b). El siguiente resultado proporciona otras descripciones equivalentes del interior de un conjunto. Proposición 2.1.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces, las siguientes afirmaciones son equivalentes. 35 2. Elementos básicos de topologı́a a) x es un punto interior de A. b) Existe ε > 0 tal que Bε (x) ⊂ A. c) x ∈ S {B ⊆ A | B es un conjunto abierto} Demostración. a) ⇒ b) Si x ∈ Ao , entonces existe un abierto U tal que x ∈ U ⊂ A. Como U es abierto, existe ε > 0 tal que Bε ⊂ U ⊂ A. b) ⇒ a) Ya se demostró que Bε (x) es un conjunto abierto, por lo que es claro que x es un punto interior de A. a) ⇒ c) S Sea G = {B ⊆ A | B es un conjunto abierto}. Se tiene que x ∈ G, si y sólamente si x ∈ B, para algún abierto B ⊆ A, esto es, x ∈ Ao . c) ⇒ a) Si x ∈ Ao , entonces existe un abierto U tal que x ∈ U ⊂ A. Por tanto x ∈ G. La proposición 2.1.4 muestra que el interior de un conjunto es abierto. Más aún, un conjunto A es abierto si y sólamente si A = Ao . Nótese que el interior de un conjunto es el abierto más grande contenido en A. El siguiente resultado muestra algunas propiedades para los interiores de conjuntos en un espacio métrico. La demostración de estos hechos se le deja al lector. Proposición 2.1.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos de X. Entonces 1. X o = X. 2. Ao ⊆ A. 3. (Ao )o = Ao . 4. (A ∩ B)o = Ao ∩ B o . 5. Si A ⊆ B, entonces Ao ⊆ B o . 6. Ao ∪ B o ⊆ (A ∪ B)o . 36 2.2. Conjuntos cerrados 2.2. Conjuntos cerrados Los conjuntos que se conocen como cerrados, al igual que los abiertos, determinan la topologı́a de los espcaios métricos. Sin embargo, sus propiedades son diferentes a las de los abiertos, por lo que resulta importante estudiarlos por separado. Definición 14 Sean X = (X, d) un espacio métrico y B ⊂ X. Se dice que B es un conjunto cerrado si B c es abierto. Ejemplos. 1. Sea x ∈ Rn . Se afirma que {x} es un conjunto cerrado en Rn . Para ver esto, considérese Rn − {x} y tómese un punto y ∈ Rn − {x}. Definimos ε = d (x,y) y construı́mos la bola con centro en y y radio ε. Luego, si 2 z ∈ Bε (y), entonces d (x, z) ≥ d (x, y) − d (z, y) ≥ d (x, y) − ε = d (x, y) − d (x, y) d (x, y) = > 0, 2 2 de donde se sigue que d (x, z) > 0, por lo que z ∈ Rn − {x}. Ası́, Rn − {x} es abierto y, por lo tanto {x} es cerrado en Rn . Más aún, por la proposición 2.2.1, se sigue que un conjunto finito en Rn es cerrado. y Figura 2.3: El complemento de la bola unitaria es un conjunto abierto 2. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Se afirma que C es cerrado. Para demostrar esta afirmación, nótese que si y ∈ C c , se tiene que ||y||2 > 1, por lo que tomamos ε = ||y||2 − 1 (véase la Figura 2.3). Sea z ∈ Bε (y). Aplicando la desigualdad del triángulo se tiene que ||y||2 − ||z||2 ≤ ||y − z||2 < ε ⇔ 1 = ||y||2 − ε < ||z||2 , es decir, z ∈ C c . En consecuencia, Bε (y) ⊂ C c , esto es, C c es abierto, de donde se concluye que C es cerrado. 37 2. Elementos básicos de topologı́a 3. El conjunto dado por R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]}, no es un conjunto cerrado. Nótese que el conjunto Rc no es abierto, ya que para toda ε > 0, la bola de radio ε centrada en un punto de la forma (a, y), donde y ∈ (c, d), no está totalmente contenida en Rc (véase la Figura 2.4). d c a b Figura 2.4: El conjunto R no es cerrado De la definición 14 y la proposición 2.1.2, se obtiene el siguiente resultado. Proposición 2.2.1 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de cerrados en X , entonces \ 1. Para cualquier conjunto de ı́ndices Λ, Aα es cerrado en X . α∈Λ 2. Si Λ es un conjunto de ı́ndices finito, entonces X. [ Aα es cerrado en α∈Λ Otro concepto topológico básico que nos ayudará a determinar si un conjunto es cerrado es el de punto de acumulación. Definición 15 Sean X = (X, d) un espacio métrico y A ⊂ X. Se dice que un punto x ∈ X es un punto de acumulación de A si existe un abierto U ⊂ X tal que x ∈ U y (U − {x}) ∩ A 6= ∅. Al conjunto de puntos de acumulación de A se le conoce como conjunto derivado y se denota por A0 . 38 2.2. Conjuntos cerrados Obsérvese que esta definición nos dice que un punto es de acumulación de un conjunto A, si está arbitrariamente cercano a los puntos de A. Por la proposición 2.1.1, podemos reformular la definición 15 de la siguiente manera: Se dice que un punto x ∈ X es un punto de acumulación de A si para toda ε > 0, (Bε (x) − {x}) ∩ A 6= ∅. Se dice que un punto x ∈ A es aislado si existe un valor ε > 0 tal que (Bε (x) − {x}) ∩ A = ∅. Ejemplos. 1. Sea A = (0, 1). Si x ∈ [0, 1], es claro que para toda ε > 0 se cumple que ((x − ε, x + ε) − {x}) ∩ (0, 1) = 6 ∅. Si x < 0, como (−∞, 0) es un conjunto abierto, existe un valor ε > 0 tal que (x − ε, x + ε) ⊂ (−∞, 0), es decir, existe un valor ε tal que el intervalo centrado en x de radio ε no interseca al conjunto A, de donde se concluye que x no es punto de acumulación para el conjunto A. Un argumento similar prueba que ningún punto en (1, ∞) es de acumulación de A. 2. Considérese el conjunto dado por A = {(x, y) ∈ R2 | x ∈ [0, 1], y ∈ Q ∩ (0, 1)}. Se afirma que A0 = [0, 1] × [0, 1]. Para ver esto, sea w = (x, y) ∈ [0, 1] × [0, 1]. Por la propiedad arquimediana, para todo valor ε > 0, se satisface que (y − ε, y + ε) ∩ Q 6= ∅, donde y ∈ [0, 1]. De esta forma, para toda ε > 0 se tiene que (Bε (w) − {w}) ∩ A 6= ∅, de donde se sigue que w ∈ A0 . Finalmente, si w ∈ A0 , por la parte anterior se sigue que w ∈ [0, 1] × [0, 1]. 3. Sea {xn }n ∈ N ⊂ R, una sucesión de puntos distintos, acotada. Por el teorema de Bolzano-Weierstrass para sucesiones en R, existe una subsucesión {xnk } convergente, digamos a x0 . Luego, x0 es un punto de acumulación para la sucesión {xn }, ya que para toda ε > 0, existe N ∈ N tal que |xnk − x0 | < ε, si nk > N . Esto quiere decir que para toda ε > 0, (Bε (x0 ) − {x0 }) ∩ {xn } 6= ∅. 2. Elementos básicos de topologı́a 39 4. Tómese la bola A = Bε (x) ⊂ R2 . Se puede ver que el conjunto Bε (x) = {y ∈ R2 | d (x, y) ≤ ε} es el conjunto de puntos de acumulación de A (la verificación de los detalles se le dejan al lector). Sin embargo, este resultado es falso en general. Si consideramos X un conjunto arbitrario, distinto del vacı́o, equipado con la métrica discreta, nótese que, para x ∈ X, B1 (x) = {x} ⇒ (B1 (x))0 = ∅. Por otro lado B1 (x) = {y ∈ R2 | d (x, y) ≤ 1} = X. Las nociones de punto de acumulación y conjunto cerrado están fuertemente relacionadas, tal y como lo muestra el siguiente resultado. Teorema 2.2.2 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces A es cerrado si y sólamente si A0 ⊆ A. Demostración. Supongamos que A es un conjunto cerrado. Si x ∈ Ac , entonces existe un valor ε > 0 tal que Bε (x) ⊂ Ac . Luego Be (x) ∩ A = ∅, de donde se sigue que x 6∈ A0 . Por tanto, A contiene a todos sus puntos de acumulación. Por otro lado, supongamos que A0 ⊆ A. Si x ∈ Ac , entonces x 6∈ A0 , de donde se sigue que existe ε > 0 tal que Bε (x) ∩ A = ∅, es decir, Bε (x) ⊂ Ac , por lo que se concluye que Ac es abierto, lo cual prueba el resultado. En la sección anterior vimos que el interior de un conjunto A es el abierto más grande contenido en A. De manera similar, podemos construir el conjunto cerrado más pequeño que contiene a A. Definición 16 Sean X = (X, d) un espacio métrico y A ⊂ X. Se define la cerradura de A, denotada por A, como el conjunto \ A = {B ⊂ X | A ⊂ B, B cerrado} Como la intersección arbitraria de cerrados es un conjunto cerrado, se sigue que A es cerrado. Nótese que A ⊂ A. El siguiente resultado muestra la conexión entre los puntos de acumulación y la cerradura de un conjunto. Proposición 2.2.3 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces A = A0 ∪ A. Demostración. Sea B = A ∪ A0 . Por el Teorema 2.2.2, se sigue que cualquier conjunto cerrado que contiene a A, debe contener a B. Por tanto, basta con demostrar que B es cerrado. Para ver esto, sea y ∈ B 0 , esto es, para ε > 0 (Bε (y) − {y}) ∩ B 6= ∅. 40 2.2. Conjuntos cerrados Tómese z ∈ (Bε (y) − {y}) ∩ B; luego z ∈ A ó z ∈ A0 . En este último caso, tomando ε0 = ε − d (z, y), se tiene que (Bε0 (z) − {z}) ∩ A 6= ∅ donde Bε0 (z) − {z} contiene puntos distintos de y, es decir, y ∈ A0 y, en consecuencia, y ∈ B. De esta forma, B es el cerrado más pequeño que contiene a A, como se querı́a demostrar. Como consecuencia de esta proposición se tiene que un conjunto A es cerrado si y sólo si A = A. El siguiente resultado muestra otra forma de definir la cerradura de un conjunto. Proposición 2.2.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces x ∈ A si y sólamente si λ = ı́nf {d (x, y) | y ∈ A} = 0. Demostración. Si x ∈ A, por la proposición 2.2.3, x ∈ A ó x ∈ A0 . Si x ∈ A, tomando x = y se sigue que λ = 0. Si x ∈ A0 , entonces para toda ε > 0 existe y ∈ A tal que d (x, y) < ε, de donde se concluye nuevamente que λ = 0. Por otro lado, si λ = 0 y x 6∈ A, como λ es el ı́nfimo, se tiene que para cualquier valor ε > 0, existe y ∈ A tal que d (x, y) < ε, de donde se obtiene que x ∈ A0 , que era lo que se querı́a demostrar. En forma análoga a los interiores de conjuntos, el siguiente resultado presenta algunas propiedades para la cerradura de conjuntos. Dejamos la verificación de los detalles al lector. Proposición 2.2.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos de X. Entonces 1. ∅ = ∅. 2. A ⊆ A. 3. A = A. 4. A ∪ B = A ∪ B. 5. Si A ⊆ B, entonces A ⊆ B. 6. A ∩ B ⊆ A ∩ B. Para cerrar esta sección, presentamos el concepto de frontera de un conjunto. Definición 17 Sean X = (X, d) un espacio métrico y A ⊂ X. Definimos la frontera de A, denotada por ∂ A, como el conjunto ∂ A = A ∩ Ac . 41 2. Elementos básicos de topologı́a Como la intersección de conjuntos cerrados es un conjunto cerrado, se sigue que la frontera de A es un conjunto cerrado. Además, n’otese que ∂ A = ∂ Ac . Proposición 2.2.6 Sea A ⊂ X. Entonces x ∈ ∂ A si y sólo si para toda ε > 0, Bε (x) ∩ A 6= ∅ 6= Bε (x) ∩ Ac (2.1) Demostración. Si x ∈ X tal que se satisface la condición (2.1), entonces Bε (x) contiene puntos de A y de Ac distintos de x. Ası́, x ∈ ∂ A. Por otra parte, supongamos que x ∈ ∂ A. Obsérvese que x ∈ A ó x ∈ Ac . Si x ∈ A, como x ∈ ∂ A, por el Teorema 2.2.2, se sigue que x ∈ (Ac )0 . Un argumento similar muestra que si x ∈ Ac , entonces x ∈ A0 . 2.3. Sucesiones El concepto de convergencia es uno de los más importantes en diversas áreas de la matemática. En esta sección, estudiaremos la noción de convergencia de una sucesión en espacios métricos, en particular, en Rn . Recordemos que una sucesión en un conjunto X 6= ∅, es una función que asocia un número natural a un elemento de X, esto es, una correspondencia de la forma S : N −→ R, donde R ⊆ X. Normalmente, cuando nos referimos a la imagen de un elemento n en el dominio, bajo una función S, la denotamos por S(n). Sin embargo, en el caso de las sucesiones, denotaremos por Sn a la imagen del natural n; a la sucesión con los elementos Sn la denotaremos por {Sn }∞ n=1 . Por otra parte, al conjunto R lo llamaremos recorrido de la sucesión. Según la propia definición, una sucesión contiene una infinidad de elementos. Recordemos la definición de convergencia en R. Si los términos de una sucesión {xn } se acercan a un número L, se dice que la sucesión tiende al lı́mite L (también suele decirse que xn converge a L) y se denota por lı́m xn = L n→∞ este sı́mbolo se lee: el lı́mite de la sucesión xn cuando n tiende a infinito es L. L xN + 1 Figura 2.5: Convergencia en R xN 42 2.3. Sucesiones Definición 18 Sea {xn } una sucesión contenida en R. Se dice que {xn } converge a un valor L si dada ε > 0 existe N ∈ N tal que |xn − L| < ε para cualquier n > N . Intuitivamente, esta definición nos dice que la sucesión converge a un cierto valor si a partir de cierto momento los elementos de la sucesión y ese valor se parecen mucho. Gráficamente, el concepto de convergencia significa que para una N suficientemente grande, los elementos de la sucesión xN +1 , xN +2 , xN +3 , ..... pertenecen a un intervalo de radio ε con centro en el valor L. Nótese que los elementos xN +1 , xN +2 , xN +3 , ....., xN quedan fuera de este intervalo, es decir, en el intervalo de convergencia se encuentra una infinidad de elementos de la sucesión, mientras que fuera del intervalo quedan sólo un número finito (véase la Figura 2.5) La definición de convergencia en un espacio métrico es muy parecida. Definición 19 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una sucesión. Se dice que {xn } converge a x0 ∈ X, si para todo abierto U ⊂ X que contiene a x0 , existe N ∈ N tal que xn ∈ U , si n ≥ N . El siguiente resultado presenta una definición equivalente, con la que el lector puede estar más familiarizado. Proposición 2.3.1 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una sucesión. {xn } converge a x0 ∈ X si y sólo si dada ε > 0 existe N ∈ N tal que si n ≥ N , entonces d (xn , x0 ) < ε. Demostración. Supongamos que xn −→ x0 y sea ε > 0. Por la proposición 2.1.1, sabemos que Bε (x0 ) es abierto; luego, existe un valor N ∈ N tal que xn ∈ Bε (x0 ), esto es, d (xn , x0 ) < ε. Por otro lado, sea U una vecindad de x0 y supóngase que dada ε > 0 existe N ∈ N tal que si n ≥ N , entonces d (xn , x0 ) < ε. Como U es una vecindad de x0 , se puede encontrar un valor ε > 0 tal que Bε (x0 ) ⊂ U . De esta forma, existe N ∈ N tal que si n ≥ N , entonces xn ∈ Bε (x0 ) ⊂ U y, por tanto, xn −→ x0 , como se querı́a demostrar. Ejemplos. 1. Sea xn = n1 . Verificamos que {xn } converge a 0. Sea ε > 0, entonces se tiene que 1 1 1 = < ε ⇔ n > , n n ε como ε > 0, esta última desigualdad está bien definida, por lo que se sigue que la sucesión {xn } converge a cero. 43 2. Elementos básicos de topologı́a 2. Considérese la sucesión de números complejos dada por zn = 1 + ni . 2 Recordemos que existe una biyección entre C y R 2. De esta forma, {zn } 1 converge, si y sólo si xn = 1, n converge en R . Se afirma que {xn } converge a x0 = (1, 0). En efecto, obsérvese que 1 1 0, = < ε, ||xn − x0 ||2 = n 2 n para ε > 0 y n suficientemente grande. Ası́, zn −→ z0 , donde z0 = 1. 3. Tómese X un conjunto arbitrario, no vacı́o y equipado con la métrica discreta. Nótese que en este espacio, las sucesiones convergentes son las casi constantes, es decir, aquellas sucesiones tales que xn = x0 para n ≥ N. 4. Sea X = (0, 1] y considérese la métrica usual de R restringida a X. Sabemos que en R, la sucesión xn = n1 es convergente y converge a 0. Sin embargo, esta sucesión en X no converge, ya que 0 6∈ X. Este ejemplo muestra que el concepto de convergencia depende de la métrica y el espacio que estemos considerando. Una propiedad fundamental del lı́mite de una sucesión es la unicidad. Proposición 2.3.2 Sea {xn } una sucesión convergente contenida en un espacio métrico, entonces su lı́mite es único. Demostración. Supongamos que xn −→ x0 y xn −→ y0 , esto es, dada ε > 0, existe N ∈ N tal que d (xn , x0 ) < ε 2 y d (xn , y0 ) < ε , 2 si n ≥ N . Luego d (x0 , y0 ) ≤ d (x0 , xn ) + d (xn , yo ) < ε, si n ≥ N . Sabemos que en R, una sucesión convergente es acotada. Para ver este hecho en general, requerimos el concepto de conjunto acotado en espacios métricos. Definición 20 Sea X = (X, d) un espacio métrico y A ⊆ X. Se dice que A es acotado si existen x ∈ X y un valor M > 0 tal que A ⊂ BM (x). Proposición 2.3.3 Sean X un espacio métrico, {xn } una sucesión convergente, digamos a x0 y R el recorrido de la sucesión. Entonces a) R es acotado. b) x0 ∈ R0 44 2.3. Sucesiones Demostración. a) Sea ε = 1 y N ∈ N correspondiente a este valor. Entonces, si n ≥ N , xn ∈ B1 (x0 ). Tomando s = máx {d (x0 , xi ) | i ∈ {1, 2, ..., N − 1}} + 1, se sigue que xn ∈ Bs (x0 ) para toda xn ∈ R. b) Como para toda ε > 0, la bola Bε (x0 ) contiene un punto de R, se concluye que x0 ∈ R0 . Proposición 2.3.4 Sean X = (X, d) un espacio métrico y A un subconjunto de X. Si x0 ∈ A, entonces existe una sucesión {xn } ⊂ A tal que xn −→ x0 . Demostración. Como x0 ∈ A, para cada n ∈ N, existe un punto xn ∈ A tal que d (xn , x0 ) < n1 . Luego d (xn , x0 ) −→ 0, es decir, xn −→ x0 . Por otra parte, tómese la sucesión xn = (−1)n . Si suponemos que 1 es el punto de convergencia, nótese que para n = 2k − 1, k ∈ N, |xn − 1| = 2 > 1, por lo que 1 no puede ser lı́mite de la sucesión xn ; de forma análoga se puede verificar que −1 no es lı́mite de la sucesión xn . En el ejemplo anterior, si tomamos las subsucesiones {x2k }k ∈ N y {x2k − 1 }k ∈ N , observamos que convergen a 1 y a −1 respectivamente. Este hecho nos hace pensar en el siguiente resultado: Una sucesión converge a un número real α si y sólamente si todas sus subsucesiones convergen a α. Este resultado también es cierto para espacios métricos en general. Proposición 2.3.5 Una sucesión {xn } en un espacio métrico converge a x0 si y sólamente si todas sus subsucesiones convergen a x0 . Demostración. Supongamos que xn −→ x0 . Esto quiere decir que dada ε > 0, existe N ∈ N tal que d (xn , x0 ) , ε si n ≥ N . Sea {xnk } ⊆ {xn } una subsucesión. Entonces, existe M ∈ N tal que nk ≥ N para k ≥ M . Luego, si k ≥ M , se sigue que d (xnk , x0 ) < ε, como se querı́a demostrar. Por otra parte, si cada subsucesión de xn converge, en particular, la sucesión completa es subsucesión de sı́ misma, por lo que se sigue el resultado. Existe un tipo de sucesiones de particular interés: las sucesiones de Cauchy. Definición 21 Sean X un espacio métrico y {xn } un sucesión. Se dice que {xn } es de Cauchy, si dada ε > 0 existe N ∈ N tal que d (xn , xm ) < ε, si n, m ≥ N . 45 2. Elementos básicos de topologı́a De manera intuitiva, decimos que una sucesión es de Cauchy cuando, a partir de cierto momento, los elementos de la sucesión son prácticamente iguales. Otra propiedad de las sucesiones de Cauchy es que son acotadas. La demostración de este hecho es muy parecida al caso de sucesiones de Cauchy en R, por lo que la prueba se le deja al lector. El siguiente resultado presenta una condición necesaria para la convergencia de sucesiones en espacios métricos. Teorema 2.3.6 Sean X un espacio métrico y {xn } una sucesión convergente, digamos a x0 . Entonces {xn } es de Cauchy. Demostración. Como xn −→ x0 , entonces para toda ε > 0, existen N1 , N2 ∈ N, de tal forma que d (xn , x0 ) < ε si n > N1 2 y d (xm , x0 ) < ε si m > N2 . 2 Tomando N = máx {N1 , N2 }, se tiene que d (xn , x0 ) < ε 2 y d (xm , x0 ) < ε , 2 si n, m > N . En consecuencia, se sigue que d (xn , xm ) ≤ d (xn , x0 ) + d (xm , x0 ) < ε, esto es, {xn } es una sucesión es de Cauchy. La implicación inversa en general es falsa. Tomando X = (0, 1] y la sucesión xn = n1 , se tiene un ejemplo de una sucesión de Cauchy que no es convergente en X. A los espacios métricos que satisfacen la doble implicación los llamaremos completos. Demostraremos que Rn es un espacio métrico completo. Para demostrar este hecho, necesitamos algunos resultados previos. Definición 22 Sean (ai , bi ) ⊂ R, i ∈ {1, ...n}, una colección de intervalos abiertos. Se define una n-celda abierta como el producto cartesiano de los intervalos (ai , bi ), esto es, una n-celda abierta es el conjunto de la forma I n = {(x1 , ..., xn ) ∈ Rn | xi ∈ (ai , bi ), i ∈ {1, ...n}}. De forma similar, definimos la n-celda cerrada como el conjunto dado por J n = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}}. Obsérvese que un conjunto A ⊂ Rn es acotado si está contenido en una ncelda. Teorema 2.3.7 (de las celdas anidadas.) Sea {Jk }k ∈ N una sucesión de celdas cerradas en Rn \ tales que J1 ⊇ J2 ⊇ .... Entonces existe un punto x0 ∈ Rn tal que x0 ∈ Jk . k∈N 46 2.3. Sucesiones Demostración. Sea Jk el conjunto dado por (k) (k) Jk = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}} (k) (k − 1) (k) Nótese que [a1 , b1 ] ⊂ [a1 2.6). (k − 1) , b1 ], donde k > 1 (véase la Figura (1) b2 (2) b2 (2) a2 (1) a2 (1) (2) a1 a1 (3) a1 (3) (2) (1) b1 b1 b1 Figura 2.6: 2-celdas anidadas Por la completez de R, existe y1 ∈ R tal que \ (k) (k) y1 ∈ [a1 , b1 ]; k∈N aplicando el mismo argumento para las demás componentes, existe x0 ∈ Rn tal que x0 = (y1 , ..., yn ), donde yj ∈ En consecuencia, x0 ∈ (k) \ k∈N \ k∈N (k) [aj , bj ], j ∈ {1, ..., n}. Jk . Este resultado se puede generalizar a espacios métricos. Para ver la generalización, requerimos la siguiente definición. 47 2. Elementos básicos de topologı́a Definición 23 Sea X un espacio métrico. Definimos el diámetro de un conjunto A en el espacio métrico como diam (A) = sup{d (x, y) | x, y ∈ A}. Teorema 2.3.8 (del encaje de Cantor). Sean X = (X, d) un espacio métrico completo y {Ai }i ∈ N una sucesión de conjuntos tales que 1. An + 1 ⊆ An , n ∈ N. 2. Ai es cerrado para toda i ∈ N. 3. lı́m n −→ ∞ diam (An ) = 0. entonces, existe x0 ∈ X tal que \ i∈N Ai = {x0 }. Demostración. Sean xn ∈ An , y ε > 0. Como lı́m n −→ ∞ diam (An ) = 0, entonces existe N ∈ N tal que diam (An ) < ε, si n ≥ N . Como la sucesión de conjuntos es decreciente, se tiene que diam (An ) ≤ diam (AN ) si n > N . Ahora d (xn , xm ) ≤ diamAN < ε. Por tanto, la sucesión {xn } es de Cauchy y como el espacio es completo, se sigue que {xn } converge, digamos a un punto x0 . Por otra parte, como Ai es cerrado para toda i, se sigue que Ai = Ai . Nótese que {xn | n ≥ k} ⊂ Ak Se afirma que \ ni ∈ N Si existe a0 ∈ X tal que a0 ∈ Ai = {x0 }. \ Ai , entonces ni ∈ N 0 ≤ d (x0 , a0 ) ≤ diam (An ) < ε, para n suficientemente grande. Por tanto, x0 = a0 . El siguiente resultado generaliza el teorema de Bolzano-Weierstrass de R. Teorema 2.3.9 (Bolzano-Weierstrass). Todo subconjunto A ⊆ Rn acotado infinito, tiene un punto de acumulación. 48 2.3. Sucesiones Demostración. Sea A un subconjunto acotado con una cantidad infinita de elementos. Entonces existe una n-celda cerrada, digamos J1 , tal que A ⊂ J1 . Bisecando cada una de sus aristas, dividimos a J1 en 2n celdas cerradas. Como A tiene una infinidad de puntos, entonces existe una n-celda cerrada J2 , tal que J2 ⊂ J1 y que contiene una infinidad de elementos de A. Nuevamente, bisecando cada una de las aristas de J2 , encontraremos una celda cerrada J3 ⊂ J2 tal que contenga una infinidad de puntos de A. Repitiendo el proceso, obtenemos una sucesión de n-celdas cerradas que satisface las hipótesis\del Teorema 2.3.7. En consecuencia, existe un punto x0 ∈ Rn tal que x0 ∈ Jk . k∈N Por otro lado, si J1 = [a1 , b1 ] × · · · × [an , bn ], definimos la medida de J1 como 0 < l (J1 ) = sup {bi − ai | i ∈ {1, ..., n}}. Luego 0 < l (Jk ) = l (J1 ) 2k − 1 k ∈ N. (2) Sea U una vecindad de x0 y supongamos que Br (x0 ) ⊂ U , donde Br(2) (x0 ) = {x ∈ Rn | ||x − x0 ||2 < r}. Sea k ∈ N tal que Jk ⊂ U ; esto lo podemos hacer ya que √ |xi | ≤ ||x||2 ≤ n sup {|xi | | i ∈ {1, ..., n}}, ası́, si w ∈ Jk , entonces ||x0 − w||2 ≤ √ n l (Jk ) = √ n l (J1 ) . 2k − 1 Luego, por propiedad arquimediana, existe k ∈ N suficientemente grande, tal que √ n l (J1 ) < r. 2k − 1 Por tanto, para cada k ∈ N, se tiene que Jk ⊂ U . Como Jk tiene una cantidad infinita de elementos de A, se concluye que U contiene al menos un elemento de A distinto de x0 , es decir, x0 ∈ A0 , con lo que queda demostrado el teorema. Teorema 2.3.10 Rn es un espacio métrico completo. Demostración. Sea {xn } una sucesión de Cauchy y sea R su recorrido. Si R es finito, entonces todos los términos de la sucesión, salvo una cantidad finita, son iguales y, por tanto, {xn } converge. Por otra parte, si R es infinito, como una sucesión de Cauchy es acotada (¿Por qué?), se sigue que R es infinito y acotado y, por el teorema 2.3.9, R tiene un punto de acumulación, digamos 49 2. Elementos básicos de topologı́a x0 . Esto último quiere decir que para toda ε > 0 B 2ε (x0 ) contiene un punto xm ∈ R. Finalmente, como {xn } es de Cauchy, se obtiene que d (xn , x0 ) ≤ d (xn , xm ) + d (xm , x0 ) < ε si n, m ≥ N, para alguna N ∈ N. Por tanto, xn −→ x0 . El Teorema 2.3.6 concluye la prueba. 2.4. Compacidad La compacidad es otra de las condiciones más importantes para resultados fundamentales en muchas áreas como la topologı́a, el análisis y el cálculo. En esta sección estudiaremos los conceptos básicos relacionados con la compacidad. Se analizarán condiciones equivalentes a la compacidad. Estudiaremos los teoremas fundamentales sobre compacidad en Rn y sus generalizaciones a espacios métricos. Para empezar, presentamos la definición de cubierta. Definición 24 Sean X = (X, d) un espacio métrico, A ⊆ X y C = {Uα }α ∈ Λ una colección de subconjuntos de X, donde Λ es un conjunto de ı́ndices. Se dice que C es una cubierta de A en X si [ A ⊂ Uα . α∈Λ Diremos que la cubierta es abierta (o cerrada), si Uα es abierto (o cerrado) para toda α ∈ Λ. Si C 0 ⊆ C y C 0 también es una cubierta, diremos que C 0 es una subcubierta de C para A. Diremos que una cubierta es finita (o numerable), si como conjunto es finito (o numerable). A continuación, presentamos la definición de conjuntos compactos en espacios métricos. Definición 25 Sean X = (X, d) y A ⊆ X. Se dice que A es compacto si toda cubierta abierta de A contiene una subcubierta finita. Ejemplos. a) Sea X un espacio métrico y consid́erese un punto x en el espacio. Es claro que el conjunto {x} es compacto. b) Sea [a, b] un intervalo cerrado en R. Se afirma que [a, b] es compacto. Para ver esto, sea C = {Cα }α ∈ Λ una cubierta de [a, b] y defı́nase el conjunto B = {x ∈ [a, b] | [a, x] se puede cubrir con una cantidad finita de elementos de C}. Nótese que B 6= ∅, ya que al menos a ∈ B. Además, para todo x ∈ B, se tiene que b > x. Por la propiedad del supremo, existe s ∈ R tal que 50 2.4. Compacidad s = sup B. Como a ∈ B y b > x para toda x ∈ B, se sigue que s ∈ [a, b]. En consecuencia, existe α0 ∈ Λ tal que s ∈ Cα0 . Luego, existe ε > 0 tal que (s − ε, s + ε) ⊂ Cα0 . También, existe x ∈ B tal que x ∈ (s − ε, s), es decir, [a, una subcubierta finita, digamos x] tiene {C1 , ..., Cn , Cα0 } Por tanto, a, s + 2ε tiene una subcubierta finita, a saber, {C1 , ..., Cn , }. Ası́, se concluye que s ∈ B. Se afirma que s = b. Si no, como a, s + 2ε tiene una subcubierta finita, entonces existe un elemento r ∈ B tal que r > s, lo cual es una contradicción. De esta forma, hemos demostrado que [a, b] es compacto. c) Si A ⊂ Rn es compacto y x ∈ Rm , entonces R = A × {x} es un subconjunto compacto en Rn × Rm . Para verificar esta afirmación, considérese una cubierta abierta C de R y defina la colección B = {B ⊂ Rn | B = {y ∈ A | (y, x) ∈ C}, para alguna C ∈ C}. Es claro que B es una cubierta abierta de A. Como A es compacto, existe una subcubierta de B para A, digamos B 0 = {B1 , ..., Bl }. Obsérvese cada Bi se corresponde con un elemento Ci de C, i ∈ {1, ..., n}, generando ası́ una subcubierta finita para R. Por tanto, R es compacto. Se puede demostrar, de manera inductiva que si n − 1 veces }| { z [−M, M ] × · · · × [−M, M ] ⊂ Rn − 1 es un conjunto compacto, entonces n veces z }| { [−M, M ] × · · · × [−M, M ] ⊂ Rn es compacto. d) Sea X = (X, d) el espacio métrico discreto y considérese un subconjunto A en este espacio. Si A es finito, como los abiertos en este espacio son subconjuntos de X, se sigue que A es compacto. Ahora, si A es compacto, entonces toda cubierta abierta de A tiene una subcubierta finita. Como los abiertos en X son subconjuntos de X, se sigue que A es finito. Ası́, los únicos conjuntos compactos en el espacio métrico discreto son aquellos subconjuntos finitos de X. Obsérvese que en la definición 25, podemos tomar A = X, en cuyo caso, estarı́amos hablando de espacios métricos compactos. Por otro lado, los ejemplos anteriores muestran que trabajar con cubiertas, en ocasiones, es complicado. Veremos que existen relaciones importantes entre la compacidad y algunas propiedades de numerabilidad. Un resultado importante, es el teorema de Lindelöf, el cual usaremos para demostrar el teorema de Heine-Borel. Para esto, necesitamos un resultado previo. 51 2. Elementos básicos de topologı́a Proposición 2.4.1 Sea B = {Br (x) ⊂ Rn | r ∈ Q, x = (x1 , ..., xn ), xi ∈ Q para toda i ∈ {1, ..., n}}. Sean y ∈ Rn y A ⊂ Rn un conjunto abierto tal que y ∈ S. Entonces, existe una bola Br (x) ∈ B tal que y ∈ Br (x) ⊂ A. Demostración. Sea y = (y1 , ..., yn ). Una primera observación es que la colección B es numerable. Si y ∈ Rn y A es un abierto tal que x ∈ A, entonces existe ε > 0 tal que Bε (y) ⊂ A. Luego, por la propiedad arquimediana, existe un valor wk ∈ Q tal que ε |yk − wk | < para cada k ∈ {1, ..., n}, 4n tomando w = (w1 , ..., wn ), se sigue que ||y − w||2 ≤ ||y − w||1 < ε . 4 Nuevamente, aplicando la propiedad arquimediana, existe r ∈ Q tal que ε ε < r < . 4 2 En consecuencia, existe r ∈ Q tal que y ∈ Br (w) ⊂ Bε (x) ⊂ A, como se querı́a demostrar. Teorema 2.4.2 (de Lindelöf). Sean A ⊆ Rn y C una cubierta de A. Entonces, existe una subcubierta de C numerable para A. Demostración. Sea B la colección de todas las bolas definida en la Proposición 2.4.1. Sea x ∈ A, entonces existe C ∈ C tal que x ∈ C. Por la Proposición 2.4.1, existe r ∈ Q y y ∈ Rn con coordenadas racionales, tal que x ∈ Br (y) ⊆ C. Como B es numerable, podemos pensar que B = {Ai }i ∈ N . Luego, para cada C ∈ C existe una infinidad numerable de elementos de B que cubren a C. Luego, existe m = m(x) ∈ N, x ∈ A, tal que x ∈ Am ⊂ A. Por tanto, {Am (x) }x ∈ A es una colección numerable de subconjuntos de Rn tal que [ A ⊂ Am (x) . Tomando la correspondencia x∈A Am (x) −→ C ∈ C tal que Am (x) ⊂ C, se sigue el resultado. Los siguientes resultados relacionan los conjuntos compactos con los cerrados en espacios métricos. 52 2.4. Compacidad Lema 2.4.3 Sean X = (X, d) un espacio métrico y A ⊂ X compacto. Entonces A es cerrado. Demostración. Sea x ∈ Ac y considérese la colección 1 An = y ∈ X | d (x, y) > . n Como d (x, y) > 0, para toda y ∈ X − {x}, entonces y ∈ An , para alguna n ∈ N. Se sigue que [ A ⊂ An , n∈N como A es compacto, entonces existe una subcubierta finita, a saber A ⊂ l [ An k . k=1 Tómese N = máx {nk | k ∈ {1, ..., l}}. Si ε = 1 N, por construcción, Bε (x) ⊂ Ac . En conclusión, Ac es abierto. Lema 2.4.4 Si X es un espacio métrico compacto y A es un conjunto cerrado en X , entonces A es compacto. Demostración. Sea {Cα }α ∈ Λ una cubierta abierta de A. Como A es cerrado, entonces {{Cα }α ∈ Λ , Ac } es una cubierta abierta de X. Como X es compacto , entonces existe una subcubierta finita, digamos {C1 , ..., Cn , Ac }. Luego, {C1 , ..., Cn } es una cubierta para A, concluyendo ası́ la prueba. El siguiente teorema es uno de los resultados centrales acerca de la compacidad de subconjuntos de Rn . Teorema 2.4.5 (Heine-Borel). Sea A ⊂ Rn . A es compacto si y sólo si es cerrado y acotado. Demostración. Supongamos que A es compacto. Por el lema 2.4.3, A es cerrado. Por otra parte, por el Teorema 2.4.2, existe una cubierta numerable de bolas para A. Como A es compacto, existe una subcubierta finita de bolas, n X digamos, {Bεi (xi )}i ∈ {1,...,n} . Considerando M = εi se sigue que A es i=1 acotado. Ahora, supongamos que A es cerrado y acotado. Consideremos una cubierta C de A. Por el Teorema 2.4.5, existe una subcubierta numerable R = {Ak }k ∈ N 53 2. Elementos básicos de topologı́a para A. Sea m ≥ 1 y tómese Sm m [ k=1 A ⊂ Ak . Obsérvese que Sm ⊆ Sm + 1 y que [ Sm . m∈N c Como Sm es abierto, entonces Sm es cerrado. Constrúyase la sucesión de conjuntos dada por Q1 = A, c Qm = A ∩ Sm , m > 1. Hacemos las siguientes observaciones 1. Qm = {puntos en A fuera de Sm }. 2. Qm es cerrado para toda m ∈ N. 3. Qm + 1 ⊆ Qm . 4. Qm ⊂ A, para toda m ∈ N y, por tanto, Qm es acotado. 5. diam (Qm ) −→ 0 conforme m −→ ∞. Aplicando el Teorema 2.3.8, se sigue que existe x ∈ A, tal que x ∈ Qm para toda m ∈ N, esto es, x 6∈ Sm para toda m ∈ N, lo cual es una contradicción al hecho de que {Sm } es una cubierta de A. Por tanto, existe m ∈ N, tal que Qm = ∅, de donde se conlcuye que A es compacto. Una segunda prueba de que un conjunto cerrado y acotado en Rn es compacto, es la siguiente: Como A es acotado, existe una n-celda cerrada J n , tal que A ⊂ J n . Por el ejemplo c) posterior a la definición 25, J n es compacto. Como A es cerrado, por el Lema 2.4.4, se sigue que A es compacto. Este resultado falla en general. Si consideramos un espacio discreto X y tomamos un subconjunto M infinito, éste no es compacto como se vió en el ejemplo d) posterior a la definición 25. Sin embargo, M es cerrado y acotado, ya que M ⊂ B2 (x0 ) ∀ x0 ∈ M Ejemplos. 1. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Ya vimos que C es cerrado y claramente es acotado. Por tanto C es compacto 2. Ya vimos que el conjunto dado por R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]}, no es un conjunto cerrado. Ası́, R no es compacto. 54 2.4. Compacidad 3. Tómese el conjunto R = {(x, y) ∈ R2 | y ∈ [c, d]}. Este conjunto, aunque es cerrado, no es compacto ya que no es acotado. Para ver esto, observe que la recta y = c está contenida en R. Se puede dar otra descripción de los conjuntos compactos, vı́a sucesiones. Definición 26 Sea X un espacio métrico. Se dice que un subconjunto A es secuencialmente compacto si toda sucesión {xn } en A tiene una subsucesión que converge a un punto x0 en A. No es difı́cil ver que un conjunto A en un espacio métrico es cerrado si y sólamente si, toda sucesión contenida en A convergente, converge dentro de A. La verificación de este hecho se deja como ejercicio al lector. Ası́, se afirma que si A es secuencialmente compacto, entonces A es cerrado. En efecto, sea {xn } ⊂ A tal que xn −→ x0 ∈ X. Como A es secuencialmente compacto, se sigue que existe una subsucesión {xnk } tal que xnk −→ x00 , pero por la Proposición 2.3.5, se sigue que x0 = x00 , de donde se concluye que A es cerrado. También, si A es secuencialmente compacto, entonces es acotado, ya que, de lo contrario, entonces existe x0 ∈ A y una sucesión {xn } ⊂ A tales que d (x − n, x0 ) ≥ n, de donde se concluirı́a que no existe una subsucesión de {xn } convergente, lo cual es una contradicción. Ahora, probaremos otro teorema central para conjuntos compactos en espacios métricos: el teorema de Bolzano-Weierstrass. Ya hemos probado una versión de este resultado en la sección anterior, pero fue para Rn . Presentamos su generalización. Necesitamos algunos resultados previos. Lema 2.4.6 Sean X un espacio métrico, A un conjunto secuencialmente compacto en X y {Aα }α ∈ Λ una cubierta abierta de A. Entonces, existe r > 0 tal que para cada x ∈ A, Br (x) ⊂ Aα para alguna α ∈ Λ. Al ı́nfimo de los números r se le conoce como número de Lebesgue para la cubierta. Demostración. Supongamos que no existe dicho número. Entonces, para toda n ∈ N existe un punto xn ∈ A tal que B n1 (xn ) no está contenida en Aα , para cualquier α ∈ Λ. Como A es secuencialmente compacto, existe una subsucesión {xnk } ⊂ {xn } de tal forma que xnk −→ x0 ∈ A. Dado que {Aα } es una cubierta de A, se tiene que x0 ∈ Aα0 para alguna α0 ∈ Λ. Luego, existe ε > 0 tal que Bε (x) ⊂ Aα0 . Ası́, para n suficientemente grande, obtenemos que ε 1 ε d (xn , x0 ) < y < , 2 n 2 de donde se concluye que B n1 (xn ) ⊂ Aα0 , lo cual es una contradicción que surge de suponer que no existe el número de Lebesgue. 55 2. Elementos básicos de topologı́a Definición 27 Sea X un espacio métrico. Se dice que un conjunto A es totalmente acotado si para cada ε > 0, existe un subconjunto {x1 , ..., xn } ⊂ X tal que n [ A ⊂ Bε (xi ). i=1 Lema 2.4.7 Si A es secuencialmente compacto, entonces A es totalmente acotado. Demostración. Si A no es totalmente acotado, entonces para alguna ε > 0, A no puede ser cubierto por una cantidad finita de bolas. Sea x1 ∈ A. Como A no es totalmente acotado, eso implica que existe x2 ∈ (Bε (x1 ))c , luego considérese un punto x3 ∈ (Bε (x1 ) ∪ Bε (x2 ))c y ası́ sucesivamente, generando una sucesión {xn } tal que !c n[ −1 xn ∈ Bε (xi ) . i=1 De esta forma, hemos construido una sucesión tal que d (xn , xm ) ≥ ε para cualesquiera n, m ∈ N. Ası́, {xn } no tiene subsucesiones convergentes, lo cual es una contradicción al hecho de que A es secuencialmente compacto. Por tanto, A es totalmente acotado. Ahora, estamos en condiciones de probar el teorema de Bolzano-Weierstrass. Teorema 2.4.8 (Bolzano-weierstrass). Sea X un espacio métrico. Un subconjunto A es compacto si y sólo si es secuencialmente compacto. Demostración. Supongamos que A es compacto y que existe una sucesión {xn } ⊂ A de tal manera que no tiene subsucesiones convergentes. Esto implica que {xn } tiene recorrido R infinito. Además, existe una vecindad Un para cada xn , n ∈ N, de tal forma que xm 6∈ Un si n 6= m, esto se sigue ya que de lo contrario, podemos elegir vecindades de la forma B k1 (xn ), k ∈ N y seleccionar una subsucesión que converja a xn . Ahora, R es cerrado, esto debido a que no tiene puntos de acumulación (no hay subsucesiones convergentes) y por tanto R = R. Como R es cerrado y A es compacto, por el Lema 2.4.4, se obtiene que R es compacto, lo cual es una contradicción, ya que Un no tiene una subcubierta finita. En consecuencia, {xn } tiene una subsucesión convergente y, dado que A es cerrado, el lı́mite yace en A. Por otra parte, supongamos que A es secuencialmente compacto. Sea r como en el Lema 2.4.6; luego, por el Lema 2.4.7, obtenemos que A ⊂ n [ i=1 Bε (xi ), donde xi ∈ A. Además, por el Lema 2.4.6, Bε (xj ) ⊂ Aαj , j ∈ {1, ...n}, donde {Aαj } es una colección de abiertos. Por tanto, hay una subcubierta finita para A, como se querı́a demostrar. 56 2.5. Compacidad Para cerrar esta sección, presentamos un resultado que relaciona los conceptos de completez y compacidad. Teorema 2.4.9 Un espacio métrico es compacto si y sólo si es completo y totalmente acotado. Demostración. Supongamos que X es compacto. Por el Teorema 2.4.8, X es secuencialmente compacto y por el Lema 2.4.7, es totalmente acotado. Ahora, para ver que es completo, consideremos una sucesión de Cauchy {xn }. Como X es secuencialmente compacto, se satisface, por un lado, que d (xn , xm ) < ε 2 si n, m > N para alguna N ∈ N y por otro lado d (xnk , x0 ) < ε 2 si nk > N para alguna N ∈ N, donde {xnk } es una subsucesión de {xn } y x0 ∈ X. Ası́, obtenemos lo siguiente: d (xn , x0 ) < d (xnk , xn ) + d (xnk , x0 ) < ε, si nk , n > N . Por otra parte, supongamos que X es completo y totalmente acotado. Demostraremos que X es secuencialmente compacto. Sean {xn } una sucesión contenida en X y R su recorrido. Si R es finito, entonces hay una subsucesión convergente y si hay una cantidad finita de repeticiones las eliminamos. Ahora, supongamos que R es infinito. Como X es secuencialmente compacto, dado N ∈ N existen elementos yL1 , ..., yLM ∈ X tales que X ⊆ M [ B N1 (yLi ). i=1 Para N = 1, sea X ⊆ M [ B1 (yLi ). i=1 De esta forma, existe una subsucesión de {xn } que cae en una de estas bolas. Tomando N = 2, podemos construir otra subsucesión que yace en una de las bolas de la forma B 21 (yLi ). Finalmente, eligiendo la subsucesión cuyo primer elemento es el primero de la primera subsucesión, el segundo es el segundo de la segunda subsucesión, etcétera, generamos una sucesión de Cauchy, que por ser el espacio completo, es convergente. Ası́, X es secuencialmente compacto y, por el Teorema 2.4.8, se sigue el resltado. 57 2. Elementos básicos de topologı́a 2.5. Conexidad Cerramos este capı́tulo con otro concepto importante que es el de conexidad. Intuitivamente, es claro que significa que un conjunto sea conexo. Uno pensarı́a que un conjunto es conexo si es de una sola pieza. Sin embargo, existen conjuntos en donde nuestra intuición puede fallar. Veremos que existen dos nociones de conexidad y estudiaremos la relación entre ellas. Iniciamos esta sección con la definición de desconexión. Definición 28 Sea X = (X, d) un espacio métrico. Se dice que un subconjunto A ⊆ X es inconexo, si existen B, C subconjuntos de A, abiertos, tales que se cumplen las siguientes condiciones 1. B 6= ∅ 6= C. 2. B ∩ C = ∅. 3. A ∩ B 6= ∅ 6= A ∩ C 4. A = B ∪ C. A la pareja (B, C) se le conoce como desconexión de A. Se dice que A es conexo si no es inconexo. Obsérvese que en esta definición, se puede tomar A = X y tenemos espacios métricos inconexos. Si X es un espacio inconexo, como X = B ∪ C, donde B, C son abiertos, se tiene que B, C también son cerrados, ya que B c = C y viceversa. Ası́, tenemos el siguiente resultado. Proposición 2.5.1 Las siguientes afirmaciones son equivalentes 1. X es inconexo. 2. Existen dos subconjuntos A, B de X, cerrados, no vacı́os, tales que X = A ∪ B. 3. Existe un subconjunto propio de X, no vacı́o, que es abierto y cerrado. También, si X es inconexo y (A, B) es la desconexión para X, cualquier subconjunto Y de X tendrá por desconexión a (A, B) si A ∩ Y 6= ∅ 6= B ∩ Y . Proposición 2.5.2 R es conexo Demostración. Supongamos que R no es conexo. Esto implica que existen abiertos A, B de R no vacı́os y ajenos, tales que R = A ∪ B. Sean a ∈ A, b ∈ B y supongamos, sin pérdida de generalidad que a < b. Definimos α = sup {x ∈ A | x < b}. 58 2.5. Conexidad Luego, existen dos opciones para α. Si α ∈ A, como A es abierto, existe ε > 0 tal que (a − ε, a + ε) ⊂ A. De esta forma, podemos elegir ε suficientemente pequeña de tal manera que α + ε < b, lo cual contradice que α sea el supremo. De esta forma, α 6∈ A. Ası́ α ∈ B. Sin embargo, como B es abierto, existe ε > 0 tal que (a − ε, a + ε) ⊂ B, luego α − ε > a, para a ∈ A, lo cual genera una contradicción, de donde se concluye que α 6∈ B, lo cual contradice la completez de R. Por tanto, R es conexo. Obsérvese que la unión y la intersección de conexos no necesariamente es un conjunto conexo. El siguiente resultado, muestra bajo que condiciones, la unión de conexos es un conexo. Proposición 2.5.3 Sean X = (X, d) un espacio métrico [ y Xλ ⊂ X, λ ∈ Λ, Xλ . Si existe λ0 ∈ Λ una colección de conjuntos conexos tales que X = λ∈Λ de tal forma que Xλ0 ∩ Xλ 6= ∅, entonces X es conexo. Demostración. Supongamos que X es inconexo. Se afirma que Xλ0 es inconexo. Para verificar esto, consideremos una desconexión (A, B) para X. Sin pérdida de generalidad, supongamos que A ∩ Xλ0 6= ∅. Como Xλ es conexo para toda λ 6= λ0 , entonces Xλ ⊂ A o Xλ ⊂ B. Tómese ΛB = {λ ∈ Λ | Xλ ⊂ B}. Obsérvese que ΛB 6= ∅, ya que[ de lo contrario, Xλ ⊂ A para toda λ ∈ Λ, lo cual implicarı́a que B = B ∩ Xλ = ∅, lo cual no es posible. Sea λ ∈ ΛB , entonces se tiene que λ∈Λ ∅ 6= Xλ ∩ Xλ0 ⊂ B ∩ Xλ0 , de donde se sigue que (A, B) es una desconexión para Xλ0 . Como consecuencia de esta proposición, tenemos que la unión de conexos es un conjunto conexo si tienen al menos un punto en común. Teorema 2.5.4 Sean X = (X, d) un espacio métrico y C ⊂ X. Si C es conexo, entonces C es conexo. Demostración. Supongamos que (C) es inconexo y sea (A, B) una desconexión para C. Como A y B son abiertos, se sigue que (A, B) es también una desconexión para C. Ejemplo. Sea [a, b] ⊂ R. Demostraremos que es un conjunto conexo. Supongamos que no, esto quiere decir que existen abiertos A, B en R, ajenos, no vacı́os, tales que A ∩ [a, b] 6= ∅ B ∩ [a, b] y A ∪ B ⊃ [a, b]. Supongamos que b ∈ B y definimos α = sup (A ∩ [a, b]). Obsérvese que A ∩ [a, b] es cerrado, ya que B ∪ ([a, b])c es abierto, en consecuencia, α ∈ A ∩ [a, b]. Ahora, α 6= b ya 2. Elementos básicos de topologı́a 59 que α 6∈ B y b ∈ B. Se sigue que, para toda vecindad W de α, W 6⊂ A y por tanto W ∩ (B ∩ [a, b]) 6= ∅. Nótese que α es punto de acumulación de B ∩ [a, b] y como este conjunto es cerrado, se sigue que α ∈ B ∩ [a, b], lo cual es una contradicción al hecho de que (A, B) es una desconexión. Claramente, en un espacio métrico X , el conjunto {x} es conexo. Consideremos el conjunto dado por [ Cx = {C ⊂ X | x ∈ C, C conexo}. Por la observación posterior a la Proposición 2.5.3, se sigue que Cx es conexo. De hecho, es el conexo más grande que contiene a x. A este conjunto se le conoce como componente conexa correspondiente a x. Nótese que Cx es cerrado y que si y ∈ Cx , entonces Cx = Cy . La otra noción, quizás más intuitiva, de conexidad es la de conexidad por trayectorias. Para estudiar esta propiedad, necesitamos definir el concepto de trayectoria entre dos puntos. Para esto, introducimos el concepto de continuidad, el cual se estudiará con más detalle en el siguiente capı́tulo. Definición 29 Sea σ : [a, b] −→ X una función que va del intervalo cerrado [a, b] a un espacio métrico X. Decimos que σ es continua si para toda sucesión {xn } ⊂ [a, b] tal que xn −→ x0 , se cumple que σ (xn ) −→ σ (x0 ) Definición 30 Sea X un espacio métrico. Decimos que x, y ∈ X están conectados por una trayectoria, si existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y. Si x y y están unidos por σ, lo denotaremos por σ : x ' y. Se dice que la trayectoria σ yace en un conjunto A ⊂ X si para todo t ∈ [a, b], σ (t) ∈ A. Diremos que dos puntos x, y ∈ X están relacionados (x ∼ y) si existe una trayectoria σ que los une. Esta relación es de equivalencia. Para probar esta afirmación, nótese que x ∼ x, ya que podemos tomar la función σ (t) = x para toda t ∈ [a, b]. Por otra parte, si x ∼ y, entonces, existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y. Si definimos σ 0 (t) = σ (a + b − t), donde t ∈ [a, b], esta función es continua y además σ 0 (a) = y y σ 0 (b) = x, de donde se sigue que y ∼ x. Finalmente, si x ∼ y y y ∼ z, entonces existen una funciones τ, σ : [a, b] −→ X continuas, tales que σ (a) = x, σ (b) = y = τ (a) y τ (b) = z. Definiendo  b si x ∈ a, a +  σ(2t − a) 2 ρ (t) = b  τ (2t − b) si x ∈ a + 2 ,b , obtenemos que ρ une x con z. Ası́, (∼) es una relación de equivalencia. A las clases de equivalencia se les llama componentes por trayectorias del espacio X. Definición 31 Se dice que un subconjunto A ⊂ X es conectable por trayectorias si cualesquiera dos puntos de A pueden ser unidos mediante una trayectoria que se encuentra totalmente contenida en A. 60 2.5. Conexidad El siguiente resultado, relaciona las dos nociones de conexidad. Teorema 2.5.5 Un conjunto conectable por trayectorias es conexo. Demostración. Sea A un conjunto conectable por trayectorias. Supongamos que A es inconexo y sea (U, V ) su desconexión. Tómese x ∈ U y y ∈ V . Como A es conectable por trayectorias, entonces, existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y; sea C = σ −1 (U ) y D = σ −1 (V ). Obsérvese que C, D ⊂ [a, b]. Consideremos una sucesión {xn } ⊂ C tal que xn −→ x0 , como [a, b] es cerrado, x0 ∈ [a, b]. Además, dado que σ es continua, se tiene que σ (xn ) −→ σ (x0 ). Se afirma que σ (x0 ) ∈ U. De lo contrario, σ (x0 ) ∈ V , pero V es abierto y se tendrı́a que σ (xn ) ∈ V lo cual es una contradicción al hecho de que (U, V ) es desconexión. De esta forma, hemos probado que C es cerrado. Un argumento similar prueba que D es cerrado. Nótese que C 6= ∅ 6= D, ya que σ −1 (x) ∈ C y σ −1 (y) ∈ D. También, tenemos que C ∩ D = σ −1 (U ) ∩ σ −1 (V ) = σ −1 (U ∩ V ) = ∅ y C ∪ D = σ −1 (U ) ∪ σ −1 (V ) = σ −1 (U ∪ V ) = σ −1 (A) = [a, b], es decir, [a, b] es inconexo, lo cual es una contradicción que surge de suponer que A es inconexo. Por tanto, A es conexo. Capı́tulo 3 Limites y continuidad. En la mayorı́a de los problemas fı́sicos, sucede que una variable depende de otras. Por ejemplo, el voltaje en una resistencia eléctrica, de acuerdo a la Ley de Ohm, depende de la resistencia y corriente eléctrica, es decir, V = RI. Es por esta razón que se hace necesario el estudio de las funciones reales de variable vectorial. Por otro lado, supóngase que se desea estudiar el viento en una región del planeta. Para esto, medimos la magnitud y dirección de la velocidad del viento, donde ésta última depende de la posición de cada punto. Ası́, asociamos a cada punto P de una región, una y sólo una velocidad. Una regla como ésta es un ejemplo de las llamadas funciones vectoriales de variable vectorial. También se les conoce con el nombre de campos vectoriales. En este capı́tulo, desarrollaremos la teorı́a de lı́mites y continuidad para funciones que toman valores en Rn y cuya variable x es un punto de Rm . Denotamos por F(C, Rm ), donde C ⊂ Rn , al conjunto de funciones f, cuyo dominio es el conjunto C (se dice que hay n variables) y f (x) ∈ Rm , x ∈ C. Se dice que la función f es real o vectorial según sea m = 1 ó m ≥ 2. Si m ≥ 2 y si f (x) = (y1 , ...., ym ), se llaman coordenadas o componentes de f a las funciones reales fi : C −→ R, donde fi (x) = yi , i ∈ {1, 2, ...., m}. Cuando una función de n variables está expresada en forma analı́tica, esto es, en una expresión de la forma z = f (x1 , ...., xn ), donde a cada vector (x1 , ...., xn ) se le asigna un valor z, se suele entender que el campo de definición o dominio de dicha función es el conjunto más amplio de puntos (x1 , ..., xn ) ∈ R para el que existe un valor para z. 61 62 3.0. Limites y continuidad. Ejemplos 1. Sea f (x, y) = √ ln(x,y) 2 1−(x +y 2 ) ; Observese que la función “ ln ” está bien definida para todos los valores positivos; en consecuencia, se debe pedir que x y y tengan el mismo signo. Además x2 +y 2 debe ser menor estrictamente que 1. Por lo tanto, el dominio para esta función tiene la forma D(f ) = {(x, y) | xy > 0, x2 + y 2 < 1} (véase la Figura 3.1) = D (f ) Figura 3.1: Dominio de la función f (x, y) = p ln(x, y) 1 − (x2 + y 2 ) 1 2. Considérese la función g(x, y) = e x2 +y2 Obsérvese que la única condición que se les pide a las coordenadas (x, y) es que x2 + y 2 6= 0; esto sucede para todo (x, y) ∈ R2 − {(0, 0)}. Ası́, D(g) = R2 − {(0, 0)} El conjunto F (C, Rm ) es un espacio vectorial respecto de las operaciones usuales de suma de funciones y de producto de un escalar λ ∈ R por una función; esto es, 3. Limites y continuidad. 63 (f + g)(x) = f (x) + g(x) y (λf )(x) = λf (x). Observe que para el caso particular m = 1, f (C, Rm ) resulta ser un campo respecto de las operaciones usuales de suma y producto de funciones, a saber, (f + g)(x) = f (x) + g(x) y (f g)(x) = f (x)g(x), donde además, se puede establecer una relación de orden parcial dada por f ≤ g ⇔ f (x) ≤ g(x) para toda x ∈ C Si 0 es la función nula, es decir, 0(x) = 0, para toda x ∈ C, entonces se dice que una función f es positiva si P ≤ f y se dice que es negativa si f ≤ P. Diremos que f ∈ F (C, Rm ) es una función acotada si el conjunto f (C) es acotado. Mas precisamente, f ∈ F (C, Rm ) es acotada, sı́ existe M > 0 tal que kf (x)k ≤ M ∀ x ∈ C 3.1. Lı́mites El concepto de lı́mite es uno de los más importantes en el estudio del cálculo y el análisis, quizá sea uno de los mas difı́ciles de comprender. El lector estará familiarizado con el concepto de convergencia de sucesiones y con el concepto de lı́mite para funciones reales de variable real. Definición 32 (condición ε − δ). Sean f : C −→ Rm una función definida en C ⊂ Rn y a ∈ C 0 . Se dice que f tiende a L ∈ Rm conforme x tiende a a (en otras palabras, L es el lı́mite de f en el punto a), si dada ε > 0, existe δ > 0 tal que si x ∈ C − {a} y d(x, a) < δ, entonces d(f (x), L) < ε Al igual que en el caso real, existe una definición de lı́mite por medio de sucesiones. Definición 33 Sean f : C −→ Rm una función definida en C ⊂ Rn y a ∈ C 0 . Si {xn }n∈N ⊂ C − {a} es una sucesión de puntos tal que xn −→ a, se dice que f tiende a L ∈ Rm si f (xn ) −→ L. Proposición 3.1.1 Las definiciones (32) y (33) son equivalentes Demostración. Supongamos que la condición ε − δ se satisface y sea {xn }n∈N ⊂ C − {a} una sucesión tal que xn −→ a; entonces, dada δ > 0, existe N ∈ N tal que kxn − ak < δ si n > N . Como xn ∈ C − {a}, se sigue que kf (xn ) − Lk < ε , para ε > 0 y n > N . Por lo tanto f (xn ) −→ L. Por otra parte, si la condición (ε − δ) no se satisface, existe ε > 0 tal que para toda δ > 0, existe x ∈ C − {a} de tal forma que kx − ak < δ y kf (x) − Lk ≥ ε. 64 3.1. Lı́mites Luego, para cada n ∈ N, si δ = n1 , existe xn ∈ {a} tal que kxn − ak < kf (xn ) − Lk ≥ ε esto es, xn −→ a, pero f (xn ) no converge a L. 1 n y Obsérvese que la definición 32 se puede reescribir de la siguiente forma: “Se dice que f tiende a L ∈ Rn conforme x tiende a a, si dada ε > 0, existe δ > 0 tal que si x ∈ Bδ∗ (a) ∩ C entonces f (x) ∈ Bε (L) (donde x ∈ Bδ∗ (a) = Bδ (a) − {a}.) ” Otra observación importante es la necesidad de que a sea un punto de acumulación de C. Si no fuera ası́, existirı́a δ > 0 tal que x ∈ Bδ∗ (a) ∩ C = ∅, por lo que se cumplı́ria la condición ε − δ con cualquier L ∈ Rm . Ejemplos 1. Sea f (x, y) = 2x2 (y + 1) + y 2 . Se afirma que 2x2 + y 2 2x2 (y + 1) + y 2 =1 2x2 + y 2 (x,y)→0 lı́m (2) (2) En efecto, si (x, y) ∈ Bδ (0), donde Bδ (0) = {x ∈ R2 kxk2 < δ}, se tiene que 2x2 (y + 1) + y 2 −1 2x2 + y 2 = ≤ 2x2 y 2x2 = |y| 2 2 2 2x + y 2x + y 2 1 |y| ≤ (x2 + y 2 ) 2 < δ = ε. x2 y , x2 − y x2 6= y El lı́mite de esta función 1 1 cuando (x, y) −→ 0 no existe, ya que si se considera la sucesión , , n∈ n n 1 1 1 , = −→ 0 N − {1}, obtenemos que g n n n(1 − n) 2. Considérese la función g(x, y) = cuando n −→ ∞. Por otro lado si se toma la sucesión 1 n−1 1 1 √ , − 2 = −→ 1 cuando n −→ ∞. n n n n x−y . Nuevamente, lı́m h(x) no existe, ya x + y x→0 1 1 que si consideramos las sucesiones , 0 y 0, , los valores lı́mite no n n coinciden. 3. Tómese la función h(x, y) = 65 3. Limites y continuidad. El lector habrá notado la complejidad de la noción de lı́mite. En el caso de las funciones reales de variable real, podemos aproximarnos a un valor por 2 trayectorias. En el caso de funciones que involucran 2 o más variables, tenemos una infinidad de formas para aproximarnos a un cierto punto. El siguiente resultado muestra un criterio de convergencia análogo al criterio de Cauchy para sucesiones. Proposición 3.1.2 Sean f : C ⊂ Rn −→ Rm y a ∈ C 0 . Entonces, f tiene lı́mite en a si y solamente si, para toda ε > 0, existe δ > 0 tal que si x, x0 ∈ C − {a} de tal forma que kx − ak < δ y kx0 − ak < δ, entonces kf (x) − f (x0 )k < ε Demostración. Si lı́m f (x) = L, entonces, dada > 0, existe δ1 , δ2 > 0 x→a tales que si kxk − a < δ1 y kx0 − ak < δ2 , donde x, x0 ∈ C − {a}, entonces kf (x) − Lk < ε/2 y kf (x0 ) − Lk < ε/2 tomando δ = min{δ1 , δ2 }, se sigue que kf (x) − f (x0 )k ≤ kf (x) − Lk + kf (x0 ) − Lk < ε para x, x0 ∈ Bδ∗ (a). Por otro lado, si para toda ε > 0, existe δ > 0 tal que si x, x0 ∈ C − {a} de tal forma que kx − ak < δ y kx0 − ak < δ implica que kf (x) − f (x0 )k < ε, debemos mostrar que el lı́mite de f en a existe. Para demostrar esto, sea {xn } ⊂ C −{a} una sucesión tal que xn −→ a. Por hipótesis, se sigue que {f (xn )} es un sucesión de Cauchy y por lo tanto, convergente. Falta demostrar que si {xn 0 } es otra sucesión que converge a a, entonces lı́m f (xn ) = lı́m f (xn 0 ) n→∞ n→∞ . Supongamos que lı́m f (xn ) = L y que lı́m f (xn 0 ) = L0 donde L 6= L0 . n→∞ n→∞ Obsérvese que la sucesión {x1 , x01 , x2 , x02 , ....} converge a a, sin embargo, la sucesión {f (x1 ), f (x01 ), f (x2 ), f (x02 ), ...} no converge, lo cual es una contradicción por lo tanto, f (xn ) −→ L, para toda sucesión {xn } ⊂ C −{a} tal que xn −→ a Hasta el momento, hemos trabajado con la noción de lı́mite de funciones con sucesiones que tienen lı́mite finito. Falta definir el caso para sucesiones que no son acotadas, es decir, falta definir el concepto de lı́mite en el infinito. Además, puede suceder que la imagen de una sucesión {xn } bajo una función f , sea un conjunto que no es acotado. Definición 34 Sean f : C ⊂ Rn → Rm una función y a ∈ C 0 . a) Se dice que f tiene lı́mite infinito en a, si para M > 0, existe δ > 0 tal que para todo x ∈ Bδ∗ (a) ∩ C se tiene que kf (x)k ≥ M. Cuando esto ocurre, lo denotaremos por el sı́mbolo lı́m f (x) = ∞ x→a 66 3.1. Lı́mites b) Si no acotado, diremos que f tiene lı́mite L en el infinito C es un conjunto lı́m f (x) = L , si para cada > 0, existe N > 0 tal que si kxk > N , x→∞ entonces kf (x) − Lk < . c) Si C es un conjunto no acotado, se dice que f tiene lı́mite infinito en el infinito, denotado por lı́m f (x) = ∞ x→∞ Si para cada M > 0, existe N > 0 tal que si kxk > N , entonces se cumple que kf (x)k ≥ M . Ahora, como el lı́mite de una sucesión es único, por la definición (33), se sigue que el lı́m f (x), si existe, es único. También, de la definición (32) se tiene que x→a lı́m f (x) = L si y solo si lı́m f (x) − L = 0. x→a x→a Otra consecuencia inmediata de la definición (32) es que si f tiene lı́mite en el punto a, entonces f es acotada en una vecindad de a. Por otra parte, si lı́m f (x) = L D ⊂ C y a ∈ D0 , x→a es claro que la función g = f |D tiene lı́mite en a, de hecho lı́m g(x) = L. Finalx→a mente si f : C ⊂ Rn → Rm , es una función de la forma f (x) = (f1 (x), ..., fn (x)), donde fi : C ⊂ Rn → R, i ∈ {1, ..., n} y L = (l1 , ..., ln ), entonces no es difı́cil ver que lı́m f (x) = L ⇔ lı́m f (x) = li x→a x→a La verificación de los detalles se deja como ejercicio al lector. Por otra parte, si existe una función ϕ : C ⊂ Rn → R tal que ϕ(x) > 0 para toda x ∈ C y lı́m ϕ(x) = 0 de tal forma que x→a kf (x) − Lk < ϕ(x), para toda x ∈ Bδ∗ (x), para alguna δ > 0 entonces se tiene que lı́m f (x) = L x→a Para ver esto, podemos aplicar la condición (ε − δ) a las función ϕ y dado que ϕ(x) > 0 para toda x ∈ C, |ϕ(x)| = ϕ(x). Luego, para toda > 0, existe δ > 0 tal que si x ∈ Bδ∗ (a), se tiene que kf (x − Lk ≤ ϕ(x) = |ϕ(x)| < , de donde se sigue la observación 67 3. Limites y continuidad. Ejemplos x3 − y 7 . Se afirma que lı́m f (x) = 0. Para ver esto, si x2 + y 4 x→0 x ∈ Bδ∗ (0) con δ > 0 se tiene que a) Defı́nase f (x, y) = |f (x, y)| = x3 y7 − x2 + y 4 x2 + y 4 x2 y4 3 + |y| x2 + y 4 x2 + y 4 ≤ |x| ≤ |x| + |y| . 3 3 Luego definiendo ϕ(x, y) = |x| + |y| , por la observación anterior, se sigue que lı́m f (x) = 0. x→0 a+1 b+1 b) Sea g(x, y) = xx2 +y2y−xy , donde a, b > 0. Demostraremos que un vector (x, y) ∈ R2 , tiene una representación en coordenadas polares de la forma (rcosθ, rsenθ). De esta forma sustituyendo lo valores de x y y, se tiene que |g(x, y)| = xa y b r2 r2 cosθsenθ = xa y b − r2 senθcosθ cosθsenθ < xa y b −→ 0 sen2θ 1− 2 si (x, y) −→ (0, 0). Hemos visto que si lı́m f (x) = L B ⊂ C y a ∈ D0 , entonces lı́m g(x) = L, x →a x→a donde g = f |D . Pues bien, respondiendo a este hecho, se dice que f tiene lı́mite L en a según la dirección de la recta L (o que f tiene lı́mite direccional en a según la recta L) si a ∈ L y lı́m g(x) = L, donde g = f |L . Diremos únicamente que f tiene lı́mite x→a direccional L en a, si f tiene lı́mite en a según la recta L para toda recta L que contenga a a y lı́m f |L (x) = L para toda L. x→0 Ya se demostró que si f tiene lı́mite en a, entonces para cualquier trayectoria que contiene a a, en particular para las rectas L que pasan por a, el lı́mite existe. Sin embargo, tenemos ejemplos donde el lı́mite direccional existe pero el lı́mite de f en a no. 68 3.1. Lı́mites Ejemplos xy + y 3 . Se afirma que el lı́mite direccional de f en (0, 0) x3 − y 2 existe. Para ver esto, sea y = mx, luego mx2 + m3 x3 1 + m2 x f (x, mx) = 2 = m . x − m2 x2 1 − m2 1. Sea f (x, y) = m , |m| = 6 1, esto es, 1 − m2 el lı́mite direccional depende de la pendiente de la recta que se tome. En consecuencia, f no tiene lı́mite direccional en a Tomando x −→ 0, se sigue que f (x, y) −→ 2. Defı́nase g(x, y) = x3 . Si y = mx, entonces x2 − y g(x, mx) = m 3 x2 m3 x3 = −→ 0, − mx x−m x2 x −→ 0 es decir, g tiene lı́mite direccional en 0. Sin embargo, g no tiene lı́mite en 0 ya que, si y = x2 − x3 , se sigue que . g(x, x2 − x3 ) = x3 = 1 −→ 1 si x −→ 0 x3 La siguiente proposición extiende algunas propiedades de lı́mites de funciones reales de variable real para el caso de funciones reales de variable vectorial. Proposición 3.1.3 Sean f,g y h tres funciones definidas en un mismo conjunto C ⊂ Rn y a ∈ c0 . Supóngase que lı́m f (x) = L y lı́m g(x) = M , para algún x→a x→a par de valores L, M ∈ R. Sean K ∈ R y Bδ∗ (a) = Bδ (a) − {a}, donde δ > 0 es el valor correspondiente a la definición de lı́mite. a) K < L (respectivamente, K ≥ L) si y solo si K < f (x) para toda x ∈ C ∩ Bδ∗ (a). (K ≥ f (x)) b) L ≤ M si y solamente si, f (x) < g(x) para cualquier x ∈ C ∩ Bδ∗ (a). c) Si L = M y f (x) ≤ g(x) ≤ g(x) para toda x ∈ lı́m h(x) = L C ∩ Bδ∗ (a), entonces x→a Demostración. a) Sea ε = L − K > 0. Como lı́m f (x) = L, entonces existe δ > 0 tal que x→a para toda x ∈ C ∩ Bδ∗ (a), |f (x) − L| < ε; luego, por la definición de valor absoluto, se sigue que K − L < f (x) − L 69 3. Limites y continuidad. Es decir, K < f (x).Por otro lado, si K < f (x) para toda x ∈ C ∩ Bδ∗ (a), para alguna δ > 0, se sigue que K − L < f (x) − L Tomando el lı́mite en ambos lados cuando x −→ a, obtenemos que K − L < 0, esto es, K < L. b) Supongamos que L < M y sea ε = 21 (M − L). Entonces existe δ > 0 tal que si x ∈ Bδ∗ (a), se tiene que f (x) ∈ Bε (L) y g(x) ∈ Bε (M ) es decir, |f (x) − L| < ε y |g(x) − M | < ε de donde se obtiene que f (x) < 1 (M + L) < g(x) 2 Por tanto, f (x) < g(x) para toda x ∈ Bδ∗ (a). Ahora, si L ≥ M , por la parte anterior, f (x) ≥ g(x), de donde se concluye que f (x) < g(x) implica que L < M c) Sea ε > 0; entonces, existe δ > 0 tal que f (x) , g(x) ∈ Bδ∗ (a) Tómese δ0 > 0 tal que para toda x ∈ Bδ0 (a), f (x) ≤ h(x) ≤ g(x). Si δ = mín {δ , δ0 } es claro que para toda x ∈ Bδ0 (a) L ≤ lı́m h(x) ≤ M = L, x→a de donde se concluye que lı́m h(x) = L. x→a El siguiente resultado establece las propiedades aritméticas para lı́mites de funciones reales de variable vectorial. La prueba de este hecho es muy similar al caso de las funciones de variable real, por lo que su prueba se deja como ejercicio al lector. Proposición 3.1.4 Sean f : C ⊂ Rn −→ R y g : C ⊂ Rn −→ R. funciones y a ∈ C 0. a) Si lı́m f (x) = 0 y para toda x ∈ C ∩ Bδ∗ (a), δ > 0, |g(x)| < M, para x→a alguna M > 0 , entonces lı́m f (x)g(x) = 0 x→a b) Si lı́m f (x) = L y lı́m g(x) = M , x→a x→a i) lı́m [f (x) + g(x)] = L + M x→a L, M ∈ R entonces: 70 3.1. Lı́mites ii) lı́m [f (x) g(x)] = L M x→a f (x) L iii) si M 6= 0, lı́m = x→a g(x) M Otra forma de calcular lı́mites es de manera reiterada. El análisis que se hace en este texto, se puede hacer extensivo a funciones escalares con cualquier número de variables independientes. Si f : C ⊂ R2 −→ R y a = (x0 , y0 ) ∈ C 0 , podemos calcular el lı́mite “reiterado” en a , aproximándonos por separado a x0 y a y0 (véase la figura 3.2). f(X2 , Y2) L Y2 Y0 f(X1 , Y1) Y1 X2 X1 Figura 3.2: Lı́mites reiterados Ejemplos 1. Sea f (x, y) = x + y. Calcularemos los lı́mites reiterados de la función f cuando (x, y) → (1, 1). Calculamos lı́m f (x, y) = lı́m x + y = 1 + x. y→1 y→1 Luego lı́m x→1 lı́m f (x, y) = (1 + x) = 2 y→1 Nótese que en este caso: lı́m x→1 lı́m f (x, y) = lı́m lı́m f (x, y) y→1 En general, esto no sucede. y→1 x→1 71 3. Limites y continuidad. 2. Sea g(x, y) = x λ(y) donde   1 λ(y) = 0   −1 si y > 0 si y = 0 si y < 0 Observe que los lı́mites reiterados no coinciden en (0, 0) , ya que, por un lado, lı́m g(x, y) = lı́m = x y→0+ y y→0+ lı́m g(x, y) = lı́m = −x y→0− y→0− Luego, lı́m ( lı́m g(x, y)) no existe; por otra parte , lı́m g(x, y) = 0 de x→0 y→0 x→0 donde se sigue que lı́m ( lı́m g(x, y)) = 0. Ahora, nótese que y→0 x→0 |g(x, y)| = |x| → 0 cuando x → 0 , por lo que el lı́mite existe. xy tiene lı́mites reiterados iguales en (0, 0), 3. La función f (x, y) = 2 x + y2 sin embargo no tiene lı́mite en (0, 0) (se le recomienda al lector verificar los detalles). 1 , donde x ∈ R+ ∪ {0} y y ∈ R+ . Nótese 4. Sea h(x, y) = x sen y 1 1 que lı́m lı́m sen = 0 pero lı́m lı́m sen no existe. y→0 x→0 x→0 y→0 y y 2 4 Para ver esto, tómese las sucesiones yn = y yn0 = . (2n − 1)π (8n + 1)π Sin embargo, como x sen siempre que p 1 1 = |x||sen | ≤ |x| ≤ x2 + y 2 < ε y y p x2 + y 2 < δ = ε, se sigue que lı́m (x,y)→(0,0) h(x, y) = 0 El siguiente resultado relaciona los conceptos de lı́mite y lı́mite reiterado. Teorema 3.1.5 Sean f : C ⊂ R2 → Rm y a = (x0 , y0 ) ∈ C o . Si lı́m f (x) = L y si para cada y ∈ Bδ∗ (y0 ), δ > 0, lı́m f (x, y) existe, x→x0 x→a entonces el lı́mite reiterado lı́m y→y0 existe y es igual a L. lı́m f (x, y) x→x0 72 3.1. Lı́mites Demostración. Dado ε > 0 , como L es el lı́mite de f en a , existe δ > 0 tal que si kx − ak < δ entonces kf (x) − Lk < 2ε . Sea U ∗ = Bδ∗ (y0 ) la bola perforada de la que habla el enunciado. Luego por hipótesis, existe una función ϕ(y) tal que ϕ(y) = lı́m f (x) para y ∈ U ∗ es decir, para cada ε > 0, x→x0 existe δy > 0, tal que si |x − x0 | < δy entonces kf (x, y) − ϕ(y)k < 2ε para y ∈ U ∗ . Ası́ para todo y ∈ U ∗ tal que |y − y0 | < δ si x ∈ Bδ∗0 (x0 ) donde δ 0 = mín{δ, δy } se tiene que: kϕ(y) − Lk ≤ kϕ(y) − f (x, y)k + kf (x, y) − Lk < ε por lo tanto lı́m ϕ(y) = L como se querı́a probar. y→y0 Ya hemos visto anteriormente casos en los que: a) La función tiene lı́mite en un punto, pero los lı́mites reiterados (o uno de ellos) no existe. b) La función tiene lı́mites reiterados en un punto, son iguales, pero su lı́mite en dicho punto no existe c) La función tiene lı́mites reiterados en un punto, pero son distintos. Esto nos proporciona un criterio para asegurar que la función no tiene lı́mite en un punto. En general, para espacios métricos, el concepto de lı́mite se extiende de manera natural. Definición 35 Sean (X, d) y (Y, ρ) espacios métricos, D ⊂ X, f : D −→ Y una función, b ∈ Y y a ∈ D0 . Decimos que b es el lı́mite de la función f en el punto a, si para cada ε > 0 existe δ > 0 tal que si d(x, a) < δ entonces e(f (x), b) < ε. Como siempre, si b es el lı́mite de f en a, lo denotaremos por lı́m f (x) = b, x→a x∈ D Teorema 3.1.6 Sea X un espacio métrico. Entonces lı́m f (x) = b, x −→ a si y sólamente si donde xn −→ a. Demostración. lı́m n −→ ∞ x ∈ D, f (xn ) = b, para toda sucesión {xn } ⊂ D − {a}, Supongamos que lı́m f (x) x −→ a = b, x ∈ D y sea {xn } ⊂ D − {a}, tal que xn −→ a, cuando n −→ ∞. Sea ε > 0, entonces existe δ > 0 tal que ρ (f (x), b) < ε si x ∈ D y d (x, a) < δ. 73 3. Limites y continuidad. Además, existe N ∈ N tal que si n ≥ N , entonces d (xn , a) < δ. Ası́, para n > N , ρ (f (xn ), b) < ε. Por otro lado, si existe ε > 0 tal que para todo δ > 0 existe x ∈ D, que depende de δ, tal que ρ (f (x), b) ≥ ε, pero d (x, a) < δ, entonces, tomando δn = n1 , n ∈ N, hemos encontrado una sucesión en D para la cual f (xn ) no converge a b. Ası́, si lı́m f (x) = b, entonces lı́m f (xn ) = b, si x −→ a n −→ ∞ xn −→ a. Corolario 3.1.7 Si f tiene lı́mite en a, éste es único. Demostración. Es consecuencia del Teorema 3.1.6 y la unicidad del lı́mite para sucesiones. Al igual que para funciones definidas sobre Rn , se tiene que el espacio de funciones con lı́mite en un punto a es cerrado bajo la suma, el producto y el cociente, es decir, si lı́m f (x) = b y lı́m g (x) = c, donde x −→ a x −→ a f, g : D ⊂ X −→ R, X espacio métrico y a ∈ D0 , entonces 1. 2. lı́m f (x) + g (x) = b + c, x −→ a lı́m (f (x) g (x)) = b c, x −→ a 3. Si c 6= 0, entonces lı́m x −→ a b f (x) = . g (x) c La verificación de los detalles se le dejan al lector. 3.2. Funciones continuas En este capı́tulo estudiaremos las funciones continuas en espacios métricos en general, analizando ejemplos de funciones en Rn . Básicamente, la continuidad de una función x −→ f (x) significa que incrementos pequeños en la variable x, implica pequeños en el valor de f (x). Las propiedades de lı́mites estudiadas en la sección anterior, conducen de manera natural a propiedades análogas para las funciones continuas. Además, existen otras propiedades importantes, que se refieren a la continuidad global. Definición 36 Sean (X, d) y (Y, ρ) espacios métricos. Se dice que una función f : X 0 , −→ Y es continua en un punto a ∈ X, si dado ε > 0, existe δ > 0 tal que si d (a, x) < δ, entonces ρ (f (a), f (x)) < ε. Obsérvese que esta definición se puede reformular en términos de bolas. A saber, f es continua en el punto a si dada cualquier bola con centro en f (a) ∈ Y , digamos BεY (f (a)), existe una bola con centro en a ∈ X, BδX (a), de tal forma que f BδX (a) ⊂ BεY (f (a)). 74 3.2. Funciones continuas Si f no es continua en a, decimos que f es discontinua en a, o que tiene una discontinuidad en a. Obsérvese que la definición de continuidad es local, es decir, está definida sobre cada punto de X. Si f es continua en a, para todo punto a ∈ A ⊆ X decimos que f es continua en A. Si f es continua en X, decimos simplemente que f es continua. f f (Bδ (a)) a δ ε f (a) Figura 3.3: Continuidad de f en a No es difı́cil demostrar (se deja como ejercicio al lector), que la definición 36 se puede reescribir de la siguiente forma: “f es continua en x si y sólo si dada ε > 0, existe δ > 0 tal que se cumple que Bδ (x) ⊂ f −1 (Bε (f (x))).” Esta caracterización afirma que f es continua en x si y sólo si para toda ε > 0, f −1 Bε (f (x)) es una vecindad de x. Esto nos da la pauta para formular una definición más general de continuidad. Definición 37 Sean X y Y espacios métricos y sea f : X −→ Y una función. Se dice que f es continua en x ∈ X, si dada una vecindad V de f (x), f −1 (V ) es una vecindad de x. Esta definición es muy útil, ya que se puede cambiar la palabra “métricos” por “topológicos”. Ejemplos. 1. Sea f : R2 −→ R, definida como  2  x + 2y − 1 f (x, y) =  3x + y 2 si x ≥ 0 si x < 0. Analicemos la continuidad de f en todos los puntos (x0 , y0 ) ∈ R2 . Si x0 > 0, entonces lı́m (x,y) −→ (x0 , y0 ) f (x, y) = lı́m (x,y) −→ (x0 , y0 ) (x2 + 2y − 1) = x20 + 2 y0 − 1 = f (x0 , y0 ). 75 3. Limites y continuidad. Si x0 < 0, entonces f es continua en (x0 , y0 ) ya que lı́m (x,y) −→ (x0 , y0 ) f (x, y) = lı́m (x,y) −→ (x0 , y0 ) 3x + y 2 = 3 x0 + y02 = f (x0 , y0 ). Ahora, si x0 = 0, tomando los semiplanos P = {(x, y) ∈ R2 | x ≥ 0} N = {(x, y) ∈ R2 | x < 0}, f tendrá el lı́mite en (0, y0 ) si y sólamente si f |P y f |N tienen el mismo lı́mite, es decir, si lı́m (x,y) −→ (0, y0 ) f |P (x, y) = 2 y0 − 1 = f (0, y0 ) y lı́m (x,y) −→ (0, y0 ) f |N (x, y) = lı́m (x,y) −→ (0, y0 ) 3x + y 2 = y02 son iguales. Esto sucede si y sólo si, 2 y0 − 1 = y02 , es decir, si y0 = 1. Por tanto, f es continua en (0, 1) y discontinua en (0, y0 ), donde y0 = 6 1. 2. Sea la función f (x, y) =  3  x + 2y  5 si (x, y) 6= (1, 3) si (x, y) = (1, 3). Obsérvese que esta función no es continua en (1, 3) ya que lı́m (x,y) −→ (1,3) f (x, y) = lı́m (x,y) −→ (1,3) 3. Considérese la función f dada por  y  x f (x, y) =  0 x3 + 2y =0 , 7 6= 5 = f (1, 3). si x 6= 0 si x = 0. Esta función no es continua en (0, y0 ), y0 ∈ R ya que lı́m (x,y) −→ (0,y0 f (x, y) no existe; una forma de verificar esta afirmación es notar que y0 lı́m lı́m f (x, y) = lı́m y −→ y0 x −→ 0 x −→ 0 x no existe. De esta forma, la función es discontinua a lo largo de la recta x = 0. 4. Hay que ser cuidadosos al discutir la continuidad de una función f : X −→ Y en un subconjunto de X. Si A ⊂ X hay que distinguir entre decir que f es continua en A y considerar la restricción de f a A y afirmar que f |A es continua con la métrica d|A . En el primer caso, 76 3.2. Funciones continuas el dominio de la función es X y estamos diciendo que en todos los puntos de A se satisface la definición con la métrica d. En el segundo caso, la función f |A está definida sobre el espacio A = (A0 , d|A ). La primera afirmación implica la segunda. Para verificar esto, considerando un punto x ∈ A y ε > 0, entonces para algún valor δ > 0, f (BδX (x)) ⊂ BεY (f (x)). Luego, recordando que f |A (x) = f (x), x ∈ A, y que en el espacio A Bδ (x) es A ∩ BδX (x), se tiene que f |A (A ∩ BδX (x)) ⊂ f (BδX (x)) ⊂ BεY (f (x)) = BεY (f |A (x)). La otra implicación es falsa, ya que la función f : R −→ R, dada por  si x ∈ I  0 f (x) =  1 si x ∈ Q, es discontinua en todo punto de R. Sin embargo, las funciones f |Q y f |I son funciones constantes y, por lo tanto, continuas. En resumen, la continuidad de f |A en X sólo toma en cuenta el comportamiento de la función f en puntos del conjunto A, mientras que la continuidad de f en x ∈ A también toma en cuenta el comportamiento de f en puntos fuera de A. El siguiente resultado establece la relación entre lı́mites y continuidad. Teorema 3.2.1 Sean f : X −→ Y y x ∈ X. f es continua en X si y sólo si se cumple una de las siguientes condiciones. a) x es punto aislado de X. b) x es punto de acumulación de X y lı́m f (y) = f (x). y −→ x Demostración. La demostración de que f sea continua implica una de las afirmaciones a) o b), se deja como ejercicio par el lector. Si x ∈ X es un punto aislado, entonces para alguna δ > 0, BδX (x) = {x} y f (BδX (x)) = {f (x)} ⊂ BεY (f (x)) para toda ε > 0. Si x es un punto de acumulación, el resultado es inmediato comparando las definiciones de lı́mite y continuidad. Corolario 3.2.2 Sea f : X −→ Y es continua en x ∈ X si y sólo si para cualquier sucesión {xn }n ∈ N ⊂ X tal que xn −→ x se tiene que la sucesión {f (xn )}n ∈ N ⊂ Y converge a f (x). 77 3. Limites y continuidad. Demostración. Si x es un punto aislado, consideramos la sucesión constante xn = x (ya que es la única sucesión de puntos de X que tiene lı́mite en X). Si x es un punto de acumulación, por el Teorema 3.2.1 se sigue el resultado. Veamos ahora que la composición de funciones continuas es continua. Teorema 3.2.3 Si (X, d1 ), (Y, d2 ) y (Z, d3 ) son espacios métricos de la forma f : X −→ Y , g : Y −→ Z son funciones continuas en x y f (x) respectivamente, entonces g ◦ f : X −→ Z es continua en x. En consecuencia, si f y g son continuas, entonces g ◦ f también lo es. Demostración. Sea W una vecindad de (g ◦ f ) (x) = g (f (x)) en Z. Como g es continua en f (x), g −1 (W ) es vecindad de f (x) en Y ; de esta forma, como f es continua en X, f −1 (g −1 (W )) = (g ◦ f )−1 (W ) es vecindad de x ∈ X. Otra forma de demostrar el resultado es la siguiente: tómese una sucesión {xn } ⊂ X tal que xn −→ x. Como f es continua en x, se tiene que f (xn ) −→ f (x). Ahora, debido a que g es continua en f (x), se sigue que (g ◦ f ) (xn ) = g (f (xn )) −→ g (f (x)) = (g ◦ f ) (x). Dado que {xn }n ∈ N fue una sucesión arbitraria, se sigue el resultado. El siguiente resultado establece la relación entre continuidad y conectabilidad por trayectorias. Corolario 3.2.4 Sean X y Y espacios métricos, f : X −→ Y una función continua y supóngase que X es conectable por trayectorias, entonces f (X) es conectable por trayectorias. Demostración. Si f (x), f (y) ∈ f (X), considérese la trayectoria σ : x ' y. Luego, por el Teorema 3.2.3, la función f ◦ σ es una trayectoria que une f (x) con f (y). Por otra parte, por el corolario 3.2.2 y la definición 36 es claro que si f : X −→ R y g : X −→ R son funciones continuas, entonces f + g, f g son continuas y si g (x) 6= 0 para toda x ∈ X entonces f /g es continua. Teorema 3.2.5 Sea (X , d) un espacio métrico, n ∈ N, fi : X −→ Rn y definase F como F (x) = ( f1 (x), .... fn (x)). Entonces, F es continua en x ∈ X si y sólo si fi es continua en x ∈ X, para cada i ∈ {1, ..., n} 78 3.2. Funciones continuas Demostración. Consideremos la función πk : Rn −→ R, definida como πk (z1 , ...., zn ) = zk (proyección sobre la k-ésima coordenada) y supongamos que F es continua en x. Nótese que πk ◦ F = fk . Se afirma que πk es continua en Rn . En efecto obsérvese que |πk (z) − πk (w) | = |zk − wk | ≤ kzk − wk k2 < ε = δ. Por el teorema 3.2.3, se sigue que fk es continua. Ahora, si fk es continua en x ∈ X, dado ε > 0, existe un δk > 0 tal que si d (x, y) < δk , entonces |fk (x) − fk (y)| < ε/n. Tomando δ = min {δ1 , ..., δn }, si d (x, y) < δ, se tiene que ! 21 n X 2 ≤ ε k F (x) − F (y) k2 = |fk (x) − fk (y)| k=1 de donde se concluye que F es continua en x El siguiente resultado presenta una generalización a espacios métricos Proposición 3.2.6 Si (X, d), (Y, d1 ) y (Z, d2 ) son espacios métricos y f : X −→ Y , g : Y −→ Z son funciones continuas. Definimos sobre Y × Z la métrica D : (Y × Z) × (Y × Z) −→ R+ ∪ {0} dada por D((y1 , z1 ) , (y2 , z2 )) = d1 (y1 , y2 ) + d2 (z1 , z2 ). Entonces, la función F : X −→ Y × Z dada por F (x) = (f (x), g(x)) es continua Demostración. Sean x0 ∈ X y ε > 0; entonces, existen δ1 , δ2 > 0 tales que si d (x, x0 ) < δ1 y d (x, x0 ) < δ2 , entonces d1 (f (x), f (x0 )) < ε 2 y d2 (g(x), g(x0 )) < ε . 2 Tomando δ = min{δ1 , δ2 } y d(x, x0 ) < δ, se sigue que D (f (x), f (x0 )) = d1 (f (x), f (x0 )) + d2 (g(x), g(x0 )) < ε ε + = ε. 2 2 Es fácil ver que este resultado se puede generalizar para funciones de la forma F : X −→ X , donde X = X1 × ... × Xn equipando a este espacio con n X la métrica producto, D = di donde di es la métrica del espacio Xi , i ∈ N. i=0 Como ya hemos visto anteriormente, la topologı́a de un espacio queda determinado por la descripción de sus conjuntos abiertos o sus cerrados, por el interior o la cerradura de sus conjuntos, etcétera. De la misma forma, la continuidad puede caracterizarse utilizando estos conceptos. 79 3. Limites y continuidad. Teorema 3.2.7 Sean X y Y espacios métricos y f : X −→ Y una función. Las siguientes afirmaciones son equivalentes a) f es continua b) Para todo abierto A en Y , f −1 (A) es abierto en X. c) Para todo subconjunto A de Y, f −1 (Ao ) ⊂ (f −1 (A))◦ d) Para todo subconjunto C de X f (C) ⊂ f (C). e) Para todo cerrado C en Y, f −1 (C) es cerrado en X. Demostración. a) ⇒ b) Sea A abierto en Y y sea x ∈ f −1 (A). Por definición de imagen inversa, f (x) ∈ A y como A es abierto, A es vecindad de f (x). Dado que f es continua en x, f −1 (A) es vecindad de x y dado que éste último fue arbitrario, f −1 (A) es abierto. b) ⇒ c) Sea A ⊂ Y ya que Ao es abierto, por b), se sigue que f −1 (Ao ) es abierto y f −1 (Ao ) ⊂ f −1 (A). Ya que (f −1 (A))◦ es el abierto más grande contenido en f −1 (A) se concluye que f −1 (Ao ) ⊂ (f −1 (A))◦ . c) ⇒ d) Sea C ⊂ X, por c), f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ . Por otro lado, nótese que para un espacio métrico X, se satisface que X − A = (X − A)◦ para todo A ⊂ X (Se deja como ejercicio al lector). Ası́, resulta que: X − f −1 (f (C)) = f −1 (Y − f (C)) = f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ = (X − f −1 (f (C)))◦ = X − f −1 (f (C)). También, nótese que C ⊂ f −1 (f (C)), de donde se sigue que C ⊂ f −1 (f (C)). Se puede verificar que si X es un espacio métrico, C = X − (X − C)◦ , C ⊂ X. De esta forma f −1 (f (C)) = X − (X − f −1 (f (C)))◦ = X − (f −1 (Y − f (C)))◦ ; 80 3.2. Funciones continuas como f cumple con c), se sigue que f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ , luego X − (f −1 (Y − f (C)))◦ ⊂ X − f −1 ((Y − f (C))◦ ) = X − f −1 (Y − f (C)) = f −1 (f (C)), de donde se concluye que C ⊂ f −1 (f (C)). Aplicando f a ambos extremos, obtenemos f (C) ⊂ f [f −1 (f (C))] ⊂ (f (C)) . d) ⇒ e) Sea C cerrado en Y . Dado que se cumple d) y ya que f (f −1 (C)) ⊂ C, se sigue que f (f −1 (C)) ⊂ f (f −1 (C)) ⊂ C = C. Tomando imágenes inversas, tenemos que f −1 (f (f −1 (C))) ⊂ f −1 (C), pero f −1 (C) ⊂ f −1 (f (f −1 (C))) por lo que f −1 (C) ⊂ f −1 (C). Por lo tanto f −1 (C) = f −1 (C) es cerrado. e) ⇒ a) Sean x ∈ X y V una vecindad de f (x) en Y . Supongamos que V es abierto. Por e) se tiene que f −1 (Y − V ) = X − f −1 (V ) es cerrado, debido a que Y − V es cerrado- Luego, f −1 (V ) es abierto y como contiene a x, es vecindad abierta de x ∈ X. En consecuencia, f es continua en x y por ser éste último arbitrario, se tiene el resultado Corolario 3.2.8 Si f : X −→ Y es continua y K un subconjunto conexo de X, entonces f (K) es un subconjunto conexo de Y Demostración. Supongamos que f (K) es inconexo y sea (A, B) una desconexión de dicho conjunto. Por el Teorema 3.2.7, se sigue que (f −1 (A), f −1 (B)) es una pareja de abiertos, no vacı́os, ajenos y tales que su unión es K, es decir, K es inconexo. Teorema 3.2.9 Si f : X −→ Y es continua y K un subconjunto compacto de X, entonces f (K) es un subconjunto compacto de Y 81 3. Limites y continuidad. Demostración. Sea C = {V : i : i ∈ I} una cubierta abierta de f (K) en Y . Como f es continua, f −1 (Vi ) es abierto en X. Por lo tanto C 0 = {f −1 (Vi ) : i ∈ I} es una cubierta abierta de K en X y como K es compacto existen {f −1 (Vi )....f −1 (Vim )} ∈ C 0 tales que K ⊂ f −1 (Vi1 ) ∪ ... ∪ f −1 (Vim ). Luego f (K) ⊂ Vi1 ∪ ... ∪ Vim , por lo que f (K) es compacto. Ejemplos 1. Sea f : Rn −→ Rm continua. Se afirma que el conjunto S = {x ∈ Rn | kf (x)k < 1}, es abierto. Para ver esto, basta con observar que el conjunto S es igual al conjunto dado por f −1 ({y ∈ Rm |kyk < 1}) , que es la imagen inversa de un abierto. Como f es continua, S es abierto. 2. Nótese que si f es una función continua de la forma f : X −→ Y y U ⊂ X es abierto, f (U ) no necesariamente es abierto. A saber, tómese la función f : R −→ [0, 1] dada por    0 si x ≤ 0    x si x ∈ (0, 1) f (x) =      1 si x ≥ 0, Si se considera U = (−7, 2), f (U ) = [0, 1] que es un conjunto cerrado. A las funciones que satisfacen que mandan abiertos en abiertos, las llamaremos aplicaciones propias. 3. Si f : X −→ Y es continua y K ⊂ Y es compacto, no se cumple en general que f −1 (K) sea compacto en X. A saber, si se toma f : R −→ R dada por f (x) = 1, para toda x ∈ R, K = {1} es compacto, pero f −1 (1) = R no lo es. Si K es conexo, tampoco se puede asegurar que f −1 (K) sea conexo en X. Para ver esto, tómese f (x) = x2 y K = {1}. Luego f −1 (K) = {−1, 1} que claramente no es conexo. 82 3.2. Funciones continuas Para funciones reales de variable real, se sabe que una función continua no necesariamente tiene un máximo ni un mı́nimo absoluto. Sin embargo, si tenemos una función continua definida sobre un intervalo cerrado, dicha función alcanza su máximo y su mı́nimo. Para el caso de funciones reales de variable vectorial, tenemos un resultado similar. Proposición 3.2.10 Si C ⊂ Rn es un conjunto compacto y f : C −→ R es una función continua en C, entonces existen puntos x0 , x1 ∈ C tales que f (x0 ) ≤ f (x) ≤ f (x1 ) para toda x ∈ C, esto es, f alcanza su máximo y su mı́nimo en C. Demostración. Por el Teorema 3.2.9 se sigue que f (C) es compacto, por el Teorema 2.4.5, se sigue que este conjunto es cerrado y acotado, por lo que existen valores α, β ∈ R tales que α = sup f (C) y β = ı́nf f (C). Demostraremos que α, β ∈ f (C). Verificamos que α ∈ f (C), el caso de β se demuestra de manera análoga. Consideremos la colección de intervalos de la forma α − n1 , α , n ∈ N. Como α es el supremo, entonces existe un punto 1 xn ∈ f (C) ∩ α − , α . n Nótese que xn −→ α. Por ser f (C) compacto y {xn } ⊂ f (C), existe una subsucesión {xnk } tal que xnk −→ x0 ∈ f (C). Por la unicidad del lı́mite, se concluye que x0 = α. Recordemos que una función inyectiva f : X −→ Y tiene inversa izquierda, es decir, existe una función g : f (X) −→ X tal que g ◦ f = IdX . Denotaremos a la función g como f −1 . Proposición 3.2.11 Sean C ⊂ Rn un conjunto compacto y f : C −→ Rm una función continua en C e inyectiva. Entonces, f −1 es continua en f (C). Demostración. Sea una sucesión {yn } ⊂ f (C) tal que yn −→ y0 . Obsérvese que la sucesión {yn } genera una sucesión {xn } en C, a saber xn = f −1 (yn ). Como C es compacto, entonces existe una subsucesión {xnk } de {xn } tal que xnk −→ x0 ∈ C. Se afirma que x0 = f −1 (y0 ). Para ver esto, dado que f es continua en C y xnk −→ x0 en C, se sigue que ynk = f (xnk ) −→ f (x0 ). Ası́, por la unicidad del lı́mite, se sigue que y0 = f (x0 ), de donde se concluye, por inyectividad, que x0 = f −1 (y0 ), como se querı́a demostrar. Un espacio métrico (y en general, un espacio topológico), tiene una estructura dada por sus conjuntos abiertos y cerrados. Cuando hablamos, por ejemplo, de estructuras algebraicas (anillos,grupos, etcétera), decimos que dos objetos “no se distinguen” si son isomorfos, esto es, si existe una biyección entre sus conjuntos subyacentes que respeta su estructura. De manera similar, se puede definir una relación entre espacios métricos (en general, espacios topológicos) que respeta la estructura topológica. 83 3. Limites y continuidad. Definición 38 Sean X y Y espacios métricos (en general, espacios topológicos). Se dice que X y Y son homeomorfos y se denota como X ∼ = Y , si existe una función f : X −→ Y continua y biyectiva tal que su inversa es también continua. Nótese que la Proposición 3.2.11 muestra que una función f inyectiva y continua sobre un conjunto C ⊂ Rn , es un homemorfismo entre C y f (C). El siguiente resultado muestra que, en efecto, un homeomorfismo es una biyección que respeta la estructura topológica. Proposición 3.2.12 Sean X y Y espacios métricos y f : X −→ Y una función. Las siguientes afirmaciones son equivalentes. a) f es un homeomorfismo. b) f es biyectiva y f (A) es abierto en Y si y sólo si A es abierto en X. c) f es biyectiva y f (C) es cerrado en Y si y sólo si C es cerrado en X. Demostración. Supongamos que f es un homemorfismo. Por definición, f es biyectiva y continua, con inversa continua. Si f (A) es abierto, entonces por el Teorema 3.2.7, se sigue que f −1 (f (A)) = A es abierto. Ahora, si A es abierto, como f −1 es continua, la imagen inversa de A bajo la función f −1 es un conjunto abierto. Pero este conjunto es justamente f (A). Por otro lado, supongamos que se satisface b). Sea A un abierto en Y , como f es biyectiva, existe un subconjunto B ⊂ X tal que f (B) = A. Luego, dado que f (B) es abierto, se sigue que B es abierto y como fue arbitrario, se concluye que f es continua. Un argumento análogo muestra que f −1 es continua. Por tanto, f es un homeomorfismo. La equivalencia entre a) y c) se demuestra de una forma similar. Nótese que este resultado afirma que f no sólo establece una biyección entre los puntos de X y de Y , sino también establece una equivalencia entre los abiertos (respectivamente, cerrados) de uno y otro espacio. En general, una función continua y biyectiva, no necesariamente define un homeomorfismo. A saber, la función f : [0, 1) −→ S1 , dada por f (t) = (cos 2 π t, sin 2 π t), es continua y biyectiva, pero no es un homeomorfismo (ejercicio). 3.3. Continuidad uniforme Nuestra definición de continuidad de una función f en un punto x0 , establece una propiedad local, es decir, es una propiedad que depende de lo valores que toma f en una vecindad de x0 suficientemente pequeña. Se dice que una función es continua sobre un conjunto C si es continua en todo punto de dicho 84 3.3. Continuidad uniforme conjunto. De esta forma, para cada punto x0 ∈ C encontraremos un módulo de continuidad δ, el cual varı́a dependiendo del punto x0 . Sin embargo, existen funciones para las cuales, el módulo de continuidad no depende del punto x0 ∈ C. A este tipo de funciones las llamaremos uniformemente continuas. Definición 39 Sean (X, d) y (Y, d0 ) espacios métricos. Se dice que una función f : X −→ Y es uniformemente continua en X si dado ε > 0 existe δ > 0 tal que si d (x, y) < δ, entonces d0 (f (x), f (y)) < ε, para cualesquiera x, y ∈ X Es una consecuencia inmediata de esta definición que si f es uniformemente continua en X entonces es continua en todo punto x ∈ X. La afirmación contraria es falsa en general. La diferencia entre ambos conceptos radica en que, en la definición de continuidad, el valor δ puede depender tanto de ε como del punto x, mientras que para tener continuidad uniforme δ depende sólo de ε. Obsérvese además que la definición 39 se puede enunciar de la siguiente forma: f es uniformemente continua si f (Bδ (x)) ⊂ Bε (f (x)) para toda x ∈ X. Ejemplos. 1. Sea f : (0, 1) −→ R dada por f (x) = x1 . Observemos que esta función es continua, ya que para un intervalo abierto (a, b) ⊂ R, donde a > 0, se tiene que 1 1 f , = (a, b), b a de donde se concluye que si V ⊂ R es un conjunto abierto, entonces f −1 (V ) es abierto. Sin embargo, f no es uniformemente continua, ya que si ε = 1, para cualquier δ > 0, tal que δ < 31 , si x = 2 δ, entonces 1 1 1 f (Bδ (x)) = f ((δ, 3 δ)) = , 6⊂ B1 . 3δ δ 2δ Una función f : C ⊂ X −→ Y , donde (X, d) y (Y, d0 ) son espacios métricos, no es uniformemente continua en un conjunto C, si se verifican una de las siguientes dos condiciones: a) Existe un valor ε > 0 tal que para cada δ > 0, existen puntos x, x0 ∈ C tales que d (x, x0 ) < δ, pero d0 (f (x), f (x0 )) > ε. b) Existen ε > 0 y dos sucesiones {xn } y {x0n } en C, tales que lı́m n −→ ∞ d (xn , x0n ) = 0, pero d0 (f (xn ), f (x0n )) > ε, donde n ∈ N. 85 3. Limites y continuidad. 2. Tomando la función f del ejemplo anterior definida en el conjunto [a, ∞), donde a > 0, resulta ser una función uniformemente continua. Para ver esto, nótese que, para x, y ∈ [a, ∞) arbitrarios, x1 < a1 y y1 < a1 . Luego, para toda ε > 0, tomando δ = ε a2 y |x − y| < δ, se tiene que |f (x) − f (y)| = y −x 1 |y − x| ε a2 1 = < < = ε. − x y xy a2 a2 Como el valor δ no depende de la elección del punto, se sigue que la función es uniformemente continua. 3. Sea g : (a, b) −→ R una función diferenciable tal que |g 0 (x)| ≤ M , para toda x ∈ (a, b). Se afirma que g es uniformemente continua. En efecto, por el teorema del valor medio, si x, y ∈ (a, b) de tal forma que x < y, entonces existe un punto x0 ∈ [x, y] de tal modo que se cumple que g (y) − g (x) = g 0 (x0 ) (y − x). Por tanto, obtenemos que |g (y) − g (x)| ≤ M |y − x|. ε Ası́, para cada ε > 0 definimos δ = M y si |y − x| < δ, se sigue que |g (x) − g (y)| < ε, quedando demostrada la afirmación. 4. Sea h (x) = sin x, donde x ∈ R. Como |h0 (x)| = | cos x| ≤ 1, por el ejemplo anterior, se sigue que h es uniformemente continua. 5. Sea r (x) = sin (x2 ), tomando x ∈ R. Esta función no es uniformemente continua ya que, por el teorema del valor medio, suponiendo que x < y, se tiene que | sin (x2 ) − sin (y 2 )| = |2x0 cos (x20 )| |x − y|, donde x0 ∈ [x, y]. De esta forma, la elección del valor δ dependerá del punto x0 . Este ejemplo muestra que, en general, una función continua y acotada en todo R no es uniformemente continua. 1 2 6. Sea f (x, y) = x2 + y 2 definida en D = R − {(0, 0)}. Esta función es continua en D, sin embargo, no es uniformemente continua. A saber, tómese ε = 1 y las sucesiones xn = √1n , 0 y x0n = 0, √n1+ 2 . Es claro que d (xn , x0n ) −→ 0 cuando n −→ ∞, sin embargo |f (xn ) − f (x0n )| = |n − (n + 2)| = 2 > 1. El siguiente resultado establece una condición suficiente para la continuidad uniforme para funciones definidas en Rn . 86 3.4. Continuidad uniforme Definición 40 Sea f : C ⊆ Rn −→ Rm . Se dice que f es una función de Lipschitz en C, si existe una constante k > 0 (constante de Lipschitz para f ) tal que para cualesquiera x, y ∈ C, se satisface que ||f (x) − f (y)|| ≤ k ||x − y||. Proposición 3.3.1 Sea una función f : C ⊆ Rn −→ Rm una función de Lipschitz en C. Entonces f es uniformemente continua en C. Demostración. Sea k > 0 la constante de Lipschitz para f . Dado ε > 0, definimos δ = kε y tomando x, y ∈ C tal que ||x − y|| < δ, obtenemos que ||f (x) − f (y)|| ≤ k ||x − y|| < ε. Si consideramos la función f (x) = tomando x ∈ (0, a), a > 0, resulta que esta función no es uniformemente continua y no se puede extender a una función continua en el intervalo [0, a] ya que f no es acotada. Sin embargo, vimos que al tomar un intervalo de la forma [a, b], donde a > 0, la función se vuelve uniformemente continua (de hecho, si consideramos el intervalo [a, ∞) la función es uniformemente continua). El siguiente resultado establece la relación entre funciones continuas definidas sobre compactos y la continuidad uniforme. 1 x, Teorema 3.3.2 Sean (X, d) y (Y, d0 ) espacios métricos, f : X −→ Y una función continua y supóngase que X es compacto. Entonces f es uniformemente continua en X Demostración. Sea ε > 0. Como f es continua, para cada x ∈ X, existe δx > 0 tal que f (Bδx (x)) ⊂ B 2ε (f (x)). Por otra parte, la colección de conjuntos {Bδx }x ∈ X es una cubierta de X. Dado que X es un conjunto compacto, entonces X es secuencialmente compacto, por lo que, aplicando el Lema 2.4.6, existe un valor δ > 0 tal que para cada x ∈ X, Bδ (x) ⊂ Bδy0 (y0 ), para alguna y0 ∈ X. Nótese que el número δ no depende de x, sino de la cubierta. De esta forma, si z ∈ Bδ (x), entonces z ∈ Bδy0 (y0 ), por lo que d0 (f (z), f (x)) ≤ d0 (f (z), f (y0 )) + d0 (f (y0 ), f (x)) < Por tanto, f (Bδ (x)) ⊂ Bε (f (x)). ε ε + = ε. 2 2 87 3. Limites y continuidad. 3.4. Espacios vectoriales normados dimensionalmente finitos En el capı́tulo anterior, vimos que para Rn se pueden definir diferentes funciones que resultan ser normas. También vimos que estas normas son equivalentes, es decir, la estructura topológica de Rn es la misma. En general, una norma sobre un espacio vectorial dimensionalmente finito depende de la elección de la base. En esta sección analizaremos la equivalencia entre diferentes normas en espacios vectoriales dimensionalmente finitos. Sea V un espacio vectorial y sean ||·|| y ||·||0 dos normas sobre V . Diremos que || · || es equivalente a || · ||0 (lo cual denotamos por || · || ∼ || · ||0 ), si existen valores a, b > 0 tales que, para toda v ∈ V , a ||v||0 ≤ ||v|| ≤ b ||v||0 . Recordemos que una norma induce una métrica, a saber, para cualesquiera v, w ∈ V , definimos la función d : V × V −→ R+ ∪ {0} como d (v, w) = ||v − w||. Gracias a la teorı́a de sucesiones que desarrollamos en el capı́tulo anterior para espacios métricos y las propiedades de funciones continuas, observamos que la función || · || : V −→ R+ ∪ {0} es continua. Esto se sigue ya que, si vn −→ v en V , entonces por la desigualdad del triángulo para la norma, se sigue que |||vn || − ||v||| ≤ ||vn − v|| < ε, para n suficientemente grande. Ası́, ||vn || −→ ||v||, de donde se concluye que || · || es continua. El siguiente resultado muestra que en un espacio vectorial con dos normas equivalentes, las propiedades de espacio métrico son las mismas. Proposición 3.4.1 Sean V un espacio vectorial, ||·|| y ||·||0 normas sobre V y d y d0 respectivamente las métricas inducidas por estas normas. Supóngase que existe K > 0 tal que ||v|| ≤ K ||v||0 para todo v ∈ V y sea {vn } una sucesión en V . a) Si {vn } converge a v en el espacio métrico (V, d0 ), entonces {vn } converge a v en el espacio métrico (V, d). b) Si {vn } es de Cauchy en el espacio métrico (V, d0 ), entonces {vn } es de Cauchy en el espacio métrico (V, d). Demostración. Demostraremos a), dejando la demostración de la otra afirmación como ejercicio para el lector. Sea ε > 0. Entonces, existe N ∈ N tal ε , si n ≥ N . Ası́, si n ≥ N , se tiene que que ||vn − v||0 < K ||vn − v|| ≤ K ||vn − v||0 < ε. Por tanto, {vn } converge a v en (V, d). 88 3.4. Espacios vectoriales normados dimensionalmente finitos Corolario 3.4.2 Sean V un espacio vectorial, ||·|| y ||·||0 normas equivalentes sobre V , d y d0 respectivamente las métricas inducidas por estas normas y {vn } una sucesión en V . a) {vn } converge a v en el espacio métrico (V, d0 ), si y sólo si {vn } converge a v en el espacio métrico (V, d). b) {vn } es de Cauchy en el espacio métrico (V, d0 ), si y sólo si {vn } es de Cauchy en el espacio métrico (V, d). c) (V, d) es completo si y sólo si (V, d0 ) es completo. Demostración. Demostraremos a) y c), dejando b) como ejercicio. Como || · || ∼ || · ||0 , entonces existen m, M > 0 tales que m ||v|| ≤ ||v||0 ≤ M ||v||, para toda v ∈ V . De esta forma, dado que ||v||0 ≤ M ||v|| para toda v ∈ V , si vn −→ v en (V, d), por la Proposición 3.4.1, vn −→ v en (V, d0 ). Obsérvese que ||v|| ≤ 1 0 m ||v|| para todo v ∈ V , por lo que, aplicando un argumento similar, queda demostrado a). Ahora, supongamos que (V, d) es completo y sea {vn } una sucesión de Cauchy en el espacio métrico (V, d0 ). Por b), {vn } es de Cauchy en (V, d) y, por tanto, convergente. Por a), se sigue que {vn } es convergente en (V, d0 ), de donde se concluye que (V, d0 ) es completo. El converso es cierto por simetrı́a. Si V es un espacio vectorial dimensionalmente finito sobre R (o sobre C), con base β = {v1 , ..., vn }, entonces la función || · ||∗ : V −→ R+ ∪ {0} dada por ! 12 ∗ n n X X λi vi = |λi |2 ||v||∗ = , i=1 i=1 es una norma (ejercicio), donde λi ∈ R (o en C) son los escalares que expresan a v en términos de la base β. Esto muestra que V tiene al menos una norma. El siguiente resultado muestra que cualquier otra norma sobre V es equivalente a esta norma. Teorema 3.4.3 Sean V un espacio vectorial dimensionalmente finito sobre R (o C), β = {v1 , ..., vn } una base para V y || · || una norma definida en V . Entonces, || · || ∼ || · ||∗ . Demostración. Sea M = n X i=1 ! 12 2 ||vi || . 89 3. Limites y continuidad. Como β es una base, se sigue que M > 0. Luego n X λ i vi i=1 ≤ = n X i=1 n X i=1 ≤ ||λi vi || |λi | ||vi || n X i=1 = M ! 12 n X 2 |λi | n X i=1 ! 21 2 ||vi || ∗ . λ i vi i=1 Ahora, sea f : Rn −→ R (se puede sustituir R por C), definida como f (λ1 , ..., λn ) = n X λi vi . i=1 Nótese que esta función es continua. Por otra parte, el conjunto S = {(λ, ..., λn ) ∈ Rn | n X i=1 |λi |2 = 1}, es compacto, por lo que, por la Proposición 3.2.10, existe un punto (µ1 , ..., µn ) ∈ S tal que m = f (µ1 , ..., µn ) ≤ f (λ1 , ..., λn ), para todo (λ1 , ..., λn ) ∈ S. Si m = 0, entonces n X µi vi = 0, i=1 de donde se concluye que n X µi vi = 0, i=1 lo cual es una contradicción al hecho de que β es una base. Por tanto, m > 0. Además, por la definición de || · ||∗ , si ||v||∗ = 1, entonces ||v|| ≥ m. Ası́, si x ∈ V − {0}, como concluye que x ||x||∗ ∗ = 1, se obtiene que ||x|| ≥ m ||x||∗ , x ||x||∗ ≥ m, de donde se 90 3.4. Espacios vectoriales normados dimensionalmente finitos quedando demostrado el teorema. La equivalencia de normas, en efecto, define una relación de equivalencia, por lo que el siguiente resultado es inmediato. Corolario 3.4.4 Sean V un espacio vectorial dimensionalmente finito sobre R (o sobre C) y || · ||, || · ||0 dos normas definidas sobre V . Entonces, dichas normas son equivalentes. Ahora que ya hemos demostrado que todas las normas sobre un espacio vectorial dimensionalmente finito son equivalentes, basta con estudiar las propiedades de espacio métrico asociadas con una norma en particular. Nótese que si V es un espacio vectorial dimensionalmente finito sobre R, se n X n λi vi , entonces puede crear una biyección entre V y R , a saber, si v = i=1 v ↔ (λ1 , ..., λn ). Como Rn es completo, se sigue que V también lo es, ya que una sucesión de Cauchy en V define una sucesión de Cauchy en Rn y, por tanto, ésta última será una sucesión convergente a un vector (x1 , ..., xn ) ∈ Rn . Luego, este vector determina un elemento v0 ∈ V . De esta forma, hemos demostrado que todo espacio vectorial dimensionalmente finito, normado, es completo. Resulta interesante verificar el concepto de continuidad para transformaciones lineales. Para esto, definimos el concepto de transformación acotada. Definición 41 Sea T : V → W una transformación lineal, donde V y W son normados. Se dice que T es acotada si existe c ∈ R+ tal que para todo v ∈ V, kT (v)kW ≤ k vkV . Teorema 3.4.5 Sea T : V → W una transformación lineal, donde V, W son espacios normados. Entonces las siguientes afirmaciones son equivalentes a) T es acotada. b) T es continua. c) T es continua en v0 ∈ V. Demostración. Supongamos que T es acotada; entonces, existe c ∈ R+ tal que, para toda v ∈ V, kT (v)kW ≤ kvkV , Ası́, para cualquier v0 ∈ V y ε > 0, tomando δ = εc se tiene que kT (v) − T (v0 )kW = kT (v − v0 )kW ≤ ckv − v0 kV < c δ si kv − v0 kV < δ. Por lo tanto a) implica b). Por otra parte, b) implica c) trivialmente, por lo que demostramos c) implica 91 3. Limites y continuidad. a). Supongamos que T es continua en v0 . Tomando ε = 1, existe δ > 0 tal que si kv − v0 kV < δ, entonces kT (v) − T (v0 )kW < 1. Escribiendo N = v − v0 , se obtiene que, si kN kV < δ, entonces kT (N )kW < 1 (T es lineal). Ahora, consideremos δ w; luego, w ∈ V − {0} y definimos v = v0 + 2kwk V N = v − v0 = donde kN kV = δw 2kwkV , δ 2 < δ. Ası́, δ w δ kT (N )kW = kT kW = kT (w)kW < 1, 2 kwkV 2kwkV de donde se concluye que kT (w)kW < como se querı́a demostrar. 2 kwkV = ckwkV δ Capı́tulo 4 Diferenciación. 4.1. Funciones vectoriales de variable escalar. Recordemos que en el cálculo de funciones de variable real, la derivada de una función f , se define como la función que denotaremos por f 0 , cuya regla de correspondencia queda determinada por f (x0 + h) − f (x0 ) h −→ 0 h y cuyo conjunto de definición es la colección de todos los valores para los que el lı́mite existe. Por otra parte, al considerar una función vectorial de variable real, estamos pensando en la representación gráfica del movimiento de una partı́cula al tiempo t0 en R3 , por ejemplo. Es decir, una función F : R −→ Rn representa la posición de un vector (x1 (t), ..., xn (t)) ∈ Rn , dependiendo del parámetro t. Veamos que si F : R −→ Rn es una función vectorial de variable real, la derivada se define de manera similar al caso real. f 0 (x0 ) = lı́m Definición 42 Sea F : A ⊂ R −→ Rn , una función vectorial de variable real. Se dice que F es diferenciable en t0 ∈ A si F (t0 + h) − F(t0 ) , h−→0 h existe. En este caso, lo denotaremos por F0 (t0 ) y le llamaremos la derivada de F en t0 . Diremos únicamente que F es diferenciable, si F es diferenciable en t0 , para toda t0 ∈ A. lı́m No es difı́cil ver (Ejercicio) que si se tiene una sucesión {xm }m∈ N ⊂ Rn , de tal forma que xm −→ x ∈ Rm , donde (n) (n) xm = x(1) y x = x(1) m , ..., xm m , ..., xm (i) entonces xm −→ xi , i ∈ {1, ..., u}. La implicación inversa también es cierta. De esta forma, tenemos el siguiente resultado. 93 94 4.1. Funciones vectoriales de variable escalar. Teorema 4.1.1 Si F = (f1 , ..., fn ), donde las funciones fi : A ⊂ R −→ R, i ∈ {1, ..., n}, son diferenciables en un punto t0 ∈ A y F0 (t0 ) = (f 0 (t0 ), ..., fn0 (t0 )). Demostración. Por la observación anterior se tiene que lı́m h−→0 F (t0 + h) − fi (t0 )) h existe si y sólo si fi (t0 + h) − fi (t0 )) , i ∈ {1, ..., n} h existe. Por hipótesis, fi es diferenciable en t0 ∈ A. Ası́, lı́m h−→0 lı́m h−→0 F (t0 + h) − fi (t0 )) h = lı́m h−→0 = = lı́m h−→0 f1 (t0 + h) − f (t0 ) fn (t0 + h) − f (t0 ) , ..., h h f1 (t0 + h) − f (t0 ) fn (t0 + h) − f (t0 ) , ....., lı́m h−→0 h h f10 (t0 ), ....., fn0 (t0 ) Ejemplos a) Sea f (t) = (cos t, sen t) t ∈ R. Las funciones cos t y sen t son diferenciables en todo R, ası́ f 0 (t) = (−sen t, cos t) b) Considérese g(t) = et (1, cos t, sen t). Nótese que g(t) = (et , et cos t, et sen t) por lo que g 0 (t) = (et , et (cos t − sen t), et (sen t + cos t)). De hecho, nótese que si F (t) = (f1 (t), ....., fn (t)) es diferenciable en un punto t0 ∈ A, entonces F(t0 + h) − F(t0 ) h−→0 h existe. Además, este lı́mite existe si y sólo si lı́m 95 4. Diferenciación. fi (t0 + h) − fi (t0 ) , i ∈ {1, ...., n} h existe, de donde se sigue que fi : A ⊂ R −→ R es diferenciable, para cada i ∈ {1, ....., n}. Geométricamente, una función F : A ⊂ R −→ Rn define una curva C en Rn . Si t0 , t0 + h ∈ D(F), donde h 6= 0, entonces el vector lı́m h−→0 1 F( t0 + h) − F (t0 ) = F(t0 ) h tiene la misma dirección que el vector F(t0 + h) − F(t0 ). Cuando h −→ 0, F0 (t0 ) se aproxima a un vector que cae en la recta tangente a la curva C en F (t0 ) (Véase la Figura 4.1) F (t0 ) F ′ (t F 0) (t 0 + h) − F ) (t 0 F (t0 + h) Figura 4.1: Vector tangente Definición 43 Si C es una curva descrita por la función F : A ⊂ R −→ Rn diferenciable en t0 y F0 (t0 ) 6= 0, entonces llamaremos a F0 (t0 ) vector tangente a la curva C en el punto F(t0 ) y a la recta L = {F(t0 ) + aF0 (t0 )|a ∈ R} se le conoce como recta tangente a la curva C en F(t0 ). Esta definición de recta tangente a una curva extiende el concepto de recta tangente a la gráfica de una función real de variable real. En efecto, para una función f : A ⊂ R −→ R diferenciable en un punto t0 ∈ A, los puntos en su gráfica quedan descritos por coordenadas de la forma (t, f (t)), donde t ∈ A. Ası́, definimos una función F : A ⊂ R −→ R2 dada por F(t) = (t, f (t)), la cual es diferenciable en t0 y 96 4.1. Funciones vectoriales de variable escalar. F0 (t0 ) = (1, f 0 (t0 )), por lo que la recta tangente a la curva en F(t0 ) queda descrita por el conjunto {F(t0 ) + aF0 (t0 )| a ∈ R} = {(t0 + a, f (t0 ) + af 0 (t0 ))| a ∈ R} Nótese que la pendiente de esta recta es f 0 (t0 ). Esto se sigue ya que los puntos (x, y) en la recta quedan descritos por las ecuaciones paramétricas x = t0 + a (4.1) y = f (t0 ) + af 0 (t0 ) (4.2) donde a ∈ R. Despejando el parámetro a en la ecuación (4.1) y sustituyendo en (4.2), obtenemos que y = f (t0 ) + f 0 (t0 ) (x − t0 ), que es la ecuación rectangular de una recta con pendiente f 0 (t0 ). Por otro lado, sabemos que si una función f : A ⊂ R −→ R es diferenciable en A, entonces es continua en A. Ası́, por el teorema 4.1.1 y la definición de diferenciabilidad, se tiene el siguiente resultado. Proposición 4.1.2 Si la función F : A ∈ R −→ Rn es diferenciable en A, entonces F es continua en A. Otra forma para denotar la derivada de una función F : A ⊂ R −→ Rn en dF (t0 ). Al igual que en cálculo real de variable real, existen un punto t0 es dt reglas para la derivada de una suma y productos por escalares. Proposición 4.1.3 Sean F, G : A ⊂ R −→ Rn y f : A ⊂ R −→ R funciones diferenciables sobre A. Entonces F±G, F·G, f F son diferenciables sobre A, donde a) d(F ± G) dF dG = ± dt dt ∂t dG dF d(F · G) = F· +G dt dt dt d(f F) dF df c) = f + (F) dt dt dt b) d) Además, si n = 3, F × G es diferenciable y d(F × G) dG dF = F× + ×G dt dt dt 97 4. Diferenciación. Demostración. Probaremos b) y d), dejando la demostración de los demás incisos como ejercicio para el lector. Si F(t) = (f1 (t), ....., fn (t)) G(t) = g1 (t), ...., gn (t) y entonces (F · G)(t) = n X fi (t) gi (t). i=1 Como F y G son diferenciables sobre A, entonces fi y gi son diferenciables sobre A, i ∈ {1, ....., n}. Ası́ d (F · G)(t) dt = n X fi0 (t) gi0 (t) + gi0 (t) fi (t) i=1 = n X fi0 (t) gi (t) + i=1 = n X gi0 (t)fi (t) i=1 dG dF · G (t) + F · (t) dt dt como se querı́a demostrar. Ahora si F = (f1 , f2 , f3 ) y G = (g1 , g2 , g3 ) entonces F × G = (f2 g3 − f3 g2 , f3 g1 − f1 g3 , f1 g2 − f2 g1 ), de donde se sigue que d(F × G) = dt (f2 g30 + f20 g3 − f30 g2 − f3 g20 , f3 g10 + f30 g1 − f10 g3 − f1 g30 , f1 g20 + f10 g2 − f2 g10 − f20 g1 ) = (f2 g30 − f3 g20 , f3 g10 − f1 g30 , f1 g20 − f2 g10 ) + (g3 f20 − g2 f30 , g1 f30 − g3 f10 , g2 f10 − g1 f20 ) = dG dF F× + ×G dt dt Recordemos que si f : A ⊂ R −→ R y g : B ⊂ R −→ R son funciones diferenciables en A y en B respectivamente y f (A) ⊆ B, entonces la composición (g ◦ f ) es diferenciable en A y df dg d(g ◦ f ) = (t) (f (t)). dt dt dt A este resultado se le conoce como regla de la cadena. Pues bien, si F : B ⊂ R −→ Rn y f (A) ⊆ B, 98 4.1. Funciones vectoriales de variable escalar. donde F es diferenciable en B, se tiene un resultado análogo, cuya prueba se deja como ejercicio al lector. Teorema 4.1.4 (Regla de la cadena) Sean F : B ⊂ R −→ Rn y f : A ⊂ R −→ R funciones diferenciables sobre B y A respectivamente, de tal forma que f (A) ⊆ B. Entonces F ◦ f es diferenciable sobre A y df dF d(F ◦ f ) = (t) (f (t)) . dt dt dt Figura 4.2: Gráfica de f (x) = ± q x3 1−x Ejemplos a) Considérese la función F(t) = t2 t3 1+t2 , 1+t2 . t3 f2 (t) = 1+t 2 Nótese que f1 = t2 t2 +1 es una función par, mientras que es impar. De esta forma, podemos concluir que la curva definida por la función F es simétrica con respecto al eje x. Ahora, los vectores tangentes a la curva quedan descritos por la ecuación 2t t4 + 3t2 t F0 (t) = , = (2, t3 + 3t). (1 + t2 )2 (1 + t2 )2 (1 + t2 )2 99 4. Diferenciación. Si t < 0, entonces, el vector tangente tiene la misma dirección que el vector (−2, −(t3 + 3t)), mientras que si t > 0, F 0 (t) tiene la misma dirección que el vector (2, t3 + 3t). Obsérvese que lı́m (−2, −(t3 + 3t)) = (−2, 0) y t −→ 0− lı́m (2, t3 + 3t) = (2, 0) t −→ 0+ esto es, en (0, 0) la gráfica de la función presenta una cúspide. Además nótese que lı́m f1 (t) = 1 y lı́m f2 (t) = ∞, por lo que la gráfica t−→∞ t−→∞ de la función es como lo muestra la Figura 4.2. De hecho, podemos da la ecuación rectangular de esta curva observando que y = t3 = t 1 + t2 t2 1 + t2 = xt, de donde se sigue que 2 x = t = 1 + t2 1 y 2 x 2 + xy s ⇔ y= ± x3 1−x b) Sea F : A ⊂ R −→ Rn una función diferenciable y supongamos que kFk = c, c ∈ R constante, para toda t ∈ A. Luego, obsérvese que F · F = kFk2 = c2 , por lo que aplicando la proposición 4.1.3 se sigue que F · F0 = 0, es decir F(t) y F0 (t) son ortogonales 2 t3 t , c) Sean F(t) = y f (t) = cos t, t ∈ R. Por el Teorema 1 + t2 1 + t2 4.1.4, se sigue que d(F ◦ f ) (t) dt df dF (t) (f (t)) dt dt 2 cos t cos4 t + 3 cos2 t = (− sin t) , (1 + cos2 t)2 (1 + cos2 t)2 −2sen t cos t −sen t (cos4 t + 3cos2 t) , = (1 + cos2 t)2 (1 + cos2 t)2 = El siguiente resultado generaliza el teorema del valor medio para funciones vectoriales de variable real. Teorema 4.1.5 (Del Valor Medio I) Sea F : [a, b] −→ Rn una función continua sobre [a, b] y diferenciable sobre (a, b). Entonces existen valores ci ∈ (a, b) i ∈ {1, ..., n} tales que F(b) − F(a) = (b − a) (f10 (c1 ), ...., fn0 (cn )) 100 4.1. Funciones vectoriales de variable escalar. Demostración. Como F es continua en [a, b] y diferenciable en (a, b), entonces fi es continua en [a, b] y diferenciable en (a, b). Luego, por el teorema del valor medio para funciones reales de variable real, se sigue que existen valores ci ∈ (a, b) tal que fi (b) − fi (a) = (b − a)(fi0 (ci )), de donde se sigue el resultado. Para una función F : A ⊂ R −→ Rn y puntos t0 , t0 + h ∈ A, llamaremos incremento de F en t0 correspondiente al valor h al vector de la forma ∆h F(t0 ) = F(t0 + h) − F(t0 ). Ası́, si F es diferenciable en t0 , se tiene que ∆h F(t0 ) = F(t0 + h) − F(t0 ) = hF0 (t0 ) + hϕh (t0 ), donde ϕh (t0 ) = F(t0 + h) − F(t0 ) − F0 (t0 ). h Como ϕh (t0 ) −→ 0 conforme h −→ 0, se concluye que ∆h F(t0 ) ≈ hF0 (t0 ) cuando h es suficientemente pequeño. F (t0 ) Dh F (t0 ) ∆h F ) (t 0 h ϕh (t0 ) F (t0 + h) 0 Figura 4.3: Diferencial de F en t0 Definición 44 Sea F : A ⊂ R −→ Rn una función diferenciable. Se define la diferencial de F en t0 correspondiente al incremento de h, denotado por Dh F(t0 ) Dh F(t0 ) = hF 0 (t0 ). 101 4. Diferenciación. De esta forma, para h suficientemente pequeño, se tiene que F(t0 + h) = F(t0 ) + ∆h F(t0 ) ≈ F(t0 ) + Dh F(t0 ). (4.3) Nótese que si F0 (t0 ) 6= 0, entonces Dh F(t0 ) es un vector paralelo al vector tangente a la curva C, descrita por F(t), en el punto F(t0 ) (Véase la Figura 4.3) Una forma de simplificar la notación, es escribir dt en lugar de h, lo cual representa un incremento en el parámetro t y en lugar de Dh F(t), abreviar por d F, de donde obtenemos la notación reveladora dF = F0 (t) dt, de donde se sigue que F0 (t) = dF dt . Con esta notación tenemos que dF = F0 (t)dt = (f1 (t)dt, ....., fn (t)dt), esto es dF = (df1 , ....., dfn ). Por la definición de diferencial y las reglas (ya demostradas) para la derivada, se tienen las siguiente propiedades: a) d(F ± G) = dF ± dG b) d(F · G) = (dF · G) + (G · dF) c) d(F × G) = (dF × G) + (F × dG) d) ∂(f F) = f (∂F) + (∂f )F e) d(F ◦ f ) = (F0 ◦ f ) df 4.2. 4.2.1. Funciones escalares de variable vectorial Derivada y diferencial En esta sección, estudiaremos la derivada y la diferencial de las funciones escalares de variable vectorial. Para esto, recordemos nuevamente la idea de la diferenciabilidad para funciones escalares de variable real. Si f es una función diferenciable en un punto t0 , entonces f 0 (t0 ) = lı́m h−→0 existe. Definiendo ϕh (t0 ) = f (t0 + h) − (t0 ) , h f (t0 +h) − (t0 ) h − f 0 (t0 ), h 6= 0 se obtiene que f (t0 + h) = f (t0 ) + f 0 (t0 )h + h ϕ(t0 ), 102 4.2. Funciones escalares de variable vectorial donde lı́m h ϕh (t0 ) = 0 h−→0 Nótese la similitud con la ecuación (4.3). Nuevamente, al valor f 0 (t0 )h lo llamaremos diferencial de f en t0 con incremento h. En general, diremos que f : A ⊂ R −→ R es diferenciable en t0 si existe r > 0 tal que Br (t0 ) ⊂ A y existe a ∈ R (independientemente de h ) tal que para todo punto t0 + h ∈ Br (t0 ) se cumple que f (t0 + h) = f (t0 ) + ah + ϕh (t0 )h, donde lı́m ϕh (t0 ) = 0; al término ah lo llamaremos la diferencial de f en t0 h−→0 con respecto al incremento h. Tomando estas ideas como base, podremos extender el concepto de diferenciabilidad a funciones de Rn a R. Definición 45 Sea F : A ⊂ Rn −→ R una función. Decimos que F es diferenciable en t0 ∈ A si existe un vector a ∈ Rn (independientemente de h) tal que para toda t0 + h ∈ Br (t0 ), r > 0 F (t0 + h) = F (t0 ) + a · h + ϕh (to ) · h donde lı́m ϕh (t0 ) = 0. Al valor a · h lo llamaremos diferencial de F en t0 h−→0 con respecto a h y lo denotaremos por Dh F (t0 ) o simplemente por D F (t0 ). Al vector a se le conoce como derivada de F en t0 y se denotará por D F (t0 ). Nótese que D F (t0 ) · h = DF (t0 ), ası́ que en muchas ocasiones, cambiaremos h por la notación (más sugerente) dt. Por tanto, D F (t0 ) · dt = DF (t0 ). Ejemplos a) Sea F (x, y) = x2 + xy y tómese un vector h = (h1 , h2 ) ∈ R2 ; entonces F (x + h) = F (x + h1 , y + h2 ) = (x + h1 )2 + (x + h1 )(y + h2 ) = x2 + 2xh1 + h21 + xy + h1 y + h2 x + h1 h2 = x2 + xy + [(2x + y)h1 + xh2 ] + h1 h1 + h1 h2 = x2 + xy + (2x + y, x) · h + (h1 , h1 ) · h 103 4. Diferenciación. Definiendo a = (2x + y, x) y ϕh (x) = (h1 , h1 ), se tiene que F es diferenciable ya que lı́m ϕh (x) = lı́m (h1 , h1 ) = (0, 0) h−→0 h−→0 p b) Considérese la función G(x, y) = |xy|. Se afirma que G no es diferenciable en 0. Para ver esto, nótese que, si h = (h1 , h2 ). Para ver esto, nótese que, si h = (h1 , h2 ), p p |h1 h2 | h1 |h1 h2 | h1 = G(0) + G(h) = |h1 h2 | = 0 + h1 h1 ! p |h1 h2 | Definiendo ϕh = , 0 . Obtenemos que h1 p G(h) − G(0) = h · ϕh (0), por lo que, al parecer, G es diferenciable en 0; sin embargo, lı́m ϕh (0) = lı́m h−→0 h−→0 ! p |h1 h2 | ,0 h1 no existe. Teorema 4.2.1 Si F : A ⊂ Rn −→ R es diferenciable en t0 ∈ A, entonces F es continua en t0 . Demostración. Como F es diferenciable, existe un vector a ∈ Rn tal que para cualquier punto t0 + h ∈ Br (t0 ), r > 0, se tiene que F (t0 + h) = F (t0 ) + a · h + ϕh (t0 ) · h, luego cuando h −→ 0 se tiene que lı́m F (t0 + h) = F (t0 ), h−→0 de donde se sigue el resultado El siguiente resultado muestra que la suma y el producto de funciones diferenciables, es diferenciable Teorema 4.2.2 Si F y G son funciones diferenciables en un punto t0 ∈ Rn , entonces F ± G y F G son diferenciables en t0 . Además a) D(F ± G)(t0 ) = DF (t0 ) ± DG(t0 ) b) D(F G)(t0 ) = G(t0 ) (DF (t0 )) + F (t0 )(DG(t0 )) 104 4.2. Funciones escalares de variable vectorial Demostración. Verificamos la validez del teorema para el producto, dejando la verificación de la suma como ejercicio para el lector. Como F y G son diferenciables, existen vectores a1 y a2 y un valor r > 0, tales que para todo t0 + h ∈ Br (t0 ), se cumple que F (t0 + h) = F (t0 ) + a1 · h + ϕh (t0 ) · h y G(t0 + h) = G(t0 ) + a2 · h + ψh (t0 ) · h donde lı́m ψh (t0 ) = 0 = lı́m ϕh (t0 ). Luego, h−→0 (F G)(t0 + h) h−→0 = (F (t0 ) + a1 · h + ϕh (t0 ) · h)(G(t0 ) + a2 · h + ψh (t0 ) · h) = (F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h + [F (t0 )ψh (t0 ) + (a1 · h)a2 + (a1 · h) ψh (t0 ) + G(t0 )ϕh (t0 )) + (a2 · h) ϕh (t0 ) + ϕh (t0 ) ψh (t0 )] · h = (F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h + τh (t0 ) · h. Nótese que lı́m τh (t0 ) = 0, de donde se sigue que f g es diferenciable en t0 y h−→0 D(F G)(t0 ) = )G(t0 )(DF (t0 ) + F (t0 )(DG(t0 )) que era lo que se querı́a demostrar. Falta ver que la composición de funciones diferenciables, es una función diferenciable. Teorema 4.2.3 (Regla de la cadena II) Si G : A ⊂ R −→ Rn es una función diferenciable en t0 y F : Rn −→ R es diferenciable en G (t0 ), entonces F ◦ G es diferenciable en t0 y d dG (F ◦ G)(t0 ) = DF (G(t0 )) · (t0 ) dt dt Demostración. Como G es diferenciable en t0 , para alguna r > 0 y para cualquier (t0 + h) ∈ Br (t0 ), se tiene que G(t0 + h) = G(t0 ) + v(t0 , h), 105 4. Diferenciación. donde v(t0 , h) = hG0 (t0 ) + hψh (t0 ). Por otro lado, como F es diferenciable en G(t0 ), existe s > 0 tal que para todo (G(t0 ) + h) ∈ Bs (G(t0 )) existe un vector a = D F (G(t0 )) de tal forma que F (G(t0 ) + h) = F (G(t0 )) + a · h + ϕh (G(t0 )) · h Como G es continua, se puede elegir r de tal manera que G(Br (t0 )) ⊂ Bs (G(t0 )). Ası́ tenemos que (F ◦ G)(t0 + h) = F [G(t0 ) + v(t0 , h)] = F (G(t0 )) + DF (G(t0 )) · v(t0 , h) + v(t0 , h) · ϕv(t0 , h) (G(t0 )) = F (G(t0 )) + hG0 (t0 ) · DF (G(t0 )) + hτh (t0 ), donde τh (t0 ) = ψh (t0 ) · DF (t0 ) + [G0 (t0 ) + ψh (t0 )] · ϕv(t0 , h) (G(t0 )) Obsérvese que lı́m τh (t0 ) = 0, de donde se obtiene que F ◦ G es diferenciable h−→0 en t0 y d(F ◦ G) (t0 ) = G0 (t0 ) · DF (G(t0 )) dt Corolario 4.2.4 Si F, G : A ⊂ Rn −→ R son diferenciables en t0 ∈ A y F G(t0 ) 6= 0, entonces G es diferenciable en t0 y F G(t0 )DF (t0 ) − F (t0 )DG(t0 ) D (t0 ) = G G2 (t0 ) F 1 1 Demostración. Como G = F G y G = (f ◦ G) donde f (y) = y1 , tenemos que 1 1 F (t0 ) = (DF (t0 )) (t0 ) + F (t0 ) D (t0 ) D G G G = = = 1 + F (t0 ) f 0 (G(t0 )) DG(t0 ) G(t0 ) 1 DF (t0 ) + − F (t0 ) DG(t0 ) G(t0 ) (G(t0 ))2 (DF (t0 )) G(t0 ) DF (t0 ) − F (t0 )DG(t0 ) , (G(t0 ))2 106 4.2. Funciones escalares de variable vectorial como se querı́a demostrar Usando el Teorema 4.2.3 y el teorema del valor medio para funciones escalares de variable escalar, se obtiene un generalización del teorema del valor medio para funciones reales de variable vectorial. Teorema 4.2.5 (Del valor medio II) Si F : A ⊂ Rn −→ R es una función diferenciable en A, donde A es un conjunto abierto que contiene un segmento rectilı́neo que va de t0 a v 0 , entonces existe ξ0 ∈ (0, 1) tal que F (v 0 ) − F (t0 ) = (v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 )) Demostración. Sea G(ξ) = t0 + ξ(v 0 − t0 ) y H = F ◦ G Entonces F (v 0 ) − F (t0 ) = F (G(1)) − F (G(0)) = H(1) − H(0). Por el Teorema 4.2.3, H es diferenciable en (0, 1). Luego, por el Teorema del valor medio para funciones escalares de variable escalar, se sigue que H(1) − H(0) = H 0 (ξ0 ) para algún ξ0 ∈ (0, 1), de donde se obtiene que F (v 0 ) − f (t0 ) = d(F ◦ G) dG (ξ0 ) = (ξ0 ) · DF (G(ξ0 )) dξ dξ = (v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 )) 4.2.2. Derivadas direccionales y parciales. Considérese una función escalar de variable vectorial F (x). Para disponer de una imagen geométrica, iniciamos nuestra discusión para funciones definidas en R2 , aunque los resultados se presentan en su versión general. En principio, supóngase que en la función F (x, y) se efectúa un cambio en las variables independientes. La primera pregunta que viene a la mente es: “¿Cuál es la razón de cambio de la función respecto a dichas variaciones? ” En general, en un punto de su dominio, la función F no tendrá una razón de cambio única, sino que cambiará en proporciones distintas dependiendo de la dirección en que el punto (x, y) se mueva. Ası́, para la función F en el punto t0 y dado un vector unitario u, la razón de cambio de F en la dirección u, está dada por lı́m h−→0 F (t0 + h u) − F (t0 ) , h 107 4. Diferenciación. F ( t0 + h u ) F ( t0 ) t0 u t0 + h u Figura 4.4: Concepto de derivada direccional Dada una función f (x1 , ..., xn ), supongamos que se realiza un cambio arbitrario en los valores de sus variables independientes. Luego, uno se preguntarı́a sobre cuál es la razón de cambio de la función respecto a dicha variación. No debe ser dificil para el lector observar que la razón de cambio de una función F : A ⊆ Rn −→ R en la dirección v, en el punto t0 ∈ A, donde v, es un vector vector unitario, está dada por lı́m h−→0 F (t0 + hv) − F (t0 ) . h Véase la Figura 4.5. Esta razón de cambio se conoce como derivada direccional de F en t0 en la dirección del vector v. Definición 46 La derivada direccional de F : A ⊆ Rn −→ R en t0 ∈ A en la dirección de un vector unitario v ∈ Rn es la función, que denotaremos por Dv F , dada por Dv F (t0 ) = lı́m h−→0 F (t0 + hv) − F (t0 ) , h 108 4.2. Funciones escalares de variable vectorial cuyo dominio son todos aquellos puntos donde este lı́mite existe. Obsérvese que Dv F (t0 ) depende de los valores de la función F sobre el conjunto L = {t0 + hv|h ∈ R}. F (t0 + h u) F (t0 + h u) − F (t0 ) F (t0 ) h F (t0 ) t0 υ u A F (t0 + h u) t0 + h u t0 + h u Figura 4.5: Razón de cambio en la dirección de un vector u para una función F : R2 −→ R Ası́, si definimos f (h) = F (t0 + hv), se tiene una función real de variable real, cuya gráfica corresponde a la intersección de la función F con un plano que contiene la recta que pasa por t0 y es paralela a v. Luego Dv F (t0 ) = = = lı́m F (t0 + hv) − F (t0 ) h lı́m f (h) − f (0) = f 0 (0) h h−→0 h−→0 109 4. Diferenciación. Ejemplos a) Consideremos la función 3xy + x2 y 3 . Se requiere calcular la derivada direccional de F en el punto (3, 2) y en la dirección v = √12 , √12 . Para esto, consideremos el siguiente lı́mite. F ((3, 2) + h lı́m 1 √1 , √ 2 2 − F (3, 2) h h−→0 3 h2 2 = = + 5h √ 2 + 6 + 9 + 6h √ 2 + h2 2 8 + 12h √ 2 + 6h2 2 + h3 3 22 − 90 h 171 √ 2 b) Considérese la función g(x, y) = 9x2 sin y. Se quiere encontrar la razón de cambio de G en elpunto x0 = (−1, 6) en la dirección del vector unitario v = √334 , √534 . Para realizar este cálculo consideremos la función escalar f : R −→ R dada por 5h 3h √ √ , x2 + = F x1 + 34 34 2 3h 5h = 9 x1 + √ sin x2 + √ 34 34 f (h) = F (x + hv) Luego, calculando la derivada de esta función, se sigue que 0 3h 5h 54 √ x1 + √ sin x2 + √ 34 34 34 2 45 3h 5h √ √ √ x1 + cos x2 + , 34 34 34 f (h) = + Por lo que, evaluando en 0 se obtiene 54 45 f 0 (0) = √ x1 sin x2 + √ x21 + cos x2 34 34 Evaluando en x0 , obtenemos 54 45 Dv F (x0 ) = − √ sin 6 + √ cos 6. 34 34 110 4.2. Funciones escalares de variable vectorial c) Sea H(x) =        x2 y + x4 y2 0 si (x, y) 6= (0, 0) si (x, y) = (0, 0) Calcularemos la derivada direccional de H en (0, 0) en la dirección de un vector v arbitrario, digamos v = (v1 , v2 ). Entonces Dv H(0, 0) = = = F (hv1 , hv2 ) − F (0, 0) h−→0 h lı́m lı́m h3 v12 v2 v 2 v2 = lı́m 2 1 2 4 4 4 h−→0 v2 + h v1 + h v1 ) 2 h−→0 h(h2 v2 v12 . v2 Este lı́mite existe para todo vector de la forma (v1 , v2 ), donde v2 6= 0. Por otra parte, nótese que para vectores de la forma (v1 , 0), se tiene que F (v1 , 0) = 0, por lo que se puede definir la derivada direccional de H en cualquier dirección como  2 v    1 v2 Dv H(0, 0) =    0 si v2 6= 0 si v2 = 0 Por otro lado, nótese que esta función no es diferenciable, ya que ni siquiera es continua (considere las trayectorias y = x2 y y = 0). Este ejemplo muestra que puede suceder que las derivadas direccionales existan en cualquier dirección, pero la función no sea diferenciable. El recı́proco se cumple en general. Teorema 4.2.6 Ses F : A ⊂ Rn −→ R una función diferenciable en t0 ∈ A. Entonces la derivada direccional de F en t0 para cualquier vector v ∈ Rn existe y Dv F (t0 ) = DF (t0 ) · v Demostración. Sea la función G : R −→ Rn , dada por G(h) = t0 + hv, 111 4. Diferenciación. y considérese la función H = F ◦ G. Entonces, H(h) = F (t0 + hv), de donde se sigue que Dv f (t0 ) = H 0 (0). Por la regla de la cadena, se sigue que H 0 (0) = d dG (F ◦ G)(0) = (0) · DF (G(0)) dt dt = v · DF (t0 ) Es importante hacer notar que la máxima razón de cambio de F se encuentra en la dirección del vector DF (t0 ) y esta máxima razón es la longitud de este vector. Esto se sigue ya que el producto escalar de dos vectores alcanza su valor máximo cuando éstos están en la misma dirección. El siguiente resultado es un teorema de valor medio para derivadas direccionales. Teorema 4.2.7 (DEL VALOR MEDIO III) Sea F : A ⊆ Rn −→ R. Supóngase que A contiene el segmento de recta que va de t0 a t0 + hv, donde kvk = 1 y supóngase que Dv F (t0 ) existe para todo t ∈ A. Entonces existe un valor ξ0 ∈ (0, 1) tal que F (t0 + hv) − F (t0 ) = hDv F (t0 + ξ0 h v). Demostración. Considérese la función f (x) = F (t0 + xv), donde x ∈ [0, h]. Luego por la definición de derivada direccional se sigue que f 0 (x) = Dv F (t0 + xv). Ası́, f es continua en [0, h] y diferenciable en (0, h), por lo que aplicando el teorema del valor medio para funciones reales de variable real, se tiene que f (h) − f (0) = hf 0 (ξh) para alguna ξ ∈ (0, 1). Por lo tanto F (t0 + xv) − F (t0 ) = hDv F (t0 + ξ hv) Ahora, en la definición de derivada direccional podemos considerar el vector unitario que tiene un uno en la i-ésima entrada y ceros en las demás, es decir, uno de los vectores de la base canónica. Cuando tomamos la derivada direccional en la dirección del k-ésimo elemento de la base canónica, la llamaremos derivada ∂F parcial de F con respecto a la k-ésima coordenada y la denotaremos por ∂x k ∂F ó Fxk . Ası́ la función ∂xk está dada por 112 4.2. Funciones escalares de variable vectorial ∂F F (x1 , ..., xk−1 , xk + h, xk+1 , ...., xn ) − F (x1 , ..., xn ) (x) = lı́m , h−→0 ∂xk h cuyo dominio es el conjunto de puntos para los que este lı́mite existe. Para calcular las derivadas parciales de una función F , podemos emplear los métodos desarrollados para las derivadas direccionales, o bien, como el valor de la derivada parcial depende solamente de los valores de F en puntos sobre la recta paralela al eje Xk que pasa por el punto x, podemos considerar la función f (x) = F (x1 , ..., xk−1 , x, xk+1 , ...., xn ), de donde se sigue que f 0 (x) = ∂F , ∂xk es decir, tomamos las entradas xi , i 6= j como constantes. Ejemplos a) Sea F (x1 , x2 ) = x21 + x22 . Definimos f (x) = x2 + x22 y g(y) = x21 + y 2 , de donde se sigue que ∂F (x1 , x2 ) = f 0 (x1 ) = 2x1 ∂x1 y ∂F (x1 , x2 ) = g 0 (x2 ) = 2x2 . ∂x2 b) Considérese G(x, y) = sin xy. Tomando a y como constante, se tiene que ∂G = y cos xy. ∂x Análogamente, se obtiene que ∂G = x cos xy ∂y Las derivadas parciales proveen una forma sencilla para demostrar que una función es diferenciable. Ya hemos visto que la existencia de las derivadas parciales no es suficiente para garantizar la diferenciabilidad de una función. El siguiente resultado establece que la continuidad de las derivadas parciales es la pieza faltante. Teorema 4.2.8 Sea F : A ⊆ Rn −→ R una función cuyas derivadas parciales existen y son continuas sobre A, un conjunto abierto de Rn . Entonces F es diferenciable sobre A. 113 4. Diferenciación. Demostración. Sean t0 ∈ A y r > 0. Considérese h ∈ Br (0). Por el Teorema 4.2.7, si t0 = (t1 , ...., tn ) y h = (h1 , ..., hn ) se tiene que F (t0 + h) − F (t0 ) = F (t1 + h1 , ....., tn + hn ) − F (t1 , ...., tn ) = F (t1 + h1 , ....., tn + hn ) − F (t1 , t2 + h2 , ...., tn + hn ) + F (t1 , t2 + h2 , ....., tn + hn ) − F (t1 , t2 , t3 + h3 , ...., tn + hn ) + F (t1 , t2 , t3 + h3 , ....., tn + hn ) − F (t1 , t2 , t3 , t4 + h4 , ..., tn + hn ) .. . F (t1 , ..., tn−1 , tn + hn ) − F (t1 , ..., tn ) = h1 + h2 ∂F (t1 + θ1 h1 + t2 + h2 , ...., tn + hn ) ∂x1 ∂F (t1 , t2 + θ2 h2 , t3 + h3 , ...., tn + hn ) ∂x2 +... + hn Como ∂F ∂xi , ∂F (t1 , ...., tn−1 , tn + θn hn ) ∂xn i ∈ {1, ...., n}, son funciones continuas, se tiene que ∂F ∂F (t1 , ..., ti−1 , ti + θi hi , ti+1 + hi+1 , ..., tn + hn ) = (t1 , ..., tn ) + ϕi h (t0 ), ∂xi ∂xi donde lı́m ϕi h (t0 ) = 0. h−→0 Ası́ F (t0 + h) − F (t0 ) = ∂F ∂F (t0 ), ..., (t0 ) · h + ϕh (t0 ) · h, ∂x1 ∂xn donde ϕh (t0 ) = (ϕ1 h (t0 ), ..., ϕn h (t0 )), por lo que se concluye que F es diferenciable y más aún ∂F ∂F DF (t0 ) = (t0 ), ...., (t0 ) x1 ∂xn Si F tiene derivadas parciales continuas, al vector derivada en t0 lo denotaremos por ∇ F (t0 ) y lo llamaremos vector gradiente de F en t0 . Si al vector 114 4.2. Funciones escalares de variable vectorial h lo denotamos por dt, obtenemos la siguiente notación (más sugerente) para la diferencial de F dF (t0 ) = D F (t0 ) · dt = ∇ F (t0 ) · dt = n X ∂F (t0 ) dxi . ∂xi i=1 Por el Teorema 4.2.6, se sigue que la derivada direccional de F en la dirección de un vector unitario v, si F es diferenciable, está dada por Dv F (t0 ) = ∇ F (t0 ) · v Ejemplos a) Sea F (x, y, z) = exy + sin z − xyz. Nótese que ∂F = xexy − xz ∂y ∂F = yexy − yz, ∂x y ∂F = cos z − xy ∂z son funciones continuas, por lo que la función es diferenciable y D F = ∇F. Más aún, la diferencial de F tiene la forma dF = ∂F ∂F ∂F dx + dy + dz ∂x ∂y ∂z = (yexy − yz)dx + (xexy − xz)dy + (cos z − xy)dz b) Como DF (t0 ) es el vector en la dirección de la máxima razón de cambio de F , donde ésta es la longitud de DF (t0 ), se sigue que el gradiente es el vector que tiene la dirección y la magnitud de la razón de cambio máxima de la función. Ası́, si F (x, y, z) = sin xy + x2 z, en el punto (2, 3, 1), la razón de cambio máxima está en la dirección del vector gradiente en el punto (2, 3, 1). Esto es ∇ F(2,3,1) = (y cos xy + 2xz, x cos xy, x2 )|(2,3,1) = (3 cos 6 + 4, 2 cos 6, 4) = u 115 4. Diferenciación. La magnitud de la razón de cambio está dada por kuk. ∂F Como la derivada parcial ∂x es una función de Rn , se pueden tomar k ∂F con respecto a la i-ésima coordenada, la cual las derivadas parciales de ∂x k denotaremos por ∂2F ∂xi ∂xk De esta forma, se pueden tomar derivadas parciales de órdenes más altos. En general, ∂2F ∂2F (t0 ) 6= (t0 ), i 6= k. ∂xi ∂xk ∂xk ∂xi Para convencerse de esto, tomése la función  x2 − y 2    xy 2 x + y2 Dv F(x, y) =    0 Luego si (x, y) 6= (0, 0) si (x, y) = (0, 0) ∂2F ∂2F (0, 0) 6= (0, 0) (Ejercicio) ∂x∂y ∂y∂x 2 ∂ F Lema 4.2.9 Sea F : A ⊆ R2 −→ R una función. Si ∂y∂x existe en el interior de un rectángulo R con vértices en los puntos (x0 , y0 ), (x0 + h, y0 ), (x0 + h, y0 + k) y (x0 , y0 + k), entonces [F (x0 + h, y0 + k) − F (x0 + h, y0 )] − [F (x0 , y0 + k) − F (x0 , y0 )] = hk ∂2F (x, y) ∂y∂x para algún punto (x, y) ∈ R Demostración. Considérese la función g(x) = F (x, y0 + k) − F (x, y). Luego g 0 (x) = ∂F ∂F (x, y0 + k) − (x, y) ∂x ∂x existe sobre R. De esta forma, por el teorema del valor medio para funciones reales de variable real se sigue que [F (x0 + h, y0 + k) − F (x0 + h, y0 )] − [F (x0 , y0 + k) − F (x0 , y0 )] = g(x0 + h) − g(x0 ) = hg 0 (x) = h ∂F ∂F (x, y0 + k) − (x, y0 ), ∂x ∂x 116 4.2. Funciones escalares de variable vectorial para algún x ∈ (x0 , x0 + h). Nuevamente, por el teorema del valor medio aplicado a ∂F ∂x , existe y ∈ (y0 , y0 + k) tal que ∂F ∂F ∂2F h (x, y0 + k) − (x, y0 ) = hk (x, y) ∂x ∂x ∂y∂x El siguiente resultado establece la igualdad de derivadas parciales mixtas de un función de R2 a R. Teorema 4.2.10 Sean F : A ⊆ R2 −→ R, r > 0 y t0 ∈ A. Si ∂2F y ∂y∂x ∂F ∂2F ∂2F existen en Br (t0 ) y es continua en t0 , entonces existe en ∂y ∂x∂y ∂x∂y t0 y ∂F ∂2F = . ∂x∂y ∂y∂x Demostración. Por definición se tiene que ∂2F (t0 ) ∂x∂y = = ∂F ∂F (t0 + he1 ) − (t0 ) ∂y ∂y lı́m h−→0 h lı́m lı́m h−→0 k−→0 [F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )] , hk si este lı́mite existe, donde u = (h, k). Denotaremos por T (h, k) a la función [F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )] hk ∂F existe en Br (t0 ), tomando 0 < |h| < r, lı́m T (h, k) existe. Sea k−→0 ∂y ∂2F g(h) = lı́m T (h, k). Como es continua en t0 , dada ε > 0, existe δ > 0, k−→0 ∂y∂x tal que si δ ≤ r y kt − t0 k < δ, entonces como ∂2F ∂2F ε (t) − (t0 ) < ∂y∂x ∂y∂x 2 Sea √ h ∈ R tal que 0 < |h| < δ y considérese k 6= 0 de tal forma que h2 + k 2 < r y |g(h) − T (h, k)| < . 2 ∂2F Por el lema 4.2.9, existe t ∈ R tal que T (h, k) = (t). Nótese que ∂y∂x t ∈ Bδ (t0 ), 117 4. Diferenciación. de donde se sigue que g(h) − ∂2F ∂2F ∂2F (t0 ) ≤ |g(h) − T (h, k)| + (t) − (t0 ) ∂y∂x ∂y∂x ∂y∂x < Por lo tanto, lı́m g(h) = h−→0 ε ε + = ε 2 2 ∂2F (t0 ), como se querı́a probar. ∂y∂x Definición 47 Se dice que una función F es de clase C n sobre A ⊆ R2 abierto, si todas las derivadas parciales de orden n de F continuas sobre A. Como siempre el Teorema 4.2.10 y la definición anterior se pueden generalizar para funciones F : Rn −→ R. Ahora, en general, para una función diferenciable, F : Rn −→ R, la derivada direccional en la dirección de un vector unitario u = (u1 , ..., un ) está dada por n X ∂F Du F (x1 , ..., xn ) = ∇ F (x1 , ..., xn ) · u = ui . ∂ xi i=1 Si ∇ F (x1 , ..., xn ) · u es una función diferenciable, la segunda derivada direccional tendrá la forma Du2 F (x1 , ..., xn ) = ∇ (∇ F (x1 , ..., xn ) · u) · u = Du = n X ∂F ui ∂ xi i=1 n X n X i=1 j=1 ! ∂2 F ui uj . ∂ xi ∂ xj Nótese que está expresión se puede escribir en forma matricial. Esto es   ∂2 F ∂2 F ∂2 F · · · 2 ∂ x2 ∂ x1 ∂ xn ∂ x1  ∂ x1     ∂2 F  2 2 ∂ F ∂ F  · · · ∂ xn ∂ x2  ∂ x22  ∂ x1 ∂ x2    Du2 F (x1 , ..., xn ) = (u1 , ..., un )     .. .. .. ..   . . . .       ∂2 F ∂2 F ∂2 F · · · ∂ x1 ∂ xn ∂ x2 ∂ xn ∂ x2 n u1 u2 .. . un      118 4.3. Aplicaciones de la diferencial y la derivada parcial Por otro lado, considérese F : Rn −→ R una función diferenciable. Su diferencial total está dada por la expresión dF = n X ∂F dxi . ∂ xi i=1 Si se considera a d F como una función diferenciable, entonces se puede calcular su diferencial total. Ası́, se tiene la segunda diferencial de la función F, a saber d (d F) n X ∂ dF dxj = d (F) = ∂ xj j=1 2 = = n X n X j=1 i=1 ∂2 F dxi ∂ xj ∂ xi ! dxj n X ∂2 F X ∂2 F 2 . (dx ) + 2 i ∂ x2i ∂ xj ∂ xi i=1 i 6= j De forma similar, se pueden calcular diferenciales de orden superior. 4.3. Aplicaciones de la diferencial y la derivada parcial Ya hemos visto que, al igual que en el caso de funciones escalares de variable real, la derivada direccional es la razón de cambio de una función en una dirección determinada. En el caso de las derivadas parciales, éstas representan la razón de cambio en una dirección paralela a uno de los ejes. Las aplicaciones de las derivadas parciales son diversas. En esta sección, nos enfocaremos en su aplicación a la geometrı́a de superficies y algunas aplicaciones sencillas en la fı́sica. 4.3.1. Plano tangente y recta normal a una superficie Considérese la superficie definida por la ecuación z2 = x2 + y 2 + 1. 4 Se desea encontrar un vector normal a la superficie en el punto (−2, 3). Nótese que la expresión anterior es equivalente a la ecuación r x2 z = + y 2 + 1. 4 Calculando las derivadas parciales de esta función y al evaluar en el punto dado, se obtienen las pendientes de dos rectas tangentes a la superficie, las que a su vez 119 4. Diferenciación. definen dos direcciones que son tangentes a la superficie. El producto vectorial de estas direcciones dará como resultado un vector que será perpendicular a las direcciones y, por tanto, a la superficie. Ası́, las derivadas parciales tienen la forma ∂z x (x, y) = q , ∂x x2 2 + 1 4 + y 4 ∂z y (x, y) = q , ∂y x2 2 + 1 + y 4 evaluando en el punto (−2, 3) obtenemos ∂z −1 (−2, 3) = √ , ∂x 2 11 ∂z 3 (−2, 3) = √ , ∂y 11 por lo que las direcciones tangentes a la superficiequedan determinadas por los 1 3 √ √ vectores v1 = 1, 0, − 2 11 , en y = 3 y v2 = 0, 1, 11 , en x = −2. Ası́, v1 × v2 = i j k 1 0 − 2 √111 0 1 √3 11 = 1 3 − √ , −√ , 1 . 2 11 11 q x2 4 + y 2 + 1, √ calculamos sus derivadas parciales y evaluamos en el punto (−2, 3, 11), se tiene que Por otra parte, si consideramos la función F (x, y, z) = z − ∂F (x, y, z) ∂x √ x ∂F 1 = − q (−2, 3, 11) = − √ ⇒ ∂ x x2 2 11 2 4 4 + y + 1 ∂F (x, y, z) ∂y = y q x2 4 ∂F (x, y, z) ∂x Luego, = + y2 + 1 ⇒ √ ∂F 3 (−2, 3, 11) = √ ∂y 11 1. √ √ √ ∂F ∂F ∂F (−2, 3, 11), (−2, 3, 11), (−2, 3, 11) = v1 × v2 . ∂x ∂y ∂z Ası́, surge la siguiente pregunta: ¿Se cumple, en general, que el vector ∇ F es un vector normal a la superficie F (x, y, z) = 0? La respuesta es afirmativa. Primero mostramos el resultado para el caso de una función de la forma F (x, y, z) = z − f (x, y). 120 4.3. Aplicaciones de la diferencial y la derivada parcial Proposición 4.3.1 Sea z = f (x, y) una función continua con primeras derivadas parciales continuas en una región R del plano XY . Si S es la superficie descrita por la función f , entonces un vector normal a la superficie en el punto (x0 , y0 , z0 ) ∈ S es ∇ F (x0 , y0 , z0 ), donde F (x, y, z) = z − f (x, y). Demostración. La derivada parcial de f (x, y) con respecto a x en el punto (x0 , y0 ) representa la pendiente de la recta tangente a la curva que resulta de la intersección entre la superficie S y el plano y = y0 . Ası́, la ecuación de la recta tiene la forma   z − z0 = ∂∂ xz (x0 , y0 ) (x − x0 ) L1 =  y = y0 . Por tanto, la dirección de L1 es ∂z v1 = 1, 0, (x0 , y0 ) . ∂x De manera análoga, la ecuación de la recta tangente a la curva que resulta de la intersección entre la superficie S y el plano x = x0 es   z − z0 = ∂∂ yz (x0 , y0 ) (y − y0 ) L2 =  x = x0 , de donde se sigue que la dirección de L2 es ∂z v2 = 0, 1, (x0 , y0 ) . ∂y Como los vectores v1 y v2 son tangentes a la superficie en el punto (x0 , y0 , z0 ), entonces un vector normal a la superficie se puede obtener haciendo el producto vectorial v1 × v2 . Ası́ N = v1 × v2 = = i j k 1 0 ∂z ∂x (x0 , y0 ) 0 1 ∂z ∂y (x0 , y0 ) ∂z ∂z − (x0 , y0 ), − (x0 , y0 ), 1 = ∇ F (x0 , y0 , z0 ). ∂x ∂y Ahora, para una superficie S descrita por la ecuación z = f (x, y) se pretende obtener las ecuaciones del plano tangente y la recta normal en el punto 121 4. Diferenciación. P0 = (x0 , y0 , z0 ). Se sabe que la ecuación de un plano que pasa por v0 y es ortogonal a un vector N está dada por N · (v − v0 ) = 0. Como N = ∇ F (x0 , y0 , z0 ) es normal a S en el punto P0 , entonces el plano tangente a S en el punto P0 queda determinado por la expresión ∇ F (x0 , y0 , z0 ) · (v − v0 ) = − ∂z ∂z (x0 , y0 ) (x − x0 ) − (x0 , y0 ) (y − y0 ) + (z − z0 ) = 0. ∂x ∂y ∇ F (P0 ) P0 G′ (P0 ) Figura 4.6: Plano tangente a una superficie Por otra parte, la ecuación de una recta en el espacio se puede calcular dando un punto sobre la recta y la dirección de ésta última. Ası́, la ecuación de la recta normal, en su forma vectorial, es LN = {P0 + t ∇ F (x0 , y0 , z0 ) | t ∈ R}. De esta forma, la ecuación del plano tangente a la superficie z2 = es x2 + y2 + 1 4 √ 1 3 − √ (x + 2) + √ (y − 3) + (z − 11) = 0 2 11 11 y la recta normal queda descrita por la expresión √ 1 3 (−2, 3, 11) + t − √ , √ , 1 . 2 11 11 122 4.3. Aplicaciones de la diferencial y la derivada parcial Ahora, considérese una función F : R3 −→ R diferenciable sobre un conjunto abierto A y S la superficie dada por S = {(x, y, z) ∈ A | F (x, y, z) = r}. Sean P0 (x0 , y0 , z0 ) ∈ S y P = G (t), t ∈ (a, b) la ecuación de una curva C sobre S que pasa por P0 . De esta forma, P0 = G (t0 ), para alguna t0 ∈ (a, b). Por otra parte, como C está contenida en S, se sigue que, para toda t ∈ (a, b), F (G (t)) = c. Si G es diferenciable en (a, b), entonces F ◦ G es diferenciable en (a, b) y ∇ F (G (t)) · G0 (t) = 0, en particular, si t = t0 ∇ F (P0 ) · G0 (t0 ) = 0. Ası́, hemos demostrado que, en P0 , el gradiente de F es ortogonal al vector tangente a cualquier curva que se encuentre sobre la superficie S y que pase por P0 . Por tanto, si ∇ F (P0 ) 6= 0, las tangentes de todas las curvas sobre S en el punto P0 se encuentran en el mismo plano. En consecuencia, el plano tangente a S en el punto P0 tiene la ecuación ∇ F (P0 ) · (P − P0 ) = 0, donde P = (x, y, z) (véase la Figura 4.6). Ejemplo. Sea S la superficie determinada por la ecuación y2 x2 + − z 2 = 1. 9 4 Calcularemos el plano tangente a S en el punto 2, 2, 32 . Para esto, consideramos la función x2 y2 F (x, y, z) = + − z2, 9 4 y la cual tiene vector gradiente 2x 9 , 2 , −2z , de donde se tiene que 2 4 4 ∇ F 2, 2, = , 1, − . 3 9 3 Por tanto, la ecuación del plano tangente es 4 2 4 4 4 , 1, − · x − 2, y − 2, z − = x + y − z − 2 = 0. 9 3 3 9 3 En otro contexto, en la práctica, el experimentador comete errores de observación que se ven reflejados en los datos que ha capturado. El error absoluto, 123 4. Diferenciación. establece la diferencia, en valor absoluto, entre el incremento de una función F y el valor que se obtiene por medio de la diferencial. Es decir, se tiene una expresión de la forma Ea = |(F (x + h) − F (x)) − dF |. El error relativo se obtiene calculando el producto de 100 por el cociente de el error absoluto entre el incremento de la función, a saber Ea Er = 100 . F (x + h) − F (x) Sin embargo, en la mayor parte de los casos, no se conoce el valor del incremento exacto de F , por lo que se hace necesario redefinir el error relativo como er = 100 dF F Ejemplos. 1. Supóngase que se quiere calcular el volumen aproximado del material necesario para fabricar un vaso cilı́ndrico cuyo radio interior es de 7 cm, tiene una altura interior de 13 cm y con espesor de fondo y paredes de 0,3 cm. Nótese que el volumen exacto del material, es la diferencia entre el volumen exterior y el volumen interior. Esto es V (x + h) − V (x) = π ((x + h1 )2 (y + h2 ) − x2 y) = π ((7,3)2 (13,3) − (7)2 (13)) = π(71,757) cm3 . Ahora, para calcular el volumen en forma aproximada, se requiere de la diferencial total de la función volumen. Es decir dV = ∂V ∂V dx + dy ∂x ∂y = π (2xy dx + x2 dy) = π (2 (7)(13)(0,3) + (7)2 (0,3)) ≈ 217,7123 cm3 . De esta forma, los errores absoluto y relativo que se obtienen al usar la diferencial en lugar del incremento exacto son Ea = |π(71,757) − 217,7123| ≈ 7,7189 y Er = 100 7,7189 225,4312 ≈ 3,42 124 4.3. Aplicaciones de la diferencial y la derivada parcial 2. Se desea calcular el valor aproximado de 3,254,13 . Para resolver este problema, consideramos la función f (x, y) = xy , tomando los valores x = 3, y = 4, dx = 0,25 y dy = 0,13. Ahora, f (3, 4) = 81. A este valor se le sumará el valor de la diferencial como aproximación del incremento. Luego df = ∂f ∂f dx + dy ∂x ∂y = y xy − 1 dx + xy ln x dy 4 (3)3 (0,25) + (3)4 ln (3) (0,13) ≈ 38,568387. = Por tanto, 3,254,13 ≈ 119,568387. 3. Un estudiante de la facultad de ciencias está apurado (caso totalmente hipotético) porque quiere calcular el valor de sin 35o cos 69o y no cuenta con calculadora. En este caso, considera la función f (x, y) = sin x cos y π y tomando los valores x = 30o = π6 , y = 60o = π3 , dx = 5o = 36 π dy = 9o = 20 . Luego, √ π π 1 3π f , y df = cos x cos y dx − sin x sin y dy = − , = 6 3 4 180 de donde se sigue que sin 35o cos 69o ≈ 4.3.2. √ 45 − 3 π . 180 Diferenciales exactas Si se tiene una expresión de la forma M (x, y) dx + N (x, y) dy el lector podrı́ preguntarse si existirá una función G : R2 −→ R tal que d G = M (x, y) dx + N (x, y) dy, es decir, ∇ G (x, y) = (M (x, y), n (x, y)). La respuesta es que en general no siempre existe dicha función. En esta sección analizaremos las condiciones bajo las cuales dicha función existe y proporcionar un procedimiento para obtenerla. Definición 48 Se dice que la expresión M (x, y) dx + N (x, y) dy es una diferencial exacta sobre un conjunto abierto A ⊂ R2 , si existe una función G : R2 −→ R tal que ∇ G (x, y) = (M (x, y), N (x, y)) para todo punto (x, y) ∈ A. El siguiente resultado establece una condición necesaria y suficiente para que una forma diferencial sea exacta. En la prueba de este teorema utilizaremos un hecho muy conocido en la teorı́a de integración múltiple, el teorema de Fubini, cuya prueba omitimos pero se puede consultar en [8], pp. 322-324. Teorema 4.3.2 Sea F : R2 −→ R una función continua con dominio rectangular R = [a, b] × [c, d]. Entonces Z bZ d Z dZ b Z F (x, y) dy dx = F (x, y) dx dy = F (x, y) dA. a c c a R 125 4. Diferenciación. Teorema 4.3.3 Sean M, N : A ⊂ R2 −→ R funciones tales que tienen primeras derivadas parciales continuas en un rectángulo abierto R ⊂ R2 , con lados paralelos a los ejes. Entonces M (x, y) dx + N (x, y) dy es una diferencial ∂N exacta si y sólamente si ∂∂M y (x, y) = ∂ x (x, y) para toda (x, y) ∈ R. Demostración. Para mayor sencillez en la notación, escribiremos M y N sólamente. Supongamos que la diferencial es exacta, esto es, existe una función G : R2 −→ R tal que d G = M dx + N dy, luego ∂G = M ∂x y ∂G = N, ∂y ∂M ∂2 G = ∂y∂x ∂y y ∂2 G ∂N = , ∂ x∂ y ∂x de donde se sigue que como las derivadas parciales son continuas, aplicando el teorema se concluye que ∂M ∂N = . ∂y ∂x ∂N Por otra parte, si ∂∂M y = ∂ x en R, entonces, integrando de x0 a x y manteniendo constante a la variable y y aplicando el Teorema fundamental del cálculo, se tiene que Z x Z x ∂M ∂N (t, y) dt = (t, y) dt = N (x, y) − N (x0 , y). ∂ y x0 x0 ∂ t Dado que la región R es rectangular, ésta es convexa y, por tanto, la igualdad anterior se da para todo par de puntos dentro de R. Ahora, integrando con respecto a y de y0 a y, se tiene que Z y Z x Z y Z y ∂M (t, s) dt ds = N (x, s) ds − N (x0 , s) ds. y0 x0 ∂ s y0 y0 Aplicando el Teorema 4.3.2, se obtiene que Z y Z y Z xZ y ∂M (t, s) ds dt = N (x, s) ds − N (x0 , s) ds, y0 y0 x0 y0 ∂ s de donde se sigue, por el Teorema fundamental del cálculo, que Z x Z x Z y Z y M (t, y) dt − M (t, y0 ) dt = N (x, s) ds − N (x0 , s) ds. x0 x0 y0 y0 Por tanto, Z x G (x, y) = Z y M (t, y) dt + x0 Z y N (x0 , s) ds = y0 Z x N (x, s) ds + y0 M (t, y0 ) dt. x0 126 4.3. Aplicaciones de la diferencial y la derivada parcial Ası́, derivando con respecto a x los primeros dos términos y derivando con respecto a y los otros dos, se sigue el resultado. Este resultado se puede generalizar para regiones convexas o regiones simplemente conexas (cf. [4], capı́tulo 6). Más aún, se puede generalizar este resultado para expresiones de la forma n X Mi dxi . i=1 Diremos que esta forma diferencial es exacta si y sólo si se cumple que ∂ Mi ∂ Mj = ∂ xj ∂ xi Ejemplos. 1. Considérese la forma diferencial dada por x p y dx + p dy. x2 + y 2 x2 + y 2 Se afirma que es una forma exacta. En efecto, nótese que si x y M (x, y) = p y N (x, y) = p , 2 2 2 x +y x + y2 entonces xy ∂M ∂N = − , 3 = 2 2 ∂y ∂x 2 (x + y ) donde (x, y) 6= (0, 0). Ası́, integrando M con respecto a x se obtiene que Z p x p G (x, y) = dx = x2 + y 2 + ϕ (y). x2 + y 2 Derivando esta última expresión con respecto a y e igualando con la función N (x, y) se concluye que ϕ0 (y) = 0 y por tanto, p G = x2 + y 2 + c, donde c es una constante. 2. Tómese la expresión 2x cos y dx − x2 sin y + 2yz dy + y 2 dz. Si M1 (x, y, z) = 2x cos y, M2 (x, y, z) = − x2 sin y + 2yz y M3 (x, y, z) = y 2 , 127 4. Diferenciación. verificamos si esta forma diferencial es exacta. Nótese que ∂ M1 = ∂y −2x sin y = ∂ M2 ∂x ∂ M2 = ∂x 2y = ∂ M3 ∂y ∂ M1 ∂ M3 = 0 = . ∂x ∂z Luego, por el Teorema 4.3.3 en su versión generalizada, se sigue que es una diferencial exacta. Integrando M1 con respecto a x, obtenemos Z 2x cos y dx = x2 cos y + ϕ1 (y, z) = F (x, y, z). Derivando esta última expresión con respecto a y se sigue que −x2 sin y + ∂ ϕ1 = − x2 sin y + 2yz, ∂y de donde se concluye que ∂ ϕ1 = 2yz, ∂y por lo que, integrando con respecto a y se obtiene que ϕ (y, z) = y 2 z + ϕ2 (z). Ası́, F (x, y, z) = x2 cos y + y 2 z + ϕ2 (z). Finalmente, derivando esta última igualdad con respecto a z, tenemos que ϕ02 (z) = 0 y, por tanto F (x, y, z) = x2 cos y + y 2 z + c c = constante. 3. La diferencial dada por − x2 x y dx + 2 dy 2 +y x + y2 satisface que, si M (x, y) = − entonces x2 y x y N (x, y) = 2 , (x, y) 6= (0, 0), 2 +y x + y2 ∂M ∂N (x, y) = (x, y), ∂y ∂x para todo punto en el plano, salvo el origen. Sin embargo, no es una diferencial exacta, ya que al integrar las funciones M y N se obtiene la función multivaluada G (x, y) = arctan xy . Si se restringe el codominio al intervalo [0, 2π) para tener una función univaluada, la función tiene una discontinuidad sobre el eje X. Por tanto, no existe su gradiente y de esta forma se ha demostrado que la expresión M dx + N dy no determina una diferencial exacta. 128 4.4. Teorı́a básica de curvas 4. La forma diferencial x 3 (x2 + y 2 ) 2 dx + y 3 (x2 + y 2 ) 2 dy, donde (x, y) 6= (0, 0) es exacta (ejercicio). 4.4. Teorı́a básica de curvas Los puntos en plano se representan con paras ordenados de números reales (a, b) y en R3 se pueden representar como ternas de ordenadas reales. Al igual que en R2 , se eligen tres rectas perpendiculares que se corten en un punto del espacio. Para representar vectores en el espacio, es conveniente introducir tres vectores especiales. A saber i = e1 = (1, 0, 0), j = e2 = (0, 1, 0), y k = e3 = (0, 0, 1). A estos vectores se les conoce como base canónica de R3 . Luego, si a = (a1 , a2 , a3 ) ∈ R3 , se tiene que a = n X ai ei . i=1 Por otra parte, hasta el momento, hemos trabajado con curvas en donde una de las variables queda en función de las demás. Sin embargo, hay ocasiones en las que es más útil y cómodo pensar en los puntos de una curva en el plano (o en el espacio), dependiendo de un parámetro t, es decir, pensar en una curva como la trayectoria que describe un punto al tiempo hipotético t. Si las coordenadas de un punto sobre la curva C en R3 son (x1 , x2 , x3 ), entonces se pueden expresar como funciones de un parámetro t ∈ [a, b], esto es x1 = x1 (t), x2 = x2 (t), x3 = x3 (t), t ∈ [a, b]. Ejemplos. a) Queremos encontrar la ecuación de una recta L que pasa por el extremo de un vector a y tiene la dirección del vector v. Si t ∈ R, los puntos de la forma t v son múltiplos de v y, por tanto, recorren todos los puntos por el origen y tiene la dirección v. Como cada punto de L es el final de la diagonal del paralelogramo con lados a y t v, para alguna t, entonces L = {u ∈ R3 | u = a + t v}, 129 4. Diferenciación. es decir, la recta L se puede expresar mediante la ecuación (paramétrica) L = a + tv b) Las ecuaciones x = r cos θ, θ ∈ [0, 2π], y = r sin θ, representan los puntos sobre una circunferencia. Esto se sigue, ya que al dejar fijo el valor r y variar el ángulo θ, obtenemos el movimiento de una partı́cula que se encuentra a una distancia constante de un punto de la circunferencia. y r θ x Figura 4.7: Circunferencia c) Considérese las ecuaciones x (t) = a cos t, y (t) = b sin t t ∈ [0, 2π] Estas ecuaciones representan los puntos sobre una elipse con eje mayor a y eje menor b (a > b), con centro en el origen, θ denota el ángulo en el centro de la elipse que se asocia al punto de la circunferencia circunscrita que se encuentra verticalmente por encima o por debajo del punto P = (a cos t, b sin t). P t Figura 4.8: Elipse d) Las ecuaciones x (t) = a cos t, y (t) = a sin t z (t) = bt t ∈ R 130 4.4. Teorı́a básica de curvas donde a, b son constantes, describen una curva que yace en el cilindro x2 + y 2 = a2 y se enrolla alrededor de éste de tal forma que cuando t toma el valor 2 k π, k ∈ Z, las coordenadas x y y regresan a su valor original mientras que z incrementa a un valor 2 π b (véase la Figura 4.9). a t Figura 4.9: Hélice enrollada en un cilindro Algunas veces, puede resultar conveniente tomar como parámetro t a la variable x y describir la curva mediante las funciones x = t, y = f (t). Por ejemplo, si se tiene la ecuación de una parábola de la forma y = x2 , podemos tomar las ecuaciones de la forma x(t) = t, y(t) = t2 . 4.4.1. Longitud de arco Ahora, supóngase que una curva C está descrita por las ecuaciones paramétricas (x(t), y(t), z(t)), t ∈ [a, b]. Supóngase que C es suave en el sentido de que x0 (t), y 0 (t) y z 0 (t) son continuas y no se anulan simultáneamente. A los puntos que cumplan esta última condición los llamaremos puntos regulares y a los puntos donde todas las derivadas se anulan los llamaremos puntos singulares. Esta condición, asegura que C no cambia repentinamente de dirección. Tomamos una partición del intervalo [a, b] en n subintervalos de la forma (ti + 1 , ti ), i ∈ {1, ..., n}; de esta forma los puntos cuyas coordenadas son xi = x (ti ), yi = y (ti ), z − i = z (ti ), caen sobre C y forman un polı́gono que aproxima a C y que tiene por vértice a los puntos Pi , i ∈ {1, ..., n}, (véase la Figura 4.10). Ahora, nótese que la longitud l de C se puede aproximar por la longitud de la poligonal y esta aproximación mejora conforme hacemos tender n a infinito. Obsérvese que la distancia de Pi − 1 a Pi está dada por p d (Pi − 1 , Pi ) = (xi − xi − 1 )2 + (yi − yi − 1 )2 + (zi − zi − 1 )2 . 131 4. Diferenciación. P1 P2 P0 Pn − 1 Pn Figura 4.10: Aproximación de una curva mediante una poligonal Como x (t), y (t) y z (t) son diferenciables, se tiene que x0 (t) ≈ Luego xi − xi − 1 ti − ti − 1 y 0 (t) ≈ yi − yi − 1 ti − ti − 1 z 0 (t) ≈ zi − zi − 1 . ti − ti − 1 p d (Pi − 1 , Pi ) ≈ (ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 . Por tanto l (C) ≈ n X i=1 p (ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 , ésta útlima es una suma de Riemann para la función p (x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 , por lo que tomando el lı́mite cuando n −→ ∞, se tiene que Z bp l (C) = (x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 dt. a Esta fórmula se conoce como longitud de arcoa de la curva C. Nótese que si F : R −→ R3 es la función F (t) = (x (t), y (t), z (t)), entonces Z b Z bp l (C) = ||F0 (t)|| dt = F0 (t) · F0 (t) dt. a a 132 4.4. Teorı́a básica de curvas Ejemplo. Sea C una curva descrita por la función F (t) = (et sin t, et cos t), donde t ∈ [0, 2 π]. Para calcular la longitud de esta curva consideramos x (t) = et sin t ⇒ x0 (t) = et (sin t + cos t) y (t) = et cos t ⇒ y 0 (t) = et (cos t − sin t), de donde se sigue que (x0 (t))2 + (y 0 (t))2 = e2t ((sin2 t + 2 cos t sin t + cos2 t) + (sin2 t − 2 cos t sin t + cos2 t)) = 2 e2t . Luego Z 0 2π ||F0 (t)|| dt = Z 0 2π √ 2 et dt = √ 2 (e2 π − 1). En general hay una cantidad infinita de representaciones paramétricas. El siguiente teorema establece la relación que hay entre las representaciones paramétricas. Teorema 4.4.1 Sea C una curva suave representada por las ecuaciones paramétricas x(t), y(t), z(t), t ∈ [a, b]. Esta curva puede ser reparametrizada en términos de un parámetro u ∈ [c, d] mediante una expresión de la forma t = f (u), si f : R −→ R satisface que 1. a = f (c) y b = f (d). 2. f 0 (u) > 0 para toda u ∈ [c, d] (ó f 0 (u) < 0 para toda u ∈ [c, d]). 3. f ∈ C 1 ([c, d]). Demostración. El nuevo parámetro u que describirá a la curva C debe ser tal que a cada valor de u le corresponda uno y solo uno de t . Ası́, t = f (u) debe ser una función creciente o decreciente, de donde se sigue que f debe tener derivada positiva o negativa respectivamente. Además, como C es una curva 133 4. Diferenciación. suave, las funciones x0 (t), y 0 (t) y z 0 (t) deben ser continuas. También dado que dx (f (u)) = du dx dt dt du = x0 (t) f 0 (u) dy (f (u)) = du dy dt dt du = y 0 (t) f 0 (u) dz (f (u)) = du dz dt dt du = z 0 (t) f 0 (u), dx dy dz y como f 0 (u) es continua, entonces du , du y du son funciones continuas en [c, d], de donde se sigue que la curva parametrizada por u es una curva suave. Por otro lado, si en la expresión para la longitud de arco, el extremo final de la curva se deja variable, entonces se obtiene la longitud de arco en función del parámetro t0 . A saber Z t s (t) = ||F0 (u)|| du. a Ası́, s = s (t) define un nuevo parámetro para la curva C, denominado parámetro de longitud de arco. En efecto, s satisface las hipótesis del Teorema 4.2.7, ya que Z t d ds = ||F0 (u)|| du = ||F0 (t)|| > 0, dt dt a de donde se sigue que existe una relaci’on biunı́voca entre s y t. También, si C es una curva suave, ||F0 (t)|| es continua en [a, b]. Ejemplo. Considérese la hélice circular con ecuaciones paramétricas dadas por F (t) = (a cos t, a sin t, bt), t > 0. Luego t Z s (t) = 0 t Z = ||F0 (u)|| du p a2 sin2 u + a2 cos2 u + b2 du 0 = p de donde se sigue que t = la longitud de arco serı́a F (s) = a cos √ a2 + b2 t, √ s . a2 + b2 s a 2 + b2 Luego, la parametrización con respecto a , a sin √ s a2 + b2 , √ bs a2 + b2 134 4.4. Teorı́a básica de curvas Ya hemos visto con anterioridad que F0 (t) representa un vector tangente a la curva C en todos los puntos regulares. Entonces, un vector unitario tangente a la curva en un punto regular queda descrito por la expresión T = dF dt dF dt = dF dt ds dt = dF , ds esto es, si se tiene la parametrización con respecto a la longitud de arco, el vector tangente a la curva en un punto s0 está dado por la derivada de la parametización evaluada en s0 . Proposición 4.4.2 a) Un vector u (t) tiene magnitud constante si y sólo si u (t) · u0 (t) = 0. b) Un vector u (t) es siempre paralelo a una dirección dada si y sólo si u (t) × u0 (t) = 0. Demostración. a) Sea u (t) un vector de magnitud constante c. Entonces ||u (t)||2 = u (t) · u (t) = c2 , luego u (t) · u (t) = 2 u0 (t) · u (t) = 0, dt por lo que se concluye que u0 (t) · u (t) = 0. Por otro lado, si ||u (t)|| no es constante, por la parte anterior u0 (t) · u (t) 6= 0, por lo que se sigue a) b) Si u (t) tiene dirección constante, digamos v, entonces u (t) = ||u (t)|| v, ası́ u0 (t) = d ||u (t)|| v. dt Por lo tanto 0 u (t) × u (t) = (||u (t)|| v) × = ||u (t)|| d ||u (t)|| v dt d ||u (t)|| (v × v) = 0. dt Por otra parte, si u (t) no tiene dirección constante, entonces u0 (t) = d ||u (t)|| d v (t) v (t) + ||u (t)|| , dt dt 135 4. Diferenciación. de donde se obtiene que " d v (t) d ||u (t)|| u (t) × u (t) = ||u (t)|| v (t) × v (t) + ||u (t)|| dt dt " # d v (t) = ||u (t)||2 v (t) × . dt # 0 Como v(t) es de magnitud constante (podemos tomarlo unitario), entonces v(t) y resultado. d v (t) dt son ortoganales, por lo que aplicando a) se sigue el 4.4.2. Aparato de Frenet-Serret Ahora, dada una curva con ecuaciones paramétricas x(t), y(t) y z(t), nos preguntamos ¿Cómo obtener el plano normal a la curva C en un punto P ? Esto es, se quiere obtener el plano perpendicular al vector T. Para resolver este problema, consideremos un punto Q arbitrario en el plano normal, con coordenadas (x, y, z). Sea P0 = (x0 , y0 , z0 ) ∈ C. Luego, el vector Q − P0 pertenece al plano (véase la Figura 4.11). P0 T Q Figura 4.11: Plano normal 136 4.4. Teorı́a básica de curvas Como T es normal al plano, se tiene que (Q − P0 ) · T = 0. Si se toma la parametrización con respecto a la longitud de arco, (si no, normalizamos el vector F0 (t)) obtenemos la ecuación para el plano normal, dada por x0 (s) (x − x0 ) + y 0 (s) (y − y0 ) + z 0 (s) (z − z0 ) = 0. Ahora, como T tiene magnitud constante (es unitario) por la Proposición 4.4.2 se sigue que dT T· = 0. ds Esto nos permite definir un vector unitario N que es perpendicular a T y por lo tanto, perpendicular a C (incluso, N es un vector que yace en el plano normal). A este vector se le conoce como normal y está dado por la expresión T = κN (4.4) A la expresión (4.4) se le conoce como primera fórmula de Frenet- Serret y al escalar κ = ddsT se le llama curvatura de C. A su recı́proco de le denomina radio de curvatura. Finalmente, al vector unitario B = T×N (4.5) se le llama vector binormal que, debido a las propiedades del producto vectorial, es perpendicular a T y a N (véase la Figura 4.12). Los vectores T, N, B determinan un sistema coordenado ortogonal local en cada punto de la curva C. Al plano que contiene a los vectores T y N lo llamaremos plano osculador, el plano que contiene a N y B es el plano normal y el plano generado por T y B lo llamaremos plano rectificador. Como B es unitario se tiene que ddsB , en caso de ser diferente de cero, será ortogonal a B. Luego derivando (4.5) con respecto a s, se tiene que dT dN dB = ×N + T× ds ds ds dado que dT ds = κ N , se sigue que ddsT × N = 0, por lo que dB = ds dN T× ds de donde se sigue que ddsB es perpendicular a T y, por lo tanto, paralelo a N. En consecuencia, se puede escribir como dB = −τ N ds (4.6) 137 4. Diferenciación. B N T Figura 4.12: Aparato de Frenet-Serret A la expresión (4.6) se le conoce como segunda fórmula de Frenet-Serret, donde al número dB |τ | = ds se le conoce como factor de torsión o simplemente torsión. El signo menos en la expresión (4.6) acontece ya que describe la dirección hacia la que gira el vector B en torno de T hacia −N. Si τ > 0, B girará en el mismo sentido que un tornillo de rosca derecha. Lo contrario sucede cuando τ < 0. Uno puede observar que si B sufre un cambio al ir recorriendo la curva, esto es, si ddsB 6= 0, el cambio sólo puede ser en su dirección (ya que el vector binormal es unitario), la cual siempre es perpendicular al vector tangente. Esto es, el vector binormal gira alrededor de la curva en un plano perpendicular al vector tangente. Por otro lado, si se multiplica vectorialmente la ecuación que define al vector binormal por −N, obtenemos que B × (−N) = T, que nos indica que si B gira hacia el vector −N, se obtiene el vector T. Ası́, si τ > 0, ddsB y el incremento del vector binormal tienen la dirección de −N y por lo tanto B gira alrededor de T hacia −N, es decir, gira en sentido positivo. Lo contrario ocurre cuando τ < 0. Por otro lado, multiplicando vectorialmente la ecuación que define al vector binormal por T, obtenemos que N = B × T, por lo que, derivando esta 138 4.4. Teorı́a básica de curvas expresión se tiene que dN ds dB dT ×T+B× ds ds = = −τ N × T + κ B × N, de donde se obtiene la llamada tercera fórmula de Frenet-Serret dN = τ B − κT ds Ejemplo. Considérese la curva definida por la ecuación vectorial s bs s , a sin √ , √ . a cos √ a2 + b2 a2 + b2 a 2 + b2 Se puede verificar (ejercicio) que esta curva está parametrizada en términos de la longitud de arco. Ası́ −√ T = a a2 + b2 √ sin s , √ a2 + b2 a a2 + b2 √ cos s , √ a2 + b2 b , a2 + b2 luego, derivando con respecto a s se obtiene que dT s a s a = − 2 cos √ sin √ ,− 2 ,0 , ds a + b2 a + b2 a2 + b2 a2 + b2 de donde se sigue que dT a = 2 , ds a + b2 κ = por lo que N = dT ds κ √ − cos = s 2 a + b2 √ , − sin s 2 a + b2 ,0 y como B = T × N, se tiene que i B = j − √a2a+ b2 sin − cos √ √ s + b2 a2 s a2 + b2 √ a a2 + b2 cos − sin √ k √ s + b2 a2 s a2 + b2 √ b a2 + b2 , 0 de donde se obtiene B = −√ b a2 + b2 sin √ s a2 + b2 , √ b a2 + b2 cos √ s a2 + b2 ,√ a a2 + b2 . 139 4. Diferenciación. Luego dB = ds − b cos a2 + b2 por tanto, √ s a2 + b2 ,− b sin a2 + b2 dB b N, = 2 ds a + b2 de donde se concluye que τ = − a2 b . + b2 √ s a2 + b2 ,0 , Bibliografı́a [1] Friedberg, S. et Al, Linear Algebra, New Jersey, Prentice Hall, 2003. [2] Cardenas, H. et Al, Álgebra superior, México, Trillas, 1982. [3] Courant, R., Fritz, J., Introduction to Calculus and Analysis Vol. 2, New York, Interscience, 1965. [4] Haaser, N. et Al, Análisis matemático 2, México, Trillas, 1971. [5] Lascurain, A., Álgebra superior I, México, Facultad de Ciencias, UNAM, 2012. [6] Lehmann, C., Geometrı́a analı́tica, México, Limusa, 1994. [7] Marsden, J., Hoffman, M. Elementary Classical Analysis, New York, W. H. Freeman and Company, 1993. [8] Marsden, J., Tromba, A. Vector Calculus, Third Edition, New York, W. H. Freeman and Company, 1988 [9] Murdoch, D. C., Geometrı́a analı́tica con vectores y matrices, México, Limusa, 1981. 141

notas1 (1)

Documentos relacionados

Productos

Apoyo

notas1 (1)

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib