Notas de Cálculo 3 Raybel A. Garcı́a A., Antonio O. Vega E., Orlando R. Martı́nez M. 27 de octubre de 2013 Contenido 1. Espacios normados 1.1. Vectores . . . . . . . . . . . . . . . . . 1.2. Espacios vectoriales . . . . . . . . . . 1.3. Espacios normados . . . . . . . . . . . 1.3.1. Producto escalar en R3 . . . . 1.3.2. Productos interiores y normas . 1.4. Espacios métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 6 9 9 10 22 2. Elementos básicos de topologı́a 2.1. Conjuntos abiertos . . . . . . . 2.2. Conjuntos cerrados . . . . . . . 2.3. Sucesiones . . . . . . . . . . . . 2.4. Compacidad . . . . . . . . . . . 2.5. Conexidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 29 36 41 49 57 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . dimensionalmente finitos . . . . . . . . . . . . . . . . . . . . 61 63 73 83 87 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 93 101 101 106 118 118 124 128 130 135 3. Limites y continuidad. 3.1. Lı́mites . . . . . . . . . . . . 3.2. Funciones continuas . . . . . 3.3. Continuidad uniforme . . . . 3.4. Espacios vectoriales normados . . . . . . . . . . . . . . . . . . . . 4. Diferenciación. 4.1. Funciones vectoriales de variable escalar. . . . . . . . . 4.2. Funciones escalares de variable vectorial . . . . . . . . 4.2.1. Derivada y diferencial . . . . . . . . . . . . . . 4.2.2. Derivadas direccionales y parciales. . . . . . . 4.3. Aplicaciones de la diferencial y la derivada parcial . . 4.3.1. Plano tangente y recta normal a una superficie 4.3.2. Diferenciales exactas . . . . . . . . . . . . . . . 4.4. Teorı́a básica de curvas . . . . . . . . . . . . . . . . . . 4.4.1. Longitud de arco . . . . . . . . . . . . . . . . . 4.4.2. Aparato de Frenet-Serret . . . . . . . . . . . . iii . . . . . . . . . . Capı́tulo 1 Espacios normados En general, estamos acostumbrados a trabajar con diversas cantidades como, por ejemplo, el volumen de un cuerpo, el área de un terreno, la temperatura de un objeto, etcétera. Ası́ pues, decimos que hemos comprado un litro de leche o que un niño tiene 38o de temperatura. En estos ejemplos, las cantidades citadas quedan totalmente determinadas cuando especificamos su magnitud, esto es, su valor numérico y la unidad que hemos utilizado para medirlas. A este tipo de cantidades las llamaremos magnitudes escalares. Sin embargo, existen otras que no pueden clasificarse como escalares, pues no quedan unicamente determinadas al proporcionar su magnitud. En este capı́tulo estudiaremos las nociones de vector, producto interior y norma. 1.1. Vectores Muchas nociones fı́sicas tan familiares como la fuerza, la velocidad y la aceleración involucran dos conceptos fundamentales: magnitud y dirección. A este tipo de entidades las llamaremos vectores. B A Figura 1.1: Vector con origen en A y extremo en B Definición 1 Un vector es una entidad matemática que tiene magnitud, dirección y sentido. Para representar un vector graficamente, utilizaremos una flecha que va de un punto A a un punto B (véase la Figura 1.1).Al punto A lo llamaremos origen y al punto B extremo del vector. La longitud del segmento AB, medida en unidades adecuadas, representa la magnitud del vector, la dirección del vector 1 2 1.1. Vectores es la de la recta que lo contiene, mientras que su sentido es el que va de su origen a su extremo. Si dos vectores son colineales, es claro que quiere decir que dos −−→ −−→ vectores tienen o no el mismo sentido; dos vectores AB y CD son paralelos entre sı́, si los segmentos AB y CD son paralelos, más aún, diremos que dichos vectores tienen el mismo sentido si los segmentos AC y BD no se cortan y tienen sentidos contrarios si estos segmentos se cortan (véase la Figura 1.2). B C A D Figura 1.2: Vectores con sentido opuesto −−→ −−→ Definición 2 Dos vectores AB y CD son iguales si y sólo si tienen la misma magnitud, dirección y sentido. (x, y) (x − a, y − b) (a, b) = O′ O Figura 1.3: Traslación en el plano 3 1. Espacios normados Consideremos un par de ejes rectangulares con origen en un punto O; si el eje y se moviera a unidades a la derecha, es claro que la abscisa de todo punto disminuirı́a en a unidades. Análogamente, si el eje y se moviera a unidades a la izquierda, la abscisa incrementarı́a en a unidades para todo punto en el eje rectangular. Algo similar sucederı́a con las ordenadas si movemos el eje x, b unidades hacia arriba o hacia abajo. En consecuencia, es claro que si movemos el origen al punto (a, b), de manera que los nuevos ejes sean paralelos y tengan la misma orientación que los ejes originales, las nuevas coordenadas (x0 , y 0 ) del punto (x, y) serán x0 = x − a y 0 = y − b, (1.1) (Figura 1.3). A este tipo de cambio de coordenadas, lo llamaremos traslación con ecuaciones (1.1). No es difı́cil extender estas ideas al espacio tridimensional: mover el plano yz hacia la derecha o hacia la izquierda a unidades, es restar o sumar a unidades a la abscisa de todo punto; si movemos el plano xz hacia adelante o hacia atrás, significa quitar o añadir unidades a la ordenada; finalmente desplazar hacia arriba o hacia abajo el plano xy modificará la cota (coordenada z) de todo punto. De esta forma, las ecuaciones de traslación para el caso tridimensional quedan descritas de la forma x0 = x − a y0 = y − b z 0 = z − c. Z′ B γ α β Y′ O A X′ Figura 1.4: Ángulos directores para un vector en el espacio Ahora, todo punto P = (x, y) en un sistema rectangular de coordenadas, podemos pensarlo como un vector, cuyo origen se encuentra en el origen del sistema coordenado y su extremo se encuentra en el punto P . Para cada punto en el plano (o en el espacio), el vector asociado de la forma antes descrita lo llamaremos vector posición. A menos que haya confusión, denotaremos por → − −−→ (x, y) al punto P y al vector posición P indistintamente. Sea AB un vector con origen A = (x1 , y1 ) y extremo B = (x2 , y2 ). Si hacemos una traslación con A como nuevo origen, las nuevas coordenadas de B serán (x2 −x1 , y2 −y1 ). −−→ Ası́, hemos encontrado una forma de representar al vector AB en un sistema de coordenadas rectangular. Para el caso del espacio tridimensional se puede realizar un proceso similar. Además, tanto en el caso bidimensional como en el 4 1.1. Vectores tridimensional, un vector queda determinado por los ángulos que forman sus proyecciones con los ejes coordenados. La Figura 1.4 muestra el caso de un vector en el espacio. Los ángulos BAX 0 , BAY 0 y BAZ 0 se llaman ángulos directores y los respresentamos por α, β y γ respectivamente. Nótese que dos vectores tienen la misma dirección y el mismo sentido si y sólo si tienen los mismos ángulos directores. Además, obsérvese que α, β, γ ∈ [0, π]. Como la función coseno es uno a uno en el intervalo [0, π], un ángulo en este intervalo queda determinado de forma única por su coseno, por tanto, la orientación de un vector está definida por los cosenos de sus ángulos directores, los cuales reciben el nombre de cosenos directores del vector. La proyección de B sobre el eje X 0 tiene coordenadas (x2 − x1 , 0, 0) con relación a los ejes trasladados, donde x2 − x1 es positivo, nulo o negativo, dependiendo de si α es menor, igual o −−→ mayor a π2 . De esta forma, si r es la magnitud del vector AB, se obtiene que x2 − x1 = r cos α = r cos β z2 − z3 = r cos γ. y2 − y1 Se sigue que, por la definición de igualdad, dos vectores son iguales si tienen la misma magnitud y los mismos cosenos directores. Proposición 1.1.1 Si A = (x1 , y1 , z1 ), B = (x2 , y2 , z2 ), C = (x3 , y3 , z3 ) y −−→ −−→ D = (x4 , y4 , z4 ) son puntos en el espacio, los vectores AB y CD si y sólo si x2 − x1 = x4 − x3 , y2 − y1 = y4 − y3 y z2 − z1 = z4 − z3 . −−→ −−→ Demostración. Por las ecuaciones anteriores, si AB = CD, entonces se tiene la igualdad de las diferencias de las coordenadas. Ahora, si las diferencias de las coordenadas son iguales, entonces las magnitudes de cada uno de los vectores son iguales, por tanto los dos vectores tienen los mismos cosenos directores. −−→ −−→ No es difı́cil probar que todo vector AB es igual a un vector OP con origen −−→ en el del sistema coordenado y con las componentes de AB como coordenadas de su extremos. También, nótese que la suma de los cuadrados de los cosenos directores de cualquier vector es igual a 1. Ahora, sean ~x = (x1 , y1 , z1 ) y ~y = (x2 , y2 , z2 ) dos vectores cualesquiera. Definimos la suma ~x + ~y como el vector −−−→ x + y := (x1 + x2 , y1 + y2 , z1 + z2 ). Al vector cuyo origen coincide con su extremo lo llamaremos vector cero o nulo. Este vector tiene magnitud nula, no tiene orientación y lo representaremos por ~0. Además, obsérvese que ~0 = (0, 0, 0), de donde se sigue que, para cualquier vector ~x, ~x + ~0 = ~0 + ~x = ~x. El vector (−x1 , −y1 , −z1 ) se llama negativo del vector ~x y se denota por −~x. Se tiene que ~x + (−~x) = −~x + ~x = ~0. 5 1. Espacios normados Es claro que, a partir de estas definiciones, la suma de vectores satisface las mismas propiedades básicas que las de la suma de números reales, es decir, es cerrada, asociativa y conmutativa, además de que existe un elemento neutro y para cada vector, existe un elemento inverso bajo esta operación. El siguiente resultado, proporciona una interpretación geométrica de la adición de vectores. Proposición 1.1.2 Si A, B y C son tres puntos cualesquiera, entonces −→ −−→ −−→ AC = AB + BC Demostración. Sin pérdida de generalidad, podemos elegir un sistema coordenado con origen en A. Sean B = (x1 , y1 , z1 ) y C = (x2 , y2 , z2 ). Entonces −−→ AB = (x1 , y1 , z1 ) −−→ BC = (x2 − x1 , y2 − y1 , z2 − z1 ), −→ −−→ −−→ de donde se obtiene que AC = (x2 , y2 , z2 ) = AB + BC. C A D B Figura 1.5: Regla del paralelogramo −−→ −→ Corolario 1.1.3 Si AB y AC son vectores con el mismo origen A, entonces −−→ −→ −−→ AB + AC = AD, donde D es el cuarto vértice del paralelogramo del cual AB y AC son lados adyacentes. Demostración. Consideremos el paralelogramo ABCD (véase la Figura 1.5). −→ −−→ Como AC = BD, se sigue que −−→ −→ −−→ −−→ −−→ AB + AC = AB + BD = AD Nótese que las demostraciones de estos dos últimos resultados funcionan tanto para el plano como para el espacio. Ahora, consideremos un vector de la 6 1.2. Espacios vectoriales forma ~x = (x1 , y1 , z1 ) y k un número real al que llamaremos escalar. Definimos el producto del vector ~x por el escalar k de la siguiente forma k ~x := (k x1 , k y1 , k z1 ) Obsérvese que se cumplen reglas distributivas para la suma de vectores y el producto por escalares como sucede en los reales. En la siguiente sección profundizaremos en este aspecto. Para finalizar con esta sección, analizamos la geometrı́a del producto de vectores por escalares. De la fórmula de la distancia, la magnitud de un vector ~x = (x1 , y1 , z1 ), que denotaremos por ||~x||, está dada por q ||~x|| = x21 + y12 + z12 . Por otra parte, si k ∈ R, entonces q q ||k ~x|| = k (x21 + y12 + z12 ) = |k| x21 + y12 + z12 = |k| ||~x||. Nótese que la orientación de k ~x será la misma o contraria a la de ~x, dependiendo de si k es mayor o menor a cero respectivamente. Se dirá que dos vectores ~x y ~y son paralelos si y sólo si ~y = k ~x, donde k 6= 0 y tendrán la misma dirección si y sólo si k > 0. 1.2. Espacios vectoriales En la sección anterior observamos que con las definiciones dadas para la suma de vectores y el producto de un vector por un escalar, estas operaciones satisfacen ciertas propiedades. En esta pequeña sección analizaremos otros sistemas algebraicos que le resultarán familiares al lector, en donde se pueden definir operaciones de adición y producto similares a las de los vectores en el plano y el espacio, y que satisfacen las mismas reglas. A continuación definimos formalmente estas estructuras algebraicas. Definición 3 Un espacio vectorial V sobre un campo K es una estructura algebraica que consiste de un conjunto, distinto del vacı́o, sobre el cual se definen dos operaciones + : V × V −→ V y · : K × V −→ V que satisfacen las siguientes condiciones: S1) Para cualesquiera x, y ∈ V , x + y = y + x. S2) Para cualesquiera x, y, z ∈ V , x + (y + z) = (x + y) + z. S3) Existe un único elemento 0 ∈ V tal que x + 0 = x para cada x ∈ V . S4) Para cada elemento x ∈ V , existe un único elemento y ∈ V tal que x + y = 0. 7 1. Espacios normados P1) Para cada elemento x ∈ V , 1 · x = x. P2) Para cualesquiera a, b ∈ K y para cualquier elemento x ∈ V , (ab) · x = a · (b · x). D1) Para todo a ∈ K y para cualesquiera x, y ∈ V , a · (x + y) = a · x + a · y. D2) Para cualesquiera a, b ∈ K y para cualquier x ∈ V , (a + b) · x = a · x + b · x. A los elementos del campo los llamaremos escalares y a los del espacio vectorial, vectores. El lector debe tener precaución al referirse, por un lado, a los elementos de un espacio vectorial y, por otro lado, a la entidad fı́sica discutida en la sección anterior. Ejemplos 1. En la sección anterior, vimos que R2 = {(x1 , x2 ) | x1 , x2 ∈ R} y R3 = {(x1 , x2 , x3 ) | x1 , x2 , x3 ∈ R} forman espacios vectoriales sobre R. Más aún, si en Rn = {(x1 , ..., xn ) | xi ∈ R, i ∈ {1, 2, ..., n}} definimos las operaciones + y · de la forma (x1 , ..., xn ) + (y1 , ..., yn ) = (x1 + y1 , ..., xn + yn ) c · (x1 , ..., xn ) = (c x1 , ..., c xn ), c ∈ R, se tiene que Rn es un espacio vectorial sobre R. 2. Una matriz de m × n con entradas en la forma a11 a12 a21 a22 A = . .. .. . am1 am2 R, es un arreglo rectangular de · · · a1n · · · a2n .. .. . . ··· amn y (cA)ij = c Aij , donde cada entrada aij ∈ R, i ∈ {1, 2, ..., m}, j ∈ {1, 2, ..., n}. Si definimos la suma de dos matrices A y B y el producto por escalares de la forma (A + B)ij = Aij + Bij 8 1.3. Espacios vectoriales donde Aij denota la entrada de la matriz que se encuentra en el i-ésimo renglón y la j-ésima columna, entonces el conjunto de matrices Mm × n (R) es un espacio vectorial sobre R. 3. Un polinomio con coeficientes en un campo K es una expresión de la forma n X p (x) = ak xk , (1.2) k=0 donde n ∈ N y cada ak , llamado coeficiente de xk , está en K. Si p (x) = 0, esto es, si ak = 0, para toda k ∈ N ∪ {0}, entonces a p (x) lo llamaremos el polinomio nulo o cero. El grado de un polinomio se define como el exponente más grande de la indeterminada x que aparece en la representación (1.2). Por convención, el polinomio nulo tiene grado −1. Diremos que dos polinomios son iguales si tienen el mismo grado y sus coeficientes son iguales, esto es, si p (x) = n X ak xk q (x) = y k=0 m X bk xk , k=0 entonces son iguales si m = n y ai = bi , i ∈ {1, ...., n}. Por otra parte, si m < n podemos definir bm +1 = bm + 2 = · · · = bn = 0, de tal forma que q (x) se puede escribir como q (x) = n X bk x k . k=0 Ası́, podemos definir la suma de dos polinomios como p (x) + q (x) = n X (ak + bk ) xk k=0 y el producto por escalares de la forma c p (x) = n X k=0 c ak xk , c ∈ K. Con estas operaciones, el conjunto de polinomios de grado n con coeficientes en un campo K (que denotaremos por Pn [K]). es un espacio vectorial. 4. Consideremos R2 con las siguientes operaciones (x1 , y1 ) ⊕ (x2 , y2 ) = (x1 + x2 , y1 − y2 ) y c 2 Obsérvese que (R , ⊕, (x1 , y1 ) = (c x1 , c y1 ). ) no es un espacio vectorial (¿Por qué?). 9 1. Espacios normados 1.3. Espacios normados El concepto de medida es fundamental en las aplicaciones. En esta sección trataremos la idea de distancia o longitud en los espacios vectoriales, vı́a una estructura más rica llamada espacio con producto interior. Los espacios con producto interior tienen diversas aplicaciones en la geometrı́a,la fı́sica, el estudio de los mı́nimos cuadrados y las formas cuadráticas, por ejemplo. Iniciamos esta sección con el estudio del producto punto para vectores en R3 (la construcción para R2 es análoga). 1.3.1. Producto escalar en R3 −−→ −→ Consideremos dos vectores AB y AC. Denotaremos por θ al ángulo entre ellos. Eligiendo un sistema de coordenadas rectangular, podemos suponer que los vectores tienen el mismo punto inicial y éste último se encuentra en el origen del sistema. De esta forma, podemos pensar que sus extremos son los puntos P1 = (x1 , y1 , z1 ) y P2 = (x2 , y2 , z2 ) respectivamente. Ahora, obsérvese que θ ∈ [0, π] (véase la Figura 1.6). Nuestro objetivo es encontrar una forma de calcular el ángulo entre estos vectores. P1 P2 r1 r2 θ Figura 1.6: Ángulo entre dos vectores Aplicando la fórmula de la distancia y la ley de cosenos, obtenemos r12 + r22 − 2 r1 r2 cos θ = (d (P1 , P2 ))2 = (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 , −−→ −→ donde r1 y r2 denotan las magnitudes de los vectores AB y AC respectivamente. Usando el hecho de que ri = x2i + yi2 + zi2 , i = 1, 2, se sigue que x1 x2 + y1 y2 + z1 z2 = r1 r2 cos θ. (1.3) 10 1.3. Espacios normados El lado izquierdo de esta última expresión lo llamamos producto escalar de los vectores P1 y P2 (recordemos que usamos indistintamente, a menos que haya confusión, la notación para puntos y vectores posición). Denotamos al producto escalar por P1 · P2 . El lado derecho de la ecuación (1.3) establece que el producto escalar no depende de la elección del sistema de coordenadas, sino de la magnitud de los vectores y el ángulo comprendido entre éstos. Se deja al lector verificar que el producto escalar satisface las siguientes condiciones: Para 3 vectores cualesquiera x, y, z y un escalar arbitrario c, 1. x · (y + z) = x · y + x · z. 2. (cx) · y = c (x · y). 3. x · y = y · x. 4. x · x ≥ 0 y x · x = 0 ⇔ x = 0 Obsérvese que de esta última propiedad se deduce que ||x|| = que, de la ecuación (1.3), se sigue que cos θ = 1.3.2. √ x · x, por lo x·y . ||x|| ||y|| Productos interiores y normas Muchas ideas geométricas tales como la longitud de vectores, los ángulos comprendidos entre ellos y la perpendicularidad en R2 y R3 , se pueden extender a espacios vectoriales más generales. Estas ideas estan relacionadas con el concepto de producto interior. Definición 4 Sea V un espacio vectorial sobre R. Un producto interior sobre V es una función h, i : V × V −→ R, tal que para cualesquiera elementos x, y, z ∈ V y para todo c ∈ R, se satisfacen las siguientes propiedades 1. hcx + y, zi = c hx, zi + hy, zi. 2. hx, yi = hy, xi. 3. hx, xi > 0 si x 6= 0 Ejemplos 1. Como vimos en la subsección anterior, el producto escalar en R3 (y en R2 ) es un producto interior. Más aún, podemos definir en Rn la siguiente función n X hX, Y i = xi yi , (1.4) i=1 11 1. Espacios normados donde X = (x1 , ...xn ) y Y = (y1 , ..., yn ). Para ver que esta función es un producto interior, tenemos que verificar las propiedades dadas en la definición 14. Si Z = (z1 , ..., zn ) y c ∈ R, entonces n X hcX + Y, Zi = (cxi + yi )zi i=1 n X = c xi zi + yi zi i=1 n X = c xi zi + i=1 n X yi zi i=1 c hX, Zi + hY, Zi. = Ahora, por la conmutatividad de los números reales, es claro que hX, Y i = hY, Xi. Finalmente si X 6= 0, entonces al menos una entrada del vector X es distinta de cero, en consecuencia n X hX, Xi = x2i > 0. i=1 Por tanto, la función dada en la expresión (1.4) es unproducto interior sobre Rn . 2. Sea V = C[a,b] el espacio de funciones continuas definidas sobre el intervalo [a, b] y definimos la función b Z hf, gi = f (t) g(t) dt (1.5) a Como la integral abre sumas y saca escalares, la primera propiedad de la definición 14 se cumple, además la segunda propiedad se cumple por la conmutatividad de los números reales. Ahora si f (t) 6= 0 para toda t ∈ [a, b], entonces (f (t))2 > 0. Como f es continua, se sigue que hf, f i = Z b (f (t))2 dt > 0, a en consecuencia, la función definida en (1.5) es un producto interior. Como consecuencias inmediatas de la definición 14, tenemos las siguientes propiedades. Proposición 1.3.1 Sea V un espacio vectorial sobre R con producto interior. Entonces para cualesquiera x, y, z ∈ V y c ∈ R se tiene que 12 1.3. Espacios normados 1. hx, cy + zi = c hx, yi + hx, zi 2. hx, 0i = h0, xi = 0. 3. hx, xi = 0 si y sólo si x = 0. 4. Si hx, yi = hx, zi para todo x ∈ V , entonces y = z Demostración. 1. Obsérvese que hx, cy + zi = hcy + z, xi = chy, xi + hz, xi = chx, yi + hx, zi. 2. Nótese que hx, 0i = hx, y − yi para y ∈ V . Luego, por la afirmación anterior, hx, y − yi = hx, yi + hx, −yi = hx, yi − hx, yi = 0. 3. Si x = 0, por la afirmación anterior se sigue que hx, xi = 0. Ahora si hx, xi = 0, como por definición se tiene que hx, xi > 0 si x 6= 0, se sigue que x = 0. 4. Si hx, yi = hx, zi, entonces se tiene que hx, yi − hx, zi = hx, y − zi = 0, para todo x ∈ V , en particular para y − z, esto es hy − z, y − zi = 0, por la afirmación anterior, y − z = 0, es decir y = z. Esta última proposición nos permite generalizar la noción de magnitud de un vector a espacios vectoriales con producto interior. Definición 5 Sea V un espacio vectorial sobre R con producto interior. Para x ∈ V definimos la norma o longitud de x como p ||x|| = hx, xi El siguiente resultado muestra que las propiedades para la norma euclidiana en R3 se cumplen en general para espacios vectoriales con producto interior. 13 1. Espacios normados Proposición 1.3.2 Sea V un espacio vectorial sobre R con producto interior. Entonces para todo x, y ∈ V y c ∈ R, se cumplen las siguientes afirmaciones 1. ||c x|| = |c| ||x||. 2. ||x|| ≥ 0 y ||x|| = 0 si y sólamente si x = 0. 3. |hx, yi| ≤ ||x|| ||y|| (Desigualdad de Cauchy - Schwarz). 4. ||x + y|| ≤ ||x|| + ||y|| (Desigualdad del triángulo). Demostración. 1. Por la definición se tiene que p p hc x, c xi = c2 hx, xi p = |c| hx, xi = |c| ||x||. ||c x|| = 2. Por la definición 14, se sigue que ||x|| > 0 si x 6= 0 y, por la proposición 1.3.1, se sigue que ||x|| = 0 si y sólamente si x = 0. 3. Si y = 0 el resultado es inmediato. Supongamos que y 6= 0. Para todo α ∈ R, se tiene que 0 ≥ ||α x + y|| = hα x + y, α x + yi = α2 ||x||2 + 2 α hx, yi + ||y||2 . Sea ||x||2 = a, 2 hx, yi = b y ||y||2 = c. Entonces, se tiene que a α2 + 2b α + c ≥ 0 ∀ α ∈ R. Ahora, si f (α) = a α2 + 2b α + c, se sigue que b f0 − = 0, 2a b esto es, α = − 2a es un mı́nimo para la función f . Además, como f (α) ≥ 0 se obtiene que a b2 4a2 para toda α ∈ R, +b de donde se sigue que c ≥ −b 2a + c ≥ 0, b2 , 4a por lo tanto b2 ≤ 4ac, es decir |hx, yi|2 ≤ ||x||2 ||y||2 14 1.3. Espacios normados 4. Por la definición de norma y las propiedades de producto interior, se tiene que ||x + y||2 = = = hx + y, x + yi hx, xi + 2 hx, yi + hy, yi ||x||2 + 2 hx, yi + ||y||2 . Por la desigualdad de Cauchy - Schwarz, se sigue que ||x + y||2 ≤ ||x||2 + ||x|| ||y|| + ||y||2 = (||x|| + ||y||)2 , lo cual concluye la demostración. Proposición 1.3.3 (Ley del paralelogramo). Sea V un espacio vectorial sobre R con producto interior. Entonces, se cumple que ||x + y||2 + ||x − y||2 = 2 (||x||2 + ||y||2 ) Demostración. Por la definición de norma en un espacio conproducto interior, se tiene que ||x + y||2 + ||x − y||2 = hx + y, x + yi + hx − y, x − yi = + = (hx, xi + 2 hx, yi + hy, yi) (hx, xi − 2 hx, yi + hy, yi) 2||x||2 + 2 ||y||2 . Ahora definimos el concepto de norma en general. Definición 6 Sea V un espacio vectorial sobre R. Definimos una norma como una función || · || : V −→ R+ ∪ {0} que satisface las siguientes condiciones 1. Para todo x ∈ V , ||x|| ≥ 0. Además, ||x|| = 0 si y sólamente si x = 0. 2. Para todo x ∈ V y c ∈ R, ||c x|| = |c| ||x||. 3. Para cualesquiera x, y, z ∈ V , ||x + y|| ≤ ||x|| + ||y||. A un espacio vectorial en donde se ha definido una norma || · || lo llamaremos simplemente espacio normado. Hemos visto que a partir de un producto interior se puede generar una norma, pero no toda norma proviene de un producto interior. Sin embargo, se puede verificar que si una norma satisface la ley del paralelogramo, se puede construir un producto interior que la induzca. 15 1. Espacios normados Proposición 1.3.4 Sea V un espacio normado sobre R, con norma || · || tal que satisface la ley del paralelogramo y defı́nase 1 hx, yi = ||x + y||2 − ||x − y||2 . 4 Entonces h, i es un producto interior tal que ||x||2 = hx, yi para todo x ∈ V . Demostración. Para ver que h, i es un producto interior, tenemos que verificar las condiciones establecidas en la definición 14. Obsérvese que 1 hx, yi = ||x + y||2 − ||x − y||2 4 1 = ||y + x||2 − ||y − x||2 = hy, xi. 4 Además, 1 ||2 x||2 − ||0||2 = ||x||2 > 0, hx, xi = 4 si x 6= 0. Por otro lado, como la norma satisface la ley del paralelogramo, se tiene que ||x + 2y||2 + ||x||2 = = ||(x + y) + y||2 + ||(x + y) − y||2 2 (||x + y||2 + ||y||2 ) y ||x − 2y||2 + ||x||2 de donde se sigue que por lo que = = ||(x − y) − y||2 + ||(x − y) + y||2 2 (||x − y||2 + ||y||2 ), ||x + 2y||2 − ||x − 2y||2 = 2(||x + y||2 − ||x − y||2 ) 1 (||x + 2y||2 − ||x − 2y||2 ) 4 1 (2(||x + y||2 − ||x − y||2 )) = 2 hx, yi. = 4 Ası́, para probar que hx + y, zi = hx, zi + hy, zi, verificamos que hx, 2yi = hx + y, 2zi = 2 (hx, zi + hy, zi). De manera similar al argumento anterior, por la ley del paralelogramo se tiene que ||x + y + 2z||2 + ||x − y||2 = 2(||x + z||2 + ||y + z||2 ) y ||x + y − 2z||2 + ||x − y||2 = 2 (||x − z||2 + ||y − z||2 ), 16 1.3. Espacios normados de donde se obtiene que ||x + y + 2z||2 − ||x + y − 2z||2 = 2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 ). En consecuencia, se sigue que 1 (||x + y + 2z||2 − ||x + y − 2z||2 ) 4 1 (2 (||x + z||2 − ||x − z||2 + ||y + z||2 − ||y − z||2 )) 4 2 (hx, zi + hy, zi). hx + y, 2zi = = = Inductivamente, para n ∈ N se tiene que hn x, yi = h(n − 1)x, yi + hx, yi = · · · = n hx, yi. Ahora, por el argumento anterior, obtenemos 1 1 hx, yi = hm x , yi = m h x, zi, m m de donde se concluye que h Ası́, si r = p q, 1 1 x, zi = hx, yi. m m donde p, q ∈ N, entonces hr x, yi = hp = 1 1 x, yi = p h x, yi q q p hx, yi = r hx, yi. q Ahora, si r = 0, se sigue que h0, yi = 1 (||y||2 − ||y||2 ) = 0 = 0 hx, yi. 4 Finalmente, si r es negativo, nótese que hrx, yi = h(−r) (−x), yi = −r h−x, yi, pero ya que h−x, yi + hx, yi = h−x, yi = −hx, yi 1 (|| − x + y||2 − || − x − y||2 + ||x + y||2 − ||x − y||2 ) = 0. 4 Por lo tanto hrx, yi = −r h−x, yi = r hx, yi. 17 1. Espacios normados Por otra parte, obsérvese que hx, xi = 1 (||x + x||2 − ||0||2 ) = ||x||2 , 4 (1.6) para todo x ∈ V . Consecuentemente, por la desigualdad del triángulo y el argumento anterior, tenemos que ||x||2 + 2 hx, yi + ||y||2 = ||x + y||2 ≤ (||x|| + ||y||)2 = ||x||2 + 2 ||x|| ||y|| + ||y||2 . De manera similar, tomando ||x − y||2 , se obtiene que ||x||2 − 2 hx, yi + ||y||2 ≤ ||x||2 + 2 ||x|| ||y|| + ||y||2 , de donde se concluye que |hx, yi| ≤ ||x|| ||y||. (1.7) Finalmente, sea c ∈ R y r ∈ Q. Como (c − r) hx, yi = c hx, yi − rhx, yi y h(c − r)x, yi = hcx − rx, yi = hcx, yi − r hx, yi, es claro que |c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi|. Ahora, por la desigualdad (1.7), se sigue que −|c − r| ||x|| ||y|| ≤ (c − r) hx, yi y y por tanto h(c − r)x, yi ≤ |c − r| ||x|| ||y|| |c hx, yi − hcx, yi| = |(c − r) hx, yi − h(c − r) x, yi| ≤ 2 |c − r| ||x|| ||y||. (1.8) Por la propiedad arquimediana, para todo c ∈ R, se puede encontrar r ∈ Q tal que |c − r| < ε, donde ε > 0. Por la desigualdad (2), se concluye que hcx, yi = c hx, yi para todo c ∈ R. Ası́, h, i es un producto interior y por la ecuación (34), se sigue el resultado. Regresando al estudio de las normas en Rn , hemos visto que el producto escalar genera una norma, a saber, la función dada por v u n uX x2i , ||X||2 = t i=1 18 1.3. Espacios normados donde X = (x1 , ..., xn ). A esta norma la llamaremos norma euclidiana. Sin embargo, podemos definir otras funciones que resultan ser normas en Rn . Por ejemplo, podemos definir la función ||X||1 = n X i=1 |xi |. Para ver que es una norma, debemos verificar que se cumplen las condiciones de la definición 15. En efecto, nótese que ||X||1 ≥ 0 ya que estamos considerando los valores absolutos de las entradas del vector X, además, esta función toma el valor cero si y sólo si cada una de las entradas del vector es cero. Por otra parte, si c ∈ R, se tiene que ||c X||1 = n X i=1 n X |c xi | = |c| i=1 |xi | = |c| ||X||1 . Finalmente, por la desigualdad del triángulo para el valor absoluto, si Y = (y1 , ..., yn ), se sigue que ||X + Y ||1 = n X i=1 |xi + yi | ≤ n X i=1 (|xi | + |yi |) = ||X||1 + ||Y ||1 . Por tanto se sigue que ||X||1 define una norma. Por otro lado, podemos definir la siguiente función ! 31 n X 3 ||X||3 = |xi | . i=1 Esta función también es una norma. En general, para p ≥ 1, si definimos la función ! p1 n X p ||X||p = |xi | , i=1 ésta resulta ser una norma. Para demostrar esta afirmación, requerimos de un par de desigualdades que demostraremos a continuación Proposición 1.3.5 (Desigualdad de Hölder). Sean p > 1 y q > 1 tales que p1 + 1q = 1, X = (x1 , ..., xn ) y Y = (y1 , ..., yn ). Sea X 0 = (|x1 |, ..., |xn |) y Y 0 = (|y1 |, ..., |yn |). Entonces ! p1 n ! q1 n X X |xi |p |yi |q (1.9) X0 · Y 0 ≤ i=1 i=1 Demostración. Para empezar, recordemos la desigualdad de Bernoulli, esto es, si t ≥ 0, entonces (1 + t)p ≥ 1 + pt, 19 1. Espacios normados alcanzándose la igualdad cuando t = 0. Ahora, sean a ≥ 0 y b > 0 tales que a 1+t = . q bp Sustituyendo este valor en la desigualdad de Bernoulli, obtenemos −q ap ≥ 1 + p a b p − p, q b donde la igualdad se alcanza cuando ap = bq . Multiplicando por bq ambos lados de la desigualdad y realizando las operaciones correspondientes, se obtiene que p−1 (1.10) ap ≥ bq (1 − p) + p a bq ( p ) . p p−1 , Como p1 + 1q = 1, se tiene que q = desigualdad (4.2) obtenemos que por lo que, sustituyendo en la ap ≥ bq (1 − p) + p a b, luego, multiplicando por 1 p, se obtiene la siguiente desigualdad bq ap + ≥ ab, p q (1.11) alcanzando la igualdad cuando ap = bq . Por otro lado, tómese aj = |xj | n X i=1 ! p1 p |xi | y bj = |yj | n X i=1 ! q1 , |yi |q sustituyendo en la desigualdad (4.3) y sumando sobre todas las j ∈ {1, ..., n}, obtenemos n X j=1 aj bj ≤ n X j=1 p |xj |p ! + n X p |xi | q i=1 n X = p |xi |p i=1 n X i=1 = n X ! + p |xi | 1 1 + = 1, p q q |yj |q ! n X q |yi | i=1 |yi |q i=1 n X i=1 ! |yi | q 20 1.3. Espacios normados es decir n X j=1 aj bj ≤ 1, de donde se sigue el resultado. Proposición 1.3.6 (Desigualdad de Minkowski) Sean xi , yi ∈ R, i ∈ {1, ..., n} y p ≥ 1. Entonces ! p1 n X i=1 |xi + yi | p ! p1 n X ≤ |xi | i=1 p ! p1 n X + p |yi | i=1 (1.12) Demostración. Por la desigualdad del triángulo para el valor absoluto, se tiene que n n X X |xi + yi |p ≤ (|xi | + |yi |)p . i=1 i=1 Por otra parte, el lado derecho de esta última desigualdad, se puede escribir como n X i=1 (|xi | + |yi |)p = = n X i=1 n X i=1 (|xi | + |yi |)p − 1 (|xi | + |yi |) (|xi | + |yi |)p − 1 |xi | + n X i=1 (|xi | + |yi |)p − 1 |yi |. Luego, definiendo |zi | = (|xi | + |yi |)p − 1 y aplicando la desigualdad (4.3) a cada uno de los sumandos de la expresión anterior, obtenemos n X i=1 |zi | |xi | + n X i=1 |zi | |yi | ≤ n X = i=1 n X = i=1 como 1 p + 1 q n X i=1 = !1 n X i=1 ! q1 |zi |q n X q |zi |q i=1 n X i=1 q (|xi | + |yi |)p − 1 !1 + ! q1 n X + i=1 i=1 |xi |p i=1 |yi |p n X i=1 ! q1 i=1 ! q1 (|xi | + |yi |)p n X + ! p1 n X i=1 n X i=1 ! p1 |xi |p + |xi |p n X i=1 ! p1 + p |yi |p , = 1, entonces p = q (p − 1), de donde se obtiene que q (|xi | + |yi |)p − 1 !1 |yi |p ! p1 ! p1 n X n X q |zi |q i=1 ! p1 |xi |p !1 n X p |xi |p n X i=1 ! p1 |yi |p ! p1 |yi |p , 21 1. Espacios normados lo cual implica que n X i=1 p (|xi | + |yi |) ≤ n X i=1 !1 n !1 q p X p (|xi | + |yi |) |xi | + i=1 n X i=1 tiene que i=1 p !1 − q1 (|xi | + |yi |) n X ≤ i=1 n X = i=1 ! p1 p |xi | n X + i=1 i=1 !1 p , |yi | p 1 por lo que, multiplicando esta desigualdad por n X n X p ! q1 se ob- (|xi | + |yi |)p ! p1 p (|xi | + |yi |) ! p1 |yi | p , pero, por la desigualdad del triángulo para los valores absolutos, tenemos que ! p1 ! p1 n n X X p p (|xi + yi |) ≤ (|xi | + |yi |) , i=1 i=1 de donde se concluye que n X i=1 ! p1 (|xi + yi |) p ≤ n X i=1 ! p1 |xi | p + n X i=1 ! p1 p |yi | , que era justo lo que se querı́a demostrar. De esta forma, la función definida por ||X||p = n X i=1 ! p1 |xi |p , donde X = (x1 , ..., xn ) define una norma, ya que, es claro que ||X||p ≥ 0, alcanzándose la igualdad si y sólamente si cada una de las entradas del vector X es igual a cero. Además, si c ∈ R, se tiene que ! p1 ! p1 n n X X = |c| |xi |p |c| ||X||. ||c X||p = |c xi |p i=1 i=1 Finalmente, la desigualdad del triángulo se sigue de la desigualdad (1.12). Por otra parte, podemos definir la siguiente función en Rn ||X||∞ = máx {|xi | | i ∈ {1, ..., n}}, donde X = (x1 , ..., xn ). Se afirma que esta función es una norma en Rn . Para ver esto, nótese que ||X|| ≥ 0 alcanzando la igualdad si y sólamente si cada entrada del vector X es cero. Ahora, si c ∈ R, entonces ||c X||∞ = máx {|c xi | | i ∈ {1, ..., n}} = |c| máx {|xi | | i ∈ {1, ..., n}} = |c| ||X||∞ . 22 1.4. Espacios métricos Finalmente, se tiene que ||X + Y ||∞ = máx {|xi + yi | | i ∈ {1, ..., n}} = |xj + yj |, para alguna j ∈ {1, ..., n}. Por la desigualdad del triángulo para el valor absoluto, se tiene que |xj + yj | ≤ |xj | + |yj | ≤ máx {|xi | | i ∈ {1, ..., n}} + máx {|yi | | i ∈ {1, ..., n}}, de donde se concluye que ||X + Y ||∞ ≤ ||X||∞ + ||Y ||∞ Se pueden dar otros ejemplos de espacios vectoriales normados: el espacio de funciones continuas definidas en un intervalo [a, b] con la función dada por ||f ||p = Z ! p1 b p (|f (x)|) dx a p ≥ 1 es un espacio normado; el espacio de funciones acotadas con la funcón ||f || = sup {|f (x)| | x ∈ [a, b]} también es un espacio normado. Nuestro estudio en la siguiente sección, se centrará en cómo mediremos distancias a partir de las estructuras que hemos construido hasta el momento. 1.4. Espacios métricos Entre las propiedades de Rn , una de las más importantes es la propiedad métrica, es decir, la forma en que se mide la distancia entre puntos. Un espacio métrico es un conjunto X equipado con una función d : X × X −→ R que proporciona una forma razonable de medir distancias entre dos elementos de X . Este concepto nos permitirá definir más adelante el concepto de conjunto abierto y a partir de éste último estudiar una serie de propiedades y conceptos como, por ejemplo, el de convergencia. Definición 7 Un espacio métrico es una estructura que consta de un conjunto X 6= ∅ y de una función d : X × X −→ R+ ∪ {0}, llamada métrica, que satisface los siguientes axiomas 1. d (x, y) = 0 ⇔ x = y. 2. d (x, y) = d (y, x) ∀ x, y ∈ X . 3. d (x, y) ≤ d (x, z) + d (z, y) ∀ x, y, z ∈ X . Ejemplos. 23 1. Espacios normados 1. Sea (V, || · ||) un espacio normado. Para x, y ∈ V , definimos d (x, y) = ||x − y||. Esta función, en efecto, define una métrica. Nótese que, por las propiedades de la norma, se tiene que d (x, y) ≥ 0, además d (x, y) = 0 si y sólamente si ||x − y|| = 0, esto pasa si y sólamente si x − y = 0, lo cual sucede si y sólamente si x = y, con lo que se satisface el primer axioma. Luego d (x, y) = ||x − y|| = || − (y − x)|| = ||y − x|| = d (y, x). Finalmente, por la desigualdad del triángulo para las normas, se tiene que d (x, y) = ||x − y|| = ||(x − z) + (z − y)|| ≤ ||x − z|| + ||z − y|| = d (x, z) + d (z, y), de donde se concluye que (V, d) es un espacio métrico. De esta forma, hemos construido varios ejemplos de espacios métricos: a) (Rn , d) donde d : Rn × Rn −→ R+ ∪ {0} está dada por ! p1 n X p p ≥ 1. d (x, y) = |xi − yi | i=1 En particular, cuando p = 2 se tiene la distancia euclidiana. b) (Rn , d), definiendo a d como d (x, y) = ||x − y||∞ c) (C[a,b] , d) donde d está definida como Z d (f, g) = a ! 21 b |f (x) − g (x)|2 dx , por mencionar algunos. 2. Sea X = 6 ∅ un conjunto arbitrario y defı́nase la función d como si x = 6 y 1 d (x, y) = 0 si x = y. Entonces (X , d) es un espacio métrico. La verificación de los detalles se dejan al lector. Nótese que este ejemplo nos dice que cualquier conjunto distinto del vacı́o, se puede equipar con una métrica. 3. Sea X = {0, 1} y considérese el conjunto Y = X 9 , es decir, las 9-adas en cuyas entradas hay sólo 0’s y 1’s. Defı́nase d como d (x, y) = número de lugares en los cuales x y y son diferentes. Entonces (Y, d) es un espacio métrico (de hecho, nótese que d (x, y) = 9 X i=1 |xi − yi |). 24 1.4. Espacios métricos 4. Sea X = {x = {xi }i ∈ N | xi ∈ R, X i∈N x2i < ∞} y defı́nase d (x, y) = sX i∈N (xi − yi )2 . Antes de verificar que esta función es una métrica, recordemos que dos sucesiones x y y son iguales si xi = yi para toda i ∈ N. Ahora, es claro que d (x, y) ≥ 0, alcanzando la igualdad si y solamente si xi − yi = 0 para toda i ∈ N. Por otra parte, obsérvese que sX sX 2 d (x, y) = (xi − yi ) = (yi − xi )2 = d (y, x). i∈N i∈N Finalmente, para la desigualdad del triángulo, si x, y, z ∈ X , entonces las series X X X (xi − yi )2 , (xi − zi )2 , (zi − yi )2 , i∈N i∈N i∈N convergen. Luego n X i=1 ! 21 (xi − yi ) 2 ≤ n X i=1 ! 21 2 (xi − zi ) + n X i=1 ! 12 2 (zi − yi ) por la desigualdad de Minkowski. Haciendo tender n a infinito, se tiene el resultado. A este espacio se le conoce como espacio de Hilbert (real) y suele denotarse como l2 . 5. Sean (Xi , di ), i ∈ {1, ..., n} espacios métricos. Tómese X = X1 × X2 × · · · × Xn . Defı́nase para x, y ∈ X la función d (x, y) = n X di (xi , yi ), i=1 donde x = (x1 , ..., xn ) y y = (y1 , ..., yn ). Se afirma que (X , d) es un espacio métrico. Para demostrar esta afirmación, verificamos los axiomas de la definición de métrica. Como di es métrica para toda i ∈ {1, ..., n}, se sigue que d (x, y) ≥ 0, alcanzando la igualdad cuando cada uno de los sumandos se anula. Esto último sucede si y sólamente si xi = yi para toda i ∈ {1, ..., n}, ya que di es métrica. Además d (x, y) = n X i=1 di (xi , yi ) = n X i=1 di (yi , xi ) = d (y, x). 25 1. Espacios normados Finalmente, como cada di es métrica, se tiene que d (x, y) = n X i=1 di (xi , yi ) ≤ n X di (xi , zi ) + i=1 n X di (zi , yi ) i=1 = d (x, z) + d (z, y), donde z = (z1 , ..., zn ). 6. Sea (X , d) un espacio métrico y Y ⊆ X . Entonces, la restricción dI = d|Y × Y : Y × Y −→ R+ ∪ {0}, es una métrica en Y. Al espacio (Y, dI ) se le conoce como subespacio métrico. (Recuerde que si f : A −→ B y g : C −→ B tal que A ⊆ C y f (x) = g (x) para toda x ∈ A, entonces se dice que f es la restricción de g sobre A). En un espacio métrico es posible hablar de vecindades de un punto. Definición 8 Sean (X , d) un espacio métrico, x ∈ X y ε > 0. Definimos la bola abierta de radio ε con centro en x como Bε (x) = {y ∈ X | d (x, y) < ε} Definición 9 Una vecindad de x es un conjunto U ⊂ X , tal que existe ε > 0 de tal forma que Bε (x) ⊂ U . Se dice que dos métricas son equivalentes si para cada punto en el espacio métrico, ambas determinan las mismas vecindades de dicho punto, es decir, dos métricas d y d0 son equivalentes si y sólo si para cada punto x ∈ X se cumple lo siguiente: Dada ε > 0 existe ε0 > 0 tal que si d0 (x, y) < ε0 , entonces d (x, y) < ε; y dada δ 0 > 0 existe δ > 0 tal que si d (x, y) < δ, entonces d0 (x, y) < δ 0 . Para cerrar este capı́tulo, resulta interesante describir geométricamente las bolas generadas en R2 y R3 por las normas || · ||p . Consideremos los conjuntos Bε(p) = {y ∈ Rn | ||y||p < 1} p ≥ 1, n = 2, 3. Primero consideremos el caso n = 2. Si p = 1, el conjunto anterior se puede escribir como {y ∈ R2 | |y1 | + |y2 | < 1}. Para describir geométricamente este conjunto, parecerı́a natural analizar el conjunto de puntos cuyas entradas satisfacen la siguiente igualdad |y1 | + |y2 | = 1. 26 1.4. Espacios métricos (0, 1) (1, 0) Figura 1.7: Bola generada por la norma || · ||1 en R2 Nótese que como se está tratando con valores absolutos, basta con analizar lo que sucede en el cuadrante positivo. El resto del conjunto se obtiene reflejando con respecto al origen y al eje y. De esta forma, trataremos la igualdad y1 + y2 = 1, que es equivalente a la igualdad y2 = 1 − y1 , la cual describe una recta que pasa por los puntos (1, 0) y (0, 1). Reflejando con respecto al eje de las ordenadas y con respecto al origen, obtenemos el conjunto descrito en la Figura 1.7. Obsérvese que los puntos que quedan debajo de la recta, satisfacen que y1 + y2 < 1, (1) por lo que los puntos que conforman al conjunto Bε en R2 son los que se encuentran ”adentro”del cuadrado descrito en la Figura 1.7. Si p = 2, nótese que se tiene una circunferencia con centro en el origen. (0, 1) (1, 0) Figura 1.8: Bola generada por la norma || · ||∞ en R2 Por otra parte, el conjunto B definido como B = {y ∈ R2 | ||y||∞ < 1}, 27 1. Espacios normados genera un lugar geométrico como el descrito en la Figura 1.8, esto debido a que si consideramos el conjunto de puntos (y1 , y2 ) tales que máx {|y1 |, |y2 |} = 1, tanto sus abscisas como sus ordenadas no podrán exceder 1, es decir, se tiene que y1 , y2 ∈ [0, 1]. Si y1 ∈ [0, 1) entonces, necesariamente, y2 = 1 y viceversa, si y2 ∈ [0, 1), entonces, forzosamente y1 = 1. Ahora, si x1 ∈ (0, 1), entonces, para 1 ≤ p ≤ q, se cumple que xq1 ≤ xp1 , de donde se obtiene que 1 − xp1 ≤ 1 − xq , de donde se concluye que la bola generada con la norma || · ||p está contenida en la bola generada por la norma || · ||q , para p < q, obteniendo una situación como la descrita en la Figura 1.9 (0, 1) ||X||1 ||X||2 (1, 0) ||X||4 ||X||∞ Figura 1.9: Comparativo de las bolas generadas por diferentes normas Se puede hacer un análisis similar para el caso de R3 . Para el caso de la norma || · ||1 , obsérvese que la ecuación x1 + x2 + x3 = 1, x1 , x2 x3 ≥ 0, describe un plano que pasa por los puntos (0, 0, 1), (0, 1, 0) y (1, 0, 0). Luego, al reflejar con respecto a los ejes y al origen, obtenemos un octaedro (véase la Figura 1.10). La norma || · ||2 genera una esfera, la norma || · ||∞ un cubo y, por un argumento similar al del caso bidimensional, la bola generada por || · ||p está contenida en la generada por || · ||q , si p ≤ q. Figura 1.10: Norma || · ||1 en R3 Capı́tulo 2 Elementos básicos de topologı́a Existen dos conceptos fundamentales en el desarrollo del cálculo diferencial y, en general, en el análisis real: la convergencia de sucesiones y la continuidad de funciones. Más adelante, definiremos funciones sobre subconjuntos de puntos contenidos en espacios de dimensiones superiores y es conveniente conocer ciertas propiedades de conjuntos que llamaremos abiertos, cerrados y compactos. Estos conjuntos generalizan las ideas de intervalos abiertos y cerrados en la recta real y constituyen las ideas básicas de la topologı́a. Gran parte de los resultados que desarrollamos en este capı́tulo dependen únicamente de las propiedades de la función distancia por lo que, en algunas ocasiones, haremos un análisis de estos conjuntos en espacios métricos más generales. A menos que haya confusión, denotaremos unicamente por X a un espacio métrico (X , d). 2.1. Conjuntos abiertos El concepto de conjunto abierto es crucial en el estudio del cálculo y el análisis real. Definición 10 Sea X un espacio métrico y A ⊆ X . Se dice que A es un conjunto abierto en X , si para todo x ∈ A, existe ε > 0 tal que Bε (x) ⊂ A. Nótese que, por la definición 9, un conjunto es abierto si y solamente si es vecindad de todos sus puntos. A partir de la definición se puede demostrar que Bε (x), ε > 0, es un conjunto abierto. Proposición 2.1.1 Sean X un espacio métrico, ε > 0 y x ∈ X . Entonces Bε (x) es un conjunto abierto. Demostración. Sea y ∈ Bε (x). Debemos exhibir un valor ε0 > 0 tal que Bε0 (y) ⊂ Bε (x). La Figura 2.1 sugiere que al tomar ε0 = ε − d(x,y) , que es 2 29 30 2.1. Conjuntos abiertos x y ε − d (x,y) 2 Figura 2.1: Idea para la demostración de la Proposición 2.1.1 estrictamente positivo ya que d (x, y) < ε, Bε0 (y) ⊂ Bε (x). En efecto, si z ∈ Bε0 (y), entonces d (x, z) ≤ d (z, y) + d (y, x) < ε0 + d (x, y) = d (x, y) + ε < ε. 2 Por tanto, z ∈ Bε (x). En la demostración de la Proposición 2.1.1, obsérvese que ε0 depende de la elección de y, esto es, Bε0 (y) será más pequeña si y está más cerca del contorno de la bola. Ejemplos. 1. Sea X = R2 con la métrica generada por la norma euclidiana. Consideremos el conjunto dado por A = {(x, y) ∈ R2 | x ∈ (a, b)}. Se afirma que A es abierto. La Figura 2.2 nos da una idea para la elección de ε. Para un punto s = (x, y) ∈ A, proponemos ε = mı́n {|x − a|, |x − b|}. Sin pérdida de generalidad, podemos suponer que 0 < a < b. Tómese un punto z = (z1 , z2 ) ∈ Bε (s), es claro que |z1 − x| ≤ d (z, s) < ε. Si ε = x − a, entonces se tiene que |z1 − x| < x − a ⇔ a − x < z1 − x < x − a ⇔ a < z1 < 2x − a = x + (x − a) < b, de donde se sigue que z ∈ A. Si ε = b − x, entonces |z1 − x| < b − x ⇔ x − b < z1 − x < b − x ⇔ 2x − b < z1 < b. 31 2. Elementos básicos de topologı́a Ahora, 2x − b > a ya que, de lo contrario, se tendrı́a que x < esto implica que a+b 2 , b−a b−a y x−a < , 2 2 de donde se concluye que x − a < b − x, lo cual es una contradicción. Por tanto, 2x − b > a de donde se concluye que z ∈ A y por lo tanto A es abierto. b−x > x a b Figura 2.2: El conjunto A = {(x, y) ∈ R2 | x ∈ (a, b)} es abierto 2. Sean A y B subconjuntos abiertos de Rn . Definimos A + B = {x + y ∈ Rn | x ∈ A, y ∈ B}. Se afirma que A + B es un conjunto abierto. Para ver esto, consideremos un punto arbitrario z ∈ A + B, entonces existen elementos x ∈ A y y ∈ B tales que z = x + y. Como A es abierto, existe ε > 0 tal que Bε (x) ⊂ A. Demostraremos que Bε (z) ⊂ A + B. Sea w ∈ Bε (z), entonces ||w − z|| = ||w − (x + y)|| < ε. Ahora, obsérvese que w − (x + y) = (w − y) − x, en consecuencia, w − y ∈ Bε (x) ⊂ A. Como y ∈ B y w = (w − y) + y, se sigue que w ∈ A + B. Por tanto A + B es abierto. 3. Sea X un conjunto arbitrario, distinto del vacı́o y equipado con la métrica discreta. Si A ⊆ X , entonces para todo punto x ∈ A tomamos ε = 21 . Luego, Bε (x) = {x} ⊂ A. Por tanto, todo subconjunto de X es abierto con la métrica discreta. 32 2.1. Conjuntos abiertos 4. Sea X un espacio normado y x ∈ X . Entonces el conjunto {x} no es abierto. Nótese que si tomamos la unión de una colección arbitraria de intervalos abiertos en R, obtendremos un conjunto abierto. Sin embargo, la intersección arbitraria de intervalos abiertos no siempre da como resultado un conjunto abierto. A saber, considérese la colección de intervalos dada por In = (x0 − 1 1 , x0 + ), n n n ∈ N, para alguna x0 ∈ R. Obsérvese que \ In = {x0 }. n∈N Este ejemplo nos sugiere la siguiente propiedad de los conjuntos abiertos. Proposición 2.1.2 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de abiertos en X , entonces [ 1. Para cualquier conjunto de ı́ndices Λ, Aα es abierto en X . α∈Λ 2. Si Λ es un conjunto de ı́ndices finito, entonces En particular, si Λ = ∅, por definición [ α∈Λ \ α∈Λ Aα es abierto en X . Aα = ∅ y \ α∈Λ Aα = X . Demostración. [ 1. Sea x ∈ Aα , entonces existe α ∈ Λ tal que x ∈ Aα . Como Aα es α∈Λ abierto, existe ε > 0 tal que Bε (x) ⊂ Aα ⊂ por tanto [ [ Aα , α∈Λ Aα es abierto. α∈Λ 2. Sea x ∈ \ α∈Λ Aα , entonces x ∈ Aα para toda α ∈ Λ. Como cada Aα es abierto, existe εα > 0 tal que Bεα ⊂ Aα . Como Λ es finito, podemos tomar ε = {εα | α ∈ Λ}; ε > 0 y claramente Bε (x) ⊂ Bεα (x) para toda α ∈ Λ. Por tanto, \ Bε ⊂ Aα , α∈Λ 33 2. Elementos básicos de topologı́a de donde se concluye que \ Aα es abierto. α∈Λ Finalmente, como X contiene a todas las bolas, entonces es abierto y ∅, por vacuidad, es abierto. En general, un conjunto con una colección de subconjuntos (llamados por definición abiertos) que satisfacen las condiciones de la proposición 2.1.2 y contiene al vacı́o y al conjunto total, se le llama espacio topológico y a la colección de subcojuntos se le llama topologı́a. Definición 11 Dos normas definidas sobre un mismo espacio vectorial V se dicen equivalentes, cuando inducen la misma topologı́a sobre V , esto es, definen los mismos abiertos en V . Esta definición es equivalente a la siguiente definición. Definición 12 Dos normas || · || y || · ||∗ sobre V son equivalentes si y sólo si existen dos constantes a, b > 0 tales que a||x|| ≤ ||x||∗ ≤ b||x|| ∀ x ∈ V. Diremos que dos normas están relacionadas (|| · || ∼ || · ||∗ ) si y sólo si son equivalentes. Es claro que esta relación es de equivalencia. Proposición 2.1.3 En Rn , las normas dadas por ! p1 n X p ||X||p = |xi | i=1 y ||X||∞ = máx {|xi | | i ∈ {1, ...., n}}, X = (x1 , ..., xn ), son equivalentes. Demostración. Obsérvese que ||X||∞ = |xj | para alguna j ∈ {1, ..., n}. Luego, se tiene que p1 X 1 (|xj |p ) p = |xj | ≤ |xi |p + |xj |p , i 6= j por tanto ||X||∞ ≤ ||X||p . Por otro lado, nótese que |xi | ≤ ||X||∞ ∀ i ∈ {1, ..., n} n X ⇒ |xi |p ≤ n (||X||∞ )p i=1 ⇒ ||X||p ≤ √ p n ||X||∞ . 34 2.1. Conjuntos abiertos Este resultado nos permite trabajar indistintamente con cualquier norma. Más adelante demostraremos que cualquier norma en Rn es equivalente a la norma || · ||p , por lo que basta analizar las propiedades de los abiertos en Rn con la norma euclidiana. Presentamos ahora otra noción topológica básica que caracteriza a los conjuntos abiertos. Definición 13 Sean X = (X, d) un espacio métrico y A un subconjunto de X. Se dice que un punto x ∈ A es interior, si existe U ⊂ X abierto tal que x ∈ U ⊂ A. A la colección de todos los puntos interiores se le llamará interior de A y se denota por Ao . Ejemplos. 1. Considérese el conjunto A = {(x, y) ∈ R2 | x ∈ (a, b)}. Ya se verificó que este conjunto es abierto, es decir, para todo x ∈ A, existe ε > 0 tal que Bε (x) ⊂ A. También, hemos demostrado que para todo punto x en un espacio métrico, Bε (x) es un conjunto abierto. En consecuencia, es claro que Ao = A. 2. Sea A = [a, b]. Se afirma que Ao = (a, b). Si x ∈ (a, b), como éste último es un conjunto abierto, se sigue que existe un valor ε > 0 tal que Bε (x) ⊂ A, esto es, existe un conjunto abierto totalmente contenido en (a, b) que contiene al punto x. Por otro lado, si x ∈ Ao , entonces existe U ⊂ R abierto, tal que x ∈ U ⊂ A. Ahora, x 6∈ (−∞, a) ∪ (b, ∞), ya que de lo contrario, como (−∞, a) ∪ (b, ∞) es un conjunto abierto, se puede construir un intervalo centrado en x de radio ε > 0, tal que esté totalmente contenido en (−∞, a) ∪ (b, ∞). Por otra parte, x 6= a, ya que para toda ε > 0, (a − ε, a + ε) interseca al complemento de A, es decir, no existe una vecindad de a que esté totalmente contenida en (a, b). Un argumento similar demuestra que b tampoco es punto interior. Por tanto, x ∈ (a, b), de donde se sigue que Ao = (a, b). El siguiente resultado proporciona otras descripciones equivalentes del interior de un conjunto. Proposición 2.1.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces, las siguientes afirmaciones son equivalentes. 35 2. Elementos básicos de topologı́a a) x es un punto interior de A. b) Existe ε > 0 tal que Bε (x) ⊂ A. c) x ∈ S {B ⊆ A | B es un conjunto abierto} Demostración. a) ⇒ b) Si x ∈ Ao , entonces existe un abierto U tal que x ∈ U ⊂ A. Como U es abierto, existe ε > 0 tal que Bε ⊂ U ⊂ A. b) ⇒ a) Ya se demostró que Bε (x) es un conjunto abierto, por lo que es claro que x es un punto interior de A. a) ⇒ c) S Sea G = {B ⊆ A | B es un conjunto abierto}. Se tiene que x ∈ G, si y sólamente si x ∈ B, para algún abierto B ⊆ A, esto es, x ∈ Ao . c) ⇒ a) Si x ∈ Ao , entonces existe un abierto U tal que x ∈ U ⊂ A. Por tanto x ∈ G. La proposición 2.1.4 muestra que el interior de un conjunto es abierto. Más aún, un conjunto A es abierto si y sólamente si A = Ao . Nótese que el interior de un conjunto es el abierto más grande contenido en A. El siguiente resultado muestra algunas propiedades para los interiores de conjuntos en un espacio métrico. La demostración de estos hechos se le deja al lector. Proposición 2.1.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos de X. Entonces 1. X o = X. 2. Ao ⊆ A. 3. (Ao )o = Ao . 4. (A ∩ B)o = Ao ∩ B o . 5. Si A ⊆ B, entonces Ao ⊆ B o . 6. Ao ∪ B o ⊆ (A ∪ B)o . 36 2.2. Conjuntos cerrados 2.2. Conjuntos cerrados Los conjuntos que se conocen como cerrados, al igual que los abiertos, determinan la topologı́a de los espcaios métricos. Sin embargo, sus propiedades son diferentes a las de los abiertos, por lo que resulta importante estudiarlos por separado. Definición 14 Sean X = (X, d) un espacio métrico y B ⊂ X. Se dice que B es un conjunto cerrado si B c es abierto. Ejemplos. 1. Sea x ∈ Rn . Se afirma que {x} es un conjunto cerrado en Rn . Para ver esto, considérese Rn − {x} y tómese un punto y ∈ Rn − {x}. Definimos ε = d (x,y) y construı́mos la bola con centro en y y radio ε. Luego, si 2 z ∈ Bε (y), entonces d (x, z) ≥ d (x, y) − d (z, y) ≥ d (x, y) − ε = d (x, y) − d (x, y) d (x, y) = > 0, 2 2 de donde se sigue que d (x, z) > 0, por lo que z ∈ Rn − {x}. Ası́, Rn − {x} es abierto y, por lo tanto {x} es cerrado en Rn . Más aún, por la proposición 2.2.1, se sigue que un conjunto finito en Rn es cerrado. y Figura 2.3: El complemento de la bola unitaria es un conjunto abierto 2. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Se afirma que C es cerrado. Para demostrar esta afirmación, nótese que si y ∈ C c , se tiene que ||y||2 > 1, por lo que tomamos ε = ||y||2 − 1 (véase la Figura 2.3). Sea z ∈ Bε (y). Aplicando la desigualdad del triángulo se tiene que ||y||2 − ||z||2 ≤ ||y − z||2 < ε ⇔ 1 = ||y||2 − ε < ||z||2 , es decir, z ∈ C c . En consecuencia, Bε (y) ⊂ C c , esto es, C c es abierto, de donde se concluye que C es cerrado. 37 2. Elementos básicos de topologı́a 3. El conjunto dado por R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]}, no es un conjunto cerrado. Nótese que el conjunto Rc no es abierto, ya que para toda ε > 0, la bola de radio ε centrada en un punto de la forma (a, y), donde y ∈ (c, d), no está totalmente contenida en Rc (véase la Figura 2.4). d c a b Figura 2.4: El conjunto R no es cerrado De la definición 14 y la proposición 2.1.2, se obtiene el siguiente resultado. Proposición 2.2.1 Sean X un espacio métrico y {Aα }α ∈ Λ una colección de cerrados en X , entonces \ 1. Para cualquier conjunto de ı́ndices Λ, Aα es cerrado en X . α∈Λ 2. Si Λ es un conjunto de ı́ndices finito, entonces X. [ Aα es cerrado en α∈Λ Otro concepto topológico básico que nos ayudará a determinar si un conjunto es cerrado es el de punto de acumulación. Definición 15 Sean X = (X, d) un espacio métrico y A ⊂ X. Se dice que un punto x ∈ X es un punto de acumulación de A si existe un abierto U ⊂ X tal que x ∈ U y (U − {x}) ∩ A 6= ∅. Al conjunto de puntos de acumulación de A se le conoce como conjunto derivado y se denota por A0 . 38 2.2. Conjuntos cerrados Obsérvese que esta definición nos dice que un punto es de acumulación de un conjunto A, si está arbitrariamente cercano a los puntos de A. Por la proposición 2.1.1, podemos reformular la definición 15 de la siguiente manera: Se dice que un punto x ∈ X es un punto de acumulación de A si para toda ε > 0, (Bε (x) − {x}) ∩ A 6= ∅. Se dice que un punto x ∈ A es aislado si existe un valor ε > 0 tal que (Bε (x) − {x}) ∩ A = ∅. Ejemplos. 1. Sea A = (0, 1). Si x ∈ [0, 1], es claro que para toda ε > 0 se cumple que ((x − ε, x + ε) − {x}) ∩ (0, 1) = 6 ∅. Si x < 0, como (−∞, 0) es un conjunto abierto, existe un valor ε > 0 tal que (x − ε, x + ε) ⊂ (−∞, 0), es decir, existe un valor ε tal que el intervalo centrado en x de radio ε no interseca al conjunto A, de donde se concluye que x no es punto de acumulación para el conjunto A. Un argumento similar prueba que ningún punto en (1, ∞) es de acumulación de A. 2. Considérese el conjunto dado por A = {(x, y) ∈ R2 | x ∈ [0, 1], y ∈ Q ∩ (0, 1)}. Se afirma que A0 = [0, 1] × [0, 1]. Para ver esto, sea w = (x, y) ∈ [0, 1] × [0, 1]. Por la propiedad arquimediana, para todo valor ε > 0, se satisface que (y − ε, y + ε) ∩ Q 6= ∅, donde y ∈ [0, 1]. De esta forma, para toda ε > 0 se tiene que (Bε (w) − {w}) ∩ A 6= ∅, de donde se sigue que w ∈ A0 . Finalmente, si w ∈ A0 , por la parte anterior se sigue que w ∈ [0, 1] × [0, 1]. 3. Sea {xn }n ∈ N ⊂ R, una sucesión de puntos distintos, acotada. Por el teorema de Bolzano-Weierstrass para sucesiones en R, existe una subsucesión {xnk } convergente, digamos a x0 . Luego, x0 es un punto de acumulación para la sucesión {xn }, ya que para toda ε > 0, existe N ∈ N tal que |xnk − x0 | < ε, si nk > N . Esto quiere decir que para toda ε > 0, (Bε (x0 ) − {x0 }) ∩ {xn } 6= ∅. 2. Elementos básicos de topologı́a 39 4. Tómese la bola A = Bε (x) ⊂ R2 . Se puede ver que el conjunto Bε (x) = {y ∈ R2 | d (x, y) ≤ ε} es el conjunto de puntos de acumulación de A (la verificación de los detalles se le dejan al lector). Sin embargo, este resultado es falso en general. Si consideramos X un conjunto arbitrario, distinto del vacı́o, equipado con la métrica discreta, nótese que, para x ∈ X, B1 (x) = {x} ⇒ (B1 (x))0 = ∅. Por otro lado B1 (x) = {y ∈ R2 | d (x, y) ≤ 1} = X. Las nociones de punto de acumulación y conjunto cerrado están fuertemente relacionadas, tal y como lo muestra el siguiente resultado. Teorema 2.2.2 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces A es cerrado si y sólamente si A0 ⊆ A. Demostración. Supongamos que A es un conjunto cerrado. Si x ∈ Ac , entonces existe un valor ε > 0 tal que Bε (x) ⊂ Ac . Luego Be (x) ∩ A = ∅, de donde se sigue que x 6∈ A0 . Por tanto, A contiene a todos sus puntos de acumulación. Por otro lado, supongamos que A0 ⊆ A. Si x ∈ Ac , entonces x 6∈ A0 , de donde se sigue que existe ε > 0 tal que Bε (x) ∩ A = ∅, es decir, Bε (x) ⊂ Ac , por lo que se concluye que Ac es abierto, lo cual prueba el resultado. En la sección anterior vimos que el interior de un conjunto A es el abierto más grande contenido en A. De manera similar, podemos construir el conjunto cerrado más pequeño que contiene a A. Definición 16 Sean X = (X, d) un espacio métrico y A ⊂ X. Se define la cerradura de A, denotada por A, como el conjunto \ A = {B ⊂ X | A ⊂ B, B cerrado} Como la intersección arbitraria de cerrados es un conjunto cerrado, se sigue que A es cerrado. Nótese que A ⊂ A. El siguiente resultado muestra la conexión entre los puntos de acumulación y la cerradura de un conjunto. Proposición 2.2.3 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces A = A0 ∪ A. Demostración. Sea B = A ∪ A0 . Por el Teorema 2.2.2, se sigue que cualquier conjunto cerrado que contiene a A, debe contener a B. Por tanto, basta con demostrar que B es cerrado. Para ver esto, sea y ∈ B 0 , esto es, para ε > 0 (Bε (y) − {y}) ∩ B 6= ∅. 40 2.2. Conjuntos cerrados Tómese z ∈ (Bε (y) − {y}) ∩ B; luego z ∈ A ó z ∈ A0 . En este último caso, tomando ε0 = ε − d (z, y), se tiene que (Bε0 (z) − {z}) ∩ A 6= ∅ donde Bε0 (z) − {z} contiene puntos distintos de y, es decir, y ∈ A0 y, en consecuencia, y ∈ B. De esta forma, B es el cerrado más pequeño que contiene a A, como se querı́a demostrar. Como consecuencia de esta proposición se tiene que un conjunto A es cerrado si y sólo si A = A. El siguiente resultado muestra otra forma de definir la cerradura de un conjunto. Proposición 2.2.4 Sean X = (X, d) un espacio métrico y A ⊂ X. Entonces x ∈ A si y sólamente si λ = ı́nf {d (x, y) | y ∈ A} = 0. Demostración. Si x ∈ A, por la proposición 2.2.3, x ∈ A ó x ∈ A0 . Si x ∈ A, tomando x = y se sigue que λ = 0. Si x ∈ A0 , entonces para toda ε > 0 existe y ∈ A tal que d (x, y) < ε, de donde se concluye nuevamente que λ = 0. Por otro lado, si λ = 0 y x 6∈ A, como λ es el ı́nfimo, se tiene que para cualquier valor ε > 0, existe y ∈ A tal que d (x, y) < ε, de donde se obtiene que x ∈ A0 , que era lo que se querı́a demostrar. En forma análoga a los interiores de conjuntos, el siguiente resultado presenta algunas propiedades para la cerradura de conjuntos. Dejamos la verificación de los detalles al lector. Proposición 2.2.5 Sean X = (X, d) un espacio métrico y A, B subconjuntos de X. Entonces 1. ∅ = ∅. 2. A ⊆ A. 3. A = A. 4. A ∪ B = A ∪ B. 5. Si A ⊆ B, entonces A ⊆ B. 6. A ∩ B ⊆ A ∩ B. Para cerrar esta sección, presentamos el concepto de frontera de un conjunto. Definición 17 Sean X = (X, d) un espacio métrico y A ⊂ X. Definimos la frontera de A, denotada por ∂ A, como el conjunto ∂ A = A ∩ Ac . 41 2. Elementos básicos de topologı́a Como la intersección de conjuntos cerrados es un conjunto cerrado, se sigue que la frontera de A es un conjunto cerrado. Además, n’otese que ∂ A = ∂ Ac . Proposición 2.2.6 Sea A ⊂ X. Entonces x ∈ ∂ A si y sólo si para toda ε > 0, Bε (x) ∩ A 6= ∅ 6= Bε (x) ∩ Ac (2.1) Demostración. Si x ∈ X tal que se satisface la condición (2.1), entonces Bε (x) contiene puntos de A y de Ac distintos de x. Ası́, x ∈ ∂ A. Por otra parte, supongamos que x ∈ ∂ A. Obsérvese que x ∈ A ó x ∈ Ac . Si x ∈ A, como x ∈ ∂ A, por el Teorema 2.2.2, se sigue que x ∈ (Ac )0 . Un argumento similar muestra que si x ∈ Ac , entonces x ∈ A0 . 2.3. Sucesiones El concepto de convergencia es uno de los más importantes en diversas áreas de la matemática. En esta sección, estudiaremos la noción de convergencia de una sucesión en espacios métricos, en particular, en Rn . Recordemos que una sucesión en un conjunto X 6= ∅, es una función que asocia un número natural a un elemento de X, esto es, una correspondencia de la forma S : N −→ R, donde R ⊆ X. Normalmente, cuando nos referimos a la imagen de un elemento n en el dominio, bajo una función S, la denotamos por S(n). Sin embargo, en el caso de las sucesiones, denotaremos por Sn a la imagen del natural n; a la sucesión con los elementos Sn la denotaremos por {Sn }∞ n=1 . Por otra parte, al conjunto R lo llamaremos recorrido de la sucesión. Según la propia definición, una sucesión contiene una infinidad de elementos. Recordemos la definición de convergencia en R. Si los términos de una sucesión {xn } se acercan a un número L, se dice que la sucesión tiende al lı́mite L (también suele decirse que xn converge a L) y se denota por lı́m xn = L n→∞ este sı́mbolo se lee: el lı́mite de la sucesión xn cuando n tiende a infinito es L. L xN + 1 Figura 2.5: Convergencia en R xN 42 2.3. Sucesiones Definición 18 Sea {xn } una sucesión contenida en R. Se dice que {xn } converge a un valor L si dada ε > 0 existe N ∈ N tal que |xn − L| < ε para cualquier n > N . Intuitivamente, esta definición nos dice que la sucesión converge a un cierto valor si a partir de cierto momento los elementos de la sucesión y ese valor se parecen mucho. Gráficamente, el concepto de convergencia significa que para una N suficientemente grande, los elementos de la sucesión xN +1 , xN +2 , xN +3 , ..... pertenecen a un intervalo de radio ε con centro en el valor L. Nótese que los elementos xN +1 , xN +2 , xN +3 , ....., xN quedan fuera de este intervalo, es decir, en el intervalo de convergencia se encuentra una infinidad de elementos de la sucesión, mientras que fuera del intervalo quedan sólo un número finito (véase la Figura 2.5) La definición de convergencia en un espacio métrico es muy parecida. Definición 19 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una sucesión. Se dice que {xn } converge a x0 ∈ X, si para todo abierto U ⊂ X que contiene a x0 , existe N ∈ N tal que xn ∈ U , si n ≥ N . El siguiente resultado presenta una definición equivalente, con la que el lector puede estar más familiarizado. Proposición 2.3.1 Sean X = (X, d) un espacio métrico y {xn } ⊂ X una sucesión. {xn } converge a x0 ∈ X si y sólo si dada ε > 0 existe N ∈ N tal que si n ≥ N , entonces d (xn , x0 ) < ε. Demostración. Supongamos que xn −→ x0 y sea ε > 0. Por la proposición 2.1.1, sabemos que Bε (x0 ) es abierto; luego, existe un valor N ∈ N tal que xn ∈ Bε (x0 ), esto es, d (xn , x0 ) < ε. Por otro lado, sea U una vecindad de x0 y supóngase que dada ε > 0 existe N ∈ N tal que si n ≥ N , entonces d (xn , x0 ) < ε. Como U es una vecindad de x0 , se puede encontrar un valor ε > 0 tal que Bε (x0 ) ⊂ U . De esta forma, existe N ∈ N tal que si n ≥ N , entonces xn ∈ Bε (x0 ) ⊂ U y, por tanto, xn −→ x0 , como se querı́a demostrar. Ejemplos. 1. Sea xn = n1 . Verificamos que {xn } converge a 0. Sea ε > 0, entonces se tiene que 1 1 1 = < ε ⇔ n > , n n ε como ε > 0, esta última desigualdad está bien definida, por lo que se sigue que la sucesión {xn } converge a cero. 43 2. Elementos básicos de topologı́a 2. Considérese la sucesión de números complejos dada por zn = 1 + ni . 2 Recordemos que existe una biyección entre C y R 2. De esta forma, {zn } 1 converge, si y sólo si xn = 1, n converge en R . Se afirma que {xn } converge a x0 = (1, 0). En efecto, obsérvese que 1 1 0, = < ε, ||xn − x0 ||2 = n 2 n para ε > 0 y n suficientemente grande. Ası́, zn −→ z0 , donde z0 = 1. 3. Tómese X un conjunto arbitrario, no vacı́o y equipado con la métrica discreta. Nótese que en este espacio, las sucesiones convergentes son las casi constantes, es decir, aquellas sucesiones tales que xn = x0 para n ≥ N. 4. Sea X = (0, 1] y considérese la métrica usual de R restringida a X. Sabemos que en R, la sucesión xn = n1 es convergente y converge a 0. Sin embargo, esta sucesión en X no converge, ya que 0 6∈ X. Este ejemplo muestra que el concepto de convergencia depende de la métrica y el espacio que estemos considerando. Una propiedad fundamental del lı́mite de una sucesión es la unicidad. Proposición 2.3.2 Sea {xn } una sucesión convergente contenida en un espacio métrico, entonces su lı́mite es único. Demostración. Supongamos que xn −→ x0 y xn −→ y0 , esto es, dada ε > 0, existe N ∈ N tal que d (xn , x0 ) < ε 2 y d (xn , y0 ) < ε , 2 si n ≥ N . Luego d (x0 , y0 ) ≤ d (x0 , xn ) + d (xn , yo ) < ε, si n ≥ N . Sabemos que en R, una sucesión convergente es acotada. Para ver este hecho en general, requerimos el concepto de conjunto acotado en espacios métricos. Definición 20 Sea X = (X, d) un espacio métrico y A ⊆ X. Se dice que A es acotado si existen x ∈ X y un valor M > 0 tal que A ⊂ BM (x). Proposición 2.3.3 Sean X un espacio métrico, {xn } una sucesión convergente, digamos a x0 y R el recorrido de la sucesión. Entonces a) R es acotado. b) x0 ∈ R0 44 2.3. Sucesiones Demostración. a) Sea ε = 1 y N ∈ N correspondiente a este valor. Entonces, si n ≥ N , xn ∈ B1 (x0 ). Tomando s = máx {d (x0 , xi ) | i ∈ {1, 2, ..., N − 1}} + 1, se sigue que xn ∈ Bs (x0 ) para toda xn ∈ R. b) Como para toda ε > 0, la bola Bε (x0 ) contiene un punto de R, se concluye que x0 ∈ R0 . Proposición 2.3.4 Sean X = (X, d) un espacio métrico y A un subconjunto de X. Si x0 ∈ A, entonces existe una sucesión {xn } ⊂ A tal que xn −→ x0 . Demostración. Como x0 ∈ A, para cada n ∈ N, existe un punto xn ∈ A tal que d (xn , x0 ) < n1 . Luego d (xn , x0 ) −→ 0, es decir, xn −→ x0 . Por otra parte, tómese la sucesión xn = (−1)n . Si suponemos que 1 es el punto de convergencia, nótese que para n = 2k − 1, k ∈ N, |xn − 1| = 2 > 1, por lo que 1 no puede ser lı́mite de la sucesión xn ; de forma análoga se puede verificar que −1 no es lı́mite de la sucesión xn . En el ejemplo anterior, si tomamos las subsucesiones {x2k }k ∈ N y {x2k − 1 }k ∈ N , observamos que convergen a 1 y a −1 respectivamente. Este hecho nos hace pensar en el siguiente resultado: Una sucesión converge a un número real α si y sólamente si todas sus subsucesiones convergen a α. Este resultado también es cierto para espacios métricos en general. Proposición 2.3.5 Una sucesión {xn } en un espacio métrico converge a x0 si y sólamente si todas sus subsucesiones convergen a x0 . Demostración. Supongamos que xn −→ x0 . Esto quiere decir que dada ε > 0, existe N ∈ N tal que d (xn , x0 ) , ε si n ≥ N . Sea {xnk } ⊆ {xn } una subsucesión. Entonces, existe M ∈ N tal que nk ≥ N para k ≥ M . Luego, si k ≥ M , se sigue que d (xnk , x0 ) < ε, como se querı́a demostrar. Por otra parte, si cada subsucesión de xn converge, en particular, la sucesión completa es subsucesión de sı́ misma, por lo que se sigue el resultado. Existe un tipo de sucesiones de particular interés: las sucesiones de Cauchy. Definición 21 Sean X un espacio métrico y {xn } un sucesión. Se dice que {xn } es de Cauchy, si dada ε > 0 existe N ∈ N tal que d (xn , xm ) < ε, si n, m ≥ N . 45 2. Elementos básicos de topologı́a De manera intuitiva, decimos que una sucesión es de Cauchy cuando, a partir de cierto momento, los elementos de la sucesión son prácticamente iguales. Otra propiedad de las sucesiones de Cauchy es que son acotadas. La demostración de este hecho es muy parecida al caso de sucesiones de Cauchy en R, por lo que la prueba se le deja al lector. El siguiente resultado presenta una condición necesaria para la convergencia de sucesiones en espacios métricos. Teorema 2.3.6 Sean X un espacio métrico y {xn } una sucesión convergente, digamos a x0 . Entonces {xn } es de Cauchy. Demostración. Como xn −→ x0 , entonces para toda ε > 0, existen N1 , N2 ∈ N, de tal forma que d (xn , x0 ) < ε si n > N1 2 y d (xm , x0 ) < ε si m > N2 . 2 Tomando N = máx {N1 , N2 }, se tiene que d (xn , x0 ) < ε 2 y d (xm , x0 ) < ε , 2 si n, m > N . En consecuencia, se sigue que d (xn , xm ) ≤ d (xn , x0 ) + d (xm , x0 ) < ε, esto es, {xn } es una sucesión es de Cauchy. La implicación inversa en general es falsa. Tomando X = (0, 1] y la sucesión xn = n1 , se tiene un ejemplo de una sucesión de Cauchy que no es convergente en X. A los espacios métricos que satisfacen la doble implicación los llamaremos completos. Demostraremos que Rn es un espacio métrico completo. Para demostrar este hecho, necesitamos algunos resultados previos. Definición 22 Sean (ai , bi ) ⊂ R, i ∈ {1, ...n}, una colección de intervalos abiertos. Se define una n-celda abierta como el producto cartesiano de los intervalos (ai , bi ), esto es, una n-celda abierta es el conjunto de la forma I n = {(x1 , ..., xn ) ∈ Rn | xi ∈ (ai , bi ), i ∈ {1, ...n}}. De forma similar, definimos la n-celda cerrada como el conjunto dado por J n = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}}. Obsérvese que un conjunto A ⊂ Rn es acotado si está contenido en una ncelda. Teorema 2.3.7 (de las celdas anidadas.) Sea {Jk }k ∈ N una sucesión de celdas cerradas en Rn \ tales que J1 ⊇ J2 ⊇ .... Entonces existe un punto x0 ∈ Rn tal que x0 ∈ Jk . k∈N 46 2.3. Sucesiones Demostración. Sea Jk el conjunto dado por (k) (k) Jk = {(x1 , ..., xn ) ∈ Rn | xi ∈ [ai , bi ], i ∈ {1, ...n}} (k) (k − 1) (k) Nótese que [a1 , b1 ] ⊂ [a1 2.6). (k − 1) , b1 ], donde k > 1 (véase la Figura (1) b2 (2) b2 (2) a2 (1) a2 (1) (2) a1 a1 (3) a1 (3) (2) (1) b1 b1 b1 Figura 2.6: 2-celdas anidadas Por la completez de R, existe y1 ∈ R tal que \ (k) (k) y1 ∈ [a1 , b1 ]; k∈N aplicando el mismo argumento para las demás componentes, existe x0 ∈ Rn tal que x0 = (y1 , ..., yn ), donde yj ∈ En consecuencia, x0 ∈ (k) \ k∈N \ k∈N (k) [aj , bj ], j ∈ {1, ..., n}. Jk . Este resultado se puede generalizar a espacios métricos. Para ver la generalización, requerimos la siguiente definición. 47 2. Elementos básicos de topologı́a Definición 23 Sea X un espacio métrico. Definimos el diámetro de un conjunto A en el espacio métrico como diam (A) = sup{d (x, y) | x, y ∈ A}. Teorema 2.3.8 (del encaje de Cantor). Sean X = (X, d) un espacio métrico completo y {Ai }i ∈ N una sucesión de conjuntos tales que 1. An + 1 ⊆ An , n ∈ N. 2. Ai es cerrado para toda i ∈ N. 3. lı́m n −→ ∞ diam (An ) = 0. entonces, existe x0 ∈ X tal que \ i∈N Ai = {x0 }. Demostración. Sean xn ∈ An , y ε > 0. Como lı́m n −→ ∞ diam (An ) = 0, entonces existe N ∈ N tal que diam (An ) < ε, si n ≥ N . Como la sucesión de conjuntos es decreciente, se tiene que diam (An ) ≤ diam (AN ) si n > N . Ahora d (xn , xm ) ≤ diamAN < ε. Por tanto, la sucesión {xn } es de Cauchy y como el espacio es completo, se sigue que {xn } converge, digamos a un punto x0 . Por otra parte, como Ai es cerrado para toda i, se sigue que Ai = Ai . Nótese que {xn | n ≥ k} ⊂ Ak Se afirma que \ ni ∈ N Si existe a0 ∈ X tal que a0 ∈ Ai = {x0 }. \ Ai , entonces ni ∈ N 0 ≤ d (x0 , a0 ) ≤ diam (An ) < ε, para n suficientemente grande. Por tanto, x0 = a0 . El siguiente resultado generaliza el teorema de Bolzano-Weierstrass de R. Teorema 2.3.9 (Bolzano-Weierstrass). Todo subconjunto A ⊆ Rn acotado infinito, tiene un punto de acumulación. 48 2.3. Sucesiones Demostración. Sea A un subconjunto acotado con una cantidad infinita de elementos. Entonces existe una n-celda cerrada, digamos J1 , tal que A ⊂ J1 . Bisecando cada una de sus aristas, dividimos a J1 en 2n celdas cerradas. Como A tiene una infinidad de puntos, entonces existe una n-celda cerrada J2 , tal que J2 ⊂ J1 y que contiene una infinidad de elementos de A. Nuevamente, bisecando cada una de las aristas de J2 , encontraremos una celda cerrada J3 ⊂ J2 tal que contenga una infinidad de puntos de A. Repitiendo el proceso, obtenemos una sucesión de n-celdas cerradas que satisface las hipótesis\del Teorema 2.3.7. En consecuencia, existe un punto x0 ∈ Rn tal que x0 ∈ Jk . k∈N Por otro lado, si J1 = [a1 , b1 ] × · · · × [an , bn ], definimos la medida de J1 como 0 < l (J1 ) = sup {bi − ai | i ∈ {1, ..., n}}. Luego 0 < l (Jk ) = l (J1 ) 2k − 1 k ∈ N. (2) Sea U una vecindad de x0 y supongamos que Br (x0 ) ⊂ U , donde Br(2) (x0 ) = {x ∈ Rn | ||x − x0 ||2 < r}. Sea k ∈ N tal que Jk ⊂ U ; esto lo podemos hacer ya que √ |xi | ≤ ||x||2 ≤ n sup {|xi | | i ∈ {1, ..., n}}, ası́, si w ∈ Jk , entonces ||x0 − w||2 ≤ √ n l (Jk ) = √ n l (J1 ) . 2k − 1 Luego, por propiedad arquimediana, existe k ∈ N suficientemente grande, tal que √ n l (J1 ) < r. 2k − 1 Por tanto, para cada k ∈ N, se tiene que Jk ⊂ U . Como Jk tiene una cantidad infinita de elementos de A, se concluye que U contiene al menos un elemento de A distinto de x0 , es decir, x0 ∈ A0 , con lo que queda demostrado el teorema. Teorema 2.3.10 Rn es un espacio métrico completo. Demostración. Sea {xn } una sucesión de Cauchy y sea R su recorrido. Si R es finito, entonces todos los términos de la sucesión, salvo una cantidad finita, son iguales y, por tanto, {xn } converge. Por otra parte, si R es infinito, como una sucesión de Cauchy es acotada (¿Por qué?), se sigue que R es infinito y acotado y, por el teorema 2.3.9, R tiene un punto de acumulación, digamos 49 2. Elementos básicos de topologı́a x0 . Esto último quiere decir que para toda ε > 0 B 2ε (x0 ) contiene un punto xm ∈ R. Finalmente, como {xn } es de Cauchy, se obtiene que d (xn , x0 ) ≤ d (xn , xm ) + d (xm , x0 ) < ε si n, m ≥ N, para alguna N ∈ N. Por tanto, xn −→ x0 . El Teorema 2.3.6 concluye la prueba. 2.4. Compacidad La compacidad es otra de las condiciones más importantes para resultados fundamentales en muchas áreas como la topologı́a, el análisis y el cálculo. En esta sección estudiaremos los conceptos básicos relacionados con la compacidad. Se analizarán condiciones equivalentes a la compacidad. Estudiaremos los teoremas fundamentales sobre compacidad en Rn y sus generalizaciones a espacios métricos. Para empezar, presentamos la definición de cubierta. Definición 24 Sean X = (X, d) un espacio métrico, A ⊆ X y C = {Uα }α ∈ Λ una colección de subconjuntos de X, donde Λ es un conjunto de ı́ndices. Se dice que C es una cubierta de A en X si [ A ⊂ Uα . α∈Λ Diremos que la cubierta es abierta (o cerrada), si Uα es abierto (o cerrado) para toda α ∈ Λ. Si C 0 ⊆ C y C 0 también es una cubierta, diremos que C 0 es una subcubierta de C para A. Diremos que una cubierta es finita (o numerable), si como conjunto es finito (o numerable). A continuación, presentamos la definición de conjuntos compactos en espacios métricos. Definición 25 Sean X = (X, d) y A ⊆ X. Se dice que A es compacto si toda cubierta abierta de A contiene una subcubierta finita. Ejemplos. a) Sea X un espacio métrico y consid́erese un punto x en el espacio. Es claro que el conjunto {x} es compacto. b) Sea [a, b] un intervalo cerrado en R. Se afirma que [a, b] es compacto. Para ver esto, sea C = {Cα }α ∈ Λ una cubierta de [a, b] y defı́nase el conjunto B = {x ∈ [a, b] | [a, x] se puede cubrir con una cantidad finita de elementos de C}. Nótese que B 6= ∅, ya que al menos a ∈ B. Además, para todo x ∈ B, se tiene que b > x. Por la propiedad del supremo, existe s ∈ R tal que 50 2.4. Compacidad s = sup B. Como a ∈ B y b > x para toda x ∈ B, se sigue que s ∈ [a, b]. En consecuencia, existe α0 ∈ Λ tal que s ∈ Cα0 . Luego, existe ε > 0 tal que (s − ε, s + ε) ⊂ Cα0 . También, existe x ∈ B tal que x ∈ (s − ε, s), es decir, [a, una subcubierta finita, digamos x] tiene {C1 , ..., Cn , Cα0 } Por tanto, a, s + 2ε tiene una subcubierta finita, a saber, {C1 , ..., Cn , }. Ası́, se concluye que s ∈ B. Se afirma que s = b. Si no, como a, s + 2ε tiene una subcubierta finita, entonces existe un elemento r ∈ B tal que r > s, lo cual es una contradicción. De esta forma, hemos demostrado que [a, b] es compacto. c) Si A ⊂ Rn es compacto y x ∈ Rm , entonces R = A × {x} es un subconjunto compacto en Rn × Rm . Para verificar esta afirmación, considérese una cubierta abierta C de R y defina la colección B = {B ⊂ Rn | B = {y ∈ A | (y, x) ∈ C}, para alguna C ∈ C}. Es claro que B es una cubierta abierta de A. Como A es compacto, existe una subcubierta de B para A, digamos B 0 = {B1 , ..., Bl }. Obsérvese cada Bi se corresponde con un elemento Ci de C, i ∈ {1, ..., n}, generando ası́ una subcubierta finita para R. Por tanto, R es compacto. Se puede demostrar, de manera inductiva que si n − 1 veces }| { z [−M, M ] × · · · × [−M, M ] ⊂ Rn − 1 es un conjunto compacto, entonces n veces z }| { [−M, M ] × · · · × [−M, M ] ⊂ Rn es compacto. d) Sea X = (X, d) el espacio métrico discreto y considérese un subconjunto A en este espacio. Si A es finito, como los abiertos en este espacio son subconjuntos de X, se sigue que A es compacto. Ahora, si A es compacto, entonces toda cubierta abierta de A tiene una subcubierta finita. Como los abiertos en X son subconjuntos de X, se sigue que A es finito. Ası́, los únicos conjuntos compactos en el espacio métrico discreto son aquellos subconjuntos finitos de X. Obsérvese que en la definición 25, podemos tomar A = X, en cuyo caso, estarı́amos hablando de espacios métricos compactos. Por otro lado, los ejemplos anteriores muestran que trabajar con cubiertas, en ocasiones, es complicado. Veremos que existen relaciones importantes entre la compacidad y algunas propiedades de numerabilidad. Un resultado importante, es el teorema de Lindelöf, el cual usaremos para demostrar el teorema de Heine-Borel. Para esto, necesitamos un resultado previo. 51 2. Elementos básicos de topologı́a Proposición 2.4.1 Sea B = {Br (x) ⊂ Rn | r ∈ Q, x = (x1 , ..., xn ), xi ∈ Q para toda i ∈ {1, ..., n}}. Sean y ∈ Rn y A ⊂ Rn un conjunto abierto tal que y ∈ S. Entonces, existe una bola Br (x) ∈ B tal que y ∈ Br (x) ⊂ A. Demostración. Sea y = (y1 , ..., yn ). Una primera observación es que la colección B es numerable. Si y ∈ Rn y A es un abierto tal que x ∈ A, entonces existe ε > 0 tal que Bε (y) ⊂ A. Luego, por la propiedad arquimediana, existe un valor wk ∈ Q tal que ε |yk − wk | < para cada k ∈ {1, ..., n}, 4n tomando w = (w1 , ..., wn ), se sigue que ||y − w||2 ≤ ||y − w||1 < ε . 4 Nuevamente, aplicando la propiedad arquimediana, existe r ∈ Q tal que ε ε < r < . 4 2 En consecuencia, existe r ∈ Q tal que y ∈ Br (w) ⊂ Bε (x) ⊂ A, como se querı́a demostrar. Teorema 2.4.2 (de Lindelöf). Sean A ⊆ Rn y C una cubierta de A. Entonces, existe una subcubierta de C numerable para A. Demostración. Sea B la colección de todas las bolas definida en la Proposición 2.4.1. Sea x ∈ A, entonces existe C ∈ C tal que x ∈ C. Por la Proposición 2.4.1, existe r ∈ Q y y ∈ Rn con coordenadas racionales, tal que x ∈ Br (y) ⊆ C. Como B es numerable, podemos pensar que B = {Ai }i ∈ N . Luego, para cada C ∈ C existe una infinidad numerable de elementos de B que cubren a C. Luego, existe m = m(x) ∈ N, x ∈ A, tal que x ∈ Am ⊂ A. Por tanto, {Am (x) }x ∈ A es una colección numerable de subconjuntos de Rn tal que [ A ⊂ Am (x) . Tomando la correspondencia x∈A Am (x) −→ C ∈ C tal que Am (x) ⊂ C, se sigue el resultado. Los siguientes resultados relacionan los conjuntos compactos con los cerrados en espacios métricos. 52 2.4. Compacidad Lema 2.4.3 Sean X = (X, d) un espacio métrico y A ⊂ X compacto. Entonces A es cerrado. Demostración. Sea x ∈ Ac y considérese la colección 1 An = y ∈ X | d (x, y) > . n Como d (x, y) > 0, para toda y ∈ X − {x}, entonces y ∈ An , para alguna n ∈ N. Se sigue que [ A ⊂ An , n∈N como A es compacto, entonces existe una subcubierta finita, a saber A ⊂ l [ An k . k=1 Tómese N = máx {nk | k ∈ {1, ..., l}}. Si ε = 1 N, por construcción, Bε (x) ⊂ Ac . En conclusión, Ac es abierto. Lema 2.4.4 Si X es un espacio métrico compacto y A es un conjunto cerrado en X , entonces A es compacto. Demostración. Sea {Cα }α ∈ Λ una cubierta abierta de A. Como A es cerrado, entonces {{Cα }α ∈ Λ , Ac } es una cubierta abierta de X. Como X es compacto , entonces existe una subcubierta finita, digamos {C1 , ..., Cn , Ac }. Luego, {C1 , ..., Cn } es una cubierta para A, concluyendo ası́ la prueba. El siguiente teorema es uno de los resultados centrales acerca de la compacidad de subconjuntos de Rn . Teorema 2.4.5 (Heine-Borel). Sea A ⊂ Rn . A es compacto si y sólo si es cerrado y acotado. Demostración. Supongamos que A es compacto. Por el lema 2.4.3, A es cerrado. Por otra parte, por el Teorema 2.4.2, existe una cubierta numerable de bolas para A. Como A es compacto, existe una subcubierta finita de bolas, n X digamos, {Bεi (xi )}i ∈ {1,...,n} . Considerando M = εi se sigue que A es i=1 acotado. Ahora, supongamos que A es cerrado y acotado. Consideremos una cubierta C de A. Por el Teorema 2.4.5, existe una subcubierta numerable R = {Ak }k ∈ N 53 2. Elementos básicos de topologı́a para A. Sea m ≥ 1 y tómese Sm m [ k=1 A ⊂ Ak . Obsérvese que Sm ⊆ Sm + 1 y que [ Sm . m∈N c Como Sm es abierto, entonces Sm es cerrado. Constrúyase la sucesión de conjuntos dada por Q1 = A, c Qm = A ∩ Sm , m > 1. Hacemos las siguientes observaciones 1. Qm = {puntos en A fuera de Sm }. 2. Qm es cerrado para toda m ∈ N. 3. Qm + 1 ⊆ Qm . 4. Qm ⊂ A, para toda m ∈ N y, por tanto, Qm es acotado. 5. diam (Qm ) −→ 0 conforme m −→ ∞. Aplicando el Teorema 2.3.8, se sigue que existe x ∈ A, tal que x ∈ Qm para toda m ∈ N, esto es, x 6∈ Sm para toda m ∈ N, lo cual es una contradicción al hecho de que {Sm } es una cubierta de A. Por tanto, existe m ∈ N, tal que Qm = ∅, de donde se conlcuye que A es compacto. Una segunda prueba de que un conjunto cerrado y acotado en Rn es compacto, es la siguiente: Como A es acotado, existe una n-celda cerrada J n , tal que A ⊂ J n . Por el ejemplo c) posterior a la definición 25, J n es compacto. Como A es cerrado, por el Lema 2.4.4, se sigue que A es compacto. Este resultado falla en general. Si consideramos un espacio discreto X y tomamos un subconjunto M infinito, éste no es compacto como se vió en el ejemplo d) posterior a la definición 25. Sin embargo, M es cerrado y acotado, ya que M ⊂ B2 (x0 ) ∀ x0 ∈ M Ejemplos. 1. Consideremos C = {x ∈ Rn | ||x||2 ≤ 1}. Ya vimos que C es cerrado y claramente es acotado. Por tanto C es compacto 2. Ya vimos que el conjunto dado por R = {(x, y) ∈ R2 | x ∈ (a, b], y ∈ [c, d]}, no es un conjunto cerrado. Ası́, R no es compacto. 54 2.4. Compacidad 3. Tómese el conjunto R = {(x, y) ∈ R2 | y ∈ [c, d]}. Este conjunto, aunque es cerrado, no es compacto ya que no es acotado. Para ver esto, observe que la recta y = c está contenida en R. Se puede dar otra descripción de los conjuntos compactos, vı́a sucesiones. Definición 26 Sea X un espacio métrico. Se dice que un subconjunto A es secuencialmente compacto si toda sucesión {xn } en A tiene una subsucesión que converge a un punto x0 en A. No es difı́cil ver que un conjunto A en un espacio métrico es cerrado si y sólamente si, toda sucesión contenida en A convergente, converge dentro de A. La verificación de este hecho se deja como ejercicio al lector. Ası́, se afirma que si A es secuencialmente compacto, entonces A es cerrado. En efecto, sea {xn } ⊂ A tal que xn −→ x0 ∈ X. Como A es secuencialmente compacto, se sigue que existe una subsucesión {xnk } tal que xnk −→ x00 , pero por la Proposición 2.3.5, se sigue que x0 = x00 , de donde se concluye que A es cerrado. También, si A es secuencialmente compacto, entonces es acotado, ya que, de lo contrario, entonces existe x0 ∈ A y una sucesión {xn } ⊂ A tales que d (x − n, x0 ) ≥ n, de donde se concluirı́a que no existe una subsucesión de {xn } convergente, lo cual es una contradicción. Ahora, probaremos otro teorema central para conjuntos compactos en espacios métricos: el teorema de Bolzano-Weierstrass. Ya hemos probado una versión de este resultado en la sección anterior, pero fue para Rn . Presentamos su generalización. Necesitamos algunos resultados previos. Lema 2.4.6 Sean X un espacio métrico, A un conjunto secuencialmente compacto en X y {Aα }α ∈ Λ una cubierta abierta de A. Entonces, existe r > 0 tal que para cada x ∈ A, Br (x) ⊂ Aα para alguna α ∈ Λ. Al ı́nfimo de los números r se le conoce como número de Lebesgue para la cubierta. Demostración. Supongamos que no existe dicho número. Entonces, para toda n ∈ N existe un punto xn ∈ A tal que B n1 (xn ) no está contenida en Aα , para cualquier α ∈ Λ. Como A es secuencialmente compacto, existe una subsucesión {xnk } ⊂ {xn } de tal forma que xnk −→ x0 ∈ A. Dado que {Aα } es una cubierta de A, se tiene que x0 ∈ Aα0 para alguna α0 ∈ Λ. Luego, existe ε > 0 tal que Bε (x) ⊂ Aα0 . Ası́, para n suficientemente grande, obtenemos que ε 1 ε d (xn , x0 ) < y < , 2 n 2 de donde se concluye que B n1 (xn ) ⊂ Aα0 , lo cual es una contradicción que surge de suponer que no existe el número de Lebesgue. 55 2. Elementos básicos de topologı́a Definición 27 Sea X un espacio métrico. Se dice que un conjunto A es totalmente acotado si para cada ε > 0, existe un subconjunto {x1 , ..., xn } ⊂ X tal que n [ A ⊂ Bε (xi ). i=1 Lema 2.4.7 Si A es secuencialmente compacto, entonces A es totalmente acotado. Demostración. Si A no es totalmente acotado, entonces para alguna ε > 0, A no puede ser cubierto por una cantidad finita de bolas. Sea x1 ∈ A. Como A no es totalmente acotado, eso implica que existe x2 ∈ (Bε (x1 ))c , luego considérese un punto x3 ∈ (Bε (x1 ) ∪ Bε (x2 ))c y ası́ sucesivamente, generando una sucesión {xn } tal que !c n[ −1 xn ∈ Bε (xi ) . i=1 De esta forma, hemos construido una sucesión tal que d (xn , xm ) ≥ ε para cualesquiera n, m ∈ N. Ası́, {xn } no tiene subsucesiones convergentes, lo cual es una contradicción al hecho de que A es secuencialmente compacto. Por tanto, A es totalmente acotado. Ahora, estamos en condiciones de probar el teorema de Bolzano-Weierstrass. Teorema 2.4.8 (Bolzano-weierstrass). Sea X un espacio métrico. Un subconjunto A es compacto si y sólo si es secuencialmente compacto. Demostración. Supongamos que A es compacto y que existe una sucesión {xn } ⊂ A de tal manera que no tiene subsucesiones convergentes. Esto implica que {xn } tiene recorrido R infinito. Además, existe una vecindad Un para cada xn , n ∈ N, de tal forma que xm 6∈ Un si n 6= m, esto se sigue ya que de lo contrario, podemos elegir vecindades de la forma B k1 (xn ), k ∈ N y seleccionar una subsucesión que converja a xn . Ahora, R es cerrado, esto debido a que no tiene puntos de acumulación (no hay subsucesiones convergentes) y por tanto R = R. Como R es cerrado y A es compacto, por el Lema 2.4.4, se obtiene que R es compacto, lo cual es una contradicción, ya que Un no tiene una subcubierta finita. En consecuencia, {xn } tiene una subsucesión convergente y, dado que A es cerrado, el lı́mite yace en A. Por otra parte, supongamos que A es secuencialmente compacto. Sea r como en el Lema 2.4.6; luego, por el Lema 2.4.7, obtenemos que A ⊂ n [ i=1 Bε (xi ), donde xi ∈ A. Además, por el Lema 2.4.6, Bε (xj ) ⊂ Aαj , j ∈ {1, ...n}, donde {Aαj } es una colección de abiertos. Por tanto, hay una subcubierta finita para A, como se querı́a demostrar. 56 2.5. Compacidad Para cerrar esta sección, presentamos un resultado que relaciona los conceptos de completez y compacidad. Teorema 2.4.9 Un espacio métrico es compacto si y sólo si es completo y totalmente acotado. Demostración. Supongamos que X es compacto. Por el Teorema 2.4.8, X es secuencialmente compacto y por el Lema 2.4.7, es totalmente acotado. Ahora, para ver que es completo, consideremos una sucesión de Cauchy {xn }. Como X es secuencialmente compacto, se satisface, por un lado, que d (xn , xm ) < ε 2 si n, m > N para alguna N ∈ N y por otro lado d (xnk , x0 ) < ε 2 si nk > N para alguna N ∈ N, donde {xnk } es una subsucesión de {xn } y x0 ∈ X. Ası́, obtenemos lo siguiente: d (xn , x0 ) < d (xnk , xn ) + d (xnk , x0 ) < ε, si nk , n > N . Por otra parte, supongamos que X es completo y totalmente acotado. Demostraremos que X es secuencialmente compacto. Sean {xn } una sucesión contenida en X y R su recorrido. Si R es finito, entonces hay una subsucesión convergente y si hay una cantidad finita de repeticiones las eliminamos. Ahora, supongamos que R es infinito. Como X es secuencialmente compacto, dado N ∈ N existen elementos yL1 , ..., yLM ∈ X tales que X ⊆ M [ B N1 (yLi ). i=1 Para N = 1, sea X ⊆ M [ B1 (yLi ). i=1 De esta forma, existe una subsucesión de {xn } que cae en una de estas bolas. Tomando N = 2, podemos construir otra subsucesión que yace en una de las bolas de la forma B 21 (yLi ). Finalmente, eligiendo la subsucesión cuyo primer elemento es el primero de la primera subsucesión, el segundo es el segundo de la segunda subsucesión, etcétera, generamos una sucesión de Cauchy, que por ser el espacio completo, es convergente. Ası́, X es secuencialmente compacto y, por el Teorema 2.4.8, se sigue el resltado. 57 2. Elementos básicos de topologı́a 2.5. Conexidad Cerramos este capı́tulo con otro concepto importante que es el de conexidad. Intuitivamente, es claro que significa que un conjunto sea conexo. Uno pensarı́a que un conjunto es conexo si es de una sola pieza. Sin embargo, existen conjuntos en donde nuestra intuición puede fallar. Veremos que existen dos nociones de conexidad y estudiaremos la relación entre ellas. Iniciamos esta sección con la definición de desconexión. Definición 28 Sea X = (X, d) un espacio métrico. Se dice que un subconjunto A ⊆ X es inconexo, si existen B, C subconjuntos de A, abiertos, tales que se cumplen las siguientes condiciones 1. B 6= ∅ 6= C. 2. B ∩ C = ∅. 3. A ∩ B 6= ∅ 6= A ∩ C 4. A = B ∪ C. A la pareja (B, C) se le conoce como desconexión de A. Se dice que A es conexo si no es inconexo. Obsérvese que en esta definición, se puede tomar A = X y tenemos espacios métricos inconexos. Si X es un espacio inconexo, como X = B ∪ C, donde B, C son abiertos, se tiene que B, C también son cerrados, ya que B c = C y viceversa. Ası́, tenemos el siguiente resultado. Proposición 2.5.1 Las siguientes afirmaciones son equivalentes 1. X es inconexo. 2. Existen dos subconjuntos A, B de X, cerrados, no vacı́os, tales que X = A ∪ B. 3. Existe un subconjunto propio de X, no vacı́o, que es abierto y cerrado. También, si X es inconexo y (A, B) es la desconexión para X, cualquier subconjunto Y de X tendrá por desconexión a (A, B) si A ∩ Y 6= ∅ 6= B ∩ Y . Proposición 2.5.2 R es conexo Demostración. Supongamos que R no es conexo. Esto implica que existen abiertos A, B de R no vacı́os y ajenos, tales que R = A ∪ B. Sean a ∈ A, b ∈ B y supongamos, sin pérdida de generalidad que a < b. Definimos α = sup {x ∈ A | x < b}. 58 2.5. Conexidad Luego, existen dos opciones para α. Si α ∈ A, como A es abierto, existe ε > 0 tal que (a − ε, a + ε) ⊂ A. De esta forma, podemos elegir ε suficientemente pequeña de tal manera que α + ε < b, lo cual contradice que α sea el supremo. De esta forma, α 6∈ A. Ası́ α ∈ B. Sin embargo, como B es abierto, existe ε > 0 tal que (a − ε, a + ε) ⊂ B, luego α − ε > a, para a ∈ A, lo cual genera una contradicción, de donde se concluye que α 6∈ B, lo cual contradice la completez de R. Por tanto, R es conexo. Obsérvese que la unión y la intersección de conexos no necesariamente es un conjunto conexo. El siguiente resultado, muestra bajo que condiciones, la unión de conexos es un conexo. Proposición 2.5.3 Sean X = (X, d) un espacio métrico [ y Xλ ⊂ X, λ ∈ Λ, Xλ . Si existe λ0 ∈ Λ una colección de conjuntos conexos tales que X = λ∈Λ de tal forma que Xλ0 ∩ Xλ 6= ∅, entonces X es conexo. Demostración. Supongamos que X es inconexo. Se afirma que Xλ0 es inconexo. Para verificar esto, consideremos una desconexión (A, B) para X. Sin pérdida de generalidad, supongamos que A ∩ Xλ0 6= ∅. Como Xλ es conexo para toda λ 6= λ0 , entonces Xλ ⊂ A o Xλ ⊂ B. Tómese ΛB = {λ ∈ Λ | Xλ ⊂ B}. Obsérvese que ΛB 6= ∅, ya que[ de lo contrario, Xλ ⊂ A para toda λ ∈ Λ, lo cual implicarı́a que B = B ∩ Xλ = ∅, lo cual no es posible. Sea λ ∈ ΛB , entonces se tiene que λ∈Λ ∅ 6= Xλ ∩ Xλ0 ⊂ B ∩ Xλ0 , de donde se sigue que (A, B) es una desconexión para Xλ0 . Como consecuencia de esta proposición, tenemos que la unión de conexos es un conjunto conexo si tienen al menos un punto en común. Teorema 2.5.4 Sean X = (X, d) un espacio métrico y C ⊂ X. Si C es conexo, entonces C es conexo. Demostración. Supongamos que (C) es inconexo y sea (A, B) una desconexión para C. Como A y B son abiertos, se sigue que (A, B) es también una desconexión para C. Ejemplo. Sea [a, b] ⊂ R. Demostraremos que es un conjunto conexo. Supongamos que no, esto quiere decir que existen abiertos A, B en R, ajenos, no vacı́os, tales que A ∩ [a, b] 6= ∅ B ∩ [a, b] y A ∪ B ⊃ [a, b]. Supongamos que b ∈ B y definimos α = sup (A ∩ [a, b]). Obsérvese que A ∩ [a, b] es cerrado, ya que B ∪ ([a, b])c es abierto, en consecuencia, α ∈ A ∩ [a, b]. Ahora, α 6= b ya 2. Elementos básicos de topologı́a 59 que α 6∈ B y b ∈ B. Se sigue que, para toda vecindad W de α, W 6⊂ A y por tanto W ∩ (B ∩ [a, b]) 6= ∅. Nótese que α es punto de acumulación de B ∩ [a, b] y como este conjunto es cerrado, se sigue que α ∈ B ∩ [a, b], lo cual es una contradicción al hecho de que (A, B) es una desconexión. Claramente, en un espacio métrico X , el conjunto {x} es conexo. Consideremos el conjunto dado por [ Cx = {C ⊂ X | x ∈ C, C conexo}. Por la observación posterior a la Proposición 2.5.3, se sigue que Cx es conexo. De hecho, es el conexo más grande que contiene a x. A este conjunto se le conoce como componente conexa correspondiente a x. Nótese que Cx es cerrado y que si y ∈ Cx , entonces Cx = Cy . La otra noción, quizás más intuitiva, de conexidad es la de conexidad por trayectorias. Para estudiar esta propiedad, necesitamos definir el concepto de trayectoria entre dos puntos. Para esto, introducimos el concepto de continuidad, el cual se estudiará con más detalle en el siguiente capı́tulo. Definición 29 Sea σ : [a, b] −→ X una función que va del intervalo cerrado [a, b] a un espacio métrico X. Decimos que σ es continua si para toda sucesión {xn } ⊂ [a, b] tal que xn −→ x0 , se cumple que σ (xn ) −→ σ (x0 ) Definición 30 Sea X un espacio métrico. Decimos que x, y ∈ X están conectados por una trayectoria, si existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y. Si x y y están unidos por σ, lo denotaremos por σ : x ' y. Se dice que la trayectoria σ yace en un conjunto A ⊂ X si para todo t ∈ [a, b], σ (t) ∈ A. Diremos que dos puntos x, y ∈ X están relacionados (x ∼ y) si existe una trayectoria σ que los une. Esta relación es de equivalencia. Para probar esta afirmación, nótese que x ∼ x, ya que podemos tomar la función σ (t) = x para toda t ∈ [a, b]. Por otra parte, si x ∼ y, entonces, existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y. Si definimos σ 0 (t) = σ (a + b − t), donde t ∈ [a, b], esta función es continua y además σ 0 (a) = y y σ 0 (b) = x, de donde se sigue que y ∼ x. Finalmente, si x ∼ y y y ∼ z, entonces existen una funciones τ, σ : [a, b] −→ X continuas, tales que σ (a) = x, σ (b) = y = τ (a) y τ (b) = z. Definiendo b si x ∈ a, a + σ(2t − a) 2 ρ (t) = b τ (2t − b) si x ∈ a + 2 ,b , obtenemos que ρ une x con z. Ası́, (∼) es una relación de equivalencia. A las clases de equivalencia se les llama componentes por trayectorias del espacio X. Definición 31 Se dice que un subconjunto A ⊂ X es conectable por trayectorias si cualesquiera dos puntos de A pueden ser unidos mediante una trayectoria que se encuentra totalmente contenida en A. 60 2.5. Conexidad El siguiente resultado, relaciona las dos nociones de conexidad. Teorema 2.5.5 Un conjunto conectable por trayectorias es conexo. Demostración. Sea A un conjunto conectable por trayectorias. Supongamos que A es inconexo y sea (U, V ) su desconexión. Tómese x ∈ U y y ∈ V . Como A es conectable por trayectorias, entonces, existe una función σ : [a, b] −→ X continua, tal que σ (a) = x y σ (b) = y; sea C = σ −1 (U ) y D = σ −1 (V ). Obsérvese que C, D ⊂ [a, b]. Consideremos una sucesión {xn } ⊂ C tal que xn −→ x0 , como [a, b] es cerrado, x0 ∈ [a, b]. Además, dado que σ es continua, se tiene que σ (xn ) −→ σ (x0 ). Se afirma que σ (x0 ) ∈ U. De lo contrario, σ (x0 ) ∈ V , pero V es abierto y se tendrı́a que σ (xn ) ∈ V lo cual es una contradicción al hecho de que (U, V ) es desconexión. De esta forma, hemos probado que C es cerrado. Un argumento similar prueba que D es cerrado. Nótese que C 6= ∅ 6= D, ya que σ −1 (x) ∈ C y σ −1 (y) ∈ D. También, tenemos que C ∩ D = σ −1 (U ) ∩ σ −1 (V ) = σ −1 (U ∩ V ) = ∅ y C ∪ D = σ −1 (U ) ∪ σ −1 (V ) = σ −1 (U ∪ V ) = σ −1 (A) = [a, b], es decir, [a, b] es inconexo, lo cual es una contradicción que surge de suponer que A es inconexo. Por tanto, A es conexo. Capı́tulo 3 Limites y continuidad. En la mayorı́a de los problemas fı́sicos, sucede que una variable depende de otras. Por ejemplo, el voltaje en una resistencia eléctrica, de acuerdo a la Ley de Ohm, depende de la resistencia y corriente eléctrica, es decir, V = RI. Es por esta razón que se hace necesario el estudio de las funciones reales de variable vectorial. Por otro lado, supóngase que se desea estudiar el viento en una región del planeta. Para esto, medimos la magnitud y dirección de la velocidad del viento, donde ésta última depende de la posición de cada punto. Ası́, asociamos a cada punto P de una región, una y sólo una velocidad. Una regla como ésta es un ejemplo de las llamadas funciones vectoriales de variable vectorial. También se les conoce con el nombre de campos vectoriales. En este capı́tulo, desarrollaremos la teorı́a de lı́mites y continuidad para funciones que toman valores en Rn y cuya variable x es un punto de Rm . Denotamos por F(C, Rm ), donde C ⊂ Rn , al conjunto de funciones f, cuyo dominio es el conjunto C (se dice que hay n variables) y f (x) ∈ Rm , x ∈ C. Se dice que la función f es real o vectorial según sea m = 1 ó m ≥ 2. Si m ≥ 2 y si f (x) = (y1 , ...., ym ), se llaman coordenadas o componentes de f a las funciones reales fi : C −→ R, donde fi (x) = yi , i ∈ {1, 2, ...., m}. Cuando una función de n variables está expresada en forma analı́tica, esto es, en una expresión de la forma z = f (x1 , ...., xn ), donde a cada vector (x1 , ...., xn ) se le asigna un valor z, se suele entender que el campo de definición o dominio de dicha función es el conjunto más amplio de puntos (x1 , ..., xn ) ∈ R para el que existe un valor para z. 61 62 3.0. Limites y continuidad. Ejemplos 1. Sea f (x, y) = √ ln(x,y) 2 1−(x +y 2 ) ; Observese que la función “ ln ” está bien definida para todos los valores positivos; en consecuencia, se debe pedir que x y y tengan el mismo signo. Además x2 +y 2 debe ser menor estrictamente que 1. Por lo tanto, el dominio para esta función tiene la forma D(f ) = {(x, y) | xy > 0, x2 + y 2 < 1} (véase la Figura 3.1) = D (f ) Figura 3.1: Dominio de la función f (x, y) = p ln(x, y) 1 − (x2 + y 2 ) 1 2. Considérese la función g(x, y) = e x2 +y2 Obsérvese que la única condición que se les pide a las coordenadas (x, y) es que x2 + y 2 6= 0; esto sucede para todo (x, y) ∈ R2 − {(0, 0)}. Ası́, D(g) = R2 − {(0, 0)} El conjunto F (C, Rm ) es un espacio vectorial respecto de las operaciones usuales de suma de funciones y de producto de un escalar λ ∈ R por una función; esto es, 3. Limites y continuidad. 63 (f + g)(x) = f (x) + g(x) y (λf )(x) = λf (x). Observe que para el caso particular m = 1, f (C, Rm ) resulta ser un campo respecto de las operaciones usuales de suma y producto de funciones, a saber, (f + g)(x) = f (x) + g(x) y (f g)(x) = f (x)g(x), donde además, se puede establecer una relación de orden parcial dada por f ≤ g ⇔ f (x) ≤ g(x) para toda x ∈ C Si 0 es la función nula, es decir, 0(x) = 0, para toda x ∈ C, entonces se dice que una función f es positiva si P ≤ f y se dice que es negativa si f ≤ P. Diremos que f ∈ F (C, Rm ) es una función acotada si el conjunto f (C) es acotado. Mas precisamente, f ∈ F (C, Rm ) es acotada, sı́ existe M > 0 tal que kf (x)k ≤ M ∀ x ∈ C 3.1. Lı́mites El concepto de lı́mite es uno de los más importantes en el estudio del cálculo y el análisis, quizá sea uno de los mas difı́ciles de comprender. El lector estará familiarizado con el concepto de convergencia de sucesiones y con el concepto de lı́mite para funciones reales de variable real. Definición 32 (condición ε − δ). Sean f : C −→ Rm una función definida en C ⊂ Rn y a ∈ C 0 . Se dice que f tiende a L ∈ Rm conforme x tiende a a (en otras palabras, L es el lı́mite de f en el punto a), si dada ε > 0, existe δ > 0 tal que si x ∈ C − {a} y d(x, a) < δ, entonces d(f (x), L) < ε Al igual que en el caso real, existe una definición de lı́mite por medio de sucesiones. Definición 33 Sean f : C −→ Rm una función definida en C ⊂ Rn y a ∈ C 0 . Si {xn }n∈N ⊂ C − {a} es una sucesión de puntos tal que xn −→ a, se dice que f tiende a L ∈ Rm si f (xn ) −→ L. Proposición 3.1.1 Las definiciones (32) y (33) son equivalentes Demostración. Supongamos que la condición ε − δ se satisface y sea {xn }n∈N ⊂ C − {a} una sucesión tal que xn −→ a; entonces, dada δ > 0, existe N ∈ N tal que kxn − ak < δ si n > N . Como xn ∈ C − {a}, se sigue que kf (xn ) − Lk < ε , para ε > 0 y n > N . Por lo tanto f (xn ) −→ L. Por otra parte, si la condición (ε − δ) no se satisface, existe ε > 0 tal que para toda δ > 0, existe x ∈ C − {a} de tal forma que kx − ak < δ y kf (x) − Lk ≥ ε. 64 3.1. Lı́mites Luego, para cada n ∈ N, si δ = n1 , existe xn ∈ {a} tal que kxn − ak < kf (xn ) − Lk ≥ ε esto es, xn −→ a, pero f (xn ) no converge a L. 1 n y Obsérvese que la definición 32 se puede reescribir de la siguiente forma: “Se dice que f tiende a L ∈ Rn conforme x tiende a a, si dada ε > 0, existe δ > 0 tal que si x ∈ Bδ∗ (a) ∩ C entonces f (x) ∈ Bε (L) (donde x ∈ Bδ∗ (a) = Bδ (a) − {a}.) ” Otra observación importante es la necesidad de que a sea un punto de acumulación de C. Si no fuera ası́, existirı́a δ > 0 tal que x ∈ Bδ∗ (a) ∩ C = ∅, por lo que se cumplı́ria la condición ε − δ con cualquier L ∈ Rm . Ejemplos 1. Sea f (x, y) = 2x2 (y + 1) + y 2 . Se afirma que 2x2 + y 2 2x2 (y + 1) + y 2 =1 2x2 + y 2 (x,y)→0 lı́m (2) (2) En efecto, si (x, y) ∈ Bδ (0), donde Bδ (0) = {x ∈ R2 kxk2 < δ}, se tiene que 2x2 (y + 1) + y 2 −1 2x2 + y 2 = ≤ 2x2 y 2x2 = |y| 2 2 2 2x + y 2x + y 2 1 |y| ≤ (x2 + y 2 ) 2 < δ = ε. x2 y , x2 − y x2 6= y El lı́mite de esta función 1 1 cuando (x, y) −→ 0 no existe, ya que si se considera la sucesión , , n∈ n n 1 1 1 , = −→ 0 N − {1}, obtenemos que g n n n(1 − n) 2. Considérese la función g(x, y) = cuando n −→ ∞. Por otro lado si se toma la sucesión 1 n−1 1 1 √ , − 2 = −→ 1 cuando n −→ ∞. n n n n x−y . Nuevamente, lı́m h(x) no existe, ya x + y x→0 1 1 que si consideramos las sucesiones , 0 y 0, , los valores lı́mite no n n coinciden. 3. Tómese la función h(x, y) = 65 3. Limites y continuidad. El lector habrá notado la complejidad de la noción de lı́mite. En el caso de las funciones reales de variable real, podemos aproximarnos a un valor por 2 trayectorias. En el caso de funciones que involucran 2 o más variables, tenemos una infinidad de formas para aproximarnos a un cierto punto. El siguiente resultado muestra un criterio de convergencia análogo al criterio de Cauchy para sucesiones. Proposición 3.1.2 Sean f : C ⊂ Rn −→ Rm y a ∈ C 0 . Entonces, f tiene lı́mite en a si y solamente si, para toda ε > 0, existe δ > 0 tal que si x, x0 ∈ C − {a} de tal forma que kx − ak < δ y kx0 − ak < δ, entonces kf (x) − f (x0 )k < ε Demostración. Si lı́m f (x) = L, entonces, dada > 0, existe δ1 , δ2 > 0 x→a tales que si kxk − a < δ1 y kx0 − ak < δ2 , donde x, x0 ∈ C − {a}, entonces kf (x) − Lk < ε/2 y kf (x0 ) − Lk < ε/2 tomando δ = min{δ1 , δ2 }, se sigue que kf (x) − f (x0 )k ≤ kf (x) − Lk + kf (x0 ) − Lk < ε para x, x0 ∈ Bδ∗ (a). Por otro lado, si para toda ε > 0, existe δ > 0 tal que si x, x0 ∈ C − {a} de tal forma que kx − ak < δ y kx0 − ak < δ implica que kf (x) − f (x0 )k < ε, debemos mostrar que el lı́mite de f en a existe. Para demostrar esto, sea {xn } ⊂ C −{a} una sucesión tal que xn −→ a. Por hipótesis, se sigue que {f (xn )} es un sucesión de Cauchy y por lo tanto, convergente. Falta demostrar que si {xn 0 } es otra sucesión que converge a a, entonces lı́m f (xn ) = lı́m f (xn 0 ) n→∞ n→∞ . Supongamos que lı́m f (xn ) = L y que lı́m f (xn 0 ) = L0 donde L 6= L0 . n→∞ n→∞ Obsérvese que la sucesión {x1 , x01 , x2 , x02 , ....} converge a a, sin embargo, la sucesión {f (x1 ), f (x01 ), f (x2 ), f (x02 ), ...} no converge, lo cual es una contradicción por lo tanto, f (xn ) −→ L, para toda sucesión {xn } ⊂ C −{a} tal que xn −→ a Hasta el momento, hemos trabajado con la noción de lı́mite de funciones con sucesiones que tienen lı́mite finito. Falta definir el caso para sucesiones que no son acotadas, es decir, falta definir el concepto de lı́mite en el infinito. Además, puede suceder que la imagen de una sucesión {xn } bajo una función f , sea un conjunto que no es acotado. Definición 34 Sean f : C ⊂ Rn → Rm una función y a ∈ C 0 . a) Se dice que f tiene lı́mite infinito en a, si para M > 0, existe δ > 0 tal que para todo x ∈ Bδ∗ (a) ∩ C se tiene que kf (x)k ≥ M. Cuando esto ocurre, lo denotaremos por el sı́mbolo lı́m f (x) = ∞ x→a 66 3.1. Lı́mites b) Si no acotado, diremos que f tiene lı́mite L en el infinito C es un conjunto lı́m f (x) = L , si para cada > 0, existe N > 0 tal que si kxk > N , x→∞ entonces kf (x) − Lk < . c) Si C es un conjunto no acotado, se dice que f tiene lı́mite infinito en el infinito, denotado por lı́m f (x) = ∞ x→∞ Si para cada M > 0, existe N > 0 tal que si kxk > N , entonces se cumple que kf (x)k ≥ M . Ahora, como el lı́mite de una sucesión es único, por la definición (33), se sigue que el lı́m f (x), si existe, es único. También, de la definición (32) se tiene que x→a lı́m f (x) = L si y solo si lı́m f (x) − L = 0. x→a x→a Otra consecuencia inmediata de la definición (32) es que si f tiene lı́mite en el punto a, entonces f es acotada en una vecindad de a. Por otra parte, si lı́m f (x) = L D ⊂ C y a ∈ D0 , x→a es claro que la función g = f |D tiene lı́mite en a, de hecho lı́m g(x) = L. Finalx→a mente si f : C ⊂ Rn → Rm , es una función de la forma f (x) = (f1 (x), ..., fn (x)), donde fi : C ⊂ Rn → R, i ∈ {1, ..., n} y L = (l1 , ..., ln ), entonces no es difı́cil ver que lı́m f (x) = L ⇔ lı́m f (x) = li x→a x→a La verificación de los detalles se deja como ejercicio al lector. Por otra parte, si existe una función ϕ : C ⊂ Rn → R tal que ϕ(x) > 0 para toda x ∈ C y lı́m ϕ(x) = 0 de tal forma que x→a kf (x) − Lk < ϕ(x), para toda x ∈ Bδ∗ (x), para alguna δ > 0 entonces se tiene que lı́m f (x) = L x→a Para ver esto, podemos aplicar la condición (ε − δ) a las función ϕ y dado que ϕ(x) > 0 para toda x ∈ C, |ϕ(x)| = ϕ(x). Luego, para toda > 0, existe δ > 0 tal que si x ∈ Bδ∗ (a), se tiene que kf (x − Lk ≤ ϕ(x) = |ϕ(x)| < , de donde se sigue la observación 67 3. Limites y continuidad. Ejemplos x3 − y 7 . Se afirma que lı́m f (x) = 0. Para ver esto, si x2 + y 4 x→0 x ∈ Bδ∗ (0) con δ > 0 se tiene que a) Defı́nase f (x, y) = |f (x, y)| = x3 y7 − x2 + y 4 x2 + y 4 x2 y4 3 + |y| x2 + y 4 x2 + y 4 ≤ |x| ≤ |x| + |y| . 3 3 Luego definiendo ϕ(x, y) = |x| + |y| , por la observación anterior, se sigue que lı́m f (x) = 0. x→0 a+1 b+1 b) Sea g(x, y) = xx2 +y2y−xy , donde a, b > 0. Demostraremos que un vector (x, y) ∈ R2 , tiene una representación en coordenadas polares de la forma (rcosθ, rsenθ). De esta forma sustituyendo lo valores de x y y, se tiene que |g(x, y)| = xa y b r2 r2 cosθsenθ = xa y b − r2 senθcosθ cosθsenθ < xa y b −→ 0 sen2θ 1− 2 si (x, y) −→ (0, 0). Hemos visto que si lı́m f (x) = L B ⊂ C y a ∈ D0 , entonces lı́m g(x) = L, x →a x→a donde g = f |D . Pues bien, respondiendo a este hecho, se dice que f tiene lı́mite L en a según la dirección de la recta L (o que f tiene lı́mite direccional en a según la recta L) si a ∈ L y lı́m g(x) = L, donde g = f |L . Diremos únicamente que f tiene lı́mite x→a direccional L en a, si f tiene lı́mite en a según la recta L para toda recta L que contenga a a y lı́m f |L (x) = L para toda L. x→0 Ya se demostró que si f tiene lı́mite en a, entonces para cualquier trayectoria que contiene a a, en particular para las rectas L que pasan por a, el lı́mite existe. Sin embargo, tenemos ejemplos donde el lı́mite direccional existe pero el lı́mite de f en a no. 68 3.1. Lı́mites Ejemplos xy + y 3 . Se afirma que el lı́mite direccional de f en (0, 0) x3 − y 2 existe. Para ver esto, sea y = mx, luego mx2 + m3 x3 1 + m2 x f (x, mx) = 2 = m . x − m2 x2 1 − m2 1. Sea f (x, y) = m , |m| = 6 1, esto es, 1 − m2 el lı́mite direccional depende de la pendiente de la recta que se tome. En consecuencia, f no tiene lı́mite direccional en a Tomando x −→ 0, se sigue que f (x, y) −→ 2. Defı́nase g(x, y) = x3 . Si y = mx, entonces x2 − y g(x, mx) = m 3 x2 m3 x3 = −→ 0, − mx x−m x2 x −→ 0 es decir, g tiene lı́mite direccional en 0. Sin embargo, g no tiene lı́mite en 0 ya que, si y = x2 − x3 , se sigue que . g(x, x2 − x3 ) = x3 = 1 −→ 1 si x −→ 0 x3 La siguiente proposición extiende algunas propiedades de lı́mites de funciones reales de variable real para el caso de funciones reales de variable vectorial. Proposición 3.1.3 Sean f,g y h tres funciones definidas en un mismo conjunto C ⊂ Rn y a ∈ c0 . Supóngase que lı́m f (x) = L y lı́m g(x) = M , para algún x→a x→a par de valores L, M ∈ R. Sean K ∈ R y Bδ∗ (a) = Bδ (a) − {a}, donde δ > 0 es el valor correspondiente a la definición de lı́mite. a) K < L (respectivamente, K ≥ L) si y solo si K < f (x) para toda x ∈ C ∩ Bδ∗ (a). (K ≥ f (x)) b) L ≤ M si y solamente si, f (x) < g(x) para cualquier x ∈ C ∩ Bδ∗ (a). c) Si L = M y f (x) ≤ g(x) ≤ g(x) para toda x ∈ lı́m h(x) = L C ∩ Bδ∗ (a), entonces x→a Demostración. a) Sea ε = L − K > 0. Como lı́m f (x) = L, entonces existe δ > 0 tal que x→a para toda x ∈ C ∩ Bδ∗ (a), |f (x) − L| < ε; luego, por la definición de valor absoluto, se sigue que K − L < f (x) − L 69 3. Limites y continuidad. Es decir, K < f (x).Por otro lado, si K < f (x) para toda x ∈ C ∩ Bδ∗ (a), para alguna δ > 0, se sigue que K − L < f (x) − L Tomando el lı́mite en ambos lados cuando x −→ a, obtenemos que K − L < 0, esto es, K < L. b) Supongamos que L < M y sea ε = 21 (M − L). Entonces existe δ > 0 tal que si x ∈ Bδ∗ (a), se tiene que f (x) ∈ Bε (L) y g(x) ∈ Bε (M ) es decir, |f (x) − L| < ε y |g(x) − M | < ε de donde se obtiene que f (x) < 1 (M + L) < g(x) 2 Por tanto, f (x) < g(x) para toda x ∈ Bδ∗ (a). Ahora, si L ≥ M , por la parte anterior, f (x) ≥ g(x), de donde se concluye que f (x) < g(x) implica que L < M c) Sea ε > 0; entonces, existe δ > 0 tal que f (x) , g(x) ∈ Bδ∗ (a) Tómese δ0 > 0 tal que para toda x ∈ Bδ0 (a), f (x) ≤ h(x) ≤ g(x). Si δ = mín {δ , δ0 } es claro que para toda x ∈ Bδ0 (a) L ≤ lı́m h(x) ≤ M = L, x→a de donde se concluye que lı́m h(x) = L. x→a El siguiente resultado establece las propiedades aritméticas para lı́mites de funciones reales de variable vectorial. La prueba de este hecho es muy similar al caso de las funciones de variable real, por lo que su prueba se deja como ejercicio al lector. Proposición 3.1.4 Sean f : C ⊂ Rn −→ R y g : C ⊂ Rn −→ R. funciones y a ∈ C 0. a) Si lı́m f (x) = 0 y para toda x ∈ C ∩ Bδ∗ (a), δ > 0, |g(x)| < M, para x→a alguna M > 0 , entonces lı́m f (x)g(x) = 0 x→a b) Si lı́m f (x) = L y lı́m g(x) = M , x→a x→a i) lı́m [f (x) + g(x)] = L + M x→a L, M ∈ R entonces: 70 3.1. Lı́mites ii) lı́m [f (x) g(x)] = L M x→a f (x) L iii) si M 6= 0, lı́m = x→a g(x) M Otra forma de calcular lı́mites es de manera reiterada. El análisis que se hace en este texto, se puede hacer extensivo a funciones escalares con cualquier número de variables independientes. Si f : C ⊂ R2 −→ R y a = (x0 , y0 ) ∈ C 0 , podemos calcular el lı́mite “reiterado” en a , aproximándonos por separado a x0 y a y0 (véase la figura 3.2). f(X2 , Y2) L Y2 Y0 f(X1 , Y1) Y1 X2 X1 Figura 3.2: Lı́mites reiterados Ejemplos 1. Sea f (x, y) = x + y. Calcularemos los lı́mites reiterados de la función f cuando (x, y) → (1, 1). Calculamos lı́m f (x, y) = lı́m x + y = 1 + x. y→1 y→1 Luego lı́m x→1 lı́m f (x, y) = (1 + x) = 2 y→1 Nótese que en este caso: lı́m x→1 lı́m f (x, y) = lı́m lı́m f (x, y) y→1 En general, esto no sucede. y→1 x→1 71 3. Limites y continuidad. 2. Sea g(x, y) = x λ(y) donde 1 λ(y) = 0 −1 si y > 0 si y = 0 si y < 0 Observe que los lı́mites reiterados no coinciden en (0, 0) , ya que, por un lado, lı́m g(x, y) = lı́m = x y→0+ y y→0+ lı́m g(x, y) = lı́m = −x y→0− y→0− Luego, lı́m ( lı́m g(x, y)) no existe; por otra parte , lı́m g(x, y) = 0 de x→0 y→0 x→0 donde se sigue que lı́m ( lı́m g(x, y)) = 0. Ahora, nótese que y→0 x→0 |g(x, y)| = |x| → 0 cuando x → 0 , por lo que el lı́mite existe. xy tiene lı́mites reiterados iguales en (0, 0), 3. La función f (x, y) = 2 x + y2 sin embargo no tiene lı́mite en (0, 0) (se le recomienda al lector verificar los detalles). 1 , donde x ∈ R+ ∪ {0} y y ∈ R+ . Nótese 4. Sea h(x, y) = x sen y 1 1 que lı́m lı́m sen = 0 pero lı́m lı́m sen no existe. y→0 x→0 x→0 y→0 y y 2 4 Para ver esto, tómese las sucesiones yn = y yn0 = . (2n − 1)π (8n + 1)π Sin embargo, como x sen siempre que p 1 1 = |x||sen | ≤ |x| ≤ x2 + y 2 < ε y y p x2 + y 2 < δ = ε, se sigue que lı́m (x,y)→(0,0) h(x, y) = 0 El siguiente resultado relaciona los conceptos de lı́mite y lı́mite reiterado. Teorema 3.1.5 Sean f : C ⊂ R2 → Rm y a = (x0 , y0 ) ∈ C o . Si lı́m f (x) = L y si para cada y ∈ Bδ∗ (y0 ), δ > 0, lı́m f (x, y) existe, x→x0 x→a entonces el lı́mite reiterado lı́m y→y0 existe y es igual a L. lı́m f (x, y) x→x0 72 3.1. Lı́mites Demostración. Dado ε > 0 , como L es el lı́mite de f en a , existe δ > 0 tal que si kx − ak < δ entonces kf (x) − Lk < 2ε . Sea U ∗ = Bδ∗ (y0 ) la bola perforada de la que habla el enunciado. Luego por hipótesis, existe una función ϕ(y) tal que ϕ(y) = lı́m f (x) para y ∈ U ∗ es decir, para cada ε > 0, x→x0 existe δy > 0, tal que si |x − x0 | < δy entonces kf (x, y) − ϕ(y)k < 2ε para y ∈ U ∗ . Ası́ para todo y ∈ U ∗ tal que |y − y0 | < δ si x ∈ Bδ∗0 (x0 ) donde δ 0 = mín{δ, δy } se tiene que: kϕ(y) − Lk ≤ kϕ(y) − f (x, y)k + kf (x, y) − Lk < ε por lo tanto lı́m ϕ(y) = L como se querı́a probar. y→y0 Ya hemos visto anteriormente casos en los que: a) La función tiene lı́mite en un punto, pero los lı́mites reiterados (o uno de ellos) no existe. b) La función tiene lı́mites reiterados en un punto, son iguales, pero su lı́mite en dicho punto no existe c) La función tiene lı́mites reiterados en un punto, pero son distintos. Esto nos proporciona un criterio para asegurar que la función no tiene lı́mite en un punto. En general, para espacios métricos, el concepto de lı́mite se extiende de manera natural. Definición 35 Sean (X, d) y (Y, ρ) espacios métricos, D ⊂ X, f : D −→ Y una función, b ∈ Y y a ∈ D0 . Decimos que b es el lı́mite de la función f en el punto a, si para cada ε > 0 existe δ > 0 tal que si d(x, a) < δ entonces e(f (x), b) < ε. Como siempre, si b es el lı́mite de f en a, lo denotaremos por lı́m f (x) = b, x→a x∈ D Teorema 3.1.6 Sea X un espacio métrico. Entonces lı́m f (x) = b, x −→ a si y sólamente si donde xn −→ a. Demostración. lı́m n −→ ∞ x ∈ D, f (xn ) = b, para toda sucesión {xn } ⊂ D − {a}, Supongamos que lı́m f (x) x −→ a = b, x ∈ D y sea {xn } ⊂ D − {a}, tal que xn −→ a, cuando n −→ ∞. Sea ε > 0, entonces existe δ > 0 tal que ρ (f (x), b) < ε si x ∈ D y d (x, a) < δ. 73 3. Limites y continuidad. Además, existe N ∈ N tal que si n ≥ N , entonces d (xn , a) < δ. Ası́, para n > N , ρ (f (xn ), b) < ε. Por otro lado, si existe ε > 0 tal que para todo δ > 0 existe x ∈ D, que depende de δ, tal que ρ (f (x), b) ≥ ε, pero d (x, a) < δ, entonces, tomando δn = n1 , n ∈ N, hemos encontrado una sucesión en D para la cual f (xn ) no converge a b. Ası́, si lı́m f (x) = b, entonces lı́m f (xn ) = b, si x −→ a n −→ ∞ xn −→ a. Corolario 3.1.7 Si f tiene lı́mite en a, éste es único. Demostración. Es consecuencia del Teorema 3.1.6 y la unicidad del lı́mite para sucesiones. Al igual que para funciones definidas sobre Rn , se tiene que el espacio de funciones con lı́mite en un punto a es cerrado bajo la suma, el producto y el cociente, es decir, si lı́m f (x) = b y lı́m g (x) = c, donde x −→ a x −→ a f, g : D ⊂ X −→ R, X espacio métrico y a ∈ D0 , entonces 1. 2. lı́m f (x) + g (x) = b + c, x −→ a lı́m (f (x) g (x)) = b c, x −→ a 3. Si c 6= 0, entonces lı́m x −→ a b f (x) = . g (x) c La verificación de los detalles se le dejan al lector. 3.2. Funciones continuas En este capı́tulo estudiaremos las funciones continuas en espacios métricos en general, analizando ejemplos de funciones en Rn . Básicamente, la continuidad de una función x −→ f (x) significa que incrementos pequeños en la variable x, implica pequeños en el valor de f (x). Las propiedades de lı́mites estudiadas en la sección anterior, conducen de manera natural a propiedades análogas para las funciones continuas. Además, existen otras propiedades importantes, que se refieren a la continuidad global. Definición 36 Sean (X, d) y (Y, ρ) espacios métricos. Se dice que una función f : X 0 , −→ Y es continua en un punto a ∈ X, si dado ε > 0, existe δ > 0 tal que si d (a, x) < δ, entonces ρ (f (a), f (x)) < ε. Obsérvese que esta definición se puede reformular en términos de bolas. A saber, f es continua en el punto a si dada cualquier bola con centro en f (a) ∈ Y , digamos BεY (f (a)), existe una bola con centro en a ∈ X, BδX (a), de tal forma que f BδX (a) ⊂ BεY (f (a)). 74 3.2. Funciones continuas Si f no es continua en a, decimos que f es discontinua en a, o que tiene una discontinuidad en a. Obsérvese que la definición de continuidad es local, es decir, está definida sobre cada punto de X. Si f es continua en a, para todo punto a ∈ A ⊆ X decimos que f es continua en A. Si f es continua en X, decimos simplemente que f es continua. f f (Bδ (a)) a δ ε f (a) Figura 3.3: Continuidad de f en a No es difı́cil demostrar (se deja como ejercicio al lector), que la definición 36 se puede reescribir de la siguiente forma: “f es continua en x si y sólo si dada ε > 0, existe δ > 0 tal que se cumple que Bδ (x) ⊂ f −1 (Bε (f (x))).” Esta caracterización afirma que f es continua en x si y sólo si para toda ε > 0, f −1 Bε (f (x)) es una vecindad de x. Esto nos da la pauta para formular una definición más general de continuidad. Definición 37 Sean X y Y espacios métricos y sea f : X −→ Y una función. Se dice que f es continua en x ∈ X, si dada una vecindad V de f (x), f −1 (V ) es una vecindad de x. Esta definición es muy útil, ya que se puede cambiar la palabra “métricos” por “topológicos”. Ejemplos. 1. Sea f : R2 −→ R, definida como 2 x + 2y − 1 f (x, y) = 3x + y 2 si x ≥ 0 si x < 0. Analicemos la continuidad de f en todos los puntos (x0 , y0 ) ∈ R2 . Si x0 > 0, entonces lı́m (x,y) −→ (x0 , y0 ) f (x, y) = lı́m (x,y) −→ (x0 , y0 ) (x2 + 2y − 1) = x20 + 2 y0 − 1 = f (x0 , y0 ). 75 3. Limites y continuidad. Si x0 < 0, entonces f es continua en (x0 , y0 ) ya que lı́m (x,y) −→ (x0 , y0 ) f (x, y) = lı́m (x,y) −→ (x0 , y0 ) 3x + y 2 = 3 x0 + y02 = f (x0 , y0 ). Ahora, si x0 = 0, tomando los semiplanos P = {(x, y) ∈ R2 | x ≥ 0} N = {(x, y) ∈ R2 | x < 0}, f tendrá el lı́mite en (0, y0 ) si y sólamente si f |P y f |N tienen el mismo lı́mite, es decir, si lı́m (x,y) −→ (0, y0 ) f |P (x, y) = 2 y0 − 1 = f (0, y0 ) y lı́m (x,y) −→ (0, y0 ) f |N (x, y) = lı́m (x,y) −→ (0, y0 ) 3x + y 2 = y02 son iguales. Esto sucede si y sólo si, 2 y0 − 1 = y02 , es decir, si y0 = 1. Por tanto, f es continua en (0, 1) y discontinua en (0, y0 ), donde y0 = 6 1. 2. Sea la función f (x, y) = 3 x + 2y 5 si (x, y) 6= (1, 3) si (x, y) = (1, 3). Obsérvese que esta función no es continua en (1, 3) ya que lı́m (x,y) −→ (1,3) f (x, y) = lı́m (x,y) −→ (1,3) 3. Considérese la función f dada por y x f (x, y) = 0 x3 + 2y =0 , 7 6= 5 = f (1, 3). si x 6= 0 si x = 0. Esta función no es continua en (0, y0 ), y0 ∈ R ya que lı́m (x,y) −→ (0,y0 f (x, y) no existe; una forma de verificar esta afirmación es notar que y0 lı́m lı́m f (x, y) = lı́m y −→ y0 x −→ 0 x −→ 0 x no existe. De esta forma, la función es discontinua a lo largo de la recta x = 0. 4. Hay que ser cuidadosos al discutir la continuidad de una función f : X −→ Y en un subconjunto de X. Si A ⊂ X hay que distinguir entre decir que f es continua en A y considerar la restricción de f a A y afirmar que f |A es continua con la métrica d|A . En el primer caso, 76 3.2. Funciones continuas el dominio de la función es X y estamos diciendo que en todos los puntos de A se satisface la definición con la métrica d. En el segundo caso, la función f |A está definida sobre el espacio A = (A0 , d|A ). La primera afirmación implica la segunda. Para verificar esto, considerando un punto x ∈ A y ε > 0, entonces para algún valor δ > 0, f (BδX (x)) ⊂ BεY (f (x)). Luego, recordando que f |A (x) = f (x), x ∈ A, y que en el espacio A Bδ (x) es A ∩ BδX (x), se tiene que f |A (A ∩ BδX (x)) ⊂ f (BδX (x)) ⊂ BεY (f (x)) = BεY (f |A (x)). La otra implicación es falsa, ya que la función f : R −→ R, dada por si x ∈ I 0 f (x) = 1 si x ∈ Q, es discontinua en todo punto de R. Sin embargo, las funciones f |Q y f |I son funciones constantes y, por lo tanto, continuas. En resumen, la continuidad de f |A en X sólo toma en cuenta el comportamiento de la función f en puntos del conjunto A, mientras que la continuidad de f en x ∈ A también toma en cuenta el comportamiento de f en puntos fuera de A. El siguiente resultado establece la relación entre lı́mites y continuidad. Teorema 3.2.1 Sean f : X −→ Y y x ∈ X. f es continua en X si y sólo si se cumple una de las siguientes condiciones. a) x es punto aislado de X. b) x es punto de acumulación de X y lı́m f (y) = f (x). y −→ x Demostración. La demostración de que f sea continua implica una de las afirmaciones a) o b), se deja como ejercicio par el lector. Si x ∈ X es un punto aislado, entonces para alguna δ > 0, BδX (x) = {x} y f (BδX (x)) = {f (x)} ⊂ BεY (f (x)) para toda ε > 0. Si x es un punto de acumulación, el resultado es inmediato comparando las definiciones de lı́mite y continuidad. Corolario 3.2.2 Sea f : X −→ Y es continua en x ∈ X si y sólo si para cualquier sucesión {xn }n ∈ N ⊂ X tal que xn −→ x se tiene que la sucesión {f (xn )}n ∈ N ⊂ Y converge a f (x). 77 3. Limites y continuidad. Demostración. Si x es un punto aislado, consideramos la sucesión constante xn = x (ya que es la única sucesión de puntos de X que tiene lı́mite en X). Si x es un punto de acumulación, por el Teorema 3.2.1 se sigue el resultado. Veamos ahora que la composición de funciones continuas es continua. Teorema 3.2.3 Si (X, d1 ), (Y, d2 ) y (Z, d3 ) son espacios métricos de la forma f : X −→ Y , g : Y −→ Z son funciones continuas en x y f (x) respectivamente, entonces g ◦ f : X −→ Z es continua en x. En consecuencia, si f y g son continuas, entonces g ◦ f también lo es. Demostración. Sea W una vecindad de (g ◦ f ) (x) = g (f (x)) en Z. Como g es continua en f (x), g −1 (W ) es vecindad de f (x) en Y ; de esta forma, como f es continua en X, f −1 (g −1 (W )) = (g ◦ f )−1 (W ) es vecindad de x ∈ X. Otra forma de demostrar el resultado es la siguiente: tómese una sucesión {xn } ⊂ X tal que xn −→ x. Como f es continua en x, se tiene que f (xn ) −→ f (x). Ahora, debido a que g es continua en f (x), se sigue que (g ◦ f ) (xn ) = g (f (xn )) −→ g (f (x)) = (g ◦ f ) (x). Dado que {xn }n ∈ N fue una sucesión arbitraria, se sigue el resultado. El siguiente resultado establece la relación entre continuidad y conectabilidad por trayectorias. Corolario 3.2.4 Sean X y Y espacios métricos, f : X −→ Y una función continua y supóngase que X es conectable por trayectorias, entonces f (X) es conectable por trayectorias. Demostración. Si f (x), f (y) ∈ f (X), considérese la trayectoria σ : x ' y. Luego, por el Teorema 3.2.3, la función f ◦ σ es una trayectoria que une f (x) con f (y). Por otra parte, por el corolario 3.2.2 y la definición 36 es claro que si f : X −→ R y g : X −→ R son funciones continuas, entonces f + g, f g son continuas y si g (x) 6= 0 para toda x ∈ X entonces f /g es continua. Teorema 3.2.5 Sea (X , d) un espacio métrico, n ∈ N, fi : X −→ Rn y definase F como F (x) = ( f1 (x), .... fn (x)). Entonces, F es continua en x ∈ X si y sólo si fi es continua en x ∈ X, para cada i ∈ {1, ..., n} 78 3.2. Funciones continuas Demostración. Consideremos la función πk : Rn −→ R, definida como πk (z1 , ...., zn ) = zk (proyección sobre la k-ésima coordenada) y supongamos que F es continua en x. Nótese que πk ◦ F = fk . Se afirma que πk es continua en Rn . En efecto obsérvese que |πk (z) − πk (w) | = |zk − wk | ≤ kzk − wk k2 < ε = δ. Por el teorema 3.2.3, se sigue que fk es continua. Ahora, si fk es continua en x ∈ X, dado ε > 0, existe un δk > 0 tal que si d (x, y) < δk , entonces |fk (x) − fk (y)| < ε/n. Tomando δ = min {δ1 , ..., δn }, si d (x, y) < δ, se tiene que ! 21 n X 2 ≤ ε k F (x) − F (y) k2 = |fk (x) − fk (y)| k=1 de donde se concluye que F es continua en x El siguiente resultado presenta una generalización a espacios métricos Proposición 3.2.6 Si (X, d), (Y, d1 ) y (Z, d2 ) son espacios métricos y f : X −→ Y , g : Y −→ Z son funciones continuas. Definimos sobre Y × Z la métrica D : (Y × Z) × (Y × Z) −→ R+ ∪ {0} dada por D((y1 , z1 ) , (y2 , z2 )) = d1 (y1 , y2 ) + d2 (z1 , z2 ). Entonces, la función F : X −→ Y × Z dada por F (x) = (f (x), g(x)) es continua Demostración. Sean x0 ∈ X y ε > 0; entonces, existen δ1 , δ2 > 0 tales que si d (x, x0 ) < δ1 y d (x, x0 ) < δ2 , entonces d1 (f (x), f (x0 )) < ε 2 y d2 (g(x), g(x0 )) < ε . 2 Tomando δ = min{δ1 , δ2 } y d(x, x0 ) < δ, se sigue que D (f (x), f (x0 )) = d1 (f (x), f (x0 )) + d2 (g(x), g(x0 )) < ε ε + = ε. 2 2 Es fácil ver que este resultado se puede generalizar para funciones de la forma F : X −→ X , donde X = X1 × ... × Xn equipando a este espacio con n X la métrica producto, D = di donde di es la métrica del espacio Xi , i ∈ N. i=0 Como ya hemos visto anteriormente, la topologı́a de un espacio queda determinado por la descripción de sus conjuntos abiertos o sus cerrados, por el interior o la cerradura de sus conjuntos, etcétera. De la misma forma, la continuidad puede caracterizarse utilizando estos conceptos. 79 3. Limites y continuidad. Teorema 3.2.7 Sean X y Y espacios métricos y f : X −→ Y una función. Las siguientes afirmaciones son equivalentes a) f es continua b) Para todo abierto A en Y , f −1 (A) es abierto en X. c) Para todo subconjunto A de Y, f −1 (Ao ) ⊂ (f −1 (A))◦ d) Para todo subconjunto C de X f (C) ⊂ f (C). e) Para todo cerrado C en Y, f −1 (C) es cerrado en X. Demostración. a) ⇒ b) Sea A abierto en Y y sea x ∈ f −1 (A). Por definición de imagen inversa, f (x) ∈ A y como A es abierto, A es vecindad de f (x). Dado que f es continua en x, f −1 (A) es vecindad de x y dado que éste último fue arbitrario, f −1 (A) es abierto. b) ⇒ c) Sea A ⊂ Y ya que Ao es abierto, por b), se sigue que f −1 (Ao ) es abierto y f −1 (Ao ) ⊂ f −1 (A). Ya que (f −1 (A))◦ es el abierto más grande contenido en f −1 (A) se concluye que f −1 (Ao ) ⊂ (f −1 (A))◦ . c) ⇒ d) Sea C ⊂ X, por c), f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ . Por otro lado, nótese que para un espacio métrico X, se satisface que X − A = (X − A)◦ para todo A ⊂ X (Se deja como ejercicio al lector). Ası́, resulta que: X − f −1 (f (C)) = f −1 (Y − f (C)) = f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ = (X − f −1 (f (C)))◦ = X − f −1 (f (C)). También, nótese que C ⊂ f −1 (f (C)), de donde se sigue que C ⊂ f −1 (f (C)). Se puede verificar que si X es un espacio métrico, C = X − (X − C)◦ , C ⊂ X. De esta forma f −1 (f (C)) = X − (X − f −1 (f (C)))◦ = X − (f −1 (Y − f (C)))◦ ; 80 3.2. Funciones continuas como f cumple con c), se sigue que f −1 ((Y − f (C))◦ ) ⊂ (f −1 (Y − f (C)))◦ , luego X − (f −1 (Y − f (C)))◦ ⊂ X − f −1 ((Y − f (C))◦ ) = X − f −1 (Y − f (C)) = f −1 (f (C)), de donde se concluye que C ⊂ f −1 (f (C)). Aplicando f a ambos extremos, obtenemos f (C) ⊂ f [f −1 (f (C))] ⊂ (f (C)) . d) ⇒ e) Sea C cerrado en Y . Dado que se cumple d) y ya que f (f −1 (C)) ⊂ C, se sigue que f (f −1 (C)) ⊂ f (f −1 (C)) ⊂ C = C. Tomando imágenes inversas, tenemos que f −1 (f (f −1 (C))) ⊂ f −1 (C), pero f −1 (C) ⊂ f −1 (f (f −1 (C))) por lo que f −1 (C) ⊂ f −1 (C). Por lo tanto f −1 (C) = f −1 (C) es cerrado. e) ⇒ a) Sean x ∈ X y V una vecindad de f (x) en Y . Supongamos que V es abierto. Por e) se tiene que f −1 (Y − V ) = X − f −1 (V ) es cerrado, debido a que Y − V es cerrado- Luego, f −1 (V ) es abierto y como contiene a x, es vecindad abierta de x ∈ X. En consecuencia, f es continua en x y por ser éste último arbitrario, se tiene el resultado Corolario 3.2.8 Si f : X −→ Y es continua y K un subconjunto conexo de X, entonces f (K) es un subconjunto conexo de Y Demostración. Supongamos que f (K) es inconexo y sea (A, B) una desconexión de dicho conjunto. Por el Teorema 3.2.7, se sigue que (f −1 (A), f −1 (B)) es una pareja de abiertos, no vacı́os, ajenos y tales que su unión es K, es decir, K es inconexo. Teorema 3.2.9 Si f : X −→ Y es continua y K un subconjunto compacto de X, entonces f (K) es un subconjunto compacto de Y 81 3. Limites y continuidad. Demostración. Sea C = {V : i : i ∈ I} una cubierta abierta de f (K) en Y . Como f es continua, f −1 (Vi ) es abierto en X. Por lo tanto C 0 = {f −1 (Vi ) : i ∈ I} es una cubierta abierta de K en X y como K es compacto existen {f −1 (Vi )....f −1 (Vim )} ∈ C 0 tales que K ⊂ f −1 (Vi1 ) ∪ ... ∪ f −1 (Vim ). Luego f (K) ⊂ Vi1 ∪ ... ∪ Vim , por lo que f (K) es compacto. Ejemplos 1. Sea f : Rn −→ Rm continua. Se afirma que el conjunto S = {x ∈ Rn | kf (x)k < 1}, es abierto. Para ver esto, basta con observar que el conjunto S es igual al conjunto dado por f −1 ({y ∈ Rm |kyk < 1}) , que es la imagen inversa de un abierto. Como f es continua, S es abierto. 2. Nótese que si f es una función continua de la forma f : X −→ Y y U ⊂ X es abierto, f (U ) no necesariamente es abierto. A saber, tómese la función f : R −→ [0, 1] dada por 0 si x ≤ 0 x si x ∈ (0, 1) f (x) = 1 si x ≥ 0, Si se considera U = (−7, 2), f (U ) = [0, 1] que es un conjunto cerrado. A las funciones que satisfacen que mandan abiertos en abiertos, las llamaremos aplicaciones propias. 3. Si f : X −→ Y es continua y K ⊂ Y es compacto, no se cumple en general que f −1 (K) sea compacto en X. A saber, si se toma f : R −→ R dada por f (x) = 1, para toda x ∈ R, K = {1} es compacto, pero f −1 (1) = R no lo es. Si K es conexo, tampoco se puede asegurar que f −1 (K) sea conexo en X. Para ver esto, tómese f (x) = x2 y K = {1}. Luego f −1 (K) = {−1, 1} que claramente no es conexo. 82 3.2. Funciones continuas Para funciones reales de variable real, se sabe que una función continua no necesariamente tiene un máximo ni un mı́nimo absoluto. Sin embargo, si tenemos una función continua definida sobre un intervalo cerrado, dicha función alcanza su máximo y su mı́nimo. Para el caso de funciones reales de variable vectorial, tenemos un resultado similar. Proposición 3.2.10 Si C ⊂ Rn es un conjunto compacto y f : C −→ R es una función continua en C, entonces existen puntos x0 , x1 ∈ C tales que f (x0 ) ≤ f (x) ≤ f (x1 ) para toda x ∈ C, esto es, f alcanza su máximo y su mı́nimo en C. Demostración. Por el Teorema 3.2.9 se sigue que f (C) es compacto, por el Teorema 2.4.5, se sigue que este conjunto es cerrado y acotado, por lo que existen valores α, β ∈ R tales que α = sup f (C) y β = ı́nf f (C). Demostraremos que α, β ∈ f (C). Verificamos que α ∈ f (C), el caso de β se demuestra de manera análoga. Consideremos la colección de intervalos de la forma α − n1 , α , n ∈ N. Como α es el supremo, entonces existe un punto 1 xn ∈ f (C) ∩ α − , α . n Nótese que xn −→ α. Por ser f (C) compacto y {xn } ⊂ f (C), existe una subsucesión {xnk } tal que xnk −→ x0 ∈ f (C). Por la unicidad del lı́mite, se concluye que x0 = α. Recordemos que una función inyectiva f : X −→ Y tiene inversa izquierda, es decir, existe una función g : f (X) −→ X tal que g ◦ f = IdX . Denotaremos a la función g como f −1 . Proposición 3.2.11 Sean C ⊂ Rn un conjunto compacto y f : C −→ Rm una función continua en C e inyectiva. Entonces, f −1 es continua en f (C). Demostración. Sea una sucesión {yn } ⊂ f (C) tal que yn −→ y0 . Obsérvese que la sucesión {yn } genera una sucesión {xn } en C, a saber xn = f −1 (yn ). Como C es compacto, entonces existe una subsucesión {xnk } de {xn } tal que xnk −→ x0 ∈ C. Se afirma que x0 = f −1 (y0 ). Para ver esto, dado que f es continua en C y xnk −→ x0 en C, se sigue que ynk = f (xnk ) −→ f (x0 ). Ası́, por la unicidad del lı́mite, se sigue que y0 = f (x0 ), de donde se concluye, por inyectividad, que x0 = f −1 (y0 ), como se querı́a demostrar. Un espacio métrico (y en general, un espacio topológico), tiene una estructura dada por sus conjuntos abiertos y cerrados. Cuando hablamos, por ejemplo, de estructuras algebraicas (anillos,grupos, etcétera), decimos que dos objetos “no se distinguen” si son isomorfos, esto es, si existe una biyección entre sus conjuntos subyacentes que respeta su estructura. De manera similar, se puede definir una relación entre espacios métricos (en general, espacios topológicos) que respeta la estructura topológica. 83 3. Limites y continuidad. Definición 38 Sean X y Y espacios métricos (en general, espacios topológicos). Se dice que X y Y son homeomorfos y se denota como X ∼ = Y , si existe una función f : X −→ Y continua y biyectiva tal que su inversa es también continua. Nótese que la Proposición 3.2.11 muestra que una función f inyectiva y continua sobre un conjunto C ⊂ Rn , es un homemorfismo entre C y f (C). El siguiente resultado muestra que, en efecto, un homeomorfismo es una biyección que respeta la estructura topológica. Proposición 3.2.12 Sean X y Y espacios métricos y f : X −→ Y una función. Las siguientes afirmaciones son equivalentes. a) f es un homeomorfismo. b) f es biyectiva y f (A) es abierto en Y si y sólo si A es abierto en X. c) f es biyectiva y f (C) es cerrado en Y si y sólo si C es cerrado en X. Demostración. Supongamos que f es un homemorfismo. Por definición, f es biyectiva y continua, con inversa continua. Si f (A) es abierto, entonces por el Teorema 3.2.7, se sigue que f −1 (f (A)) = A es abierto. Ahora, si A es abierto, como f −1 es continua, la imagen inversa de A bajo la función f −1 es un conjunto abierto. Pero este conjunto es justamente f (A). Por otro lado, supongamos que se satisface b). Sea A un abierto en Y , como f es biyectiva, existe un subconjunto B ⊂ X tal que f (B) = A. Luego, dado que f (B) es abierto, se sigue que B es abierto y como fue arbitrario, se concluye que f es continua. Un argumento análogo muestra que f −1 es continua. Por tanto, f es un homeomorfismo. La equivalencia entre a) y c) se demuestra de una forma similar. Nótese que este resultado afirma que f no sólo establece una biyección entre los puntos de X y de Y , sino también establece una equivalencia entre los abiertos (respectivamente, cerrados) de uno y otro espacio. En general, una función continua y biyectiva, no necesariamente define un homeomorfismo. A saber, la función f : [0, 1) −→ S1 , dada por f (t) = (cos 2 π t, sin 2 π t), es continua y biyectiva, pero no es un homeomorfismo (ejercicio). 3.3. Continuidad uniforme Nuestra definición de continuidad de una función f en un punto x0 , establece una propiedad local, es decir, es una propiedad que depende de lo valores que toma f en una vecindad de x0 suficientemente pequeña. Se dice que una función es continua sobre un conjunto C si es continua en todo punto de dicho 84 3.3. Continuidad uniforme conjunto. De esta forma, para cada punto x0 ∈ C encontraremos un módulo de continuidad δ, el cual varı́a dependiendo del punto x0 . Sin embargo, existen funciones para las cuales, el módulo de continuidad no depende del punto x0 ∈ C. A este tipo de funciones las llamaremos uniformemente continuas. Definición 39 Sean (X, d) y (Y, d0 ) espacios métricos. Se dice que una función f : X −→ Y es uniformemente continua en X si dado ε > 0 existe δ > 0 tal que si d (x, y) < δ, entonces d0 (f (x), f (y)) < ε, para cualesquiera x, y ∈ X Es una consecuencia inmediata de esta definición que si f es uniformemente continua en X entonces es continua en todo punto x ∈ X. La afirmación contraria es falsa en general. La diferencia entre ambos conceptos radica en que, en la definición de continuidad, el valor δ puede depender tanto de ε como del punto x, mientras que para tener continuidad uniforme δ depende sólo de ε. Obsérvese además que la definición 39 se puede enunciar de la siguiente forma: f es uniformemente continua si f (Bδ (x)) ⊂ Bε (f (x)) para toda x ∈ X. Ejemplos. 1. Sea f : (0, 1) −→ R dada por f (x) = x1 . Observemos que esta función es continua, ya que para un intervalo abierto (a, b) ⊂ R, donde a > 0, se tiene que 1 1 f , = (a, b), b a de donde se concluye que si V ⊂ R es un conjunto abierto, entonces f −1 (V ) es abierto. Sin embargo, f no es uniformemente continua, ya que si ε = 1, para cualquier δ > 0, tal que δ < 31 , si x = 2 δ, entonces 1 1 1 f (Bδ (x)) = f ((δ, 3 δ)) = , 6⊂ B1 . 3δ δ 2δ Una función f : C ⊂ X −→ Y , donde (X, d) y (Y, d0 ) son espacios métricos, no es uniformemente continua en un conjunto C, si se verifican una de las siguientes dos condiciones: a) Existe un valor ε > 0 tal que para cada δ > 0, existen puntos x, x0 ∈ C tales que d (x, x0 ) < δ, pero d0 (f (x), f (x0 )) > ε. b) Existen ε > 0 y dos sucesiones {xn } y {x0n } en C, tales que lı́m n −→ ∞ d (xn , x0n ) = 0, pero d0 (f (xn ), f (x0n )) > ε, donde n ∈ N. 85 3. Limites y continuidad. 2. Tomando la función f del ejemplo anterior definida en el conjunto [a, ∞), donde a > 0, resulta ser una función uniformemente continua. Para ver esto, nótese que, para x, y ∈ [a, ∞) arbitrarios, x1 < a1 y y1 < a1 . Luego, para toda ε > 0, tomando δ = ε a2 y |x − y| < δ, se tiene que |f (x) − f (y)| = y −x 1 |y − x| ε a2 1 = < < = ε. − x y xy a2 a2 Como el valor δ no depende de la elección del punto, se sigue que la función es uniformemente continua. 3. Sea g : (a, b) −→ R una función diferenciable tal que |g 0 (x)| ≤ M , para toda x ∈ (a, b). Se afirma que g es uniformemente continua. En efecto, por el teorema del valor medio, si x, y ∈ (a, b) de tal forma que x < y, entonces existe un punto x0 ∈ [x, y] de tal modo que se cumple que g (y) − g (x) = g 0 (x0 ) (y − x). Por tanto, obtenemos que |g (y) − g (x)| ≤ M |y − x|. ε Ası́, para cada ε > 0 definimos δ = M y si |y − x| < δ, se sigue que |g (x) − g (y)| < ε, quedando demostrada la afirmación. 4. Sea h (x) = sin x, donde x ∈ R. Como |h0 (x)| = | cos x| ≤ 1, por el ejemplo anterior, se sigue que h es uniformemente continua. 5. Sea r (x) = sin (x2 ), tomando x ∈ R. Esta función no es uniformemente continua ya que, por el teorema del valor medio, suponiendo que x < y, se tiene que | sin (x2 ) − sin (y 2 )| = |2x0 cos (x20 )| |x − y|, donde x0 ∈ [x, y]. De esta forma, la elección del valor δ dependerá del punto x0 . Este ejemplo muestra que, en general, una función continua y acotada en todo R no es uniformemente continua. 1 2 6. Sea f (x, y) = x2 + y 2 definida en D = R − {(0, 0)}. Esta función es continua en D, sin embargo, no es uniformemente continua. A saber, tómese ε = 1 y las sucesiones xn = √1n , 0 y x0n = 0, √n1+ 2 . Es claro que d (xn , x0n ) −→ 0 cuando n −→ ∞, sin embargo |f (xn ) − f (x0n )| = |n − (n + 2)| = 2 > 1. El siguiente resultado establece una condición suficiente para la continuidad uniforme para funciones definidas en Rn . 86 3.4. Continuidad uniforme Definición 40 Sea f : C ⊆ Rn −→ Rm . Se dice que f es una función de Lipschitz en C, si existe una constante k > 0 (constante de Lipschitz para f ) tal que para cualesquiera x, y ∈ C, se satisface que ||f (x) − f (y)|| ≤ k ||x − y||. Proposición 3.3.1 Sea una función f : C ⊆ Rn −→ Rm una función de Lipschitz en C. Entonces f es uniformemente continua en C. Demostración. Sea k > 0 la constante de Lipschitz para f . Dado ε > 0, definimos δ = kε y tomando x, y ∈ C tal que ||x − y|| < δ, obtenemos que ||f (x) − f (y)|| ≤ k ||x − y|| < ε. Si consideramos la función f (x) = tomando x ∈ (0, a), a > 0, resulta que esta función no es uniformemente continua y no se puede extender a una función continua en el intervalo [0, a] ya que f no es acotada. Sin embargo, vimos que al tomar un intervalo de la forma [a, b], donde a > 0, la función se vuelve uniformemente continua (de hecho, si consideramos el intervalo [a, ∞) la función es uniformemente continua). El siguiente resultado establece la relación entre funciones continuas definidas sobre compactos y la continuidad uniforme. 1 x, Teorema 3.3.2 Sean (X, d) y (Y, d0 ) espacios métricos, f : X −→ Y una función continua y supóngase que X es compacto. Entonces f es uniformemente continua en X Demostración. Sea ε > 0. Como f es continua, para cada x ∈ X, existe δx > 0 tal que f (Bδx (x)) ⊂ B 2ε (f (x)). Por otra parte, la colección de conjuntos {Bδx }x ∈ X es una cubierta de X. Dado que X es un conjunto compacto, entonces X es secuencialmente compacto, por lo que, aplicando el Lema 2.4.6, existe un valor δ > 0 tal que para cada x ∈ X, Bδ (x) ⊂ Bδy0 (y0 ), para alguna y0 ∈ X. Nótese que el número δ no depende de x, sino de la cubierta. De esta forma, si z ∈ Bδ (x), entonces z ∈ Bδy0 (y0 ), por lo que d0 (f (z), f (x)) ≤ d0 (f (z), f (y0 )) + d0 (f (y0 ), f (x)) < Por tanto, f (Bδ (x)) ⊂ Bε (f (x)). ε ε + = ε. 2 2 87 3. Limites y continuidad. 3.4. Espacios vectoriales normados dimensionalmente finitos En el capı́tulo anterior, vimos que para Rn se pueden definir diferentes funciones que resultan ser normas. También vimos que estas normas son equivalentes, es decir, la estructura topológica de Rn es la misma. En general, una norma sobre un espacio vectorial dimensionalmente finito depende de la elección de la base. En esta sección analizaremos la equivalencia entre diferentes normas en espacios vectoriales dimensionalmente finitos. Sea V un espacio vectorial y sean ||·|| y ||·||0 dos normas sobre V . Diremos que || · || es equivalente a || · ||0 (lo cual denotamos por || · || ∼ || · ||0 ), si existen valores a, b > 0 tales que, para toda v ∈ V , a ||v||0 ≤ ||v|| ≤ b ||v||0 . Recordemos que una norma induce una métrica, a saber, para cualesquiera v, w ∈ V , definimos la función d : V × V −→ R+ ∪ {0} como d (v, w) = ||v − w||. Gracias a la teorı́a de sucesiones que desarrollamos en el capı́tulo anterior para espacios métricos y las propiedades de funciones continuas, observamos que la función || · || : V −→ R+ ∪ {0} es continua. Esto se sigue ya que, si vn −→ v en V , entonces por la desigualdad del triángulo para la norma, se sigue que |||vn || − ||v||| ≤ ||vn − v|| < ε, para n suficientemente grande. Ası́, ||vn || −→ ||v||, de donde se concluye que || · || es continua. El siguiente resultado muestra que en un espacio vectorial con dos normas equivalentes, las propiedades de espacio métrico son las mismas. Proposición 3.4.1 Sean V un espacio vectorial, ||·|| y ||·||0 normas sobre V y d y d0 respectivamente las métricas inducidas por estas normas. Supóngase que existe K > 0 tal que ||v|| ≤ K ||v||0 para todo v ∈ V y sea {vn } una sucesión en V . a) Si {vn } converge a v en el espacio métrico (V, d0 ), entonces {vn } converge a v en el espacio métrico (V, d). b) Si {vn } es de Cauchy en el espacio métrico (V, d0 ), entonces {vn } es de Cauchy en el espacio métrico (V, d). Demostración. Demostraremos a), dejando la demostración de la otra afirmación como ejercicio para el lector. Sea ε > 0. Entonces, existe N ∈ N tal ε , si n ≥ N . Ası́, si n ≥ N , se tiene que que ||vn − v||0 < K ||vn − v|| ≤ K ||vn − v||0 < ε. Por tanto, {vn } converge a v en (V, d). 88 3.4. Espacios vectoriales normados dimensionalmente finitos Corolario 3.4.2 Sean V un espacio vectorial, ||·|| y ||·||0 normas equivalentes sobre V , d y d0 respectivamente las métricas inducidas por estas normas y {vn } una sucesión en V . a) {vn } converge a v en el espacio métrico (V, d0 ), si y sólo si {vn } converge a v en el espacio métrico (V, d). b) {vn } es de Cauchy en el espacio métrico (V, d0 ), si y sólo si {vn } es de Cauchy en el espacio métrico (V, d). c) (V, d) es completo si y sólo si (V, d0 ) es completo. Demostración. Demostraremos a) y c), dejando b) como ejercicio. Como || · || ∼ || · ||0 , entonces existen m, M > 0 tales que m ||v|| ≤ ||v||0 ≤ M ||v||, para toda v ∈ V . De esta forma, dado que ||v||0 ≤ M ||v|| para toda v ∈ V , si vn −→ v en (V, d), por la Proposición 3.4.1, vn −→ v en (V, d0 ). Obsérvese que ||v|| ≤ 1 0 m ||v|| para todo v ∈ V , por lo que, aplicando un argumento similar, queda demostrado a). Ahora, supongamos que (V, d) es completo y sea {vn } una sucesión de Cauchy en el espacio métrico (V, d0 ). Por b), {vn } es de Cauchy en (V, d) y, por tanto, convergente. Por a), se sigue que {vn } es convergente en (V, d0 ), de donde se concluye que (V, d0 ) es completo. El converso es cierto por simetrı́a. Si V es un espacio vectorial dimensionalmente finito sobre R (o sobre C), con base β = {v1 , ..., vn }, entonces la función || · ||∗ : V −→ R+ ∪ {0} dada por ! 12 ∗ n n X X λi vi = |λi |2 ||v||∗ = , i=1 i=1 es una norma (ejercicio), donde λi ∈ R (o en C) son los escalares que expresan a v en términos de la base β. Esto muestra que V tiene al menos una norma. El siguiente resultado muestra que cualquier otra norma sobre V es equivalente a esta norma. Teorema 3.4.3 Sean V un espacio vectorial dimensionalmente finito sobre R (o C), β = {v1 , ..., vn } una base para V y || · || una norma definida en V . Entonces, || · || ∼ || · ||∗ . Demostración. Sea M = n X i=1 ! 12 2 ||vi || . 89 3. Limites y continuidad. Como β es una base, se sigue que M > 0. Luego n X λ i vi i=1 ≤ = n X i=1 n X i=1 ≤ ||λi vi || |λi | ||vi || n X i=1 = M ! 12 n X 2 |λi | n X i=1 ! 21 2 ||vi || ∗ . λ i vi i=1 Ahora, sea f : Rn −→ R (se puede sustituir R por C), definida como f (λ1 , ..., λn ) = n X λi vi . i=1 Nótese que esta función es continua. Por otra parte, el conjunto S = {(λ, ..., λn ) ∈ Rn | n X i=1 |λi |2 = 1}, es compacto, por lo que, por la Proposición 3.2.10, existe un punto (µ1 , ..., µn ) ∈ S tal que m = f (µ1 , ..., µn ) ≤ f (λ1 , ..., λn ), para todo (λ1 , ..., λn ) ∈ S. Si m = 0, entonces n X µi vi = 0, i=1 de donde se concluye que n X µi vi = 0, i=1 lo cual es una contradicción al hecho de que β es una base. Por tanto, m > 0. Además, por la definición de || · ||∗ , si ||v||∗ = 1, entonces ||v|| ≥ m. Ası́, si x ∈ V − {0}, como concluye que x ||x||∗ ∗ = 1, se obtiene que ||x|| ≥ m ||x||∗ , x ||x||∗ ≥ m, de donde se 90 3.4. Espacios vectoriales normados dimensionalmente finitos quedando demostrado el teorema. La equivalencia de normas, en efecto, define una relación de equivalencia, por lo que el siguiente resultado es inmediato. Corolario 3.4.4 Sean V un espacio vectorial dimensionalmente finito sobre R (o sobre C) y || · ||, || · ||0 dos normas definidas sobre V . Entonces, dichas normas son equivalentes. Ahora que ya hemos demostrado que todas las normas sobre un espacio vectorial dimensionalmente finito son equivalentes, basta con estudiar las propiedades de espacio métrico asociadas con una norma en particular. Nótese que si V es un espacio vectorial dimensionalmente finito sobre R, se n X n λi vi , entonces puede crear una biyección entre V y R , a saber, si v = i=1 v ↔ (λ1 , ..., λn ). Como Rn es completo, se sigue que V también lo es, ya que una sucesión de Cauchy en V define una sucesión de Cauchy en Rn y, por tanto, ésta última será una sucesión convergente a un vector (x1 , ..., xn ) ∈ Rn . Luego, este vector determina un elemento v0 ∈ V . De esta forma, hemos demostrado que todo espacio vectorial dimensionalmente finito, normado, es completo. Resulta interesante verificar el concepto de continuidad para transformaciones lineales. Para esto, definimos el concepto de transformación acotada. Definición 41 Sea T : V → W una transformación lineal, donde V y W son normados. Se dice que T es acotada si existe c ∈ R+ tal que para todo v ∈ V, kT (v)kW ≤ k vkV . Teorema 3.4.5 Sea T : V → W una transformación lineal, donde V, W son espacios normados. Entonces las siguientes afirmaciones son equivalentes a) T es acotada. b) T es continua. c) T es continua en v0 ∈ V. Demostración. Supongamos que T es acotada; entonces, existe c ∈ R+ tal que, para toda v ∈ V, kT (v)kW ≤ kvkV , Ası́, para cualquier v0 ∈ V y ε > 0, tomando δ = εc se tiene que kT (v) − T (v0 )kW = kT (v − v0 )kW ≤ ckv − v0 kV < c δ si kv − v0 kV < δ. Por lo tanto a) implica b). Por otra parte, b) implica c) trivialmente, por lo que demostramos c) implica 91 3. Limites y continuidad. a). Supongamos que T es continua en v0 . Tomando ε = 1, existe δ > 0 tal que si kv − v0 kV < δ, entonces kT (v) − T (v0 )kW < 1. Escribiendo N = v − v0 , se obtiene que, si kN kV < δ, entonces kT (N )kW < 1 (T es lineal). Ahora, consideremos δ w; luego, w ∈ V − {0} y definimos v = v0 + 2kwk V N = v − v0 = donde kN kV = δw 2kwkV , δ 2 < δ. Ası́, δ w δ kT (N )kW = kT kW = kT (w)kW < 1, 2 kwkV 2kwkV de donde se concluye que kT (w)kW < como se querı́a demostrar. 2 kwkV = ckwkV δ Capı́tulo 4 Diferenciación. 4.1. Funciones vectoriales de variable escalar. Recordemos que en el cálculo de funciones de variable real, la derivada de una función f , se define como la función que denotaremos por f 0 , cuya regla de correspondencia queda determinada por f (x0 + h) − f (x0 ) h −→ 0 h y cuyo conjunto de definición es la colección de todos los valores para los que el lı́mite existe. Por otra parte, al considerar una función vectorial de variable real, estamos pensando en la representación gráfica del movimiento de una partı́cula al tiempo t0 en R3 , por ejemplo. Es decir, una función F : R −→ Rn representa la posición de un vector (x1 (t), ..., xn (t)) ∈ Rn , dependiendo del parámetro t. Veamos que si F : R −→ Rn es una función vectorial de variable real, la derivada se define de manera similar al caso real. f 0 (x0 ) = lı́m Definición 42 Sea F : A ⊂ R −→ Rn , una función vectorial de variable real. Se dice que F es diferenciable en t0 ∈ A si F (t0 + h) − F(t0 ) , h−→0 h existe. En este caso, lo denotaremos por F0 (t0 ) y le llamaremos la derivada de F en t0 . Diremos únicamente que F es diferenciable, si F es diferenciable en t0 , para toda t0 ∈ A. lı́m No es difı́cil ver (Ejercicio) que si se tiene una sucesión {xm }m∈ N ⊂ Rn , de tal forma que xm −→ x ∈ Rm , donde (n) (n) xm = x(1) y x = x(1) m , ..., xm m , ..., xm (i) entonces xm −→ xi , i ∈ {1, ..., u}. La implicación inversa también es cierta. De esta forma, tenemos el siguiente resultado. 93 94 4.1. Funciones vectoriales de variable escalar. Teorema 4.1.1 Si F = (f1 , ..., fn ), donde las funciones fi : A ⊂ R −→ R, i ∈ {1, ..., n}, son diferenciables en un punto t0 ∈ A y F0 (t0 ) = (f 0 (t0 ), ..., fn0 (t0 )). Demostración. Por la observación anterior se tiene que lı́m h−→0 F (t0 + h) − fi (t0 )) h existe si y sólo si fi (t0 + h) − fi (t0 )) , i ∈ {1, ..., n} h existe. Por hipótesis, fi es diferenciable en t0 ∈ A. Ası́, lı́m h−→0 lı́m h−→0 F (t0 + h) − fi (t0 )) h = lı́m h−→0 = = lı́m h−→0 f1 (t0 + h) − f (t0 ) fn (t0 + h) − f (t0 ) , ..., h h f1 (t0 + h) − f (t0 ) fn (t0 + h) − f (t0 ) , ....., lı́m h−→0 h h f10 (t0 ), ....., fn0 (t0 ) Ejemplos a) Sea f (t) = (cos t, sen t) t ∈ R. Las funciones cos t y sen t son diferenciables en todo R, ası́ f 0 (t) = (−sen t, cos t) b) Considérese g(t) = et (1, cos t, sen t). Nótese que g(t) = (et , et cos t, et sen t) por lo que g 0 (t) = (et , et (cos t − sen t), et (sen t + cos t)). De hecho, nótese que si F (t) = (f1 (t), ....., fn (t)) es diferenciable en un punto t0 ∈ A, entonces F(t0 + h) − F(t0 ) h−→0 h existe. Además, este lı́mite existe si y sólo si lı́m 95 4. Diferenciación. fi (t0 + h) − fi (t0 ) , i ∈ {1, ...., n} h existe, de donde se sigue que fi : A ⊂ R −→ R es diferenciable, para cada i ∈ {1, ....., n}. Geométricamente, una función F : A ⊂ R −→ Rn define una curva C en Rn . Si t0 , t0 + h ∈ D(F), donde h 6= 0, entonces el vector lı́m h−→0 1 F( t0 + h) − F (t0 ) = F(t0 ) h tiene la misma dirección que el vector F(t0 + h) − F(t0 ). Cuando h −→ 0, F0 (t0 ) se aproxima a un vector que cae en la recta tangente a la curva C en F (t0 ) (Véase la Figura 4.1) F (t0 ) F ′ (t F 0) (t 0 + h) − F ) (t 0 F (t0 + h) Figura 4.1: Vector tangente Definición 43 Si C es una curva descrita por la función F : A ⊂ R −→ Rn diferenciable en t0 y F0 (t0 ) 6= 0, entonces llamaremos a F0 (t0 ) vector tangente a la curva C en el punto F(t0 ) y a la recta L = {F(t0 ) + aF0 (t0 )|a ∈ R} se le conoce como recta tangente a la curva C en F(t0 ). Esta definición de recta tangente a una curva extiende el concepto de recta tangente a la gráfica de una función real de variable real. En efecto, para una función f : A ⊂ R −→ R diferenciable en un punto t0 ∈ A, los puntos en su gráfica quedan descritos por coordenadas de la forma (t, f (t)), donde t ∈ A. Ası́, definimos una función F : A ⊂ R −→ R2 dada por F(t) = (t, f (t)), la cual es diferenciable en t0 y 96 4.1. Funciones vectoriales de variable escalar. F0 (t0 ) = (1, f 0 (t0 )), por lo que la recta tangente a la curva en F(t0 ) queda descrita por el conjunto {F(t0 ) + aF0 (t0 )| a ∈ R} = {(t0 + a, f (t0 ) + af 0 (t0 ))| a ∈ R} Nótese que la pendiente de esta recta es f 0 (t0 ). Esto se sigue ya que los puntos (x, y) en la recta quedan descritos por las ecuaciones paramétricas x = t0 + a (4.1) y = f (t0 ) + af 0 (t0 ) (4.2) donde a ∈ R. Despejando el parámetro a en la ecuación (4.1) y sustituyendo en (4.2), obtenemos que y = f (t0 ) + f 0 (t0 ) (x − t0 ), que es la ecuación rectangular de una recta con pendiente f 0 (t0 ). Por otro lado, sabemos que si una función f : A ⊂ R −→ R es diferenciable en A, entonces es continua en A. Ası́, por el teorema 4.1.1 y la definición de diferenciabilidad, se tiene el siguiente resultado. Proposición 4.1.2 Si la función F : A ∈ R −→ Rn es diferenciable en A, entonces F es continua en A. Otra forma para denotar la derivada de una función F : A ⊂ R −→ Rn en dF (t0 ). Al igual que en cálculo real de variable real, existen un punto t0 es dt reglas para la derivada de una suma y productos por escalares. Proposición 4.1.3 Sean F, G : A ⊂ R −→ Rn y f : A ⊂ R −→ R funciones diferenciables sobre A. Entonces F±G, F·G, f F son diferenciables sobre A, donde a) d(F ± G) dF dG = ± dt dt ∂t dG dF d(F · G) = F· +G dt dt dt d(f F) dF df c) = f + (F) dt dt dt b) d) Además, si n = 3, F × G es diferenciable y d(F × G) dG dF = F× + ×G dt dt dt 97 4. Diferenciación. Demostración. Probaremos b) y d), dejando la demostración de los demás incisos como ejercicio para el lector. Si F(t) = (f1 (t), ....., fn (t)) G(t) = g1 (t), ...., gn (t) y entonces (F · G)(t) = n X fi (t) gi (t). i=1 Como F y G son diferenciables sobre A, entonces fi y gi son diferenciables sobre A, i ∈ {1, ....., n}. Ası́ d (F · G)(t) dt = n X fi0 (t) gi0 (t) + gi0 (t) fi (t) i=1 = n X fi0 (t) gi (t) + i=1 = n X gi0 (t)fi (t) i=1 dG dF · G (t) + F · (t) dt dt como se querı́a demostrar. Ahora si F = (f1 , f2 , f3 ) y G = (g1 , g2 , g3 ) entonces F × G = (f2 g3 − f3 g2 , f3 g1 − f1 g3 , f1 g2 − f2 g1 ), de donde se sigue que d(F × G) = dt (f2 g30 + f20 g3 − f30 g2 − f3 g20 , f3 g10 + f30 g1 − f10 g3 − f1 g30 , f1 g20 + f10 g2 − f2 g10 − f20 g1 ) = (f2 g30 − f3 g20 , f3 g10 − f1 g30 , f1 g20 − f2 g10 ) + (g3 f20 − g2 f30 , g1 f30 − g3 f10 , g2 f10 − g1 f20 ) = dG dF F× + ×G dt dt Recordemos que si f : A ⊂ R −→ R y g : B ⊂ R −→ R son funciones diferenciables en A y en B respectivamente y f (A) ⊆ B, entonces la composición (g ◦ f ) es diferenciable en A y df dg d(g ◦ f ) = (t) (f (t)). dt dt dt A este resultado se le conoce como regla de la cadena. Pues bien, si F : B ⊂ R −→ Rn y f (A) ⊆ B, 98 4.1. Funciones vectoriales de variable escalar. donde F es diferenciable en B, se tiene un resultado análogo, cuya prueba se deja como ejercicio al lector. Teorema 4.1.4 (Regla de la cadena) Sean F : B ⊂ R −→ Rn y f : A ⊂ R −→ R funciones diferenciables sobre B y A respectivamente, de tal forma que f (A) ⊆ B. Entonces F ◦ f es diferenciable sobre A y df dF d(F ◦ f ) = (t) (f (t)) . dt dt dt Figura 4.2: Gráfica de f (x) = ± q x3 1−x Ejemplos a) Considérese la función F(t) = t2 t3 1+t2 , 1+t2 . t3 f2 (t) = 1+t 2 Nótese que f1 = t2 t2 +1 es una función par, mientras que es impar. De esta forma, podemos concluir que la curva definida por la función F es simétrica con respecto al eje x. Ahora, los vectores tangentes a la curva quedan descritos por la ecuación 2t t4 + 3t2 t F0 (t) = , = (2, t3 + 3t). (1 + t2 )2 (1 + t2 )2 (1 + t2 )2 99 4. Diferenciación. Si t < 0, entonces, el vector tangente tiene la misma dirección que el vector (−2, −(t3 + 3t)), mientras que si t > 0, F 0 (t) tiene la misma dirección que el vector (2, t3 + 3t). Obsérvese que lı́m (−2, −(t3 + 3t)) = (−2, 0) y t −→ 0− lı́m (2, t3 + 3t) = (2, 0) t −→ 0+ esto es, en (0, 0) la gráfica de la función presenta una cúspide. Además nótese que lı́m f1 (t) = 1 y lı́m f2 (t) = ∞, por lo que la gráfica t−→∞ t−→∞ de la función es como lo muestra la Figura 4.2. De hecho, podemos da la ecuación rectangular de esta curva observando que y = t3 = t 1 + t2 t2 1 + t2 = xt, de donde se sigue que 2 x = t = 1 + t2 1 y 2 x 2 + xy s ⇔ y= ± x3 1−x b) Sea F : A ⊂ R −→ Rn una función diferenciable y supongamos que kFk = c, c ∈ R constante, para toda t ∈ A. Luego, obsérvese que F · F = kFk2 = c2 , por lo que aplicando la proposición 4.1.3 se sigue que F · F0 = 0, es decir F(t) y F0 (t) son ortogonales 2 t3 t , c) Sean F(t) = y f (t) = cos t, t ∈ R. Por el Teorema 1 + t2 1 + t2 4.1.4, se sigue que d(F ◦ f ) (t) dt df dF (t) (f (t)) dt dt 2 cos t cos4 t + 3 cos2 t = (− sin t) , (1 + cos2 t)2 (1 + cos2 t)2 −2sen t cos t −sen t (cos4 t + 3cos2 t) , = (1 + cos2 t)2 (1 + cos2 t)2 = El siguiente resultado generaliza el teorema del valor medio para funciones vectoriales de variable real. Teorema 4.1.5 (Del Valor Medio I) Sea F : [a, b] −→ Rn una función continua sobre [a, b] y diferenciable sobre (a, b). Entonces existen valores ci ∈ (a, b) i ∈ {1, ..., n} tales que F(b) − F(a) = (b − a) (f10 (c1 ), ...., fn0 (cn )) 100 4.1. Funciones vectoriales de variable escalar. Demostración. Como F es continua en [a, b] y diferenciable en (a, b), entonces fi es continua en [a, b] y diferenciable en (a, b). Luego, por el teorema del valor medio para funciones reales de variable real, se sigue que existen valores ci ∈ (a, b) tal que fi (b) − fi (a) = (b − a)(fi0 (ci )), de donde se sigue el resultado. Para una función F : A ⊂ R −→ Rn y puntos t0 , t0 + h ∈ A, llamaremos incremento de F en t0 correspondiente al valor h al vector de la forma ∆h F(t0 ) = F(t0 + h) − F(t0 ). Ası́, si F es diferenciable en t0 , se tiene que ∆h F(t0 ) = F(t0 + h) − F(t0 ) = hF0 (t0 ) + hϕh (t0 ), donde ϕh (t0 ) = F(t0 + h) − F(t0 ) − F0 (t0 ). h Como ϕh (t0 ) −→ 0 conforme h −→ 0, se concluye que ∆h F(t0 ) ≈ hF0 (t0 ) cuando h es suficientemente pequeño. F (t0 ) Dh F (t0 ) ∆h F ) (t 0 h ϕh (t0 ) F (t0 + h) 0 Figura 4.3: Diferencial de F en t0 Definición 44 Sea F : A ⊂ R −→ Rn una función diferenciable. Se define la diferencial de F en t0 correspondiente al incremento de h, denotado por Dh F(t0 ) Dh F(t0 ) = hF 0 (t0 ). 101 4. Diferenciación. De esta forma, para h suficientemente pequeño, se tiene que F(t0 + h) = F(t0 ) + ∆h F(t0 ) ≈ F(t0 ) + Dh F(t0 ). (4.3) Nótese que si F0 (t0 ) 6= 0, entonces Dh F(t0 ) es un vector paralelo al vector tangente a la curva C, descrita por F(t), en el punto F(t0 ) (Véase la Figura 4.3) Una forma de simplificar la notación, es escribir dt en lugar de h, lo cual representa un incremento en el parámetro t y en lugar de Dh F(t), abreviar por d F, de donde obtenemos la notación reveladora dF = F0 (t) dt, de donde se sigue que F0 (t) = dF dt . Con esta notación tenemos que dF = F0 (t)dt = (f1 (t)dt, ....., fn (t)dt), esto es dF = (df1 , ....., dfn ). Por la definición de diferencial y las reglas (ya demostradas) para la derivada, se tienen las siguiente propiedades: a) d(F ± G) = dF ± dG b) d(F · G) = (dF · G) + (G · dF) c) d(F × G) = (dF × G) + (F × dG) d) ∂(f F) = f (∂F) + (∂f )F e) d(F ◦ f ) = (F0 ◦ f ) df 4.2. 4.2.1. Funciones escalares de variable vectorial Derivada y diferencial En esta sección, estudiaremos la derivada y la diferencial de las funciones escalares de variable vectorial. Para esto, recordemos nuevamente la idea de la diferenciabilidad para funciones escalares de variable real. Si f es una función diferenciable en un punto t0 , entonces f 0 (t0 ) = lı́m h−→0 existe. Definiendo ϕh (t0 ) = f (t0 + h) − (t0 ) , h f (t0 +h) − (t0 ) h − f 0 (t0 ), h 6= 0 se obtiene que f (t0 + h) = f (t0 ) + f 0 (t0 )h + h ϕ(t0 ), 102 4.2. Funciones escalares de variable vectorial donde lı́m h ϕh (t0 ) = 0 h−→0 Nótese la similitud con la ecuación (4.3). Nuevamente, al valor f 0 (t0 )h lo llamaremos diferencial de f en t0 con incremento h. En general, diremos que f : A ⊂ R −→ R es diferenciable en t0 si existe r > 0 tal que Br (t0 ) ⊂ A y existe a ∈ R (independientemente de h ) tal que para todo punto t0 + h ∈ Br (t0 ) se cumple que f (t0 + h) = f (t0 ) + ah + ϕh (t0 )h, donde lı́m ϕh (t0 ) = 0; al término ah lo llamaremos la diferencial de f en t0 h−→0 con respecto al incremento h. Tomando estas ideas como base, podremos extender el concepto de diferenciabilidad a funciones de Rn a R. Definición 45 Sea F : A ⊂ Rn −→ R una función. Decimos que F es diferenciable en t0 ∈ A si existe un vector a ∈ Rn (independientemente de h) tal que para toda t0 + h ∈ Br (t0 ), r > 0 F (t0 + h) = F (t0 ) + a · h + ϕh (to ) · h donde lı́m ϕh (t0 ) = 0. Al valor a · h lo llamaremos diferencial de F en t0 h−→0 con respecto a h y lo denotaremos por Dh F (t0 ) o simplemente por D F (t0 ). Al vector a se le conoce como derivada de F en t0 y se denotará por D F (t0 ). Nótese que D F (t0 ) · h = DF (t0 ), ası́ que en muchas ocasiones, cambiaremos h por la notación (más sugerente) dt. Por tanto, D F (t0 ) · dt = DF (t0 ). Ejemplos a) Sea F (x, y) = x2 + xy y tómese un vector h = (h1 , h2 ) ∈ R2 ; entonces F (x + h) = F (x + h1 , y + h2 ) = (x + h1 )2 + (x + h1 )(y + h2 ) = x2 + 2xh1 + h21 + xy + h1 y + h2 x + h1 h2 = x2 + xy + [(2x + y)h1 + xh2 ] + h1 h1 + h1 h2 = x2 + xy + (2x + y, x) · h + (h1 , h1 ) · h 103 4. Diferenciación. Definiendo a = (2x + y, x) y ϕh (x) = (h1 , h1 ), se tiene que F es diferenciable ya que lı́m ϕh (x) = lı́m (h1 , h1 ) = (0, 0) h−→0 h−→0 p b) Considérese la función G(x, y) = |xy|. Se afirma que G no es diferenciable en 0. Para ver esto, nótese que, si h = (h1 , h2 ). Para ver esto, nótese que, si h = (h1 , h2 ), p p |h1 h2 | h1 |h1 h2 | h1 = G(0) + G(h) = |h1 h2 | = 0 + h1 h1 ! p |h1 h2 | Definiendo ϕh = , 0 . Obtenemos que h1 p G(h) − G(0) = h · ϕh (0), por lo que, al parecer, G es diferenciable en 0; sin embargo, lı́m ϕh (0) = lı́m h−→0 h−→0 ! p |h1 h2 | ,0 h1 no existe. Teorema 4.2.1 Si F : A ⊂ Rn −→ R es diferenciable en t0 ∈ A, entonces F es continua en t0 . Demostración. Como F es diferenciable, existe un vector a ∈ Rn tal que para cualquier punto t0 + h ∈ Br (t0 ), r > 0, se tiene que F (t0 + h) = F (t0 ) + a · h + ϕh (t0 ) · h, luego cuando h −→ 0 se tiene que lı́m F (t0 + h) = F (t0 ), h−→0 de donde se sigue el resultado El siguiente resultado muestra que la suma y el producto de funciones diferenciables, es diferenciable Teorema 4.2.2 Si F y G son funciones diferenciables en un punto t0 ∈ Rn , entonces F ± G y F G son diferenciables en t0 . Además a) D(F ± G)(t0 ) = DF (t0 ) ± DG(t0 ) b) D(F G)(t0 ) = G(t0 ) (DF (t0 )) + F (t0 )(DG(t0 )) 104 4.2. Funciones escalares de variable vectorial Demostración. Verificamos la validez del teorema para el producto, dejando la verificación de la suma como ejercicio para el lector. Como F y G son diferenciables, existen vectores a1 y a2 y un valor r > 0, tales que para todo t0 + h ∈ Br (t0 ), se cumple que F (t0 + h) = F (t0 ) + a1 · h + ϕh (t0 ) · h y G(t0 + h) = G(t0 ) + a2 · h + ψh (t0 ) · h donde lı́m ψh (t0 ) = 0 = lı́m ϕh (t0 ). Luego, h−→0 (F G)(t0 + h) h−→0 = (F (t0 ) + a1 · h + ϕh (t0 ) · h)(G(t0 ) + a2 · h + ψh (t0 ) · h) = (F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h + [F (t0 )ψh (t0 ) + (a1 · h)a2 + (a1 · h) ψh (t0 ) + G(t0 )ϕh (t0 )) + (a2 · h) ϕh (t0 ) + ϕh (t0 ) ψh (t0 )] · h = (F G)(t0 ) + (F (t0 )a2 + G(t0 )a1 ) · h + τh (t0 ) · h. Nótese que lı́m τh (t0 ) = 0, de donde se sigue que f g es diferenciable en t0 y h−→0 D(F G)(t0 ) = )G(t0 )(DF (t0 ) + F (t0 )(DG(t0 )) que era lo que se querı́a demostrar. Falta ver que la composición de funciones diferenciables, es una función diferenciable. Teorema 4.2.3 (Regla de la cadena II) Si G : A ⊂ R −→ Rn es una función diferenciable en t0 y F : Rn −→ R es diferenciable en G (t0 ), entonces F ◦ G es diferenciable en t0 y d dG (F ◦ G)(t0 ) = DF (G(t0 )) · (t0 ) dt dt Demostración. Como G es diferenciable en t0 , para alguna r > 0 y para cualquier (t0 + h) ∈ Br (t0 ), se tiene que G(t0 + h) = G(t0 ) + v(t0 , h), 105 4. Diferenciación. donde v(t0 , h) = hG0 (t0 ) + hψh (t0 ). Por otro lado, como F es diferenciable en G(t0 ), existe s > 0 tal que para todo (G(t0 ) + h) ∈ Bs (G(t0 )) existe un vector a = D F (G(t0 )) de tal forma que F (G(t0 ) + h) = F (G(t0 )) + a · h + ϕh (G(t0 )) · h Como G es continua, se puede elegir r de tal manera que G(Br (t0 )) ⊂ Bs (G(t0 )). Ası́ tenemos que (F ◦ G)(t0 + h) = F [G(t0 ) + v(t0 , h)] = F (G(t0 )) + DF (G(t0 )) · v(t0 , h) + v(t0 , h) · ϕv(t0 , h) (G(t0 )) = F (G(t0 )) + hG0 (t0 ) · DF (G(t0 )) + hτh (t0 ), donde τh (t0 ) = ψh (t0 ) · DF (t0 ) + [G0 (t0 ) + ψh (t0 )] · ϕv(t0 , h) (G(t0 )) Obsérvese que lı́m τh (t0 ) = 0, de donde se obtiene que F ◦ G es diferenciable h−→0 en t0 y d(F ◦ G) (t0 ) = G0 (t0 ) · DF (G(t0 )) dt Corolario 4.2.4 Si F, G : A ⊂ Rn −→ R son diferenciables en t0 ∈ A y F G(t0 ) 6= 0, entonces G es diferenciable en t0 y F G(t0 )DF (t0 ) − F (t0 )DG(t0 ) D (t0 ) = G G2 (t0 ) F 1 1 Demostración. Como G = F G y G = (f ◦ G) donde f (y) = y1 , tenemos que 1 1 F (t0 ) = (DF (t0 )) (t0 ) + F (t0 ) D (t0 ) D G G G = = = 1 + F (t0 ) f 0 (G(t0 )) DG(t0 ) G(t0 ) 1 DF (t0 ) + − F (t0 ) DG(t0 ) G(t0 ) (G(t0 ))2 (DF (t0 )) G(t0 ) DF (t0 ) − F (t0 )DG(t0 ) , (G(t0 ))2 106 4.2. Funciones escalares de variable vectorial como se querı́a demostrar Usando el Teorema 4.2.3 y el teorema del valor medio para funciones escalares de variable escalar, se obtiene un generalización del teorema del valor medio para funciones reales de variable vectorial. Teorema 4.2.5 (Del valor medio II) Si F : A ⊂ Rn −→ R es una función diferenciable en A, donde A es un conjunto abierto que contiene un segmento rectilı́neo que va de t0 a v 0 , entonces existe ξ0 ∈ (0, 1) tal que F (v 0 ) − F (t0 ) = (v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 )) Demostración. Sea G(ξ) = t0 + ξ(v 0 − t0 ) y H = F ◦ G Entonces F (v 0 ) − F (t0 ) = F (G(1)) − F (G(0)) = H(1) − H(0). Por el Teorema 4.2.3, H es diferenciable en (0, 1). Luego, por el Teorema del valor medio para funciones escalares de variable escalar, se sigue que H(1) − H(0) = H 0 (ξ0 ) para algún ξ0 ∈ (0, 1), de donde se obtiene que F (v 0 ) − f (t0 ) = d(F ◦ G) dG (ξ0 ) = (ξ0 ) · DF (G(ξ0 )) dξ dξ = (v 0 − t0 ) · DF (t0 + ξ0 (v 0 − t0 )) 4.2.2. Derivadas direccionales y parciales. Considérese una función escalar de variable vectorial F (x). Para disponer de una imagen geométrica, iniciamos nuestra discusión para funciones definidas en R2 , aunque los resultados se presentan en su versión general. En principio, supóngase que en la función F (x, y) se efectúa un cambio en las variables independientes. La primera pregunta que viene a la mente es: “¿Cuál es la razón de cambio de la función respecto a dichas variaciones? ” En general, en un punto de su dominio, la función F no tendrá una razón de cambio única, sino que cambiará en proporciones distintas dependiendo de la dirección en que el punto (x, y) se mueva. Ası́, para la función F en el punto t0 y dado un vector unitario u, la razón de cambio de F en la dirección u, está dada por lı́m h−→0 F (t0 + h u) − F (t0 ) , h 107 4. Diferenciación. F ( t0 + h u ) F ( t0 ) t0 u t0 + h u Figura 4.4: Concepto de derivada direccional Dada una función f (x1 , ..., xn ), supongamos que se realiza un cambio arbitrario en los valores de sus variables independientes. Luego, uno se preguntarı́a sobre cuál es la razón de cambio de la función respecto a dicha variación. No debe ser dificil para el lector observar que la razón de cambio de una función F : A ⊆ Rn −→ R en la dirección v, en el punto t0 ∈ A, donde v, es un vector vector unitario, está dada por lı́m h−→0 F (t0 + hv) − F (t0 ) . h Véase la Figura 4.5. Esta razón de cambio se conoce como derivada direccional de F en t0 en la dirección del vector v. Definición 46 La derivada direccional de F : A ⊆ Rn −→ R en t0 ∈ A en la dirección de un vector unitario v ∈ Rn es la función, que denotaremos por Dv F , dada por Dv F (t0 ) = lı́m h−→0 F (t0 + hv) − F (t0 ) , h 108 4.2. Funciones escalares de variable vectorial cuyo dominio son todos aquellos puntos donde este lı́mite existe. Obsérvese que Dv F (t0 ) depende de los valores de la función F sobre el conjunto L = {t0 + hv|h ∈ R}. F (t0 + h u) F (t0 + h u) − F (t0 ) F (t0 ) h F (t0 ) t0 υ u A F (t0 + h u) t0 + h u t0 + h u Figura 4.5: Razón de cambio en la dirección de un vector u para una función F : R2 −→ R Ası́, si definimos f (h) = F (t0 + hv), se tiene una función real de variable real, cuya gráfica corresponde a la intersección de la función F con un plano que contiene la recta que pasa por t0 y es paralela a v. Luego Dv F (t0 ) = = = lı́m F (t0 + hv) − F (t0 ) h lı́m f (h) − f (0) = f 0 (0) h h−→0 h−→0 109 4. Diferenciación. Ejemplos a) Consideremos la función 3xy + x2 y 3 . Se requiere calcular la derivada direccional de F en el punto (3, 2) y en la dirección v = √12 , √12 . Para esto, consideremos el siguiente lı́mite. F ((3, 2) + h lı́m 1 √1 , √ 2 2 − F (3, 2) h h−→0 3 h2 2 = = + 5h √ 2 + 6 + 9 + 6h √ 2 + h2 2 8 + 12h √ 2 + 6h2 2 + h3 3 22 − 90 h 171 √ 2 b) Considérese la función g(x, y) = 9x2 sin y. Se quiere encontrar la razón de cambio de G en elpunto x0 = (−1, 6) en la dirección del vector uni- tario v = √334 , √534 . Para realizar este cálculo consideremos la función escalar f : R −→ R dada por 5h 3h √ √ , x2 + = F x1 + 34 34 2 3h 5h = 9 x1 + √ sin x2 + √ 34 34 f (h) = F (x + hv) Luego, calculando la derivada de esta función, se sigue que 0 3h 5h 54 √ x1 + √ sin x2 + √ 34 34 34 2 45 3h 5h √ √ √ x1 + cos x2 + , 34 34 34 f (h) = + Por lo que, evaluando en 0 se obtiene 54 45 f 0 (0) = √ x1 sin x2 + √ x21 + cos x2 34 34 Evaluando en x0 , obtenemos 54 45 Dv F (x0 ) = − √ sin 6 + √ cos 6. 34 34 110 4.2. Funciones escalares de variable vectorial c) Sea H(x) = x2 y + x4 y2 0 si (x, y) 6= (0, 0) si (x, y) = (0, 0) Calcularemos la derivada direccional de H en (0, 0) en la dirección de un vector v arbitrario, digamos v = (v1 , v2 ). Entonces Dv H(0, 0) = = = F (hv1 , hv2 ) − F (0, 0) h−→0 h lı́m lı́m h3 v12 v2 v 2 v2 = lı́m 2 1 2 4 4 4 h−→0 v2 + h v1 + h v1 ) 2 h−→0 h(h2 v2 v12 . v2 Este lı́mite existe para todo vector de la forma (v1 , v2 ), donde v2 6= 0. Por otra parte, nótese que para vectores de la forma (v1 , 0), se tiene que F (v1 , 0) = 0, por lo que se puede definir la derivada direccional de H en cualquier dirección como 2 v 1 v2 Dv H(0, 0) = 0 si v2 6= 0 si v2 = 0 Por otro lado, nótese que esta función no es diferenciable, ya que ni siquiera es continua (considere las trayectorias y = x2 y y = 0). Este ejemplo muestra que puede suceder que las derivadas direccionales existan en cualquier dirección, pero la función no sea diferenciable. El recı́proco se cumple en general. Teorema 4.2.6 Ses F : A ⊂ Rn −→ R una función diferenciable en t0 ∈ A. Entonces la derivada direccional de F en t0 para cualquier vector v ∈ Rn existe y Dv F (t0 ) = DF (t0 ) · v Demostración. Sea la función G : R −→ Rn , dada por G(h) = t0 + hv, 111 4. Diferenciación. y considérese la función H = F ◦ G. Entonces, H(h) = F (t0 + hv), de donde se sigue que Dv f (t0 ) = H 0 (0). Por la regla de la cadena, se sigue que H 0 (0) = d dG (F ◦ G)(0) = (0) · DF (G(0)) dt dt = v · DF (t0 ) Es importante hacer notar que la máxima razón de cambio de F se encuentra en la dirección del vector DF (t0 ) y esta máxima razón es la longitud de este vector. Esto se sigue ya que el producto escalar de dos vectores alcanza su valor máximo cuando éstos están en la misma dirección. El siguiente resultado es un teorema de valor medio para derivadas direccionales. Teorema 4.2.7 (DEL VALOR MEDIO III) Sea F : A ⊆ Rn −→ R. Supóngase que A contiene el segmento de recta que va de t0 a t0 + hv, donde kvk = 1 y supóngase que Dv F (t0 ) existe para todo t ∈ A. Entonces existe un valor ξ0 ∈ (0, 1) tal que F (t0 + hv) − F (t0 ) = hDv F (t0 + ξ0 h v). Demostración. Considérese la función f (x) = F (t0 + xv), donde x ∈ [0, h]. Luego por la definición de derivada direccional se sigue que f 0 (x) = Dv F (t0 + xv). Ası́, f es continua en [0, h] y diferenciable en (0, h), por lo que aplicando el teorema del valor medio para funciones reales de variable real, se tiene que f (h) − f (0) = hf 0 (ξh) para alguna ξ ∈ (0, 1). Por lo tanto F (t0 + xv) − F (t0 ) = hDv F (t0 + ξ hv) Ahora, en la definición de derivada direccional podemos considerar el vector unitario que tiene un uno en la i-ésima entrada y ceros en las demás, es decir, uno de los vectores de la base canónica. Cuando tomamos la derivada direccional en la dirección del k-ésimo elemento de la base canónica, la llamaremos derivada ∂F parcial de F con respecto a la k-ésima coordenada y la denotaremos por ∂x k ∂F ó Fxk . Ası́ la función ∂xk está dada por 112 4.2. Funciones escalares de variable vectorial ∂F F (x1 , ..., xk−1 , xk + h, xk+1 , ...., xn ) − F (x1 , ..., xn ) (x) = lı́m , h−→0 ∂xk h cuyo dominio es el conjunto de puntos para los que este lı́mite existe. Para calcular las derivadas parciales de una función F , podemos emplear los métodos desarrollados para las derivadas direccionales, o bien, como el valor de la derivada parcial depende solamente de los valores de F en puntos sobre la recta paralela al eje Xk que pasa por el punto x, podemos considerar la función f (x) = F (x1 , ..., xk−1 , x, xk+1 , ...., xn ), de donde se sigue que f 0 (x) = ∂F , ∂xk es decir, tomamos las entradas xi , i 6= j como constantes. Ejemplos a) Sea F (x1 , x2 ) = x21 + x22 . Definimos f (x) = x2 + x22 y g(y) = x21 + y 2 , de donde se sigue que ∂F (x1 , x2 ) = f 0 (x1 ) = 2x1 ∂x1 y ∂F (x1 , x2 ) = g 0 (x2 ) = 2x2 . ∂x2 b) Considérese G(x, y) = sin xy. Tomando a y como constante, se tiene que ∂G = y cos xy. ∂x Análogamente, se obtiene que ∂G = x cos xy ∂y Las derivadas parciales proveen una forma sencilla para demostrar que una función es diferenciable. Ya hemos visto que la existencia de las derivadas parciales no es suficiente para garantizar la diferenciabilidad de una función. El siguiente resultado establece que la continuidad de las derivadas parciales es la pieza faltante. Teorema 4.2.8 Sea F : A ⊆ Rn −→ R una función cuyas derivadas parciales existen y son continuas sobre A, un conjunto abierto de Rn . Entonces F es diferenciable sobre A. 113 4. Diferenciación. Demostración. Sean t0 ∈ A y r > 0. Considérese h ∈ Br (0). Por el Teorema 4.2.7, si t0 = (t1 , ...., tn ) y h = (h1 , ..., hn ) se tiene que F (t0 + h) − F (t0 ) = F (t1 + h1 , ....., tn + hn ) − F (t1 , ...., tn ) = F (t1 + h1 , ....., tn + hn ) − F (t1 , t2 + h2 , ...., tn + hn ) + F (t1 , t2 + h2 , ....., tn + hn ) − F (t1 , t2 , t3 + h3 , ...., tn + hn ) + F (t1 , t2 , t3 + h3 , ....., tn + hn ) − F (t1 , t2 , t3 , t4 + h4 , ..., tn + hn ) .. . F (t1 , ..., tn−1 , tn + hn ) − F (t1 , ..., tn ) = h1 + h2 ∂F (t1 + θ1 h1 + t2 + h2 , ...., tn + hn ) ∂x1 ∂F (t1 , t2 + θ2 h2 , t3 + h3 , ...., tn + hn ) ∂x2 +... + hn Como ∂F ∂xi , ∂F (t1 , ...., tn−1 , tn + θn hn ) ∂xn i ∈ {1, ...., n}, son funciones continuas, se tiene que ∂F ∂F (t1 , ..., ti−1 , ti + θi hi , ti+1 + hi+1 , ..., tn + hn ) = (t1 , ..., tn ) + ϕi h (t0 ), ∂xi ∂xi donde lı́m ϕi h (t0 ) = 0. h−→0 Ası́ F (t0 + h) − F (t0 ) = ∂F ∂F (t0 ), ..., (t0 ) · h + ϕh (t0 ) · h, ∂x1 ∂xn donde ϕh (t0 ) = (ϕ1 h (t0 ), ..., ϕn h (t0 )), por lo que se concluye que F es diferenciable y más aún ∂F ∂F DF (t0 ) = (t0 ), ...., (t0 ) x1 ∂xn Si F tiene derivadas parciales continuas, al vector derivada en t0 lo denotaremos por ∇ F (t0 ) y lo llamaremos vector gradiente de F en t0 . Si al vector 114 4.2. Funciones escalares de variable vectorial h lo denotamos por dt, obtenemos la siguiente notación (más sugerente) para la diferencial de F dF (t0 ) = D F (t0 ) · dt = ∇ F (t0 ) · dt = n X ∂F (t0 ) dxi . ∂xi i=1 Por el Teorema 4.2.6, se sigue que la derivada direccional de F en la dirección de un vector unitario v, si F es diferenciable, está dada por Dv F (t0 ) = ∇ F (t0 ) · v Ejemplos a) Sea F (x, y, z) = exy + sin z − xyz. Nótese que ∂F = xexy − xz ∂y ∂F = yexy − yz, ∂x y ∂F = cos z − xy ∂z son funciones continuas, por lo que la función es diferenciable y D F = ∇F. Más aún, la diferencial de F tiene la forma dF = ∂F ∂F ∂F dx + dy + dz ∂x ∂y ∂z = (yexy − yz)dx + (xexy − xz)dy + (cos z − xy)dz b) Como DF (t0 ) es el vector en la dirección de la máxima razón de cambio de F , donde ésta es la longitud de DF (t0 ), se sigue que el gradiente es el vector que tiene la dirección y la magnitud de la razón de cambio máxima de la función. Ası́, si F (x, y, z) = sin xy + x2 z, en el punto (2, 3, 1), la razón de cambio máxima está en la dirección del vector gradiente en el punto (2, 3, 1). Esto es ∇ F(2,3,1) = (y cos xy + 2xz, x cos xy, x2 )|(2,3,1) = (3 cos 6 + 4, 2 cos 6, 4) = u 115 4. Diferenciación. La magnitud de la razón de cambio está dada por kuk. ∂F Como la derivada parcial ∂x es una función de Rn , se pueden tomar k ∂F con respecto a la i-ésima coordenada, la cual las derivadas parciales de ∂x k denotaremos por ∂2F ∂xi ∂xk De esta forma, se pueden tomar derivadas parciales de órdenes más altos. En general, ∂2F ∂2F (t0 ) 6= (t0 ), i 6= k. ∂xi ∂xk ∂xk ∂xi Para convencerse de esto, tomése la función x2 − y 2 xy 2 x + y2 Dv F(x, y) = 0 Luego si (x, y) 6= (0, 0) si (x, y) = (0, 0) ∂2F ∂2F (0, 0) 6= (0, 0) (Ejercicio) ∂x∂y ∂y∂x 2 ∂ F Lema 4.2.9 Sea F : A ⊆ R2 −→ R una función. Si ∂y∂x existe en el interior de un rectángulo R con vértices en los puntos (x0 , y0 ), (x0 + h, y0 ), (x0 + h, y0 + k) y (x0 , y0 + k), entonces [F (x0 + h, y0 + k) − F (x0 + h, y0 )] − [F (x0 , y0 + k) − F (x0 , y0 )] = hk ∂2F (x, y) ∂y∂x para algún punto (x, y) ∈ R Demostración. Considérese la función g(x) = F (x, y0 + k) − F (x, y). Luego g 0 (x) = ∂F ∂F (x, y0 + k) − (x, y) ∂x ∂x existe sobre R. De esta forma, por el teorema del valor medio para funciones reales de variable real se sigue que [F (x0 + h, y0 + k) − F (x0 + h, y0 )] − [F (x0 , y0 + k) − F (x0 , y0 )] = g(x0 + h) − g(x0 ) = hg 0 (x) = h ∂F ∂F (x, y0 + k) − (x, y0 ), ∂x ∂x 116 4.2. Funciones escalares de variable vectorial para algún x ∈ (x0 , x0 + h). Nuevamente, por el teorema del valor medio aplicado a ∂F ∂x , existe y ∈ (y0 , y0 + k) tal que ∂F ∂F ∂2F h (x, y0 + k) − (x, y0 ) = hk (x, y) ∂x ∂x ∂y∂x El siguiente resultado establece la igualdad de derivadas parciales mixtas de un función de R2 a R. Teorema 4.2.10 Sean F : A ⊆ R2 −→ R, r > 0 y t0 ∈ A. Si ∂2F y ∂y∂x ∂F ∂2F ∂2F existen en Br (t0 ) y es continua en t0 , entonces existe en ∂y ∂x∂y ∂x∂y t0 y ∂F ∂2F = . ∂x∂y ∂y∂x Demostración. Por definición se tiene que ∂2F (t0 ) ∂x∂y = = ∂F ∂F (t0 + he1 ) − (t0 ) ∂y ∂y lı́m h−→0 h lı́m lı́m h−→0 k−→0 [F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )] , hk si este lı́mite existe, donde u = (h, k). Denotaremos por T (h, k) a la función [F (t0 + u) − F (t0 + he1 )] − [F (t0 + ke2 ) − F (t0 )] hk ∂F existe en Br (t0 ), tomando 0 < |h| < r, lı́m T (h, k) existe. Sea k−→0 ∂y ∂2F g(h) = lı́m T (h, k). Como es continua en t0 , dada ε > 0, existe δ > 0, k−→0 ∂y∂x tal que si δ ≤ r y kt − t0 k < δ, entonces como ∂2F ∂2F ε (t) − (t0 ) < ∂y∂x ∂y∂x 2 Sea √ h ∈ R tal que 0 < |h| < δ y considérese k 6= 0 de tal forma que h2 + k 2 < r y |g(h) − T (h, k)| < . 2 ∂2F Por el lema 4.2.9, existe t ∈ R tal que T (h, k) = (t). Nótese que ∂y∂x t ∈ Bδ (t0 ), 117 4. Diferenciación. de donde se sigue que g(h) − ∂2F ∂2F ∂2F (t0 ) ≤ |g(h) − T (h, k)| + (t) − (t0 ) ∂y∂x ∂y∂x ∂y∂x < Por lo tanto, lı́m g(h) = h−→0 ε ε + = ε 2 2 ∂2F (t0 ), como se querı́a probar. ∂y∂x Definición 47 Se dice que una función F es de clase C n sobre A ⊆ R2 abierto, si todas las derivadas parciales de orden n de F continuas sobre A. Como siempre el Teorema 4.2.10 y la definición anterior se pueden generalizar para funciones F : Rn −→ R. Ahora, en general, para una función diferenciable, F : Rn −→ R, la derivada direccional en la dirección de un vector unitario u = (u1 , ..., un ) está dada por n X ∂F Du F (x1 , ..., xn ) = ∇ F (x1 , ..., xn ) · u = ui . ∂ xi i=1 Si ∇ F (x1 , ..., xn ) · u es una función diferenciable, la segunda derivada direccional tendrá la forma Du2 F (x1 , ..., xn ) = ∇ (∇ F (x1 , ..., xn ) · u) · u = Du = n X ∂F ui ∂ xi i=1 n X n X i=1 j=1 ! ∂2 F ui uj . ∂ xi ∂ xj Nótese que está expresión se puede escribir en forma matricial. Esto es ∂2 F ∂2 F ∂2 F · · · 2 ∂ x2 ∂ x1 ∂ xn ∂ x1 ∂ x1 ∂2 F 2 2 ∂ F ∂ F · · · ∂ xn ∂ x2 ∂ x22 ∂ x1 ∂ x2 Du2 F (x1 , ..., xn ) = (u1 , ..., un ) .. .. .. .. . . . . ∂2 F ∂2 F ∂2 F · · · ∂ x1 ∂ xn ∂ x2 ∂ xn ∂ x2 n u1 u2 .. . un 118 4.3. Aplicaciones de la diferencial y la derivada parcial Por otro lado, considérese F : Rn −→ R una función diferenciable. Su diferencial total está dada por la expresión dF = n X ∂F dxi . ∂ xi i=1 Si se considera a d F como una función diferenciable, entonces se puede calcular su diferencial total. Ası́, se tiene la segunda diferencial de la función F, a saber d (d F) n X ∂ dF dxj = d (F) = ∂ xj j=1 2 = = n X n X j=1 i=1 ∂2 F dxi ∂ xj ∂ xi ! dxj n X ∂2 F X ∂2 F 2 . (dx ) + 2 i ∂ x2i ∂ xj ∂ xi i=1 i 6= j De forma similar, se pueden calcular diferenciales de orden superior. 4.3. Aplicaciones de la diferencial y la derivada parcial Ya hemos visto que, al igual que en el caso de funciones escalares de variable real, la derivada direccional es la razón de cambio de una función en una dirección determinada. En el caso de las derivadas parciales, éstas representan la razón de cambio en una dirección paralela a uno de los ejes. Las aplicaciones de las derivadas parciales son diversas. En esta sección, nos enfocaremos en su aplicación a la geometrı́a de superficies y algunas aplicaciones sencillas en la fı́sica. 4.3.1. Plano tangente y recta normal a una superficie Considérese la superficie definida por la ecuación z2 = x2 + y 2 + 1. 4 Se desea encontrar un vector normal a la superficie en el punto (−2, 3). Nótese que la expresión anterior es equivalente a la ecuación r x2 z = + y 2 + 1. 4 Calculando las derivadas parciales de esta función y al evaluar en el punto dado, se obtienen las pendientes de dos rectas tangentes a la superficie, las que a su vez 119 4. Diferenciación. definen dos direcciones que son tangentes a la superficie. El producto vectorial de estas direcciones dará como resultado un vector que será perpendicular a las direcciones y, por tanto, a la superficie. Ası́, las derivadas parciales tienen la forma ∂z x (x, y) = q , ∂x x2 2 + 1 4 + y 4 ∂z y (x, y) = q , ∂y x2 2 + 1 + y 4 evaluando en el punto (−2, 3) obtenemos ∂z −1 (−2, 3) = √ , ∂x 2 11 ∂z 3 (−2, 3) = √ , ∂y 11 por lo que las direcciones tangentes a la superficiequedan determinadas por los 1 3 √ √ vectores v1 = 1, 0, − 2 11 , en y = 3 y v2 = 0, 1, 11 , en x = −2. Ası́, v1 × v2 = i j k 1 0 − 2 √111 0 1 √3 11 = 1 3 − √ , −√ , 1 . 2 11 11 q x2 4 + y 2 + 1, √ calculamos sus derivadas parciales y evaluamos en el punto (−2, 3, 11), se tiene que Por otra parte, si consideramos la función F (x, y, z) = z − ∂F (x, y, z) ∂x √ x ∂F 1 = − q (−2, 3, 11) = − √ ⇒ ∂ x x2 2 11 2 4 4 + y + 1 ∂F (x, y, z) ∂y = y q x2 4 ∂F (x, y, z) ∂x Luego, = + y2 + 1 ⇒ √ ∂F 3 (−2, 3, 11) = √ ∂y 11 1. √ √ √ ∂F ∂F ∂F (−2, 3, 11), (−2, 3, 11), (−2, 3, 11) = v1 × v2 . ∂x ∂y ∂z Ası́, surge la siguiente pregunta: ¿Se cumple, en general, que el vector ∇ F es un vector normal a la superficie F (x, y, z) = 0? La respuesta es afirmativa. Primero mostramos el resultado para el caso de una función de la forma F (x, y, z) = z − f (x, y). 120 4.3. Aplicaciones de la diferencial y la derivada parcial Proposición 4.3.1 Sea z = f (x, y) una función continua con primeras derivadas parciales continuas en una región R del plano XY . Si S es la superficie descrita por la función f , entonces un vector normal a la superficie en el punto (x0 , y0 , z0 ) ∈ S es ∇ F (x0 , y0 , z0 ), donde F (x, y, z) = z − f (x, y). Demostración. La derivada parcial de f (x, y) con respecto a x en el punto (x0 , y0 ) representa la pendiente de la recta tangente a la curva que resulta de la intersección entre la superficie S y el plano y = y0 . Ası́, la ecuación de la recta tiene la forma z − z0 = ∂∂ xz (x0 , y0 ) (x − x0 ) L1 = y = y0 . Por tanto, la dirección de L1 es ∂z v1 = 1, 0, (x0 , y0 ) . ∂x De manera análoga, la ecuación de la recta tangente a la curva que resulta de la intersección entre la superficie S y el plano x = x0 es z − z0 = ∂∂ yz (x0 , y0 ) (y − y0 ) L2 = x = x0 , de donde se sigue que la dirección de L2 es ∂z v2 = 0, 1, (x0 , y0 ) . ∂y Como los vectores v1 y v2 son tangentes a la superficie en el punto (x0 , y0 , z0 ), entonces un vector normal a la superficie se puede obtener haciendo el producto vectorial v1 × v2 . Ası́ N = v1 × v2 = = i j k 1 0 ∂z ∂x (x0 , y0 ) 0 1 ∂z ∂y (x0 , y0 ) ∂z ∂z − (x0 , y0 ), − (x0 , y0 ), 1 = ∇ F (x0 , y0 , z0 ). ∂x ∂y Ahora, para una superficie S descrita por la ecuación z = f (x, y) se pretende obtener las ecuaciones del plano tangente y la recta normal en el punto 121 4. Diferenciación. P0 = (x0 , y0 , z0 ). Se sabe que la ecuación de un plano que pasa por v0 y es ortogonal a un vector N está dada por N · (v − v0 ) = 0. Como N = ∇ F (x0 , y0 , z0 ) es normal a S en el punto P0 , entonces el plano tangente a S en el punto P0 queda determinado por la expresión ∇ F (x0 , y0 , z0 ) · (v − v0 ) = − ∂z ∂z (x0 , y0 ) (x − x0 ) − (x0 , y0 ) (y − y0 ) + (z − z0 ) = 0. ∂x ∂y ∇ F (P0 ) P0 G′ (P0 ) Figura 4.6: Plano tangente a una superficie Por otra parte, la ecuación de una recta en el espacio se puede calcular dando un punto sobre la recta y la dirección de ésta última. Ası́, la ecuación de la recta normal, en su forma vectorial, es LN = {P0 + t ∇ F (x0 , y0 , z0 ) | t ∈ R}. De esta forma, la ecuación del plano tangente a la superficie z2 = es x2 + y2 + 1 4 √ 1 3 − √ (x + 2) + √ (y − 3) + (z − 11) = 0 2 11 11 y la recta normal queda descrita por la expresión √ 1 3 (−2, 3, 11) + t − √ , √ , 1 . 2 11 11 122 4.3. Aplicaciones de la diferencial y la derivada parcial Ahora, considérese una función F : R3 −→ R diferenciable sobre un conjunto abierto A y S la superficie dada por S = {(x, y, z) ∈ A | F (x, y, z) = r}. Sean P0 (x0 , y0 , z0 ) ∈ S y P = G (t), t ∈ (a, b) la ecuación de una curva C sobre S que pasa por P0 . De esta forma, P0 = G (t0 ), para alguna t0 ∈ (a, b). Por otra parte, como C está contenida en S, se sigue que, para toda t ∈ (a, b), F (G (t)) = c. Si G es diferenciable en (a, b), entonces F ◦ G es diferenciable en (a, b) y ∇ F (G (t)) · G0 (t) = 0, en particular, si t = t0 ∇ F (P0 ) · G0 (t0 ) = 0. Ası́, hemos demostrado que, en P0 , el gradiente de F es ortogonal al vector tangente a cualquier curva que se encuentre sobre la superficie S y que pase por P0 . Por tanto, si ∇ F (P0 ) 6= 0, las tangentes de todas las curvas sobre S en el punto P0 se encuentran en el mismo plano. En consecuencia, el plano tangente a S en el punto P0 tiene la ecuación ∇ F (P0 ) · (P − P0 ) = 0, donde P = (x, y, z) (véase la Figura 4.6). Ejemplo. Sea S la superficie determinada por la ecuación y2 x2 + − z 2 = 1. 9 4 Calcularemos el plano tangente a S en el punto 2, 2, 32 . Para esto, consideramos la función x2 y2 F (x, y, z) = + − z2, 9 4 y la cual tiene vector gradiente 2x 9 , 2 , −2z , de donde se tiene que 2 4 4 ∇ F 2, 2, = , 1, − . 3 9 3 Por tanto, la ecuación del plano tangente es 4 2 4 4 4 , 1, − · x − 2, y − 2, z − = x + y − z − 2 = 0. 9 3 3 9 3 En otro contexto, en la práctica, el experimentador comete errores de observación que se ven reflejados en los datos que ha capturado. El error absoluto, 123 4. Diferenciación. establece la diferencia, en valor absoluto, entre el incremento de una función F y el valor que se obtiene por medio de la diferencial. Es decir, se tiene una expresión de la forma Ea = |(F (x + h) − F (x)) − dF |. El error relativo se obtiene calculando el producto de 100 por el cociente de el error absoluto entre el incremento de la función, a saber Ea Er = 100 . F (x + h) − F (x) Sin embargo, en la mayor parte de los casos, no se conoce el valor del incremento exacto de F , por lo que se hace necesario redefinir el error relativo como er = 100 dF F Ejemplos. 1. Supóngase que se quiere calcular el volumen aproximado del material necesario para fabricar un vaso cilı́ndrico cuyo radio interior es de 7 cm, tiene una altura interior de 13 cm y con espesor de fondo y paredes de 0,3 cm. Nótese que el volumen exacto del material, es la diferencia entre el volumen exterior y el volumen interior. Esto es V (x + h) − V (x) = π ((x + h1 )2 (y + h2 ) − x2 y) = π ((7,3)2 (13,3) − (7)2 (13)) = π(71,757) cm3 . Ahora, para calcular el volumen en forma aproximada, se requiere de la diferencial total de la función volumen. Es decir dV = ∂V ∂V dx + dy ∂x ∂y = π (2xy dx + x2 dy) = π (2 (7)(13)(0,3) + (7)2 (0,3)) ≈ 217,7123 cm3 . De esta forma, los errores absoluto y relativo que se obtienen al usar la diferencial en lugar del incremento exacto son Ea = |π(71,757) − 217,7123| ≈ 7,7189 y Er = 100 7,7189 225,4312 ≈ 3,42 124 4.3. Aplicaciones de la diferencial y la derivada parcial 2. Se desea calcular el valor aproximado de 3,254,13 . Para resolver este problema, consideramos la función f (x, y) = xy , tomando los valores x = 3, y = 4, dx = 0,25 y dy = 0,13. Ahora, f (3, 4) = 81. A este valor se le sumará el valor de la diferencial como aproximación del incremento. Luego df = ∂f ∂f dx + dy ∂x ∂y = y xy − 1 dx + xy ln x dy 4 (3)3 (0,25) + (3)4 ln (3) (0,13) ≈ 38,568387. = Por tanto, 3,254,13 ≈ 119,568387. 3. Un estudiante de la facultad de ciencias está apurado (caso totalmente hipotético) porque quiere calcular el valor de sin 35o cos 69o y no cuenta con calculadora. En este caso, considera la función f (x, y) = sin x cos y π y tomando los valores x = 30o = π6 , y = 60o = π3 , dx = 5o = 36 π dy = 9o = 20 . Luego, √ π π 1 3π f , y df = cos x cos y dx − sin x sin y dy = − , = 6 3 4 180 de donde se sigue que sin 35o cos 69o ≈ 4.3.2. √ 45 − 3 π . 180 Diferenciales exactas Si se tiene una expresión de la forma M (x, y) dx + N (x, y) dy el lector podrı́ preguntarse si existirá una función G : R2 −→ R tal que d G = M (x, y) dx + N (x, y) dy, es decir, ∇ G (x, y) = (M (x, y), n (x, y)). La respuesta es que en general no siempre existe dicha función. En esta sección analizaremos las condiciones bajo las cuales dicha función existe y proporcionar un procedimiento para obtenerla. Definición 48 Se dice que la expresión M (x, y) dx + N (x, y) dy es una diferencial exacta sobre un conjunto abierto A ⊂ R2 , si existe una función G : R2 −→ R tal que ∇ G (x, y) = (M (x, y), N (x, y)) para todo punto (x, y) ∈ A. El siguiente resultado establece una condición necesaria y suficiente para que una forma diferencial sea exacta. En la prueba de este teorema utilizaremos un hecho muy conocido en la teorı́a de integración múltiple, el teorema de Fubini, cuya prueba omitimos pero se puede consultar en [8], pp. 322-324. Teorema 4.3.2 Sea F : R2 −→ R una función continua con dominio rectangular R = [a, b] × [c, d]. Entonces Z bZ d Z dZ b Z F (x, y) dy dx = F (x, y) dx dy = F (x, y) dA. a c c a R 125 4. Diferenciación. Teorema 4.3.3 Sean M, N : A ⊂ R2 −→ R funciones tales que tienen primeras derivadas parciales continuas en un rectángulo abierto R ⊂ R2 , con lados paralelos a los ejes. Entonces M (x, y) dx + N (x, y) dy es una diferencial ∂N exacta si y sólamente si ∂∂M y (x, y) = ∂ x (x, y) para toda (x, y) ∈ R. Demostración. Para mayor sencillez en la notación, escribiremos M y N sólamente. Supongamos que la diferencial es exacta, esto es, existe una función G : R2 −→ R tal que d G = M dx + N dy, luego ∂G = M ∂x y ∂G = N, ∂y ∂M ∂2 G = ∂y∂x ∂y y ∂2 G ∂N = , ∂ x∂ y ∂x de donde se sigue que como las derivadas parciales son continuas, aplicando el teorema se concluye que ∂M ∂N = . ∂y ∂x ∂N Por otra parte, si ∂∂M y = ∂ x en R, entonces, integrando de x0 a x y manteniendo constante a la variable y y aplicando el Teorema fundamental del cálculo, se tiene que Z x Z x ∂M ∂N (t, y) dt = (t, y) dt = N (x, y) − N (x0 , y). ∂ y x0 x0 ∂ t Dado que la región R es rectangular, ésta es convexa y, por tanto, la igualdad anterior se da para todo par de puntos dentro de R. Ahora, integrando con respecto a y de y0 a y, se tiene que Z y Z x Z y Z y ∂M (t, s) dt ds = N (x, s) ds − N (x0 , s) ds. y0 x0 ∂ s y0 y0 Aplicando el Teorema 4.3.2, se obtiene que Z y Z y Z xZ y ∂M (t, s) ds dt = N (x, s) ds − N (x0 , s) ds, y0 y0 x0 y0 ∂ s de donde se sigue, por el Teorema fundamental del cálculo, que Z x Z x Z y Z y M (t, y) dt − M (t, y0 ) dt = N (x, s) ds − N (x0 , s) ds. x0 x0 y0 y0 Por tanto, Z x G (x, y) = Z y M (t, y) dt + x0 Z y N (x0 , s) ds = y0 Z x N (x, s) ds + y0 M (t, y0 ) dt. x0 126 4.3. Aplicaciones de la diferencial y la derivada parcial Ası́, derivando con respecto a x los primeros dos términos y derivando con respecto a y los otros dos, se sigue el resultado. Este resultado se puede generalizar para regiones convexas o regiones simplemente conexas (cf. [4], capı́tulo 6). Más aún, se puede generalizar este resultado para expresiones de la forma n X Mi dxi . i=1 Diremos que esta forma diferencial es exacta si y sólo si se cumple que ∂ Mi ∂ Mj = ∂ xj ∂ xi Ejemplos. 1. Considérese la forma diferencial dada por x p y dx + p dy. x2 + y 2 x2 + y 2 Se afirma que es una forma exacta. En efecto, nótese que si x y M (x, y) = p y N (x, y) = p , 2 2 2 x +y x + y2 entonces xy ∂M ∂N = − , 3 = 2 2 ∂y ∂x 2 (x + y ) donde (x, y) 6= (0, 0). Ası́, integrando M con respecto a x se obtiene que Z p x p G (x, y) = dx = x2 + y 2 + ϕ (y). x2 + y 2 Derivando esta última expresión con respecto a y e igualando con la función N (x, y) se concluye que ϕ0 (y) = 0 y por tanto, p G = x2 + y 2 + c, donde c es una constante. 2. Tómese la expresión 2x cos y dx − x2 sin y + 2yz dy + y 2 dz. Si M1 (x, y, z) = 2x cos y, M2 (x, y, z) = − x2 sin y + 2yz y M3 (x, y, z) = y 2 , 127 4. Diferenciación. verificamos si esta forma diferencial es exacta. Nótese que ∂ M1 = ∂y −2x sin y = ∂ M2 ∂x ∂ M2 = ∂x 2y = ∂ M3 ∂y ∂ M1 ∂ M3 = 0 = . ∂x ∂z Luego, por el Teorema 4.3.3 en su versión generalizada, se sigue que es una diferencial exacta. Integrando M1 con respecto a x, obtenemos Z 2x cos y dx = x2 cos y + ϕ1 (y, z) = F (x, y, z). Derivando esta última expresión con respecto a y se sigue que −x2 sin y + ∂ ϕ1 = − x2 sin y + 2yz, ∂y de donde se concluye que ∂ ϕ1 = 2yz, ∂y por lo que, integrando con respecto a y se obtiene que ϕ (y, z) = y 2 z + ϕ2 (z). Ası́, F (x, y, z) = x2 cos y + y 2 z + ϕ2 (z). Finalmente, derivando esta última igualdad con respecto a z, tenemos que ϕ02 (z) = 0 y, por tanto F (x, y, z) = x2 cos y + y 2 z + c c = constante. 3. La diferencial dada por − x2 x y dx + 2 dy 2 +y x + y2 satisface que, si M (x, y) = − entonces x2 y x y N (x, y) = 2 , (x, y) 6= (0, 0), 2 +y x + y2 ∂M ∂N (x, y) = (x, y), ∂y ∂x para todo punto en el plano, salvo el origen. Sin embargo, no es una diferencial exacta, ya que al integrar las funciones M y N se obtiene la función multivaluada G (x, y) = arctan xy . Si se restringe el codominio al intervalo [0, 2π) para tener una función univaluada, la función tiene una discontinuidad sobre el eje X. Por tanto, no existe su gradiente y de esta forma se ha demostrado que la expresión M dx + N dy no determina una diferencial exacta. 128 4.4. Teorı́a básica de curvas 4. La forma diferencial x 3 (x2 + y 2 ) 2 dx + y 3 (x2 + y 2 ) 2 dy, donde (x, y) 6= (0, 0) es exacta (ejercicio). 4.4. Teorı́a básica de curvas Los puntos en plano se representan con paras ordenados de números reales (a, b) y en R3 se pueden representar como ternas de ordenadas reales. Al igual que en R2 , se eligen tres rectas perpendiculares que se corten en un punto del espacio. Para representar vectores en el espacio, es conveniente introducir tres vectores especiales. A saber i = e1 = (1, 0, 0), j = e2 = (0, 1, 0), y k = e3 = (0, 0, 1). A estos vectores se les conoce como base canónica de R3 . Luego, si a = (a1 , a2 , a3 ) ∈ R3 , se tiene que a = n X ai ei . i=1 Por otra parte, hasta el momento, hemos trabajado con curvas en donde una de las variables queda en función de las demás. Sin embargo, hay ocasiones en las que es más útil y cómodo pensar en los puntos de una curva en el plano (o en el espacio), dependiendo de un parámetro t, es decir, pensar en una curva como la trayectoria que describe un punto al tiempo hipotético t. Si las coordenadas de un punto sobre la curva C en R3 son (x1 , x2 , x3 ), entonces se pueden expresar como funciones de un parámetro t ∈ [a, b], esto es x1 = x1 (t), x2 = x2 (t), x3 = x3 (t), t ∈ [a, b]. Ejemplos. a) Queremos encontrar la ecuación de una recta L que pasa por el extremo de un vector a y tiene la dirección del vector v. Si t ∈ R, los puntos de la forma t v son múltiplos de v y, por tanto, recorren todos los puntos por el origen y tiene la dirección v. Como cada punto de L es el final de la diagonal del paralelogramo con lados a y t v, para alguna t, entonces L = {u ∈ R3 | u = a + t v}, 129 4. Diferenciación. es decir, la recta L se puede expresar mediante la ecuación (paramétrica) L = a + tv b) Las ecuaciones x = r cos θ, θ ∈ [0, 2π], y = r sin θ, representan los puntos sobre una circunferencia. Esto se sigue, ya que al dejar fijo el valor r y variar el ángulo θ, obtenemos el movimiento de una partı́cula que se encuentra a una distancia constante de un punto de la circunferencia. y r θ x Figura 4.7: Circunferencia c) Considérese las ecuaciones x (t) = a cos t, y (t) = b sin t t ∈ [0, 2π] Estas ecuaciones representan los puntos sobre una elipse con eje mayor a y eje menor b (a > b), con centro en el origen, θ denota el ángulo en el centro de la elipse que se asocia al punto de la circunferencia circunscrita que se encuentra verticalmente por encima o por debajo del punto P = (a cos t, b sin t). P t Figura 4.8: Elipse d) Las ecuaciones x (t) = a cos t, y (t) = a sin t z (t) = bt t ∈ R 130 4.4. Teorı́a básica de curvas donde a, b son constantes, describen una curva que yace en el cilindro x2 + y 2 = a2 y se enrolla alrededor de éste de tal forma que cuando t toma el valor 2 k π, k ∈ Z, las coordenadas x y y regresan a su valor original mientras que z incrementa a un valor 2 π b (véase la Figura 4.9). a t Figura 4.9: Hélice enrollada en un cilindro Algunas veces, puede resultar conveniente tomar como parámetro t a la variable x y describir la curva mediante las funciones x = t, y = f (t). Por ejemplo, si se tiene la ecuación de una parábola de la forma y = x2 , podemos tomar las ecuaciones de la forma x(t) = t, y(t) = t2 . 4.4.1. Longitud de arco Ahora, supóngase que una curva C está descrita por las ecuaciones paramétricas (x(t), y(t), z(t)), t ∈ [a, b]. Supóngase que C es suave en el sentido de que x0 (t), y 0 (t) y z 0 (t) son continuas y no se anulan simultáneamente. A los puntos que cumplan esta última condición los llamaremos puntos regulares y a los puntos donde todas las derivadas se anulan los llamaremos puntos singulares. Esta condición, asegura que C no cambia repentinamente de dirección. Tomamos una partición del intervalo [a, b] en n subintervalos de la forma (ti + 1 , ti ), i ∈ {1, ..., n}; de esta forma los puntos cuyas coordenadas son xi = x (ti ), yi = y (ti ), z − i = z (ti ), caen sobre C y forman un polı́gono que aproxima a C y que tiene por vértice a los puntos Pi , i ∈ {1, ..., n}, (véase la Figura 4.10). Ahora, nótese que la longitud l de C se puede aproximar por la longitud de la poligonal y esta aproximación mejora conforme hacemos tender n a infinito. Obsérvese que la distancia de Pi − 1 a Pi está dada por p d (Pi − 1 , Pi ) = (xi − xi − 1 )2 + (yi − yi − 1 )2 + (zi − zi − 1 )2 . 131 4. Diferenciación. P1 P2 P0 Pn − 1 Pn Figura 4.10: Aproximación de una curva mediante una poligonal Como x (t), y (t) y z (t) son diferenciables, se tiene que x0 (t) ≈ Luego xi − xi − 1 ti − ti − 1 y 0 (t) ≈ yi − yi − 1 ti − ti − 1 z 0 (t) ≈ zi − zi − 1 . ti − ti − 1 p d (Pi − 1 , Pi ) ≈ (ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 . Por tanto l (C) ≈ n X i=1 p (ti − ti − 1 ) (x0 (ti ))2 + (y 0 (ti ))2 + (z 0 (ti ))2 , ésta útlima es una suma de Riemann para la función p (x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 , por lo que tomando el lı́mite cuando n −→ ∞, se tiene que Z bp l (C) = (x0 (t))2 + (y 0 (t))2 + (z 0 (t))2 dt. a Esta fórmula se conoce como longitud de arcoa de la curva C. Nótese que si F : R −→ R3 es la función F (t) = (x (t), y (t), z (t)), entonces Z b Z bp l (C) = ||F0 (t)|| dt = F0 (t) · F0 (t) dt. a a 132 4.4. Teorı́a básica de curvas Ejemplo. Sea C una curva descrita por la función F (t) = (et sin t, et cos t), donde t ∈ [0, 2 π]. Para calcular la longitud de esta curva consideramos x (t) = et sin t ⇒ x0 (t) = et (sin t + cos t) y (t) = et cos t ⇒ y 0 (t) = et (cos t − sin t), de donde se sigue que (x0 (t))2 + (y 0 (t))2 = e2t ((sin2 t + 2 cos t sin t + cos2 t) + (sin2 t − 2 cos t sin t + cos2 t)) = 2 e2t . Luego Z 0 2π ||F0 (t)|| dt = Z 0 2π √ 2 et dt = √ 2 (e2 π − 1). En general hay una cantidad infinita de representaciones paramétricas. El siguiente teorema establece la relación que hay entre las representaciones paramétricas. Teorema 4.4.1 Sea C una curva suave representada por las ecuaciones paramétricas x(t), y(t), z(t), t ∈ [a, b]. Esta curva puede ser reparametrizada en términos de un parámetro u ∈ [c, d] mediante una expresión de la forma t = f (u), si f : R −→ R satisface que 1. a = f (c) y b = f (d). 2. f 0 (u) > 0 para toda u ∈ [c, d] (ó f 0 (u) < 0 para toda u ∈ [c, d]). 3. f ∈ C 1 ([c, d]). Demostración. El nuevo parámetro u que describirá a la curva C debe ser tal que a cada valor de u le corresponda uno y solo uno de t . Ası́, t = f (u) debe ser una función creciente o decreciente, de donde se sigue que f debe tener derivada positiva o negativa respectivamente. Además, como C es una curva 133 4. Diferenciación. suave, las funciones x0 (t), y 0 (t) y z 0 (t) deben ser continuas. También dado que dx (f (u)) = du dx dt dt du = x0 (t) f 0 (u) dy (f (u)) = du dy dt dt du = y 0 (t) f 0 (u) dz (f (u)) = du dz dt dt du = z 0 (t) f 0 (u), dx dy dz y como f 0 (u) es continua, entonces du , du y du son funciones continuas en [c, d], de donde se sigue que la curva parametrizada por u es una curva suave. Por otro lado, si en la expresión para la longitud de arco, el extremo final de la curva se deja variable, entonces se obtiene la longitud de arco en función del parámetro t0 . A saber Z t s (t) = ||F0 (u)|| du. a Ası́, s = s (t) define un nuevo parámetro para la curva C, denominado parámetro de longitud de arco. En efecto, s satisface las hipótesis del Teorema 4.2.7, ya que Z t d ds = ||F0 (u)|| du = ||F0 (t)|| > 0, dt dt a de donde se sigue que existe una relaci’on biunı́voca entre s y t. También, si C es una curva suave, ||F0 (t)|| es continua en [a, b]. Ejemplo. Considérese la hélice circular con ecuaciones paramétricas dadas por F (t) = (a cos t, a sin t, bt), t > 0. Luego t Z s (t) = 0 t Z = ||F0 (u)|| du p a2 sin2 u + a2 cos2 u + b2 du 0 = p de donde se sigue que t = la longitud de arco serı́a F (s) = a cos √ a2 + b2 t, √ s . a2 + b2 s a 2 + b2 Luego, la parametrización con respecto a , a sin √ s a2 + b2 , √ bs a2 + b2 134 4.4. Teorı́a básica de curvas Ya hemos visto con anterioridad que F0 (t) representa un vector tangente a la curva C en todos los puntos regulares. Entonces, un vector unitario tangente a la curva en un punto regular queda descrito por la expresión T = dF dt dF dt = dF dt ds dt = dF , ds esto es, si se tiene la parametrización con respecto a la longitud de arco, el vector tangente a la curva en un punto s0 está dado por la derivada de la parametización evaluada en s0 . Proposición 4.4.2 a) Un vector u (t) tiene magnitud constante si y sólo si u (t) · u0 (t) = 0. b) Un vector u (t) es siempre paralelo a una dirección dada si y sólo si u (t) × u0 (t) = 0. Demostración. a) Sea u (t) un vector de magnitud constante c. Entonces ||u (t)||2 = u (t) · u (t) = c2 , luego u (t) · u (t) = 2 u0 (t) · u (t) = 0, dt por lo que se concluye que u0 (t) · u (t) = 0. Por otro lado, si ||u (t)|| no es constante, por la parte anterior u0 (t) · u (t) 6= 0, por lo que se sigue a) b) Si u (t) tiene dirección constante, digamos v, entonces u (t) = ||u (t)|| v, ası́ u0 (t) = d ||u (t)|| v. dt Por lo tanto 0 u (t) × u (t) = (||u (t)|| v) × = ||u (t)|| d ||u (t)|| v dt d ||u (t)|| (v × v) = 0. dt Por otra parte, si u (t) no tiene dirección constante, entonces u0 (t) = d ||u (t)|| d v (t) v (t) + ||u (t)|| , dt dt 135 4. Diferenciación. de donde se obtiene que " d v (t) d ||u (t)|| u (t) × u (t) = ||u (t)|| v (t) × v (t) + ||u (t)|| dt dt " # d v (t) = ||u (t)||2 v (t) × . dt # 0 Como v(t) es de magnitud constante (podemos tomarlo unitario), entonces v(t) y resultado. d v (t) dt son ortoganales, por lo que aplicando a) se sigue el 4.4.2. Aparato de Frenet-Serret Ahora, dada una curva con ecuaciones paramétricas x(t), y(t) y z(t), nos preguntamos ¿Cómo obtener el plano normal a la curva C en un punto P ? Esto es, se quiere obtener el plano perpendicular al vector T. Para resolver este problema, consideremos un punto Q arbitrario en el plano normal, con coordenadas (x, y, z). Sea P0 = (x0 , y0 , z0 ) ∈ C. Luego, el vector Q − P0 pertenece al plano (véase la Figura 4.11). P0 T Q Figura 4.11: Plano normal 136 4.4. Teorı́a básica de curvas Como T es normal al plano, se tiene que (Q − P0 ) · T = 0. Si se toma la parametrización con respecto a la longitud de arco, (si no, normalizamos el vector F0 (t)) obtenemos la ecuación para el plano normal, dada por x0 (s) (x − x0 ) + y 0 (s) (y − y0 ) + z 0 (s) (z − z0 ) = 0. Ahora, como T tiene magnitud constante (es unitario) por la Proposición 4.4.2 se sigue que dT T· = 0. ds Esto nos permite definir un vector unitario N que es perpendicular a T y por lo tanto, perpendicular a C (incluso, N es un vector que yace en el plano normal). A este vector se le conoce como normal y está dado por la expresión T = κN (4.4) A la expresión (4.4) se le conoce como primera fórmula de Frenet- Serret y al escalar κ = ddsT se le llama curvatura de C. A su recı́proco de le denomina radio de curvatura. Finalmente, al vector unitario B = T×N (4.5) se le llama vector binormal que, debido a las propiedades del producto vectorial, es perpendicular a T y a N (véase la Figura 4.12). Los vectores T, N, B determinan un sistema coordenado ortogonal local en cada punto de la curva C. Al plano que contiene a los vectores T y N lo llamaremos plano osculador, el plano que contiene a N y B es el plano normal y el plano generado por T y B lo llamaremos plano rectificador. Como B es unitario se tiene que ddsB , en caso de ser diferente de cero, será ortogonal a B. Luego derivando (4.5) con respecto a s, se tiene que dT dN dB = ×N + T× ds ds ds dado que dT ds = κ N , se sigue que ddsT × N = 0, por lo que dB = ds dN T× ds de donde se sigue que ddsB es perpendicular a T y, por lo tanto, paralelo a N. En consecuencia, se puede escribir como dB = −τ N ds (4.6) 137 4. Diferenciación. B N T Figura 4.12: Aparato de Frenet-Serret A la expresión (4.6) se le conoce como segunda fórmula de Frenet-Serret, donde al número dB |τ | = ds se le conoce como factor de torsión o simplemente torsión. El signo menos en la expresión (4.6) acontece ya que describe la dirección hacia la que gira el vector B en torno de T hacia −N. Si τ > 0, B girará en el mismo sentido que un tornillo de rosca derecha. Lo contrario sucede cuando τ < 0. Uno puede observar que si B sufre un cambio al ir recorriendo la curva, esto es, si ddsB 6= 0, el cambio sólo puede ser en su dirección (ya que el vector binormal es unitario), la cual siempre es perpendicular al vector tangente. Esto es, el vector binormal gira alrededor de la curva en un plano perpendicular al vector tangente. Por otro lado, si se multiplica vectorialmente la ecuación que define al vector binormal por −N, obtenemos que B × (−N) = T, que nos indica que si B gira hacia el vector −N, se obtiene el vector T. Ası́, si τ > 0, ddsB y el incremento del vector binormal tienen la dirección de −N y por lo tanto B gira alrededor de T hacia −N, es decir, gira en sentido positivo. Lo contrario ocurre cuando τ < 0. Por otro lado, multiplicando vectorialmente la ecuación que define al vector binormal por T, obtenemos que N = B × T, por lo que, derivando esta 138 4.4. Teorı́a básica de curvas expresión se tiene que dN ds dB dT ×T+B× ds ds = = −τ N × T + κ B × N, de donde se obtiene la llamada tercera fórmula de Frenet-Serret dN = τ B − κT ds Ejemplo. Considérese la curva definida por la ecuación vectorial s bs s , a sin √ , √ . a cos √ a2 + b2 a2 + b2 a 2 + b2 Se puede verificar (ejercicio) que esta curva está parametrizada en términos de la longitud de arco. Ası́ −√ T = a a2 + b2 √ sin s , √ a2 + b2 a a2 + b2 √ cos s , √ a2 + b2 b , a2 + b2 luego, derivando con respecto a s se obtiene que dT s a s a = − 2 cos √ sin √ ,− 2 ,0 , ds a + b2 a + b2 a2 + b2 a2 + b2 de donde se sigue que dT a = 2 , ds a + b2 κ = por lo que N = dT ds κ √ − cos = s 2 a + b2 √ , − sin s 2 a + b2 ,0 y como B = T × N, se tiene que i B = j − √a2a+ b2 sin − cos √ √ s + b2 a2 s a2 + b2 √ a a2 + b2 cos − sin √ k √ s + b2 a2 s a2 + b2 √ b a2 + b2 , 0 de donde se obtiene B = −√ b a2 + b2 sin √ s a2 + b2 , √ b a2 + b2 cos √ s a2 + b2 ,√ a a2 + b2 . 139 4. Diferenciación. Luego dB = ds − b cos a2 + b2 por tanto, √ s a2 + b2 ,− b sin a2 + b2 dB b N, = 2 ds a + b2 de donde se concluye que τ = − a2 b . + b2 √ s a2 + b2 ,0 , Bibliografı́a [1] Friedberg, S. et Al, Linear Algebra, New Jersey, Prentice Hall, 2003. [2] Cardenas, H. et Al, Álgebra superior, México, Trillas, 1982. [3] Courant, R., Fritz, J., Introduction to Calculus and Analysis Vol. 2, New York, Interscience, 1965. [4] Haaser, N. et Al, Análisis matemático 2, México, Trillas, 1971. [5] Lascurain, A., Álgebra superior I, México, Facultad de Ciencias, UNAM, 2012. [6] Lehmann, C., Geometrı́a analı́tica, México, Limusa, 1994. [7] Marsden, J., Hoffman, M. Elementary Classical Analysis, New York, W. H. Freeman and Company, 1993. [8] Marsden, J., Tromba, A. Vector Calculus, Third Edition, New York, W. H. Freeman and Company, 1988 [9] Murdoch, D. C., Geometrı́a analı́tica con vectores y matrices, México, Limusa, 1981. 141