Geometría Proyectiva - Facultad de Ciencias Matemáticas

Apuntes de Geometrı́a Proyectiva por Enrique Arrondo(*) Versión del 7 de Enero de 2009 Versión muy preliminar EL PLANO PROYECTIVO 1. Construcción del plano proyectivo 2. Rectas del plano proyectivo 3. Razón doble 4. Cónicas proyectivas 5. Cónicas afines y euclı́deas ESPACIOS PROYECTIVOS 6. Construcción del espacio proyectivo 7. Aplicaciones proyectivas 8. Clasificación de proyectividades 9. Correlaciones y cuádricas 10. Espacio afı́n y espacio proyectivo (*) Departamento de Álgebra, Facultad de Ciencias Matemáticas, Universidad Complutense de Madrid, 28040 Madrid, Spain, [email protected] 1 EL PLANO PROYECTIVO 1. Construcción del plano proyectivo Nuestro punto de partida consiste en observar que existe una cierta simetrı́a entre el conjunto de puntos y el conjunto de rectas del plano afı́n A2k sobre un cuerpo k. En efecto, dados dos puntos distintos de A2k , se puede determinar a partir de ellos una recta, concretamente la única que pasa por ellos dos; recı́procamente, dadas dos rectas distintas del plano, determinan un único punto, en concreto el de intersección de ambas (salvo que sean paralelas, problema que obviaremos de momento). Esta simetrı́a nos puede hacer sospechar que ambos conjuntos tienen la misma estructura, ası́ que vamos a analizar si esto es cierto. En primer lugar, el conjunto de puntos de Ak2 se identifica inmediatamente con k 2 , pero describir el conjunto de rectas parece más complicado. Para simplificarlo, y hacer que tal conjunto sea otro k 2 , podemos representar cada recta por medio de una ecuación de la forma Y = aX + b, con a, b ∈ k. En otras palabras, estamos determinando cada recta a partir de un par (a, b), donde a es la pendiente de la recta y (0, b) es su punto de intersección con el eje vertical. Obsérvese que encontramos un nuevo problema, y es que esto nos da una biyección no entre k 2 y el conjunto de todas las rectas, sino sólo entre k 2 y las rectas no verticales (ya que las rectas de la forma X =constante son las únicas que no se pueden representar con una ecuación de la forma Y = aX + b). A pesar de estos problemas, veamos si de todas formas encontramos la simetrı́a a la que aludimos desde el principio. Empecemos por dos puntos distintos (x , y ), (x , y ) ∈ A2k y determinemos la recta que pasa por ellos. De Álgebra Lineal y Geometrı́a, sabemos que dicha recta tiene de ecuación 1 X Y 1 x y = 0 1 x y que, escrita de la forma descrita anteriormente, será Y = aX + b, con (a, b) = y − y x y − x y , . x − x x − x (1.1) Por otro lado, si consideramos las rectas Y = a X + b y Y = a X + b , su intersección es el punto b − b a b − a b (x, y) = − , . (1.2) a − a a − a 2 Comparando las dos expresiones (1.1) y (1.2), nos damos cuenta de que, salvo por un signo, los pares de la forma (a, b) juegan un papel simétrico al de los pares de la forma (x, y), lo que no deberı́a ser por casualidad. La clave nos la va a dar el mirar los casos “patológicos”. Si miramos la fórmula (1.2), nos damos cuenta de que no tiene sentido si a = a . Hasta aquı́ es normal, visto que a = a quiere decir que las dos rectas tienen la misma pendiente, es decir, son paralelas, con lo que evidentemente no nos podı́a salir un punto de intersección. Mirando ahora el caso simétrico, la fórmula (1.1) no está definida cuando x = x , lo que también es normal, porque en tal caso la recta que pasa por los dos puntos es una recta vertical, que no se puede poner de la forma Y = aX + b. La idea es que, dado que en este último caso sabemos que sı́ que hay recta, vamos a ampliar el conjunto de pares de la forma (a, b) al conjunto de todas las rectas de A2k , y por simetrı́a ampliaremos también el conjunto de puntos de A2k . En realidad, el conjunto de todas las rectas vendrá dado por el conjunto de todas las ecuaciones de la forma u0 + u1 X + u2 Y = 0 (con u0 , u1 , u2 ∈ k), teniendo en cuenta dos observaciones: 1) Necesariamente al menos uno de los coeficientes u1 , u2 es distinto de cero (de hecho, hasta ahora estábamos considerando sólo rectas con u2 = 0, es decir, rectas no verticales). 2) Una recta tiene infinitas ecuaciones. Más precisamente, las ecuaciones u0 + u1 X + u2 Y = 0 y u0 + u1 X + u2 Y = 0 definen la misma recta si y sólo si los coeficientes son proporcionales, es decir, existe λ ∈ k tal que (u0 , u1 , u2 ) = λ(u0 , u1 , u2 ) (obsérvese que, necesariamente, λ = 0). Para indicar que los coeficientes están definidos salvo proporcionalidad escribiremos (u0 : u1 : u2 ). Con esta notación, una recta dada por las coordenadas (a, b) es la recta de coeficientes (a : b : −1) la fórmula (1.1) queda entonces (u0 : u1 : u2 ) = y − y x y − x y : : −1 = (y − y : x y − x y : x − x ) x − x x − x que ahora es una recta que existe siempre (ya que o la primera o la tercera coordenadas son distintas de cero cuando los dos puntos son distintos). Podemos intentar lo mismo ahora con los puntos en lugar de las rectas, es decir, añadir una nueva coordenada y seguir definiendo ternas salvo multiplicidad. Obsérvese primero que la ecuación u0 + u1 X + u2 Y = 0 sugiere una anulación sobre la terna (1, X, Y ), con lo que lo razonable es añadir la nueva coordenada al principio. En definitiva, identificamos un punto (x, y) ∈ A2k con la terna (1 : x : y), con lo que la fórmula (1.2) queda b − b a b − a b : = (a − a : b − b : a b − a b ). (1 : x : y) = 1 : − a −a a −a 3 De ese modo, la terna de la derecha está siempre definida, aunque no corresponderá a un punto de A2k si a = a , es decir, cuando las rectas son paralelas. En otras palabras, parece que hemos aumentado el plano suficientemente para que dos rectas se corten siempre. Esto motiva la siguiente: Definición. Llamaremos plano proyectivo sobre el cuerpo k, y lo denotaremos con conjunto de ternas (x0 : x1 : x2 ) con x0 , x1 , x2 ∈ k no todos nulos y de forma que P2k , al (x0 : x1 : x2 ) = (x0 : x1 : x2 ) ⇔ ∃λ ∈ k tal que (x0 , x1 , x2 ) = λ(x0 , x1 , x2 ). Observación 1.3. Es muy importante observar inmediatamente que no tiene sentido sumar puntos en el plano proyectivo. Por ejemplo, ¿qué querrı́a decir la suma de los puntos (1 : 0 : 0) y (0 : 1 : 0)? Una respuesta apresurada nos dirı́a que la suma es el punto (1 : 1 : 0), pero esto no es ası́. No hay que olvidar que los elementos del plano proyectivo en realidad son clases de equivalencia, y por tanto una definición es consistente sólo si no depende del representante elegido. Por ejemplo, por la definición de plano proyectivo, tenemos que el punto (1 : 0 : 0) coincide con el punto (2 : 0 : 0), mientras que el punto (0 : 1 : 0) coincide con el punto (0 : −3 : 0), y con estos representantes parecerı́a lógico decir que la suma de (2 : 0 : 0) y (0 : −3 : 0) es (2 : −3 : 0), que no es igual al punto (1 : 1 : 0). Proposición 1.4. La aplicación i : A2k → P2k (x, y) → (1 : x : y) es inyectiva y define una biyección entre inversa es (x0 : x1 : x2 ) → ( xx10 , xx20 ). A2k y U0 := {(x0 : x1 : x2 ) ∈ P2k | x0 = 0} cuya Demostración: Obsérvese en primer lugar que el subconjunto U0 está bien definido, ya que si (x0 : x1 : x2 ) = (x0 : x1 : x2 ), es equivalente x0 = 0 a x0 = 0, puesto que x0 = λx0 para algún λ = 0. Claramente i es inyectiva, ya que si (1 : x : y ) = (1 : x : y ), existe λ ∈ k tal que (1, x : y ) = λ(1, x , y ) , con lo que necesariamente λ = 1 y (x , y ) = (x , y ). Por otra parte, es claro que la imagen de i está contenida en U0 . Recı́procamente, dado cualquier elemento (x0 : x1 : x2 ) ∈ U0 , como x0 = 0 podemos escribir (x0 : x1 : x2 ) = (1 : xx10 : xx20 ), y por tanto (x0 : x1 : x2 ) es la imagen de ( xx10 , xx20 ). Definición. A raı́z de la inclusión anterior, consideraremos siempre el espacio afı́n como el subconjuto U0 del plano proyectivo P2k . Los elementos de P2k que no están en los llamaremos puntos del infinito del plano afı́n A2k . 4 A2k A2k Proposición 1.5. Sea L ⊂ A2k la recta de ecuación u0 + u1 X + u2 Y = 0. Entonces, si (v1 , v2 ) es un vector director de L, el conjunto L̄ := L ∪ {(0 : v1 : v2 )} ⊂ P2k tiene como ecuación u0 X0 + u1 X1 + u2 X2 = 0. Demostración: Los vectores directores de L son de la forma (v1 , v2 ) = λ(u2 , −u1 ), con lo que el punto (0 : v1 : v2 ) está unı́vocamente determinado, y es inmediato que verifica la ecuación u0 X0 +u1 X1 +u2 X2 = 0. Por otra parte, es claro que un punto (x, y) ∈ L, cuando se identifica con el punto (1 : x : y) ∈ P2k , verifica la ecuación u0 X0 + u1 X1 + u2 X2 = 0. Recı́procamente, dado (x0 : x1 : x2 ) ∈ ocurrir dos cosas: P2k tal que u0 x0 + u1 x1 + u2 x2 = 0, pueden 1) Si x0 = 0, entonces (x0 : x1 : x2 ) se puede ver como el punto ( xx10 , xx20 ) de además se tiene u0 + u1 xx10 + u2 xx20 = 0, con lo que ( xx10 , xx20 ) está en L. A2k , y 2) Si x0 = 0, entonces de la ecuación u0 x0 +u1 x1 +u2 x2 = 0 se deduce inmediatamente (x0 : x1 : x2 ) = (0 : u2 : −u1 ). Definición. Llamaremos completado proyectivo de la recta L al conjunto L̄, y punto del infinito de la recta L al punto (0 : v1 : v2 ). El resultado anterior nos dice entonces que los puntos del planos proyectivo son de dos tipos: 1) Puntos con x0 = 0, es decir, puntos de A2k . 2) Puntos de la forma (0 : v1 : v2 ), con (v1 , v2 ) = (0, 0), que son entonces puntos del infinito de rectas, es decir, que se pueden interpretar como direcciones del plano afı́n. Nótese que, en la ecuación del completado proyectivo de una recta todos los sumandos tienen grado uno, y que no hay término independiente. La definición general es la siguiente. Definición. Se llama polinomio homogéneo (de grado d) en k[X0 , . . . , Xn ] a un polinomio F que tiene todos sus sumandos de grado d. Claramente se verifica que F (λX0 , . . . , λXn ) = λd F (X0 , . . . , Xn ) (y de hecho, esta propiedad caracteriza a los polinomios homogéneos). Observación 1.6. Los polinomios homogéneos en k[X0 , X1 , X2 ] son los que sirven para dar ecuaciones en el plano proyectivo, teniendo en cuenta lo siguiente: 1) Un polinomio no homogéneo no puede nunca definir una ecuación. Por ejemplo, no tiene sentido hablar de la ecuación X0 + X2 − 1 = 0. Uno podrı́a pensar que el punto (1 : 0 : 0) verifica la ecuación, pero sin embargo el mismo punto lo podemos escribir como (2 : 0 : 0) y ya no verifica la ecuación. 2) Sı́ que tiene sentido hablar de la ecuación definida por un polinomio homogéneo F ∈ k[X0 , X1 , X2 ] (por ejemplo, la ecuación X0 = 0 que hemos usado en la Proposición 5 1.4 o en general la ecuación de una recta). En efecto, si dado un punto (x0 : x1 : x2 ) se tiene que F (x0 , x1 , x2 ) = 0, entonces para cualquier otra representación (λx0 : λx1 : λx2 ) del mismo punto se tendrá también F (λx0 , λx1 , λx2 ) = λd F (x0 , x1 , x2 ) = 0. Por tanto, la anulación de un polinomio en un punto no depende del representante que tomemos. 3) Lo que no tiene sentido es decir cuánto vale un polinomio en un punto cuando no se anula. Por ejemplo, no se puede decir que el polinomio X0 − X1 + X2 valga 1 en el punto (1 : 1 : 1), ya que cambiando el representante a (−3 : −3 : −3) su valor serı́a −3. Ejemplo 1.7. Veamos en ejemplos concretos cómo se generaliza el completado proyectivo de las rectas a otras curvas planas. 1) Consideramos la parábola Y − X 2 = 0. Entonces, un punto (x0 : x1 : x2 ) ∈ U0 estará en la parábola si y sólo si xx20 − ( xx10 )2 = 0. Quitando denominadores (es decir, multiplicando por x20 ) nos queda la relación x0 x2 − x21 = 0. Como en la demostración de la Proposición 1.5, los únicos puntos de U0 que verifican la ecuación X0 X2 − X12 = 0 son los de la parábola. En cambio, los puntos del infinito que verifican también X0 X2 − X12 = 0 deben verificar por tanto X0 = X12 = 0, con lo que sólo hay un punto en el infinito, en concreto (0 : 0 : 1), es decir, el punto que corresponde a la dirección vertical. 2) Si consideramos la hipérbola XY − 1 = 0, repitiendo el mismo proceso nos quedarı́a la ecuación X1 X2 −X02 = 0, cuya intersección con la recta del infinito nos da X0 = X1 X2 = 0. Tenemos por tanto en este caso dos puntos en el infinito, (0 : 0 : 1) y (0 : 1 : 0), que corresponden a las direcciones vertical y horizontal de las ası́ntotas. En general, se tiene lo siguiente: Definición. Dado un polinomio f ∈ k[X, Y ] de grado d, se llama completado proyectivo de la curva definida por f = 0 al conjunto de puntos que se anulan en el polinomio 1 X2 F (X0 , X1 , X2 ) := X0d f ( X X0 , X0 ). El polinomio F se llama el homogeneizado de f , y consiste en cambiar en cada sumando de f la variable X por X1 , la variable Y por X2 y multiplicar por X0 elevado a d menos el grado del monomio. Los puntos de F = 0 que están la recta del infinito se llaman puntos del infinito de la curva. Definición. Se llama curva proyectiva de grado d al subconjunto de los puntos de P2k que se anulan en un polinomio homogéneo de grado d en k[X0 , X1 , X2 ]. Si d = 1, la curva se llama recta proyectiva, mientras que si d = 2 la curva se llama cónica proyectiva. Observación 1.8. definido por una ecuación del tipo u0 X0 + u1 X1 + u2 X2 = 0, con algún ui = 0. Por la Proposición 1.5, todas las rectas proyectivas son completados de una recta, excepto la recta X0 = 0, que consiste en el conjunto de los puntos del infinito de A2k , y que llamaremos recta del infinito. 6 Veamos que con esta construcción ya tenemos la simetrı́a que buscábamos. En primer lugar, dados dos puntos distintos, determinan siempre una recta. En efecto: 1) Si los dos puntos están en A2k , entonces la única recta que los contiene es el completado proyectivo de la recta afı́n que pasa por ellos. 2) Si uno de los puntos está en A2k y el otro en la recta del infinito, entonces este segundo punto representa una dirección, y por tanto hay una única recta afı́n que pasa por el primer punto en la dirección representada por el segundo punto. La recta proyectiva buscada es el completado proyectivo de esta recta afı́n. 3) Si los dos puntos están en el infinito, la única recta que pasa por ellos es la recta del infinito. Simétricamente, veamos que la intersección de dos rectas proyectivas es siempre un punto: 1) Si las dos rectas son completados proyectivos de rectas afines no paralelas, su único punto de intersección es el de las correspondientes rectas afines. 2) Si las dos rectas son completados proyectivos de rectas afines paralelas, su único punto de intersección es el punto del infinito que corresponde a la dirección de las dos rectas afines. 3) Si una de las rectas es la recta del infinito, el único punto de intersección es el punto del infinito de la otra recta (que necesariamente es el completado proyectivo de una recta afı́n). Puede pensarse, y con razón, que la anterior comprobación es excesivamente pesada. Y en efecto, tiene todo el sabor de los resultados de geometrı́a afı́n en que hay que distinguir entre numerosos casos. De hecho, el plano proyectivo no hay que verlo sólo como una completación del plano afı́n (aunque esto ayude mucho a visualizarlo). Debe verse, sobre todo, como un espacio geométrico con interés en sı́ mismo. De hecho, ası́ es como lo vamos a considerar nosotros (sólo cuando lo hayamos estudiado en profundidad volveremos a relacionarlo con el plano afı́n, pero con el fin de obtener a partir de él propiedades del plano afı́n, y no al revés). Reescribamos pues la simetrı́a anterior sin usar el plano afı́n. La primera primera observación es que el conjunto de rectas proyectivas forma también un plano proyectivo. En efecto, dos ecuaciones u0 X0 + u1 X1 + u2 X2 = 0 y u0 X0 + u1 X1 + u2 X2 = 0 definen la misma recta si y sólo si existe λ ∈ k \ {0} tal que (u0 , u1 , u2 ) = (u0 , u1 , u2 )λ. Por tanto, podemos dar la siguiente definición: Definición. Llamamos plano proyectivo dual al conjunto de rectas del plano proyectivo. Es un plano proyectivo en el sentido de que a cada recta u0 X0 + u1 X1 + u2 X2 = 0 le asociamos el punto (u0 : u1 : u2 ). Para distinguirlo del plano proyectivo lo denotamos con 7 P2k ∗ , y sus variables las llamaremos U0 , U1 , U2 . El primer signo de la simetrı́a que tenemos (que a partir de ahora llamaremos dualidad) ∗ ∗ es que no sólo los puntos de P2k son rectas de P2k , sino que también las rectas de P2k son puntos en P2k : Proposición 1.9. Toda recta en P2k consiste en el conjunto de rectas de P2k que pasan por un punto fijo (lo que se llama haz de rectas con base el punto). Recı́procamente todo ∗ haz de rectas en P2k representa una recta en P2k . ∗ Demostración: Es inmediato, ya que la ecuación de una recta en P2k es de la forma ∗ a0 U0 + a1 U1 + a2 U2 = 0. Pero que un punto de P2k de coordenadas (u0 : u1 : u2 ) satisfaga esa ecuación quiere decir que la recta de P2k de ecuación u0 X0 + u1 X1 + u2 X2 = 0 pase por el punto (a0 : a1 : a2 ) de P2k . ∗ Veamos ahora cómo aplicar la dualidad. : x1 : x2 ), (x0 : x1 : x2 ) de P2k , la única ecuación X0 X1 x0 x1 x0 x1 (x0 En primer lugar, dados dos puntos distintos recta de P2k que pasa por ellos tendrá como X2 x2 = 0 x2 (1.10) x0 x1 x0 x2 (claramente representa una recta, ya que al menos uno de los menores , , x x x x 0 1 0 2 x1 x2 x1 x2 es distinto de cero, porque (x0 : x1 : x2 ) = (x0 : x1 : x2 ); además, es claro que la recta pasa por los dos puntos). Simétricamente, consideramos dos rectas distintas de P2k de ecuaciones u0 X0 + u1 X1 + u2 X2 = 0 y u0 X0 + u1 X1 + u2 X2 = 0. Si (a0 : a1 : a2 ) es el punto de intersección de ambas rectas, eso quiere decir que las dos rectas pertenecen al haz de rectas con base (a0 : a1 : a2 ). ∗ ∗ Pasando entonces a P2k , estamos buscando la recta a0 U0 + a1 U1 + a2 U2 = 0 de P2k que contiene a los puntos (u0 : u1 : u2 ), (u0 : u1 : u2 ). Según , (1.10), esa recta será la recta de ecuación U0 U1 U2 u0 u1 u2 = 0. u0 u1 u2 Ejemplo 1.11. Usando el truco de dualidad anterior, si queremos calcular el punto de intersección de las rectas 2X0 − 3X1 + X2 = 0 y 3X0 + 4X1 − 5X2 = 0 sin resolver el ∗ sistema hacemos lo siguiente. Las rectas representan los puntos de P2k de coordenadas 8 (2 : −3 : 1) y (3 : 4 : −5). La recta de U0 2 3 U1 −3 4 P2k ∗ que pasa por ellos tiene de ecuación U2 1 = 11U0 + 13U1 + 17U2 = 0, −5 con lo que el punto de intersección de las rectas dadas es (11 : 13 : 17). 9 2. Rectas del plano proyectivo Empezamos con lo que serı́a el análogo de ecuaciones paramétricas de una recta: Proposición 2.1. Sea L la recta proyectiva determinada por los puntos (x0 : x1 : x2 ) y (x0 : x1 : x2 ). Entonces un punto (x0 : x1 : x2 ) está en L si y sólo si existen λ, µ ∈ k (no ambos nulos) tales que   x0 = λx0 + µx0 x1 = λx1 + µx1 (2.2)  x2 = λx2 + µx2 Además, (λx0 + µx0 : λx1 + µx1 : λx2 + µx2 ) = (λ x0 + µ x0 : λ x1 + µ x1 : λ x2 + µ x2 ) si y sólo si existe ν ∈ k \ {0} tal que (λ , µ ) = (νλ, νµ). Demostración: La fórmula (1.10) nos dice que (x0 : x1 : x2 ) ∈ P2k es un punto de la recta L si y sólo si los vectores (x0 , x1 , x2 ), (x0 , x1 , x2 ), (x0 , x1 , x2 ) son linealmente dependientes. Como los dos últimos son linealmente independientes (por ser los puntos (x0 : x1 : x2 ) y (x0 : x1 : x2 ) distintos), se tiene que (x0 , x1 , x2 ) depende linealmente de (x0 , x1 , x2 ) y (x0 , x1 , x2 ), es decir, que existen λ, µ ∈ k tales que (x0 , x1 , x2 ) = λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) (además (λ, µ) = (0, 0), porque (x0 , x1 , x2 ) = (0, 0, 0)). Esto prueba la igualdad (2.2). Por otra parte, la igualdad (λx0 + µx0 : λx1 + µx1 : λx2 + µx2 ) = (λ x0 + µ x0 : λ x1 + µ x1 : λ x2 + µ x2 ) es equivalente a decir que existe ν ∈ k tal que (λ x0 + µ x0 , λ x1 + µ x1 , λ x2 + µ x2 ) = ν(λx0 + µx0 , λx1 + µx1 , λx2 + µx2 ) es decir λ (x0 , x1 , x2 ) + µ (x0 , x1 , x2 ) = ν λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) o lo que es lo mismo (λ − νλ)(x0 , x1 , x2 ) = (−µ + νµ)(x0 , x1 , x2 ) = (0, 0, 0). Como (x0 , x1 , x2 ) y (x0 , x1 , x2 ) no son proporcionales, se obtiene λ − νλ = −µ + νµ = 0, es decir (λ , µ ) = (νλ, νµ). Observación 2.3. La Proposición 2.1 indica que toda recta proyectiva está en biyección con el conjunto de pares (λ, µ) = (0, 0) en que identificamos dos de ellos si y sólo si son 10 proporcionales. Es natural por tanto, en analogı́a con la definición de plano proyectivo, definir el conjunto P1k de pares (λ : µ) definidos salvo proporcionalidad (por analogı́a con P2k , usaremos mejor coordenadas (t0 : t1 )). Este conjunto se debe interpretar como una especie de recta proyectiva “abstracta”. La Proposición 2.1 está diciendo que tenemos una biyección P1k → L (2.4) (t0 : t1 ) → (x0 t0 + x0 t1 : x1 t0 + x1 t1 : x2 t0 + x2 t1 ) que es el análogo de las ecuaciones paramétricas de una recta afı́n (en el caso afı́n hay un solo parámetro, que varı́a en el cuerpo k, es decir en A1k , la recta afı́n “abstracta”). Definición. Una biyección como (2.4) la llamaremos parametrización de la recta L. Lema 2.5. Dados a0 , a1 , a2 , b0 , b1 , b2 ∈ k, son equivalentes: (i) (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) es una parametrización de una recta. (ii) (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) está bien definida (i.e. no existe ningún valor (t0 : t1 ) ∈ P1k tal que (a0 t0 + b0 t1 , a1 t0 + b1 t1 , a2 t0 + b2 t1 ) = (0, 0, 0)). a0 a1 a2 (iii) La matriz tenga rango dos. b0 b1 b2 Demostración: (i) ⇒ (ii): Es inmediato. (ii) ⇒ (iii): Si la matriz tuviera rango a lo más uno, entonces se tendrı́a que el punto (b0 : −a0 ) = (b1 : −a1 ) = (b2 : −a2 ) no tendrı́a imagen. (iii) ⇒ (iv): Por hipótesis, (a0 : a1 : a2 ) y (b0 : b1 : b2 ) son dos puntos distintos, luego la Proposicion 2.1 nos dice que (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) es una parametrización de la recta que pasa por esos dos puntos. Observación 2.6. La condición (iii) del lema anterior nos dice cómo calcular la inversa de ) = (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ). En efecto, si el una parametrización (x0 : x1 : x2 a0 a1 a2 es dos, habrá dos columnas que no sean proporcionales, rango de la matriz b0 b1 b2 por ejemplo las dos primeras. Esto quiere decir que podemos despejar t0 , t1 en función de x0 , x1 . Concretamente (t0 : t1 ) = ( a0 a1 b1 x0 − b0 b1 a0 a1 b0 x1 : − a0 b0 a1 b1 a1 x0 + b0 b1 a0 a1 a0 x1 ) b0 b1 o lo que es lo mismo (una de las grandes ventajas del proyectivo es que permite eliminar denominadores) (t0 : t1 ) = (b1 x0 − b0 x1 : −a1 x0 + a0 x1 ). 11 Obsérvese que, en general, la inversa consiste en dos formas lineales en x0 , x1 , x2 (en realidad sólo dos de estas coordenadas, dependiendo de la columnas de la matriz que tomemos). Ejemplo 2.7. guiente: Supongamos que tenemos una recta afı́n parametrizada de la forma si X = x + v1 t Y = y + v2 t es decir, la recta que pasa por el punto (x, y) con vector director (v1 , v2 ). Su completado proyectivo será entonces la recta que pasa por los puntos (1 : x : y) y (0 : v1 : v2 ), con lo que tendremos una parametrización   X 0 = t0 X = xt0 + v1 t1  1 X2 = yt0 + v2 t1 que es una especie de “homogeneización” de la parametrización afı́n. De hecho, teniendo X2 t1 t1 t1 1 en cuenta que X = X X0 , Y = X0 , tendremos X = x + v1 t0 , Y = y + v2 t0 , es decir, t = t0 . Obsérvese que el punto del infinito de la recta corresponde al valor (t0 : t1 ) = (0 : 1), es decir, al valor “infinito” del parámetro t. Ejemplo 2.8. La aplicación más importante de las parametrizaciones de rectas es que permiten calcular su intersección con cualquier curva. Por ejemplo, supongamos que queremos intersecar la cónica X0 X2 − X12 = 0 con la recta que pasa por los puntos (1 : −1 : 3) y (0 : 1 : −1). Debemos encontrar entonces los valores de (t0 : t1 ) tales que el punto (t0 : −t0 + t1 : 3t0 − t1 ) esté en la cónica, es decir, t0 (3t0 − t1 ) − (−t0 + t1 )2 = 0, que operando queda 2t20 + t0 t1 − t21 = 0. Para resolver esta ecuación, observamos que t0 no es cero (si lo fuera, también lo serı́a t1 , pero no pueden ser ambos nulos, por definición de P1k ), con lo que nos queda 2 + tt10 − ( tt10 )2 = 0, de donde deducimos que tt10 = 2, −1. Por tanto, las soluciones en P1k son (t0 : t1 ) = (1 : 2), (1 : −1), que nos dan los puntos de la recta (1 : 1 : 1), (1 : −2 : 4). Este truco se funciona en general, como vemos en el resultado siguiente. Proposición 2.9. Si k es un cuerpo algebraicamente cerrado, todo polinomio homogéneo F ∈ k[T0 , T1 ] de grado d factoriza en d factores lineales, por lo que tiene d soluciones en P1k contadas con multiplicidad. En consecencuencia, la intersección de cualquier recta con una curva de grado d consiste en d puntos (contados con multiplicidad), salvo que la recta esté contenida en la curva. Demostración: Sacando T0 factor común tantas veces como sea posible, escribimos F = T0n−m (a0 T0m + a1 T0m−1 T1 + . . . + am T1m ) 12 con am = 0. Como k es algebraicamente cerrado, el polinomio a0 + a1 T + . . . + am T m se puede escribir como am (T − α1 ) . . . (T − αm ), de donde se sigue F = am T0n−m (T1 − α1 T0 ) . . . (T1 − αm T0 ) y se anula precisamente en (t0 : t1 ) = (0 : 1) (con multiplicidad n − m) y en cada (1 : αi ) (cada uno contado tantas veces como se repita el factor T1 − αi T0 ). Por tanto, dada una curva definida por una ecuación G = 0, con G ∈ k[X0 , X1 , X2 ] homogéneo de grado d, si sustituimos en G la parametrización de una curva, obtendremos una ecuación homogénea de grado d en t0 , t1 (salvo que la recta esté contenida en la curva, en cuyo caso tal sustitución es idénticamente nula). Por lo que acabamos de ver, tal ecuación tendrá d soluciones (contadas con multiplicidad) en P1k , con lo que obtendremos d puntos de la recta que están también en la curva. Observación 2.10. Conviene precisar cuanto antes una ambigüedad calculada del enunciado de la Proposicion 2.1. Implı́citamente, se está diciendo que se están fijando representantes de los dos puntos que determinan la recta, y no sólo los puntos. Es decir, que dos puntos pueden determinar infinitas parametrizaciones distintas. Por ejemplo, si queremos parametrizar la recta que pasa por (1 : 0 : 1) y (0 : 1 : 1), obtendrı́amos la parametrización (t0 : t1 ) → (t0 : t1 : t0 + t1 ) pero si escribimos los puntos como (2 : 0 : 2) y (0 : −1 : −1) obtendrı́amos la parametrización (t0 : t1 ) → (2t0 : −t1 : 2t0 − t1 ) que sólo coincide con la anterior para los valores (t0 : t1 ) = (1 : 0), (0 : 1). El resultado siguiente nos dice que para tener unicidad nos hace falta un tercer punto. Teorema 2.11. Sea L una recta proyectiva y (x0 : x1 : x2 ), (x0 : x1 : x2 ), (x 0 : x1 : x2 ) tres puntos distintos de L. Entonces, existe y es única una parametrización de L que verifique (1 : 0) → (x0 : x1 : x2 ) (0 : 1) → (x0 : x1 : x2 ) (1 : 1) → (x 0 : x1 : x2 ) Demostración: Veamos en primer lugar que, de existir, la parametrización debe ser única. Una parametrización genérica tiene el aspecto (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) y, de acuerdo con nuestras condiciones, debe verificarse (a0 : a1 : a2 ) = (x0 : x1 : x2 ) 13 (b0 : b1 : b2 ) = (x0 : x1 : x2 ) (a0 + b0 : a1 + b1 : a2 + b2 ) = (x 0 : x1 : x2 ) es decir, que existen λ, µ, ν ∈ k \ {0} tales que (a0 , a1 , a2 ) = (λx0 , λx1 , λx2 ) (b0 , b1 , b2 ) = (µx0 , µx1 , µx2 ) (a0 + b0 , a1 + b1 , a2 + b2 ) = (νx 0 , νx1 , νx2 ). De aquı́ se deduce, sumando las dos primeras igualdades, λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) = ν(x 0 , x1 , x2 ). Por otra parte, del hecho que (x0 : x1 : (x 0 : x1 : x2 ), se deduce de (1.10): x0 x0 x0 x2 ) esté en la recta que pasa por (x0 : x1 : x2 ) y x1 x1 x 1 x2 x2 = 0 x 2 y por tanto, la última fila es combinación de las dos primeras (que son independientes al representar puntos distintos). Es decir, existen α, β ∈ k tales que (x 0 , x1 , x2 ) = α(x0 , x1 , x2 ) + β(x0 , x1 , x2 ). (2.12) Substituyendo de aquı́ (x 0 , x1 , x2 ) en la combinación lineal anterior tenemos λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) = να(x0 , x1 , x2 ) + νβ(x0 , x1 , x2 ) o equivalentemente (λ − να)(x0 , x1 , x2 ) = (νβ − µ)(x0 , x1 , x2 ). Como (x0 , x1 , x2 ) y (x0 , x1 , x2 ) no son proporcionales, se sigue que λ = να, µ = νβ, de donde (a0 , a1 , a2 ) = (ναx0 , ναx1 , ναx2 ) (b0 , b1 , b2 ) = (νβx0 , νβx1 , νβx2 ) y por tanto la parametrización debe ser (t0 : t1 ) → (ναx0 t0 + νβx0 t1 : ναx1 t0 + νβx1 t1 : ναx2 t0 + νβx2 t1 ) 14 que es la misma que (t0 : t1 ) → (αx0 t0 + βx0 t1 : αx1 t0 + βx1 t1 : αx2 t0 + βx2 t1 ). Como α, β están determinados a partir de los puntos mediante (2.12), la parametrización es única. Además, es evidente que tal parametrización verifica las condiciones que queremos, con lo que se concluye la demostración. Ejemplo 2.13. Obsérvese que la demostración del teorema anterior es constructiva. Por ejemplo, supongamos que queremos encontrar la única parametrización de la recta X0 + X1 − X2 = 0 que manda (1 : 0) a (1 : 2 : 3), (0 : 1) a (2 : 3 : 5) y (1 : 1) a (1 : −1 : 0). Entonces, lo primero que hay que hacer es encontrar la relación (2.12), es decir, hay que escribir (1, −1, 0) como combinación lineal de (1, 2, 3) y (2, 3, 5). Tal relación es (1, −1, 0) = −5(1, 2, 3) + 3(2, 3, 5) = (−5, −10, −15) + (6, 9, 15) con lo que la parametrización queda (t0 : t1 ) → (−5t0 + 6t1 : −10t0 + 9t1 : −15t0 + 15t1 ). Ejemplo 2.14. Una pregunta natural es cómo son todas las parametrizaciones de una recta. Por ejemplo, para la recta X0 + X1 − X2 = 0, la Observación 2.10 y el Ejemplo 2.13 nos dan hasta tres parametrizaciones distintas. Para ello tomamos por ejemplo la parametrización (x0 : x1 : x2 ) = (−5t0 + 6t1 : −10t0 + 9t1 : −15t0 + 15t1 ) del ejemplo anterior, y calculamos su inversa (ver la Observación 2.6) (t0 : t1 ) = (9x0 − 6x1 : 10x0 − 5x1 ). Entonces, si consideramos la composición de la parametrización (t0 : t1 ) → (2t0 : −t1 : 2t0 − t1 ) con la inversa anterior tendremos (t0 : t1 )→(2t0 : −t1 : 2t0 −t1 )→ 9(2t0 )−6(−t1 ) : 10(2t0 )−5(−t1 ) =(18t0 +6t1 : 20t0 +5t1 ). Lema 2.15. Dados a, b, c, d ∈ k, son equivalentes: 15 (i) (t0 : t1 ) → (at0 + bt1 : ct0 + dt1 ) es una biyección. (ii) (t0 (t0 a (iii) c : t1 ) → (at0 + bt1 : ct0 + dt1 ) está bien definido, es decir, no existe ningún valor : t1 ) ∈ P1k tal que at0 + bt1 , ct0 + dt1 ) = (0, 0). b = 0. c Demostración: Es prácticamente igual que la del Lema 2.5. (i) ⇒ (ii): Evidente. a b = 0, entonces el punto (−b : a) = (−d : c) no tendrı́a imagen. (ii) ⇒ (iii): Si fuera c c (iii) ⇒ (i): (t0 : t1 ) → (dt0 − bt1 : −ct0 + at1 ) es la inversa. Definición. Llamaremos cambio de variable en P1k a una aplicación ψ : P1k → P1k de la forma ψ(t0 : t1 ) = (at0 + bt1 : ct0 + dt1 ) verificando cualquiera de las condiciones equivalentes del lema anterior. Lema 2.16. Sea ϕ : P1k → L una parametrización de la recta L. Entonces, todas las parametrizaciones de L son de la forma ϕ ◦ ψ, donde ψ es un cambio de variable en P1k . Demostración: Si ϕ : P1k → L es otra parametrización de L, tal y como hemos hecho en el Ejemplo 2.14 se observa que ϕ−1 ◦ ϕ es un cambio de variable ψ, con lo que ϕ = ϕ ◦ ψ. Recı́procamente, es claro que la composición de un cambio de variable con ϕ tiene el aspecto (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ), y como está bien definida es una parametrización por el Lema 2.5. Nos planteamos ahora el mismo tipo de problema pero cambiando de una recta a otra. Lema 2.17. Sea f : L → L una aplicación entre dos rectas proyectivas. Entonces son equivalentes. (i) Existe una parametrización ϕ : P1k → L tal que f ◦ ϕ es una parametrización de L . (ii) Para cada parametrización ϕ : P1k → L, se tiene que f ◦ ϕ es una parametrización de L . (iii) Para cada parametrización ϕ : P1k → L y cada parametrización ϕ : −1 que ϕ ◦ f ◦ ϕ es un cambio de variable en P1k . (iv) Existen parametrizaciones ϕ : cambio de variable en P1k . P1k → L y ϕ : Demostración: 16 P1k P1k → L se tiene → L tales que ϕ −1 ◦ f ◦ ϕ es un (i) ⇒ (ii): Sabemos que para una parametrización concreta ϕ de L se tiene que f ◦ ϕ es una parametrización de L . Entonces, por el Lema 2.16, cualquier otra parametrización de L es de la forma ϕ = ϕ ◦ ψ, donde ψ es un cambio de variable en P1k . Por tanto, f ◦ ϕ = (f ◦ ϕ) ◦ ψ, que es la composición del cambio de variable ψ con la parametrización f ◦ ϕ, luego de nuevo por el Lema 2.16 es una parametrización de L . (ii) ⇒ (iii): Sean ϕ, ϕ parametrizaciones de L y L respectivamente. Por hipótesis, f ◦ ϕ −1 es una parametrización de L , luego por el Lema 2.16 se tiene que ϕ ◦ f ◦ ϕ es un cambio de variable en P1k . (iii) ⇒ (iv): Evidente. (iv) ⇒ (i): Como ϕ ◦ f ◦ ϕ es un cambio de variable en P1k , por el Lema 2.16 se tiene −1 que ϕ ◦ (ϕ ◦ f ◦ ϕ) es una parametrización de L , de donde se sigue el resultado. −1 Definición. Una proyectividad entre dos rectas proyectivas L y L es una aplicación f : L → L que verifica cualquiera de las condiciones del Lema 2.17. Veamos algunos ejemplos de proyectividades de rectas. Proposición 2.18. Sea L una recta de P2 y sea a ∈ P2k un punto que no está en L. Sea ∗ Ω(a) ⊂ P2k el haz de rectas que pasan por a. Entonces: (i) La aplicación L → Ω(a) que asocia a cada punto p ∈ L la recta que pasa por a y p es una proyectividad. (ii) La aplicación Ω(a) → L que asocia a cada recta del haz su intersección con la recta L es una proyectividad. Demostración: Sea ϕ : P1 → L una parametrización dada por ϕ(t0 : t1 ) = l0 (t0 , t1 ) : l1 (t0 , t1 ) : l2 (t0 , t1 ) , donde l0 , l1 , l2 son formas lineales en t0 , t1 . Si a tiene coordenadas (a0 : a1 : a2 ), la recta generada por a y l0 (t0 , t1 ) : l1 (t0 , t1 ) : l2 (t0 , t1 ) tiene como ecuación X0 X X 1 2 =0 a0 a1 a2 l0 (t0 , t1 ) l1 (t0 , t1 ) l2 (t0 , t1 ) es decir, sus coordenadas en P2k ∗ son (u0 : u1 : u2 ) = a1 l2 (t0 , t1 )−a2 l1 (t0 , t1 ) : a2 l0 (t0 , t1 )−a0 l2 (t0 , t1 ) : a0 l1 (t0 , t1 )−a1 l0 (t0 , t1 ) lo que da una parametrización de Ω(a). Por tanto, la aplicación de (i) es una proyectividad. 17 La aplicación de (ii) es la inversa de la de (i), con lo que también es una proyectividad (también puede verse por dualidad). Proposición 2.19. Sean L, L dos rectas distintas y sea a un punto fuera de ellas. Entonces la aplicación L → L que asocia a cada punto p ∈ L el punto de intersección de L con la recta generada por a y p es una proyectividad. Demostración: Se sigue inmediatamente de la Proposición 2.18. En efecto, L → L es la composición de L → Ω(a) que asocia a cada punto p ∈ L la recta que generan a y p (que es una proyectividad) y de Ω(a) → L que asocia a cada recta del haz su intersección con L (que es una proyectividad). Como es claro que la composición de proyectividades es una proyectividad, se sigue el resultado. Definición. Se llama perspectividad entre dos rectas a una proyectividad definida como en la Proposición 2.19. El punto a se llama centro de la perspectividad. Observemos que una perspectividad no es la proyectividad más general entre dos rectas, ya que el punto de intersección de las rectas queda fijo por una perspectividad, pero no necesariamente por una proyectividad. En realidad, veremos que el que tal punto quede fijo caracteriza las perspectividades. Para ello necesitamos en primer lugar el siguiente resultado, que es importante en sı́ mismo. Teorema 2.20. Dadas dos rectas L, L tres puntos distintos a, b, c ∈ L y tres puntos distintos a , b , c ∈ L , existe una única proyectividad f : L → L tal que f (a) = a , f (b) = b y f (c) = c . Demostración: Aplicando el Teorema 2.11, sean ϕ : P1k → L la única parametrización de L tal que ϕ(1 : 0) = a, ϕ(0 : 1) = b, ϕ(1 : 1) = c y ϕ : P1k → L la única parametrización de L tal que ϕ(1 : 0) = a , ϕ(0 : 1) = b , ϕ(1 : 1) = c . Entonces, f = ϕ ◦ ϕ−1 es una proyectividad que cumple la propiedad buscada. Además, si f es otra proyectividad en las mismas condiciones, se tiene que f ◦ ϕ es una parametrización de L que manda respectivamente (1 : 0), (0 : 1), (1 : 1) a a , b , c , por lo que de nuevo por el Teorema 2.11 se tiene f ◦ ϕ = ϕ , con lo que f = f . Teorema 2.21. Sean L, L dos rectas distintas con punto de intersección a. Entonces una proyectividad f : L → L es una perspectividad si y sólo si f (a) = a. Demostración: Sean b, c otros dos puntos de L distintos de a y tomamos b = f (b) y c = f (c). Consideramos el punto de intersección q de las rectas bb y cc . Entonces, si πq : L → L es la perspectividad de centro q, entonces es claro que πq (a) = a, πq (b) = b y πq (c) = c . Por el Teorema 2.20, se sigue que f = πq . 18 Aunque las perspectividades no sean todas las proyectividades, al menos las proyectividades se pueden obtener a partir de perspectividades: Teorema 2.22. Toda proyectividad f : L → L es composición de perspectividades. Demostración: Observamos en primer lugar que podemos suponer L = L . En efecto, si fueran L = L , tomando L = L y una perspectividad cualquiera π : L → L se tendrı́a que, supuesto demostrado el teorema para rectas distintas, f ◦ π −1 es composición de perspectividades, con lo que f también lo serı́a. Suponemos pues que L y L son dos rectas distintas e ilustraremos la demostración con la siguiente figura: L c b L' a p a' b' a'' q b'' L" c'' Sean a, b, c tres puntos distintos de L y a , b , c sus respectivas imágenes por f en L , con la condición de que ni c ni c son el punto de intersección de L y L . Sea p un punto de la recta cc distinto de c y c . Tomamos una recta L que pase por c pero que no pase ni por c ni por a . Sean a y b los respectivos puntos de intersección de L con las rectas pa y pb. Finalmente, sea q el punto de intersección de las rectas a a y b b . Si πp : L → L es la perspectividad de centro p y πq : L → L es la perspectividad de centro q se tiene πp f L −→ L −→ L a → a → a b → b → b c → c → c con lo que, por el Teorema 2.20, se tiene f = πq ◦ πp . Teorema 2.23 (Desargues). Sean a, b, c, a , b , c dos ternas de puntos no alineados y todos ellos distintos entre sı́. Sean los puntos p = ab ∩ a b , q = ac ∩ a c y r = bc ∩ b c . Entonces las rectas aa , bb , cc son concurrentes en un punto si sólo si los puntos p, q, r están alineados. Demostración: Supongamos en primer lugar que las rectas aa , bb , cc son concurrentes en un punto o. Ilustramos la demostración con la siguiente figura: 19 p L a' t a o b t' L' b' c t'' c' r L'' q Escribimos L = aa , L = bb , L = cc , t = pr ∩L, t = pr ∩L , t = pr ∩ L y definimos πp la perspectividad de L sobre L con centro p y πr la proyectividad de L sobre l con centro r. Se tendrá πp πr L L −→ L −→ o → o → o a → b → c → b → c a t → t → t La composición πr ◦ πp es una proyectividad que deja fijo el punto o, luego por el Teorema 2.21 es una perspectividad, y su centro es necesariamente ac ∩ a c = q. Como la imagen de t por esta perspectividad es t , se tiene que t, t , q están alineados, es decir, que q está en la recta generada por t, t , que es la recta p, r, por lo que p, q, r están alineados. El recı́proco es precisamente el enunciado dual del que acabamos de demostrar. 20 3. Razón doble En esta sección definiremos el concepto más importante de geometrı́a proyectiva, que ya veremos más adelante que es el que caracteriza tal geometrı́a. Definición. Sean a, b, c, d cuatro puntos distintos de una recta L. Sea ϕ : P1k → L la única parametrización de L tal que ϕ(1 : 0) = a, ϕ(0 : 1) = b, ϕ(1 : 1) = c. Si d = ϕ(ρ0 : ρ1 ), llamaremos razón doble de los cuatro puntos a ρ := ρρ01 , y la denotaremos normalmente por [a, b, c, d] (OJO: la definición no es unánime, y para muchos la razón doble es ρρ10 , es decir, el valor inverso del que definimos nosotros). A veces suele extenderse la definición a los casos d = a, b, c, en que ρ = ∞, 0, 1, respectivamente; si no, ρ toma valores en k \ {0, 1}. Antes de ver las propiedades de la razón doble, veamos cómo se calcula, lo que nos ayudará a entender su significado geométrico. Lema 3.1. Sean a = (a0 : a1 : a2 ), b = (b0 : b1 : b2 ), c cuatro puntos alineados de modo que la recta que los Entonces a0 c0 b0 a1 c1 b1 [a, b, c, d] = a0 d0 b0 a1 d1 b1 = (c0 : c1 : c2 ), d = (d0 : d1 : d2 ) contiene no pasa por (0 : 0 : 1). d0 d1 c0 c1 (obviamente, se obtienen resultados simétricos si se supone que (1 : 0 : 0) o (0 : 1 : 0) no están en la recta). Demostración: Para calcular la única parametrización ϕ de la recta abcd que manda (1 : 0), (0 : 1), (1 : 1) respectivamente a a, b, c seguimos los pasos del Teorema 2.11. Observamos en primer lugar que, como (1 : 0 : 0) no está alineado con a, b, c, d, por ejemplo 1 0 0 a0 b0 a1 b1 = a0 a1 a2 = 0, y lo mismo para los menores de orden dos formados por b0 b1 b2 las dos primeras coordenadas de cualquier par de puntos entre a, b, c, d. Esto quiere decir que, a la hora de escribir las coordenadas de c en función de las de a y b basta trabajar con las dos primeras coordenadas. Entonces un simple cálculo (por ejemplo con la regla de Cramer) muestra que: c0 b0 a0 c0 c1 b1 a1 c1 (a0 , a1 , a2 ) + (c0 , c1 , c2 ) = a0 b0 (b0 , b1 , b2 ) a b 0 0 a1 b1 a1 b1 con lo que ϕ tendrá de ecuación (t0 : t1 ) → 21 c ( 0 c1 a0 b0 t + a 0 0 a1 b1 c0 b t c1 0 1 c : 0 c1 a0 b0 t + a 1 0 a1 b1 c0 b t c1 1 1 c : 0 c1 a0 b0 t + a 2 0 a1 b1 c0 b t ) c1 2 1 (después de quitar denominadores). Repitiendo las mismas cuentas con d al puesto de c, se tendrá d 0 b0 a0 d0 d 1 b1 a1 d1 (a0 , a1 , a2 ) + (d0 , d1 , d2 ) = a0 b0 (b0 , b1 , b2 ) a0 b0 a1 b1 a1 b1 lo que indica que el valor (d0 : d1 : d2 ) se alcanza en la parametrización para d0 d1 (ρ0 : ρ1 ) = ( c0 c1 b0 a0 b1 a1 : b0 a0 b1 a1 d0 d1 ) c0 c1 de donde sigue el resultado. Observación 3.2. Usemos la fórmula anterior para interpretar la razón doble de cuatro puntos afines que estén en una recta que no sea vertical (recordemos que las rectas afines verticales son las que pasan por el punto (0 : 0 : 1)). Tomamos entonces cuatro puntos alineados (a1 , a2 ), (b1 , b2 ), (c1 , c2 ), (d1 , d2 ) de forma que sus segundas coordenadas sean siempre distintas. Una vez Identificados con los correspondientes puntos del plano proyectivo (1 : a1 : a2 ), (1 : b1 : b2 ), (1 : c1 : c2 ), (1 : d1 : d2 ), su razón doble es [a, b, c, d] = (c1 − a1 )(d1 − b1 ) = (d1 − a1 )(c1 − b1 ) c1 −a1 d1 −a1 c1 −b1 d1 −b1 c1 −a1 d1 −a1 representa la proporción entre el vector ac y el vector ad 1 (lo que se llama la razón simple de a, d, c), mientras que dc11−b −b1 es la proporción entre bc y (es decir, la razón simple de b, d, c). La razón simple es invariante por afinidades (ya bd Por estar a, b, c alineados, que éstas preservan las proporciones), y de hecho el preservar la razón simple de ternas caracteriza a las afinidades. En geometrı́a proyectiva, sin embargo, las proyectividades no preservan las proporciones. Piénsese en tres puntos alineados a, b, c, con b entre a y c. Si “miramos” la recta desde un punto externo entre a y b (es decir, si hacemos una perspectividad desde dicho punto) nos parecerá ver que proporcionalmente, la distancia entre a y b es mucho mayor que la distancia entre b y c, mientras que mirando desde un punto externo entre b y c nos parecerá ahora que la distancia entre b y c es mucho mayor que la distancia entre a y b. El resultado central en geometrı́a proyectiva es que lo que permanecerá invariante no serán las proporciones (i.e. la razón simple), sino la doble 22 proporción (i.e. la proporción entre proporciones, el cociente entre dos razones simples: la razón doble; de ahı́ su nombre). Observación 3.3. Tomemos ahora a como punto del infinito de la recta bcd. Usando de nuevo la fórmula del Lema 3.1 obtendremos ahora d 1 − b1 [a, b, c, d] = c1 − b1 es decir, la razón simple de b, c, d. Nótese que d será el punto medio de c y d si y sólo si = −bc, es decir, si la razón simple de b, c, d (que hemos dicho que es [a, b, c, d] es −1. bd Definición. Se llama cuaterna armónica a cuatro puntos alineados a, b, c, d tales que [a, b, c, d] = −1. Veamos que, efectivamente, las proyectividades preservan la razón doble (y que de hecho están caracterizadas por esta propiedad): Teorema 3.4. Sea f : L → L una aplicación inyectiva entre dos rectas. Entonces f es una proyectividad si y sólo si para cada a, b, c, d ∈ L distintos se tiene [a, b, c, d] = [f (a), f (b), f (c), f (d)]. Demostración: Supongamos en primer lugar que f es una proyectividad y sean cuatro puntos distintos a, b, c, d ∈ L. Sea ϕ : P1k → L la única parametrización de L que manda (1 : 0), (0 : 1), (1 : 1) respectivamente a a, b, c. Si ρ = [a, b, c, d], entonces ϕ(ρ : 1) = d. Por otra parte, f ◦ ϕ es una parametrización de L que manda (1 : 0), (0 : 1), (1 : 1) respectivamente a f (a), f (b), f (c), y por tanto es la única. Como f ◦ ϕ(ρ : 1) = f (d), se sigue que [f (a), f (b), f (c), f (d)] = ρ, y por tanto coincide con [a, b, c, d], como querı́amos. Recı́procamente, supongamos que f conserva la razón doble. Fijamos tres puntos distintos a, b, c ∈ L y consideramos la única proyectividad g : L → L tal que g(a) = f (a), g(b) = f (b), g(c) = f (c) (son tres puntos distintos por ser f inyectiva). Queremos ver que g = f . Para ello tomamos cualquier otro punto d ∈ L y veamos que g(d) = f (d). Por hipótesis, [a, b, c, d] = [f (a), f (b), f (c), f (d)], mientras que por la parte ya demostrada, sabemos que [a, b, c, d] = [g(a), g(b), g(c), g(d)] = [f (a), f (b), f (c), g(d)]. Por tanto, [f (a), f (b), f (c), f (d)] = [f (a), f (b), f (c), g(d)]. Sea ϕ : P1k → L la única parametrización tal que (1 : 0), (0 : 1), (1 : 1) van a parar respectivamente a f (a), f (b), f (c). Por definición de razón doble, si ρ = [f (a), f (b), f (c), f (d)], entonces ϕ(ρ : 1) = f (d), y como también ρ = [f (a), f (b), f (c), g(d)], se tiene ϕ(ρ : 1) = g(d), luego g(d) = f (d). Corolario 3.5. Sean a, b, c, d y a , b , c , d dos cuaternas de puntos alineados. Entonces se tiene que [a, b, c, d] = [a , b , c , d ] si y sólo si existe una composición de perspectividades que manda una cuaterna a otra. Demostración: Es conssecuencia inmediata del Teorema 3.4 y del Teorema 2.22. 23 Observación 3.6. Nótese que la última parte de la demostración del Teorema 3.4 en realidad demuestra que, en general, dados puntos a , b , c , d , e en una recta L tales que [a , b , c , d ] = [a , b , c , e ], entonces d = e . Veamos una aplicación de la observación anterior. Para ello, necesitaremos previamente una definición. Definición. Llamaremos complexificación de una recta proyectiva real L a la recta compleja LC que tiene en el plano proyectivo la misma ecuación de L. Equivalentemente, si L es la recta que pasa por dos puntos reales a, b, LC es la recta del plano proyectivo que pasa por a y b. Proposición 3.7. Sean L, L rectas proyectivas reales y sean a, b, c ∈ LC tres puntos distintos, y a , b , c ∈ LC sus respectivas imágenes por una proyectividad f : LC → LC . Si se verifica que f (ā) = a , f (b̄) = b , f (c̄) = c (donde la barra indica conjugación), entonces ¯ = f (d). En particular, f manda puntos reales a para cualquier d ∈ LC se verifica f (d) puntos reales y define una proyectividad entre las rectas reales. Como consecuencia, las siguientes son condiciones suficientes para que una proyectividad f : LC → LC induzca una proyectividad de L en L : (i) f manda tres puntos reales a tres puntos reales. (ii) f manda un punto real a un punto real y un par de puntos imaginarios conjugados a un par de puntos imaginarios conjugados. (iii) f manda dos pares de puntos conjugados a dos pares de puntos conjugados. Demostración: Por la Observación 3.6 bastará ver que, para todo d = a, b, c, se tiene ¯ = [a , b , c , f (d)]. Como la fórmula del Lema 3.1 implica claramente que la [a , b , c , f (d)] razón doble de los conjugados de cuatro puntos es el conjugado de la razón doble de los ¯ = [ā , b̄ , c̄ , f (d)] cuatro puntos, dicha igualdad será equivalente a [a , b , c , f (d)] ¯ = [a, b, c, d] ¯ y Por ser f una proyectividad, el Teorema 3.4 implica [a , b , c , f (d)] [ā , b̄ , c̄ , f (d)] = [ā, b̄, c̄, d] que claramente son conjugados el uno del otro, lo que demuestra la igualdad que querı́amos. ¯ = f (d), lo que implica que f (d) es Si d es real, entonces d¯ = d, con lo que f (d) = f (d) real. El hecho de que f restringida a la parte real de L sea una proyectividad es de nuevo consecuencia del Teorema 3.4, ya que f conserva la razón doble. Observación 3.8. La parte (i) de la proposición anterior es inmediata, ya que por el Teorema 2.20 existe una única proyectividad (tanto de L a L como de LC a LC que manda tres puntos dados a tres puntos dados). Lo novedoso (y que usaremos más adelante) es que las partes (ii) y (iii) permiten definir proyectividades reales definiéndolas a partir de las 24 imágenes de puntos imaginarios. Cabrı́a pensar que basta mandar dos puntos imaginarios conjugados a dos puntos imaginarios conjugados para tener una proyectividad real, pero no es ası́. Por ejemplo, la proyectividad de {X0 = 0} (0 : X1 : X2 ) → (2X0 + iX1 : −iX0 + 2X1 ) manda (0 : 1 : i) y (0 : 1 : −i) a sı́ mismos, pero por ejemplo la imagen de (0 : 1 : 0) es el punto imaginario (0 : 2 : −i). Observación 3.9. De la fórmula del Lema 3.1 se deduce inmediatamente que, si [a, b, c, d] = ρ, entonces: [a, b, c, d] = [b, a, d, c] = [c, d, a, b] = [d, c, b, a] = ρ [b, a, c, d] = [a, b, d, c] = [c, d, b, a] = [d, c, a, b] = 1 ρ Cabe preguntarse pues qué ocurre al hacer las demás permutaciones del conjunto de puntos. Por ejemplo, d0 c0 b0 a0 d1 c1 b1 a1 a b c d − a0 b1 c1 d0 − a1 b0 c0 d1 + a0 b1 c0 d1 =− 1 0 1 0 [d, b, c, a] = a0 d0 b0 c0 d0 a0 b0 c0 d1 a1 b1 c1 a1 d1 b1 c1 que, sumado con a0 a1 ρ = a0 a1 c0 b0 d0 c1 b1 d1 a b c d − a0 b1 c1 d0 − a1 b0 c0 d1 + a1 b1 c0 d0 = 0 0 1 1 a0 d0 b0 c0 d0 b0 c0 a1 d1 b1 c1 d1 b1 c1 da a0 b0 c1 d1 + a1 b1 c0 d0 − a1 b0 c1 d0 − a0 b1 c0 d1 (a0 d1 − a1 d0 )(b0 c1 − b1 c0 ) = =1 a0 d0 b0 c0 a0 d0 b0 c0 a1 d1 b1 c1 a1 d1 b1 c1 Por tanto, y observando las simetrı́as que ya tenı́amos: [d, b, c, a] = [b, d, a, c] = [c, a, d, b] = [a, c, b, d] = 1 − ρ De aquı́ se sigue fácilmente, combinando permutaciones anteriores: [b, d, c, a] = [a, c, d, b] = [d, b, a, c] = [c, a, b, d] = 25 1 1−ρ [a, d, c, b] = [d, a, b, c] = [c, b, a, d] = [b, c, d, a] = 1 − ρ 1 = 1−ρ ρ−1 [d, a, c, b] = [a, d, b, c] = [c, b, d, a] = [b, c, a, d] = ρ−1 ρ Ası́ que la razón doble de cuatro puntos, al hacer todas las permutaciones posibles del orden de los puntos, toma seis valores. Dichos seis valores son distintos, excepto cuando las posibles razones dobles son {−1, 12 , 2} (que corresponde a una cuaterna armónica y sus √ √ permutaciones) o { 1+2 3i , 1−2 3i }. Observación 3.10. Dadas cuatro rectas L1 , L2 , L3 , L4 concurrentes en un punto a, tiene sentido hablar de su razón doble, ya que son cuatro puntos del haz Ω(a), que es una recta ∗ en P2k . Además, dada cualquier recta L que no pase por a, si llamamos ai = L∩Li , se tiene que [L1 , L2 , L3 , L4 ] = [a1 , a2 , a3 , a4 ], aplicando el Teorema 3.4 y el hecho (ver Proposición 2.18) de que la aplicación f : Ω(a) → L definida por f (L ) = L ∩ L es una proyectividad. Observación 3.11. De la fórmula del Lema 3.1 para calcular la razón doble de cuatro puntos, se sigue que, si a, b, c, d, e son cuatro puntos alineados, entonces [a, b, c, d][a, b, d, e] = [a, b, c, e]. El motivo geométrico para esta igualdad se obtiene de pensar que a es el punto del infinito y bc, [a, b, d, e] es de la recta, por lo que [a, b, c, d] es la proporción entre los vectores bd y bd, mientras que [a, b, c, e] es la proporción entre la proporción entre los vectores be y bc. De hecho, esta observación nos permite construir geométricamente los vectores be el producto de dos razones dobles. En efecto, si [a, b, c, d] = λ y [a , b , c , d ] = λ , es siempre posible mediante perspectividades encontrar e tal que [a, b, d, e] = λ . Por tanto, [a, b, c, e] = λλ . La construcción de la suma de razones dobles es más complicada, pero también puede hacerse geométricamente: Proposición 3.11. Sean a, b dos puntos distintos de una recta L y sean d1 , d2 ∈ L\{a, b}. Dada L una recta cualquiera que pase por a y un punto cualquiera fuera de L y L , sean b , d2 las imágenes en L por la perspectividad desde p. Consideramos los puntos q = b d1 ∩ ap y d = qd2 ∩ L. Entonces [a, b, c, d] = [a, b, c, d1 ] + [a, b, c, d2 ] para cualquier punto c ∈ L. 26 p q a d d2 d1 d' 2 b L' L b' Demostración: Si tomamos la recta ap como recta del infinito, entonces las rectas L y L 2 = bd = d1 d, de donde se sigue el resultado. son paralelas. Además, tendremos bd 2 27 4. Cónicas proyectivas Ejemplo 4.1. Si consideramos la ecuación X02 + X12 + X22 = 0 en P2R , es claro que no hay ningún punto que la satisfaga. Lo mismo puede decirse de la ecuación X02 + X12 + 4X22 = 0. Sin embargo, en cierto modo deberı́amos considerar que son cónicas distintas, ya que la primera pasa por el punto imaginario (0 : 1 : i), mientras que la segunda no pasa por él. En ese sentido, vamos a considerar las cónicas como ecuaciones, no como conjuntos de puntos (si trabajamos sobre un cuerpo algebraicamente cerrado, ambos conceptos son sin embargo equivalentes). Definición. Una cónica en P2k es una ecuación de la forma u00 X02 + u01 X0 X1 + u02 X0 X2 + u11 X12 + u12 X1 X2 + u22 X22 . Dos cónicas se considerarán iguales si y sólo si sus respectivas ecuaciones son proporcionales. De todas formas, recurriremos muchas veces al abuso de notación de considerar la cónica como el conjunto de puntos que satisfacen la ecuación. Cuando la caracterı́stica de k es distinta de dos (cosa que supondremos en todo este capı́tulo), la ecuación se puede escribir de forma matricial como    u00 u201 u202 X0 (X0 X1 X2 )  u201 u11 u212   X1  = 0 u12 u02 u22 X2 2 2 con lo que una cónica se puede siempre identificar con una matriz simétrica no nula de orden tres módulo multiplicación por constante. Recordemos de Álgebra Lineal que toda matriz simétrica A se puede diagonalizar (por congruencia), en el sentido de que existen matrices de orden tres P y D tales que P tiene determinante no nulo, D es diagonal y A = P t DP . Esto quiere decir que la ecuación de toda cónica se puede escribir de la forma     0 λ0 0 X0 (X0 X1 X2 )P t  0 λ1 0  P  X1  = 0. X2 0 0 λ2     X0 X0 En otras palabras, si escribimos  X1  = P  X1 , la ecuación de la cónica quedará de X2 X2 2 2 2 la forma λ0 X0 + λ1 X1 + λ2 X2 = 0.   X0 Definición. Llamamos cambio de coordenadas en P2k a una expresión de la forma  X1  = X2   X0 P  X1 , donde P es una matriz de orden tres de determinante no nulo. Nótese que X2 28 un cambio de coordenadas manda polinomios homogéneos de grado d a polinomios homogéneos de grado d. Sin embargo, si se piensa en el plano como completado de un plano afı́n, hay que notar que en las nuevas coordenadas la recta del infinito ya no tiene por qué ser X0 = 0. Veamos, en función de λ0 , λ1 , λ2 , los tipos de cónicas que tenemos. Recordemos también de Álgebra Lineal que el rango de A es el número de λi distintos de cero. Caso 1) rg(A) = 1. Supongamos por ejemplo λ1 = λ2 = 0, con lo que tras el cambio de coordenadas 2 2 nos queda la ecuación λ0 X0 = 0, o equivalentemente X0 = 0. Escribiendo P = (pij ), tendremos X0 = p00 X0 +p01 X1 +p02 X2 , con lo que la ecuación original es (p00 X0 +p01 X1 + p02 X2 )2 = 0, que es una recta doble. Caso 2) rg(A) = 2. Supongamos por ejemploλ2 = 0, con lo que tendremos la ecuación λ0 X0 +λ1 X1 = 0, 2 2 que es equivalente a X0 = ± − λλ10 X1 . Deshaciendo el cambio de coordenadas tendremos las dos rectas (distintas) λ1 λ1 λ1 (p00 + − p10 )X0 + (p01 + − p11 )X1 + (p02 + − p12 )X2 = 0 λ0 λ0 λ0 λ1 λ1 λ1 (p00 − − p10 )X0 + (p01 − − p11 )X1 + (p02 − − p12 )X2 = 0 λ0 λ0 λ0 En principio, si el cuerpo k no es algebraicamente cerrado, puede ocurrir − λλ10 ∈ k, en cuyo caso las dos rectas serı́an imaginarias conjugadas. Obsérvese que, en contraste con el caso afı́n, no hay que distinguir si las rectas se cortan o no, ya que dos rectas del plano proyectivo se cortan siempre. Caso 3) rg(A) = 3. Dependiendo de cómo sea el cuerpo k tendremos más o menos subcasos. Si k es algebraicamente cerrado, a la hora de diagonalizar A sabemos que podemos obtener λ0 = λ1 = λ2 = 1, con lo que todas las cónicas son equivalentes, después de un cambio de 2 2 2 coordenadas, a X0 + X1 + X2 = 0. Si en cambio k = R, a la hora de diagonalizar la matriz simétrica A, tendremos varios casos, dependiendo de la signatura de A: –Si la signatura de A es (3, 0), podremos obtener λ0 = λ1 = λ2 = 1, con lo que después 2 2 2 de un cambio de coordenadas tendremos X0 + X1 + X2 = 0, que no tiene puntos reales. Lo mismo ocurre si la signatura es (0, 3), ya que basta con cambiar el signo a toda la ecuación de la cónica. –Si la signatura de A es (2, 1), podremos obtener λ0 = λ1 = 1, λ2 = −1, con lo que 2 2 2 después de un cambio de coordenadas tendremos X0 + X1 − X2 = 0, que ahora sı́ tiene puntos reales. Como antes, obtenemos lo mismo si la signatura es (1, 2). 29 Definición. Llamaremos cónica no degenerada a una cónica representada por una matriz de rango tres. Si no tiene puntos en P2k , diremos que es una cónica imaginaria. Resumimos a continuación en sendas tablas la clasificación de cónicas que hemos obtenido cuando k es algebraicamente cerrado y cuando k = R. Cónicas en P2k con k algebraicamente cerrado Tipo de cónica Caracterización Cónica no degenerada rg(A) = 3 Par de rectas rg(A) = 2 Recta doble rg(A) = 1 Cónicas en P2R Tipo de cónica Caracterización Cónica no degenerada real rg(A) = 3, sgn(A) = (2, 1), (1, 2) Cónica no degenerada imaginaria rg(A) = 3, sgn(A) = (3, 0), (0, 3) Par de rectas reales rg(A) = 2, sgn(A) = (1, 1) Par de rectas imaginarias conjugadas rg(A) = 2, sgn(A) = (2, 0), (0, 2) Recta doble rg(A) = 1 Proposición 4.2. Sea C el conjunto de puntos de una cónica no degenerada de matriz A b2 ) distinto y sea a = (a0 : a1 : a2 ) un punto de C. Entonces, para cada punto b = (b0 : b1 :   b0 de a, la recta ab corta a C en un solo punto distinto a a, excepto si (a0 a1 a2 )A  b1  = 0, b2 en que la intersección es sólo el punto a. Demostración: Parametrizamos la recta que pasa por a y b de la forma (x0 : x1 : x2 ) = (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) y sustituyendo en la ecuación de la cónica obtenemos que los puntos de la intersección de la recta y C corresponden a las soluciones de       a0 b0 b0 (a0 a1 a2 )A  a1  t20 + 2 (a0 a1 a2 )A  b1  t0 t1 + (b0 b1 b2 )A  b1  t21 = 0. a2 b2 b2 30 El coeficiente de t20 es cero, ya que a está en la cónica, con lo que obtenemos que las soluciones son t1 = 0 (que da el punto a) y las soluciones de     b0 b0    2 (a0 a1 a2 )A b1 t0 + (b0 b1 b2 )A b1  t1 = 0. b2 b2 Basta ver que la ecuación anterior no es idénticamente nula, porque entonces nos dará una   b0 segunda solución, que coincidirá con la primera si y sólo si (a0 a1 a2 )A  b1  = 0. b2     b0 b0 Supongamos pues que (a0 a1 a2 )A  b1  = 0 y (b0 b1 b2 )A  b1  = 0. Eso b2 b2 quiere decir (junto con la condición de que a está en C) que tanto a como b verifican     X0 X0    = 0 y (b0 b1 b2 )A X1  = 0, es decir, que amlas ecuaciones (a0 a1 a2 )A X1 X2 X2 bas ecuaciones representan a la recta ab y por tanto son proporcionales. Es decir, existe λ ∈ k tal que (a0 a1 a2 )A = λ(b0 b1 b2 )A. Multiplicando por A−1 obtendrı́amos (a0 , a1 , a2 ) = λ(b0 , b1 , b2 ), lo que es absurdo porque (a0 , a1 : a2 ) = (b0 : b1 : b2 ). Definición. Dada una cónica no degenerada de matriz A y un punto a = (a0 : a1 : a2 ) de la misma,se llama recta tangente a la cónica en el punto a a la recta de ecuación  X0 (a0 a1 a2 )A  X1  = 0. Más en general, dado un punto b = (b0 : b1 : b2 ), no neceX2 sariamente en la cónica,  sellama recta polar del punto respecto de la cónica a la recta de X0  ecuación (b0 b1 b2 )A X1  = 0. X2 Corolario 4.3. Una cónica no degenerada C no contiene tres puntos alineados, y en particular no contiene rectas. Demostración: La primera parte es consecuencia inmediata de la Proposición 4.2. La segunda parte se obtiene del hecho de que cualquier recta proyectiva contiene al menos tres puntos distintos (ya que está en biyección con P1k , que contiene los puntos distintos (1 : 0), (0 : 1), (1 : 1)). Proposición 4.4. Dada una cónica no degenerada de matriz A, el conjunto de rectas ∗ tangentes a ella forma una cónica en P2k de matriz A−1 . 31 Demostración: Por definición, un punto (u0 : u1 : u2 ) ∈ P2k representa los coeficientes de una recta tangente a la cónica si y sólo (u0 u1 u2 ) = (a0 a1 a2 )A para algún (a0 : a1 : a2 ) −1 de la cónica. Equivalentemente (a0 a1 a2 ) = (u0 u1 u2 )A deben ser las coordenadas de   u0 un punto de la curva, es decir, (u0 u1 u2 )A−1 A(A−1 )t  u1  = 0. Como A es simétrica, u2 (A−1 )t = A−1 , lo que concluye el resultado. ∗ Definición. Dada una cónica no degenerada C de matriz A se llama cónica dual de C, y ∗ se denota por C ∗ , a la cónica de P2k de matriz A−1 . Se llama polo de una recta L respecto ∗ de la cónica C al punto de P2k que corresponde a la recta de P2k polar de L respecto de C ∗. Observación 4.5. El concepto de polaridad es el realmente importante a la hora de describir una cónica y, de hecho, explica la definición, en apariencia artificiosa, que hemos dado de cónica como ecuación y no como conjunto de puntos. En efecto, las cónicas del Ejemplo 4.1 son realmente distintas porque la recta polar del punto (0 : 1 : 1) es X1 + X2 = 0 respecto de la cónica X02 + X12 + X22 = 0, mientras que es X1 + 4X2 = 0 respecto de la cónica X02 + X12 + 4X22 = 0. Recogemos las propiedades de la polaridad en el siguiente resultado: Proposición 4.6. Sea C una cónica no degenerada de matriz A. Entonces: (i) Un punto a es el polo de una recta L si y sólo si la recta L es la recta polar de a. (ii) Un punto a está en la polar de un punto b si y sólo si b está en la polar de a si y sólo si a está en la recta tangente a C en b si y sólo si b está en la recta tangente a C en a. (iii) Un punto pertenece a su recta polar si y sólo si es un punto de la cónica. (iv) Una recta pasa por su polo si y sólo si la recta es tangente a C. (v) El polo de la recta que pasa por los puntos a y b es la intersección de las rectas polares de a y b. (vi) La recta polar de la intersección de las rectas L y L es la recta que pasa por los polos de L y L . Demostración: Si a = (a0 : a1: a2 )y L tiene coordenadas 0 : u1 : u2 ), entonces L es la  (u a0 u0    recta polar de a si y sólo si A a1 es proporcional a u1 , mientras que a es el polo a2 u2     u0 a0 −1    u1 es proporcional a a1 , y ambas condiciones son claramente de L si y sólo si A u2 a2 equivalentes. 32 La parte (ii) es clara,ya  que, por la Proposición 4.2, todas esas condiciones son  b0 a0    equivalentes a (a0 a1 a2 )A b1 = 0 (que es equivalente a (b0 b1 b2 )A a1  = 0 por la b2 a2 simetrı́a de A), siendo a = (a0 : a1 : a2 ), b = (b0 : b1 : b2 ). Haciendo a = b, obtenemos la parte (iii), de la que (iv) es su aplicación a C ∗ . Por (i) c es el polo de la recta que pasa por a y b si y sólo si la recta polar de c es la recta que pasa por a y b, que por (ii) es equivalente a que c esté en las rectas polares de a y b, es decir, c es la intersección de dichas rectas polares. Esto demuestra (v), y de nuevo (vi) es lo mismo pero en C ∗ . Ejemplo 4.7. Aplicando la Proposición 4.2 a C ∗ , tendremos que cada haz de rectas con base fuera de C contiene dos rectas tangentes a C. Hay dos modos de calcular dichas rectas. Veamos ambos métodos por ejemplo para calcular las rectas tangentes a la cónica C de ecuación X0 X2 − X12 = 0 que pasan por el punto (0 : 1 : 1): Método 1) Según hemos visto, la tangente en un punto a de C pasa por (0 : 1 : 1) si y sólo  recta  si a está 1enla  polar de (0 : 1 : 1). Dicha recta polar tiene de ecuación X0 0 0 2    (0 1 1) 0 −1 0 X1  = 0, es decir, X0 − 2X1 = 0. Por tanto, los puntos de C 1 0 0 X2 2 cuya tangente pasa por (0 : 1 : 1) son los puntos de intersección de dicha recta con la cónica. Es un simple ejercicio ver que dichos puntos son (0 : 0 : 1) y (4 : 2 : 1), y sus respectivas rectas tangentes son X0 = 0 y X0 − 4X1 + 4X2 = 0, que efectivamente pasan por (0 : 1 : 1) (si uno tiene fe, puede ahorrarse el calcular las rectas tangentes, y calcular directamente la recta por (0 : 0 : 1) y (0 : 1 : 1) y la recta por (4 : 2 : 1) y (0 : 1 : 1)). Método 2) Según 4.4, el conjunto de rectas tangentes a C es una cónica  la Proposición  0 0 2 en P2k de matrix  0 −1 0 , es decir, la cónica de ecuación U12 − 4U0 U2 = 0. Por otra 2 0 0 ∗ parte, el haz de rectas que pasan por el punto (0 : 1 : 1) ∈ P2k es la recta de P2k de ecuación U1 + U2 = 0. Se calcula fácilmente que la cónica U12 − 4U0 U2 = 0 y la recta U1 + U2 = 0 ∗ se cortan en los puntos (u0 : u1 : u2 ) = (1 : 0 : 0), (1 : −4 : 4) ∈ P2k , que son precisamente las rectas X0 = 0 y X0 − 4X1 + 4X2 = 0 de P2k . El siguiente ejemplo será ilustrativo de cómo las cónicas, al igual que las rectas, se pueden parametrizar. Ejemplo 4.8. Sea C la cónica de ecuación X0 X2 − X12 = 0 y tomemos el punto a = (1 : 0 : 0) y la recta L : X0 = 0. Parametrizamos L de la forma (t0 : t1 ) → (0 : t0 : t1 ). Una parametrización de la recta que pasa por (1 : 0 : 0) y (0 : t0 : t1 ) viene dada por (s0 : 33 s1 ) → (s0 : t0 s1 : t1 s1 ) (usamos como parámetros s0 , s1 , ya que t0 , t1 son los parámetros de la recta L), que sustituida en la ecuación de la cónica nos da t1 s0 s1 − t20 s21 = 0, que tiene como soluciones (s0 : s1 ) = (1 : 0) (que corresponde al punto a) y (s0 : s1 ) = (t20 : t1 ), que sustituido en la parametrización nos da el punto (t20 : t0 t1 : t21 ). Tenemos pues una biyeccción P1k → C definida por (t0 : t1 ) → (t20 : t0 t1 : t21 ). Proposición 4.9. Sea C una cónica no degenerada y sean a ∈ C y L una recta que no pasa por a. Sea φ : L → C la aplicación que asocia a cada p ∈ L el segundo punto de intersección de la recta ap con C (si ap es la recta tangente a C entonces φ(p) = a). Entonces, si ϕ : P1k → L es una parametización de L, la composición φ ◦ ϕ : P1k → C tiene 2 2 2 2 2 2 el aspecto (t0 : t1 ) → (c00 t0 + c01 t0 t1 + c02 t1 : c10 t0 + c11 t0 t1 + c12 t1 : c20 t0 + c21 t0 t1 + c22 t1 ), c00 c01 c02 con c10 c11 c12 = 0. c20 c21 c22 Demostración: Consiste en esencia en repetir las cuentas de la Proposición 4.2, pero sin usar notación matricial (como ilustra el Ejemplo 4.8). Por simplificar, escribiremos la parametrización ϕ como (t0 : t1 ) → (l0 : l1 : l2 ), donde l0 , l1 , l2 representan expresiones lineales homogéneas en t0 , t1 . Una parametrización de la recta que pasa por a = (a0 : a1 : a2 ) y (l0 : l1 : l2 ) será de la forma: (s0 : s1 ) → (a0 s0 + l0 s1 : a1 s0 + l1 s1 : a2 s0 + l2 s1 ) que al sustituir en la ecuación de la cónica nos dará una expresión de la forma (teniendo en cuenta que (a0 : a1 : a2 ) satisface la ecuación de la cónica, ver la demostración de la Proposición 4.2): ls0 s1 + qs21 = 0 donde l es una expresión lineal homogénea en t0 , t1 y q es una expresión cuadrática homogénea en t0 , t1 . Como la solución (s0 : s1 ) = (1 : 0) es la que nos da el punto a, φ(l0 : l1 : l2 ) corresponderá a la solución (s0 : s1 ) = (q : −l), es decir, φ(l0 : l1 : l2 ) = (q0 : q1 : q2 ) donde q0 , q1 , q2 son expresiones cuadráticas homogéneas en t0 , t1 . El resultado estará demostrado si vemos que q0 , q1 , q2 son formas linealmente independientes. Si no fuera ası́, existirı́a una relación u0 q0 + u1 q1 + u2 q2 = 0, lo que implicarı́a que la cónica C estarı́a contenida en la recta u0 X0 +u1 X1 +u2 X2 = 0, lo que es absurdo porque C (que contiene al menos tres puntos, por estar en biyección con P1k ) no puede contener tres puntos alineados (por el Corolario 4.3). Definición. Llamaremos parametrización de una cónica C a una biyección en la Proposición 4.9. 34 P1k → C como P1k → P2k de la forma (t0 : t1 ) → c00 c01 c02 (c00 t20 +c01 t0 t1 +c02 t21 : c10 t20 +c11 t0 t1 +c12 t21 : c20 t20 +c21 t0 t1 +c22 t21 ), con c10 c11 c12 = c20 c21 c22 0 es una cónica no degenerada que se puede transformar, mediante un cambio de coor2 denadas, en X0 X2 − X1 = 0. Como consecuencia, todas las cónicas no degeneradas con algún punto son equivalentes entre sı́ (en el sentido de que se puede pasar de una a otra por un cambio de coordenadas. Proposición 4.10. La imagen de cualquier aplicación Demostración: La última afirmación es consecuencia inmediata de la   laprimera por t20 x0 Proposición 4.9. Sea pues el conjunto de puntos de coordenadas  x1  = P  t0 t1  x2 t21   c00 c01 c02 1  c10 c11 c12 . Haciendo el cambio de coordedonde (t0 : t1 ) varı́a en Pk y P = c20 c21 c22     X0 X0  −1   X1  el conjunto será el constituido por los puntos de la forma nadas X1 = P X2 X2 2 (x0 : x1 : x2 ) = (t0 : t0 t1 : t21 ), que es precisamente (ver el Ejemplo 4.8) la cónica de 2 ecuación X0 X2 − X1 = 0. Deshaciendo el cambio de coordenadas, se obtiene que el 2 conjunto es una cónica (no degenerada, por serlo X0 X2 − X1 = 0). Observación 4.11. El resultado anterior puede no resultar sorprendente, porque ya sabemos que todas las cónicas complejas no degeneradas son equivalentes, y que las reales no degeneradas con signatura (2,1) o (1,2) (como es la signatura de la cónica X0 X2 − X12 = 0) también son equivalentes. Sin embargo, es más sorprendente en otros cuerpos, por ejemplo el de los racionales. En efecto, que sólo haya una clase de cónicas no imaginarias no degeneradas en P2Q es en principio sorprendente, ya que hay infinitas clases de cónicas imaginarias no degeneradas. Por ejemplo, puede demostrarse que no hay ningún cambio de variable en P2Q que transforme la ecuación X02 + X12 + pX22 = 0 en X02 + X12 + p X22 = 0 si p y p son dos números primos distintos. En la Proposición 4.9, en realidad la parametrización de la cónica viene dada por el haz de rectas Ω(a), y no por la recta L que escogemos arbitrariamente (si lo hemos hecho ası́ es sólo porque las cuentas salı́an más sencillas). En concreto, el resultado realmente canónico serı́a: Proposición 4.12. Sea C una cónica no degenerada, a un punto de C y ψ : Ω(a) → C la aplicación que asocia a cada recta L que pasa por a el segundo punto de intersección de L con C. Entonces para cualquier parametrización ϕ : P1k → Ω(a), la composición ψ ◦ ϕ : P1k → C es una parametrización de C. 35 Demostración: Sea L una recta cualquiera que no pase por a y consideremos la proyectividad (ver Proposición 2.18) f : Ω(a) → L definida por L → L ∩ L. Entonces ψ = φ ◦ f , donde φ es la aplicación φ : L → C de la Proposición 4.9. Si ϕ : P1k → Ω(a) es una parametrización de Ω(a), entonces, por ser f una proyectividad, se tendrá que f ◦ ϕ es una parametrización de L. Por tanto, por la Proposición 4.9, φ ◦ f ◦ ϕ (es decir, ψ ◦ ϕ) es una parametrización de C. Veamos ahora que, recı́procamente, toda parametrización de una cónica proviene de la proyección desde un punto de ella, que además podemos tomar arbitrariamente. Proposición 4.13. Sea C una cónica no degenerada y ϕ : P1k → C una parametrización de C. Entonces, para cualquier a ∈ C, ϕ = ψ◦ϕ, donde ψ es la aplicación de la Proposición 4.12 y ϕ : P1k → Ω(a) es una parametrización de Ω(a). Demostración: Escribimos ϕ : P1k → C de la forma (t0 : t1 ) → (q0 : q1 : q2 ), donde qi = Qi (t0 , t1 ), siendo Q0 , Q1 , Q2 ∈ k[T0 , T1 ] formas cuadráticas homogéneas (independientes). Necesitamos ver que ψ −1 ◦ ϕ es una parametrización ϕ de Ω(a), es decir, que tiene una expresión lineal en t0 , t1 . La imagen de (t0 : t1 ) será la recta que pase por a = (a0 : a1 : a2 ) y (q0 : q1 : q2 ), es decir, la recta X0 X1 X2 a0 a1 a2 = 0 q0 q1 q2 que es el punto de P2k ∗ de coordenadas (u0 : u1 : u2 ) = (a1 q2 − a2 q1 : a2 q0 − a0 q2 : a0 q1 − a1 q2 ). Aunque esto parece indicar que la expresión queda de grado dos y no de grado uno, en realidad no es ası́. En efecto, el punto a está en C, por lo que se podrá escribir (a0 : a1 : a2 ) = (Q0 (s0 , s1 ) : Q1 (s0 , s1 ) : Q2 (s0 , s1 )) para algún (s0 : s1 ) ∈ P1k , luego los polinomios a1 Q2 − a2 Q1 , a2 Q0 − a0 Q2 , a0 Q1 − a1 Q2 tienen a (s0 : s1 ) como raı́z. Por tanto, son divisibles por s1 T0 −s0 T1 (ver simultáneamente a esta demostración el Ejemplo 4.14 siguiente para ilustrar este hecho) y podremos escribir a1 Q2 − a2 Q1 = (s1 T0 − s0 T1 )A0 a2 Q0 − a0 Q2 = (s1 T0 − s0 T1 )A1 a0 Q1 − a1 Q0 = (s1 T0 − s0 T1 )A2 36 donde A0 , A1 , A2 ∈ k[T0 , T1 ] son formas lineales homogéneas. Es decir, cancelando el factor común podemos escribir (u0 : u1 : u2 ) = (A0 (t0 , t1 ) : A1 (t0 , t1 ) : A2 (t0 , t1 )) que ahora ya representa una parametrización de Ω(a). Ejemplo 4.14. Ilustramos la última parte de la demostración anterior con la cónica C : X0 X2 − X12 = 0 con su parametrización (t0 : t1 ) → (t20 : t0 t1 : t21 ) (que además, por ser todas las cónicas equivalentes a ésta por un cambio de variable, según la Proposición 4.10, sirve en realidad para cualquier cónica). Tomamos el punto a = (s20 : s0 s1 : s21 ), y entonces los coeficientes de la recta que pasa por a y (t20 : t0 t1 : t21 ) son (u0 : u1 : u2 ) = (s0 s1 t21 − s21 t0 t1 : s21 t20 − s20 t21 : s20 t0 t1 − s0 s1 t20 ). Efectivamente, todas las coordenadas son divisibles por s1 t0 − s0 t1 y, una vez eliminado el factor común, queda (u0 : u1 : u2 ) = (−s1 t1 : s1 t0 + s0 t1 : −s0 t0 ). Ahora ya no hay indeterminación para el único valor conflictivo, (t0 : t1 ) = (s0 : s1 ), para el que queda la recta de coeficientes (−s21 : 2s0 s1 : −s20 ), que es precisamente la recta tangente a C en el punto a. Corolario 4.15. Si ϕ, ϕ : P1k → C son dos parametrizaciones distintas de una cónica no degenerada C, entonces ϕ = ϕ ◦ α, donde α : P1k → P1k es un cambio de variable en P1k . Demostración: Sea ψ : Ω(a) → C la aplicación de la Proposición 4.12. Entonces, por la Proposición 4.13, ψ −1 ϕ y ψ −1 ϕ son parametrizaciones de Ω(a). Por el Lema 2.16, se tendrá que ψ −1 ϕ = ψ −1 ϕα, donde α : P1k → P1k es un cambio de variable en P1k . Componiendo a la izquierda con ψ se concluye el resultado. Corolario 4.16 (Teorema de Chasles). Sea C una cónica no degenerada y sean a, a ∈ C. Consideramos la aplicación f : Ω(a) → Ω(a ) que asocia a cada recta L que pasa por a la recta generada por a y el punto de intersección de L con C distinto de a (entendiendo que cuando L es tangente a C se define f (L) = aa , y que además f (aa ) es la recta tangente a C en a ). Entonces f es una proyectividad. Demostración: Sean ψ : Ω(a) → C y ψ : Ω(a ) → C las aplicaciones definidas en la −1 Proposición 4.12. Entonces f = ψ ◦ ψ. Sea ϕ : P1k → C una parametrización cualquiera. 37 Por la Proposición 4.13 se tiene que ψ −1 ϕ y ψ −1 ϕ son parametrizaciones de Ω(a). Como ψ −1 ϕ = f ◦ ψ −1 ϕ, se sigue que f es una proyectividad (ver Lema 2.17(i)). Observación 4.17. El corolario anterior indica que, dada una cónica no degenerada C y cuatro puntos a, b, c, d sobre ella, se puede definir su razón doble: basta escoger un punto p ∈ C y considerar la razón doble de las rectas pa, pb, pc, pd (ver la Observación 3.10). Esta definición no depende de la elección del punto p, ya que el Corolario 4.16 implica que, escogiendo otro punto p, tenemos una proyectividad f : Ω(p) → Ω(p ) tal que f (pa) = p a, f (pb) = p b, f (pc) = p c, f (pd) = p d, y por el Teorema 3.4 se tendrá [pa, pb, pc, pd] = [p a, p b, p c, pd ]. El teorema de Chasles está diciendo que, dada una cónica no degenerada, sus puntos se pueden obtener de la siguiente forma: fijamos dos puntos a, a de la cónica y tomamos la proyectividad f : Ω(a) → Ω(a ) del Corolario 4.16 (que verifica f (aa ) = aa ); entonces la cónica es el conjunto de las intersecciones L ∩ f (L) cuando L varı́a en Ω(a). El siguiente resultado afirma que una construcción general de esta forma produce siempre una cónica no degenerada: Teorema 4.18 (Construcción de Steiner). Sean a, a ∈ P2k dos puntos distintos y sea f : Ω(a) → Ω(a ) una proyectividad tal que f (aa ) = aa . Entonces el conjunto C = {L ∩ f (L) | L ∈ Ω(a)} es una cónica no degenerada que pasa por a y a . Demostración: Sea ϕ : P1k → Ω(a) una parametrización definida por (t0 : t1 ) → (u0 : u1 : u2 ) = (l0 , l1 : l2 ), donde l0 , l1 , l2 son expresiones lineales homogéneas en t0 , t1 . Como f es una proyectividad, f ◦ ϕ es una parametrización de Ω(a ), que tendrá por tanto el aspecto (t0 : t1 ) → (u0 : u1 : u2 ) = (l0 , l1 : l2 ), donde l0 , l1 , l2 son de nuevo expresiones lineales homogéneas en t0 , t1 . El conjunto C será entonces el conjunto de puntos de intersección de las rectas l 0 X 0 + l1 X1 + l2 X 2 = 0 l0 X0 + l1 X1 + l2 X2 = 0 cuando (t0 : t1 ) varı́a en P1k . Por tanto, C estará parametrizado de la forma (t0 : t1 ) → (l1 l2 − l2 l1 : l2 l0 − l0 l2 : l0 l1 − l1 l0 ). 38 Por la Proposición 4.10, el teorema estará demostrado si demostramos que las expresiones cuadráticas homogéneas l1 l2 − l2 l1 , l2 l0 − l0 l2 , l0 l1 − l1 l0 son linealmente independientes. Supongamos por tanto que no lo fueran. Eso querrı́a decir que el conjunto C estarı́a contenido en una recta L0 . Es decir, para cada L ∈ Ω(a) se tendrı́a que L ∩ f (L) es un punto de la recta L0 . En otras palabras, tendrı́amos una proyectividad entre dos rectas ∗ ∗ de P2k tal que la recta entre cada punto y su imagen pasa siempre por el punto L0 ∈ P2k , con lo que f serı́a una perspectividad de centro L0 . Sin embargo esto es absurdo, porque la imagen de aa (que es la intersección de Ω(a) y Ω(a )) no es aa . Observación 4.19. Nótese que, si en la construcción de Steiner quitamos la condición f (aa ) = aa , se tiene que la intersección L ∩ f (L) es siempre un punto excepto en el caso L = aa , en que la intersección es toda aa . Además, como se observa al final de ∗ la demostración del Teorema 4.18, f : Ω(a) → Ω(a ) serı́a una perspectividad en P2k , es decir, existirı́a una recta L0 tal que f (L) serı́a la recta generada por a y L ∩ L0 . Se tendrı́a entonces que C serı́a la unión de L0 y aa . Teorema 4.20. Sean p1 , p2 , p3 , p4 , p5 ∈ P2k cinco puntos distintos de modo que no hay tres entre ellos alineados. Entonces existe una única cónica que pasa por ellos, que además es no degenerada. Demostración: Claramente, cualquier cónica que pase por los cinco puntos es no degenerada, ya que en caso contrario la cónica deberı́a ser o un par de rectas o una recta doble, y en cualquiera de los dos casos necesariamente tres de los cinco puntos estarı́an en una recta, en contra de nuestra hipótesis. Por otra parte, por el teorema de Chasles (Corolario 4.16), si C es una cónica no degenerada que pasa por p1 , p2 , p3 , p4 , p5 , entonces existe una proyectividad f : Ω(p1 ) → Ω(p2 ) tal que f (p1 p3 ) = p2 p3 , f (p1 p4 ) = p2 p4 , f (p1 p5 ) = p2 p5 y C = {L ∩ f (L) | L ∈ Ω(p1 )}. Como f está determinada por la imagen de p1 p3 , p1 p4 , p1 p5 , se tiene que sólo existe una posibilidad para f y por tanto una única C posible. Por otra parte, la construcción de Steiner nos dice que tal construcción nos da una cónica (o un par de rectas, según la Observación 4.19). Como claramente C definida de ese modo contiene a p1 , p2 , p3 , p4 , p5 , es claro que C es una cónica no degenerada. Teorema 4.21. Sea C una cónica no degenerada y L una recta que corta a C en dos puntos distintos a, b. Entonces, para cada punto c ∈ L \ {a, b}, si c es el punto de intersección de L con la recta polar de c respecto de C, se tiene [a, b, c, c ] = −1. Demostración: Sea L la recta polar de c respecto de C y sean p1 , p2 los puntos de intersección de L con C. 39 b p1 d a p2 c Por la Observación 3.10, [a, b, c, c ] = [p1 a, p1 b, p1 c, p1 c ], mientras que por la Observación 4.17, [p1 a, p1 b, p1 c, p1 c ] = [a, b, p1 , p2 ], con lo que se tiene [a, b, c, c ] = [a, b, p1 , p2 ]. Análogamente, cambiando el papel de p1 por p2 se tendrá [a, b, c, c ] = [a, b, p2 , p1 ], que, 1 por la Observación 3.9, es [a,b,p11 ,p2 ] . Por tanto, [a, b, c, c ] = [a,b,c,c ] , de donde se deduce (teniendo en cuenta que la razón doble de cuatro puntos distintos es distinta de uno) que [a, b, c, c ] = −1. 40 5. Cónicas afines y euclı́deas En este capı́tulo redemostraremos la clasifición de cónicas afines y euclı́deas a partir de sus completados proyectivos. Empezaremos con las cónicas afines reales, iniciando por los casos más sencillos de completado proyectivo. Proposición 5.1. Sea C ∈ A2k una cónica afı́n tal que su completado proyectivo es una recta doble. Entonces C es una recta doble. Demostración: Es inmediato: si el completado proyectivo tiene ecuación (a0 X0 + a1 X1 + a2 X2 )2 = 0, entonces C es la recta doble de ecuación (a0 + a1 X + a2 Y )2 = 0. Proposición 5.2. Sea C ∈ A2k una cónica afı́n tal que su completado proyectivo C̄ es una par de rectas no imaginarias (resp. imaginarias conjugadas). Entonces se da uno de los siguientes casos: (i) La interscción de C̄ y la recta del infinito consiste en dos puntos no imaginarios (resp. imaginarios) distintos y entonces C consiste en un par de rectas secantes no imaginarias (resp. imaginarias conjugadas). (ii) La interscción de C̄ y la recta del infinito consiste un solo punto no imaginario (resp. imaginario) distintos y entonces C consiste en un par de rectas paralelas no imaginarias (resp. imaginarias conjugadas). Demostración: Si la ecuación de C̄ es (a0 X0 + a1 X1 + a2 X2 )(b0 X0 + b1 X1 + b2 X2 ) = 0, entonces la ecuación de C es (a0 + a1 X + a2 Y )(b0 + b1 X + b2 Y ) = 0, que es la unión de dos rectas. La intersección de C̄ con la recta del infinito son los puntos (0 : a2 : −a1 ) y (0 : b2 : −b1 ), que corresponden a los vectores directores de las rectas. Entonces la intersección con la recta del infinito será un solo punto si y sólo si las rectas son paralelas. Para estudiar cónicas no degeneradas necesitaremos hacer cambios de coordenadas. Recuérdese que un cambio de coordenadas afı́n tiene el aspecto      1 1 0 0 1  X  =  α a b   X  Y β c d Y a b = 0 con lo que se puede extender a un cambio de coordenadas en P2 de la con k c d forma      1 0 0 X0 X0  X1  =  α a b   X1  . (5.3) X2 X2 β c d 41 Definición. Se llama completado proyectivo de un cambio de coordenadas afı́n a un cambio de coordenadas en P2k como el anterior. Lema 5.4. Un cambio de coordenadas en P2k es el completado proyectivo de un cambio afı́n de coordenadas si y sólo si manda la recta del infinito a X0 = 0. Además, cualquier proyectividad de la recta del infinito en sı́ misma se puede ver como la restricción del completado proyectivo de un cambio de coordenadas afı́n. Demostración: Claramente, un cambio de coordenadas de la forma (5.3) manda la recta del infinito a X0 = 0. Concretamente, se tiene la expresión (0 : X1 : X2 ) = (0 : aX1 + bX2 : cX1 + dX2 ) que claramente define una proyectividad de la recta del infinito en sı́ misma. Recı́procamente, si tenemos un cambio de coordenadas de P2k    X0 p00  X1  =  p10 X2 p20 p01 p11 p21   p02 X0 p12   X1  p22 X2 si la recta del infinito va a parar a X0 = 0, en particular ocurrirá que los puntos (0 : 1 : 0) y (0 : 0 : 1), que en las nuevas coordenadas son respectivamente (p01 : p11 : p21 ) y (p02 : p12 : p22 ) deben tener la primera es decir p01 = p02 = 0. Por tratarse coordenada cero, p00 0 0 p11 p12 = 0. de un cambio de coordenadas, p10 p11 p12 = 0, es decir, p00 = 0 y p p 21 22 p20 p21 p22 Dividiendo entonces por p00 , el cambio de coordenadas queda de la forma   1 X0  X1  =  pp10 01 p20 X2 p01  p11 p12 p01 con pp01 p22 21 p01 p01 nadas afı́n. 0 0 p11 p01 p21 p01 p12 p01 p22 p01   X0   X1  X2 = 0, que es por tanto el completado proyectivo de un cambio de coorde Por otra parte, cualquier proyectividad de la recta del infinito se puede escribir de la a b = 0, con lo que viene de forma (0 : X1 : X2 ) → (0 : aX1 + bX2 : cX1 + dX2 ), con c d un cambio de coordenadas como (5.3) (que claramente no es único). Teorema 5.5. Sea C ∈ A2R una cónica afı́n tal que su completado proyectivo C̄ es una cónica no degenerada real. Entonces: 42 (i) Si C̄ corta a la recta del infinito en un solo punto (es decir, si es tangente a la recta del infinito), C es una parábola. (ii) Si C̄ corta a la recta del infinito en dos puntos reales distintos, entonces C es una hipérbola. (iii) Si C̄ corta a la recta del infinito en dos puntos imaginarios, entonces C es una elipse real. Demostración: En el caso (i), por el Teorema 2.20, podemos encontrar una proyectividad de la recta del infinito en sı́ misma que mande su punto de intersección con C̄ al punto (0 : 0 : 1), luego por el Lema 5.4 existe un cambio de coordenadas afı́n tal que el punto del infinito de C es la dirección vertical (y la recta tangente en ese punto es la recta del infinito). Eso quiere decir que la ecuación de la cónica en las nuevas coordenadas tiene el aspecto aX 2 + bX + cY + d = 0. Como C̄ es no degenerada, c = 0, con lo que la ecuación se puede escribir de la forma Y = − ac X 2 − cb X − dc , que claramente es la ecuación de una parábola. En el caso (ii), tomamos una proyectividad de la recta del infinito en sı́ misma que mande sus puntos de intersección con C̄ a (0 : 1 : 0) y (0 : 0 : 1). Usando otra vez el Lema 5.4, tendremos un cambio de coordenadas afı́n tal que los puntos del infinito de C serán el horizontal y el vertical, es decir, que en las nuevas coordenadas de tendrá ecuación d b c 2 2 aX Y + bX + cY + d con a = 0 y, por ser C̄ no degenerada, 2b 0 a2 = 0, i.e. c a 0 2 2 a(bc − ad) = 0. Dividiendo por a, la ecuación se puede escribir como (X + ab )(Y + ac ) = bc−ad a2 , que claramente corresponde a una hipérbola. En el caso (iii), por la Proposición 3.7 podemos construir una proyectividad de la recta del infinito que mande sus puntos de intersección con C̄ a los puntos (0 : 1 : i) y (0 : 1 : −i) y, como en los casos anteriores, extenderlas al completado proyectivo de un cambio de coordenadas afı́n. Como consecuencia, en  las nuevas  coordenadas, C tendrá c a2 2b ecuación X 2 + Y 2 + aX + bY + c = 0, donde la matriz  a2 1 0  tiene signatura (2, 1) b 01 2 1 0 (no puede tener signatura (1, 2), porque la submatriz diagonal tiene ya signatura 0 1 2 2 (2, 0)). Por tanto, su determinante c − a4 − b4 es negativo. La ecuación es equivalente a 2 2 2 2 (X +a)2 +(Y +b)2 +(c− a4 − b4 ) = 0, que representa una elipse real, ya que c− a4 − b4 < 0. Finalmente, estudiamos la cónicas no degeneradas imaginarias: 43 Proposición 5.6. Sea C una cónica afı́n tal que C̄ es una cónica no degenerada imaginaria. Entonces C es una elipse imaginaria. Demostración: Como C̄ es imaginaria, su intersección con la recta del infinito son dos puntos imaginarios conjugados. Como en la demostración del caso (iii) del teorema anterior, podemos encontrar un cambio afı́n de coordenadas tal que C tenga  ecuación  c a2 2b 2 2 (X + a)2 + (Y + b)2 + (c − a4 − b4 ) = 0. La diferencia es que ahora la matriz  a2 1 0  b 0 1 2 a2 b2 tiene signatura (3, 0), luego determinante c − 4 − 4 positivo, con lo que la ecuación representa una elipse imaginaria. Obsérvese que, para cada una de las posibilidades de C̄ y su intersección con la recta del infinito, nos han salido tipos de cónicas que no son afı́nmente equivalentes. Esto nos da una clasificación completa de las cónicas afines reales, que resumimos en la siguiente tabla: Clasificación de cónicas en A2R Tipo de cónica C Tipo de C̄ C̄ ∩ {X0 = 0} Hipérbola No degenerada real Dos puntos reales Parábola No degenerada real Un puntos real Elipse real No degenerada real Dos puntos imaginarios Elipse imaginaria No degenerada imaginaria Dos puntos imaginarios Par de rectas reales secantes Par de rectas reales Dos puntos reales Par de rectas reales paralelas Par de rectas reales Un punto real Par de rectas imaginarias Dos puntos imaginarios Par de rectas imaginarias Un punto real Recta doble Un punto real Par de rectas imaginarias conjugadas secantes Par de rectas imaginarias conjugadas paralelas Recta doble Obsérvese que la clasificación de cónicas afines complejas consiste en la anterior quitando todos los casos imaginarios, quedando por tanto como posibilidades la hipérbola, la parábola, el par de rectas secantes, el par de rectas paralelas y la recta doble. En general, para cónicas afines sobre cualquier cuerpo k, seguiremos usando el nombre elipse, parábola, 44 etc. de acuerdo con la tabla anterior, según cómo sea C̄ y su intersección con la recta del infinito. Ejemplo 5.7. Fijémonos por un instante en el caso de la hipérbola. En la ecuación reducida que hemos obtenido en la demostración del Teorema 5.5, está claro que las ası́ntotas son X + ab = 0 e Y + ac = 0 después del cambio de coordenadas. Una pregunta natural es si se pueden calcular sin hacer el cambio de coordenadas. En estas nuevas coordenadas, el completado proyectivo C̄ tiene ecuaciones  d (X0 X1 X2 )  2b c 2 b 2 0 a 2  X0   X1  = 0 X2 0 c 2 a 2  de donde se obtiene que las tangentes a C̄ en sus puntos del infinito (0 : 1 : 0) y (0 : 0 : 1) son respectivamente las rectas 2b X0 + a2 X2 = 0 y 2c X0 + a2 X1 = 0, que son precisamente los completados proyectivos de las ası́ntotas. Esto motiva la siguiente: Definición. Dada una cónica afı́n no degenerada C en A2k tal que su completado corta a la recta del infinito en dos puntos distintos, llamaremos ası́ntotas de la cónica a la parte afı́n de las tangentes a C̄ en los puntos del infinito. Obsérvese que estamos excluyendo el caso de la parábola, en que hay un solo punto en el infinito, cuya recta tangente es la propia recta del infinito, por lo que no tiene parte afı́n. Estamos admitiendo también la existencia de ası́ntotas en el caso de la elipse (imaginaria o no), pero en tal caso serán dos rectas imaginarias. Obsérvese que, sin embargo, estas dos rectas imaginarias se cortan en un punto no imaginario. En efecto, si p1 , p2 son los dos puntos del infinito de C (imaginarios o no), las tangentes a C̄ en p1 y p2 son las rectas polares de dichos puntos, con lo que su intersección será el polo de la recta p1 p2 , es decir, de la recta del infinito (ver la Proposición 4.6(v)), que no es imaginario. Esto motiva de nuevo otra definición. Definición. Se llama centro de una cónica afı́n no degenerada al polo de la recta del infinito. Una cónica cuyo centro sea un punto afı́n (es decir, que no sea una parábola) se llama cónica con centro. Pasamos ahora a estudiar las cónicas euclı́deas. Toda cónica euclı́dea es una cónica afı́n, luego una primera aproximación es la clasificación que ya tenemos de las cónicas afines. Sin embargo, necesitamos una clasificación un poco más fina, en el sentido de que dos cónicas afı́nmente equivalentes no son necesariamente equivalentes como cónicas euclı́deas. Por ejemplo, en el plano afı́n las cónicas X 2 + Y 2 = 1 y X 2 + 4Y 2 = 1 son equivalentes, porque el cambio de coordenadas (X, Y ) = (X , 2Y ) permite pasar de una a 45 otra. Sin embargo, como cónicas euclı́deas no son equivalentes, porque mientras la primera es una circunferencia (en concreto el conjunto de puntos que distan uno de (0, 0)) la segunda no lo es, y cualquier transformación euclı́dea deberı́a conservar las distancias. De hecho, los únicos cambios de coordenadas permitidos en el plano euclı́deo son las isometrı́as, que tienen la forma      1 0 0 1 1  X  =  α a b   X  Y β c d Y a b a b a c 1 0 con una matriz ortogonal, es decir = . Dependiendo c d c d b d 0 1 del signo del determinante (que necesariamente es ±1), se da uno de los siguientes casos a b cos θ − sen θ = (isometrı́a directa) c d sen θ cos θ a b cos θ sen θ = (isometrı́a inversa) c d sen θ − cos θ Como una circunferencia está caracterizada por ser una elipse real que corta a la recta del infinito en los puntos cı́clicos (0 : 1 : i), (0 : 1 : −i), podrı́a pensarse que las los completados proyectivos de isometrı́as se caracterizan por preservar los puntos cı́clicos. Dicha afirmación es cierta sólo a medias: Proposición 5.8. Un cambio de coordenadas en P2R deja invariantes las coordenadas del conjunto {(0 : 1 : i), (0 : 1 : −i)} de los puntos cı́clicos si y sólo si es el completado proyectivo de la composición de una homotecia y una isometrı́a. Además, dicha isometrı́a es directa si y sólo si quedan fijas las coordenadas de cada uno de los puntos cı́clicos, y es inversa si las permuta. Finalmente, cualquier proyectividad de la recta del infinito que deje invariantes las coordenadas del conjunto {(0 : 1 : i), (0 : 1 : −i)} es restricción del completado proyectivo de un cambio de coordenadas isométrico. Demostración: En primer lugar, una homotecia    1 1 0  X  =  α λ Y β 0 tiene de ecuaciones   0 1 0X  λ Y y su completado proyectivo claramente conserva las coordenadas de cada punto de la recta del infinito (ya que las multiplica todas por la constante λ). Por otra parte, es una simple comprobación que el completado proyectivo de una isometrı́a directas deja fijas las coordenadas de los puntos cı́clicos, mientras que el de una inversa las intercambia. Recı́procamente, supongamos que un cambio de coordenadas de P2 conserva las coordenadas del conjunto de los puntos cı́clicos. Esto implica en primer lugar que manda 46 la recta del infinito a la recta X0 = 0, con lo que (por el Lema 5.4) es el completado proyectivo de un cambio afı́n de coordenadas, es decir, será de la forma   1 X0  X1  =  α X2 β    0 0 X0 a b   X1  X2 c d a b = 0. Las nuevas coordenadas de (0 : 1 : i) y (0 : 1 : −i) serán respectivamente con c d (0 : a + bi : c + di) y (0 : a − bi : c − di). Si por ejemplo (0 : a + bi : c + di) = (0 : 1 : i) y (0 : a − bi : c − di) = (0 : 1 : −i), a − bi c − di a + bi c + di , de donde se deduce d = a, b = −c. = 0 = se tendrá 1 −i 1 i Escribiendo √a2a+c2 = cos θ, √a2c+c2 = sen θ, tendremos  1 α β   0 0 1   a b = α c d β 0 cos θ sen θ  0 1   − sen θ 0 0 cos θ √ 0 a2 + c2 0  0  √ 0 2 2 a +c que representa la composición de una homotecia y una isometrı́a directa. Si en cambio (0 : a + bi : c + di) = (0 : 1 : −i) y (0 : a − bi : c − di) = (0 : 1 : i), se a + bi c + di = 0 = a − bi c − di , de donde se deduce ahora d = −a, b = c. tendrá 1 1 −i i a c Escribiendo de nuevo √a2 +c2 = cos θ, √a2 +c2 = sen θ, tendremos  1 α β   0 0 1   a b = α c d β 0 cos θ sen θ  0 1   sen θ 0 0 − cos θ √ 0 a2 + c2 0  0  √ 0 2 2 a +c que representa ahora la composición de una homotecia y una isometrı́a inversa. Finalmente, dada una proyectividad (0 : X1 : X2 ) → (0 : aX1 + bX2 : cX1 + bX2 ) de la recta del infinito que deje invariantes las coordenadas del conjunto de puntos cı́clicos, √ acabamos de ver que (después de dividir por a2 + c2 ), se escribe como (0 : X1 : X2 ) → (0 : cos θX1 − sen θX2 : sen θX1 + cos θX2 ) si deja fijos ambos puntos cı́clicos o bien como (0 : X1 : X2 ) → (0 : cos θX1 + sen θX2 : sen θX1 − cos θX2 ) si los intercambia, con lo que es siempre restricción del completado proyectivo de una isometrı́a. 47 Definición. Se llama semejanza a la composición de una homotecia y una isometrı́a. Se dirá que es directa o inversa según lo sea la isometrı́a. El resultado anterior está diciendo que con la geometrı́a proyectiva, más que geometrı́a euclı́dea (la que conserva distancias, es decir, las formas y tamaños), podemos sólo hacer geometrı́a conforme (la que conserva las formas, pero no necesariamente los tamaños). Este hecho se manifiesta explı́citamente en el siguiente resultado, que muestra de nuevo el papel fundamental que juegan los puntos cı́clicos. Proposición 5.9. Sean v = (0 : v1 : v2 ), w = (0 : w1 : w2 ) dos puntos del infinito del plano euclı́deo E2 . Si I = (0 : 1 : i), J = (0 : 1 : −i) son los puntos cı́clicos, entonces [I, J, v, w] = cos 2θ + i sen 2θ, donde θ es el ángulo que va del vector w = (w1 , w2 ) al vector v = (v1 , v2 ) en el sentido antihorario. En particular, las direcciones representadas por v y w son perpendiculares si y sólo si [I, J, v, w] = −1. Demostración: Por el Lema 1 v1 1 i v2 −i [I, J, u, v] = 1 1 w 1 i w2 −i 3.1, se tiene  2 w1 √ v22 2 − i √ v21 2 w2 v1 +v2 (v − iv1 )(w2 + iw1 )  v1 +v2  . = 2 = w √ 2 2 2 − i √ w2 1 2 (w2 − iw1 )(v2 + iv1 ) v1 w1 +w2 w1 +w2 v2 Ahora bien, los vectores v y w se pueden ver en el plano de los números complejos como v = = w1 + iw2 , y en tal caso sus vectores normalizados (de módulo uno) y girados v1 + iv2 y w noventa grados en el sentido de las agujas del reloj son precisamente √ v22 2 − i √ v21 2 y √ w2 w12 +w22 − i√ w1 . w12 +w22 v1 +v2 v1 +v2 Por tanto, el ángulo del segundo al primero en sentido antihorario √ v22 es también θ, de donde se sigue √ v +v 2 1 2 w2 w2 +w2 1 2 −i √ −i √ v1 v 2 +v 2 1 2 w1 = cos θ + i sen θ = eiθ , lo que implica el w2 +w2 1 2 resultado. Obsérvese que en el enunciado anterior no hay indefinición, ya que si cambiamos de sentido uno de los vectores v o w, entonces θ varı́a en 180 grados, con lo que su doble es el mismo (módulo 360 grados). Observación 5.10. El resultado anterior interpreta entonces lo que son las semejanzas: si son directas, I, J quedan fijos y, al conservarse la razón doble, se preservan los ángulos; si son inversas, se intercambian I y J, luego por la Observación 3.9 invierte la razón doble, que al ser un número complejo de módulo uno nos da el conjugado, luego cambia el sentido de los ángulos. Veamos también lo que podemos decir sobre la razón doble de los puntos cı́clicos y dos puntos imaginarios conjugados. 48 Lema 5.11. Sean, p, p̄ dos puntos imaginarios conjugados de la recta del infinito, distintos de los puntos cı́clicos. Entonces, [I, J, p, p̄] es un número real positivo. Además, existe λ ∈ R \ {0, 1} tal que, si llamamos q = (0 : 1 : λi), entonces [I, J, p, p̄] = [I, J, q, q̄]. Demostración: La manera más rápida, aunque poco elegante, es por medio de un simple cálculo. Por simplificar, como p no es real, su coordenada X1 no es cero (porque si no serı́a el punto (0 : 0 : 1)), ası́ que podemos escribir p = (0 : 1 : a + bi), con a, b ∈ R y b = 0. Es entonces un simple cálculo que 1 1 1 1 i a + bi −i a − bi (a + (b − 1)i)(a − (b − 1)i) a2 + (b − 1)2 = = [I, J, p, p̄] = (a − (b + 1)i)(a + (b + 1)i) a2 + (b + 1)2 1 1 1 1 i a − bi −i a + bi que claramente es un número positivo. Por tanto, podemos escribir [I, J, p, p̄] = µ2 para algún µ > 0 (además, µ = 1). Las mismas cuentas que acabamos de hacer muestran que, 2 tomando q = (0 : 1 : λi), se tiene [I, J, q, q̄] = λ−1 , con lo que basta encontrar un λ ∈ R λ+1 tal que µ = λ−1 λ+1 , y claramente basta tomar λ = 1+µ 1−µ . Con todo esto, ya podemos ir estudiando los distintos tipos de cónicas euclı́deas. Proposición 5.12. Toda parábola euclı́dea se puede escribir, después de una cambio de coordenadas isométrico de la forma Y = aX 2 para un único a > 0. Demostración: Si p es el punto del infinito de la parábola, por la Proposición 3.7 existe una proyectividad de la recta del infinito en sı́ misma que deja fijos los puntos cı́clicos y manda p al punto (0 : 1 : 0), por lo que por la Proposición 5.8 existe un cambio de coordenadas isométrico tal que la nueva ecuación de la parábola será de la forma (haciendo las mismas cuentas que en la demostración del Teorema 5.5) Y = aX 2 + bX + c con a = 0. Además, cambiando Y por −Y si fuera necesario, podemos suponer a > 0. La ecuación anterior es 2 4b2 2b 2 2b equivalente a Y −c+ 4b a2 = a(X + a ) , con lo que llamando X = X + a , Y = Y −c+ a2 (que es una traslación y por tanto una isometrı́a) se tiene la ecuación buscada. Como en estas últimas coordenadas la parábola representa el conjunto de puntos que equidistan del 1 1 punto de la recta Y = − 4a y del punto (0, 4a ), el valor a está unı́vocamente determinado a partir de la parábola, ya que la distancia del punto a la recta, que permanece fijo por 1 . isometrı́as, es 2a Proposición 5.13. Toda hipérbola euclı́dea se puede escribir, después de un cambio de 2 2 coordenadas isométrico de la forma Xa2 − Yb2 = 1 para unos únicos a, b > 0. Demostración: Sean v, w los puntos del infinito de la hipérbola, y sea cos 2θ + i sen 2θ la razón doble [I, J, v, w] (ver la Proposición 5.9). Si llamamos v = (0 : cos θ2 : sen θ2 ), w = 49 (0 : cos θ2 : − sen θ2 ), también se tiene que [I, J, v , w ] = cos 2θ + i sen 2θ, por lo que existe una proyectividad de la recta del infinito en sı́ misma que manda respectivamente I, J, v, w a I, J, v , w , y por la Proposición 3.7 será una proyectividad real. Por tanto, por la Proposición 5.8 existe un cambio de coordenadas isométrico tal que los puntos del infinito de la hipérbola tendrán coordenadas (0 : cos θ2 : sen θ2 ), (0 : cos θ2 : − sen θ2 ), lo que implica que la ecuación se puede escribir como sen2 θ2 X 2 − cos2 θ2 Y 2 + cX + dY + e = 0. Mediante la traslación (X , Y ) = (X + 2 senc 2 θ , Y − 2 cosd 2 θ ) obtenemos una ecuación de 2 2 la forma sen2 θ2 X 2 − cos2 θ2 Y 2 + e = 0 (con e = 0, ya que se trata de una hipérbola). Podemos suponer e < 0 (si fuera e > 0, intercambiamos X e Y y cambiamos θ por θ + π), y escribiendo sene 2 θ = a2 , cose2 θ = b2 obtenemos la ecuación reducida buscada. En estas coordenadas, la hipérbola consiste en los puntos tales que la diferencia de las √ √ distancias a los puntos (− a2 + b2 , 0) y ( a2 + b2 , 0) es, en valor absoluto, igual a 2a. Por √ tanto, 2a depende de las propiedades métricas de la hipérbola, ası́ como 2 a2 + b2 , que es la √ √ distancia entre los puntos (− a2 + b2 , 0) y ( a2 + b2 , 0). Como consecuencia, a y b están determinados unı́vocamente por la hipérbola, independientemente de las coordenadas. Proposición 5.14. Toda elipse euclı́dea real se puede escribir, después de un cambio de 2 2 coordenadas euclı́deo, de la forma Xa2 + Yb2 = 1 para unos únicos a ≥ b > 0. Demostración: Como en los casos anteriores, y usando ahora el Lema 5.11, podemos hacer una cambio de coordenadas euclı́deo tal que los puntos del infinito de la elipse sean de la forma (0 : 1 : λi), (0 : 1 : −λi) para algún λ = 0 (si los puntos del infinito de la elipse son los puntos cı́clicos, no hay que hacer cambio de coordenadas, y tendremos λ = 1. Es decir, que podemos escribir la ecuación de la elipse como λ2 X 2 + Y 2 + a X + b Y + c = 0. a , Y + b2 ), la ecuación tendrá el aspecto Después de una traslación (X , Y ) = (X + 2λ λ2 X 2 + Y 2 + e = 0,para algún e ∈ R, que necesariamente es negativo por ser la elipse √ , b = −e tendremos la ecuación buscada (si fuera a < b, basta real. Escribiendo a = −e 2 λ girar 90 grados o intercambiar X e Y ). En estas coordenadas, la elipse consiste en los puntos tales que la suma de las distancias √ √ a los puntos (− a2 − b2 , 0) y ( a2 − b2 , 0) es igual a 2a. Como en el caso de la hipérbola, √ 2a y 2 a2 − b2 , y por tanto a y b están determinados unı́vocamente por las propiedades métricas de la elipse, y por tanto no dependen de las coordenadas. Observación 5.15. Se deja como ejercicio para el lector que, en el caso de las demás cónicas euclı́deas, la ecuación reducida queda: –Elipse imaginaria: X 2 a2 + Y 2 b2 = −1 para unos únicos a ≥ b > 0. –Par de rectas reales secantes: sen2 θ2 X 2 − cos2 θ2 Y 2 = 0, donde θ es el ángulo entre las dos rectas. 50 –Par de rectas imaginarias secantes: λ2 X 2 + Y 2 = 0, para un único λ > 0. –Par de rectas reales paralelas: X 2 = a2 , donde 2a es la distancia entre las dos rectas. –Par de rectas imaginarias paralelas: X 2 = −a2 , para un único a > 0. –Recta doble: X 2 = 0. Finalmente, ya que los puntos cı́clicos juegan un factor importante en la geometrı́a euclı́dea, también lo deben jugar sus rectas polares respecto del completado proyectivo de la cónica: Definición. Dada una cónica euclı́dea no degenerada C, si L1 , L2 son las tangentes a C̄ que pasan por I, y M1 , M2 son las rectas tangentes a C̄ que pasan por J, se llaman focos de la cónica a los puntos afines de intersección de cada Li con cada Mj . Veamos cuáles son los focos de los distintos tipos de cónicas euclı́deas reales (con la ecuación ya reducida): –Si C es la hipérbola X2 a2 − Y2 b2 = 1, entonces la recta polar a (0 : 1 : ±i) respecto X2 X2 iX2 2 1 1 2 de C̄ es X a2 = ± b2 , que√interseca a C̄ (de ecuación a2 − b2 = X0 ) en los puntos √ (− a2 + b2 i : ±a2 i : b2 ), ( a2 + b2 i : ±a2 i : b2 ). Por tanto las rectas tangentes a C̄ que pasan por (0 : 1 : ±i) son (a2 + b2 )X0 ± a2 + b2 X1 + a2 + b2 iX2 = 0 y a2 + b2 X1 − a2 + b2 iX2 = 0 √ √ √ con lo que los focos quedan los puntos (− a2 + b2 , 0), ( a2 + b2 , 0) (0, − a2 + b2 i) y √ (0, a2 + b2 i). (a2 + b2 )X0 ∓ 2 2 Y –Si C es la elipse real de ecuación X cuentas que antes a2 + b2 = 1, las mismas √ √ 2 2 2 2 (basta cambiar b por −b ) nos dan como focos los puntos (− a − b , 0), ( a2 − b2 , 0) √ √ (0, − a2 − b2 i) y (0, a2 − b2 i). Si la elipse fuera imaginaria (cambiando los a2 y b2 por sus opuestos en la ecuación de C), quedarı́an los mismos focos. Obsérvese que, en el caso de una circunferencia (real o imaginaria) los cuatro focos coinciden. –Si C es la parábola de ecuación Y = aX 2 , la recta polar a (0 : 1 : ±i) respecto de C̄ es ∓ 2i X0 + aX1 = 0, que intersecada con C̄ (de ecuación X0 X2 = aX12 ) nos da los puntos (0 : 0 : 1) y (∓4ai : 2 : ±i). Por tanto, las rectas tangentes a C̄ que pasan por (0 : 1 : ±i) son X0 = 0 y ∓iX0 + 4aX1 ± 4aiX2 = 0, y se obtiene sólo un foco, que es el punto afı́n 1 (0, 4a ). Definición. Se llaman ejes de una cónica euclı́dea a: 51 –las rectas que unen los dos focos reales reales o dos focos imaginarios conjugados, en el caso de la hipérbola o una elipse que no sea una circunferencia (hay dos ejes, que son perpendiculares entre sı́ y se cortan en el centro de la cónica); –la recta que pasa por el foco de la parábola y su punto del infinito. En este caso, se llama directriz de la parábola a la recta perpendicular al eje que pasa por el simétrico del foco respecto del punto de intersección de la parábola con el eje. 52 ESPACIOS PROYECTIVOS 6. Construcción del espacio proyectivo A la vista de cómo hemos definido primero P2k y luego P1k , está claro que puede generalizarse para definir Pnk para n arbitrario. Basta definirlo como el conjunto de elementos (a0 : . . . : an ) (con no todos los ai nulos) tales que (a0 : . . . : an ) = (b0 : . . . : bn ) si y sólo si existe λ ∈ k \ {0} tal que (b0 , . . . , bn ) = λ(a0 , . . . , an ). De todas formas, una definición ası́ no es muy precisa matemáticamente. Probemos a dar entonces una descripción alternativa, que valdrá en un contexto más general. La condición (b0 , . . . , bn ) = λ(a0 , . . . , an ) anterior es en realidad equivalente a decir que los vectores (a0 , . . . , an ) y (b0 , . . . , bn ) generan la misma recta vectorial en k n+1 . Más en general, podemos definir: Definición. Se llama proyectivizado de un espacio vectorial V sobre un cuerpo k al conjunto P(V ) de rectas vectoriales de V . Si V = k n+1 , escribiremos simplemente Pnk , y lo llamaremos espacio proyectivo de dimensión n. Si consideramos la aplicación π : V → P(V ) que asocia a cada vector no nulo la recta vectorial que genera en V , tenemos claramente una aplicación suprayectiva, y además π(v) = π(w) si y sólo si existe λ ∈ k \ {0} tal que w = λv. Por tanto, la relación ∼ en V \ {0} definida por v ∼ w ⇔ ∃λ ∈ k \ {0} tal que w = λv es una relación de equivalencia y además el cociente V \ {0} está en biyección con P(V ) en forma natural (asociando a la clase de v la recta vectorial generada por v). Por tanto, podemos tambier dar la siguiente: Definición (otra definición equivalente de espacio proyectivo). El proyectivizado de un espacio vectorial V es el cociente P(V ) de V \ {0} por la relación de equivalencia ∼. Al punto de P(V ) que corresponde a la clase del vector v la denotaremos por [v]. Si V = k n+1 , el punto de Pnk que corresponde a la clase del vector (a0 , . . . , an ) la denotaremos por (a0 : . . . : an ) en vez de [(a0 , . . . , an )]. Si V es un espacio vectorial de dimensión finita de dimensión n + 1, tomando una base de V cada vector de V puede representarse por n + 1 coordenadas, por lo que cada elemento de P(V ) puede representarse por un elemento de Pnk . Por tanto, P(V ) se puede identificar con Pnk (ya veremos esto con más precisión cuando describamos los sistemas de referencia). 53 Definición. Dado un espacio proyectivo P(V ), se llama subespacio proyectivo o lineal de dimensión r a un subconjunto de la forma P(W ), donde W es un subespacio vectorial de dimensión r + 1. A los subespacios proyectivos de dimensión uno se les llama rectas, a los de dimensión dos se les llama planos y a los de dimensión n − 1 (donde n es la dimensión de P(V ), es decir dim(V ) = n + 1) se les llama hiperplanos. Por definición, los subespacios proyectivos de dimensión cero son los puntos. Por convenio, el conjunto vacı́o (que se puede ver como el proyectivizado del subespacio cero) diremos que tiene dimensión −1. Obsérvese que una hipersuperficie proyectiva P(W ) de P(V ) es lo mismo que una hipersuperficie vectorial W de V , que viene dada por tanto por una ecuación, que es una forma lineal no nula sobre V (que es lo que ocurrı́a para las rectas de P2k ). Además, dos ecuaciones definen la misma hipersuperficie si y sólo si son proporcionales. Por tanto, el conjunto de hipersuperficies de P(V ) se identifica con el conjunto de formas lineales no nulas sobre V módulo proporcionalidad, es decir, V ∗ \ {0}/ ∼, que es precisamente P(V ∗ ). Generalizando la noción de plano dual, tendremos entonces: Definición. Se llama espacio proyectivo dual de un espacio proyectivo P(V ) al conjunto P(V )∗ de todos los hiperplanos de P(V ). Es otro espacio proyectivo que se puede identificar con P(V ∗ ). Por otra parte, una recta P(W ) ⊂ Pnk corresponde a un subespacio W ⊂ k n+1 de dimensión dos, que se podrá generar por dos vectores linealmente independientes (a0 , . . . , an ), (b0 , . . . , bn ). Por tanto, un vector (x0 , . . . , xn ) está en W (que es lo mismo que decir que el punto (x0 : . . . : xn ) está en P(W )) si y sólo si existen t0 , t1 ∈ k (no ambos nulos) tales que  x0 =a0 t0 + b0 t1    .. .    xn =an t0 + bn t1 con lo que recobramos la parametrización de las rectas (y no sólo en P2k ). Observación 6.1. Dados subespacios P(W1 ), . . . , P(Ws ) de un espacio proyectivo P(V ), se pueden hacer las siguientes operaciones: –La intersección P(W1 ) ∩ . . . ∩ P(Ws ), que consistirá en los elementos [v] tales que v está en cada Wi , es decir, que P(W1 ) ∩ . . . ∩ P(Ws ) = P(W1 ∩ . . . ∩ Ws ), con lo que en particular la intersección de subespacios es otro subespacio. –El mı́nimo subespacio P(W ) que los contiene, luego W será el mı́nimo subespacio vectorial que contiene a W1 , . . . , Ws , es decir, W = W1 + . . . + Ws . 54 Definición. Se llama subespacio generado por los subespacios P(W1 ), . . . , P(Ws ), y lo denotaremos por < P(W1 ), . . . , P(Ws ) > al mı́nimo subespacio proyectivo que los contiene. Como hemos visto, < P(W1 ), . . . , P(Ws ) >= P(W1 + . . . + Ws ). Proposición 6.2 (fórmula de Grassmann). Sean de P(V ). Entonces P(W1 ), P(W2 ) subespacios proyectivos dim < P(W1 ), P(W2 ) >= dim P(W1 ) + dim P(W2 ) − dim P(W1 ∩ W2 ). Demostración: Hemos visto que < P(W1 ), P(W2 ) >= P(W1 +W2 ), luego por definición tendremos que dim < P(W1 ), P(W2 ) >= dim(W1 + W2 ) − 1, que por la fórmula de Grassmann vectorial será igual a dim W1 + dim W2 − dim(W1 − W2 ) = (dim W1 − 1) + (dim W2 − 1) − (dim(W1 ∩W2 )−1), que por definición es igual a dim P(W1 )+dim P(W2 )−dim P(W1 ∩W2 ). Corolario 6.3. Sean Λ, Λ dos subespacios proyectivos de dimensiones respectivas r, r en un espacio proyectivo de dimensión n. Entonces, si r + r ≥ n, la intersección de Λ y Λ tiene dimensión al menos r + r − n (y por tanto es no vacı́a). Demostración: Por la fórmula de Grassmann, dim(Λ ∩ Λ ) = r + r − dim < Λ, Λ >. Como claramente dim < Λ, Λ >≥ n, el resultado se sigue inmediatamente. Corolario 6.4. Sea Λ un subespacio proyectivo de dimensión r. Entonces, si H es un hiperplano que no contiene a Λ, Λ ∩ H tiene dimensión r − 1 (por ejemplo, una recta y un hiperplano que no la contiene se intersecan exactamente en un punto). Demostración: De nuevo por la fórmula de Grassmann, se tiene que dim(Λ ∩ H) = n − 1 + r − dim < Λ, H >. Como Λ ⊆ / H, se sigue que H ⊆ / < Λ, H >, por lo que < Λ, H > tiene dimensión mayor que n − 1 (y por tanto es el total), es decir dim < Λ, H >= n, de donde se obtiene dim(Λ ∩ H) = r − 1. Ejemplo 6.5.Consideramos en P5k , donde usaremos coordenadas (a0 : a1 : a2 : a3 : a4 : a5 ), el subespacio de ecuaciones  a0     a0 a3 +a1 +a2 +a3 55 +a4 a5 +a5 =0 =0 =0 = 0. Como corresponde a un plano vectorial en k 6 , entonces es una recta L ⊂ P5 , que podremos parametrizar como   a0 = 0      a1 = t0      a2 = t1  a3 = 0       a4 = −t0 − t1     a5 = 0 Este ejemplo no está escogido al azar. De hecho, un punto (a0 : a1 : a2 : a3 : a4 : a5 ) ∈ P5k se puede identificar con la cónica de P2k de ecuación a0 X02 + a1 X0 X1 + a2 X0 X2 + a3 X12 + a4 X1 X2 + a5 X22 = 0 (ya que dos ecuaciones definen la misma cónica si y sólo si sus ecuaciones tienen sus coeficientes proporcionales). Con esta identificación, se observa inmediatamente que • a0 = 0 si y sólo si el punto (1 : 0 : 0) pertenece a la cónica. • a1 = 0 si y sólo si el punto (0 : 1 : 0) pertenece a la cónica. • a3 = 0 si y sólo si el punto (0 : 0 : 1) pertenece a la cónica. • a0 + a1 + a2 + a3 + a4 + a5 = 0 si y sólo si el punto (1 : 1 : 1) pertenece a la cónica. Por tanto, L se interpreta dentro del conjunto de las cónicas de P2k como el subconjunto de aquéllas que pasan por los puntos (1 : 0 : 0), (0 : 1 : 0), (0 : 0 : 1), (1 : 1 : 1). La parametrización anterior de L nos está diciendo que cualquier cónica que pase por dichos puntos se puede escribir de la forma t0 (X0 X1 − X1 X2 ) + t1 (X0 X2 − X1 X2 ). Obsérvese que se obtiene entonces una combinación lineal genérica del par de rectas X1 (X0 − X2 ) (que son las rectas que pasan respectivamente por (1 : 0 : 0), (0 : 0 : 1) y por (0 : 1 : 0), (1 : 1 : 1)) y del par de rectas X2 (X0 − X1 ) (que son las rectas que pasan respectivamente por (1 : 0 : 0), (0 : 1 : 0) y por (0 : 0 : 1), (1 : 1 : 1)). Definición. Se llama haz de cónicas a un subconjunto L de cónicas de P2k , que, visto como subconjunto de P5k , forme una recta L ⊂ P5k . Observación 6.6. Identificaremos, como en el ejemplo anterior, el conjunto de cónicas con P5k . Para cualquier punto p = (b0 : b1 : b2 ), el conjunto Hp de las cónicas que pasan por p tiene ecuación b20 a0 + b0 b1 a1 + b0 b2 a2 + b21 a3 + b1 b2 a4 + b22 a5 = 0, que es un hiperplano en P5k (el recı́proco no es cierto: es un simple ejercicio ver que, por ejemplo, el hiperplano a1 = 0 no corresponde a las cónicas que pasan por algún punto). Por tanto, uno se espera 56 que las cónicas que pasan por cuatro puntos (al ser la intersección de cuatro hiperplanos de P5k ) sea un subconjunto proyectivo de dimensión uno, es decir, un haz. El siguiente resultado da la respuesta completa. Proposición 6.7. Sean p1 , p2 , p3 , p4 ∈ P2k cuatro puntos distintos. Entonces: (i) El conjunto de cónicas que pasan por p1 , p2 , p3 es un subconjunto proyectivo de P5k de dimensión dos. (ii) El conjunto de cónicas que pasan por p1 , p2 , p3 , p4 forma un haz si y sólo si no existe una recta que pase por p1 , p2 , p3 , p4 . Demostración: La idea para demostrar (i) es aplicar sucesivamente el Lema 6.4 para calcular la dimensión del subconjunto Hp1 ∩ Hp2 ∩ Hp3 (que es precisamente el conjunto de cónicas que pasan por p1 , p2 , p3 ). En primer lugar, Hp1 es un hiperplano, luego tiene dimensión cuatro. Claramente Hp1 no está contenido en Hp2 (basta tomar una recta doble que pase por p1 y que no pase por p1 ), ası́ que el Lema 6.4 implica que Hp1 ∩ Hp2 tiene dimensión tres. De nuevo, Hp1 ∩ Hp2 no está contenido en el hiperplano Hp3 (tómese por ejemplo un par de rectas, una que pase por p1 y no por p3 y otra que pase por p2 y no por p3 ), con lo que el Lema 6.4 nos dice ahora que Hp1 ∩ Hp2 ∩ Hp3 tiene dimensión dos, lo que demuestra (i). Para demostrar (ii), supongamos en primer lugar que no existe ninguna recta que contenga a p1 , p2 , p3 , p4 . Por tanto, el punto p4 no puede estar al mismo tiempo en las rectas p1 p2 , p1 p3 , p2 p3 . Sin pérdida de generalidad, podemos suponer por ejemplo que p4 no está en p1 p2 . Tomando entonces la cónica formada por la recta p1 p2 y cualquier recta que pase por p3 pero no por p4 , se concluye que Hp1 ∩ Hp2 ∩ Hp3 no está contenido en Hp4 . Aplicando una vez más el Lema 6.4, se concluye que Hp1 ∩ Hp2 ∩ Hp3 ∩ Hp4 tiene dimensión uno, luego es efectivamente un haz de cónicas. Si en cambio suponemos que p1 , p2 , p3 , p4 están todos en una recta de ecuación u0 X0 + u1 X1 + u2 X2 = 0, entonces todas las cónicas de la forma t0 (u0 X02 + u1 X0 X1 + u2 X0 X2 ) + t1 (u0 X0 X1 +u1 X12 +u2 X1 X2 )+t2 (u0 X0 X2 +u1 X1 X2 +u2 X22 ) = 0 pasan por p1 , p2 , p3 , p4 . Esto da un subespacio de P5k de ecuaciones paramétricas  a0    a    1 a2 a3       a4 a5 = u 0 t0 = u 1 t0 = u 2 t0 = = = + u 0 t1 + u 0 t2 u 1 t1 u 2 t1 57 + u 1 t2 u 2 t2   u0 0 0  u1 u0 0     u2 0 u0  Dado que la matriz de coeficientes   tiene claramente rango tres (ya que  0 u1 0    0 u2 u1 0 0 u2 u0 , u1 , u2 no son todos nulos), estas ecuaciones definen un subespacio vectorial de dimensión tres de k 5 y por tanto un subespacio proyectivo de dimensión dos de P5k . Esto demuestra que el conjunto de cónicas que pasan por p1 , p2 , p3 , p4 no es un haz (y de hecho es exactamente un subespacio proyectivo de dimensión dos de P5k , ya que Hp1 ∩ Hp2 ∩ Hp3 ∩ Hp4 está contenido en Hp1 ∩Hp2 ∩Hp3 , que por (i) tiene dimensión dos; esto demuestra que, además, las cónicas que pasan por p1 , p2 , p3 , p4 consisten en un par de rectas, una de las cuales es la que contiene a p1 , p2 , p3 , p4 ). La pregunta natural es: ¿Son todos los haces de cónicas de la forma anterior (es decir, conjuntos de cónicas que pasan por cuatro puntos no alineados)? Para responder a eso, damos primero la siguiente: Definición. Se llama base de un haz de cónicas al conjunto de puntos de todas las cónicas de un haz. P2k que están en Lema 6.8. Sea A ⊂ P5k un haz de cónicas. Entonces, dadas dos cónicas cualesquiera de C1 , C2 ∈ A, la base de A es C1 ∩ C2 . Por tanto, la base de A o bien es un conjunto finito de a lo más cuatro punto, o bien es una recta y un punto o bien es una recta. Demostración: Evidentemente, como los puntos de la base de A están en cada cónica del haz, en particular están en C1 y C2 , luego están en C1 ∩ C2 . Recı́procamente, sea p un punto de la intersección de C1 y C2 . Si F1 , F2 ∈ k[X0 , X1 , X2 ] son ecuaciones de C1 y C2 respectivamente, se tendrá que F (p1 ) = F (p2 ) = 0. Por tanto, como cualquier cónica de A tiene de ecuación t0 F1 + t1 F2 y evidentemente t0 F1 (p) + t1 F2 (p) = 0, entonces p está también en cualquier cónica del haz. Para ver cómo puede ser la base de A, supongamos en primer lugar que A contiene una cónica no degenerada C1 . Si es imaginaria, entonces claramente la base del haz es el conjunto vacı́o. Si C1 no es imaginaria, entonces se puede parametrizar, y al cortar con cualquier otra cónica del haz obtenemos cuatro puntos (contados con multiplicidad, luego el número de puntos distintos puede ser menor que cuatro). Supongamos en cambio que todas las cónicas de A son degeneradas. Si todas fueran rectas dobles, entonces es claro que la base del haz serı́a exactamente un punto (el de intersección de dos de las rectas dobles cualesquiera del haz). Si en cambio existe un par de rectas L1 ∪ L2 en A, entonces otro par de rectas en A o bien consiste en dos rectas 58 ambas distintas a L1 , L2 (con lo que la base del haz será un conjunto de a lo más cuatro puntos) o bien será la unión de, por ejemplo, L1 con otra recta L2 (en cuyo caso la base de A es L1 más el punto de intersección de L2 y L2 , que podrı́a estar dentro de L1 . Observación 6.9. No es difı́cil construir ejemplos de haces de cónicas para cada una de las posibles bases dadas por el resultado anterior. Obsérvese que, en los casos en que la base del haz es un conjunto de puntos, en realidad se puede considerar que salen siempre cuatro puntos, si se incluyen los imaginarios y también la multiplicidad. Por ejemplo, la base del haz de cónicas reales t0 (X0 X2 − X12 ) + t1 (X02 + X12 ) = 0 consiste en el punto (0 : 0 : 1), contado con multiplicidad dos, y en los puntos imaginarios (1 : i : −1), (1 : −i : −1) (al sustituir la parametrización (s20 : s0 s1 : s21 ) de la primera cónica se obtiene s20 (s20 + s21 )). Si la base del haz es una recta L1 y un punto p fuera de ella, tomando p1 , p2 , p3 ∈ L, el haz se puede describir como el conjunto de cónicas que pasan por p1 , p2 , p3 , p. Si en cambio el haz de cónicas son los pares de rectas tales que una de las rectas es L y la otra pasa por un punto p ∈ L, entonces, tomando p1 , p2 ∈ L distintos de p, se podrı́a ver el haz como el conjunto de cónicas que pasan por p1 , p2 y “pasan dos veces” por p. Por tanto, en cualquiera de los casos un haz se puede describir como el conjunto de cónicas que pasan por cuatro puntos, aunque alguno cuente varias veces o sea imaginario. Observación 6.10. Nótese que todos los haces de cónicas contienen cónicas degeneradas. La mejor forma de verlo es con un ejemplo. Si consideramos el haz de la observación anterior, la matriz de una cónica del haz será   t0 0 t1 2  0 t0 − t 1 0  t0 0 0 2 luego la cónica será degenerada si y sólo si la matriz tiene determinante cero, es decir, t0 2 (t0 − t1 ) = 0, que nos da las soluciones (t0 : t1 ) = (0 : 1) con multiplicidad dos 2 y (t0 : t1 ) = (1 : 1), que dan respectivamente las cónicas X02 + X12 = 0 (par de rectas imaginarias conjugadas) y X0 (X0 + X2 ) = 0 (par de rectas reales). En principio, puede parecer extraño que el último par de rectas pase con multiplicidad dos por (0 : 0 : 1), ya que sólo la rectas X0 = 0 pasa por ese punto. En realidad, es que el hecho de pasar con multiplicidad dos por un punto es más sofisticado de la idea intuitiva que hemos dado. Por ejemplo, en este caso, las cónicas del haz pasan por (0 : 0 : 1) con recta tangente X0 = 0, es decir, que pasan por el punto y por otro “infinitamente próximo” en esa dirección (otra forma de decirlo, para incluir también las cónicas degeneradas, es que la recta X0 = 0 corta a las cónicas del haz en (0 : 0 : 1) con multiplicidad dos). 59 En general, el determinante de la matriz de la cónica general del haz es o bien idénticamente nulo (si todas las cónicas del haz son degeneradas) o bien homogéneo de grado tres en t0 , t1 , con lo que da tres soluciones contadas con multiplicidad. Por ejemplo, en el caso más general del haz de cónicas que pasan por cuatro puntos p1 , p2 , p3 , p4 tales que no hay tres alineados, hay tres cónicas degeneradas, que son los pares de rectas p1 p2 ∪ p3 p4 , p1 p3 ∪ p2 p4 y p1 p4 ∪ p 2 p3 . Estudiamos ahora la dualidad en el espacio proyectivo, que no es sino la traducción de la dualidad en espacios vectoriales. Teorema 6.11. Sea P(V ) un espacio vectorial de dimensión n. Para cada subespacio proyectivo Λ ⊂ P(V ) definimos Ω(Λ) := {H ∈ P(V )∗ | Λ ⊂ H} y para cada subespacio proyectivo A ⊂ P(V )∗ definimos Ω∗ (A) := H. H∈A Entonces: (i) Si dim Λ = r, entonces Ω(Λ) es un subespacio proyectivo de n − r − 1. P(V )∗ de dimensión P(V ) de dimensión (ii) Si dim A = s, entonces Ω∗ (A) es un subespacio proyectivo de n − s − 1. (iii) Ω y Ω∗ definen biyecciones entre el conjunto de subespacios proyectivos de P(V ) y el conjunto de subespacios proyectivos de P(V ) que son inversas la una de la otra. (iv) Si Λ, Λ son subespacios proyectivos de P(V ), entonces Ω(Λ ∩ Λ ) =< Ω(Λ), Ω(Λ ) > y Ω(< Λ, Λ >) = Ω(Λ) ∩ Ω(Λ ). (v) Si A, A son subespacios proyectivos de P(V )∗, entonces Ω∗ (A∩A ) =< Ω∗ (A), Ω∗ (A ) > y Ω∗ (< A, A >) = Ω∗ (A) ∩ Ω∗ (A ). Demostración: A lo largo de la demostración supondremos fijada una base de V , con lo que trabajaremos con coordenadas respecto de esa base. Para demostrar (i), un subespacio Λ ⊂ P(V ) de dimensión r corresponderá a un subespacio de vectorial de V de dimensión r + 1, por lo que se podrá poner como el subespacio generado por vectores independientes (a00 , . . . , a0n ), . . . , (ar0 , . . . , arn ). Entonces, una forma lineal u0 X0 + . . . + un Xn ∈ V ∗ define un hiperplano de P(V ) que contiene a Λ 60 si y sólo si  a00 u0 + . . . + a0n un = 0    .. .    ar0 u0 + . . . + arn un = 0. Por tanto, éstas son las ecuaciones de Ω(Λ), por lo que representa un subespacio de P(V )∗ . Además, como las r + 1 ecuaciones son linealmente independientes, es un subespacio dimensión n − r − 1. Para ver (ii), supongamos que A corresponde al subespacio de de V ∗ generado por las formas lineales independientes  H0 =u00 X0 + . . . + u0n Xn    .. .    Hs =us0 X0 + . . . + usn Xn . Es claro que la intersección en P(V ) de los hiperplanos de A coincide con la intersección de los hiperplanos definidos por H0 , . . . , Hs . Al ser independientes, la intersección de dichos hiperplanos es un subespacio de P(V ) de dimensión n − s − 1. Para la parte (iii), observemos que que para todo subespacio Λ ⊂ P(V ) se tiene Ω∗ (Ω(Λ)) = H∈Ω(Λ) H = H⊃Λ H, que claramente contiene a Λ. Como (i) y (ii) implican que Ω∗ (Ω(Λ)) y Λ tienen la misma dimensión, se sigue entonces la igualdad Ω∗ (Ω(Λ)) = Λ. De la misma forma, para cualquier subespacio A ⊂ P(V )∗ se tiene la inclusión A ⊂ Ω(Ω∗ (A)) (ya que cualquier hiperplano de A contiene a Ω∗ (A), que es la intersección de todos los hiperplanos de A), y de nuevo por (i) y (ii) es una igualdad. De (iv) y (v) son inmediatas a partir de la definición las igualdades Ω(< Λ, Λ >) = Ω(Λ) ∩ Ω(Λ ) y Ω∗ (< A, A >) = Ω∗ (A) ∩ Ω∗ (A ). Las otras dos se obtienen a partir de las biyecciones Ω y Ω∗ . Por ejemplo, para demostrar la igualdad Ω(Λ ∩ Λ ) =< Ω(Λ), Ω(Λ ) > basta demostrar la igualdad Ω∗ (Ω(Λ ∩ Λ )) = Ω∗ (< Ω(Λ), Ω(Λ ) >). Pero el término de la izquierda es Λ ∩ Λ por (iii), y el término de la derecha es, como acabamos de observar, igual a Ω∗ (Ω(Λ)) ∩ Ω∗ (Ω(Λ )), que de nuevo por (iii) es igual a Λ ∩ Λ∗ . Definición. Llamaremos sistema lineal de hiperplanos de dimensión s a un subconjunto proyectivo A ⊂ P(V )∗ de dimensión s. Si s = 1, al sistema lineal lo llamaremos haz de hiperplanos. Por el teorema anterior, un sistema lineal de hiperplanos es el conjunto de 61 hiperplanos de P(V ) que contienen a un subespacio proyectivo Λ ⊂ P(V ) de dimensión n − s − 1. Además, si M0 , . . . , Ms ∈ V ∗ son s + 1 formas lineales independientes que definen a Λ, entonces los hiperplanos del sistema lineal Ω(Λ) son los de ecuaciones λ0 M0 + . . . + λs Ms = 0 con λ0 , . . . , λs ∈ k. 62 7. Aplicaciones proyectivas Ya hemos observado que para dar coordenadas en el espacio proyectivo P(V ) basta dar una base de V y tomar coordenadas respecto de dicha base. Por ejemplo, una recta en P2k corresponderá a un subespacio vectorial de dimensión dos de k3 , que estará generado por dos vectores (a0 , a1 , a2 ) y (b0 , b1 , b2 ). Entonces, podemos decir que un punto de la recta tiene coordenadas (t0 : t1 ) si es el punto (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ). En otras palabras, dar coordenadas en la recta no es más que dar una parametrización de la misma. Ya observamos (Observación 2.10y Teorema 2.11) que la parametrización no está determinada por los puntos (a0 : a1 : a2 ) y (b0 : b1 : b2 ), sino que hace falta un tercer punto. En general, habrá que añadir siempre otro punto para obtener una base: Proposición 7.1. Sea p0 , . . . , pn+1 un conjunto de n + 2 puntos de un espacio proyectivo P(V ) tales que no haya ningún hiperplano que contenga a n + 1 de ellos. Entonces existe una base {v0 , . . . , vn } de V tal que p0 =[v0 ] .. . pn =[vn ] pn+1 =[v0 + . . . + vn ]. Además, cualquier otra base que verifique lo mismo es de la forma {λv0 , . . . , λvn } para algún λ ∈ k \ {0}. Demostración: Sean w0 , . . . , wn+1 ∈ V tales que p0 = [w0 ], . . . , pn+1 = [wn+1 ]. Como p0 , . . . , pn no están en ningún hiperplano de P(V ), w0 , . . . , wn no están en ningún hiperplano de V , es decir, son linealmente independientes, por lo que forman una base de V . Tendremos entonces una relación wn+1 = λ0 w0 + . . . + λn wn donde además λ0 , . . . , λn son todos no nulos (si fuera λi = 0, entonces los vectores w0 , . . . , wi−1 , wi+1 . . . , wn+1 serı́an linealmente dependientes, con lo que estarı́an en un hiperplano, luego los puntos p0 , . . . , pi−1 , pi+1 . . . , pn+1 estarı́an en un hiperplano, en contra de nuestra hipótesis). Basta tomar entonces v0 = λ0 w0 , . . . , vn = λn wn . Supongamos ahora que tenemos v0 , . . . , vn ∈ V tales que p0 =[v0 ] .. . pn =[vn ] pn+1 =[v0 + 63 . . . . + vn ] Entonces extistirán µ0 , . . . , µn+1 tales que v0 =µ0 v0 .. . vn =µn vn v0 + . . . + vn =µn+1 (v0 + . . . + vn ). Sumando las n + 1 primeras igualdades y sustituyendo en la última, obtenemos µ0 v0 + . . . + µn vn = µn+1 v0 + . . . + µn+1 vn . Como v0 , . . . , vn forman una base (en particular son linealmente independientes) se tiene que µ0 = . . . = µn = µn+1 , que es lo que querı́amos demostrar (llamando λ a este valor común). Definición. Un conjunto de puntos en posición general en un espacio proyectivo P(V ) es un conjunto de puntos p0 , . . . , ps tales que cualesquiera pi0 , . . . , pir distintos (con r ≤ n) generan un subespacio proyectivo de dimensión r. En otras palabras: –Si s ≤ n, los puntos generan un subespacio de dimensión s. –Si s ≥ n, no existe un hiperplano de cardinal n + 1 de los p0 , . . . , ps . P(V ) que contenga ningún subconjunto de Se llama referencia proyectiva de P(V ) a un conjunto ordenado de n + 2 puntos en posición general. Se llama base asociada a una referencia proyectiva a cualquiera de las bases que proporciona el Teorema 7.1. Corolario 7.2. Sea P(V ) un espacio proyectivo de dimensión n y sea R una referencia proyectiva de P(V ). Entonces la aplicación ϕR : Pnk → P(V ) que asocia a cada (a0 : . . . : an ) el punto de P(V ) que corresponde a un vector v ∈ V de coordenadas (a0 , . . . , an ) respecto de una base asociada a R está bien definida y es biyectiva. Demostración: Sea B = {v0 , . . . , vn } una base asociada a R. Tenemos entonces un isomorfismo ψB : k n+1 → V de espacios vectoriales que asocia a cada (a0 , . . . , an ) el vector a0 v0 + . . . + an vn . Entonces debe ser ϕR (a0 : . . . : an ) = [ψB (a0 , . . . , an )], con lo que para estar bien definido hay que ver que este valor no depende ni del representante de (a0 : . . . : an ) ni de la base asociada B. En primer lugar, si (a0 : . . . : an ) = (a0 : . . . : an ), entonces existe λ ∈ k \ {0} tal que (a0 , . . . , an ) = µ(a0 , . . . , an ), luego ψB (a0 , . . . , an ) = λψB (a0 , . . . , an ), y por tanto [ψB (a0 , . . . , an )] = [ψB (a0 , . . . , an )]. 64 En segundo lugar, si B fuera otra base asociada a R, por el Teorema 7.1 se sigue que existe λ ∈ k \ {0} tal que B = {λv0 , . . . , λvn }. Por tanto, ψB (a0 , . . . , an ) = a0 λv0 + . . . + an λvn = λ(a0 v0 + . . . + an vn ) = λψB (a0 , . . . , an ) es decir, [ψB (a0 , . . . , an )] = [ψB (a0 , . . . , an )]. Definición. Dado un punto [v] ∈ P(V ), se llaman coordenadas respecto a una referencia proyectiva R = {p0 , . . . , pn , pn+1 } a ϕ−1 R ([v]), es decir, a (a0 : . . . : an ), donde (a0 , . . . , an ) son las coordenadas de v respecto de cualquier base asociada a la referencia proyectiva. Obsérvese que las coordenadas respecto de R de los puntos p0 , . . . , pn , pn+1 son, respectivamente, (1 : 0 : . . . : 0), . . . , (0 : . . . : 0 : 1), (1 : . . . : 1). El punto pn+1 se llama punto unidad de la referencia. Se llama referencia canónica de Pnk a la referencia {(1 : 0 : . . . : 0), . . . , (0 : . . . : 0 : 1), (1 : . . . : 1)}. La demostración del Corolario 7.2 se puede generalizar: Proposición 7.3. Sean V, W dos espacios vectoriales de dimensión n + 1 sobre k. Entonces: (i) Si ψ : V → W es un isomorfismo de espacios vectoriales, la aplicación ϕ : P(V ) → P(W ) dada por ϕ([v]) = [ψ(v)] está bien definida y es una biyección. (ii) Si {p0 , . . . , pn , pn+1 } es una referencia proyectiva de P(V ) y {v0 , . . . , vn } es una base asociada, {ϕ(p0 ), . . . , ϕ(pn ), ϕ(pn+1 )} es una referencia proyectiva de P(W ) con base asociada {ψ(v0 ), . . . , ψ(vn )}. (iii) Dos isomorfismos ψ, ψ : V → W definen la misma aplicación ϕ : P(V ) → P(W ) si y sólo si existe λ ∈ k \ {0} tal que ψ = λψ. Demostración: Para demostrar (i), observamos primero que ψ(v) = 0 si v = 0, con lo que tiene sentido hablar de [ψ(v)]. Además, [v] = [v ] si y sólo si existe λ ∈ k \ {0} tal que v = λv, que es equivalente (por ser ψ un biyectiva) a ψ(v ) = ψ(λv); como ψ es un homomorfismo de espacios vectoriales, ψ(λv) = λψ(v), por lo que la igualdad anterior es equivalente a [ψ(v )] = [ψ(v)]. Esto demuestra que ϕ está bien definida y es inyectiva. La suprayectividad de ϕ es inmediata, ya que dado [w] ∈ P(W ), por la suprayectividad de ψ tenemos que existe v ∈ V tal que w = ψ(v). Además, como w = 0 y ψ es homomorfismo, se sigue que v = 0. Por tanto, [w] = ϕ([v]). La parte (ii) es una consecuencia de las igualdades ϕ(p0 ) = ϕ([v0 ]) = [ψ(v0 )] .. . 65 ϕ(pn ) = ϕ([vn ]) = [ψ(vn )] ϕ(pn+1 ) = ϕ([v0 + . . . + vn ]) = [ψ(v0 + . . . + vn )] = [ψ(v0 ) + . . . + ψ(vn )] Para la parte (iii), es claro que cualquier isomorfismo de la forma λψ define la misma aplicación ϕ que ψ. Recı́procamente, supongamos que ψ, ψ definen la misma ϕ. Tomamos {p0 , . . . , pn , pn+1 } una referencia proyectiva de P(V ) y {v0 , . . . , vn } una base asociada suya. Por (ii), {ψ(v0 ), . . . , ψ(vn )} como {ψ (v0 ), . . . , ψ (vn )} son bases de W serán dos bases asociadas de {ϕ(p0 ), . . . , ϕ(pn ), ϕ(pn+1 )}. Por la Proposición 7.1, existe λ ∈ k \ {0} tal que ψ (v0 ) = λψ(v0 ) .. . ψ (vn ) = λψ(vn ) lo que implica que ψ = λψ. Definición. Se llama proyectividad entre dos espacios proyectivos P(V ) y P(W ) a una biyección obtenida como en la Proposición 7.3 a partir de un isomorfismo entre V y W . Se llama parametrización de un espacio proyectivo P(V ) a una proyectividad entre Pnk y P(V ). Teorema 7.4 (segundo teorema fundamental de la geometrı́a proyectiva). Sean P(V ) y P(W ) dos espacios proyectivos de dimensión n y referencias respectivas {p0 , . . . , pn , pn+1 } y {q0 , . . . , qn , qn+1 }. Entonces existe una única proyectividad ϕ : P(V ) → P(W ) tal que ϕ(pi ) = qi para i = 0, . . . , n + 1. Demostración: Supongamos que ϕ venga definida a partir de un isomorfismo ψ : V → W y veamos que ψ es único salvo multiplicación por constante. Si {v0 , . . . , vn } es una base asociada a {p0 , . . . , pn , pn+1 }, entonces por la Proposición 7.3(ii), {ψ(v0 ), . . . , ψ(vn )} es una base asociada a {q0 , . . . , qn , qn+1 }. Como por la Proposición 7.1 existen bases asociadas a {q0 , . . . , qn , qn+1 } y todas son proporcionales entre ellas, existen isomorfismos ψ en esas condiciones y todos ellos son proporcionales entre sı́. El motivo de empezar estudiando las aplicaciones que inducen los isomorfismos vectoriales es que una aplicación lineal arbitraria F : V → W no da lugar a una aplicación f : P(V ) → P(W ) bien definida (la definición seguirı́a siendo f ([v]) = [F (v)]). Siguiendo la demostración de la Proposición 7.3, se observa que el problema es que, si F no es inyectiva, existen vectores no nulos v ∈ ker F y entonces f ([v]) no está definida. Indicaremos el hecho de que una aplicación no esté definida en todos los puntos con la notación f : P(V )-----> P(W ). 66 Definición. Se llama aplicación proyectiva entre dos espacios proyectivos P(V ) y P(W ) a una aplicación f : P(V )-----> P(W ) definida por una aplicación lineal no nula F : V → W . El subespacio P(ker F ) se llama centro de la aplicación proyectiva. Ejemplo 7.5. Sea P(V ) un espacio proyectivo de dimensión n y sean Λ, Λ dos subespacios disjuntos de dimensiones r y n − r − 1 (luego por la fórmula de Grassmann, < Λ, Λ >= P(V ). Para cada p ∈ P(V ) \ Λ, podemos considerar el subespacio < p, Λ >, que por la fórmula de Grassmann tiene dimensión r + 1. De nuevo por la fórmula de Grassmann, dim(< p, Λ > ∩Λ ) = 0, es decir, es un punto p . Veamos que la aplicación f : P(V )\Λ → Λ es proyectiva (y se llama proyección lineal de centro Λ sobre Λ ). Sean W, W los subespacios vectoriales de V que corresponden respectivamente a Λ, Λ . Como Λ ∩ Λ = ∅, se tiene W ∩ W = 0, y como dim W = r + 1 y dim W = n − r se sigue que V = W + W . Entonces, para cada v ∈ W se puede escribir de forma única v = w + w , con w ∈ W y w ∈ W \ {0}. Por tanto, se tiene w = v − w, que claramente está en L[v] + W . En otras palabras, el punto [w ] de P(V ) está tanto en < [v], Λ > como en P(W ). Como hemos visto que si [v] ∈ P(V ) \ P(W ) hay un único punto en < [v], Λ > ∩P(W ), necesariamente es [w ], por lo que f ([v]) = [w ]. Dado que la aplicación F : V → W que asocia a cada v el único vector w tal que v = w + w es un homomorfismo, se sigue que f es proyectiva. Podemos ahora generalizar la Proposición 7.3: Proposición 7.6. Sea F : V → V un homomorfismo no nulo de espacios vectoriales y sea f : P(V )-----> P(W ) la aplicación proyectiva inducida. Entonces (i) Im f = P(Im F ), luego es un subespacio proyectivo de dim P(V ) − dim(centro de f ) − 1. P(W ) que tiene dimensión (ii) f es suprayectiva si y sólo si F es suprayectiva. (iii) f es inyectiva (donde está definida) si y sólo si F es inyectiva, es decir, si y sólo si el centro de f es vacı́o (y por tanto f está definida en todo P(V )). (iv) f es una proyectividad si y sólo si F es un isomorfismo. (v) Otro homomorfismo no nulo F : V → W define la misma aplicación proyectiva f si y sólo si existe λ ∈ k \ {0} tal que F = λF . Demostración: Para demostrar (i), basta observar que los elementos de Im f son los elementos de la forma f ([v]), con v ∈ V \ ker F , es decir, los elementos de la forma [F (v)] con F (v) = 0, es decir, los elementos de P(Im F ). La fórmula de la dimensión es consecuencia inmediata de la igualdad dim(Im F ) = dim V − dim ker F . La parte (ii) es inmediata a partir de (i), de la misma forma que (iv) es consecuencia de (ii) y (iii). 67 Para ver (iii), hay que trabajar un poco más. Supongamos primero que F es inyectiva. Entonces, si f ([v]) = f ([v ], se tiene que [F (v)] = F (v )], por lo que existe λ ∈ k \ {0} tal que F (v ) = λF (v). Esto implica que F (v ) = F (λv), que, por la inyectividad de F implica v = λv, es decir, [v] = [v ], con lo que f es inyectiva. Recı́procamente, supongamos ahora que f es inyectiva y veamos que ker F = 0. Para ello, tomamos v ∈ ker F y fijamos cualquier v ∈ V \ ker F . Entonces tendremos F (v + v ) = F (v) + F (v ) = F (v ) = 0, con lo que tendremos f ([v + v ]) = f ([v ]). Por la inyectividad de f , existe λ ∈ k \ {0} tal que v + v = λv . Aplicando F , tendremos F (v ) = λF (v ), y como F (v ) = 0, se tendrá λ = 1, por lo que v = 0, lo que demuestra ker F = 0. Finalmente, para ver (v), es evidente que dos aplicaciones lineales proporcionales definen la misma aplicación proyectiva. Recı́procamente, supongamos que F y F definen la misma aplicación proyectiva f : P(V )-----> P(W ). En particular, el centro de f es tanto P(ker F ) como P(ker F ), y la imagen de f es tanto P(Im F ) como P(Im F ). Por tanto, ker F = ker F e Im F = Im F . Sea V ⊂ V un subespacio vectorial complementario de ker F , es decir, V = ker F ⊕ V y sea W = Im F = Im F . Es entonces evidente que F|V , FV : V → W son dos isomorfismos que definen la misma proyectividad f|P(W ) : P(V ) → P(W ). Por tanto, por la Proposición 7.3(iii), existe λ ∈ k\{0} tal que F|V , λFV . Sea ahora cualquier v ∈ V . Como V = ker F ⊕ V , podremos escribir v = v0 + v , con v0 ∈ ker F = ker F y v ∈ V . Por tanto, F (v) = F (v0 +v ) = F (v0 )+F (v ) = 0+λF (v) = λF (v0 )+λF (v) = λF (v0 +v ) = λF (v) lo que demuestra que F = λF . El resultado anterior nos permite dar las siguientes definiciones: Definición. Se llama matriz de una aplicación proyectiva f : P(V )-----> P(V ) respecto de un par de sistemas de referencia R, R de P(V ) y P(W ) a una matriz de una aplicación lineal F : V → W que induzca f respecto a un par de bases B, B asociadas a R, R . Esta matriz será única salvo multiplicación por constante. Dadas dos referencias proyectiva R, R de un mismo espacio proyectivo, se llama matriz de cambio de referencia a una matriz de la aplicación identidad en P(V ) respecto de las referencias R, R . Ejemplo 7.7. Si tenemos una proyectividad entre dos espacios proyectivos P(V ) y P(W ), entonces sabemos que una referencia R de P(V ) va a parar a una referencia R de P(W ). Por tanto, la matriz de la proyectividad respecto de R y R es la identidad, es decir, el punto de coordenadas (x0 : . . . : xn ) respecto de R va a parar al punto de coordenadas (x0 : . . . : xn ) respecto de R . Recı́procamente, si tenemos una aplicación f : P(V ) → P(W ) y un par de referencias proyectivas, R de P(V ) y R de P(W ), tal que el punto de 68 coordenadas (x0 : . . . : xn ) respecto de R va a parar al punto de coordenadas (x0 : . . . : xn ) respecto de R , entonces f es una proyectividad. En efecto, si {v0 , . . . , vn } y {w0 , . . . , wn } son bases asociadas a R y R respectivamente, se tendrá que f corresponde al isomorfismo V → W que manda el vector x0 v0 + . . . + xn vn al vector x0 w0 + . . . + xn wn . Observación 7.8. Nótese que el segundo teorema fundamental de la geometrı́a proyectiva es la generalización del Teorema 2.20, que es el que permitı́a definir razón doble de cuatro puntos de una recta del plano proyectivo. Por tanto, tiene sentido dar la misma definición de razón doble para cuatro puntos alineados en cualquier espacio proyectivo, y se tendrá también el análogo del Teorema 3.4, es decir, que una aplicación inyectiva entre dos recta es una proyectividad si y sólo si conserva la razón doble. En el leguaje de coordenadas, se puede interpretar de otro modo. Dados cuatro puntos a, b, c, d de una recta L, la única parametrización P1k → L que manda respectivamente (1 : 0), (0 : 1), (1 : 1) a los puntos a, b, c es precisamente la proyectividad que consiste en tomar coordenadas respecto a la referencia R = {a, b, c}. Entonces, si (ρ0 : ρ1 ) son las coordenadas homogéneas de d respecto de R, la razón doble es por definición [a, b, c, d] = ρρ01 . La fórmula de cálculo de la razón doble que dimos en el Lema 3.1 se puede generalizar. La forma más sencilla de escribirla es que, dados a, b, c, d en una recta L, tomando cualquier referencia proyectiva R sobre L, si las coordendas de a, b, c, d son respectivamente (a0 : a1 ), (b0 : b1 ), (c0 : c1 ), (d0 : d1 ), entonces a0 a1 [a, b, c, d] = a0 a1 c0 b0 d0 c1 b1 d1 . d0 b0 c0 d1 b1 c1 Esto es simplemente porque la aplicación φR : P1k → L dada por las coordenadas respecto de R es una proyectividad, luego conserva la razón doble. El hecho de que la conservación de la razón doble caracterice las proyectividades de rectas es precisamente el hecho de que las proyectividades están caracterizadas por conservar coordenadas. En efecto, supongamos que tenemos una aplicacióon inyectiva f : L → L entre dos rectas, y sean a, b, c ∈ L puntos distintos. Como f es inyectiva, entonces f (a), f (b), f (c) son también distintos. Tenemos entonces una referencia R = {a, b, c} de L y otra {f (a), f (b), f (c)} de L . Según el Ejemplo 7.7, f será una proyectividad si y sólo si transforma cada punto de coordenadas (ρ0 : ρ1 ) respecto de R en el punto de coordenadas (ρ0 : ρ1 ) respecto de R , lo que es equivalente a que f conserve la razón doble. Esta última observación se puede generalizar a espacios proyectivos de dimensión arbitraria, y nos permite caracterizar las proyectividades en términos exclusivamente de geometrı́a proyectiva, sin necesidad de usar espacios vectoriales: 69 Teorema 7.9. Sea f : P(V ) → P(W ) una aplicación inyectiva entre espacios proyectivos. Entonces f es una proyectividad entre P(V ) y f (P(V )) si y sólo si manda puntos alineados en puntos alineados y conserva la razón doble de cuaternas de puntos alineados. Demostración: Lo demostraremos por inducción sobre n = dim P(V ). Si n = 1, entonces P(V ) es una recta, y por hipótesis su imagen está contenida en una recta, por lo que este caso es el Teorema 3.4 (que acabamos de redemostrar en la Observación 7.8). Supongamos ahora que n > 1 y que hemos demostrado el resultado para aplicaciones que parten de un espacio proyectivo de dimensión n − 1. Obsérvese primero que una implicación es inmediata: si f es una proyectividad sobre la imagen, manda rectas a rectas, y la restricción a ellas es una proyectividad, luego conserva la razón doble. Para la otra implicación, fijemos R = {p0 , p1 , . . . , pn , pn+1 }, una referencia proyectiva de P(V ). Para cada i, j ∈ {0, 1, . . . , n, n + 1}, sean Λij =< p0 , . . . , p̂i , . . . , p̂j , . . . , pn+1 > y pij =< pi , pj > ∩Λij . Por hipótesis de inducción, cada f|Λij es una proyectividad sobre f (Λij ), que será un subsespacio de dimensión n − 1. Como f es inyectiva, entonces f (pi ), f (pj ) son distintos y ninguno de ellos está en f (Λij ). Se tendrá, por tanto, f (pij ) = < f (pi ), f (pj ) > ∩f (Λij ) y, en particular, f (P(V )) estará contenido en el subespacio < f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) >=< f (Λij ), f (pi ), f (pj ) >, que tiene dimensión n. El hecho de que cada f|Λij sea una proyectividad sobre F (Λij ) implica que los puntos f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) están en posición general, y forman una referencia proyectiva de < f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) >. Consideramos entonces la única proyectividad F : P(V ) →< f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) > que manda cada pi a f (pi ). Veamos que F = f , lo que completarı́a la demostración. En primer lugar, para cada i, j es claro que los puntos p0 , . . . , p̂i , . . . , p̂j , . . . , pn+1 , pij forman una referencia proyectiva de Λij . Por tanto f|Λij es la única proyectividad que ˆ i ), . . . , f (p ˆ j ), . . . , f (pn+1 ), f (pij ). Como F|Λ tammanda esa referencia en f (p0 ), . . . , f (p ij bién verifica lo mismo (para pij se hace como para f ), entonces f|Λij = F|Λij . Por tanto, f (p) = F (p) para cualquier punto p ∈ P(V ) que esté en algún Λij . Por otra parte, si un punto p ∈ P(V ) no está en ningún Λij , consideramos los puntos p =< p, pn+1 > ∩Λ0,n+1 y q =< p, pn+1 > ∩Λn,n+1 . Usando que tanto f como F conservan la razón doble, se tendrá [f (p ), f (q ), f (pn+1 ), f (p)] = [p , q , pn+1 , p] = = [F (p ), F (q ), F (pn+1 ), F (p)] = [f (p ), f (q ), f (pn+1 ), F (p)] de donde se deduce (Observación 3.6) f (p) = F (p). Observación 7.10. La hipótesis de conservar la razón doble es fundamental en el Teorema 7.9. Por ejemplo, la aplicación f : P2C → P2C definida por f (x0 : x1 : x2 ) = (x̄0 : x̄1 : x̄2 ) 70 es claramente biyectiva, y la imagen de la recta de ecuación u0 x0 + u1 x1 + u2 x2 = 0 es la recta de ecuación ū0 x0 + ū1 x1 + ū2 x2 = 0. Sin embargo, no se conserva la razón doble, ya que, por ejemplo, [(0 : 1 : 0), (1 : 0 : 0), (1 : 1 : 0), (1 : λ : 0)] = λ, mientras que en cambio [(0 : 1 : 0), (1 : 0 : 0), (1 : 1 : 0), (1 : λ̄ : 0)] = λ̄. Definición. Se llama aplicación semilineal de espacios vectoriales a una aplicación F : V → W para la que existe un automorfismo de cuerpos σ : k → k tal que F (v1 + v2 ) = F (v1 ) + F (v2 ) y F (λv) = σ(λ)F (v). Se dice también que F es σ-semilineal. Si F es un isomorfismo, diremos que es un σ-semiisomorfismo (en cuyo caso F −1 es una aplicación σ −1 -semilineal). Ejemplo 7.11. Fijada una base v0 , . . . , vn de V y un automorfismo de cuerpos σ : k → k, la aplicación F0 : V → V definida por F0 (x0 v0 + . . . + xn vn ) = σ(x0 )v0 + . . . + σ(xn )vn es un σ-semiisomorfismo. Lema 7.12. Sea F0 : V → V un σ-semiisomorfismo y W un espacio vectorial sobre k. La asignación F → F ◦ F0 define una biyección entre el conjunto de aplicaciones lineales F : V → W y el conjunto de aplicaciones σ-semilineales F : V → W . Demostración: Si F es una aplicación lineal, entonces se tendrá F ◦ F0 (λ1 v1 + λ2 v2 ) = F (σ(λ1 )F0 (v1 ) + σ(λ2 )F0 (v2 )) = σ(λ1 )F (F0 (v1 )) + σ(λ2 )F (F0 (v2 )) por lo que F ◦ F0 es una aplicación σ-semilineal. Del mismo modo, si F : V → W es una aplicación σ-semilineal, se tendrá F ◦ F0−1 (λ1 v1 + λ2 v2 ) = λ1 F (F0−1 (v1 )) + λ2 F (F0−1 (v2 )) por lo que F ◦ F0−1 es una aplicación lineal. Por tanto, la asignación F → F ◦ F0−1 es la asignación inversa de la dada, con lo que ambas son biyectivas. Podemos repetir para aplicaciones semilineales todo lo que hemos visto para aplicaciones lineales. En concreto: Definición. Se llama aplicación semiproyectiva o aplicación σ-semiproyectiva a una aplicación f : P(V ) → P(W ) definida por una aplicación σ-semilineal V → W no nula (es decir, f ([v]) = [F (v)]). Si F es un semiisomorfismo, diremos que f es una σ-semiproyectividad. Por el Lema 7.12, una aplicación semiproyectiva viene caracterizada por ser la composición de una semiproyectividad y una aplicación proyectiva. 71 Teorema 7.13 (Primer teorema fundamental de la geometrı́a proyectiva). Una aplicación f : P(V ) → P(W ) entre espacios proyectivos de dimensión al menos dos es una semiproyectividad entre P(V ) y f (P(V )) si y sólo si manda biyectivamente rectas a rectas. Demostración: Es claro que una semiproyectividad manda biyectivamente rectas a rectas, ası́ que basta ver que esta propiedad caracteriza a las semiproyectividades. Sea pues f : P(V ) → P(W ) una aplicación inyectiva que manda biyectivamente rectas a rectas. En particular, f es inyectiva, ya que si a = b, la recta ab va biyectivamente a otra recta, por lo que f (a) = f (b). Veamos que, si [a1 , b1 , c1 , d1 ] = [a2 , b2 , c2 , d2 ] para dos cuaternas de puntos alineados en P(V ), entonces también [f (a1 ), f (b1 ), f (c1 ), f (d1 )] = [f (a2 ), f (b2 ), f (c2 ), f (d2 )]. En efecto, la condición [a1 , b1 , c1 , d1 ] = [a2 , b2 , c2 , d2 ] es equivalente a que las cuaternas a1 , b1 , c1 , d1 y a2 , b2 , c2 , d2 se obtienen una de la otra a partir de un número finito de perspectividades. Como f manda puntos alineados en puntos alineados, se tendrá también que las cuaternas f (a1 ), f (b1 ), f (c1 ), f (d1 ) y f (a2 ), f (b2 ), f (c2 ), f (d2 ) se obtienen una de la otra a partir de un número finito de perspectividades. Por tanto, [f (a1 ), f (b1 ), f (c1 ), f (d1 )] = [f (a2 ), f (b2 ), f (c2 ), f (d2 )]. Podemos entonces definir una aplicación σ : k → k tomando, para cada ρ ∈ k, una cuaterna a, b, c, d ∈ P(V ) tal que [a, b, c, d] = ρ y definiendo σ(ρ) = [f (a), f (b), f (c), f (d)] (como casos degenerados, definimos σ(0) = 0 y σ(1) = 1). Veamos en primer lugar que σ es un automorfismo de cuerpos. –Dados ρ1 , ρ2 ∈ k \ {0, 1}, sean a, b, c tres puntos distintos de P(V ) que estén sobre una misma recta L. Tomamos d ∈ L tal que [a, b, c, d] = ρ1 . Como ρ1 = 0, 1, los puntos a, b, d son distintos, luego existe e ∈ L tal que [a, b, d, e] = ρ2 . Por la Observación 3.11 tendremos σ(ρ1 ρ2 ) = σ([a, b, c, d][a, b, d, e]) = σ([a, b, d, e]) = = [f (a), f (b), f (c), f (e)] = [f (a), f (b), f (c), f (d)][f (a), f (b), f (d), f (e)] = σ(ρ1 )σ(ρ2 ). Tenemos por tanto que σ(ρ1 ρ2 ) = σ(ρ1 )σ(ρ2 ) para todo ρ1 , ρ2 ∈ k (si algún ρi = 0, 1, el resultado es trivial). –Veamos ahora que σ(ρ1 +ρ2 ) = σ(ρ1 )+σ(ρ2 ) para todo ρ1 , ρ2 ∈ k\{0} (el caso en que algún ρi = 0 es trivial). En este caso, podemos tomar tres puntos distintos a, b, c ∈ P(V ) sobre una misma recta L, y puntos d1 , d2 = a tales que [a, b, c, d1 ] = ρ1 y [a, b, c, d2 ] = ρ2 . Como P(V ) tiene dimensión al menos dos (ésta es la parte crucial en que se usa), podemos tomar un plano que contenga a L, y el Lema 3.11 nos permite construir geométricamente un punto d ∈ L tal que [a, b, c, d] = [a, b, c, d1 ]+[a, b, c, d2 ]. Como f manda puntos alineados a puntos alineados, mandará la figura del Lema 3.11 en una figura idéntica en P(V ), que 72 dará entonces [f (a), f (b), f (c), f (d)] = [f (a), f (b), f (c), f (d1 )] + [f (a), f (b), f (c), f (d2 )], es decir, σ(ρ1 + ρ2 ) = σ(ρ1 ) + σ(ρ2 ). –Con esto tenemos que σ es un homomorfismo de grupos (y en particular inyectivo). Para ver que es suprayectivo, sea ρ ∈ k. Tomamos L ⊂ P(V ) una recta cualquiera. Por hipótesis, f (L) es una recta. En particular, podremos encontrar a , b , c , d ∈ f (L) tales que [a , b , c , d ] = ρ . Sean a, b, c, d ∈ L tales que f (a) = a , f (b) = b , f (c) = c y f (d) = d y escribamos ρ = [a, b, c, d]. Se tendrá entonces σ(ρ) = ρ . Sea ahora g : P(V ) → P(V ) cualquier σ-semiproyectividad. Se tendrá entonces que f ◦ g es una aplicación inyectiva que manda puntos alineados en puntos alineados, y que además conserva la razón doble. Por el Teorema 7.9, la aplicación f ◦ g −1 es una proyectividad sobre f ◦ g −1 (P(V )) = f (P(V )), lo que implica que f es una σ-semiproyectividad sobre f (P(V )). −1 En el caso en que el cuerpo base es k = R, el Teorema Fundamental caracteriza las proyectividades de un espacio proyectivo (de dimensión al menos dos) como aquellas aplicaciones que mandan biyectivamente rectas a rectas, ya que se tiene el siguiente: Teorema 7.14. Sea σ : R → R un automorfismo de cuerpos. Entonces σ = idR . Demostración: Por ser un automorfismo de cuerpos, σ(1) = 1, y por tanto . . + 1) = 1 + .n) .. + 1 = n σ(n) = σ(1 + .n) para todo n ∈ N. Como σ(−1) = −1, se sigue también que σ(a) = a para todo a ∈ Z. Si tomamos ahora q = ab ∈ Q, se tendrá bσ(q) = σ(b)σ(q) = σ(bq) = σ(a) = a = bq por lo que σ(q) = q para cualquier q ∈ Q. Veamos ahora que σ conserva el orden de los reales. En efecto, si α < β, entonces podremos escribir β − α = 2 , para algún ∈ R positivo. Por tanto σ(β) − σ(α) = σ(β − α) = σ(2 ) = σ()2 > 0 luego σ(α) < σ(β). Veamos finalmente que σ(α) = α para cualquier α ∈ R. En efecto, en caso contrario, se tendrı́a α < σ(α) o σ(α) < α. Veamos que el primer caso es imposible, siendo el segundo caso análogo. Si fuera α < σ(α), como los racionales son densos en Q, podrı́amos encontrar q ∈ Q tal que α < q < σ(α). Pero eso es imposible, ya que, según hemos visto, la desigualdad α < q implica la desigualdad σ(α) < σ(q) = q. 73 En el caso k = C, el resultado anterior no es cierto, ya que la conjugación es un automorfismo. No es el único automorfismo distinto de la identidad (aunque sı́ es el único continuo). De hecho, existem infinitos automorfismos de C, aunque no son fáciles de construir. Damos ahora una definición que de nuevo parece artificial porque necesita pasar por el espacio vectorial, pero que otra vez más la razón doble nos permitirá hacer de forma intrı́nseca. Definición. Dada una referencia proyectiva R de un espacio proyectivo P(V ), se llama referencia dual a la única referencia proyectiva R∗ de P(V )∗ que tiene como base asociada una base dual de una base asociada a R. Proposición 7.15. Sea R = {p0 , . . . , pn , pn+1 } una referencia proyectiva de un espacio proyectivo P(V ). Entonces, la referencia dual R∗ = {H0 , . . . , Hn , Hn+1 } consiste en los hiperplanos: H0 =< p1 , . . . , pn > .. . Hn =< p0 , . . . , pn−1 > y Hn+1 es el único hiperplano que contiene a los puntos pij donde pij es el cuarto armónico respecto de los puntos pi , pj , < pi pj > ∩ < R \ {pi , pj } >. Demostración: Escribimos todo en coordenadas respecto de la referencia R. Entonces la referencia dual consiste en los hiperplanos H0 : X0 = 0 .. . Hn : Xn = 0 Hn+1 : X0 + . . . + Xn = 0. Evidentemente, H0 , . . . , Hn consiste en los hiperplanos del enunciado, ası́ que basta comprobar que Hn+1 es el del enunciado. Para cada i, j ∈ {0, . . . , n} (supondremos i < j), el hiperplano < R \ {pi , pj } > tiene ecuación Xi − Xj = 0, con lo que su intersección con la i) j) recta < pi , pj > tiene coordenadas (0 : . . . : 0 : 1 : 0 . . . 0 : 1 : 0 : . . . : 0), luego el punto pij i) j) tiene coordenadas (0 : . . . : 0 : 1 : 0 . . . 0 : − 1 : 0 : . . . : 0). Es entonces claro queHij es el hiperplano generado por los puntos pij . 74 Proposición 7.16. Sea f : P(V )-----> P(W ) una aplicación proyectiva que tiene matriz A respecto de las referencias R y R . Entonces, la aplicación f ∗ : P(W )∗ -----> P(V )∗ que asocia a cada hiperplano H ⊂ P(W ) que no contiene a Im f el hiperplano f −1 (H ) ⊂ P(V ) es una aplicación proyectiva de centro Ω(Im f ), y su matriz respecto de las referencias R∗ y R∗ es At (i.e. la matriz transpuesta de A). Demostración: Que A sea la matriz de f respecto de R y R quiere decir que el punto de coordenadas (x0 : . . . : xn ) respecto de R se transforma por f en el punto de coordenadas (x0 : . . . : xm ) respecto de R , con    x0 x0  ..  ..   .  . =A . xn xm  (7.17) Sea ahora el hiperplano H ⊂ P(W ) de ecuación u0 X0 + . . . + um Xm = 0 respecto de R . Un punto de P(V ) de coordenadas (x0 : . . . : xn ) respecto a R estará en f −1 (H ) si y sólo si u0 x0 + . . . + um xm = 0, donde (x0 : . . . : xm ) vienen dados por (7.17). Esto es equivalente a decir que   x0 . (u0 . . . um )A  ..  = 0 xn es decir, el punto de coordenadas (x0 : . . . : xn ) pertenece al hiperplano de coeficientes (u0 . . . un ) = (u0 . . . um )A (obsérvese que los coeficientes son todos no nulos si y sólo si H no contiene a la imagen de f ). De aquı́ se concluye que el hiperplano de coordenadas (u0 : . . . : um ) respecto de R∗ se transforma mediante f ∗ en el hiperplano de coordenadas (u0 : . . . : un ) respecto de R∗ , con   u0  ...  = A    un  u0 ..  .  um lo que demuestra el resultado. Definición. Se llama aplicación dual de una aplicación proyectiva f : P(V )-----> P(W ) a la aplicación f ∗ : P(W )∗ -----> P(V )∗ definida en la Proposición 7.16. 75 8. Clasificación de proyectividades Clasificar proyectividades quiere decir encontrar una representación sencilla de ellas respecto de alguna referencia proyectiva. Ya vimos en el Ejemplo 7.7 que, usando buenas referencias en los espacios proyectivos de salida y llegada de la proyectividad, la matriz de la proyectividad es más sencilla. Por tanto, plantearse el problema de una representación sencilla sólo tiene sentido si las referencias de los dos espacios proyectivos están relacionadas entre sı́. El caso más natural es cuando ambas referencias son iguales, es decir, cuando lo que queremos es clasificar proyectividades de un espacio proyectivo en sı́ mismo. Observación 8.1. Sea f : P(V ) → P(V ) una proyectividad. Si fijamos una referencia proyectiva R de P(V ), entonces f tendrá una cierta matriz A respecto de R. Si cambiamos la referencia R a otra R y la matriz P define el cambio de sistema de referencia, entonces P −1 AP es (salvo proporcionalidad) la matriz de f respecto de R . Por tanto, las posibles matrices sencillas de proyectividades estarán en clases de equivalencia de matrices por semejanza, es decir, corresponderán a las posibles formas canónicas de Jordan. Las formas canónicas de Jordan se calculan a partir de autovectores y autovalores. Veamos que se trata de una noción natural en el contexto de las proyectividades: Lema 8.2. Sea f : P(V ) → P(V ) una proyectividad determinada por un automorfismo F : V → V . Entonces un vector v ∈ V \ {0} es un autovector de F si y sólo si [v] es un punto invariante por f (i.e. f ([v]) = [v]). Demostración: Recordemos que, por definición, f ([v]) = [F (v)], luego [v] es invariante por f si y sólo si [F (v)] = [v], es decir, si y sólo si existe λ = 0 tal que F (v) = λv, es decir, si y sólo si v es un autovector de autovalor λ (obsérvese que necesariamente todos los autovalores de F son no nulos, por ser F un isomorfismo). Observación 8.3. Dado que, fijada una referecia proyectiva de P(V ) la matriz de una proyectividad de P(V ) respecto de dicha referencia es única salvo proporcionalidad, siempre que tengamos un autovalor en k (lo que es cierto siempre que k sea algebraicamente cerrado, por ejemplo si k = C), dividiendo por él podemos suponer que 1 es un autovalor. Esto permite simplificar la clasificación de proyectividades. Ejemplo 8.4. Veamos por ejemplo cuál serı́a la clasificación de las proyectividades de una recta cuando k es un cuerpo algebraicamente cerrado, usando la simplificación de la Observación 8.3. Suponiendo entonces que un autovalor es 1, las posibles formas canónicas de Jordan serı́an: 76 1) Si hay un único autovalor multiplicidad dos) y la matriz es diagonalizable, la (con 1 0 forma canónica de Jordan serı́a . En este caso, la proyectividad serı́a la identidad. 0 1 2) Si hayun autovalor doble y la matriz no es diagonalizable, la forma canónica de 1 0 Jordan serı́a . 1 1 1 0 3) Si hay dos autovalores distintos, la forma canónica de Jordan serı́a , con 0 λ λ = 1. Obsérvese que si k no fuera algebraicamente cerrado (el caso natural en que pensar es k = R), entonces tanto en el caso 1 como en el 2 el único autovalor está necesariamente en k. Sin embargo, en el caso 3 hay que distinguir dos subcasos: que los dos autovalores estén en k o que ambos sean imaginarios (conjugados, si k = R). Veamos ahora la descripción geométrica de cada uno de los casos anteriores no triviales. Lema 8.5. Sea f : L → L una proyectividad deuna recta proyectiva L cuya matriz 1 0 . Entonces, f tiene un único punto respecto de alguna referencia proyectiva es 1 1 invariante p0 , y se tiene que [p0 , p, f (p), f (f (p))] = 2 para cualquier p ∈ L \ {p0 }. Por tanto, f está determinada conociendo p0 y la imagen de un punto distinto de él. 1 0 Demostración: En las coordenadas respecto a las cuales la matriz de f es , se tiene 1 1 inmediatamente que p0 = (0 : 1) es el único punto invariante. Un punto p distinto de p0 se puede escribir con coordenadas (1 : a), luego f (p) tendrá coordenadas (1 : a + 1), y f (f (p)) tendrá coordenadas (1 : a+2). Se calcula entonces fácilemente que [p0 , p, f (p), f (f (p))] = 2. Por tanto, conocidos p0 y la imagen de un punto p = p0 , la fórmula anterior permite conocer también la imagen de f (p), con lo que tenemos la imagen de tres puntos, lo que determina de forma unı́voca la proyectividad f . El tercer caso lo estudiamos en una situación más general, que nos será útil más adelante: Lema 8.6. Sea f : P(V ) → P(V ) una proyectividad de un espacio proyectivo P(V ) de dimensión n. Supongamos que existe una referencia proyectiva R de P(V ) en la cual f viene 77      representada por una matriz diagonal     1  .. . r+1) 1 λ ..      con λ = 1. Entonces,    . n−r) λ existen subespacios proyectivos disjuntos Λ, Λ ⊂ P(V ) de dimensiones r y n − r − 1 tales que cada punto de ellos es invariante por f y, para cada p ∈ P(V ) \ (Λ ∪ Λ ), su imagen f (p) está caracterizada por la condición [p0 , p1 , p, f (p)] = λ donde p0 =< p, Λ > ∩ Λ , p1 = Λ∩ < Λ , p >. En particular, si P(V ) es una recta, existen puntos invariantes p0 , p1 tales que [p0 , p1 , p, f (p)] = λ para todo p = p0 , p1 . Demostración: Tomamos coordenadas respecto de una referencia R como en la hipótesis. Entonces, la expresión de f será de la forma f (x0 : . . . : xn ) = (x0 : . . . : xr : λxr+1 : . . . : λxn ). Es entonces evidente que los subespacios Λ : Xr+1 = . . . = Xn = 0 y Λ : X0 = . . . = Xr = 0 están formados por puntos invariantes. Dado un punto p = (a0 : . . . : an ) que no esté ni en Λ ni en Λ , es fácil ver (en realidad está hecho en el Ejemplo 7.5) que p0 = (0 : . . . : 0 : ar+1 : . . . : an ) y p1 = (a0 : . . . : ar : 0 : . . . : 0). Tomando {p0 , p1 , p} como sistema de referencia de la recta < p0 , p1 >, es claro que f (p) = (a0 : . . . : ar : λar+1 : . . . : λan ) tiene coordenadas (λ : 1), de lo que se sigue que [p0 , p1 , p, f (p)] = λ. En general, nos interesarán no sólo subespacios de puntos fijos (como en el resultado anterior), sin más en general subespacios que se transformen en ellos mismos, pero no necesariamente punto a punto: Definición. Dada una proyectividad f : P(V ) → P(V ), se llama subespacio invariante a un subespacio Λ ⊂ P(V ) tal que f (Λ) = Λ. Obsérvese que, como f (Λ) tiene la misma dimensión que Λ, basta comprobar sólo que f (Λ) ⊂ Λ. Para hiperplanos, la situación es bien sencilla: 78 Lema 8.7. Sea f : P(V ) → P(V ) una proyectividad y sea H ⊂ P(V ) un hiperplano. Entonces, H es un hiperplano invariante si y sólo si es un punto invariante de la aplicación dual f ∗ : P(V )∗ → P(V )∗ . Demostración: Como f es biyectiva, es claro que f (H) = H si y sólo si H = f −1 (H), lo que es equivalente a que H sea un punto fijo de f ∗ . Observación 8.8. Dada una proyectividad f : P(V ) → P(V ) definida por una matriz A respecto de una referencia R, la aplicación dual viene dada por la matriz At respecto de la referencia dual R∗ (Proposición 7.16). Recuérdese que la forma canónica de Jordan de A está determinada a partir de los rangos de las potencias (A − λI)i , que son iguales a los rangos de (At − λI)i , luego A y At tienen la misma forma canónica de Jordan. En particular, hay una biyección entre el conjunto de puntos invariantes y el de hiperplanos invariantes (incluso autovalor a autovalor). Veamos a continuación cómo usar esto de modo práctico. P3R → P3R la proyectividad definida, respecto de la referencia  0 −1 0 0 0 0  1 2 canónica, por la matriz  . Nuestro objetivo es calcular todos los subes0 0 −1 0 0 0 0 −1 pacios invariantes por f . Un simple cálculo muestra que los autovalores son ±1 (cada uno doble) y que, para el autovalor λ = 1, se obtiene el punto invariante (1 : −1 : 0 : 0) y para λ = −1 se obtiene la recta X0 = X1 = 0 de puntos invariantes. Un modo de obtener subespacios invariantes es considerando subespacios generados por subespacios invariantes. En nuestro caso, el único plano que se obtiene ası́ es el plano X0 + X1 = 0, generado por todos los puntos invariantes que hemos encontrado. Sin embargo, por la observación anterior sabemos que tiene que haber infinitos planos invariantes. Para calcularlos, transponemos la matriz anterior y calculamos los subespacios propios. Para λ = 1 obtenemos (u0 : u1 : u2 : u3 ) = (1 : 1 : 0 : 0), es decir, de nuevo el plano X0 +X1 = 0. ∗ Si en cambio calculamos el subespacio propio de λ = −1, obtenemos la recta de P3R de ecuaciones U0 = U1 = 0, que corresponde al haz de planos de P3R que contienen a la recta X2 = X3 . Veamos ahora cómo podemos encontrar rectas invariantes a partir de los puntos y planos invariantes ya hallados: Ejemplo 8.9. Sea f :  1) La recta X0 = X1 = 0 de puntos invariantes es evidentemente invariante. 2) La recta X2 = X3 = 0 es invariante por ser intersección de planos invariantes. 3) Todas las rectas del plano X0 + X1 = 0 que pasan por el punto (1 : −1 : 0 : 0) son invariantes, ya que están generadas por (1 : −1 : 0 : 0) y su intersección con X0 = X1 = 0 (que es necesariamente un punto, distinto de (0 : 1 : 0 : 0) y además invariante). Estas 79 rectas también pueden verse como la intersección del plano invariante X0 + X1 = 0 con un plano que contenga a X2 = X3 (y por tanto también invariante). Éstas son todas las formas de obtener rectas invariantes a partir de intersecciones de planos invariantes o como rectas generadas por dos puntos invariantes, pero en principio podrı́an no ser todas (como pasaba con los planos invariantes obtenidos a partir de los puntos invariantes). Un modo más exhaustivo de encontrar rectas invariantes es el de restringir la proyectividad a un plano invariante y calcular todos los hiperplanos invariantes de dicha restricción. Veamos lo que obtenemos en nuestro caso: –Si restringimos al plano X0 + X1 = 0, tomamos en él coordenadas x1 , x2 , x3 (usando que x0 = −x1 ), y tendremos entonces la expresión (−x1 : x1 : x2 : x3 ) → (−x1 : x1 : −x2 : −x3 ) o, en forma matricial,   1 x1  x2  →  0 x3 0  0 −1 0   0 x1   x2  . 0 x3 −1 El autovalor λ = 1 de esta nueva matriz nos da el punto y la recta invariante de coordenadas (1 : 0 : 0), que son respectivamente el punto (−1 : 1 : 0 : 0) (que ya sabı́amos que era invariante) y la recta X0 = X1 = 0 (que también sabı́amos que era invariante). Por otra parte, el autovalor λ = −1 nos da como puntos invariantes los de la recta de ecuación X1 = 0 (dentro del plano X0 + X1 = 0, es decir, de nuevo la recta X0 = X1 = 0), y como rectas invariantes las que verifican la ecuación U1 = 0, es decir, las que pasan por el punto de coordenadas (1 : 0 : 0), que son precisamente las rectas de X0 + X1 = 0 que pasan por (−1 : 1 : 0 : 0) (que de nuevo ya sabı́amos que eran invariantes). –Si restringimos a un plano que contenga a la recta X2 = X3 = 0, las cuentas son más complicadas porque tenemos infinitos de estos planos, y deberı́amos hacer depender todo de un parámetro. Para evitar dichas cuentas, utilizaremos la Observación 8.8. Fijemos en primer lugar un plano Π que contenga a la recta X2 = X3 = 0. Los puntos invariantes de f|Π ya los sabemos, ya que son los puntos de intersección de Π con el conjunto de puntos invariantes de f . Obtenemos entonces que f|Π tiene exactamente dos puntos invariantes: el punto (1 : −1 : 0 : 0) y la intersección de Π con la recta X0 = X1 = 0 (que es sólo un punto, ya que en caso contrario Π contendrı́a a toda la recta X0 = X1 = 0, aparte de a la recta X2 = X = 3 = 0, que sin embargo generan todo P3R ). Por tanto, por la Observación 8.8, f|Π tiene exactamente dos rectas invariantes. Como ya conocemos dos (la recta X2 = X3 = 0 y la intersección de Π con X0 + X1 = 0), ya sabemos que no hay más. Si supiéramos que todas las rectas invariantes están contenidas en algún plano invariante, en el ejemplo anterior habrı́amos encontrado todas las rectas invariantes. Veamos 80 que, en efecto, es ası́: Lema 8.10. Sea f : P(V ) → P(V ) una proyectividad de espacios proyectivos sobre un cuerpo algebraicamente cerrado k. Entonces cada subespacio invariante contiene un punto invariante y está contenido en un subespacio invariante. Demostración: Veamos primero que cada subespacio invariante contiene un punto invariante. En efecto, si Λ ⊂ P(V ) es un subespacio invariante por f , entonces f|Λ es una proyectividad de Λ en sı́ mismo. Como k es algebraicamente cerrado, cualquier endomorfismo que induzca f|Λ tiene al menos un autovector no nulo (ya que tiene algún autovalor), y por el Lema 8.2, f|Λ tiene algún punto invariante, es decir, Λ contiene algún punto invariante por f . Veamos ahora que existe algún hiperplano invariante que contiene a Λ. En primer lugar, observamos que, como f (Λ) = Λ (o equivalentemente f −1 (Λ) = Λ), entonces para cualquier hiperplano H que contenga a Λ se tiene que f −1 (H) también contiene a Λ. Esto quiere decir que Ω(Λ) es un subespacio invariante de la proyectividad f ∗ : P(V )∗ → P(V )∗ . Por la parte que acabamos de demostrar, existirá H ∈ Ω(Λ) invariante por f ∗ , es decir, H es un subespacio invariante de f que contiene a Λ. Observación 8.11. El lector puede pensar que el lema anterior no se puede aplicar al Ejemplo 8.9, porque R no es algebraicamente cerrado. Sin embargo, como R está dentro de C, que es algebraicamente cerrado, y en realidad hemos calculado todos los subespacios invariantes de la proyectividad de P3C en sı́ mismo definida por la misma matriz, f no tiene más rectas invariantes (ni siquiera imaginarias). Un buen ejemplo de esta observación es considerar la proyectividad de P3R en sı́ mismo definida por la matriz  0  −1  1 0 1 0 0 0 0 0 0 −1  0 0 . 1 0 Es un simple cálculo comprobar que sus autovalores son λ = i, que da el punto invariante (0 : 0 : 1 : −i) y el plano invariante X0 − iX1 = 0, y λ = −i, que da el punto invariante (0 : 0 : 1 : i) y el plano invariante X0 + iX1 = 0. Por tanto, la proyectividad no tiene ni puntos ni planos reales invariantes. Sin embargo, en el plano X0 − iX1 = 0 (donde (0 : 0 : 1 : i) y (0 : 0 : 1 : −i) son puntos invariantes) tenemos las rectas invariantes X0 = X1 = 0 y X0 − iX1 = X2 − iX3 = 0, y en el plano X0 + iX1 = 0 (donde (0 : 0 : 1 : i) y (0 : 0 : 1 : −i) son puntos invariantes) tenemos las rectas invariantes X0 = X1 = 0 y X0 + iX1 = X2 + iX3 = 0. Por tanto, la proyectividad tiene una recta invariante real, que es X0 = X1 = 0 (que podı́a haberse obtenido también como la recta generada por los 81 dos puntos invariantes o como la intersección de los dos planos invariantes; nótese también que ninguna de las rectas invariantes imaginarias podrı́an haberse obtenido directamente a partir de los puntos y planos invariantes). En los siguientes dos resultados estudiaremos tipos particulares de proyectividades de un espacio proyectivo. Definición. Una proyectividad involutiva es una proyectividad f : P(V ) → P(V ) tal que f ◦ f = idP(V ) . Teorema 8.12. Sea f : P(V ) → P(V ) una proyectividad y supongamos que k es algebraicamente cerrado. Entonces son equivalentes: (i) f es una proyectividad involutiva. (ii) Existe una referencia proyectiva de P(V ) en la que f se representa por una matriz diagonal con sólo unos y menos unos. (iii) Existen subespacios proyectivos disjuntos Λ, Λ ⊂ P(V ) de dimensiones r y n − r − 1 tales que cada punto de ellos es invariante y, para cada p ∈ P(V ) \ (Λ ∪ Λ ), el punto f (p) es el cuarto armónico de los puntos < p, Λ > ∩ Λ , Λ∩ < Λ , p > y p. Demostración: (i) ⇒ (ii): Sea F : V → V un isomorfismo que defina a f (que como dijimos en la Observación 8.3 podemos suponer que tiene a 1 como autovalor). La condición f ◦ f = idP(V ) (por ser f involutiva) equivale a decir que existe λ ∈ k tal que F ◦ F = λidV . Como 1 es un autovalor de F , existirá v ∈ V \ {0} tal que F (v) = v. Por tanto, λv = F (F (v)) = F (v) = v, lo que implica λ = 1. Entonces, la condición F ◦ F = idV puede escribirse también como (F − idV ) ◦ (F + idV ) = 0, o equivalentemente Im(F + idV ) ⊂ ker(F − idV ). Tomando dimensiones y usando la igualdad dim V = dim(ker(F +idV ))+dim(Im(F +idV )) llegamos a que dim(ker(F − idV )) + dim(ker(F + idV )) ≥ dim V . Como ker(F − idV ) ∩ ker(F + idV ) = 0 (son los subespacios propios de los autovalores 1 y −1, se concluye que V es la suma directa de ker(F − idV ) y ker(F + idV ). Tomando una base formada por la unión de una base de ker(F − idV ) y otra de ker(F + idV ) se obtiene que la matriz de F respecto de esa base es diagonal con unos y menos unos en la diagonal. (ii) ⇒ (iii): Es el Lema 8.6 cuando λ = −1. (iii) ⇒ (i): Es claro que, si p están en Λ o Λ , entonces f (f (p)) = f (p) = p, ası́ que basta comprobar la igualdad f (f (p)) = p para puntos que no estén en Λ ∪ Λ . Si llamamos p0 =< p, Λ > ∩ Λ , p1 = Λ∩ < Λ , p >, se tiene por hipótesis [p0 , p1 , p, f (p)] = −1 y [p0 , p1 , f (p), f (f (p))] = −1. Entonces, por la Observación 3.9, se tiene también [p0 , p1 , f (f (p)), f (p)] = −1 y la Observación 3.6 se sigue que f (f (p)) = p 82 Teorema 8.13. Sean P(V ) un espacio proyectivo de dimensión n ≥ 2 y f : P(V ) → P(V ) una proyectividad distinta de la identidad. Entonces, si existe un hiperplano H ⊂ P(V ) de puntos invariantes, se da una de las siguientes situaciones: (i) Existe otro punto invariante p0 ∈ H y una constante λ = 0, 1 tal que para cada p ∈ H ∪ {p0 } se verifica que f (p) es el único punto de la recta < p0 , p > para el que [< p0 , p > ∩H, p0 , p, f (p)] = λ. (ii) No hay más puntos invariantes por f aparte de los de H, y conocidos un punto p1 ∈ H y su imagen f (p1 ), si p0 =< p1 , f (p1 ) > ∩H, entonces f está determinada de la forma siguiente (si dim P(V ) ≥ 2): para cada p ∈ H∪ < p1 , f (p1 ) >, si q =< p1 , p > ∩H, se tiene f (p) =< p0 , p > ∩ < q, f (p1 ) >. Demostración: El que haya un hiperplano H de puntos invariantes equivale a decir que existe todo un hiperplano en V de vectores propios de un automorfismo de V que defina f . Este hiperplano corresponderá entonces a un autovalor λ de multiplicidad al menos n. Se pueden dar entonces dos casos: Caso i) El autovalor λ tiene multiplicidad exactamente n, con lo que hay otro autovalor, que (ver la Observación 8.3) supondremos que es 1 (por tanto, λ = 1, y tampoco es cero por tratarse de un isomorfismo). Entonces la forma canónica de Jordan es diagonal (ya que la dimensión del subespacio propio correspondiente a λ es precisamente n) y estamos en el caso particular del Lema 8.6 en que r = 0, con lo que Λ es un punto p0 . Caso ii) El autovalor λ tiene multiplicidad n + 1, y por tanto es el único autovalor (que, de nuevo por la Observación 8.3, supondremos λ = 1. Se tiene entonces que la matriz de Jordan J no es diagonal, pero como J − I debe tener rango uno debe ser:   1 1  J =     .   1 1 .. . 1 Sea R una referencia proyectiva de P(V ) respecto de la cual la matriz J represente a f . Usando coordenadas respecto de R, H será el hiperplano de ecuación X0 = 0. Supongamos que el punto p1 tenga coordenadas (1 : a1 : . . . : an ) (podemos suponer que la primera coordenada no es nula, por no estar p1 en H). Entonces es un simple ejercicio comprobar que f (p1 ) = (1 : a1 + 1 : a2 : . . . : an ) y que el punto p0 =< p1 , f (p1 ) > ∩H tiene coordenadas (0 : 1 : 0 : . . . : 0) (obsérvese en particular que p0 no depende del punto p1 escogido). Tomemos ahora un punto arbitrario p ∈ H∪ < p1 , f (p1 ) >. Como acabamos de observar, la intersección de < p, f (p) > con H debe ser el mismo punto p0 , luego f (p) está en la recta < p0 , p >. Es también evidente que, como p está en la recta < p1 , q >, 83 entonces f (p) también está en < f (p1 ), f (q) >=< f (p1 ), q >. Como las rectas < p0 , p > y < f (p1 ), q > son distintas (porque p no está en la recta < p0 , f (p1 ) =< p0 , p1 >) y dos rectas distintas se cortan como mucho en un punto, se sigue que la intersección de < p0 , p > y < q, f (p1 ) > es exactamente f (p). Definición. Se llama homologı́a de centro p0 y eje el hiperplano H0 a una proyectividad de P(V ) como en el teorema anterior. Una homologı́a como en el caso (i) se llama homologı́a general, y λ se llama razón de la homologı́a. Una homologı́a como en el caso (ii) se llama homologı́a especial. Observación 8.14. Está claro que una homologı́a general está completamente determinada a partir del centro, eje y razón. En principio, una homologı́a especial parece determinada a partir del eje y de la imagen de un punto p1 (lo que determina automáticamente el centro) sólo para puntos fuera de la recta < p1 , f (p1 ) >. Sin embargo, una vez conocida la imagen de un punto p1 fuera de la recta < p1 , f (p1 ) >, haciendo jugar ahora a p1 el papel de p1 , podemos conocer la imagen de cualquier punto fuera de < p1 , f (p1 ) >, en particular de cualquier punto de < p1 , f (p1 ) >. Por eso es fundamental la hipótesis n ≥ 2, que hace que en el caso n = 1 la situación sea menos completa (ver el Lema 8.5). 84 9. Correlaciones y cuádricas La mejor forma de explicar lo que queremos hacer en este capı́tulo es revisar, con el lenguaje de la geometrı́a proyectiva, la noción de polaridad respecto de una cónica que vimos en el capı́tulo 4: Ejemplo 9.1. Sea C una cónica no degenerada de P2 de ecuación   X0 (X0 X1 X2 )A  X1  = 0 X2 (donde A es una matriz simétrica no degenerada). Sea f : P2 → P2 la aplicación que asocia a cada punto de P2 su recta polar respecto de C. Entonces, f es una proyectividad. En efecto, si C es la cónica, sabemos que la recta polar del punto (a0 : a1 : a2 ) es   X0 (a0 a1 a2 )A  X1  = 0 X2 ∗ es decir, la recta u0 X0 + u1 X1 + u2 X2 = 0, donde (u0 u1 u2 ) = (a0 a1 a2 )A. Como A es simétrica, también podemos escribir     a0 u0  u1  = A  a1  u2 a2 lo que indica que f es la proyectividad de matriz A tomando la referencia canónica de ∗ y su referencia dual en P2 . P2 Sin embargo, no todas las proyectividades de P2 en P2 son una polaridad. Por ∗ ejemplo, la proyectividad f : P2R → P2R que asocia a cada punto (a0 : a1 : a2 ) la recta a1 X0 − a0 X1 + a2 x2 = 0 no puede ser la polaridad respecto de una cónica. En efecto, la imagen del punto a = (0 : 1 : 1) es la recta f (a) de ecuación X0 + X2 = 0, que contiene al punto b = (1 : 1 : −1), mientras que la imagen del punto b es la recta X0 − X1 − X2 = 0, que no contiene al punto a. Por tanto, f no verifica la propiedad (ii) de la Proposición 4.6, por lo que no es la polaridad respecto de una cónica. El problema con este ejemplo (como explicaremos en este capı́tulo)  es que ftiene como matriz, respecto de las referencias 0 1 0  canónica y su dual, a la matriz −1 0 0 , que no es simétrica. 0 0 1 Una primera justificación de la observación anterior es que la polaridad respecto de una cónica no degenerada C ⊂ P2k de matriz A se puede definir de la siguiente forma. ∗ 85 Consideramos la forma bilineal B : k 3 × k 3 → k definida por   Y0 B((X0 , X1 , X2 ), (Y0 , Y1 , Y2 )) = (X0 X1 X2 )A  Y1  . Y2 Entonces la recta polar respecto de C de un punto (a0 : a1 : a2 ) es la recta de ecuación B((X0 , X1 , X2 ), (a0 , a1 , a2 )) = 0. En particular, el punto (b0 : b1 : b2 ) está en la recta polar de (a0 : a1 : a2 ) si y sólo si B((b0 , b1 , b2 ), (a0 , a1 , a2 )) = 0, mientras que el punto (a0 : a1 : a2 ) está en la recta polar de (b0 : b1 : b2 ) si y sólo si B((a0 , a1 , a2 ), (b0 , b1 , b2 )) = 0. Por tanto, la propiedad (ii) de la Proposición 4.6 parece equivalente a que B sea una forma bilineal simétrica, es decir, que A sea simétrica. Nótese, finalmente, que la cónica C está determinada perfectamente por la forma bilineal B (o, más precisamente, por su forma cuadrática asociada), ya que su ecuación es precisamente B((X0 , X1 , X2 ), (X0 , X1 , X2 )) = 0. En este capı́tulo nos proponemos estudiar generalización de cónica proyectiva (que, como en geometrı́a afı́n, será la noción de cuádrica) y la noción de polaridad, que será una aplicación proyectiva de un espacio proyectivo en su dual (pero no cualquiera, ya que tendrá que verificar alguna condición de simetrı́a). Empezamos con una definición: Definición. Llamaremos correlación a una aplicación proyectiva f : P(V )-----> P(V )∗ y correlación no degenerada a una correlación que además sea una proyectividad (esta notación no es universal, y muchos autores llaman correlación a lo que nosotros llamamos correlación no degenerada). Observación 9.2. Veamos (por el momento en coordenadas) que la noción de correlación f : P(V )-----> P(V )∗ no es más que la generalización a dimensión arbitraria de lo que hemos visto en el Ejemplo 9.1. Para ello, fijamos una referencia proyectiva R de P(V ), tomamos la referencia dual R∗ de P(V )∗ y consideramos A una matriz de f respecto de R y R∗ . Esto quiere decir que, si un punto p (fuera del centro de f ) tiene coordenadas (a0 : . . . : an )   a0 . respecto de R, entonces f (p) es el hiperplano coordenadas A  ..  respecto de R, es an decir, el hiperplano de ecuación   a0 . (X0 . . . Xn )A  ..  = 0 an respecto de R. En otras palabras, un punto de coordenadas (b0 : . . . : bn ) pertenece al 86 hiperplano f (p) si y sólo si   a0 . (b0 . . . bn )A  ..  = 0. an    a0 0 ..  ..    = Obsérvese que, si p estuviera en el centro de f , entonces A . , con lo que . 0 an la relación anterior se verifica para cualquier punto de coordenadas (b0 : . . . : bn ). Por abuso de notación, diremos en tal caso que f (p) es todo P(V ). De esta forma, dar una correlación es equivalente a dar una matriz A, y la imagen por la correlación de un punto de coordenadas (a0 : . . . : an ) es el conjunto de puntos de coordenadas (b0 : . . . : bn ) para los que se verifica la relación anterior.  También puede verse la correlación por medio de una forma bilineal. En efecto, basta fijar una base asociada a la referencia R y definir B : V × V -----> k mediante   Y0 . B(u, v) = (X0 . . . Xn )A  ..  Yn donde X0 , . . . , Xn e Y0 , . . . , Yn son respectivamente las coordenadas de u y v respecto de dicha base. De este modo, la imagen por la correlación del punto [v] es el conjunto de puntos de [u] que verifican B(u, v) = 0. Dicho sin coordenadas, lo que tenemos es el siguiente resultado de Álgebra Lineal: Proposición 9.3. Sea V un espacio vectoria sobre un cuerpo k. Entonces: (i) Dado un homomorfismo F : V → V ∗ , la aplicación BF : V × V → k definida por BF (u, v) = (F (v))(u) es una forma bilineal. (ii) Dada una forma bilineal B : V × V → k, la aplicación FB : V → V ∗ definida por FB (v) : V u → → k B(u, v) es una aplicación lineal. Además, las asignaciones F → BF y B → FB definen biyecciones (una inversa de la otra) entre el conjunto de homomorfismos V → V ∗ y el conjunto de formas bilineales V ×V → k. Demostración: Se deja como ejercicio. Definición. Llamaremos correlación asociada a una forma bilineal no nula B : V × V → k a la correlación definida por el homomorfismo FB : V → V ∗ de la proposición anterior. 87 Observación 9.4. Por la Proposición 9.3, la correlación f : P(V )-----> P(V )∗ asociada a una forma bilineal B : V × V → k está definida como f ([v]) = {[u] ∈ P(V ) | B(u, v) = 0}. Además, dos formas bilineales B, B definen la misma correlación si y sólo si los homomorfismos FB y FB definen la misma aplicación proyectiva. Por la Proposición 7.6(v), esto es equivalente a que FB y FB sean proporcionales, lo que equivale a que B y B sean proporcionales. Proposición 9.5. Sea f : P(V )-----> P(V )∗ la correlación asociada a una forma bilineal no nula B : V × V → k. Consideramos la forma bilineal B t : V × V → k definida por B t (u, v) = B(v, u). Entonces la aplicación dual de f (ver Proposición 7.16) es la aplicación f ∗ : P(V )-----> P(V )∗ asociada a B t , es decir, para todo p ∈ P(V ) se tiene que f ∗ (p) = {q ∈ P(V ) | p ∈ f (q)}. Demostración: Identificamos cada punto [v] ∈ P(V ) con el hiperplano Ω([v]) de P(V )∗ consistente en el conjunto de hiperplanos de P(V ) que pasan por p. Entonces, por definición de aplicación dual, f ∗ manda [v] a la imagen inversa por f de Ω([v]), es decir al conjunto {[u] ∈ P(V ) | [v] ∈ f ([u])}. Como f está asociada a B, se tendrá [v] ∈ f ([u]) si y sólo si B(v, u) = 0, es decir B t (u, v) = 0, por lo que f ∗ es la correlación asociada a B t . Definición. Llamaremos correlación dual o correlación transpuesta de una correlación f a la aplicación f ∗ : P(V )-----> P(V )∗ del lema anterior. Nótese que, si f tiene matriz A respecto de una referencia y su dual, entonces f ∗ tiene matriz At . Proposición 9.6. Sea f : P(V )-----> P(V )∗ una correlación asociada a una forma bilineal B : V × V → k. Entonces: (i) f = f ∗ si y sólo si B es simétrica o antisimétrica. (ii) Cada punto p ∈ P(V ) está en el hiperplano f (p) si y sólo si B es antisimétrica. Demostración: Sabemos por la Proposición 9.5 que f ∗ está asociada a B t . Por tanto, por la Observación 9.4, se tendrá f = f ∗ si y sólo si existe λ ∈ k \ {0} tal que B = λB t . Para demostrar (i), basta ver que los únicos valores de λ para los que se puede dar esta igualdad son 1 y −1. En efecto, transponiendo la igualdad y reiterando, se obtiene B t = λB = λ(λB t ) = λ2 B t , lo que implica λ2 = 1 y por tanto λ = ±1. Esto demuestra (i). Para demostrar (ii), la Observación 9.4 nos dice que [v] ∈ f ([v]) si y sólo si B(v, v) = 0. Por tanto, cada punto estará en su imagen por f si y sólo si B(v, v) = 0 para todo v ∈ V . Veamos que esta última condición es equivalente a que B sea una forma bilineal 88 antisimétrica. En efecto, si B(v, v) = 0 para todo v ∈ V , en particular se tendrá, para cualesquiera u, v ∈ V , 0 = B(u + v, u + v) = B(u, u) + B(u, v) + B(v, u) + B(v, v) = B(u, v) + B(v, u) (donde hemos usado la bilinealidad de B). Por tanto, B(u, v) = −B(v, u) para cualesquiera u, v ∈ V , es decir, B es antisimétrica. Definición. Se llama correlación nula (o correlación antisimétrica) a una correlación f : P(V )-----> P(V )∗ tal que p ∈ f (p) para cada p ∈ P(V ). Se llama polaridad o correlación simétrica a una correlación f : P(V )-----> P(V )∗ que coincide con su dual f ∗ y tal que el conjunto Q de los puntos p ∈ P(V ) para los que p ∈ f (p) no es todo P(V ). Por la proposición anterior, tales correlaciones son, respectivamente, las correlaciones asociadas a una forma bilineal antisimétrica y simétrica. Ejemplo 9.7. Obsérvese que, como en una recta los hiperplanos son puntos, una correlación en una recta no es más que una aplicación proyectiva de la recta en sı́ misma. Si f : L-----> L fuera una correlación nula en la recta L, entonces f (p) = p para todo p ∈ L, luego p serı́a la identidad. Observación 9.8. Nótese que, si el cuerpo k tiene caracterı́stica distinta de dos (lo que supondremos siempre) no puede haber correlaciones nulas no degeneradas en un espacio proyectivo de dimensión n par. El motivo es que si A es una matriz antisimétrica de orden impar n + 1, entonces de la igualdad At = −A se sigue det A = det At = (−1)n+1 det A = − det A, lo que implica det A = 0 (aquı́ hace falta usar que la caracterı́stica no es dos; en caso contrario, 2 det A = 0 no implicarı́a det A = 0). En cambio, para n impar, la matriz   0 1  −1 0         0 1 −1 0 .. . 0 −1         1 0 (donde las entradas no explicitadas son cero) es antisimétrica de orden par. En realidad, puede demostrarse que cualquier correlación nula no degenerada admite una matriz de esa forma respecto de un sistema de referencia adecuado. Definición. Por abuso de notación, se suele llamar cuádrica en un espacio proyectivo P(V ) a un conjunto Q de puntos p ∈ f (p), donde f : P(V )-----> P(V )∗ es una polaridad, aunque en 89 realidad una cuádrica es una polaridad, en el sentido de que dos cuádricas se considerarán iguales sólo si sus polaridades coinciden. Se llamará vértice de la cuádrica al centro de la polaridad. Llamaremos rango de la cuádrica al rango de cualquier matriz que defina la polaridad. Diremos que la cuádrica es no degenerada o no singular si el rango es máximo, es decir, dim(V ) (equivalentemente, f es una proyectividad o, también, el lugar singular es vacı́o). Lema 9.9. Sea f : P(V )-----> P(V )∗ la polaridad asociada a una forma bilineal (simétrica) B : V × V → k y sea Q ⊂ P(V ) el conjunto de puntos p ∈ P(V ) tales que p ∈ f (p). Dado un subespacio P(W ) ⊂ P(V ) no contenido en Q, entonces la aplicación f|P(W ) : P(W )-----> P(W )∗ definida por f|P(W ) (p) = f (p) ∩ P(W ) es la polaridad asociada a la restricción BW ×W . Además, como conjunto de puntos, esta cuádrica es la intersección de Q con P(W ). Demostración: Por definición, la correlación asociada a BW ×W asocia a cada [w] ∈ P(W ) el conjunto de puntos [u] ∈ P(W ) tales que BW ×W (u, w) = 0, que es precisamente f ([w]) ∩ P(W ). Además, [w] ∈ P(W ) está en el correspondiente conjunto de puntos si y sólo si BW ×W (w, w) = 0, es decir, si y sólo si [w] ∈ Q. Ejemplo 9.10. En coordenadas respecto de una referencia R (y su dual), la polaridad de una cuádrica viene dada por una matriz simétrica A. Si el rango de A es r, entonces sabemos que existe una matriz P de determinante no nulo tal que      P t AP =      λ0 ..         . λr−1 0 .. . 0 con λo , . . . , λr−1 ∈ k \ {0} Esto quiere decir que, haciendo el cambio de coordenadas    X0 X0  .  ..  = P  ..  . , Xn Xn  = 0. Por tanto: la ecuación de la cuádrica queda λ0 X0 + . . . + λr−1 Xr−1 2 2 –Si la cuádrica tiene rango uno, su conjunto de puntos es un hiperplano, y se dice que la cuádrica es un hiperplano doble. 90 –Si la cuádrica tiene rango dos, su conjunto de puntos es de la forma X0 + λλ10 X1 = 0. λ1 Si − λ0 ∈ k, entonces dicho conjunto es la unión de los hiperplanos X0 + − λλ10 X1 = 0 y X0 − − λλ10 X1 = 0, y se dice que la cuádrica es un par de hiperplanos reales (los hiperplanos son distintos, pues λ1 = 0). Si, en cambio − λλ10 ∈ k, se dice que la cuádrica es un par de hiperplanos imaginarios. 2 2 El resultado siguiente indica que la polaridad respecto de una cuádrica no degenerada tiene el mismo sentido que vimos para cónicas (Proposición 4.2), aunque ahora lo haremos sin coordenadas: Proposición 9.11. Sea f : P(V )-----> P(V )∗ la polaridad de una cuádrica Q. Entonces, para cualquier p ∈ Q se tiene: (i) Una recta de f (p) que pase por p o bien está contenida en Q o corta a Q sólo en el punto p. (ii) Una recta que pase por p y no esté contenida en f (p) corta a Q exactamente en dos puntos (siendo p uno de ellos). Demostración: Sea L ⊂ f (p) tal que p ∈ L y supongamos que L contiene un punto q ∈ Q distinto de L. Veamos entonces que L ⊂ Q, lo que demostrará (i). Observamos en primer lugar que, como q ∈ f (p), entonces p ∈ f (q), y como q ∈ Q, entonces q ∈ f (q). Por tanto, L ⊂ f (q), además de L ⊂ f (p) por hipótesis. Dado pues q ∈ L, se tendrá q ∈ f (p) y q ∈ f (q), luego p, q ∈ f (q ), es decir, L ⊂ f (q ). En particular, q ∈ f (q ), es decir, q ∈ Q como querı́amos. Para demostrar (ii), sea ahora L una recta que pasa por p pero no está contenida en f (p). En particular, f (p) es un hiperplano que corta a L sólo en el punto p. Consideramos f|L : L-----> L definido en el Lema 9.9. Evidentemente, f|L (p) = f (p) ∩ L = p. Además, si q ∈ L \ {p}, no puede ser L ⊂ f (q), ya que entonces p ∈ f (q), lo que implicarı́a q ∈ f (p), es decir, q ∈ f (p)capL = p, que es absurdo. Por tanto, f|L (q) = f (q) ∩ L es un punto, lo que implica que f|L es no degenerada, es decir, tiene rango dos. Por el Ejemplo 9.10, como Q ∩ L tiene al menos el punto real p, consiste exactamente en dos puntos. Definición. Dada una cuádrica no degenerada Q ⊂ P(V ), se llama hiperplano polar de un punto respecto de la cuádrica a la imagen del punto respecto de la correlación f determinada por la cuádrica (en el sentido del resultado anterior) Si p ∈ Q, llamaremos a f (p) hiperplano tangente a la cuádrica Q en el punto p y lo denotaremos Tp Q. Más en general, se llama subespacio polar de un subespacio Λ ⊂ P(V ) al subespacio que corresponde por dualidad a f (Λ) ⊂ P(V )∗ . Se tiene entonces que la intersección de Q con el hiperplano polar de un punto p es el conjunto de puntos q tales que el hiperplano tangente a Q en q pasa por p. 91 Proposición 9.12. Sea Q una cuádrica de rango r y vértice Λ0 en un espacio proyectivo P(V ) de dimensión n. Entonces: (i) Para cada p ∈ Q, la intersección de Q con el hiperplano tangente a Q en p es una cuádrica en dicho hiperplano, que tiene rango r − 2 y vértice el subespacio generado por p y Λ0 . (ii) Los subespacios lineales contenidos en Q tienen dimensión a lo sumo 2n−r 2 . Demostración: Para demostrar (i), tomamos coordenadas en P(V ) tales que el punto p sea (1 : 0 : . . . : 0) y el hiperplano tangente a Q en p sea H : Xn = 0. La matriz de Q en estas coordenadas tendrá entonces la forma  0  0 ... 0 p 0n   A=   0 .. . p11 .. . ... p1,n−1 .. . p1n .. . 0 p0n p1,n−1 p1n ... ... pn−1,n−1 pn−1,n pn−1,n pn,n        ... p1,n−1 p11   .. con p0n = 0. Además, como el rango de A es r, el rango de  ...  . p1,n−1 . . . pn−1,n−1 es r − 2. Es claro que H ∩ Q es la cuádrica en H, cuya ecuación en las coordenadas x0 , . . . , xn−1 consiste en hacer Xn = 0 en la ecuación de Q, es decir, es la cuádrica de matriz 0  0 ... 0 ... p1,n−1  p11 0 .  .. .. .  . . . 0 p1,n−1 ... pn−1,n−1 que claramente tiene rango r − 2 y cuyo núcleo es el subespacio que corresponde al subespacio proyectivo generado por p y Λ0 . Sea ahora Λ un subespacio lineal contenido en Q de dimensión m. La restricción de la polaridad de Q a Λ es una aplicación proyectiva Λ-----> Ω(Λ) con centro Λ ∩ Λ0 . Por tanto n − m − 1 = dim(Ω(Λ)) ≥ dim Λ − dim(Λ ∩ Λ0 ) − 1 ≥ dim Λ − dim Λ0 − 1 = m − (n − r) − 1 de donde se obtiene (ii). Proposición 9.13. Sea P(V ) un espacio proyectivo de dimensión tres y sea Q ⊂ P(V ) una cuádrica no degenerada que contiene una recta L. Entonces por cada punto p ∈ Q pasan exactamente dos rectas contenidas en Q. Demostración: Por la Proposición 9.12(i) sabemos que la intersección de Q con el plano tangente a Q en p es una cónica de rango uno, es decir, un par de rectas. El resultado 92 estará demostrado si demostramos que las rectas no son imaginarias. Distinguimos dos casos: –Si p ∈ L, la intersección de Q con su plano tangente en P contiene a la recta L, luego el par de rectas no son imaginarias (ya que L es una de ellas). –Si p ∈ L, entonces, la intersección de Q con el plano Π generado por p y L es una cónica que pasa por p y contiene a la recta L. Por tanto, dicha cónica es un par de rectas no imaginarias, una de ellas L, y otra recta L que pasa por p. Repitiendo el caso anterior tomando L en lugar de L, se obtiene el resultado. 93 10. Espacio afı́n y espacio proyectivo 94

Geometría Proyectiva - Facultad de Ciencias Matemáticas

Documentos relacionados

Productos

Apoyo

Geometría Proyectiva - Facultad de Ciencias Matemáticas

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib