Geometría Proyectiva - Facultad de Ciencias Matemáticas

Anuncio
Apuntes de
Geometrı́a Proyectiva
por Enrique Arrondo(*)
Versión del 7 de Enero de 2009
Versión muy preliminar
EL PLANO PROYECTIVO
1. Construcción del plano proyectivo
2. Rectas del plano proyectivo
3. Razón doble
4. Cónicas proyectivas
5. Cónicas afines y euclı́deas
ESPACIOS PROYECTIVOS
6. Construcción del espacio proyectivo
7. Aplicaciones proyectivas
8. Clasificación de proyectividades
9. Correlaciones y cuádricas
10. Espacio afı́n y espacio proyectivo
(*) Departamento de Álgebra, Facultad de Ciencias Matemáticas, Universidad Complutense de Madrid, 28040 Madrid, Spain, [email protected]
1
EL PLANO PROYECTIVO
1. Construcción del plano proyectivo
Nuestro punto de partida consiste en observar que existe una cierta simetrı́a entre
el conjunto de puntos y el conjunto de rectas del plano afı́n A2k sobre un cuerpo k. En
efecto, dados dos puntos distintos de A2k , se puede determinar a partir de ellos una recta,
concretamente la única que pasa por ellos dos; recı́procamente, dadas dos rectas distintas
del plano, determinan un único punto, en concreto el de intersección de ambas (salvo que
sean paralelas, problema que obviaremos de momento). Esta simetrı́a nos puede hacer
sospechar que ambos conjuntos tienen la misma estructura, ası́ que vamos a analizar si
esto es cierto.
En primer lugar, el conjunto de puntos de Ak2 se identifica inmediatamente con k 2 ,
pero describir el conjunto de rectas parece más complicado. Para simplificarlo, y hacer
que tal conjunto sea otro k 2 , podemos representar cada recta por medio de una ecuación
de la forma Y = aX + b, con a, b ∈ k. En otras palabras, estamos determinando cada
recta a partir de un par (a, b), donde a es la pendiente de la recta y (0, b) es su punto de
intersección con el eje vertical. Obsérvese que encontramos un nuevo problema, y es que
esto nos da una biyección no entre k 2 y el conjunto de todas las rectas, sino sólo entre k 2
y las rectas no verticales (ya que las rectas de la forma X =constante son las únicas que
no se pueden representar con una ecuación de la forma Y = aX + b).
A pesar de estos problemas, veamos si de todas formas encontramos la simetrı́a a la
que aludimos desde el principio. Empecemos por dos puntos distintos (x , y ), (x , y ) ∈ A2k
y determinemos la recta que pasa por ellos. De Álgebra Lineal y Geometrı́a, sabemos que
dicha recta tiene de ecuación
1 X Y 1 x y = 0
1 x y que, escrita de la forma descrita anteriormente, será Y = aX + b, con
(a, b) =
y − y x y − x y ,
.
x − x
x − x
(1.1)
Por otro lado, si consideramos las rectas Y = a X + b y Y = a X + b , su intersección es
el punto
b − b a b − a b (x, y) = − ,
.
(1.2)
a − a
a − a
2
Comparando las dos expresiones (1.1) y (1.2), nos damos cuenta de que, salvo por un
signo, los pares de la forma (a, b) juegan un papel simétrico al de los pares de la forma
(x, y), lo que no deberı́a ser por casualidad. La clave nos la va a dar el mirar los casos
“patológicos”. Si miramos la fórmula (1.2), nos damos cuenta de que no tiene sentido si
a = a . Hasta aquı́ es normal, visto que a = a quiere decir que las dos rectas tienen la
misma pendiente, es decir, son paralelas, con lo que evidentemente no nos podı́a salir un
punto de intersección.
Mirando ahora el caso simétrico, la fórmula (1.1) no está definida cuando x = x ,
lo que también es normal, porque en tal caso la recta que pasa por los dos puntos es una
recta vertical, que no se puede poner de la forma Y = aX + b. La idea es que, dado que
en este último caso sabemos que sı́ que hay recta, vamos a ampliar el conjunto de pares de
la forma (a, b) al conjunto de todas las rectas de A2k , y por simetrı́a ampliaremos también
el conjunto de puntos de A2k .
En realidad, el conjunto de todas las rectas vendrá dado por el conjunto de todas las
ecuaciones de la forma u0 + u1 X + u2 Y = 0 (con u0 , u1 , u2 ∈ k), teniendo en cuenta dos
observaciones:
1) Necesariamente al menos uno de los coeficientes u1 , u2 es distinto de cero (de hecho,
hasta ahora estábamos considerando sólo rectas con u2 = 0, es decir, rectas no verticales).
2) Una recta tiene infinitas ecuaciones. Más precisamente, las ecuaciones u0 + u1 X +
u2 Y = 0 y u0 + u1 X + u2 Y = 0 definen la misma recta si y sólo si los coeficientes son
proporcionales, es decir, existe λ ∈ k tal que (u0 , u1 , u2 ) = λ(u0 , u1 , u2 ) (obsérvese que,
necesariamente, λ = 0).
Para indicar que los coeficientes están definidos salvo proporcionalidad escribiremos
(u0 : u1 : u2 ). Con esta notación, una recta dada por las coordenadas (a, b) es la recta de
coeficientes (a : b : −1) la fórmula (1.1) queda entonces
(u0 : u1 : u2 ) =
y − y x y − x y :
:
−1
= (y − y : x y − x y : x − x )
x − x
x − x
que ahora es una recta que existe siempre (ya que o la primera o la tercera coordenadas
son distintas de cero cuando los dos puntos son distintos).
Podemos intentar lo mismo ahora con los puntos en lugar de las rectas, es decir, añadir
una nueva coordenada y seguir definiendo ternas salvo multiplicidad. Obsérvese primero
que la ecuación u0 + u1 X + u2 Y = 0 sugiere una anulación sobre la terna (1, X, Y ), con lo
que lo razonable es añadir la nueva coordenada al principio. En definitiva, identificamos
un punto (x, y) ∈ A2k con la terna (1 : x : y), con lo que la fórmula (1.2) queda
b − b a b − a b :
= (a − a : b − b : a b − a b ).
(1 : x : y) = 1 : − a −a
a −a
3
De ese modo, la terna de la derecha está siempre definida, aunque no corresponderá a un
punto de A2k si a = a , es decir, cuando las rectas son paralelas. En otras palabras, parece
que hemos aumentado el plano suficientemente para que dos rectas se corten siempre. Esto
motiva la siguiente:
Definición. Llamaremos plano proyectivo sobre el cuerpo k, y lo denotaremos con
conjunto de ternas (x0 : x1 : x2 ) con x0 , x1 , x2 ∈ k no todos nulos y de forma que
P2k , al
(x0 : x1 : x2 ) = (x0 : x1 : x2 ) ⇔ ∃λ ∈ k tal que (x0 , x1 , x2 ) = λ(x0 , x1 , x2 ).
Observación 1.3. Es muy importante observar inmediatamente que no tiene sentido
sumar puntos en el plano proyectivo. Por ejemplo, ¿qué querrı́a decir la suma de los
puntos (1 : 0 : 0) y (0 : 1 : 0)? Una respuesta apresurada nos dirı́a que la suma es el punto
(1 : 1 : 0), pero esto no es ası́. No hay que olvidar que los elementos del plano proyectivo
en realidad son clases de equivalencia, y por tanto una definición es consistente sólo si
no depende del representante elegido. Por ejemplo, por la definición de plano proyectivo,
tenemos que el punto (1 : 0 : 0) coincide con el punto (2 : 0 : 0), mientras que el punto
(0 : 1 : 0) coincide con el punto (0 : −3 : 0), y con estos representantes parecerı́a lógico
decir que la suma de (2 : 0 : 0) y (0 : −3 : 0) es (2 : −3 : 0), que no es igual al punto
(1 : 1 : 0).
Proposición 1.4. La aplicación
i : A2k
→
P2k
(x, y) → (1 : x : y)
es inyectiva y define una biyección entre
inversa es (x0 : x1 : x2 ) → ( xx10 , xx20 ).
A2k y U0 := {(x0 : x1 : x2 ) ∈ P2k
| x0 = 0} cuya
Demostración: Obsérvese en primer lugar que el subconjunto U0 está bien definido, ya
que si (x0 : x1 : x2 ) = (x0 : x1 : x2 ), es equivalente x0 = 0 a x0 = 0, puesto que x0 = λx0
para algún λ = 0.
Claramente i es inyectiva, ya que si (1 : x : y ) = (1 : x : y ), existe λ ∈ k tal que
(1, x : y ) = λ(1, x , y ) , con lo que necesariamente λ = 1 y (x , y ) = (x , y ).
Por otra parte, es claro que la imagen de i está contenida en U0 . Recı́procamente,
dado cualquier elemento (x0 : x1 : x2 ) ∈ U0 , como x0 = 0 podemos escribir (x0 : x1 : x2 ) =
(1 : xx10 : xx20 ), y por tanto (x0 : x1 : x2 ) es la imagen de ( xx10 , xx20 ).
Definición. A raı́z de la inclusión anterior, consideraremos siempre el espacio afı́n
como el subconjuto U0 del plano proyectivo P2k . Los elementos de P2k que no están en
los llamaremos puntos del infinito del plano afı́n A2k .
4
A2k
A2k
Proposición 1.5. Sea L ⊂ A2k la recta de ecuación u0 + u1 X + u2 Y = 0. Entonces, si
(v1 , v2 ) es un vector director de L, el conjunto L̄ := L ∪ {(0 : v1 : v2 )} ⊂ P2k tiene como
ecuación u0 X0 + u1 X1 + u2 X2 = 0.
Demostración: Los vectores directores de L son de la forma (v1 , v2 ) = λ(u2 , −u1 ), con lo
que el punto (0 : v1 : v2 ) está unı́vocamente determinado, y es inmediato que verifica la
ecuación u0 X0 +u1 X1 +u2 X2 = 0. Por otra parte, es claro que un punto (x, y) ∈ L, cuando
se identifica con el punto (1 : x : y) ∈ P2k , verifica la ecuación u0 X0 + u1 X1 + u2 X2 = 0.
Recı́procamente, dado (x0 : x1 : x2 ) ∈
ocurrir dos cosas:
P2k
tal que u0 x0 + u1 x1 + u2 x2 = 0, pueden
1) Si x0 = 0, entonces (x0 : x1 : x2 ) se puede ver como el punto ( xx10 , xx20 ) de
además se tiene u0 + u1 xx10 + u2 xx20 = 0, con lo que ( xx10 , xx20 ) está en L.
A2k , y
2) Si x0 = 0, entonces de la ecuación u0 x0 +u1 x1 +u2 x2 = 0 se deduce inmediatamente
(x0 : x1 : x2 ) = (0 : u2 : −u1 ).
Definición. Llamaremos completado proyectivo de la recta L al conjunto L̄, y punto del
infinito de la recta L al punto (0 : v1 : v2 ).
El resultado anterior nos dice entonces que los puntos del planos proyectivo son de
dos tipos:
1) Puntos con x0 = 0, es decir, puntos de
A2k .
2) Puntos de la forma (0 : v1 : v2 ), con (v1 , v2 ) = (0, 0), que son entonces puntos del
infinito de rectas, es decir, que se pueden interpretar como direcciones del plano afı́n.
Nótese que, en la ecuación del completado proyectivo de una recta todos los sumandos
tienen grado uno, y que no hay término independiente. La definición general es la siguiente.
Definición. Se llama polinomio homogéneo (de grado d) en k[X0 , . . . , Xn ] a un polinomio
F que tiene todos sus sumandos de grado d. Claramente se verifica que F (λX0 , . . . , λXn ) =
λd F (X0 , . . . , Xn ) (y de hecho, esta propiedad caracteriza a los polinomios homogéneos).
Observación 1.6. Los polinomios homogéneos en k[X0 , X1 , X2 ] son los que sirven para
dar ecuaciones en el plano proyectivo, teniendo en cuenta lo siguiente:
1) Un polinomio no homogéneo no puede nunca definir una ecuación. Por
ejemplo, no tiene sentido hablar de la ecuación X0 + X2 − 1 = 0. Uno podrı́a pensar que el
punto (1 : 0 : 0) verifica la ecuación, pero sin embargo el mismo punto lo podemos escribir
como (2 : 0 : 0) y ya no verifica la ecuación.
2) Sı́ que tiene sentido hablar de la ecuación definida por un polinomio homogéneo
F ∈ k[X0 , X1 , X2 ] (por ejemplo, la ecuación X0 = 0 que hemos usado en la Proposición
5
1.4 o en general la ecuación de una recta). En efecto, si dado un punto (x0 : x1 : x2 ) se
tiene que F (x0 , x1 , x2 ) = 0, entonces para cualquier otra representación (λx0 : λx1 : λx2 )
del mismo punto se tendrá también F (λx0 , λx1 , λx2 ) = λd F (x0 , x1 , x2 ) = 0. Por tanto, la
anulación de un polinomio en un punto no depende del representante que tomemos.
3) Lo que no tiene sentido es decir cuánto vale un polinomio en un punto cuando no
se anula. Por ejemplo, no se puede decir que el polinomio X0 − X1 + X2 valga 1 en el
punto (1 : 1 : 1), ya que cambiando el representante a (−3 : −3 : −3) su valor serı́a −3.
Ejemplo 1.7. Veamos en ejemplos concretos cómo se generaliza el completado proyectivo
de las rectas a otras curvas planas.
1) Consideramos la parábola Y − X 2 = 0. Entonces, un punto (x0 : x1 : x2 ) ∈ U0
estará en la parábola si y sólo si xx20 − ( xx10 )2 = 0. Quitando denominadores (es decir,
multiplicando por x20 ) nos queda la relación x0 x2 − x21 = 0. Como en la demostración de la
Proposición 1.5, los únicos puntos de U0 que verifican la ecuación X0 X2 − X12 = 0 son los
de la parábola. En cambio, los puntos del infinito que verifican también X0 X2 − X12 = 0
deben verificar por tanto X0 = X12 = 0, con lo que sólo hay un punto en el infinito, en
concreto (0 : 0 : 1), es decir, el punto que corresponde a la dirección vertical.
2) Si consideramos la hipérbola XY − 1 = 0, repitiendo el mismo proceso nos quedarı́a
la ecuación X1 X2 −X02 = 0, cuya intersección con la recta del infinito nos da X0 = X1 X2 =
0. Tenemos por tanto en este caso dos puntos en el infinito, (0 : 0 : 1) y (0 : 1 : 0), que
corresponden a las direcciones vertical y horizontal de las ası́ntotas.
En general, se tiene lo siguiente:
Definición. Dado un polinomio f ∈ k[X, Y ] de grado d, se llama completado proyectivo
de la curva definida por f = 0 al conjunto de puntos que se anulan en el polinomio
1 X2
F (X0 , X1 , X2 ) := X0d f ( X
X0 , X0 ). El polinomio F se llama el homogeneizado de f , y consiste
en cambiar en cada sumando de f la variable X por X1 , la variable Y por X2 y multiplicar
por X0 elevado a d menos el grado del monomio. Los puntos de F = 0 que están la recta
del infinito se llaman puntos del infinito de la curva.
Definición. Se llama curva proyectiva de grado d al subconjunto de los puntos de P2k que
se anulan en un polinomio homogéneo de grado d en k[X0 , X1 , X2 ]. Si d = 1, la curva se
llama recta proyectiva, mientras que si d = 2 la curva se llama cónica proyectiva.
Observación 1.8. definido por una ecuación del tipo u0 X0 + u1 X1 + u2 X2 = 0, con
algún ui = 0. Por la Proposición 1.5, todas las rectas proyectivas son completados de una
recta, excepto la recta X0 = 0, que consiste en el conjunto de los puntos del infinito de
A2k , y que llamaremos recta del infinito.
6
Veamos que con esta construcción ya tenemos la simetrı́a que buscábamos. En primer
lugar, dados dos puntos distintos, determinan siempre una recta. En efecto:
1) Si los dos puntos están en A2k , entonces la única recta que los contiene es el completado proyectivo de la recta afı́n que pasa por ellos.
2) Si uno de los puntos está en A2k y el otro en la recta del infinito, entonces este
segundo punto representa una dirección, y por tanto hay una única recta afı́n que pasa por
el primer punto en la dirección representada por el segundo punto. La recta proyectiva
buscada es el completado proyectivo de esta recta afı́n.
3) Si los dos puntos están en el infinito, la única recta que pasa por ellos es la recta
del infinito.
Simétricamente, veamos que la intersección de dos rectas proyectivas es siempre un
punto:
1) Si las dos rectas son completados proyectivos de rectas afines no paralelas, su único
punto de intersección es el de las correspondientes rectas afines.
2) Si las dos rectas son completados proyectivos de rectas afines paralelas, su único
punto de intersección es el punto del infinito que corresponde a la dirección de las dos
rectas afines.
3) Si una de las rectas es la recta del infinito, el único punto de intersección es el punto
del infinito de la otra recta (que necesariamente es el completado proyectivo de una recta
afı́n).
Puede pensarse, y con razón, que la anterior comprobación es excesivamente pesada. Y
en efecto, tiene todo el sabor de los resultados de geometrı́a afı́n en que hay que distinguir
entre numerosos casos. De hecho, el plano proyectivo no hay que verlo sólo como una
completación del plano afı́n (aunque esto ayude mucho a visualizarlo). Debe verse, sobre
todo, como un espacio geométrico con interés en sı́ mismo. De hecho, ası́ es como lo vamos
a considerar nosotros (sólo cuando lo hayamos estudiado en profundidad volveremos a
relacionarlo con el plano afı́n, pero con el fin de obtener a partir de él propiedades del
plano afı́n, y no al revés).
Reescribamos pues la simetrı́a anterior sin usar el plano afı́n. La primera primera
observación es que el conjunto de rectas proyectivas forma también un plano proyectivo.
En efecto, dos ecuaciones u0 X0 + u1 X1 + u2 X2 = 0 y u0 X0 + u1 X1 + u2 X2 = 0 definen la
misma recta si y sólo si existe λ ∈ k \ {0} tal que (u0 , u1 , u2 ) = (u0 , u1 , u2 )λ. Por tanto,
podemos dar la siguiente definición:
Definición. Llamamos plano proyectivo dual al conjunto de rectas del plano proyectivo.
Es un plano proyectivo en el sentido de que a cada recta u0 X0 + u1 X1 + u2 X2 = 0 le
asociamos el punto (u0 : u1 : u2 ). Para distinguirlo del plano proyectivo lo denotamos con
7
P2k ∗ , y sus variables las llamaremos U0 , U1 , U2 .
El primer signo de la simetrı́a que tenemos (que a partir de ahora llamaremos dualidad)
∗
∗
es que no sólo los puntos de P2k son rectas de P2k , sino que también las rectas de P2k son
puntos en P2k :
Proposición 1.9. Toda recta en P2k consiste en el conjunto de rectas de P2k que pasan
por un punto fijo (lo que se llama haz de rectas con base el punto). Recı́procamente todo
∗
haz de rectas en P2k representa una recta en P2k .
∗
Demostración: Es inmediato, ya que la ecuación de una recta en P2k es de la forma
∗
a0 U0 + a1 U1 + a2 U2 = 0. Pero que un punto de P2k de coordenadas (u0 : u1 : u2 ) satisfaga
esa ecuación quiere decir que la recta de P2k de ecuación u0 X0 + u1 X1 + u2 X2 = 0 pase
por el punto (a0 : a1 : a2 ) de P2k .
∗
Veamos ahora cómo aplicar la dualidad.
: x1 : x2 ), (x0 : x1 : x2 ) de P2k , la única
ecuación
X0 X1
x0 x1
x0 x1
(x0
En primer lugar, dados dos puntos distintos
recta de P2k que pasa por ellos tendrá como
X2 x2 = 0
x2 (1.10)
x0 x1 x0 x2 (claramente representa una recta, ya que al menos uno de los menores , ,
x
x
x
x
0
1
0
2
x1 x2 x1 x2 es distinto de cero, porque (x0 : x1 : x2 ) = (x0 : x1 : x2 ); además, es claro que
la recta pasa por los dos puntos).
Simétricamente, consideramos dos rectas distintas de P2k de ecuaciones u0 X0 + u1 X1 +
u2 X2 = 0 y u0 X0 + u1 X1 + u2 X2 = 0. Si (a0 : a1 : a2 ) es el punto de intersección de ambas
rectas, eso quiere decir que las dos rectas pertenecen al haz de rectas con base (a0 : a1 : a2 ).
∗
∗
Pasando entonces a P2k , estamos buscando la recta a0 U0 + a1 U1 + a2 U2 = 0 de P2k que
contiene a los puntos (u0 : u1 : u2 ), (u0 : u1 : u2 ). Según , (1.10), esa recta será la recta de
ecuación
U0 U1 U2 u0 u1 u2 = 0.
u0 u1 u2 Ejemplo 1.11. Usando el truco de dualidad anterior, si queremos calcular el punto de
intersección de las rectas 2X0 − 3X1 + X2 = 0 y 3X0 + 4X1 − 5X2 = 0 sin resolver el
∗
sistema hacemos lo siguiente. Las rectas representan los puntos de P2k de coordenadas
8
(2 : −3 : 1) y (3 : 4 : −5). La recta de
U0
2
3
U1
−3
4
P2k ∗ que pasa por ellos tiene de ecuación
U2 1 = 11U0 + 13U1 + 17U2 = 0,
−5 con lo que el punto de intersección de las rectas dadas es (11 : 13 : 17).
9
2. Rectas del plano proyectivo
Empezamos con lo que serı́a el análogo de ecuaciones paramétricas de una recta:
Proposición 2.1. Sea L la recta proyectiva determinada por los puntos (x0 : x1 : x2 ) y
(x0 : x1 : x2 ). Entonces un punto (x0 : x1 : x2 ) está en L si y sólo si existen λ, µ ∈ k (no
ambos nulos) tales que

 x0 = λx0 + µx0
x1 = λx1 + µx1
(2.2)

x2 = λx2 + µx2
Además, (λx0 + µx0 : λx1 + µx1 : λx2 + µx2 ) = (λ x0 + µ x0 : λ x1 + µ x1 : λ x2 + µ x2 )
si y sólo si existe ν ∈ k \ {0} tal que (λ , µ ) = (νλ, νµ).
Demostración: La fórmula (1.10) nos dice que (x0 : x1 : x2 ) ∈ P2k es un punto de la recta L
si y sólo si los vectores (x0 , x1 , x2 ), (x0 , x1 , x2 ), (x0 , x1 , x2 ) son linealmente dependientes.
Como los dos últimos son linealmente independientes (por ser los puntos (x0 : x1 : x2 )
y (x0 : x1 : x2 ) distintos), se tiene que (x0 , x1 , x2 ) depende linealmente de (x0 , x1 , x2 ) y
(x0 , x1 , x2 ), es decir, que existen λ, µ ∈ k tales que
(x0 , x1 , x2 ) = λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 )
(además (λ, µ) = (0, 0), porque (x0 , x1 , x2 ) = (0, 0, 0)). Esto prueba la igualdad (2.2).
Por otra parte, la igualdad
(λx0 + µx0 : λx1 + µx1 : λx2 + µx2 ) = (λ x0 + µ x0 : λ x1 + µ x1 : λ x2 + µ x2 )
es equivalente a decir que existe ν ∈ k tal que
(λ x0 + µ x0 , λ x1 + µ x1 , λ x2 + µ x2 ) = ν(λx0 + µx0 , λx1 + µx1 , λx2 + µx2 )
es decir
λ (x0 , x1 , x2 ) + µ (x0 , x1 , x2 ) = ν λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 )
o lo que es lo mismo
(λ − νλ)(x0 , x1 , x2 ) = (−µ + νµ)(x0 , x1 , x2 ) = (0, 0, 0).
Como (x0 , x1 , x2 ) y (x0 , x1 , x2 ) no son proporcionales, se obtiene λ − νλ = −µ + νµ = 0,
es decir (λ , µ ) = (νλ, νµ).
Observación 2.3. La Proposición 2.1 indica que toda recta proyectiva está en biyección
con el conjunto de pares (λ, µ) = (0, 0) en que identificamos dos de ellos si y sólo si son
10
proporcionales. Es natural por tanto, en analogı́a con la definición de plano proyectivo,
definir el conjunto P1k de pares (λ : µ) definidos salvo proporcionalidad (por analogı́a con
P2k , usaremos mejor coordenadas (t0 : t1 )). Este conjunto se debe interpretar como una
especie de recta proyectiva “abstracta”. La Proposición 2.1 está diciendo que tenemos una
biyección
P1k → L
(2.4)
(t0 : t1 ) → (x0 t0 + x0 t1 : x1 t0 + x1 t1 : x2 t0 + x2 t1 )
que es el análogo de las ecuaciones paramétricas de una recta afı́n (en el caso afı́n hay un
solo parámetro, que varı́a en el cuerpo k, es decir en A1k , la recta afı́n “abstracta”).
Definición. Una biyección como (2.4) la llamaremos parametrización de la recta L.
Lema 2.5. Dados a0 , a1 , a2 , b0 , b1 , b2 ∈ k, son equivalentes:
(i) (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) es una parametrización de una recta.
(ii) (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) está bien definida (i.e. no existe
ningún valor (t0 : t1 ) ∈ P1k tal que (a0 t0 + b0 t1 , a1 t0 + b1 t1 , a2 t0 + b2 t1 ) = (0, 0, 0)).
a0 a1 a2
(iii) La matriz
tenga rango dos.
b0 b1 b2
Demostración:
(i) ⇒ (ii): Es inmediato.
(ii) ⇒ (iii): Si la matriz tuviera rango a lo más uno, entonces se tendrı́a que el punto
(b0 : −a0 ) = (b1 : −a1 ) = (b2 : −a2 ) no tendrı́a imagen.
(iii) ⇒ (iv): Por hipótesis, (a0 : a1 : a2 ) y (b0 : b1 : b2 ) son dos puntos distintos, luego
la Proposicion 2.1 nos dice que (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) es una
parametrización de la recta que pasa por esos dos puntos.
Observación 2.6. La condición (iii) del lema anterior nos dice cómo calcular la inversa de
) = (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ). En efecto, si el
una parametrización
(x0 : x1 : x2
a0 a1 a2
es dos, habrá dos columnas que no sean proporcionales,
rango de la matriz
b0 b1 b2
por ejemplo las dos primeras. Esto quiere decir que podemos despejar t0 , t1 en función de
x0 , x1 . Concretamente
(t0 : t1 ) = ( a0
a1
b1
x0 −
b0 b1 a0
a1
b0
x1 : − a0
b0 a1
b1 a1
x0 +
b0 b1 a0
a1
a0
x1 )
b0 b1 o lo que es lo mismo (una de las grandes ventajas del proyectivo es que permite eliminar
denominadores)
(t0 : t1 ) = (b1 x0 − b0 x1 : −a1 x0 + a0 x1 ).
11
Obsérvese que, en general, la inversa consiste en dos formas lineales en x0 , x1 , x2 (en
realidad sólo dos de estas coordenadas, dependiendo de la columnas de la matriz que
tomemos).
Ejemplo 2.7.
guiente:
Supongamos que tenemos una recta afı́n parametrizada de la forma si
X = x + v1 t
Y = y + v2 t
es decir, la recta que pasa por el punto (x, y) con vector director (v1 , v2 ). Su completado
proyectivo será entonces la recta que pasa por los puntos (1 : x : y) y (0 : v1 : v2 ), con lo
que tendremos una parametrización

 X 0 = t0
X = xt0 + v1 t1
 1
X2 = yt0 + v2 t1
que es una especie de “homogeneización” de la parametrización afı́n. De hecho, teniendo
X2
t1
t1
t1
1
en cuenta que X = X
X0 , Y = X0 , tendremos X = x + v1 t0 , Y = y + v2 t0 , es decir, t = t0 .
Obsérvese que el punto del infinito de la recta corresponde al valor (t0 : t1 ) = (0 : 1), es
decir, al valor “infinito” del parámetro t.
Ejemplo 2.8. La aplicación más importante de las parametrizaciones de rectas es que
permiten calcular su intersección con cualquier curva. Por ejemplo, supongamos que queremos intersecar la cónica X0 X2 − X12 = 0 con la recta que pasa por los puntos (1 : −1 : 3)
y (0 : 1 : −1). Debemos encontrar entonces los valores de (t0 : t1 ) tales que el punto
(t0 : −t0 + t1 : 3t0 − t1 ) esté en la cónica, es decir, t0 (3t0 − t1 ) − (−t0 + t1 )2 = 0, que
operando queda 2t20 + t0 t1 − t21 = 0. Para resolver esta ecuación, observamos que t0 no es
cero (si lo fuera, también lo serı́a t1 , pero no pueden ser ambos nulos, por definición de
P1k ), con lo que nos queda 2 + tt10 − ( tt10 )2 = 0, de donde deducimos que tt10 = 2, −1. Por
tanto, las soluciones en P1k son (t0 : t1 ) = (1 : 2), (1 : −1), que nos dan los puntos de la
recta (1 : 1 : 1), (1 : −2 : 4). Este truco se funciona en general, como vemos en el resultado
siguiente.
Proposición 2.9. Si k es un cuerpo algebraicamente cerrado, todo polinomio homogéneo
F ∈ k[T0 , T1 ] de grado d factoriza en d factores lineales, por lo que tiene d soluciones en
P1k contadas con multiplicidad. En consecencuencia, la intersección de cualquier recta con
una curva de grado d consiste en d puntos (contados con multiplicidad), salvo que la recta
esté contenida en la curva.
Demostración: Sacando T0 factor común tantas veces como sea posible, escribimos
F = T0n−m (a0 T0m + a1 T0m−1 T1 + . . . + am T1m )
12
con am = 0. Como k es algebraicamente cerrado, el polinomio a0 + a1 T + . . . + am T m se
puede escribir como am (T − α1 ) . . . (T − αm ), de donde se sigue
F = am T0n−m (T1 − α1 T0 ) . . . (T1 − αm T0 )
y se anula precisamente en (t0 : t1 ) = (0 : 1) (con multiplicidad n − m) y en cada (1 : αi )
(cada uno contado tantas veces como se repita el factor T1 − αi T0 ).
Por tanto, dada una curva definida por una ecuación G = 0, con G ∈ k[X0 , X1 , X2 ]
homogéneo de grado d, si sustituimos en G la parametrización de una curva, obtendremos
una ecuación homogénea de grado d en t0 , t1 (salvo que la recta esté contenida en la curva,
en cuyo caso tal sustitución es idénticamente nula). Por lo que acabamos de ver, tal
ecuación tendrá d soluciones (contadas con multiplicidad) en P1k , con lo que obtendremos
d puntos de la recta que están también en la curva.
Observación 2.10. Conviene precisar cuanto antes una ambigüedad calculada del enunciado de la Proposicion 2.1. Implı́citamente, se está diciendo que se están fijando representantes de los dos puntos que determinan la recta, y no sólo los puntos. Es decir, que dos
puntos pueden determinar infinitas parametrizaciones distintas. Por ejemplo, si queremos
parametrizar la recta que pasa por (1 : 0 : 1) y (0 : 1 : 1), obtendrı́amos la parametrización
(t0 : t1 ) → (t0 : t1 : t0 + t1 )
pero si escribimos los puntos como (2 : 0 : 2) y (0 : −1 : −1) obtendrı́amos la parametrización
(t0 : t1 ) → (2t0 : −t1 : 2t0 − t1 )
que sólo coincide con la anterior para los valores (t0 : t1 ) = (1 : 0), (0 : 1). El resultado
siguiente nos dice que para tener unicidad nos hace falta un tercer punto.
Teorema 2.11. Sea L una recta proyectiva y (x0 : x1 : x2 ), (x0 : x1 : x2 ), (x
0 : x1 : x2 )
tres puntos distintos de L. Entonces, existe y es única una parametrización de L que
verifique
(1 : 0) → (x0 : x1 : x2 )
(0 : 1) → (x0 : x1 : x2 )
(1 : 1) → (x
0 : x1 : x2 )
Demostración: Veamos en primer lugar que, de existir, la parametrización debe ser única.
Una parametrización genérica tiene el aspecto
(t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 )
y, de acuerdo con nuestras condiciones, debe verificarse
(a0 : a1 : a2 ) = (x0 : x1 : x2 )
13
(b0 : b1 : b2 ) = (x0 : x1 : x2 )
(a0 + b0 : a1 + b1 : a2 + b2 ) = (x
0 : x1 : x2 )
es decir, que existen λ, µ, ν ∈ k \ {0} tales que
(a0 , a1 , a2 ) = (λx0 , λx1 , λx2 )
(b0 , b1 , b2 ) = (µx0 , µx1 , µx2 )
(a0 + b0 , a1 + b1 , a2 + b2 ) = (νx
0 , νx1 , νx2 ).
De aquı́ se deduce, sumando las dos primeras igualdades,
λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) = ν(x
0 , x1 , x2 ).
Por otra parte, del hecho que (x0 : x1 :
(x
0 : x1 : x2 ), se deduce de (1.10):
x0
x0
x0
x2 ) esté en la recta que pasa por (x0 : x1 : x2 ) y
x1
x1
x
1
x2 x2 = 0
x
2
y por tanto, la última fila es combinación de las dos primeras (que son independientes al
representar puntos distintos). Es decir, existen α, β ∈ k tales que
(x
0 , x1 , x2 ) = α(x0 , x1 , x2 ) + β(x0 , x1 , x2 ).
(2.12)
Substituyendo de aquı́ (x
0 , x1 , x2 ) en la combinación lineal anterior tenemos
λ(x0 , x1 , x2 ) + µ(x0 , x1 , x2 ) = να(x0 , x1 , x2 ) + νβ(x0 , x1 , x2 )
o equivalentemente
(λ − να)(x0 , x1 , x2 ) = (νβ − µ)(x0 , x1 , x2 ).
Como (x0 , x1 , x2 ) y (x0 , x1 , x2 ) no son proporcionales, se sigue que λ = να, µ = νβ, de
donde
(a0 , a1 , a2 ) = (ναx0 , ναx1 , ναx2 )
(b0 , b1 , b2 ) = (νβx0 , νβx1 , νβx2 )
y por tanto la parametrización debe ser
(t0 : t1 ) → (ναx0 t0 + νβx0 t1 : ναx1 t0 + νβx1 t1 : ναx2 t0 + νβx2 t1 )
14
que es la misma que
(t0 : t1 ) → (αx0 t0 + βx0 t1 : αx1 t0 + βx1 t1 : αx2 t0 + βx2 t1 ).
Como α, β están determinados a partir de los puntos mediante (2.12), la parametrización es
única. Además, es evidente que tal parametrización verifica las condiciones que queremos,
con lo que se concluye la demostración.
Ejemplo 2.13. Obsérvese que la demostración del teorema anterior es constructiva.
Por ejemplo, supongamos que queremos encontrar la única parametrización de la recta
X0 + X1 − X2 = 0 que manda (1 : 0) a (1 : 2 : 3), (0 : 1) a (2 : 3 : 5) y (1 : 1) a (1 : −1 : 0).
Entonces, lo primero que hay que hacer es encontrar la relación (2.12), es decir, hay que
escribir (1, −1, 0) como combinación lineal de (1, 2, 3) y (2, 3, 5). Tal relación es
(1, −1, 0) = −5(1, 2, 3) + 3(2, 3, 5) = (−5, −10, −15) + (6, 9, 15)
con lo que la parametrización queda
(t0 : t1 ) → (−5t0 + 6t1 : −10t0 + 9t1 : −15t0 + 15t1 ).
Ejemplo 2.14. Una pregunta natural es cómo son todas las parametrizaciones de una
recta. Por ejemplo, para la recta X0 + X1 − X2 = 0, la Observación 2.10 y el Ejemplo
2.13 nos dan hasta tres parametrizaciones distintas. Para ello tomamos por ejemplo la
parametrización
(x0 : x1 : x2 ) = (−5t0 + 6t1 : −10t0 + 9t1 : −15t0 + 15t1 )
del ejemplo anterior, y calculamos su inversa (ver la Observación 2.6)
(t0 : t1 ) = (9x0 − 6x1 : 10x0 − 5x1 ).
Entonces, si consideramos la composición de la parametrización
(t0 : t1 ) → (2t0 : −t1 : 2t0 − t1 )
con la inversa anterior tendremos
(t0 : t1 )→(2t0 : −t1 : 2t0 −t1 )→ 9(2t0 )−6(−t1 ) : 10(2t0 )−5(−t1 ) =(18t0 +6t1 : 20t0 +5t1 ).
Lema 2.15. Dados a, b, c, d ∈ k, son equivalentes:
15
(i) (t0 : t1 ) → (at0 + bt1 : ct0 + dt1 ) es una biyección.
(ii) (t0
(t0
a
(iii) c
: t1 ) → (at0 + bt1 : ct0 + dt1 ) está bien definido, es decir, no existe ningún valor
: t1 ) ∈ P1k tal que at0 + bt1 , ct0 + dt1 ) = (0, 0).
b = 0.
c
Demostración: Es prácticamente igual que la del Lema 2.5.
(i) ⇒ (ii): Evidente.
a b
= 0, entonces el punto (−b : a) = (−d : c) no tendrı́a imagen.
(ii) ⇒ (iii): Si fuera c c
(iii) ⇒ (i): (t0 : t1 ) → (dt0 − bt1 : −ct0 + at1 ) es la inversa.
Definición. Llamaremos cambio de variable en P1k a una aplicación ψ : P1k → P1k de
la forma ψ(t0 : t1 ) = (at0 + bt1 : ct0 + dt1 ) verificando cualquiera de las condiciones
equivalentes del lema anterior.
Lema 2.16. Sea ϕ : P1k → L una parametrización de la recta L. Entonces, todas las
parametrizaciones de L son de la forma ϕ ◦ ψ, donde ψ es un cambio de variable en P1k .
Demostración: Si ϕ : P1k → L es otra parametrización de L, tal y como hemos hecho en
el Ejemplo 2.14 se observa que ϕ−1 ◦ ϕ es un cambio de variable ψ, con lo que ϕ = ϕ ◦ ψ.
Recı́procamente, es claro que la composición de un cambio de variable con ϕ tiene el
aspecto (t0 : t1 ) → (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ), y como está bien definida es una
parametrización por el Lema 2.5.
Nos planteamos ahora el mismo tipo de problema pero cambiando de una recta a otra.
Lema 2.17. Sea f : L → L una aplicación entre dos rectas proyectivas. Entonces son
equivalentes.
(i) Existe una parametrización ϕ : P1k → L tal que f ◦ ϕ es una parametrización de L .
(ii) Para cada parametrización ϕ : P1k → L, se tiene que f ◦ ϕ es una parametrización de
L .
(iii) Para cada parametrización ϕ : P1k → L y cada parametrización ϕ :
−1
que ϕ ◦ f ◦ ϕ es un cambio de variable en P1k .
(iv) Existen parametrizaciones ϕ :
cambio de variable en P1k .
P1k
→ L y ϕ :
Demostración:
16
P1k
P1k → L se tiene
→ L tales que ϕ
−1
◦ f ◦ ϕ es un
(i) ⇒ (ii): Sabemos que para una parametrización concreta ϕ de L se tiene que f ◦ ϕ es
una parametrización de L . Entonces, por el Lema 2.16, cualquier otra parametrización
de L es de la forma ϕ = ϕ ◦ ψ, donde ψ es un cambio de variable en P1k . Por tanto,
f ◦ ϕ = (f ◦ ϕ) ◦ ψ, que es la composición del cambio de variable ψ con la parametrización
f ◦ ϕ, luego de nuevo por el Lema 2.16 es una parametrización de L .
(ii) ⇒ (iii): Sean ϕ, ϕ parametrizaciones de L y L respectivamente. Por hipótesis, f ◦ ϕ
−1
es una parametrización de L , luego por el Lema 2.16 se tiene que ϕ ◦ f ◦ ϕ es un cambio
de variable en P1k .
(iii) ⇒ (iv): Evidente.
(iv) ⇒ (i): Como ϕ ◦ f ◦ ϕ es un cambio de variable en P1k , por el Lema 2.16 se tiene
−1
que ϕ ◦ (ϕ ◦ f ◦ ϕ) es una parametrización de L , de donde se sigue el resultado.
−1
Definición. Una proyectividad entre dos rectas proyectivas L y L es una aplicación f :
L → L que verifica cualquiera de las condiciones del Lema 2.17.
Veamos algunos ejemplos de proyectividades de rectas.
Proposición 2.18. Sea L una recta de P2 y sea a ∈ P2k un punto que no está en L. Sea
∗
Ω(a) ⊂ P2k el haz de rectas que pasan por a. Entonces:
(i) La aplicación L → Ω(a) que asocia a cada punto p ∈ L la recta que pasa por a y p es
una proyectividad.
(ii) La aplicación Ω(a) → L que asocia a cada recta del haz su intersección con la recta L
es una proyectividad.
Demostración: Sea ϕ : P1 → L una parametrización dada por
ϕ(t0 : t1 ) = l0 (t0 , t1 ) : l1 (t0 , t1 ) : l2 (t0 , t1 ) ,
donde l0 , l1 , l2 son formas lineales en t0 , t1 . Si a tiene coordenadas (a0 : a1 : a2 ), la recta
generada por a y l0 (t0 , t1 ) : l1 (t0 , t1 ) : l2 (t0 , t1 ) tiene como ecuación
X0
X
X
1
2
=0
a0
a1
a2
l0 (t0 , t1 ) l1 (t0 , t1 ) l2 (t0 , t1 ) es decir, sus coordenadas en
P2k ∗ son
(u0 : u1 : u2 ) = a1 l2 (t0 , t1 )−a2 l1 (t0 , t1 ) : a2 l0 (t0 , t1 )−a0 l2 (t0 , t1 ) : a0 l1 (t0 , t1 )−a1 l0 (t0 , t1 )
lo que da una parametrización de Ω(a). Por tanto, la aplicación de (i) es una proyectividad.
17
La aplicación de (ii) es la inversa de la de (i), con lo que también es una proyectividad
(también puede verse por dualidad).
Proposición 2.19. Sean L, L dos rectas distintas y sea a un punto fuera de ellas. Entonces la aplicación L → L que asocia a cada punto p ∈ L el punto de intersección de L
con la recta generada por a y p es una proyectividad.
Demostración: Se sigue inmediatamente de la Proposición 2.18. En efecto, L → L es la
composición de L → Ω(a) que asocia a cada punto p ∈ L la recta que generan a y p (que
es una proyectividad) y de Ω(a) → L que asocia a cada recta del haz su intersección con
L (que es una proyectividad). Como es claro que la composición de proyectividades es
una proyectividad, se sigue el resultado.
Definición. Se llama perspectividad entre dos rectas a una proyectividad definida como en
la Proposición 2.19. El punto a se llama centro de la perspectividad.
Observemos que una perspectividad no es la proyectividad más general entre dos
rectas, ya que el punto de intersección de las rectas queda fijo por una perspectividad, pero
no necesariamente por una proyectividad. En realidad, veremos que el que tal punto quede
fijo caracteriza las perspectividades. Para ello necesitamos en primer lugar el siguiente
resultado, que es importante en sı́ mismo.
Teorema 2.20. Dadas dos rectas L, L tres puntos distintos a, b, c ∈ L y tres puntos
distintos a , b , c ∈ L , existe una única proyectividad f : L → L tal que f (a) = a ,
f (b) = b y f (c) = c .
Demostración: Aplicando el Teorema 2.11, sean ϕ : P1k → L la única parametrización de
L tal que ϕ(1 : 0) = a, ϕ(0 : 1) = b, ϕ(1 : 1) = c y ϕ : P1k → L la única parametrización
de L tal que ϕ(1 : 0) = a , ϕ(0 : 1) = b , ϕ(1 : 1) = c . Entonces, f = ϕ ◦ ϕ−1 es
una proyectividad que cumple la propiedad buscada. Además, si f es otra proyectividad
en las mismas condiciones, se tiene que f ◦ ϕ es una parametrización de L que manda
respectivamente (1 : 0), (0 : 1), (1 : 1) a a , b , c , por lo que de nuevo por el Teorema 2.11
se tiene f ◦ ϕ = ϕ , con lo que f = f .
Teorema 2.21. Sean L, L dos rectas distintas con punto de intersección a. Entonces una
proyectividad f : L → L es una perspectividad si y sólo si f (a) = a.
Demostración: Sean b, c otros dos puntos de L distintos de a y tomamos b = f (b) y
c = f (c). Consideramos el punto de intersección q de las rectas bb y cc . Entonces, si
πq : L → L es la perspectividad de centro q, entonces es claro que πq (a) = a, πq (b) = b y
πq (c) = c . Por el Teorema 2.20, se sigue que f = πq .
18
Aunque las perspectividades no sean todas las proyectividades, al menos las proyectividades se pueden obtener a partir de perspectividades:
Teorema 2.22. Toda proyectividad f : L → L es composición de perspectividades.
Demostración: Observamos en primer lugar que podemos suponer L = L . En efecto, si
fueran L = L , tomando L = L y una perspectividad cualquiera π : L → L se tendrı́a
que, supuesto demostrado el teorema para rectas distintas, f ◦ π −1 es composición de
perspectividades, con lo que f también lo serı́a. Suponemos pues que L y L son dos
rectas distintas e ilustraremos la demostración con la siguiente figura:
L
c
b
L'
a
p
a'
b'
a''
q
b''
L"
c''
Sean a, b, c tres puntos distintos de L y a , b , c sus respectivas imágenes por f en
L , con la condición de que ni c ni c son el punto de intersección de L y L . Sea p un
punto de la recta cc distinto de c y c . Tomamos una recta L que pase por c pero que
no pase ni por c ni por a . Sean a y b los respectivos puntos de intersección de L con
las rectas pa y pb. Finalmente, sea q el punto de intersección de las rectas a a y b b . Si
πp : L → L es la perspectividad de centro p y πq : L → L es la perspectividad de centro
q se tiene
πp
f L −→ L −→ L
a → a → a
b → b → b
c → c → c
con lo que, por el Teorema 2.20, se tiene f = πq ◦ πp .
Teorema 2.23 (Desargues). Sean a, b, c, a , b , c dos ternas de puntos no alineados y
todos ellos distintos entre sı́. Sean los puntos p = ab ∩ a b , q = ac ∩ a c y r = bc ∩ b c .
Entonces las rectas aa , bb , cc son concurrentes en un punto si sólo si los puntos p, q, r
están alineados.
Demostración: Supongamos en primer lugar que las rectas aa , bb , cc son concurrentes en
un punto o. Ilustramos la demostración con la siguiente figura:
19
p
L
a'
t
a
o
b
t'
L'
b'
c
t''
c'
r
L''
q
Escribimos L = aa , L = bb , L = cc , t = pr ∩L, t = pr ∩L , t = pr ∩ L y definimos
πp la perspectividad de L sobre L con centro p y πr la proyectividad de L sobre l con
centro r. Se tendrá
πp
πr
L
L −→ L −→
o →
o
→
o
a →
b
→
c
→ b
→
c
a
t
→ t
→ t
La composición πr ◦ πp es una proyectividad que deja fijo el punto o, luego por el Teorema
2.21 es una perspectividad, y su centro es necesariamente ac ∩ a c = q. Como la imagen
de t por esta perspectividad es t , se tiene que t, t , q están alineados, es decir, que q está
en la recta generada por t, t , que es la recta p, r, por lo que p, q, r están alineados.
El recı́proco es precisamente el enunciado dual del que acabamos de demostrar.
20
3. Razón doble
En esta sección definiremos el concepto más importante de geometrı́a proyectiva, que
ya veremos más adelante que es el que caracteriza tal geometrı́a.
Definición. Sean a, b, c, d cuatro puntos distintos de una recta L. Sea ϕ : P1k → L la única
parametrización de L tal que ϕ(1 : 0) = a, ϕ(0 : 1) = b, ϕ(1 : 1) = c. Si d = ϕ(ρ0 : ρ1 ),
llamaremos razón doble de los cuatro puntos a ρ := ρρ01 , y la denotaremos normalmente por
[a, b, c, d] (OJO: la definición no es unánime, y para muchos la razón doble es ρρ10 , es decir,
el valor inverso del que definimos nosotros). A veces suele extenderse la definición a los
casos d = a, b, c, en que ρ = ∞, 0, 1, respectivamente; si no, ρ toma valores en k \ {0, 1}.
Antes de ver las propiedades de la razón doble, veamos cómo se calcula, lo que nos
ayudará a entender su significado geométrico.
Lema 3.1. Sean a = (a0 : a1 : a2 ), b = (b0 : b1 : b2 ), c
cuatro puntos alineados de modo que la recta que los
Entonces
a0 c0 b0
a1 c1 b1
[a, b, c, d] = a0 d0 b0
a1 d1 b1
= (c0 : c1 : c2 ), d = (d0 : d1 : d2 )
contiene no pasa por (0 : 0 : 1).
d0 d1 c0 c1 (obviamente, se obtienen resultados simétricos si se supone que (1 : 0 : 0) o (0 : 1 : 0) no
están en la recta).
Demostración: Para calcular la única parametrización ϕ de la recta abcd que manda
(1 : 0), (0 : 1), (1 : 1) respectivamente a a, b, c seguimos los pasos del Teorema 2.11.
Observamos en primer lugar
que, como (1 : 0 : 0) no está alineado con a, b, c, d, por ejemplo
1 0 0 a0 b0 a1 b1 = a0 a1 a2 = 0, y lo mismo para los menores de orden dos formados por
b0 b1 b2 las dos primeras coordenadas de cualquier par de puntos entre a, b, c, d. Esto quiere decir
que, a la hora de escribir las coordenadas de c en función de las de a y b basta trabajar
con las dos primeras coordenadas. Entonces un simple cálculo (por ejemplo con la regla
de Cramer) muestra que:
c0 b0 a0 c0 c1 b1 a1 c1 (a0 , a1 , a2 ) + (c0 , c1 , c2 ) = a0 b0 (b0 , b1 , b2 )
a
b
0
0
a1 b1 a1 b1 con lo que ϕ tendrá de ecuación
(t0 : t1 ) →
21
c
( 0
c1
a0
b0 t
+
a
0
0
a1
b1 c0 b t
c1 0 1
c
: 0
c1
a0
b0 t
+
a
1
0
a1
b1 c0 b t
c1 1 1
c
: 0
c1
a0
b0 t
+
a
2
0
a1
b1 c0 b t )
c1 2 1
(después de quitar denominadores). Repitiendo las mismas cuentas con d al puesto de c,
se tendrá
d 0 b0 a0 d0 d 1 b1 a1 d1 (a0 , a1 , a2 ) + (d0 , d1 , d2 ) = a0 b0 (b0 , b1 , b2 )
a0 b0 a1 b1 a1 b1 lo que indica que el valor (d0 : d1 : d2 ) se alcanza en la parametrización para
d0
d1
(ρ0 : ρ1 ) = ( c0
c1
b0 a0
b1 a1
: b0 a0
b1 a1
d0 d1 )
c0 c1 de donde sigue el resultado.
Observación 3.2. Usemos la fórmula anterior para interpretar la razón doble de cuatro puntos afines que estén en una recta que no sea vertical (recordemos que las rectas
afines verticales son las que pasan por el punto (0 : 0 : 1)). Tomamos entonces cuatro
puntos alineados (a1 , a2 ), (b1 , b2 ), (c1 , c2 ), (d1 , d2 ) de forma que sus segundas coordenadas
sean siempre distintas. Una vez Identificados con los correspondientes puntos del plano
proyectivo (1 : a1 : a2 ), (1 : b1 : b2 ), (1 : c1 : c2 ), (1 : d1 : d2 ), su razón doble es
[a, b, c, d] =
(c1 − a1 )(d1 − b1 )
=
(d1 − a1 )(c1 − b1 )
c1 −a1
d1 −a1
c1 −b1
d1 −b1
c1 −a1
d1 −a1
representa la proporción entre el vector ac
y el vector ad
1
(lo que se llama la razón simple de a, d, c), mientras que dc11−b
−b1 es la proporción entre bc y
(es decir, la razón simple de b, d, c). La razón simple es invariante por afinidades (ya
bd
Por estar a, b, c alineados,
que éstas preservan las proporciones), y de hecho el preservar la razón simple de ternas
caracteriza a las afinidades. En geometrı́a proyectiva, sin embargo, las proyectividades
no preservan las proporciones. Piénsese en tres puntos alineados a, b, c, con b entre a y
c. Si “miramos” la recta desde un punto externo entre a y b (es decir, si hacemos una
perspectividad desde dicho punto) nos parecerá ver que proporcionalmente, la distancia
entre a y b es mucho mayor que la distancia entre b y c, mientras que mirando desde
un punto externo entre b y c nos parecerá ahora que la distancia entre b y c es mucho
mayor que la distancia entre a y b. El resultado central en geometrı́a proyectiva es que lo
que permanecerá invariante no serán las proporciones (i.e. la razón simple), sino la doble
22
proporción (i.e. la proporción entre proporciones, el cociente entre dos razones simples: la
razón doble; de ahı́ su nombre).
Observación 3.3. Tomemos ahora a como punto del infinito de la recta bcd. Usando de
nuevo la fórmula del Lema 3.1 obtendremos ahora
d 1 − b1
[a, b, c, d] =
c1 − b1
es decir, la razón simple de b, c, d. Nótese que d será el punto medio de c y d si y sólo si
= −bc,
es decir, si la razón simple de b, c, d (que hemos dicho que es [a, b, c, d] es −1.
bd
Definición. Se llama cuaterna armónica a cuatro puntos alineados a, b, c, d tales que
[a, b, c, d] = −1.
Veamos que, efectivamente, las proyectividades preservan la razón doble (y que de
hecho están caracterizadas por esta propiedad):
Teorema 3.4. Sea f : L → L una aplicación inyectiva entre dos rectas. Entonces f
es una proyectividad si y sólo si para cada a, b, c, d ∈ L distintos se tiene [a, b, c, d] =
[f (a), f (b), f (c), f (d)].
Demostración: Supongamos en primer lugar que f es una proyectividad y sean cuatro
puntos distintos a, b, c, d ∈ L. Sea ϕ : P1k → L la única parametrización de L que manda
(1 : 0), (0 : 1), (1 : 1) respectivamente a a, b, c. Si ρ = [a, b, c, d], entonces ϕ(ρ : 1) = d.
Por otra parte, f ◦ ϕ es una parametrización de L que manda (1 : 0), (0 : 1), (1 : 1)
respectivamente a f (a), f (b), f (c), y por tanto es la única. Como f ◦ ϕ(ρ : 1) = f (d), se
sigue que [f (a), f (b), f (c), f (d)] = ρ, y por tanto coincide con [a, b, c, d], como querı́amos.
Recı́procamente, supongamos que f conserva la razón doble. Fijamos tres puntos distintos a, b, c ∈ L y consideramos la única proyectividad g : L → L tal que
g(a) = f (a), g(b) = f (b), g(c) = f (c) (son tres puntos distintos por ser f inyectiva).
Queremos ver que g = f . Para ello tomamos cualquier otro punto d ∈ L y veamos que
g(d) = f (d). Por hipótesis, [a, b, c, d] = [f (a), f (b), f (c), f (d)], mientras que por la parte
ya demostrada, sabemos que [a, b, c, d] = [g(a), g(b), g(c), g(d)] = [f (a), f (b), f (c), g(d)].
Por tanto, [f (a), f (b), f (c), f (d)] = [f (a), f (b), f (c), g(d)]. Sea ϕ : P1k → L la única
parametrización tal que (1 : 0), (0 : 1), (1 : 1) van a parar respectivamente a f (a), f (b), f (c).
Por definición de razón doble, si ρ = [f (a), f (b), f (c), f (d)], entonces ϕ(ρ : 1) = f (d), y
como también ρ = [f (a), f (b), f (c), g(d)], se tiene ϕ(ρ : 1) = g(d), luego g(d) = f (d).
Corolario 3.5. Sean a, b, c, d y a , b , c , d dos cuaternas de puntos alineados. Entonces
se tiene que [a, b, c, d] = [a , b , c , d ] si y sólo si existe una composición de perspectividades
que manda una cuaterna a otra.
Demostración: Es conssecuencia inmediata del Teorema 3.4 y del Teorema 2.22.
23
Observación 3.6. Nótese que la última parte de la demostración del Teorema 3.4 en
realidad demuestra que, en general, dados puntos a , b , c , d , e en una recta L tales que
[a , b , c , d ] = [a , b , c , e ], entonces d = e .
Veamos una aplicación de la observación anterior. Para ello, necesitaremos previamente una definición.
Definición. Llamaremos complexificación de una recta proyectiva real L a la recta compleja
LC que tiene en el plano proyectivo la misma ecuación de L. Equivalentemente, si L es la
recta que pasa por dos puntos reales a, b, LC es la recta del plano proyectivo que pasa por
a y b.
Proposición 3.7. Sean L, L rectas proyectivas reales y sean a, b, c ∈ LC tres puntos
distintos, y a , b , c ∈ LC sus respectivas imágenes por una proyectividad f : LC → LC . Si
se verifica que f (ā) = a , f (b̄) = b , f (c̄) = c (donde la barra indica conjugación), entonces
¯ = f (d). En particular, f manda puntos reales a
para cualquier d ∈ LC se verifica f (d)
puntos reales y define una proyectividad entre las rectas reales. Como consecuencia, las
siguientes son condiciones suficientes para que una proyectividad f : LC → LC induzca
una proyectividad de L en L :
(i) f manda tres puntos reales a tres puntos reales.
(ii) f manda un punto real a un punto real y un par de puntos imaginarios conjugados a
un par de puntos imaginarios conjugados.
(iii) f manda dos pares de puntos conjugados a dos pares de puntos conjugados.
Demostración: Por la Observación 3.6 bastará ver que, para todo d = a, b, c, se tiene
¯ = [a , b , c , f (d)]. Como la fórmula del Lema 3.1 implica claramente que la
[a , b , c , f (d)]
razón doble de los conjugados de cuatro puntos es el conjugado de la razón doble de los
¯ = [ā , b̄ , c̄ , f (d)]
cuatro puntos, dicha igualdad será equivalente a [a , b , c , f (d)]
¯ = [a, b, c, d]
¯ y
Por ser f una proyectividad, el Teorema 3.4 implica [a , b , c , f (d)]
[ā , b̄ , c̄ , f (d)] = [ā, b̄, c̄, d] que claramente son conjugados el uno del otro, lo que demuestra
la igualdad que querı́amos.
¯ = f (d), lo que implica que f (d) es
Si d es real, entonces d¯ = d, con lo que f (d) = f (d)
real. El hecho de que f restringida a la parte real de L sea una proyectividad es de nuevo
consecuencia del Teorema 3.4, ya que f conserva la razón doble.
Observación 3.8. La parte (i) de la proposición anterior es inmediata, ya que por el
Teorema 2.20 existe una única proyectividad (tanto de L a L como de LC a LC que manda
tres puntos dados a tres puntos dados). Lo novedoso (y que usaremos más adelante) es que
las partes (ii) y (iii) permiten definir proyectividades reales definiéndolas a partir de las
24
imágenes de puntos imaginarios. Cabrı́a pensar que basta mandar dos puntos imaginarios
conjugados a dos puntos imaginarios conjugados para tener una proyectividad real, pero
no es ası́. Por ejemplo, la proyectividad de {X0 = 0}
(0 : X1 : X2 ) → (2X0 + iX1 : −iX0 + 2X1 )
manda (0 : 1 : i) y (0 : 1 : −i) a sı́ mismos, pero por ejemplo la imagen de (0 : 1 : 0) es el
punto imaginario (0 : 2 : −i).
Observación 3.9.
De la fórmula del Lema 3.1 se deduce inmediatamente que, si
[a, b, c, d] = ρ, entonces:
[a, b, c, d] = [b, a, d, c] = [c, d, a, b] = [d, c, b, a] = ρ
[b, a, c, d] = [a, b, d, c] = [c, d, b, a] = [d, c, a, b] =
1
ρ
Cabe preguntarse pues qué ocurre al hacer las demás permutaciones del conjunto de puntos.
Por ejemplo,
d0 c0 b0 a0 d1 c1 b1 a1 a b c d − a0 b1 c1 d0 − a1 b0 c0 d1 + a0 b1 c0 d1
=− 1 0 1 0
[d, b, c, a] = a0 d0 b0 c0 d0 a0 b0 c0 d1 a1 b1 c1 a1 d1 b1 c1 que, sumado con
a0
a1
ρ = a0
a1
c0 b0 d0 c1 b1 d1 a b c d − a0 b1 c1 d0 − a1 b0 c0 d1 + a1 b1 c0 d0
= 0 0 1 1
a0 d0 b0 c0 d0 b0 c0 a1 d1 b1 c1 d1 b1 c1 da
a0 b0 c1 d1 + a1 b1 c0 d0 − a1 b0 c1 d0 − a0 b1 c0 d1
(a0 d1 − a1 d0 )(b0 c1 − b1 c0 )
=
=1
a0 d0 b0 c0 a0 d0 b0 c0 a1 d1 b1 c1 a1 d1 b1 c1 Por tanto, y observando las simetrı́as que ya tenı́amos:
[d, b, c, a] = [b, d, a, c] = [c, a, d, b] = [a, c, b, d] = 1 − ρ
De aquı́ se sigue fácilmente, combinando permutaciones anteriores:
[b, d, c, a] = [a, c, d, b] = [d, b, a, c] = [c, a, b, d] =
25
1
1−ρ
[a, d, c, b] = [d, a, b, c] = [c, b, a, d] = [b, c, d, a] = 1 −
ρ
1
=
1−ρ
ρ−1
[d, a, c, b] = [a, d, b, c] = [c, b, d, a] = [b, c, a, d] =
ρ−1
ρ
Ası́ que la razón doble de cuatro puntos, al hacer todas las permutaciones posibles del
orden de los puntos, toma seis valores. Dichos seis valores son distintos, excepto cuando
las posibles razones dobles
son
{−1, 12 , 2} (que corresponde a una cuaterna armónica y sus
√
√
permutaciones) o { 1+2 3i , 1−2 3i }.
Observación 3.10. Dadas cuatro rectas L1 , L2 , L3 , L4 concurrentes en un punto a, tiene
sentido hablar de su razón doble, ya que son cuatro puntos del haz Ω(a), que es una recta
∗
en P2k . Además, dada cualquier recta L que no pase por a, si llamamos ai = L∩Li , se tiene
que [L1 , L2 , L3 , L4 ] = [a1 , a2 , a3 , a4 ], aplicando el Teorema 3.4 y el hecho (ver Proposición
2.18) de que la aplicación f : Ω(a) → L definida por f (L ) = L ∩ L es una proyectividad.
Observación 3.11. De la fórmula del Lema 3.1 para calcular la razón doble de cuatro
puntos, se sigue que, si a, b, c, d, e son cuatro puntos alineados, entonces
[a, b, c, d][a, b, d, e] = [a, b, c, e].
El motivo geométrico para esta igualdad se obtiene de pensar que a es el punto del infinito
y bc,
[a, b, d, e] es
de la recta, por lo que [a, b, c, d] es la proporción entre los vectores bd
y bd,
mientras que [a, b, c, e] es la proporción entre
la proporción entre los vectores be
y bc.
De hecho, esta observación nos permite construir geométricamente
los vectores be
el producto de dos razones dobles. En efecto, si [a, b, c, d] = λ y [a , b , c , d ] = λ , es
siempre posible mediante perspectividades encontrar e tal que [a, b, d, e] = λ . Por tanto,
[a, b, c, e] = λλ .
La construcción de la suma de razones dobles es más complicada, pero también puede
hacerse geométricamente:
Proposición 3.11. Sean a, b dos puntos distintos de una recta L y sean d1 , d2 ∈ L\{a, b}.
Dada L una recta cualquiera que pase por a y un punto cualquiera fuera de L y L ,
sean b , d2 las imágenes en L por la perspectividad desde p. Consideramos los puntos
q = b d1 ∩ ap y d = qd2 ∩ L. Entonces
[a, b, c, d] = [a, b, c, d1 ] + [a, b, c, d2 ]
para cualquier punto c ∈ L.
26
p
q
a
d
d2
d1
d' 2
b
L'
L
b'
Demostración: Si tomamos la recta ap como recta del infinito, entonces las rectas L y L
2 = bd = d1 d, de donde se sigue el resultado.
son paralelas. Además, tendremos bd
2
27
4. Cónicas proyectivas
Ejemplo 4.1. Si consideramos la ecuación X02 + X12 + X22 = 0 en P2R , es claro que no hay
ningún punto que la satisfaga. Lo mismo puede decirse de la ecuación X02 + X12 + 4X22 = 0.
Sin embargo, en cierto modo deberı́amos considerar que son cónicas distintas, ya que la
primera pasa por el punto imaginario (0 : 1 : i), mientras que la segunda no pasa por
él. En ese sentido, vamos a considerar las cónicas como ecuaciones, no como conjuntos de
puntos (si trabajamos sobre un cuerpo algebraicamente cerrado, ambos conceptos son sin
embargo equivalentes).
Definición. Una cónica en P2k es una ecuación de la forma u00 X02 + u01 X0 X1 + u02 X0 X2 +
u11 X12 + u12 X1 X2 + u22 X22 . Dos cónicas se considerarán iguales si y sólo si sus respectivas
ecuaciones son proporcionales. De todas formas, recurriremos muchas veces al abuso de
notación de considerar la cónica como el conjunto de puntos que satisfacen la ecuación.
Cuando la caracterı́stica de k es distinta de dos (cosa que supondremos en todo este
capı́tulo), la ecuación se puede escribir de forma matricial como



u00 u201 u202
X0
(X0 X1 X2 )  u201 u11 u212   X1  = 0
u12
u02
u22
X2
2
2
con lo que una cónica se puede siempre identificar con una matriz simétrica no nula de
orden tres módulo multiplicación por constante.
Recordemos de Álgebra Lineal que toda matriz simétrica A se puede diagonalizar (por
congruencia), en el sentido de que existen matrices de orden tres P y D tales que P tiene
determinante no nulo, D es diagonal y A = P t DP . Esto quiere decir que la ecuación de
toda cónica se puede escribir de la forma

 

0
λ0 0
X0
(X0 X1 X2 )P t  0 λ1 0  P  X1  = 0.
X2
0
0 λ2


 
X0
X0
En otras palabras, si escribimos  X1  = P  X1 , la ecuación de la cónica quedará de
X2
X2
2
2
2
la forma λ0 X0 + λ1 X1 + λ2 X2 = 0.
 
X0
Definición. Llamamos cambio de coordenadas en P2k a una expresión de la forma  X1  =
X2


X0
P  X1 , donde P es una matriz de orden tres de determinante no nulo. Nótese que
X2
28
un cambio de coordenadas manda polinomios homogéneos de grado d a polinomios homogéneos de grado d. Sin embargo, si se piensa en el plano como completado de un plano
afı́n, hay que notar que en las nuevas coordenadas la recta del infinito ya no tiene por qué
ser X0 = 0.
Veamos, en función de λ0 , λ1 , λ2 , los tipos de cónicas que tenemos. Recordemos también de Álgebra Lineal que el rango de A es el número de λi distintos de cero.
Caso 1) rg(A) = 1.
Supongamos por ejemplo λ1 = λ2 = 0, con lo que tras el cambio de coordenadas
2
2
nos queda la ecuación λ0 X0 = 0, o equivalentemente X0 = 0. Escribiendo P = (pij ),
tendremos X0 = p00 X0 +p01 X1 +p02 X2 , con lo que la ecuación original es (p00 X0 +p01 X1 +
p02 X2 )2 = 0, que es una recta doble.
Caso 2) rg(A) = 2.
Supongamos por ejemploλ2 = 0, con lo que tendremos la ecuación λ0 X0 +λ1 X1 = 0,
2
2
que es equivalente a X0 = ± − λλ10 X1 . Deshaciendo el cambio de coordenadas tendremos
las dos rectas (distintas)
λ1
λ1
λ1
(p00 + − p10 )X0 + (p01 + − p11 )X1 + (p02 + − p12 )X2 = 0
λ0
λ0
λ0
λ1
λ1
λ1
(p00 − − p10 )X0 + (p01 − − p11 )X1 + (p02 − − p12 )X2 = 0
λ0
λ0
λ0
En principio, si el cuerpo k no es algebraicamente cerrado, puede ocurrir − λλ10 ∈ k, en
cuyo caso las dos rectas serı́an imaginarias conjugadas. Obsérvese que, en contraste con
el caso afı́n, no hay que distinguir si las rectas se cortan o no, ya que dos rectas del plano
proyectivo se cortan siempre.
Caso 3) rg(A) = 3.
Dependiendo de cómo sea el cuerpo k tendremos más o menos subcasos. Si k es
algebraicamente cerrado, a la hora de diagonalizar A sabemos que podemos obtener λ0 =
λ1 = λ2 = 1, con lo que todas las cónicas son equivalentes, después de un cambio de
2
2
2
coordenadas, a X0 + X1 + X2 = 0. Si en cambio k = R, a la hora de diagonalizar la
matriz simétrica A, tendremos varios casos, dependiendo de la signatura de A:
–Si la signatura de A es (3, 0), podremos obtener λ0 = λ1 = λ2 = 1, con lo que después
2
2
2
de un cambio de coordenadas tendremos X0 + X1 + X2 = 0, que no tiene puntos reales.
Lo mismo ocurre si la signatura es (0, 3), ya que basta con cambiar el signo a toda la
ecuación de la cónica.
–Si la signatura de A es (2, 1), podremos obtener λ0 = λ1 = 1, λ2 = −1, con lo que
2
2
2
después de un cambio de coordenadas tendremos X0 + X1 − X2 = 0, que ahora sı́ tiene
puntos reales. Como antes, obtenemos lo mismo si la signatura es (1, 2).
29
Definición. Llamaremos cónica no degenerada a una cónica representada por una matriz
de rango tres. Si no tiene puntos en P2k , diremos que es una cónica imaginaria.
Resumimos a continuación en sendas tablas la clasificación de cónicas que hemos
obtenido cuando k es algebraicamente cerrado y cuando k = R.
Cónicas en
P2k con k algebraicamente cerrado
Tipo de cónica
Caracterización
Cónica no degenerada
rg(A) = 3
Par de rectas
rg(A) = 2
Recta doble
rg(A) = 1
Cónicas en P2R
Tipo de cónica
Caracterización
Cónica no degenerada real
rg(A) = 3, sgn(A) = (2, 1), (1, 2)
Cónica no degenerada imaginaria
rg(A) = 3, sgn(A) = (3, 0), (0, 3)
Par de rectas reales
rg(A) = 2, sgn(A) = (1, 1)
Par de rectas imaginarias conjugadas
rg(A) = 2, sgn(A) = (2, 0), (0, 2)
Recta doble
rg(A) = 1
Proposición 4.2. Sea C el conjunto de puntos de una cónica no degenerada de matriz A
b2 ) distinto
y sea a = (a0 : a1 : a2 ) un punto de C. Entonces, para cada punto b = (b0 : b1 : 

b0
de a, la recta ab corta a C en un solo punto distinto a a, excepto si (a0 a1 a2 )A  b1  = 0,
b2
en que la intersección es sólo el punto a.
Demostración: Parametrizamos la recta que pasa por a y b de la forma (x0 : x1 : x2 ) =
(a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ) y sustituyendo en la ecuación de la cónica obtenemos
que los puntos de la intersección de la recta y C corresponden a las soluciones de

 
 

a0
b0
b0
(a0 a1 a2 )A  a1  t20 + 2 (a0 a1 a2 )A  b1  t0 t1 + (b0 b1 b2 )A  b1  t21 = 0.
a2
b2
b2
30
El coeficiente de t20 es cero, ya que a está en la cónica, con lo que obtenemos que las
soluciones son t1 = 0 (que da el punto a) y las soluciones de

 

b0
b0



2 (a0 a1 a2 )A b1 t0 + (b0 b1 b2 )A b1  t1 = 0.
b2
b2
Basta ver que la ecuación anterior no es idénticamente nula, porque entonces
nos dará una
 
b0
segunda solución, que coincidirá con la primera si y sólo si (a0 a1 a2 )A  b1  = 0.
b2
 
 
b0
b0
Supongamos pues que (a0 a1 a2 )A  b1  = 0 y (b0 b1 b2 )A  b1  = 0. Eso
b2
b2
quiere decir (junto con la condición
de
que
a
está
en
C)
que
tanto
a
como b verifican




X0
X0



= 0 y (b0 b1 b2 )A X1  = 0, es decir, que amlas ecuaciones (a0 a1 a2 )A X1
X2
X2
bas ecuaciones representan a la recta ab y por tanto son proporcionales. Es decir, existe λ ∈ k tal que (a0 a1 a2 )A = λ(b0 b1 b2 )A. Multiplicando por A−1 obtendrı́amos
(a0 , a1 , a2 ) = λ(b0 , b1 , b2 ), lo que es absurdo porque (a0 , a1 : a2 ) = (b0 : b1 : b2 ).
Definición. Dada una cónica no degenerada de matriz A y un punto a = (a0 : a1 : a2 )
de la misma,se llama
recta tangente a la cónica en el punto a a la recta de ecuación

X0
(a0 a1 a2 )A  X1  = 0. Más en general, dado un punto b = (b0 : b1 : b2 ), no neceX2
sariamente en la cónica,
 sellama recta polar del punto respecto de la cónica a la recta de
X0

ecuación (b0 b1 b2 )A X1  = 0.
X2
Corolario 4.3. Una cónica no degenerada C no contiene tres puntos alineados, y en
particular no contiene rectas.
Demostración: La primera parte es consecuencia inmediata de la Proposición 4.2. La
segunda parte se obtiene del hecho de que cualquier recta proyectiva contiene al menos
tres puntos distintos (ya que está en biyección con P1k , que contiene los puntos distintos
(1 : 0), (0 : 1), (1 : 1)).
Proposición 4.4. Dada una cónica no degenerada de matriz A, el conjunto de rectas
∗
tangentes a ella forma una cónica en P2k de matriz A−1 .
31
Demostración: Por definición, un punto (u0 : u1 : u2 ) ∈ P2k representa los coeficientes de
una recta tangente a la cónica si y sólo (u0 u1 u2 ) = (a0 a1 a2 )A para algún (a0 : a1 : a2 )
−1
de la cónica. Equivalentemente (a0 a1 a2 ) = (u0 u1 u2 )A
deben ser las coordenadas de
 
u0
un punto de la curva, es decir, (u0 u1 u2 )A−1 A(A−1 )t  u1  = 0. Como A es simétrica,
u2
(A−1 )t = A−1 , lo que concluye el resultado.
∗
Definición. Dada una cónica no degenerada C de matriz A se llama cónica dual de C, y
∗
se denota por C ∗ , a la cónica de P2k de matriz A−1 . Se llama polo de una recta L respecto
∗
de la cónica C al punto de P2k que corresponde a la recta de P2k polar de L respecto de
C ∗.
Observación 4.5. El concepto de polaridad es el realmente importante a la hora de
describir una cónica y, de hecho, explica la definición, en apariencia artificiosa, que hemos
dado de cónica como ecuación y no como conjunto de puntos. En efecto, las cónicas
del Ejemplo 4.1 son realmente distintas porque la recta polar del punto (0 : 1 : 1) es
X1 + X2 = 0 respecto de la cónica X02 + X12 + X22 = 0, mientras que es X1 + 4X2 = 0
respecto de la cónica X02 + X12 + 4X22 = 0.
Recogemos las propiedades de la polaridad en el siguiente resultado:
Proposición 4.6. Sea C una cónica no degenerada de matriz A. Entonces:
(i) Un punto a es el polo de una recta L si y sólo si la recta L es la recta polar de a.
(ii) Un punto a está en la polar de un punto b si y sólo si b está en la polar de a si y sólo
si a está en la recta tangente a C en b si y sólo si b está en la recta tangente a C en a.
(iii) Un punto pertenece a su recta polar si y sólo si es un punto de la cónica.
(iv) Una recta pasa por su polo si y sólo si la recta es tangente a C.
(v) El polo de la recta que pasa por los puntos a y b es la intersección de las rectas polares
de a y b.
(vi) La recta polar de la intersección de las rectas L y L es la recta que pasa por los polos
de L y L .
Demostración: Si a = (a0 : a1: a2 )y L tiene coordenadas
0 : u1 : u2 ), entonces L es la
 (u
a0
u0



recta polar de a si y sólo si A a1 es proporcional a u1 , mientras que a es el polo
a2
u2
 
 
u0
a0
−1 


u1 es proporcional a a1 , y ambas condiciones son claramente
de L si y sólo si A
u2
a2
equivalentes.
32
La parte (ii) es clara,ya 
que, por la Proposición 4.2, todas esas condiciones
son

b0
a0



equivalentes a (a0 a1 a2 )A b1 = 0 (que es equivalente a (b0 b1 b2 )A a1  = 0 por la
b2
a2
simetrı́a de A), siendo a = (a0 : a1 : a2 ), b = (b0 : b1 : b2 ). Haciendo a = b, obtenemos la
parte (iii), de la que (iv) es su aplicación a C ∗ .
Por (i) c es el polo de la recta que pasa por a y b si y sólo si la recta polar de c es la
recta que pasa por a y b, que por (ii) es equivalente a que c esté en las rectas polares de a
y b, es decir, c es la intersección de dichas rectas polares. Esto demuestra (v), y de nuevo
(vi) es lo mismo pero en C ∗ .
Ejemplo 4.7. Aplicando la Proposición 4.2 a C ∗ , tendremos que cada haz de rectas con
base fuera de C contiene dos rectas tangentes a C. Hay dos modos de calcular dichas
rectas. Veamos ambos métodos por ejemplo para calcular las rectas tangentes a la cónica
C de ecuación X0 X2 − X12 = 0 que pasan por el punto (0 : 1 : 1):
Método 1) Según hemos visto, la tangente en un punto a de C pasa por (0 : 1 : 1)
si y sólo
 recta
 si a está 1enla
 polar de (0 : 1 : 1). Dicha recta polar tiene de ecuación
X0
0 0
2



(0 1 1) 0 −1 0
X1  = 0, es decir, X0 − 2X1 = 0. Por tanto, los puntos de C
1
0 0
X2
2
cuya tangente pasa por (0 : 1 : 1) son los puntos de intersección de dicha recta con la
cónica. Es un simple ejercicio ver que dichos puntos son (0 : 0 : 1) y (4 : 2 : 1), y sus
respectivas rectas tangentes son X0 = 0 y X0 − 4X1 + 4X2 = 0, que efectivamente pasan
por (0 : 1 : 1) (si uno tiene fe, puede ahorrarse el calcular las rectas tangentes, y calcular
directamente la recta por (0 : 0 : 1) y (0 : 1 : 1) y la recta por (4 : 2 : 1) y (0 : 1 : 1)).
Método 2) Según
4.4, el conjunto de rectas tangentes a C es una cónica
 la Proposición

0 0 2
en P2k de matrix  0 −1 0 , es decir, la cónica de ecuación U12 − 4U0 U2 = 0. Por otra
2 0 0
∗
parte, el haz de rectas que pasan por el punto (0 : 1 : 1) ∈ P2k es la recta de P2k de ecuación
U1 + U2 = 0. Se calcula fácilmente que la cónica U12 − 4U0 U2 = 0 y la recta U1 + U2 = 0
∗
se cortan en los puntos (u0 : u1 : u2 ) = (1 : 0 : 0), (1 : −4 : 4) ∈ P2k , que son precisamente
las rectas X0 = 0 y X0 − 4X1 + 4X2 = 0 de P2k .
El siguiente ejemplo será ilustrativo de cómo las cónicas, al igual que las rectas, se
pueden parametrizar.
Ejemplo 4.8. Sea C la cónica de ecuación X0 X2 − X12 = 0 y tomemos el punto a =
(1 : 0 : 0) y la recta L : X0 = 0. Parametrizamos L de la forma (t0 : t1 ) → (0 : t0 : t1 ).
Una parametrización de la recta que pasa por (1 : 0 : 0) y (0 : t0 : t1 ) viene dada por (s0 :
33
s1 ) → (s0 : t0 s1 : t1 s1 ) (usamos como parámetros s0 , s1 , ya que t0 , t1 son los parámetros
de la recta L), que sustituida en la ecuación de la cónica nos da t1 s0 s1 − t20 s21 = 0, que
tiene como soluciones (s0 : s1 ) = (1 : 0) (que corresponde al punto a) y (s0 : s1 ) = (t20 : t1 ),
que sustituido en la parametrización nos da el punto (t20 : t0 t1 : t21 ). Tenemos pues una
biyeccción P1k → C definida por (t0 : t1 ) → (t20 : t0 t1 : t21 ).
Proposición 4.9. Sea C una cónica no degenerada y sean a ∈ C y L una recta que
no pasa por a. Sea φ : L → C la aplicación que asocia a cada p ∈ L el segundo punto
de intersección de la recta ap con C (si ap es la recta tangente a C entonces φ(p) = a).
Entonces, si ϕ : P1k → L es una parametización de L, la composición φ ◦ ϕ : P1k → C tiene
2
2
2
2
2
2
el aspecto
(t0 : t1 ) →
(c00 t0 + c01 t0 t1 + c02 t1 : c10 t0 + c11 t0 t1 + c12 t1 : c20 t0 + c21 t0 t1 + c22 t1 ),
c00 c01 c02 con c10 c11 c12 = 0.
c20 c21 c22 Demostración: Consiste en esencia en repetir las cuentas de la Proposición 4.2, pero sin
usar notación matricial (como ilustra el Ejemplo 4.8). Por simplificar, escribiremos la
parametrización ϕ como (t0 : t1 ) → (l0 : l1 : l2 ), donde l0 , l1 , l2 representan expresiones
lineales homogéneas en t0 , t1 . Una parametrización de la recta que pasa por a = (a0 : a1 :
a2 ) y (l0 : l1 : l2 ) será de la forma:
(s0 : s1 ) → (a0 s0 + l0 s1 : a1 s0 + l1 s1 : a2 s0 + l2 s1 )
que al sustituir en la ecuación de la cónica nos dará una expresión de la forma (teniendo
en cuenta que (a0 : a1 : a2 ) satisface la ecuación de la cónica, ver la demostración de la
Proposición 4.2):
ls0 s1 + qs21 = 0
donde l es una expresión lineal homogénea en t0 , t1 y q es una expresión cuadrática homogénea en t0 , t1 . Como la solución (s0 : s1 ) = (1 : 0) es la que nos da el punto a,
φ(l0 : l1 : l2 ) corresponderá a la solución (s0 : s1 ) = (q : −l), es decir,
φ(l0 : l1 : l2 ) = (q0 : q1 : q2 )
donde q0 , q1 , q2 son expresiones cuadráticas homogéneas en t0 , t1 . El resultado estará demostrado si vemos que q0 , q1 , q2 son formas linealmente independientes. Si no fuera ası́,
existirı́a una relación u0 q0 + u1 q1 + u2 q2 = 0, lo que implicarı́a que la cónica C estarı́a
contenida en la recta u0 X0 +u1 X1 +u2 X2 = 0, lo que es absurdo porque C (que contiene al
menos tres puntos, por estar en biyección con P1k ) no puede contener tres puntos alineados
(por el Corolario 4.3).
Definición. Llamaremos parametrización de una cónica C a una biyección
en la Proposición 4.9.
34
P1k → C como
P1k → P2k
de la forma (t0 : t1 ) →
c00 c01 c02 (c00 t20 +c01 t0 t1 +c02 t21 : c10 t20 +c11 t0 t1 +c12 t21 : c20 t20 +c21 t0 t1 +c22 t21 ), con c10 c11 c12 =
c20 c21 c22 0 es una cónica no degenerada que se puede transformar, mediante un cambio de coor2
denadas, en X0 X2 − X1 = 0. Como consecuencia, todas las cónicas no degeneradas con
algún punto son equivalentes entre sı́ (en el sentido de que se puede pasar de una a otra
por un cambio de coordenadas.
Proposición 4.10. La imagen de cualquier aplicación
Demostración:
La última afirmación es consecuencia inmediata de
la

 laprimera por
t20
x0
Proposición 4.9. Sea pues el conjunto de puntos de coordenadas  x1  = P  t0 t1 
x2
t21


c00 c01 c02
1

c10 c11 c12 . Haciendo el cambio de coordedonde (t0 : t1 ) varı́a en Pk y P =
c20 c21 c22


 
X0
X0

−1 

X1  el conjunto será el constituido por los puntos de la forma
nadas X1 = P
X2
X2
2
(x0 : x1 : x2 ) = (t0 : t0 t1 : t21 ), que es precisamente (ver el Ejemplo 4.8) la cónica de
2
ecuación X0 X2 − X1 = 0. Deshaciendo el cambio de coordenadas, se obtiene que el
2
conjunto es una cónica (no degenerada, por serlo X0 X2 − X1 = 0).
Observación 4.11. El resultado anterior puede no resultar sorprendente, porque ya
sabemos que todas las cónicas complejas no degeneradas son equivalentes, y que las reales
no degeneradas con signatura (2,1) o (1,2) (como es la signatura de la cónica X0 X2 − X12 =
0) también son equivalentes. Sin embargo, es más sorprendente en otros cuerpos, por
ejemplo el de los racionales. En efecto, que sólo haya una clase de cónicas no imaginarias
no degeneradas en P2Q es en principio sorprendente, ya que hay infinitas clases de cónicas
imaginarias no degeneradas. Por ejemplo, puede demostrarse que no hay ningún cambio
de variable en P2Q que transforme la ecuación X02 + X12 + pX22 = 0 en X02 + X12 + p X22 = 0
si p y p son dos números primos distintos.
En la Proposición 4.9, en realidad la parametrización de la cónica viene dada por el
haz de rectas Ω(a), y no por la recta L que escogemos arbitrariamente (si lo hemos hecho
ası́ es sólo porque las cuentas salı́an más sencillas). En concreto, el resultado realmente
canónico serı́a:
Proposición 4.12. Sea C una cónica no degenerada, a un punto de C y ψ : Ω(a) → C
la aplicación que asocia a cada recta L que pasa por a el segundo punto de intersección
de L con C. Entonces para cualquier parametrización ϕ : P1k → Ω(a), la composición
ψ ◦ ϕ : P1k → C es una parametrización de C.
35
Demostración: Sea L una recta cualquiera que no pase por a y consideremos la proyectividad (ver Proposición 2.18) f : Ω(a) → L definida por L → L ∩ L. Entonces ψ = φ ◦ f ,
donde φ es la aplicación φ : L → C de la Proposición 4.9.
Si ϕ : P1k → Ω(a) es una parametrización de Ω(a), entonces, por ser f una proyectividad, se tendrá que f ◦ ϕ es una parametrización de L. Por tanto, por la Proposición 4.9,
φ ◦ f ◦ ϕ (es decir, ψ ◦ ϕ) es una parametrización de C.
Veamos ahora que, recı́procamente, toda parametrización de una cónica proviene de
la proyección desde un punto de ella, que además podemos tomar arbitrariamente.
Proposición 4.13. Sea C una cónica no degenerada y ϕ : P1k → C una parametrización
de C. Entonces, para cualquier a ∈ C, ϕ = ψ◦ϕ, donde ψ es la aplicación de la Proposición
4.12 y ϕ : P1k → Ω(a) es una parametrización de Ω(a).
Demostración: Escribimos ϕ : P1k → C de la forma (t0 : t1 ) → (q0 : q1 : q2 ), donde qi =
Qi (t0 , t1 ), siendo Q0 , Q1 , Q2 ∈ k[T0 , T1 ] formas cuadráticas homogéneas (independientes).
Necesitamos ver que ψ −1 ◦ ϕ es una parametrización ϕ de Ω(a), es decir, que tiene una
expresión lineal en t0 , t1 . La imagen de (t0 : t1 ) será la recta que pase por a = (a0 : a1 : a2 )
y (q0 : q1 : q2 ), es decir, la recta
X0 X1 X2 a0 a1 a2 = 0
q0 q1 q2 que es el punto de
P2k ∗ de coordenadas
(u0 : u1 : u2 ) = (a1 q2 − a2 q1 : a2 q0 − a0 q2 : a0 q1 − a1 q2 ).
Aunque esto parece indicar que la expresión queda de grado dos y no de grado uno, en
realidad no es ası́. En efecto, el punto a está en C, por lo que se podrá escribir
(a0 : a1 : a2 ) = (Q0 (s0 , s1 ) : Q1 (s0 , s1 ) : Q2 (s0 , s1 ))
para algún (s0 : s1 ) ∈ P1k , luego los polinomios a1 Q2 − a2 Q1 , a2 Q0 − a0 Q2 , a0 Q1 − a1 Q2
tienen a (s0 : s1 ) como raı́z. Por tanto, son divisibles por s1 T0 −s0 T1 (ver simultáneamente
a esta demostración el Ejemplo 4.14 siguiente para ilustrar este hecho) y podremos escribir
a1 Q2 − a2 Q1 = (s1 T0 − s0 T1 )A0
a2 Q0 − a0 Q2 = (s1 T0 − s0 T1 )A1
a0 Q1 − a1 Q0 = (s1 T0 − s0 T1 )A2
36
donde A0 , A1 , A2 ∈ k[T0 , T1 ] son formas lineales homogéneas. Es decir, cancelando el factor
común podemos escribir
(u0 : u1 : u2 ) = (A0 (t0 , t1 ) : A1 (t0 , t1 ) : A2 (t0 , t1 ))
que ahora ya representa una parametrización de Ω(a).
Ejemplo 4.14. Ilustramos la última parte de la demostración anterior con la cónica
C : X0 X2 − X12 = 0 con su parametrización (t0 : t1 ) → (t20 : t0 t1 : t21 ) (que además, por ser
todas las cónicas equivalentes a ésta por un cambio de variable, según la Proposición 4.10,
sirve en realidad para cualquier cónica). Tomamos el punto a = (s20 : s0 s1 : s21 ), y entonces
los coeficientes de la recta que pasa por a y (t20 : t0 t1 : t21 ) son
(u0 : u1 : u2 ) = (s0 s1 t21 − s21 t0 t1 : s21 t20 − s20 t21 : s20 t0 t1 − s0 s1 t20 ).
Efectivamente, todas las coordenadas son divisibles por s1 t0 − s0 t1 y, una vez eliminado el
factor común, queda
(u0 : u1 : u2 ) = (−s1 t1 : s1 t0 + s0 t1 : −s0 t0 ).
Ahora ya no hay indeterminación para el único valor conflictivo, (t0 : t1 ) = (s0 : s1 ), para
el que queda la recta de coeficientes (−s21 : 2s0 s1 : −s20 ), que es precisamente la recta
tangente a C en el punto a.
Corolario 4.15. Si ϕ, ϕ : P1k → C son dos parametrizaciones distintas de una cónica no
degenerada C, entonces ϕ = ϕ ◦ α, donde α : P1k → P1k es un cambio de variable en P1k .
Demostración: Sea ψ : Ω(a) → C la aplicación de la Proposición 4.12. Entonces, por
la Proposición 4.13, ψ −1 ϕ y ψ −1 ϕ son parametrizaciones de Ω(a). Por el Lema 2.16,
se tendrá que ψ −1 ϕ = ψ −1 ϕα, donde α : P1k → P1k es un cambio de variable en P1k .
Componiendo a la izquierda con ψ se concluye el resultado.
Corolario 4.16 (Teorema de Chasles). Sea C una cónica no degenerada y sean a, a ∈ C.
Consideramos la aplicación f : Ω(a) → Ω(a ) que asocia a cada recta L que pasa por a la
recta generada por a y el punto de intersección de L con C distinto de a (entendiendo que
cuando L es tangente a C se define f (L) = aa , y que además f (aa ) es la recta tangente
a C en a ). Entonces f es una proyectividad.
Demostración: Sean ψ : Ω(a) → C y ψ : Ω(a ) → C las aplicaciones definidas en la
−1
Proposición 4.12. Entonces f = ψ ◦ ψ. Sea ϕ : P1k → C una parametrización cualquiera.
37
Por la Proposición 4.13 se tiene que ψ −1 ϕ y ψ −1 ϕ son parametrizaciones de Ω(a). Como
ψ −1 ϕ = f ◦ ψ −1 ϕ, se sigue que f es una proyectividad (ver Lema 2.17(i)).
Observación 4.17. El corolario anterior indica que, dada una cónica no degenerada
C y cuatro puntos a, b, c, d sobre ella, se puede definir su razón doble: basta escoger un
punto p ∈ C y considerar la razón doble de las rectas pa, pb, pc, pd (ver la Observación
3.10). Esta definición no depende de la elección del punto p, ya que el Corolario 4.16
implica que, escogiendo otro punto p, tenemos una proyectividad f : Ω(p) → Ω(p ) tal
que f (pa) = p a, f (pb) = p b, f (pc) = p c, f (pd) = p d, y por el Teorema 3.4 se tendrá
[pa, pb, pc, pd] = [p a, p b, p c, pd ].
El teorema de Chasles está diciendo que, dada una cónica no degenerada, sus puntos
se pueden obtener de la siguiente forma: fijamos dos puntos a, a de la cónica y tomamos
la proyectividad f : Ω(a) → Ω(a ) del Corolario 4.16 (que verifica f (aa ) = aa ); entonces
la cónica es el conjunto de las intersecciones L ∩ f (L) cuando L varı́a en Ω(a). El siguiente
resultado afirma que una construcción general de esta forma produce siempre una cónica
no degenerada:
Teorema 4.18 (Construcción de Steiner). Sean a, a ∈ P2k dos puntos distintos y sea
f : Ω(a) → Ω(a ) una proyectividad tal que f (aa ) = aa . Entonces el conjunto C =
{L ∩ f (L) | L ∈ Ω(a)} es una cónica no degenerada que pasa por a y a .
Demostración: Sea ϕ : P1k → Ω(a) una parametrización definida por
(t0 : t1 ) → (u0 : u1 : u2 ) = (l0 , l1 : l2 ),
donde l0 , l1 , l2 son expresiones lineales homogéneas en t0 , t1 . Como f es una proyectividad,
f ◦ ϕ es una parametrización de Ω(a ), que tendrá por tanto el aspecto
(t0 : t1 ) → (u0 : u1 : u2 ) = (l0 , l1 : l2 ),
donde l0 , l1 , l2 son de nuevo expresiones lineales homogéneas en t0 , t1 . El conjunto C será
entonces el conjunto de puntos de intersección de las rectas
l 0 X 0 + l1 X1 + l2 X 2 = 0
l0 X0 + l1 X1 + l2 X2 = 0
cuando (t0 : t1 ) varı́a en
P1k .
Por tanto, C estará parametrizado de la forma
(t0 : t1 ) → (l1 l2 − l2 l1 : l2 l0 − l0 l2 : l0 l1 − l1 l0 ).
38
Por la Proposición 4.10, el teorema estará demostrado si demostramos que las expresiones
cuadráticas homogéneas l1 l2 − l2 l1 , l2 l0 − l0 l2 , l0 l1 − l1 l0 son linealmente independientes.
Supongamos por tanto que no lo fueran. Eso querrı́a decir que el conjunto C estarı́a
contenido en una recta L0 . Es decir, para cada L ∈ Ω(a) se tendrı́a que L ∩ f (L) es un
punto de la recta L0 . En otras palabras, tendrı́amos una proyectividad entre dos rectas
∗
∗
de P2k tal que la recta entre cada punto y su imagen pasa siempre por el punto L0 ∈ P2k ,
con lo que f serı́a una perspectividad de centro L0 . Sin embargo esto es absurdo, porque
la imagen de aa (que es la intersección de Ω(a) y Ω(a )) no es aa .
Observación 4.19. Nótese que, si en la construcción de Steiner quitamos la condición
f (aa ) = aa , se tiene que la intersección L ∩ f (L) es siempre un punto excepto en el
caso L = aa , en que la intersección es toda aa . Además, como se observa al final de
∗
la demostración del Teorema 4.18, f : Ω(a) → Ω(a ) serı́a una perspectividad en P2k , es
decir, existirı́a una recta L0 tal que f (L) serı́a la recta generada por a y L ∩ L0 . Se tendrı́a
entonces que C serı́a la unión de L0 y aa .
Teorema 4.20. Sean p1 , p2 , p3 , p4 , p5 ∈ P2k cinco puntos distintos de modo que no hay
tres entre ellos alineados. Entonces existe una única cónica que pasa por ellos, que además
es no degenerada.
Demostración: Claramente, cualquier cónica que pase por los cinco puntos es no degenerada, ya que en caso contrario la cónica deberı́a ser o un par de rectas o una recta doble,
y en cualquiera de los dos casos necesariamente tres de los cinco puntos estarı́an en una
recta, en contra de nuestra hipótesis. Por otra parte, por el teorema de Chasles (Corolario
4.16), si C es una cónica no degenerada que pasa por p1 , p2 , p3 , p4 , p5 , entonces existe una
proyectividad f : Ω(p1 ) → Ω(p2 ) tal que f (p1 p3 ) = p2 p3 , f (p1 p4 ) = p2 p4 , f (p1 p5 ) = p2 p5 y
C = {L ∩ f (L) | L ∈ Ω(p1 )}. Como f está determinada por la imagen de p1 p3 , p1 p4 , p1 p5 ,
se tiene que sólo existe una posibilidad para f y por tanto una única C posible. Por otra
parte, la construcción de Steiner nos dice que tal construcción nos da una cónica (o un par
de rectas, según la Observación 4.19). Como claramente C definida de ese modo contiene
a p1 , p2 , p3 , p4 , p5 , es claro que C es una cónica no degenerada.
Teorema 4.21. Sea C una cónica no degenerada y L una recta que corta a C en dos puntos
distintos a, b. Entonces, para cada punto c ∈ L \ {a, b}, si c es el punto de intersección de
L con la recta polar de c respecto de C, se tiene [a, b, c, c ] = −1.
Demostración: Sea L la recta polar de c respecto de C y sean p1 , p2 los puntos de
intersección de L con C.
39
b
p1
d
a
p2
c
Por la Observación 3.10, [a, b, c, c ] = [p1 a, p1 b, p1 c, p1 c ], mientras que por la Observación 4.17, [p1 a, p1 b, p1 c, p1 c ] = [a, b, p1 , p2 ], con lo que se tiene [a, b, c, c ] = [a, b, p1 , p2 ].
Análogamente, cambiando el papel de p1 por p2 se tendrá [a, b, c, c ] = [a, b, p2 , p1 ], que,
1
por la Observación 3.9, es [a,b,p11 ,p2 ] . Por tanto, [a, b, c, c ] = [a,b,c,c
] , de donde se deduce
(teniendo en cuenta que la razón doble de cuatro puntos distintos es distinta de uno) que
[a, b, c, c ] = −1.
40
5. Cónicas afines y euclı́deas
En este capı́tulo redemostraremos la clasifición de cónicas afines y euclı́deas a partir
de sus completados proyectivos. Empezaremos con las cónicas afines reales, iniciando por
los casos más sencillos de completado proyectivo.
Proposición 5.1. Sea C ∈ A2k una cónica afı́n tal que su completado proyectivo es una
recta doble. Entonces C es una recta doble.
Demostración: Es inmediato: si el completado proyectivo tiene ecuación (a0 X0 + a1 X1 +
a2 X2 )2 = 0, entonces C es la recta doble de ecuación (a0 + a1 X + a2 Y )2 = 0.
Proposición 5.2. Sea C ∈ A2k una cónica afı́n tal que su completado proyectivo C̄ es una
par de rectas no imaginarias (resp. imaginarias conjugadas). Entonces se da uno de los
siguientes casos:
(i) La interscción de C̄ y la recta del infinito consiste en dos puntos no imaginarios
(resp. imaginarios) distintos y entonces C consiste en un par de rectas secantes no
imaginarias (resp. imaginarias conjugadas).
(ii) La interscción de C̄ y la recta del infinito consiste un solo punto no imaginario (resp.
imaginario) distintos y entonces C consiste en un par de rectas paralelas no imaginarias
(resp. imaginarias conjugadas).
Demostración: Si la ecuación de C̄ es (a0 X0 + a1 X1 + a2 X2 )(b0 X0 + b1 X1 + b2 X2 ) = 0,
entonces la ecuación de C es (a0 + a1 X + a2 Y )(b0 + b1 X + b2 Y ) = 0, que es la unión de
dos rectas. La intersección de C̄ con la recta del infinito son los puntos (0 : a2 : −a1 )
y (0 : b2 : −b1 ), que corresponden a los vectores directores de las rectas. Entonces la
intersección con la recta del infinito será un solo punto si y sólo si las rectas son paralelas.
Para estudiar cónicas no degeneradas necesitaremos hacer cambios de coordenadas.
Recuérdese que un cambio de coordenadas afı́n tiene el aspecto

 
 
1
1 0 0
1
 X  =  α a b   X 
Y
β c d
Y
a b
= 0 con lo que se puede extender a un cambio de coordenadas en P2 de la
con k
c d
forma


  
1 0 0
X0
X0
 X1  =  α a b   X1  .
(5.3)
X2
X2
β c d
41
Definición. Se llama completado proyectivo de un cambio de coordenadas afı́n a un cambio
de coordenadas en P2k como el anterior.
Lema 5.4. Un cambio de coordenadas en P2k es el completado proyectivo de un cambio
afı́n de coordenadas si y sólo si manda la recta del infinito a X0 = 0. Además, cualquier
proyectividad de la recta del infinito en sı́ misma se puede ver como la restricción del
completado proyectivo de un cambio de coordenadas afı́n.
Demostración: Claramente, un cambio de coordenadas de la forma (5.3) manda la recta
del infinito a X0 = 0. Concretamente, se tiene la expresión
(0 : X1 : X2 ) = (0 : aX1 + bX2 : cX1 + dX2 )
que claramente define una proyectividad de la recta del infinito en sı́ misma. Recı́procamente, si tenemos un cambio de coordenadas de P2k

 
X0
p00
 X1  =  p10
X2
p20
p01
p11
p21


p02
X0
p12   X1 
p22
X2
si la recta del infinito va a parar a X0 = 0, en particular ocurrirá que los puntos (0 : 1 : 0)
y (0 : 0 : 1), que en las nuevas coordenadas son respectivamente (p01 : p11 : p21 ) y (p02 :
p12 : p22 ) deben tener la primera
es decir p01 = p02 = 0. Por tratarse
coordenada cero,
p00 0
0
p11 p12 = 0.
de un cambio de coordenadas, p10 p11 p12 = 0, es decir, p00 = 0 y p
p
21
22
p20 p21 p22 Dividiendo entonces por p00 , el cambio de coordenadas queda de la forma
 
1
X0
 X1  =  pp10
01
p20
X2
p01

p11 p12
p01
con pp01
p22
21
p01
p01
nadas afı́n.
0
0
p11
p01
p21
p01
p12
p01
p22
p01


X0
  X1 
X2
= 0, que es por tanto el completado proyectivo de un cambio de coorde
Por otra parte, cualquier proyectividad de la recta del
infinito
se puede escribir de la
a b
= 0, con lo que viene de
forma (0 : X1 : X2 ) → (0 : aX1 + bX2 : cX1 + dX2 ), con c d
un cambio de coordenadas como (5.3) (que claramente no es único).
Teorema 5.5. Sea C ∈ A2R una cónica afı́n tal que su completado proyectivo C̄ es una
cónica no degenerada real. Entonces:
42
(i) Si C̄ corta a la recta del infinito en un solo punto (es decir, si es tangente a la recta
del infinito), C es una parábola.
(ii) Si C̄ corta a la recta del infinito en dos puntos reales distintos, entonces C es una
hipérbola.
(iii) Si C̄ corta a la recta del infinito en dos puntos imaginarios, entonces C es una elipse
real.
Demostración: En el caso (i), por el Teorema 2.20, podemos encontrar una proyectividad
de la recta del infinito en sı́ misma que mande su punto de intersección con C̄ al punto
(0 : 0 : 1), luego por el Lema 5.4 existe un cambio de coordenadas afı́n tal que el punto
del infinito de C es la dirección vertical (y la recta tangente en ese punto es la recta del
infinito). Eso quiere decir que la ecuación de la cónica en las nuevas coordenadas tiene el
aspecto aX 2 + bX + cY + d = 0. Como C̄ es no degenerada, c = 0, con lo que la ecuación
se puede escribir de la forma Y = − ac X 2 − cb X − dc , que claramente es la ecuación de
una parábola.
En el caso (ii), tomamos una proyectividad de la recta del infinito en sı́ misma que
mande sus puntos de intersección con C̄ a (0 : 1 : 0) y (0 : 0 : 1). Usando otra vez el
Lema 5.4, tendremos un cambio de coordenadas afı́n tal que los puntos del infinito de C
serán el horizontal y el vertical, es decir, que en las nuevas coordenadas
de
tendrá
ecuación
d b c 2
2 aX Y + bX + cY + d con a = 0 y, por ser C̄ no degenerada, 2b 0 a2 = 0, i.e.
c a 0
2
2
a(bc − ad) = 0. Dividiendo por a, la ecuación se puede escribir como (X + ab )(Y + ac ) =
bc−ad
a2 , que claramente corresponde a una hipérbola.
En el caso (iii), por la Proposición 3.7 podemos construir una proyectividad de la
recta del infinito que mande sus puntos de intersección con C̄ a los puntos (0 : 1 : i) y
(0 : 1 : −i) y, como en los casos anteriores, extenderlas al completado proyectivo de un
cambio de coordenadas afı́n. Como consecuencia, en 
las nuevas 
coordenadas, C tendrá
c a2 2b
ecuación X 2 + Y 2 + aX + bY + c = 0, donde la matriz  a2 1 0  tiene signatura (2, 1)
b
01
2
1 0
(no puede tener signatura (1, 2), porque la submatriz diagonal
tiene ya signatura
0 1
2
2
(2, 0)). Por tanto, su determinante c − a4 − b4 es negativo. La ecuación es equivalente a
2
2
2
2
(X +a)2 +(Y +b)2 +(c− a4 − b4 ) = 0, que representa una elipse real, ya que c− a4 − b4 < 0.
Finalmente, estudiamos la cónicas no degeneradas imaginarias:
43
Proposición 5.6. Sea C una cónica afı́n tal que C̄ es una cónica no degenerada imaginaria. Entonces C es una elipse imaginaria.
Demostración: Como C̄ es imaginaria, su intersección con la recta del infinito son dos
puntos imaginarios conjugados. Como en la demostración del caso (iii) del teorema
anterior, podemos encontrar un cambio afı́n de coordenadas tal que C tenga
 ecuación

c a2 2b
2
2
(X + a)2 + (Y + b)2 + (c − a4 − b4 ) = 0. La diferencia es que ahora la matriz  a2 1 0 
b
0 1
2
a2
b2
tiene signatura (3, 0), luego determinante c − 4 − 4 positivo, con lo que la ecuación
representa una elipse imaginaria.
Obsérvese que, para cada una de las posibilidades de C̄ y su intersección con la recta
del infinito, nos han salido tipos de cónicas que no son afı́nmente equivalentes. Esto nos
da una clasificación completa de las cónicas afines reales, que resumimos en la siguiente
tabla:
Clasificación de cónicas en A2R
Tipo de cónica C
Tipo de C̄
C̄ ∩ {X0 = 0}
Hipérbola
No degenerada real
Dos puntos reales
Parábola
No degenerada real
Un puntos real
Elipse real
No degenerada real
Dos puntos imaginarios
Elipse imaginaria
No degenerada imaginaria
Dos puntos imaginarios
Par de rectas reales secantes
Par de rectas reales
Dos puntos reales
Par de rectas reales paralelas
Par de rectas reales
Un punto real
Par de rectas imaginarias
Dos puntos imaginarios
Par de rectas imaginarias
Un punto real
Recta doble
Un punto real
Par de rectas imaginarias
conjugadas secantes
Par de rectas imaginarias
conjugadas paralelas
Recta doble
Obsérvese que la clasificación de cónicas afines complejas consiste en la anterior quitando todos los casos imaginarios, quedando por tanto como posibilidades la hipérbola, la
parábola, el par de rectas secantes, el par de rectas paralelas y la recta doble. En general,
para cónicas afines sobre cualquier cuerpo k, seguiremos usando el nombre elipse, parábola,
44
etc. de acuerdo con la tabla anterior, según cómo sea C̄ y su intersección con la recta del
infinito.
Ejemplo 5.7. Fijémonos por un instante en el caso de la hipérbola. En la ecuación reducida que hemos obtenido en la demostración del Teorema 5.5, está claro que las ası́ntotas
son X + ab = 0 e Y + ac = 0 después del cambio de coordenadas. Una pregunta natural
es si se pueden calcular sin hacer el cambio de coordenadas. En estas nuevas coordenadas,
el completado proyectivo C̄ tiene ecuaciones

d
(X0 X1 X2 )  2b
c
2
b
2
0
a
2

X0
  X1  = 0
X2
0
c
2
a
2

de donde se obtiene que las tangentes a C̄ en sus puntos del infinito (0 : 1 : 0) y (0 : 0 : 1)
son respectivamente las rectas 2b X0 + a2 X2 = 0 y 2c X0 + a2 X1 = 0, que son precisamente
los completados proyectivos de las ası́ntotas. Esto motiva la siguiente:
Definición. Dada una cónica afı́n no degenerada C en A2k tal que su completado corta a
la recta del infinito en dos puntos distintos, llamaremos ası́ntotas de la cónica a la parte
afı́n de las tangentes a C̄ en los puntos del infinito.
Obsérvese que estamos excluyendo el caso de la parábola, en que hay un solo punto en
el infinito, cuya recta tangente es la propia recta del infinito, por lo que no tiene parte afı́n.
Estamos admitiendo también la existencia de ası́ntotas en el caso de la elipse (imaginaria
o no), pero en tal caso serán dos rectas imaginarias. Obsérvese que, sin embargo, estas
dos rectas imaginarias se cortan en un punto no imaginario. En efecto, si p1 , p2 son los
dos puntos del infinito de C (imaginarios o no), las tangentes a C̄ en p1 y p2 son las rectas
polares de dichos puntos, con lo que su intersección será el polo de la recta p1 p2 , es decir,
de la recta del infinito (ver la Proposición 4.6(v)), que no es imaginario. Esto motiva de
nuevo otra definición.
Definición. Se llama centro de una cónica afı́n no degenerada al polo de la recta del
infinito. Una cónica cuyo centro sea un punto afı́n (es decir, que no sea una parábola) se
llama cónica con centro.
Pasamos ahora a estudiar las cónicas euclı́deas. Toda cónica euclı́dea es una cónica
afı́n, luego una primera aproximación es la clasificación que ya tenemos de las cónicas
afines. Sin embargo, necesitamos una clasificación un poco más fina, en el sentido de
que dos cónicas afı́nmente equivalentes no son necesariamente equivalentes como cónicas
euclı́deas. Por ejemplo, en el plano afı́n las cónicas X 2 + Y 2 = 1 y X 2 + 4Y 2 = 1 son
equivalentes, porque el cambio de coordenadas (X, Y ) = (X , 2Y ) permite pasar de una a
45
otra. Sin embargo, como cónicas euclı́deas no son equivalentes, porque mientras la primera
es una circunferencia (en concreto el conjunto de puntos que distan uno de (0, 0)) la segunda
no lo es, y cualquier transformación euclı́dea deberı́a conservar las distancias. De hecho,
los únicos cambios de coordenadas permitidos en el plano euclı́deo son las isometrı́as, que
tienen la forma
 
 

1 0 0
1
1
 X  =  α a b   X 
Y
β c d
Y
a b
a b
a c
1 0
con
una matriz ortogonal, es decir
=
. Dependiendo
c d
c d
b d
0 1
del signo del determinante (que necesariamente es ±1), se da uno de los siguientes casos
a b
cos θ − sen θ
=
(isometrı́a directa)
c d
sen θ
cos θ
a b
cos θ
sen θ
=
(isometrı́a inversa)
c d
sen θ − cos θ
Como una circunferencia está caracterizada por ser una elipse real que corta a la
recta del infinito en los puntos cı́clicos (0 : 1 : i), (0 : 1 : −i), podrı́a pensarse que las
los completados proyectivos de isometrı́as se caracterizan por preservar los puntos cı́clicos.
Dicha afirmación es cierta sólo a medias:
Proposición 5.8. Un cambio de coordenadas en P2R deja invariantes las coordenadas del
conjunto {(0 : 1 : i), (0 : 1 : −i)} de los puntos cı́clicos si y sólo si es el completado
proyectivo de la composición de una homotecia y una isometrı́a. Además, dicha isometrı́a
es directa si y sólo si quedan fijas las coordenadas de cada uno de los puntos cı́clicos, y
es inversa si las permuta. Finalmente, cualquier proyectividad de la recta del infinito que
deje invariantes las coordenadas del conjunto {(0 : 1 : i), (0 : 1 : −i)} es restricción del
completado proyectivo de un cambio de coordenadas isométrico.
Demostración: En primer lugar, una homotecia

 
1
1 0
 X  =  α λ
Y
β 0
tiene de ecuaciones
 
0
1
0X 
λ
Y
y su completado proyectivo claramente conserva las coordenadas de cada punto de la
recta del infinito (ya que las multiplica todas por la constante λ). Por otra parte, es una
simple comprobación que el completado proyectivo de una isometrı́a directas deja fijas las
coordenadas de los puntos cı́clicos, mientras que el de una inversa las intercambia.
Recı́procamente, supongamos que un cambio de coordenadas de P2 conserva las coordenadas del conjunto de los puntos cı́clicos. Esto implica en primer lugar que manda
46
la recta del infinito a la recta X0 = 0, con lo que (por el Lema 5.4) es el completado
proyectivo de un cambio afı́n de coordenadas, es decir, será de la forma
 
1
X0
 X1  =  α
X2
β



0 0
X0
a b   X1 
X2
c d
a b
= 0. Las nuevas coordenadas de (0 : 1 : i) y (0 : 1 : −i) serán respectivamente
con c d
(0 : a + bi : c + di) y (0 : a − bi : c − di).
Si por ejemplo (0 : a + bi : c + di) = (0 : 1 : i)
y (0 : a − bi : c − di) = (0 : 1 : −i),
a − bi c − di a + bi c + di , de donde se deduce d = a, b = −c.
= 0 = se tendrá 1
−i 1
i Escribiendo √a2a+c2 = cos θ, √a2c+c2 = sen θ, tendremos

1
α
β
 
0 0
1


a b = α
c d
β
0
cos θ
sen θ

0
1


− sen θ
0
0
cos θ
√ 0
a2 + c2
0

0

√ 0
2
2
a +c
que representa la composición de una homotecia y una isometrı́a directa.
Si en cambio (0 : a + bi : c + di) = (0 : 1 : −i) y (0 : a − bi : c − di) = (0 : 1 : i), se
a + bi c + di = 0 = a − bi c − di , de donde se deduce ahora d = −a, b = c.
tendrá 1
1
−i i a
c
Escribiendo de nuevo √a2 +c2 = cos θ, √a2 +c2 = sen θ, tendremos

1
α
β
 
0 0
1


a b = α
c d
β
0
cos θ
sen θ

0
1


sen θ
0
0
− cos θ
√ 0
a2 + c2
0

0

√ 0
2
2
a +c
que representa ahora la composición de una homotecia y una isometrı́a inversa.
Finalmente, dada una proyectividad (0 : X1 : X2 ) → (0 : aX1 + bX2 : cX1 + bX2 ) de
la recta del infinito que deje invariantes las coordenadas del conjunto de puntos cı́clicos,
√
acabamos de ver que (después de dividir por a2 + c2 ), se escribe como
(0 : X1 : X2 ) → (0 : cos θX1 − sen θX2 : sen θX1 + cos θX2 )
si deja fijos ambos puntos cı́clicos o bien como
(0 : X1 : X2 ) → (0 : cos θX1 + sen θX2 : sen θX1 − cos θX2 )
si los intercambia, con lo que es siempre restricción del completado proyectivo de una
isometrı́a.
47
Definición. Se llama semejanza a la composición de una homotecia y una isometrı́a. Se
dirá que es directa o inversa según lo sea la isometrı́a.
El resultado anterior está diciendo que con la geometrı́a proyectiva, más que geometrı́a
euclı́dea (la que conserva distancias, es decir, las formas y tamaños), podemos sólo hacer
geometrı́a conforme (la que conserva las formas, pero no necesariamente los tamaños).
Este hecho se manifiesta explı́citamente en el siguiente resultado, que muestra de nuevo el
papel fundamental que juegan los puntos cı́clicos.
Proposición 5.9. Sean v = (0 : v1 : v2 ), w = (0 : w1 : w2 ) dos puntos del infinito del
plano euclı́deo E2 . Si I = (0 : 1 : i), J = (0 : 1 : −i) son los puntos cı́clicos, entonces
[I, J, v, w] = cos 2θ + i sen 2θ, donde θ es el ángulo que va del vector w
= (w1 , w2 ) al vector
v = (v1 , v2 ) en el sentido antihorario. En particular, las direcciones representadas por v y
w son perpendiculares si y sólo si [I, J, v, w] = −1.
Demostración: Por el Lema
1 v1 1
i v2 −i
[I, J, u, v] = 1
1
w
1
i w2 −i
3.1, se tiene

2
w1 √ v22 2 − i √ v21 2
w2
v1 +v2
(v − iv1 )(w2 + iw1 )  v1 +v2
 .
= 2
=
w
√ 2 2 2 − i √ w2 1 2
(w2 − iw1 )(v2 + iv1 )
v1 w1 +w2
w1 +w2
v2 Ahora bien, los vectores v y w
se pueden ver en el plano de los números complejos como v =
= w1 + iw2 , y en tal caso sus vectores normalizados (de módulo uno) y girados
v1 + iv2 y w
noventa grados en el sentido de las agujas del reloj son precisamente √ v22 2 − i √ v21 2 y
√
w2
w12 +w22
− i√
w1
.
w12 +w22
v1 +v2
v1 +v2
Por tanto, el ángulo del segundo al primero en sentido antihorario
√ v22
es también θ, de donde se sigue √
v +v 2
1
2
w2
w2 +w2
1
2
−i √
−i √
v1
v 2 +v 2
1
2
w1
= cos θ + i sen θ = eiθ , lo que implica el
w2 +w2
1
2
resultado.
Obsérvese que en el enunciado anterior no hay indefinición, ya que si cambiamos de
sentido uno de los vectores v o w,
entonces θ varı́a en 180 grados, con lo que su doble es
el mismo (módulo 360 grados).
Observación 5.10. El resultado anterior interpreta entonces lo que son las semejanzas:
si son directas, I, J quedan fijos y, al conservarse la razón doble, se preservan los ángulos;
si son inversas, se intercambian I y J, luego por la Observación 3.9 invierte la razón doble,
que al ser un número complejo de módulo uno nos da el conjugado, luego cambia el sentido
de los ángulos.
Veamos también lo que podemos decir sobre la razón doble de los puntos cı́clicos y
dos puntos imaginarios conjugados.
48
Lema 5.11. Sean, p, p̄ dos puntos imaginarios conjugados de la recta del infinito, distintos
de los puntos cı́clicos. Entonces, [I, J, p, p̄] es un número real positivo. Además, existe
λ ∈ R \ {0, 1} tal que, si llamamos q = (0 : 1 : λi), entonces [I, J, p, p̄] = [I, J, q, q̄].
Demostración: La manera más rápida, aunque poco elegante, es por medio de un simple
cálculo. Por simplificar, como p no es real, su coordenada X1 no es cero (porque si no serı́a
el punto (0 : 0 : 1)), ası́ que podemos escribir p = (0 : 1 : a + bi), con a, b ∈ R y b = 0. Es
entonces un simple cálculo que
1
1
1
1
i a + bi −i a − bi (a + (b − 1)i)(a − (b − 1)i)
a2 + (b − 1)2
=
=
[I, J, p, p̄] = (a − (b + 1)i)(a + (b + 1)i)
a2 + (b + 1)2
1 1
1 1
i a − bi −i a + bi que claramente es un número positivo. Por tanto, podemos escribir [I, J, p, p̄] = µ2 para
algún µ > 0 (además, µ = 1). Las mismas cuentas que acabamos de hacer muestran que,
2
tomando q = (0 : 1 : λi), se tiene [I, J, q, q̄] = λ−1
, con lo que basta encontrar un λ ∈ R
λ+1
tal que µ =
λ−1
λ+1 ,
y claramente basta tomar λ =
1+µ
1−µ .
Con todo esto, ya podemos ir estudiando los distintos tipos de cónicas euclı́deas.
Proposición 5.12. Toda parábola euclı́dea se puede escribir, después de una cambio de
coordenadas isométrico de la forma Y = aX 2 para un único a > 0.
Demostración: Si p es el punto del infinito de la parábola, por la Proposición 3.7 existe una
proyectividad de la recta del infinito en sı́ misma que deja fijos los puntos cı́clicos y manda
p al punto (0 : 1 : 0), por lo que por la Proposición 5.8 existe un cambio de coordenadas
isométrico tal que la nueva ecuación de la parábola será de la forma (haciendo las mismas
cuentas que en la demostración del Teorema 5.5) Y = aX 2 + bX + c con a = 0. Además,
cambiando Y por −Y si fuera necesario, podemos suponer a > 0. La ecuación anterior es
2
4b2
2b 2
2b
equivalente a Y −c+ 4b
a2 = a(X + a ) , con lo que llamando X = X + a , Y = Y −c+ a2
(que es una traslación y por tanto una isometrı́a) se tiene la ecuación buscada. Como en
estas últimas coordenadas la parábola representa el conjunto de puntos que equidistan del
1
1
punto de la recta Y = − 4a
y del punto (0, 4a
), el valor a está unı́vocamente determinado
a partir de la parábola, ya que la distancia del punto a la recta, que permanece fijo por
1
.
isometrı́as, es 2a
Proposición 5.13. Toda hipérbola euclı́dea se puede escribir, después de un cambio de
2
2
coordenadas isométrico de la forma Xa2 − Yb2 = 1 para unos únicos a, b > 0.
Demostración: Sean v, w los puntos del infinito de la hipérbola, y sea cos 2θ + i sen 2θ la
razón doble [I, J, v, w] (ver la Proposición 5.9). Si llamamos v = (0 : cos θ2 : sen θ2 ), w =
49
(0 : cos θ2 : − sen θ2 ), también se tiene que [I, J, v , w ] = cos 2θ + i sen 2θ, por lo que
existe una proyectividad de la recta del infinito en sı́ misma que manda respectivamente
I, J, v, w a I, J, v , w , y por la Proposición 3.7 será una proyectividad real. Por tanto,
por la Proposición 5.8 existe un cambio de coordenadas isométrico tal que los puntos del
infinito de la hipérbola tendrán coordenadas (0 : cos θ2 : sen θ2 ), (0 : cos θ2 : − sen θ2 ), lo que
implica que la ecuación se puede escribir como sen2 θ2 X 2 − cos2 θ2 Y 2 + cX + dY + e = 0.
Mediante la traslación (X , Y ) = (X + 2 senc 2 θ , Y − 2 cosd 2 θ ) obtenemos una ecuación de
2
2
la forma sen2 θ2 X 2 − cos2 θ2 Y 2 + e = 0 (con e = 0, ya que se trata de una hipérbola).
Podemos suponer e < 0 (si fuera e > 0, intercambiamos X e Y y cambiamos θ por
θ + π), y escribiendo sene 2 θ = a2 , cose2 θ = b2 obtenemos la ecuación reducida buscada.
En estas coordenadas, la hipérbola consiste en los puntos tales que la diferencia de las
√
√
distancias a los puntos (− a2 + b2 , 0) y ( a2 + b2 , 0) es, en valor absoluto, igual a 2a. Por
√
tanto, 2a depende de las propiedades métricas de la hipérbola, ası́ como 2 a2 + b2 , que es la
√
√
distancia entre los puntos (− a2 + b2 , 0) y ( a2 + b2 , 0). Como consecuencia, a y b están
determinados unı́vocamente por la hipérbola, independientemente de las coordenadas.
Proposición 5.14. Toda elipse euclı́dea real se puede escribir, después de un cambio de
2
2
coordenadas euclı́deo, de la forma Xa2 + Yb2 = 1 para unos únicos a ≥ b > 0.
Demostración: Como en los casos anteriores, y usando ahora el Lema 5.11, podemos hacer
una cambio de coordenadas euclı́deo tal que los puntos del infinito de la elipse sean de la
forma (0 : 1 : λi), (0 : 1 : −λi) para algún λ = 0 (si los puntos del infinito de la elipse son
los puntos cı́clicos, no hay que hacer cambio de coordenadas, y tendremos λ = 1. Es decir,
que podemos escribir la ecuación de la elipse como λ2 X 2 + Y 2 + a X + b Y + c = 0.
a
, Y + b2 ), la ecuación tendrá el aspecto
Después de una traslación (X , Y ) = (X + 2λ
λ2 X 2 + Y 2 + e = 0,para algún e ∈ R, que necesariamente es negativo por ser la elipse
√
,
b
=
−e tendremos la ecuación buscada (si fuera a < b, basta
real. Escribiendo a = −e
2
λ
girar 90 grados o intercambiar X e Y ).
En estas coordenadas, la elipse consiste en los puntos tales que la suma de las distancias
√
√
a los puntos (− a2 − b2 , 0) y ( a2 − b2 , 0) es igual a 2a. Como en el caso de la hipérbola,
√
2a y 2 a2 − b2 , y por tanto a y b están determinados unı́vocamente por las propiedades
métricas de la elipse, y por tanto no dependen de las coordenadas.
Observación 5.15. Se deja como ejercicio para el lector que, en el caso de las demás
cónicas euclı́deas, la ecuación reducida queda:
–Elipse imaginaria:
X 2
a2
+
Y 2
b2
= −1 para unos únicos a ≥ b > 0.
–Par de rectas reales secantes: sen2 θ2 X 2 − cos2 θ2 Y 2 = 0, donde θ es el ángulo entre
las dos rectas.
50
–Par de rectas imaginarias secantes: λ2 X 2 + Y 2 = 0, para un único λ > 0.
–Par de rectas reales paralelas: X 2 = a2 , donde 2a es la distancia entre las dos rectas.
–Par de rectas imaginarias paralelas: X 2 = −a2 , para un único a > 0.
–Recta doble: X 2 = 0.
Finalmente, ya que los puntos cı́clicos juegan un factor importante en la geometrı́a
euclı́dea, también lo deben jugar sus rectas polares respecto del completado proyectivo de
la cónica:
Definición. Dada una cónica euclı́dea no degenerada C, si L1 , L2 son las tangentes a C̄
que pasan por I, y M1 , M2 son las rectas tangentes a C̄ que pasan por J, se llaman focos
de la cónica a los puntos afines de intersección de cada Li con cada Mj .
Veamos cuáles son los focos de los distintos tipos de cónicas euclı́deas reales (con la
ecuación ya reducida):
–Si C es la hipérbola
X2
a2
−
Y2
b2
= 1, entonces la recta polar a (0 : 1 : ±i) respecto
X2
X2
iX2
2
1
1
2
de C̄ es X
a2 = ± b2 , que√interseca a C̄ (de ecuación a2 − b2 = X0 ) en los puntos
√
(− a2 + b2 i : ±a2 i : b2 ), ( a2 + b2 i : ±a2 i : b2 ). Por tanto las rectas tangentes a C̄ que
pasan por (0 : 1 : ±i) son
(a2 + b2 )X0 ±
a2 + b2 X1 + a2 + b2 iX2 = 0
y
a2 + b2 X1 − a2 + b2 iX2 = 0
√
√
√
con lo que los focos quedan los puntos (− a2 + b2 , 0), ( a2 + b2 , 0) (0, − a2 + b2 i) y
√
(0, a2 + b2 i).
(a2 + b2 )X0 ∓
2
2
Y
–Si C es la elipse real de ecuación X
cuentas que antes
a2 + b2 = 1, las mismas
√
√
2
2
2
2
(basta cambiar b por −b ) nos dan como focos los puntos (− a − b , 0), ( a2 − b2 , 0)
√
√
(0, − a2 − b2 i) y (0, a2 − b2 i). Si la elipse fuera imaginaria (cambiando los a2 y b2 por
sus opuestos en la ecuación de C), quedarı́an los mismos focos. Obsérvese que, en el caso
de una circunferencia (real o imaginaria) los cuatro focos coinciden.
–Si C es la parábola de ecuación Y = aX 2 , la recta polar a (0 : 1 : ±i) respecto de C̄
es ∓ 2i X0 + aX1 = 0, que intersecada con C̄ (de ecuación X0 X2 = aX12 ) nos da los puntos
(0 : 0 : 1) y (∓4ai : 2 : ±i). Por tanto, las rectas tangentes a C̄ que pasan por (0 : 1 : ±i)
son X0 = 0 y ∓iX0 + 4aX1 ± 4aiX2 = 0, y se obtiene sólo un foco, que es el punto afı́n
1
(0, 4a
).
Definición. Se llaman ejes de una cónica euclı́dea a:
51
–las rectas que unen los dos focos reales reales o dos focos imaginarios conjugados, en
el caso de la hipérbola o una elipse que no sea una circunferencia (hay dos ejes, que son
perpendiculares entre sı́ y se cortan en el centro de la cónica);
–la recta que pasa por el foco de la parábola y su punto del infinito. En este caso, se
llama directriz de la parábola a la recta perpendicular al eje que pasa por el simétrico del
foco respecto del punto de intersección de la parábola con el eje.
52
ESPACIOS PROYECTIVOS
6. Construcción del espacio proyectivo
A la vista de cómo hemos definido primero P2k y luego P1k , está claro que puede generalizarse para definir Pnk para n arbitrario. Basta definirlo como el conjunto de elementos
(a0 : . . . : an ) (con no todos los ai nulos) tales que (a0 : . . . : an ) = (b0 : . . . : bn ) si y sólo si
existe λ ∈ k \ {0} tal que (b0 , . . . , bn ) = λ(a0 , . . . , an ). De todas formas, una definición ası́
no es muy precisa matemáticamente. Probemos a dar entonces una descripción alternativa,
que valdrá en un contexto más general. La condición (b0 , . . . , bn ) = λ(a0 , . . . , an ) anterior
es en realidad equivalente a decir que los vectores (a0 , . . . , an ) y (b0 , . . . , bn ) generan la
misma recta vectorial en k n+1 . Más en general, podemos definir:
Definición. Se llama proyectivizado de un espacio vectorial V sobre un cuerpo k al conjunto P(V ) de rectas vectoriales de V . Si V = k n+1 , escribiremos simplemente Pnk , y lo
llamaremos espacio proyectivo de dimensión n.
Si consideramos la aplicación π : V → P(V ) que asocia a cada vector no nulo la recta
vectorial que genera en V , tenemos claramente una aplicación suprayectiva, y además
π(v) = π(w) si y sólo si existe λ ∈ k \ {0} tal que w = λv. Por tanto, la relación ∼ en
V \ {0} definida por
v ∼ w ⇔ ∃λ ∈ k \ {0} tal que w = λv
es una relación de equivalencia y además el cociente V \ {0} está en biyección con P(V )
en forma natural (asociando a la clase de v la recta vectorial generada por v). Por tanto,
podemos tambier dar la siguiente:
Definición (otra definición equivalente de espacio proyectivo). El proyectivizado de un
espacio vectorial V es el cociente P(V ) de V \ {0} por la relación de equivalencia ∼. Al
punto de P(V ) que corresponde a la clase del vector v la denotaremos por [v]. Si V = k n+1 ,
el punto de Pnk que corresponde a la clase del vector (a0 , . . . , an ) la denotaremos por
(a0 : . . . : an ) en vez de [(a0 , . . . , an )].
Si V es un espacio vectorial de dimensión finita de dimensión n + 1, tomando una
base de V cada vector de V puede representarse por n + 1 coordenadas, por lo que cada
elemento de P(V ) puede representarse por un elemento de Pnk . Por tanto, P(V ) se puede
identificar con Pnk (ya veremos esto con más precisión cuando describamos los sistemas de
referencia).
53
Definición. Dado un espacio proyectivo P(V ), se llama subespacio proyectivo o lineal de
dimensión r a un subconjunto de la forma P(W ), donde W es un subespacio vectorial de
dimensión r + 1. A los subespacios proyectivos de dimensión uno se les llama rectas, a los
de dimensión dos se les llama planos y a los de dimensión n − 1 (donde n es la dimensión
de P(V ), es decir dim(V ) = n + 1) se les llama hiperplanos. Por definición, los subespacios
proyectivos de dimensión cero son los puntos. Por convenio, el conjunto vacı́o (que se
puede ver como el proyectivizado del subespacio cero) diremos que tiene dimensión −1.
Obsérvese que una hipersuperficie proyectiva P(W ) de P(V ) es lo mismo que una
hipersuperficie vectorial W de V , que viene dada por tanto por una ecuación, que es una
forma lineal no nula sobre V (que es lo que ocurrı́a para las rectas de P2k ). Además, dos
ecuaciones definen la misma hipersuperficie si y sólo si son proporcionales. Por tanto, el
conjunto de hipersuperficies de P(V ) se identifica con el conjunto de formas lineales no
nulas sobre V módulo proporcionalidad, es decir, V ∗ \ {0}/ ∼, que es precisamente P(V ∗ ).
Generalizando la noción de plano dual, tendremos entonces:
Definición. Se llama espacio proyectivo dual de un espacio proyectivo P(V ) al conjunto
P(V )∗ de todos los hiperplanos de P(V ). Es otro espacio proyectivo que se puede identificar
con P(V ∗ ).
Por otra parte, una recta P(W ) ⊂ Pnk corresponde a un subespacio W ⊂ k n+1
de dimensión dos, que se podrá generar por dos vectores linealmente independientes
(a0 , . . . , an ), (b0 , . . . , bn ). Por tanto, un vector (x0 , . . . , xn ) está en W (que es lo mismo
que decir que el punto (x0 : . . . : xn ) está en P(W )) si y sólo si existen t0 , t1 ∈ k (no ambos
nulos) tales que

x0 =a0 t0 + b0 t1



..
.



xn =an t0 + bn t1
con lo que recobramos la parametrización de las rectas (y no sólo en
P2k ).
Observación 6.1. Dados subespacios P(W1 ), . . . , P(Ws ) de un espacio proyectivo P(V ),
se pueden hacer las siguientes operaciones:
–La intersección P(W1 ) ∩ . . . ∩ P(Ws ), que consistirá en los elementos [v] tales que v
está en cada Wi , es decir, que P(W1 ) ∩ . . . ∩ P(Ws ) = P(W1 ∩ . . . ∩ Ws ), con lo que en
particular la intersección de subespacios es otro subespacio.
–El mı́nimo subespacio P(W ) que los contiene, luego W será el mı́nimo subespacio
vectorial que contiene a W1 , . . . , Ws , es decir, W = W1 + . . . + Ws .
54
Definición. Se llama subespacio generado por los subespacios P(W1 ), . . . , P(Ws ), y lo denotaremos por < P(W1 ), . . . , P(Ws ) > al mı́nimo subespacio proyectivo que los contiene.
Como hemos visto, < P(W1 ), . . . , P(Ws ) >= P(W1 + . . . + Ws ).
Proposición 6.2 (fórmula de Grassmann). Sean
de P(V ). Entonces
P(W1 ), P(W2 ) subespacios proyectivos
dim < P(W1 ), P(W2 ) >= dim P(W1 ) + dim P(W2 ) − dim P(W1 ∩ W2 ).
Demostración: Hemos visto que < P(W1 ), P(W2 ) >= P(W1 +W2 ), luego por definición tendremos que dim < P(W1 ), P(W2 ) >= dim(W1 + W2 ) − 1, que por la fórmula de Grassmann
vectorial será igual a dim W1 + dim W2 − dim(W1 − W2 ) = (dim W1 − 1) + (dim W2 − 1) −
(dim(W1 ∩W2 )−1), que por definición es igual a dim P(W1 )+dim P(W2 )−dim P(W1 ∩W2 ).
Corolario 6.3. Sean Λ, Λ dos subespacios proyectivos de dimensiones respectivas r, r en
un espacio proyectivo de dimensión n. Entonces, si r + r ≥ n, la intersección de Λ y Λ
tiene dimensión al menos r + r − n (y por tanto es no vacı́a).
Demostración: Por la fórmula de Grassmann, dim(Λ ∩ Λ ) = r + r − dim < Λ, Λ >. Como
claramente dim < Λ, Λ >≥ n, el resultado se sigue inmediatamente.
Corolario 6.4. Sea Λ un subespacio proyectivo de dimensión r. Entonces, si H es un
hiperplano que no contiene a Λ, Λ ∩ H tiene dimensión r − 1 (por ejemplo, una recta y un
hiperplano que no la contiene se intersecan exactamente en un punto).
Demostración: De nuevo por la fórmula de Grassmann, se tiene que dim(Λ ∩ H) = n −
1 + r − dim < Λ, H >. Como Λ ⊆
/ H, se sigue que H ⊆
/ < Λ, H >, por lo que < Λ, H >
tiene dimensión mayor que n − 1 (y por tanto es el total), es decir dim < Λ, H >= n, de
donde se obtiene dim(Λ ∩ H) = r − 1.
Ejemplo 6.5.Consideramos en P5k , donde usaremos coordenadas (a0 : a1 : a2 : a3 : a4 : a5 ),
el subespacio de ecuaciones

a0




a0
a3
+a1
+a2
+a3
55
+a4
a5
+a5
=0
=0
=0
= 0.
Como corresponde a un plano vectorial en k 6 , entonces es una recta L ⊂ P5 , que podremos
parametrizar como

 a0 = 0





a1 = t0





a2 = t1

a3 = 0






a4 = −t0 − t1




a5 = 0
Este ejemplo no está escogido al azar. De hecho, un punto (a0 : a1 : a2 : a3 : a4 : a5 ) ∈
P5k se puede identificar con la cónica de P2k de ecuación a0 X02 + a1 X0 X1 + a2 X0 X2 +
a3 X12 + a4 X1 X2 + a5 X22 = 0 (ya que dos ecuaciones definen la misma cónica si y sólo si
sus ecuaciones tienen sus coeficientes proporcionales). Con esta identificación, se observa
inmediatamente que
• a0 = 0 si y sólo si el punto (1 : 0 : 0) pertenece a la cónica.
• a1 = 0 si y sólo si el punto (0 : 1 : 0) pertenece a la cónica.
• a3 = 0 si y sólo si el punto (0 : 0 : 1) pertenece a la cónica.
• a0 + a1 + a2 + a3 + a4 + a5 = 0 si y sólo si el punto (1 : 1 : 1) pertenece a la cónica.
Por tanto, L se interpreta dentro del conjunto de las cónicas de P2k como el subconjunto
de aquéllas que pasan por los puntos (1 : 0 : 0), (0 : 1 : 0), (0 : 0 : 1), (1 : 1 : 1). La
parametrización anterior de L nos está diciendo que cualquier cónica que pase por dichos
puntos se puede escribir de la forma
t0 (X0 X1 − X1 X2 ) + t1 (X0 X2 − X1 X2 ).
Obsérvese que se obtiene entonces una combinación lineal genérica del par de rectas
X1 (X0 − X2 ) (que son las rectas que pasan respectivamente por (1 : 0 : 0), (0 : 0 : 1)
y por (0 : 1 : 0), (1 : 1 : 1)) y del par de rectas X2 (X0 − X1 ) (que son las rectas que pasan
respectivamente por (1 : 0 : 0), (0 : 1 : 0) y por (0 : 0 : 1), (1 : 1 : 1)).
Definición. Se llama haz de cónicas a un subconjunto L de cónicas de P2k , que, visto como
subconjunto de P5k , forme una recta L ⊂ P5k .
Observación 6.6. Identificaremos, como en el ejemplo anterior, el conjunto de cónicas
con P5k . Para cualquier punto p = (b0 : b1 : b2 ), el conjunto Hp de las cónicas que pasan
por p tiene ecuación b20 a0 + b0 b1 a1 + b0 b2 a2 + b21 a3 + b1 b2 a4 + b22 a5 = 0, que es un hiperplano
en P5k (el recı́proco no es cierto: es un simple ejercicio ver que, por ejemplo, el hiperplano
a1 = 0 no corresponde a las cónicas que pasan por algún punto). Por tanto, uno se espera
56
que las cónicas que pasan por cuatro puntos (al ser la intersección de cuatro hiperplanos
de P5k ) sea un subconjunto proyectivo de dimensión uno, es decir, un haz. El siguiente
resultado da la respuesta completa.
Proposición 6.7. Sean p1 , p2 , p3 , p4 ∈ P2k cuatro puntos distintos. Entonces:
(i) El conjunto de cónicas que pasan por p1 , p2 , p3 es un subconjunto proyectivo de P5k de
dimensión dos.
(ii) El conjunto de cónicas que pasan por p1 , p2 , p3 , p4 forma un haz si y sólo si no existe
una recta que pase por p1 , p2 , p3 , p4 .
Demostración: La idea para demostrar (i) es aplicar sucesivamente el Lema 6.4 para
calcular la dimensión del subconjunto Hp1 ∩ Hp2 ∩ Hp3 (que es precisamente el conjunto
de cónicas que pasan por p1 , p2 , p3 ). En primer lugar, Hp1 es un hiperplano, luego tiene
dimensión cuatro. Claramente Hp1 no está contenido en Hp2 (basta tomar una recta doble
que pase por p1 y que no pase por p1 ), ası́ que el Lema 6.4 implica que Hp1 ∩ Hp2 tiene
dimensión tres. De nuevo, Hp1 ∩ Hp2 no está contenido en el hiperplano Hp3 (tómese por
ejemplo un par de rectas, una que pase por p1 y no por p3 y otra que pase por p2 y no
por p3 ), con lo que el Lema 6.4 nos dice ahora que Hp1 ∩ Hp2 ∩ Hp3 tiene dimensión dos,
lo que demuestra (i).
Para demostrar (ii), supongamos en primer lugar que no existe ninguna recta que
contenga a p1 , p2 , p3 , p4 . Por tanto, el punto p4 no puede estar al mismo tiempo en las
rectas p1 p2 , p1 p3 , p2 p3 . Sin pérdida de generalidad, podemos suponer por ejemplo que p4
no está en p1 p2 . Tomando entonces la cónica formada por la recta p1 p2 y cualquier recta
que pase por p3 pero no por p4 , se concluye que Hp1 ∩ Hp2 ∩ Hp3 no está contenido en
Hp4 . Aplicando una vez más el Lema 6.4, se concluye que Hp1 ∩ Hp2 ∩ Hp3 ∩ Hp4 tiene
dimensión uno, luego es efectivamente un haz de cónicas.
Si en cambio suponemos que p1 , p2 , p3 , p4 están todos en una recta de ecuación u0 X0 +
u1 X1 + u2 X2 = 0, entonces todas las cónicas de la forma t0 (u0 X02 + u1 X0 X1 + u2 X0 X2 ) +
t1 (u0 X0 X1 +u1 X12 +u2 X1 X2 )+t2 (u0 X0 X2 +u1 X1 X2 +u2 X22 ) = 0 pasan por p1 , p2 , p3 , p4 .
Esto da un subespacio de P5k de ecuaciones paramétricas

a0



a


 1
a2
a3





 a4
a5
= u 0 t0
= u 1 t0
= u 2 t0
=
=
=
+ u 0 t1
+ u 0 t2
u 1 t1
u 2 t1
57
+ u 1 t2
u 2 t2


u0 0
0
 u1 u0 0 


 u2 0 u0 
Dado que la matriz de coeficientes 
 tiene claramente rango tres (ya que
 0 u1 0 


0 u2 u1
0
0 u2
u0 , u1 , u2 no son todos nulos), estas ecuaciones definen un subespacio vectorial de dimensión
tres de k 5 y por tanto un subespacio proyectivo de dimensión dos de P5k . Esto demuestra que
el conjunto de cónicas que pasan por p1 , p2 , p3 , p4 no es un haz (y de hecho es exactamente
un subespacio proyectivo de dimensión dos de P5k , ya que Hp1 ∩ Hp2 ∩ Hp3 ∩ Hp4 está
contenido en Hp1 ∩Hp2 ∩Hp3 , que por (i) tiene dimensión dos; esto demuestra que, además,
las cónicas que pasan por p1 , p2 , p3 , p4 consisten en un par de rectas, una de las cuales es
la que contiene a p1 , p2 , p3 , p4 ).
La pregunta natural es: ¿Son todos los haces de cónicas de la forma anterior (es decir,
conjuntos de cónicas que pasan por cuatro puntos no alineados)? Para responder a eso,
damos primero la siguiente:
Definición. Se llama base de un haz de cónicas al conjunto de puntos de
todas las cónicas de un haz.
P2k que están en
Lema 6.8. Sea A ⊂ P5k un haz de cónicas. Entonces, dadas dos cónicas cualesquiera de
C1 , C2 ∈ A, la base de A es C1 ∩ C2 . Por tanto, la base de A o bien es un conjunto finito
de a lo más cuatro punto, o bien es una recta y un punto o bien es una recta.
Demostración: Evidentemente, como los puntos de la base de A están en cada cónica del
haz, en particular están en C1 y C2 , luego están en C1 ∩ C2 . Recı́procamente, sea p un
punto de la intersección de C1 y C2 . Si F1 , F2 ∈ k[X0 , X1 , X2 ] son ecuaciones de C1 y C2
respectivamente, se tendrá que F (p1 ) = F (p2 ) = 0. Por tanto, como cualquier cónica de
A tiene de ecuación t0 F1 + t1 F2 y evidentemente t0 F1 (p) + t1 F2 (p) = 0, entonces p está
también en cualquier cónica del haz.
Para ver cómo puede ser la base de A, supongamos en primer lugar que A contiene
una cónica no degenerada C1 . Si es imaginaria, entonces claramente la base del haz es el
conjunto vacı́o. Si C1 no es imaginaria, entonces se puede parametrizar, y al cortar con
cualquier otra cónica del haz obtenemos cuatro puntos (contados con multiplicidad, luego
el número de puntos distintos puede ser menor que cuatro).
Supongamos en cambio que todas las cónicas de A son degeneradas. Si todas fueran
rectas dobles, entonces es claro que la base del haz serı́a exactamente un punto (el de
intersección de dos de las rectas dobles cualesquiera del haz). Si en cambio existe un par
de rectas L1 ∪ L2 en A, entonces otro par de rectas en A o bien consiste en dos rectas
58
ambas distintas a L1 , L2 (con lo que la base del haz será un conjunto de a lo más cuatro
puntos) o bien será la unión de, por ejemplo, L1 con otra recta L2 (en cuyo caso la base
de A es L1 más el punto de intersección de L2 y L2 , que podrı́a estar dentro de L1 .
Observación 6.9. No es difı́cil construir ejemplos de haces de cónicas para cada una de
las posibles bases dadas por el resultado anterior. Obsérvese que, en los casos en que la
base del haz es un conjunto de puntos, en realidad se puede considerar que salen siempre
cuatro puntos, si se incluyen los imaginarios y también la multiplicidad. Por ejemplo, la
base del haz de cónicas reales
t0 (X0 X2 − X12 ) + t1 (X02 + X12 ) = 0
consiste en el punto (0 : 0 : 1), contado con multiplicidad dos, y en los puntos imaginarios
(1 : i : −1), (1 : −i : −1) (al sustituir la parametrización (s20 : s0 s1 : s21 ) de la primera
cónica se obtiene s20 (s20 + s21 )). Si la base del haz es una recta L1 y un punto p fuera de ella,
tomando p1 , p2 , p3 ∈ L, el haz se puede describir como el conjunto de cónicas que pasan
por p1 , p2 , p3 , p. Si en cambio el haz de cónicas son los pares de rectas tales que una de las
rectas es L y la otra pasa por un punto p ∈ L, entonces, tomando p1 , p2 ∈ L distintos de p,
se podrı́a ver el haz como el conjunto de cónicas que pasan por p1 , p2 y “pasan dos veces”
por p. Por tanto, en cualquiera de los casos un haz se puede describir como el conjunto de
cónicas que pasan por cuatro puntos, aunque alguno cuente varias veces o sea imaginario.
Observación 6.10. Nótese que todos los haces de cónicas contienen cónicas degeneradas.
La mejor forma de verlo es con un ejemplo. Si consideramos el haz de la observación
anterior, la matriz de una cónica del haz será


t0
0
t1
2
 0 t0 − t 1 0 
t0
0
0
2
luego la cónica será degenerada si y sólo si la matriz tiene determinante cero, es decir,
t0 2
(t0 − t1 ) = 0, que nos da las soluciones (t0 : t1 ) = (0 : 1) con multiplicidad dos
2
y (t0 : t1 ) = (1 : 1), que dan respectivamente las cónicas X02 + X12 = 0 (par de rectas
imaginarias conjugadas) y X0 (X0 + X2 ) = 0 (par de rectas reales). En principio, puede
parecer extraño que el último par de rectas pase con multiplicidad dos por (0 : 0 : 1), ya
que sólo la rectas X0 = 0 pasa por ese punto. En realidad, es que el hecho de pasar con
multiplicidad dos por un punto es más sofisticado de la idea intuitiva que hemos dado. Por
ejemplo, en este caso, las cónicas del haz pasan por (0 : 0 : 1) con recta tangente X0 = 0,
es decir, que pasan por el punto y por otro “infinitamente próximo” en esa dirección (otra
forma de decirlo, para incluir también las cónicas degeneradas, es que la recta X0 = 0
corta a las cónicas del haz en (0 : 0 : 1) con multiplicidad dos).
59
En general, el determinante de la matriz de la cónica general del haz es o bien idénticamente
nulo (si todas las cónicas del haz son degeneradas) o bien homogéneo de grado tres en t0 , t1 ,
con lo que da tres soluciones contadas con multiplicidad. Por ejemplo, en el caso más
general del haz de cónicas que pasan por cuatro puntos p1 , p2 , p3 , p4 tales que no hay tres
alineados, hay tres cónicas degeneradas, que son los pares de rectas p1 p2 ∪ p3 p4 , p1 p3 ∪ p2 p4
y p1 p4 ∪ p 2 p3 .
Estudiamos ahora la dualidad en el espacio proyectivo, que no es sino la traducción
de la dualidad en espacios vectoriales.
Teorema 6.11. Sea P(V ) un espacio vectorial de dimensión n. Para cada subespacio
proyectivo Λ ⊂ P(V ) definimos
Ω(Λ) := {H ∈ P(V )∗ | Λ ⊂ H}
y para cada subespacio proyectivo A ⊂ P(V )∗ definimos
Ω∗ (A) :=
H.
H∈A
Entonces:
(i) Si dim Λ = r, entonces Ω(Λ) es un subespacio proyectivo de
n − r − 1.
P(V )∗
de dimensión
P(V )
de dimensión
(ii) Si dim A = s, entonces Ω∗ (A) es un subespacio proyectivo de
n − s − 1.
(iii) Ω y Ω∗ definen biyecciones entre el conjunto de subespacios proyectivos de P(V ) y el
conjunto de subespacios proyectivos de P(V ) que son inversas la una de la otra.
(iv) Si Λ, Λ son subespacios proyectivos de P(V ), entonces Ω(Λ ∩ Λ ) =< Ω(Λ), Ω(Λ ) >
y Ω(< Λ, Λ >) = Ω(Λ) ∩ Ω(Λ ).
(v) Si A, A son subespacios proyectivos de P(V )∗, entonces Ω∗ (A∩A ) =< Ω∗ (A), Ω∗ (A ) >
y Ω∗ (< A, A >) = Ω∗ (A) ∩ Ω∗ (A ).
Demostración: A lo largo de la demostración supondremos fijada una base de V , con lo
que trabajaremos con coordenadas respecto de esa base.
Para demostrar (i), un subespacio Λ ⊂ P(V ) de dimensión r corresponderá a un
subespacio de vectorial de V de dimensión r + 1, por lo que se podrá poner como el subespacio generado por vectores independientes (a00 , . . . , a0n ), . . . , (ar0 , . . . , arn ). Entonces,
una forma lineal u0 X0 + . . . + un Xn ∈ V ∗ define un hiperplano de P(V ) que contiene a Λ
60
si y sólo si

a00 u0 + . . . + a0n un = 0



..
.



ar0 u0 + . . . + arn un = 0.
Por tanto, éstas son las ecuaciones de Ω(Λ), por lo que representa un subespacio de P(V )∗ .
Además, como las r + 1 ecuaciones son linealmente independientes, es un subespacio dimensión n − r − 1.
Para ver (ii), supongamos que A corresponde al subespacio de de V ∗ generado por las
formas lineales independientes

H0 =u00 X0 + . . . + u0n Xn



..
.



Hs =us0 X0 + . . . + usn Xn .
Es claro que la intersección en P(V ) de los hiperplanos de A coincide con la intersección de
los hiperplanos definidos por H0 , . . . , Hs . Al ser independientes, la intersección de dichos
hiperplanos es un subespacio de P(V ) de dimensión n − s − 1.
Para la parte (iii), observemos que que para todo subespacio Λ ⊂ P(V ) se tiene
Ω∗ (Ω(Λ)) = H∈Ω(Λ) H = H⊃Λ H, que claramente contiene a Λ. Como (i) y (ii) implican
que Ω∗ (Ω(Λ)) y Λ tienen la misma dimensión, se sigue entonces la igualdad Ω∗ (Ω(Λ)) = Λ.
De la misma forma, para cualquier subespacio A ⊂ P(V )∗ se tiene la inclusión A ⊂
Ω(Ω∗ (A)) (ya que cualquier hiperplano de A contiene a Ω∗ (A), que es la intersección de
todos los hiperplanos de A), y de nuevo por (i) y (ii) es una igualdad.
De (iv) y (v) son inmediatas a partir de la definición las igualdades Ω(< Λ, Λ >) =
Ω(Λ) ∩ Ω(Λ ) y Ω∗ (< A, A >) = Ω∗ (A) ∩ Ω∗ (A ). Las otras dos se obtienen a partir de las
biyecciones Ω y Ω∗ . Por ejemplo, para demostrar la igualdad Ω(Λ ∩ Λ ) =< Ω(Λ), Ω(Λ ) >
basta demostrar la igualdad
Ω∗ (Ω(Λ ∩ Λ )) = Ω∗ (< Ω(Λ), Ω(Λ ) >).
Pero el término de la izquierda es Λ ∩ Λ por (iii), y el término de la derecha es, como
acabamos de observar, igual a Ω∗ (Ω(Λ)) ∩ Ω∗ (Ω(Λ )), que de nuevo por (iii) es igual a
Λ ∩ Λ∗ .
Definición. Llamaremos sistema lineal de hiperplanos de dimensión s a un subconjunto
proyectivo A ⊂ P(V )∗ de dimensión s. Si s = 1, al sistema lineal lo llamaremos haz de
hiperplanos. Por el teorema anterior, un sistema lineal de hiperplanos es el conjunto de
61
hiperplanos de P(V ) que contienen a un subespacio proyectivo Λ ⊂ P(V ) de dimensión
n − s − 1. Además, si M0 , . . . , Ms ∈ V ∗ son s + 1 formas lineales independientes que
definen a Λ, entonces los hiperplanos del sistema lineal Ω(Λ) son los de ecuaciones λ0 M0 +
. . . + λs Ms = 0 con λ0 , . . . , λs ∈ k.
62
7. Aplicaciones proyectivas
Ya hemos observado que para dar coordenadas en el espacio proyectivo P(V ) basta
dar una base de V y tomar coordenadas respecto de dicha base. Por ejemplo, una recta en
P2k corresponderá a un subespacio vectorial de dimensión dos de k3 , que estará generado
por dos vectores (a0 , a1 , a2 ) y (b0 , b1 , b2 ). Entonces, podemos decir que un punto de la
recta tiene coordenadas (t0 : t1 ) si es el punto (a0 t0 + b0 t1 : a1 t0 + b1 t1 : a2 t0 + b2 t1 ). En
otras palabras, dar coordenadas en la recta no es más que dar una parametrización de la
misma. Ya observamos (Observación 2.10y Teorema 2.11) que la parametrización no está
determinada por los puntos (a0 : a1 : a2 ) y (b0 : b1 : b2 ), sino que hace falta un tercer
punto. En general, habrá que añadir siempre otro punto para obtener una base:
Proposición 7.1. Sea p0 , . . . , pn+1 un conjunto de n + 2 puntos de un espacio proyectivo
P(V ) tales que no haya ningún hiperplano que contenga a n + 1 de ellos. Entonces existe
una base {v0 , . . . , vn } de V tal que
p0 =[v0 ]
..
.
pn =[vn ]
pn+1 =[v0 + . . . + vn ].
Además, cualquier otra base que verifique lo mismo es de la forma {λv0 , . . . , λvn } para
algún λ ∈ k \ {0}.
Demostración: Sean w0 , . . . , wn+1 ∈ V tales que p0 = [w0 ], . . . , pn+1 = [wn+1 ]. Como
p0 , . . . , pn no están en ningún hiperplano de P(V ), w0 , . . . , wn no están en ningún hiperplano de V , es decir, son linealmente independientes, por lo que forman una base de V .
Tendremos entonces una relación
wn+1 = λ0 w0 + . . . + λn wn
donde además λ0 , . . . , λn son todos no nulos (si fuera λi = 0, entonces los vectores
w0 , . . . , wi−1 , wi+1 . . . , wn+1 serı́an linealmente dependientes, con lo que estarı́an en un
hiperplano, luego los puntos p0 , . . . , pi−1 , pi+1 . . . , pn+1 estarı́an en un hiperplano, en contra de nuestra hipótesis). Basta tomar entonces v0 = λ0 w0 , . . . , vn = λn wn .
Supongamos ahora que tenemos v0 , . . . , vn ∈ V tales que
p0 =[v0 ]
..
.
pn =[vn ]
pn+1 =[v0 +
63
.
. . . + vn ]
Entonces extistirán µ0 , . . . , µn+1 tales que
v0 =µ0 v0
..
.
vn =µn vn
v0 + . . . + vn =µn+1 (v0 + . . . + vn ).
Sumando las n + 1 primeras igualdades y sustituyendo en la última, obtenemos
µ0 v0 + . . . + µn vn = µn+1 v0 + . . . + µn+1 vn .
Como v0 , . . . , vn forman una base (en particular son linealmente independientes) se tiene
que µ0 = . . . = µn = µn+1 , que es lo que querı́amos demostrar (llamando λ a este valor
común).
Definición. Un conjunto de puntos en posición general en un espacio proyectivo P(V ) es
un conjunto de puntos p0 , . . . , ps tales que cualesquiera pi0 , . . . , pir distintos (con r ≤ n)
generan un subespacio proyectivo de dimensión r. En otras palabras:
–Si s ≤ n, los puntos generan un subespacio de dimensión s.
–Si s ≥ n, no existe un hiperplano de
cardinal n + 1 de los p0 , . . . , ps .
P(V )
que contenga ningún subconjunto de
Se llama referencia proyectiva de P(V ) a un conjunto ordenado de n + 2 puntos en posición
general. Se llama base asociada a una referencia proyectiva a cualquiera de las bases que
proporciona el Teorema 7.1.
Corolario 7.2. Sea P(V ) un espacio proyectivo de dimensión n y sea R una referencia
proyectiva de P(V ). Entonces la aplicación ϕR : Pnk → P(V ) que asocia a cada (a0 : . . . : an )
el punto de P(V ) que corresponde a un vector v ∈ V de coordenadas (a0 , . . . , an ) respecto
de una base asociada a R está bien definida y es biyectiva.
Demostración: Sea B = {v0 , . . . , vn } una base asociada a R. Tenemos entonces un isomorfismo ψB : k n+1 → V de espacios vectoriales que asocia a cada (a0 , . . . , an ) el vector
a0 v0 + . . . + an vn . Entonces debe ser ϕR (a0 : . . . : an ) = [ψB (a0 , . . . , an )], con lo que
para estar bien definido hay que ver que este valor no depende ni del representante de
(a0 : . . . : an ) ni de la base asociada B.
En primer lugar, si (a0 : . . . : an ) = (a0 : . . . : an ), entonces existe λ ∈ k \ {0}
tal que (a0 , . . . , an ) = µ(a0 , . . . , an ), luego ψB (a0 , . . . , an ) = λψB (a0 , . . . , an ), y por tanto
[ψB (a0 , . . . , an )] = [ψB (a0 , . . . , an )].
64
En segundo lugar, si B fuera otra base asociada a R, por el Teorema 7.1 se sigue que
existe λ ∈ k \ {0} tal que B = {λv0 , . . . , λvn }. Por tanto,
ψB (a0 , . . . , an ) = a0 λv0 + . . . + an λvn = λ(a0 v0 + . . . + an vn ) = λψB (a0 , . . . , an )
es decir, [ψB (a0 , . . . , an )] = [ψB (a0 , . . . , an )].
Definición. Dado un punto [v] ∈ P(V ), se llaman coordenadas respecto a una referencia proyectiva R = {p0 , . . . , pn , pn+1 } a ϕ−1
R ([v]), es decir, a (a0 : . . . : an ), donde
(a0 , . . . , an ) son las coordenadas de v respecto de cualquier base asociada a la referencia proyectiva. Obsérvese que las coordenadas respecto de R de los puntos p0 , . . . , pn , pn+1
son, respectivamente, (1 : 0 : . . . : 0), . . . , (0 : . . . : 0 : 1), (1 : . . . : 1). El punto pn+1 se
llama punto unidad de la referencia. Se llama referencia canónica de Pnk a la referencia
{(1 : 0 : . . . : 0), . . . , (0 : . . . : 0 : 1), (1 : . . . : 1)}.
La demostración del Corolario 7.2 se puede generalizar:
Proposición 7.3. Sean V, W dos espacios vectoriales de dimensión n + 1 sobre k. Entonces:
(i) Si ψ : V → W es un isomorfismo de espacios vectoriales, la aplicación ϕ : P(V ) →
P(W ) dada por ϕ([v]) = [ψ(v)] está bien definida y es una biyección.
(ii) Si {p0 , . . . , pn , pn+1 } es una referencia proyectiva de P(V ) y {v0 , . . . , vn } es una base
asociada, {ϕ(p0 ), . . . , ϕ(pn ), ϕ(pn+1 )} es una referencia proyectiva de P(W ) con base
asociada {ψ(v0 ), . . . , ψ(vn )}.
(iii) Dos isomorfismos ψ, ψ : V → W definen la misma aplicación ϕ : P(V ) → P(W ) si y
sólo si existe λ ∈ k \ {0} tal que ψ = λψ.
Demostración: Para demostrar (i), observamos primero que ψ(v) = 0 si v = 0, con lo
que tiene sentido hablar de [ψ(v)]. Además, [v] = [v ] si y sólo si existe λ ∈ k \ {0} tal
que v = λv, que es equivalente (por ser ψ un biyectiva) a ψ(v ) = ψ(λv); como ψ es un
homomorfismo de espacios vectoriales, ψ(λv) = λψ(v), por lo que la igualdad anterior es
equivalente a [ψ(v )] = [ψ(v)]. Esto demuestra que ϕ está bien definida y es inyectiva. La
suprayectividad de ϕ es inmediata, ya que dado [w] ∈ P(W ), por la suprayectividad de ψ
tenemos que existe v ∈ V tal que w = ψ(v). Además, como w = 0 y ψ es homomorfismo,
se sigue que v = 0. Por tanto, [w] = ϕ([v]).
La parte (ii) es una consecuencia de las igualdades
ϕ(p0 ) = ϕ([v0 ]) = [ψ(v0 )]
..
.
65
ϕ(pn ) = ϕ([vn ]) = [ψ(vn )]
ϕ(pn+1 ) = ϕ([v0 + . . . + vn ]) = [ψ(v0 + . . . + vn )] = [ψ(v0 ) + . . . + ψ(vn )]
Para la parte (iii), es claro que cualquier isomorfismo de la forma λψ define la misma
aplicación ϕ que ψ. Recı́procamente, supongamos que ψ, ψ definen la misma ϕ. Tomamos
{p0 , . . . , pn , pn+1 } una referencia proyectiva de P(V ) y {v0 , . . . , vn } una base asociada suya.
Por (ii), {ψ(v0 ), . . . , ψ(vn )} como {ψ (v0 ), . . . , ψ (vn )} son bases de W serán dos bases
asociadas de {ϕ(p0 ), . . . , ϕ(pn ), ϕ(pn+1 )}. Por la Proposición 7.1, existe λ ∈ k \ {0} tal que
ψ (v0 ) = λψ(v0 )
..
.
ψ (vn ) = λψ(vn )
lo que implica que ψ = λψ.
Definición. Se llama proyectividad entre dos espacios proyectivos P(V ) y P(W ) a una
biyección obtenida como en la Proposición 7.3 a partir de un isomorfismo entre V y W .
Se llama parametrización de un espacio proyectivo P(V ) a una proyectividad entre Pnk y
P(V ).
Teorema 7.4 (segundo teorema fundamental de la geometrı́a proyectiva). Sean P(V ) y
P(W ) dos espacios proyectivos de dimensión n y referencias respectivas {p0 , . . . , pn , pn+1 }
y {q0 , . . . , qn , qn+1 }. Entonces existe una única proyectividad ϕ : P(V ) → P(W ) tal que
ϕ(pi ) = qi para i = 0, . . . , n + 1.
Demostración: Supongamos que ϕ venga definida a partir de un isomorfismo ψ : V → W
y veamos que ψ es único salvo multiplicación por constante. Si {v0 , . . . , vn } es una base
asociada a {p0 , . . . , pn , pn+1 }, entonces por la Proposición 7.3(ii), {ψ(v0 ), . . . , ψ(vn )} es una
base asociada a {q0 , . . . , qn , qn+1 }. Como por la Proposición 7.1 existen bases asociadas
a {q0 , . . . , qn , qn+1 } y todas son proporcionales entre ellas, existen isomorfismos ψ en esas
condiciones y todos ellos son proporcionales entre sı́.
El motivo de empezar estudiando las aplicaciones que inducen los isomorfismos vectoriales es que una aplicación lineal arbitraria F : V → W no da lugar a una aplicación
f : P(V ) → P(W ) bien definida (la definición seguirı́a siendo f ([v]) = [F (v)]). Siguiendo
la demostración de la Proposición 7.3, se observa que el problema es que, si F no es
inyectiva, existen vectores no nulos v ∈ ker F y entonces f ([v]) no está definida. Indicaremos el hecho de que una aplicación no esté definida en todos los puntos con la notación
f : P(V )-----> P(W ).
66
Definición. Se llama aplicación proyectiva entre dos espacios proyectivos P(V ) y P(W ) a
una aplicación f : P(V )-----> P(W ) definida por una aplicación lineal no nula F : V → W .
El subespacio P(ker F ) se llama centro de la aplicación proyectiva.
Ejemplo 7.5. Sea P(V ) un espacio proyectivo de dimensión n y sean Λ, Λ dos subespacios
disjuntos de dimensiones r y n − r − 1 (luego por la fórmula de Grassmann, < Λ, Λ >=
P(V ). Para cada p ∈ P(V ) \ Λ, podemos considerar el subespacio < p, Λ >, que por
la fórmula de Grassmann tiene dimensión r + 1. De nuevo por la fórmula de Grassmann,
dim(< p, Λ > ∩Λ ) = 0, es decir, es un punto p . Veamos que la aplicación f : P(V )\Λ → Λ
es proyectiva (y se llama proyección lineal de centro Λ sobre Λ ).
Sean W, W los subespacios vectoriales de V que corresponden respectivamente a Λ, Λ .
Como Λ ∩ Λ = ∅, se tiene W ∩ W = 0, y como dim W = r + 1 y dim W = n − r
se sigue que V = W + W . Entonces, para cada v ∈ W se puede escribir de forma
única v = w + w , con w ∈ W y w ∈ W \ {0}. Por tanto, se tiene w = v − w, que
claramente está en L[v] + W . En otras palabras, el punto [w ] de P(V ) está tanto en
< [v], Λ > como en P(W ). Como hemos visto que si [v] ∈ P(V ) \ P(W ) hay un único
punto en < [v], Λ > ∩P(W ), necesariamente es [w ], por lo que f ([v]) = [w ]. Dado que la
aplicación F : V → W que asocia a cada v el único vector w tal que v = w + w es un
homomorfismo, se sigue que f es proyectiva.
Podemos ahora generalizar la Proposición 7.3:
Proposición 7.6. Sea F : V → V un homomorfismo no nulo de espacios vectoriales y
sea f : P(V )-----> P(W ) la aplicación proyectiva inducida. Entonces
(i) Im f = P(Im F ), luego es un subespacio proyectivo de
dim P(V ) − dim(centro de f ) − 1.
P(W )
que tiene dimensión
(ii) f es suprayectiva si y sólo si F es suprayectiva.
(iii) f es inyectiva (donde está definida) si y sólo si F es inyectiva, es decir, si y sólo si el
centro de f es vacı́o (y por tanto f está definida en todo P(V )).
(iv) f es una proyectividad si y sólo si F es un isomorfismo.
(v) Otro homomorfismo no nulo F : V → W define la misma aplicación proyectiva f si y
sólo si existe λ ∈ k \ {0} tal que F = λF .
Demostración: Para demostrar (i), basta observar que los elementos de Im f son los
elementos de la forma f ([v]), con v ∈ V \ ker F , es decir, los elementos de la forma
[F (v)] con F (v) = 0, es decir, los elementos de P(Im F ). La fórmula de la dimensión es
consecuencia inmediata de la igualdad dim(Im F ) = dim V − dim ker F .
La parte (ii) es inmediata a partir de (i), de la misma forma que (iv) es consecuencia
de (ii) y (iii).
67
Para ver (iii), hay que trabajar un poco más. Supongamos primero que F es inyectiva.
Entonces, si f ([v]) = f ([v ], se tiene que [F (v)] = F (v )], por lo que existe λ ∈ k \ {0}
tal que F (v ) = λF (v). Esto implica que F (v ) = F (λv), que, por la inyectividad de F
implica v = λv, es decir, [v] = [v ], con lo que f es inyectiva. Recı́procamente, supongamos
ahora que f es inyectiva y veamos que ker F = 0. Para ello, tomamos v ∈ ker F y fijamos
cualquier v ∈ V \ ker F . Entonces tendremos F (v + v ) = F (v) + F (v ) = F (v ) = 0, con
lo que tendremos f ([v + v ]) = f ([v ]). Por la inyectividad de f , existe λ ∈ k \ {0} tal que
v + v = λv . Aplicando F , tendremos F (v ) = λF (v ), y como F (v ) = 0, se tendrá λ = 1,
por lo que v = 0, lo que demuestra ker F = 0.
Finalmente, para ver (v), es evidente que dos aplicaciones lineales proporcionales
definen la misma aplicación proyectiva. Recı́procamente, supongamos que F y F definen
la misma aplicación proyectiva f : P(V )-----> P(W ). En particular, el centro de f es tanto
P(ker F ) como P(ker F ), y la imagen de f es tanto P(Im F ) como P(Im F ). Por tanto,
ker F = ker F e Im F = Im F . Sea V ⊂ V un subespacio vectorial complementario de
ker F , es decir, V = ker F ⊕ V y sea W = Im F = Im F . Es entonces evidente que
F|V , FV : V → W son dos isomorfismos que definen la misma proyectividad f|P(W ) :
P(V ) → P(W ). Por tanto, por la Proposición 7.3(iii), existe λ ∈ k\{0} tal que F|V , λFV .
Sea ahora cualquier v ∈ V . Como V = ker F ⊕ V , podremos escribir v = v0 + v , con
v0 ∈ ker F = ker F y v ∈ V . Por tanto,
F (v) = F (v0 +v ) = F (v0 )+F (v ) = 0+λF (v) = λF (v0 )+λF (v) = λF (v0 +v ) = λF (v)
lo que demuestra que F = λF .
El resultado anterior nos permite dar las siguientes definiciones:
Definición. Se llama matriz de una aplicación proyectiva f : P(V )-----> P(V ) respecto de un
par de sistemas de referencia R, R de P(V ) y P(W ) a una matriz de una aplicación lineal
F : V → W que induzca f respecto a un par de bases B, B asociadas a R, R . Esta matriz
será única salvo multiplicación por constante. Dadas dos referencias proyectiva R, R de
un mismo espacio proyectivo, se llama matriz de cambio de referencia a una matriz de la
aplicación identidad en P(V ) respecto de las referencias R, R .
Ejemplo 7.7. Si tenemos una proyectividad entre dos espacios proyectivos P(V ) y P(W ),
entonces sabemos que una referencia R de P(V ) va a parar a una referencia R de P(W ).
Por tanto, la matriz de la proyectividad respecto de R y R es la identidad, es decir, el
punto de coordenadas (x0 : . . . : xn ) respecto de R va a parar al punto de coordenadas
(x0 : . . . : xn ) respecto de R . Recı́procamente, si tenemos una aplicación f : P(V ) →
P(W ) y un par de referencias proyectivas, R de P(V ) y R de P(W ), tal que el punto de
68
coordenadas (x0 : . . . : xn ) respecto de R va a parar al punto de coordenadas (x0 : . . . : xn )
respecto de R , entonces f es una proyectividad. En efecto, si {v0 , . . . , vn } y {w0 , . . . , wn }
son bases asociadas a R y R respectivamente, se tendrá que f corresponde al isomorfismo
V → W que manda el vector x0 v0 + . . . + xn vn al vector x0 w0 + . . . + xn wn .
Observación 7.8. Nótese que el segundo teorema fundamental de la geometrı́a proyectiva
es la generalización del Teorema 2.20, que es el que permitı́a definir razón doble de cuatro
puntos de una recta del plano proyectivo. Por tanto, tiene sentido dar la misma definición
de razón doble para cuatro puntos alineados en cualquier espacio proyectivo, y se tendrá
también el análogo del Teorema 3.4, es decir, que una aplicación inyectiva entre dos recta
es una proyectividad si y sólo si conserva la razón doble. En el leguaje de coordenadas,
se puede interpretar de otro modo. Dados cuatro puntos a, b, c, d de una recta L, la única
parametrización P1k → L que manda respectivamente (1 : 0), (0 : 1), (1 : 1) a los puntos
a, b, c es precisamente la proyectividad que consiste en tomar coordenadas respecto a la
referencia R = {a, b, c}. Entonces, si (ρ0 : ρ1 ) son las coordenadas homogéneas de d
respecto de R, la razón doble es por definición [a, b, c, d] = ρρ01 .
La fórmula de cálculo de la razón doble que dimos en el Lema 3.1 se puede generalizar.
La forma más sencilla de escribirla es que, dados a, b, c, d en una recta L, tomando cualquier
referencia proyectiva R sobre L, si las coordendas de a, b, c, d son respectivamente (a0 :
a1 ), (b0 : b1 ), (c0 : c1 ), (d0 : d1 ), entonces
a0
a1
[a, b, c, d] = a0
a1
c0 b0 d0 c1 b1 d1 .
d0 b0 c0 d1 b1 c1 Esto es simplemente porque la aplicación φR : P1k → L dada por las coordenadas respecto
de R es una proyectividad, luego conserva la razón doble.
El hecho de que la conservación de la razón doble caracterice las proyectividades
de rectas es precisamente el hecho de que las proyectividades están caracterizadas por
conservar coordenadas. En efecto, supongamos que tenemos una aplicacióon inyectiva f :
L → L entre dos rectas, y sean a, b, c ∈ L puntos distintos. Como f es inyectiva, entonces
f (a), f (b), f (c) son también distintos. Tenemos entonces una referencia R = {a, b, c} de L
y otra {f (a), f (b), f (c)} de L . Según el Ejemplo 7.7, f será una proyectividad si y sólo si
transforma cada punto de coordenadas (ρ0 : ρ1 ) respecto de R en el punto de coordenadas
(ρ0 : ρ1 ) respecto de R , lo que es equivalente a que f conserve la razón doble.
Esta última observación se puede generalizar a espacios proyectivos de dimensión
arbitraria, y nos permite caracterizar las proyectividades en términos exclusivamente de
geometrı́a proyectiva, sin necesidad de usar espacios vectoriales:
69
Teorema 7.9. Sea f : P(V ) → P(W ) una aplicación inyectiva entre espacios proyectivos.
Entonces f es una proyectividad entre P(V ) y f (P(V )) si y sólo si manda puntos alineados
en puntos alineados y conserva la razón doble de cuaternas de puntos alineados.
Demostración: Lo demostraremos por inducción sobre n = dim P(V ). Si n = 1, entonces
P(V ) es una recta, y por hipótesis su imagen está contenida en una recta, por lo que este
caso es el Teorema 3.4 (que acabamos de redemostrar en la Observación 7.8).
Supongamos ahora que n > 1 y que hemos demostrado el resultado para aplicaciones
que parten de un espacio proyectivo de dimensión n − 1. Obsérvese primero que una
implicación es inmediata: si f es una proyectividad sobre la imagen, manda rectas a
rectas, y la restricción a ellas es una proyectividad, luego conserva la razón doble.
Para la otra implicación, fijemos R = {p0 , p1 , . . . , pn , pn+1 }, una referencia proyectiva
de P(V ). Para cada i, j ∈ {0, 1, . . . , n, n + 1}, sean Λij =< p0 , . . . , p̂i , . . . , p̂j , . . . , pn+1 >
y pij =< pi , pj > ∩Λij . Por hipótesis de inducción, cada f|Λij es una proyectividad
sobre f (Λij ), que será un subsespacio de dimensión n − 1. Como f es inyectiva, entonces
f (pi ), f (pj ) son distintos y ninguno de ellos está en f (Λij ). Se tendrá, por tanto, f (pij ) =
< f (pi ), f (pj ) > ∩f (Λij ) y, en particular, f (P(V )) estará contenido en el subespacio
< f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) >=< f (Λij ), f (pi ), f (pj ) >, que tiene dimensión n.
El hecho de que cada f|Λij sea una proyectividad sobre F (Λij ) implica que los puntos
f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) están en posición general, y forman una referencia proyectiva de < f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) >. Consideramos entonces la única proyectividad F : P(V ) →< f (p0 ), f (p1 ), . . . , f (pn ), f (pn+1 ) > que manda cada pi a f (pi ). Veamos
que F = f , lo que completarı́a la demostración.
En primer lugar, para cada i, j es claro que los puntos p0 , . . . , p̂i , . . . , p̂j , . . . , pn+1 , pij
forman una referencia proyectiva de Λij . Por tanto f|Λij es la única proyectividad que
ˆ i ), . . . , f (p
ˆ j ), . . . , f (pn+1 ), f (pij ). Como F|Λ tammanda esa referencia en f (p0 ), . . . , f (p
ij
bién verifica lo mismo (para pij se hace como para f ), entonces f|Λij = F|Λij . Por tanto,
f (p) = F (p) para cualquier punto p ∈ P(V ) que esté en algún Λij .
Por otra parte, si un punto p ∈ P(V ) no está en ningún Λij , consideramos los puntos
p =< p, pn+1 > ∩Λ0,n+1 y q =< p, pn+1 > ∩Λn,n+1 . Usando que tanto f como F
conservan la razón doble, se tendrá
[f (p ), f (q ), f (pn+1 ), f (p)] = [p , q , pn+1 , p] =
= [F (p ), F (q ), F (pn+1 ), F (p)] = [f (p ), f (q ), f (pn+1 ), F (p)]
de donde se deduce (Observación 3.6) f (p) = F (p).
Observación 7.10. La hipótesis de conservar la razón doble es fundamental en el Teorema
7.9. Por ejemplo, la aplicación f : P2C → P2C definida por f (x0 : x1 : x2 ) = (x̄0 : x̄1 : x̄2 )
70
es claramente biyectiva, y la imagen de la recta de ecuación u0 x0 + u1 x1 + u2 x2 = 0 es la
recta de ecuación ū0 x0 + ū1 x1 + ū2 x2 = 0. Sin embargo, no se conserva la razón doble, ya
que, por ejemplo, [(0 : 1 : 0), (1 : 0 : 0), (1 : 1 : 0), (1 : λ : 0)] = λ, mientras que en cambio
[(0 : 1 : 0), (1 : 0 : 0), (1 : 1 : 0), (1 : λ̄ : 0)] = λ̄.
Definición. Se llama aplicación semilineal de espacios vectoriales a una aplicación F :
V → W para la que existe un automorfismo de cuerpos σ : k → k tal que F (v1 + v2 ) =
F (v1 ) + F (v2 ) y F (λv) = σ(λ)F (v). Se dice también que F es σ-semilineal. Si F es un
isomorfismo, diremos que es un σ-semiisomorfismo (en cuyo caso F −1 es una aplicación
σ −1 -semilineal).
Ejemplo 7.11. Fijada una base v0 , . . . , vn de V y un automorfismo de cuerpos σ : k → k,
la aplicación F0 : V → V definida por F0 (x0 v0 + . . . + xn vn ) = σ(x0 )v0 + . . . + σ(xn )vn es
un σ-semiisomorfismo.
Lema 7.12. Sea F0 : V → V un σ-semiisomorfismo y W un espacio vectorial sobre k.
La asignación F → F ◦ F0 define una biyección entre el conjunto de aplicaciones lineales
F : V → W y el conjunto de aplicaciones σ-semilineales F : V → W .
Demostración: Si F es una aplicación lineal, entonces se tendrá
F ◦ F0 (λ1 v1 + λ2 v2 ) = F (σ(λ1 )F0 (v1 ) + σ(λ2 )F0 (v2 )) = σ(λ1 )F (F0 (v1 )) + σ(λ2 )F (F0 (v2 ))
por lo que F ◦ F0 es una aplicación σ-semilineal.
Del mismo modo, si F : V → W es una aplicación σ-semilineal, se tendrá
F ◦ F0−1 (λ1 v1 + λ2 v2 ) = λ1 F (F0−1 (v1 )) + λ2 F (F0−1 (v2 ))
por lo que F ◦ F0−1 es una aplicación lineal. Por tanto, la asignación F → F ◦ F0−1 es la
asignación inversa de la dada, con lo que ambas son biyectivas.
Podemos repetir para aplicaciones semilineales todo lo que hemos visto para aplicaciones lineales. En concreto:
Definición. Se llama aplicación semiproyectiva o aplicación σ-semiproyectiva a una aplicación f : P(V ) → P(W ) definida por una aplicación σ-semilineal V → W no nula (es decir,
f ([v]) = [F (v)]). Si F es un semiisomorfismo, diremos que f es una σ-semiproyectividad.
Por el Lema 7.12, una aplicación semiproyectiva viene caracterizada por ser la composición
de una semiproyectividad y una aplicación proyectiva.
71
Teorema 7.13 (Primer teorema fundamental de la geometrı́a proyectiva). Una aplicación
f : P(V ) → P(W ) entre espacios proyectivos de dimensión al menos dos es una semiproyectividad entre P(V ) y f (P(V )) si y sólo si manda biyectivamente rectas a rectas.
Demostración: Es claro que una semiproyectividad manda biyectivamente rectas a rectas,
ası́ que basta ver que esta propiedad caracteriza a las semiproyectividades.
Sea pues f : P(V ) → P(W ) una aplicación inyectiva que manda biyectivamente rectas
a rectas. En particular, f es inyectiva, ya que si a = b, la recta ab va biyectivamente a
otra recta, por lo que f (a) = f (b).
Veamos que, si [a1 , b1 , c1 , d1 ] = [a2 , b2 , c2 , d2 ] para dos cuaternas de puntos alineados en
P(V ), entonces también [f (a1 ), f (b1 ), f (c1 ), f (d1 )] = [f (a2 ), f (b2 ), f (c2 ), f (d2 )]. En efecto,
la condición [a1 , b1 , c1 , d1 ] = [a2 , b2 , c2 , d2 ] es equivalente a que las cuaternas a1 , b1 , c1 , d1
y a2 , b2 , c2 , d2 se obtienen una de la otra a partir de un número finito de perspectividades. Como f manda puntos alineados en puntos alineados, se tendrá también que las
cuaternas f (a1 ), f (b1 ), f (c1 ), f (d1 ) y f (a2 ), f (b2 ), f (c2 ), f (d2 ) se obtienen una de la otra
a partir de un número finito de perspectividades. Por tanto, [f (a1 ), f (b1 ), f (c1 ), f (d1 )] =
[f (a2 ), f (b2 ), f (c2 ), f (d2 )].
Podemos entonces definir una aplicación σ : k → k tomando, para cada ρ ∈ k, una
cuaterna a, b, c, d ∈ P(V ) tal que [a, b, c, d] = ρ y definiendo σ(ρ) = [f (a), f (b), f (c), f (d)]
(como casos degenerados, definimos σ(0) = 0 y σ(1) = 1). Veamos en primer lugar que σ
es un automorfismo de cuerpos.
–Dados ρ1 , ρ2 ∈ k \ {0, 1}, sean a, b, c tres puntos distintos de P(V ) que estén sobre
una misma recta L. Tomamos d ∈ L tal que [a, b, c, d] = ρ1 . Como ρ1 = 0, 1, los puntos
a, b, d son distintos, luego existe e ∈ L tal que [a, b, d, e] = ρ2 . Por la Observación 3.11
tendremos
σ(ρ1 ρ2 ) = σ([a, b, c, d][a, b, d, e]) = σ([a, b, d, e]) =
= [f (a), f (b), f (c), f (e)] = [f (a), f (b), f (c), f (d)][f (a), f (b), f (d), f (e)] = σ(ρ1 )σ(ρ2 ).
Tenemos por tanto que σ(ρ1 ρ2 ) = σ(ρ1 )σ(ρ2 ) para todo ρ1 , ρ2 ∈ k (si algún ρi = 0, 1, el
resultado es trivial).
–Veamos ahora que σ(ρ1 +ρ2 ) = σ(ρ1 )+σ(ρ2 ) para todo ρ1 , ρ2 ∈ k\{0} (el caso en que
algún ρi = 0 es trivial). En este caso, podemos tomar tres puntos distintos a, b, c ∈ P(V )
sobre una misma recta L, y puntos d1 , d2 = a tales que [a, b, c, d1 ] = ρ1 y [a, b, c, d2 ] = ρ2 .
Como P(V ) tiene dimensión al menos dos (ésta es la parte crucial en que se usa), podemos
tomar un plano que contenga a L, y el Lema 3.11 nos permite construir geométricamente
un punto d ∈ L tal que [a, b, c, d] = [a, b, c, d1 ]+[a, b, c, d2 ]. Como f manda puntos alineados
a puntos alineados, mandará la figura del Lema 3.11 en una figura idéntica en P(V ), que
72
dará entonces [f (a), f (b), f (c), f (d)] = [f (a), f (b), f (c), f (d1 )] + [f (a), f (b), f (c), f (d2 )], es
decir, σ(ρ1 + ρ2 ) = σ(ρ1 ) + σ(ρ2 ).
–Con esto tenemos que σ es un homomorfismo de grupos (y en particular inyectivo).
Para ver que es suprayectivo, sea ρ ∈ k. Tomamos L ⊂ P(V ) una recta cualquiera. Por
hipótesis, f (L) es una recta. En particular, podremos encontrar a , b , c , d ∈ f (L) tales
que [a , b , c , d ] = ρ . Sean a, b, c, d ∈ L tales que f (a) = a , f (b) = b , f (c) = c y f (d) = d
y escribamos ρ = [a, b, c, d]. Se tendrá entonces σ(ρ) = ρ .
Sea ahora g : P(V ) → P(V ) cualquier σ-semiproyectividad. Se tendrá entonces que
f ◦ g es una aplicación inyectiva que manda puntos alineados en puntos alineados, y que
además conserva la razón doble. Por el Teorema 7.9, la aplicación f ◦ g −1 es una proyectividad sobre f ◦ g −1 (P(V )) = f (P(V )), lo que implica que f es una σ-semiproyectividad
sobre f (P(V )).
−1
En el caso en que el cuerpo base es k = R, el Teorema Fundamental caracteriza
las proyectividades de un espacio proyectivo (de dimensión al menos dos) como aquellas
aplicaciones que mandan biyectivamente rectas a rectas, ya que se tiene el siguiente:
Teorema 7.14. Sea σ : R → R un automorfismo de cuerpos. Entonces σ = idR .
Demostración: Por ser un automorfismo de cuerpos, σ(1) = 1, y por tanto
. . + 1) = 1 + .n)
.. + 1 = n
σ(n) = σ(1 + .n)
para todo n ∈ N. Como σ(−1) = −1, se sigue también que σ(a) = a para todo a ∈ Z. Si
tomamos ahora q = ab ∈ Q, se tendrá
bσ(q) = σ(b)σ(q) = σ(bq) = σ(a) = a = bq
por lo que σ(q) = q para cualquier q ∈ Q.
Veamos ahora que σ conserva el orden de los reales. En efecto, si α < β, entonces
podremos escribir β − α = 2 , para algún ∈ R positivo. Por tanto
σ(β) − σ(α) = σ(β − α) = σ(2 ) = σ()2 > 0
luego σ(α) < σ(β). Veamos finalmente que σ(α) = α para cualquier α ∈ R. En efecto, en
caso contrario, se tendrı́a α < σ(α) o σ(α) < α. Veamos que el primer caso es imposible,
siendo el segundo caso análogo. Si fuera α < σ(α), como los racionales son densos en Q,
podrı́amos encontrar q ∈ Q tal que α < q < σ(α). Pero eso es imposible, ya que, según
hemos visto, la desigualdad α < q implica la desigualdad σ(α) < σ(q) = q.
73
En el caso k = C, el resultado anterior no es cierto, ya que la conjugación es un
automorfismo. No es el único automorfismo distinto de la identidad (aunque sı́ es el único
continuo). De hecho, existem infinitos automorfismos de C, aunque no son fáciles de
construir.
Damos ahora una definición que de nuevo parece artificial porque necesita pasar por
el espacio vectorial, pero que otra vez más la razón doble nos permitirá hacer de forma
intrı́nseca.
Definición. Dada una referencia proyectiva R de un espacio proyectivo P(V ), se llama
referencia dual a la única referencia proyectiva R∗ de P(V )∗ que tiene como base asociada
una base dual de una base asociada a R.
Proposición 7.15. Sea R = {p0 , . . . , pn , pn+1 } una referencia proyectiva de un espacio
proyectivo P(V ). Entonces, la referencia dual R∗ = {H0 , . . . , Hn , Hn+1 } consiste en los
hiperplanos:
H0 =< p1 , . . . , pn >
..
.
Hn =< p0 , . . . , pn−1 >
y Hn+1 es el único hiperplano que contiene a los puntos pij donde pij es el cuarto armónico
respecto de los puntos pi , pj , < pi pj > ∩ < R \ {pi , pj } >.
Demostración: Escribimos todo en coordenadas respecto de la referencia R. Entonces la
referencia dual consiste en los hiperplanos
H0 : X0 = 0
..
.
Hn : Xn = 0
Hn+1 : X0 + . . . + Xn = 0.
Evidentemente, H0 , . . . , Hn consiste en los hiperplanos del enunciado, ası́ que basta comprobar que Hn+1 es el del enunciado. Para cada i, j ∈ {0, . . . , n} (supondremos i < j), el
hiperplano < R \ {pi , pj } > tiene ecuación Xi − Xj = 0, con lo que su intersección con la
i)
j)
recta < pi , pj > tiene coordenadas (0 : . . . : 0 : 1 : 0 . . . 0 : 1 : 0 : . . . : 0), luego el punto pij
i)
j)
tiene coordenadas (0 : . . . : 0 : 1 : 0 . . . 0 : − 1 : 0 : . . . : 0). Es entonces claro queHij es el
hiperplano generado por los puntos pij .
74
Proposición 7.16. Sea f : P(V )-----> P(W ) una aplicación proyectiva que tiene matriz
A respecto de las referencias R y R . Entonces, la aplicación f ∗ : P(W )∗ -----> P(V )∗ que
asocia a cada hiperplano H ⊂ P(W ) que no contiene a Im f el hiperplano f −1 (H ) ⊂ P(V )
es una aplicación proyectiva de centro Ω(Im f ), y su matriz respecto de las referencias R∗
y R∗ es At (i.e. la matriz transpuesta de A).
Demostración: Que A sea la matriz de f respecto de R y R quiere decir que el punto de
coordenadas (x0 : . . . : xn ) respecto de R se transforma por f en el punto de coordenadas
(x0 : . . . : xm ) respecto de R , con

 
x0
x0
 .. 
.. 

.
 . =A
.
xn
xm

(7.17)
Sea ahora el hiperplano H ⊂ P(W ) de ecuación u0 X0 + . . . + um Xm
= 0 respecto de R .
Un punto de P(V ) de coordenadas (x0 : . . . : xn ) respecto a R estará en f −1 (H ) si y sólo si
u0 x0 + . . . + um xm = 0, donde (x0 : . . . : xm ) vienen dados por (7.17). Esto es equivalente
a decir que
 
x0
.
(u0 . . . um )A  ..  = 0
xn
es decir, el punto de coordenadas (x0 : . . . : xn ) pertenece al hiperplano de coeficientes
(u0 . . . un ) = (u0 . . . um )A (obsérvese que los coeficientes son todos no nulos si y sólo si
H no contiene a la imagen de f ). De aquı́ se concluye que el hiperplano de coordenadas
(u0 : . . . : um ) respecto de R∗ se transforma mediante f ∗ en el hiperplano de coordenadas
(u0 : . . . : un ) respecto de R∗ , con


u0
 ...  = A 


un

u0
.. 
. 
um
lo que demuestra el resultado.
Definición. Se llama aplicación dual de una aplicación proyectiva f : P(V )-----> P(W ) a la
aplicación f ∗ : P(W )∗ -----> P(V )∗ definida en la Proposición 7.16.
75
8. Clasificación de proyectividades
Clasificar proyectividades quiere decir encontrar una representación sencilla de ellas
respecto de alguna referencia proyectiva. Ya vimos en el Ejemplo 7.7 que, usando buenas
referencias en los espacios proyectivos de salida y llegada de la proyectividad, la matriz de
la proyectividad es más sencilla. Por tanto, plantearse el problema de una representación
sencilla sólo tiene sentido si las referencias de los dos espacios proyectivos están relacionadas
entre sı́. El caso más natural es cuando ambas referencias son iguales, es decir, cuando lo
que queremos es clasificar proyectividades de un espacio proyectivo en sı́ mismo.
Observación 8.1. Sea f : P(V ) → P(V ) una proyectividad. Si fijamos una referencia
proyectiva R de P(V ), entonces f tendrá una cierta matriz A respecto de R. Si cambiamos
la referencia R a otra R y la matriz P define el cambio de sistema de referencia, entonces
P −1 AP es (salvo proporcionalidad) la matriz de f respecto de R . Por tanto, las posibles
matrices sencillas de proyectividades estarán en clases de equivalencia de matrices por
semejanza, es decir, corresponderán a las posibles formas canónicas de Jordan.
Las formas canónicas de Jordan se calculan a partir de autovectores y autovalores.
Veamos que se trata de una noción natural en el contexto de las proyectividades:
Lema 8.2. Sea f : P(V ) → P(V ) una proyectividad determinada por un automorfismo
F : V → V . Entonces un vector v ∈ V \ {0} es un autovector de F si y sólo si [v] es un
punto invariante por f (i.e. f ([v]) = [v]).
Demostración: Recordemos que, por definición, f ([v]) = [F (v)], luego [v] es invariante
por f si y sólo si [F (v)] = [v], es decir, si y sólo si existe λ = 0 tal que F (v) = λv, es
decir, si y sólo si v es un autovector de autovalor λ (obsérvese que necesariamente todos
los autovalores de F son no nulos, por ser F un isomorfismo).
Observación 8.3. Dado que, fijada una referecia proyectiva de P(V ) la matriz de una
proyectividad de P(V ) respecto de dicha referencia es única salvo proporcionalidad, siempre
que tengamos un autovalor en k (lo que es cierto siempre que k sea algebraicamente cerrado,
por ejemplo si k = C), dividiendo por él podemos suponer que 1 es un autovalor. Esto
permite simplificar la clasificación de proyectividades.
Ejemplo 8.4. Veamos por ejemplo cuál serı́a la clasificación de las proyectividades de
una recta cuando k es un cuerpo algebraicamente cerrado, usando la simplificación de la
Observación 8.3. Suponiendo entonces que un autovalor es 1, las posibles formas canónicas
de Jordan serı́an:
76
1) Si hay un único autovalor
multiplicidad dos) y la matriz es diagonalizable, la
(con 1 0
forma canónica de Jordan serı́a
. En este caso, la proyectividad serı́a la identidad.
0 1
2) Si hayun autovalor
doble y la matriz no es diagonalizable, la forma canónica de
1 0
Jordan serı́a
.
1 1
1 0
3) Si hay dos autovalores distintos, la forma canónica de Jordan serı́a
, con
0 λ
λ = 1.
Obsérvese que si k no fuera algebraicamente cerrado (el caso natural en que pensar es
k = R), entonces tanto en el caso 1 como en el 2 el único autovalor está necesariamente
en k. Sin embargo, en el caso 3 hay que distinguir dos subcasos: que los dos autovalores
estén en k o que ambos sean imaginarios (conjugados, si k = R).
Veamos ahora la descripción geométrica de cada uno de los casos anteriores no triviales.
Lema 8.5. Sea f : L → L una proyectividad
deuna recta proyectiva L cuya matriz
1 0
. Entonces, f tiene un único punto
respecto de alguna referencia proyectiva es
1 1
invariante p0 , y se tiene que
[p0 , p, f (p), f (f (p))] = 2
para cualquier p ∈ L \ {p0 }. Por tanto, f está determinada conociendo p0 y la imagen de
un punto distinto de él.
1 0
Demostración: En las coordenadas respecto a las cuales la matriz de f es
, se tiene
1 1
inmediatamente que p0 = (0 : 1) es el único punto invariante. Un punto p distinto de p0 se
puede escribir con coordenadas (1 : a), luego f (p) tendrá coordenadas (1 : a + 1), y f (f (p))
tendrá coordenadas (1 : a+2). Se calcula entonces fácilemente que [p0 , p, f (p), f (f (p))] = 2.
Por tanto, conocidos p0 y la imagen de un punto p = p0 , la fórmula anterior permite
conocer también la imagen de f (p), con lo que tenemos la imagen de tres puntos, lo que
determina de forma unı́voca la proyectividad f .
El tercer caso lo estudiamos en una situación más general, que nos será útil más
adelante:
Lema 8.6. Sea f : P(V ) → P(V ) una proyectividad de un espacio proyectivo P(V ) de
dimensión n. Supongamos que existe una referencia proyectiva R de P(V ) en la cual f viene
77





representada por una matriz diagonal 



1

..
. r+1)
1
λ
..




 con λ = 1. Entonces,



. n−r)
λ
existen subespacios proyectivos disjuntos Λ, Λ ⊂ P(V ) de dimensiones r y n − r − 1 tales
que cada punto de ellos es invariante por f y, para cada p ∈ P(V ) \ (Λ ∪ Λ ), su imagen
f (p) está caracterizada por la condición
[p0 , p1 , p, f (p)] = λ
donde p0 =< p, Λ > ∩ Λ , p1 = Λ∩ < Λ , p >. En particular, si P(V ) es una recta, existen
puntos invariantes p0 , p1 tales que [p0 , p1 , p, f (p)] = λ para todo p = p0 , p1 .
Demostración: Tomamos coordenadas respecto de una referencia R como en la hipótesis.
Entonces, la expresión de f será de la forma
f (x0 : . . . : xn ) = (x0 : . . . : xr : λxr+1 : . . . : λxn ).
Es entonces evidente que los subespacios Λ : Xr+1 = . . . = Xn = 0 y Λ : X0 = . . . = Xr =
0 están formados por puntos invariantes. Dado un punto p = (a0 : . . . : an ) que no esté ni
en Λ ni en Λ , es fácil ver (en realidad está hecho en el Ejemplo 7.5) que
p0 = (0 : . . . : 0 : ar+1 : . . . : an ) y p1 = (a0 : . . . : ar : 0 : . . . : 0).
Tomando {p0 , p1 , p} como sistema de referencia de la recta < p0 , p1 >, es claro que f (p) =
(a0 : . . . : ar : λar+1 : . . . : λan ) tiene coordenadas (λ : 1), de lo que se sigue que
[p0 , p1 , p, f (p)] = λ.
En general, nos interesarán no sólo subespacios de puntos fijos (como en el resultado
anterior), sin más en general subespacios que se transformen en ellos mismos, pero no
necesariamente punto a punto:
Definición. Dada una proyectividad f : P(V ) → P(V ), se llama subespacio invariante a
un subespacio Λ ⊂ P(V ) tal que f (Λ) = Λ. Obsérvese que, como f (Λ) tiene la misma
dimensión que Λ, basta comprobar sólo que f (Λ) ⊂ Λ.
Para hiperplanos, la situación es bien sencilla:
78
Lema 8.7. Sea f : P(V ) → P(V ) una proyectividad y sea H ⊂ P(V ) un hiperplano.
Entonces, H es un hiperplano invariante si y sólo si es un punto invariante de la aplicación
dual f ∗ : P(V )∗ → P(V )∗ .
Demostración: Como f es biyectiva, es claro que f (H) = H si y sólo si H = f −1 (H), lo
que es equivalente a que H sea un punto fijo de f ∗ .
Observación 8.8. Dada una proyectividad f : P(V ) → P(V ) definida por una matriz
A respecto de una referencia R, la aplicación dual viene dada por la matriz At respecto
de la referencia dual R∗ (Proposición 7.16). Recuérdese que la forma canónica de Jordan
de A está determinada a partir de los rangos de las potencias (A − λI)i , que son iguales
a los rangos de (At − λI)i , luego A y At tienen la misma forma canónica de Jordan. En
particular, hay una biyección entre el conjunto de puntos invariantes y el de hiperplanos
invariantes (incluso autovalor a autovalor). Veamos a continuación cómo usar esto de modo
práctico.
P3R
→ P3R la proyectividad definida, respecto de la referencia

0 −1 0
0
0
0 
1 2
canónica, por la matriz 
. Nuestro objetivo es calcular todos los subes0 0 −1 0
0 0
0 −1
pacios invariantes por f . Un simple cálculo muestra que los autovalores son ±1 (cada uno
doble) y que, para el autovalor λ = 1, se obtiene el punto invariante (1 : −1 : 0 : 0)
y para λ = −1 se obtiene la recta X0 = X1 = 0 de puntos invariantes. Un modo de
obtener subespacios invariantes es considerando subespacios generados por subespacios
invariantes. En nuestro caso, el único plano que se obtiene ası́ es el plano X0 + X1 =
0, generado por todos los puntos invariantes que hemos encontrado. Sin embargo, por
la observación anterior sabemos que tiene que haber infinitos planos invariantes. Para
calcularlos, transponemos la matriz anterior y calculamos los subespacios propios. Para
λ = 1 obtenemos (u0 : u1 : u2 : u3 ) = (1 : 1 : 0 : 0), es decir, de nuevo el plano X0 +X1 = 0.
∗
Si en cambio calculamos el subespacio propio de λ = −1, obtenemos la recta de P3R de
ecuaciones U0 = U1 = 0, que corresponde al haz de planos de P3R que contienen a la recta
X2 = X3 . Veamos ahora cómo podemos encontrar rectas invariantes a partir de los puntos
y planos invariantes ya hallados:
Ejemplo 8.9.
Sea f :

1) La recta X0 = X1 = 0 de puntos invariantes es evidentemente invariante.
2) La recta X2 = X3 = 0 es invariante por ser intersección de planos invariantes.
3) Todas las rectas del plano X0 + X1 = 0 que pasan por el punto (1 : −1 : 0 : 0) son
invariantes, ya que están generadas por (1 : −1 : 0 : 0) y su intersección con X0 = X1 = 0
(que es necesariamente un punto, distinto de (0 : 1 : 0 : 0) y además invariante). Estas
79
rectas también pueden verse como la intersección del plano invariante X0 + X1 = 0 con un
plano que contenga a X2 = X3 (y por tanto también invariante).
Éstas son todas las formas de obtener rectas invariantes a partir de intersecciones de planos
invariantes o como rectas generadas por dos puntos invariantes, pero en principio podrı́an
no ser todas (como pasaba con los planos invariantes obtenidos a partir de los puntos
invariantes). Un modo más exhaustivo de encontrar rectas invariantes es el de restringir la
proyectividad a un plano invariante y calcular todos los hiperplanos invariantes de dicha
restricción. Veamos lo que obtenemos en nuestro caso:
–Si restringimos al plano X0 + X1 = 0, tomamos en él coordenadas x1 , x2 , x3 (usando
que x0 = −x1 ), y tendremos entonces la expresión
(−x1 : x1 : x2 : x3 ) → (−x1 : x1 : −x2 : −x3 )
o, en forma matricial,


1
x1
 x2  →  0
x3
0

0
−1
0
 
0
x1


x2  .
0
x3
−1
El autovalor λ = 1 de esta nueva matriz nos da el punto y la recta invariante de coordenadas
(1 : 0 : 0), que son respectivamente el punto (−1 : 1 : 0 : 0) (que ya sabı́amos que era
invariante) y la recta X0 = X1 = 0 (que también sabı́amos que era invariante). Por otra
parte, el autovalor λ = −1 nos da como puntos invariantes los de la recta de ecuación
X1 = 0 (dentro del plano X0 + X1 = 0, es decir, de nuevo la recta X0 = X1 = 0), y como
rectas invariantes las que verifican la ecuación U1 = 0, es decir, las que pasan por el punto
de coordenadas (1 : 0 : 0), que son precisamente las rectas de X0 + X1 = 0 que pasan por
(−1 : 1 : 0 : 0) (que de nuevo ya sabı́amos que eran invariantes).
–Si restringimos a un plano que contenga a la recta X2 = X3 = 0, las cuentas son más
complicadas porque tenemos infinitos de estos planos, y deberı́amos hacer depender todo
de un parámetro. Para evitar dichas cuentas, utilizaremos la Observación 8.8. Fijemos en
primer lugar un plano Π que contenga a la recta X2 = X3 = 0. Los puntos invariantes de
f|Π ya los sabemos, ya que son los puntos de intersección de Π con el conjunto de puntos
invariantes de f . Obtenemos entonces que f|Π tiene exactamente dos puntos invariantes:
el punto (1 : −1 : 0 : 0) y la intersección de Π con la recta X0 = X1 = 0 (que es sólo
un punto, ya que en caso contrario Π contendrı́a a toda la recta X0 = X1 = 0, aparte
de a la recta X2 = X = 3 = 0, que sin embargo generan todo P3R ). Por tanto, por la
Observación 8.8, f|Π tiene exactamente dos rectas invariantes. Como ya conocemos dos
(la recta X2 = X3 = 0 y la intersección de Π con X0 + X1 = 0), ya sabemos que no hay
más.
Si supiéramos que todas las rectas invariantes están contenidas en algún plano invariante, en el ejemplo anterior habrı́amos encontrado todas las rectas invariantes. Veamos
80
que, en efecto, es ası́:
Lema 8.10. Sea f : P(V ) → P(V ) una proyectividad de espacios proyectivos sobre un
cuerpo algebraicamente cerrado k. Entonces cada subespacio invariante contiene un punto
invariante y está contenido en un subespacio invariante.
Demostración: Veamos primero que cada subespacio invariante contiene un punto invariante. En efecto, si Λ ⊂ P(V ) es un subespacio invariante por f , entonces f|Λ es una
proyectividad de Λ en sı́ mismo. Como k es algebraicamente cerrado, cualquier endomorfismo que induzca f|Λ tiene al menos un autovector no nulo (ya que tiene algún autovalor),
y por el Lema 8.2, f|Λ tiene algún punto invariante, es decir, Λ contiene algún punto
invariante por f .
Veamos ahora que existe algún hiperplano invariante que contiene a Λ. En primer
lugar, observamos que, como f (Λ) = Λ (o equivalentemente f −1 (Λ) = Λ), entonces para
cualquier hiperplano H que contenga a Λ se tiene que f −1 (H) también contiene a Λ. Esto
quiere decir que Ω(Λ) es un subespacio invariante de la proyectividad f ∗ : P(V )∗ → P(V )∗ .
Por la parte que acabamos de demostrar, existirá H ∈ Ω(Λ) invariante por f ∗ , es decir, H
es un subespacio invariante de f que contiene a Λ.
Observación 8.11. El lector puede pensar que el lema anterior no se puede aplicar al
Ejemplo 8.9, porque R no es algebraicamente cerrado. Sin embargo, como R está dentro
de C, que es algebraicamente cerrado, y en realidad hemos calculado todos los subespacios
invariantes de la proyectividad de P3C en sı́ mismo definida por la misma matriz, f no tiene
más rectas invariantes (ni siquiera imaginarias). Un buen ejemplo de esta observación es
considerar la proyectividad de P3R en sı́ mismo definida por la matriz

0
 −1

1
0
1 0
0 0
0 0
0 −1

0
0
.
1
0
Es un simple cálculo comprobar que sus autovalores son λ = i, que da el punto invariante
(0 : 0 : 1 : −i) y el plano invariante X0 − iX1 = 0, y λ = −i, que da el punto invariante
(0 : 0 : 1 : i) y el plano invariante X0 + iX1 = 0. Por tanto, la proyectividad no tiene
ni puntos ni planos reales invariantes. Sin embargo, en el plano X0 − iX1 = 0 (donde
(0 : 0 : 1 : i) y (0 : 0 : 1 : −i) son puntos invariantes) tenemos las rectas invariantes
X0 = X1 = 0 y X0 − iX1 = X2 − iX3 = 0, y en el plano X0 + iX1 = 0 (donde (0 : 0 : 1 : i)
y (0 : 0 : 1 : −i) son puntos invariantes) tenemos las rectas invariantes X0 = X1 = 0 y
X0 + iX1 = X2 + iX3 = 0. Por tanto, la proyectividad tiene una recta invariante real,
que es X0 = X1 = 0 (que podı́a haberse obtenido también como la recta generada por los
81
dos puntos invariantes o como la intersección de los dos planos invariantes; nótese también
que ninguna de las rectas invariantes imaginarias podrı́an haberse obtenido directamente
a partir de los puntos y planos invariantes).
En los siguientes dos resultados estudiaremos tipos particulares de proyectividades de
un espacio proyectivo.
Definición. Una proyectividad involutiva es una proyectividad f : P(V ) → P(V ) tal que
f ◦ f = idP(V ) .
Teorema 8.12. Sea f : P(V ) → P(V ) una proyectividad y supongamos que k es algebraicamente cerrado. Entonces son equivalentes:
(i) f es una proyectividad involutiva.
(ii) Existe una referencia proyectiva de P(V ) en la que f se representa por una matriz
diagonal con sólo unos y menos unos.
(iii) Existen subespacios proyectivos disjuntos Λ, Λ ⊂ P(V ) de dimensiones r y n − r − 1
tales que cada punto de ellos es invariante y, para cada p ∈ P(V ) \ (Λ ∪ Λ ), el punto
f (p) es el cuarto armónico de los puntos < p, Λ > ∩ Λ , Λ∩ < Λ , p > y p.
Demostración:
(i) ⇒ (ii): Sea F : V → V un isomorfismo que defina a f (que como dijimos en la
Observación 8.3 podemos suponer que tiene a 1 como autovalor). La condición f ◦ f =
idP(V ) (por ser f involutiva) equivale a decir que existe λ ∈ k tal que F ◦ F = λidV . Como
1 es un autovalor de F , existirá v ∈ V \ {0} tal que F (v) = v. Por tanto, λv = F (F (v)) =
F (v) = v, lo que implica λ = 1. Entonces, la condición F ◦ F = idV puede escribirse
también como (F − idV ) ◦ (F + idV ) = 0, o equivalentemente Im(F + idV ) ⊂ ker(F − idV ).
Tomando dimensiones y usando la igualdad dim V = dim(ker(F +idV ))+dim(Im(F +idV ))
llegamos a que dim(ker(F − idV )) + dim(ker(F + idV )) ≥ dim V . Como ker(F − idV ) ∩
ker(F + idV ) = 0 (son los subespacios propios de los autovalores 1 y −1, se concluye que
V es la suma directa de ker(F − idV ) y ker(F + idV ). Tomando una base formada por la
unión de una base de ker(F − idV ) y otra de ker(F + idV ) se obtiene que la matriz de F
respecto de esa base es diagonal con unos y menos unos en la diagonal.
(ii) ⇒ (iii): Es el Lema 8.6 cuando λ = −1.
(iii) ⇒ (i): Es claro que, si p están en Λ o Λ , entonces f (f (p)) = f (p) = p, ası́ que
basta comprobar la igualdad f (f (p)) = p para puntos que no estén en Λ ∪ Λ . Si llamamos p0 =< p, Λ > ∩ Λ , p1 = Λ∩ < Λ , p >, se tiene por hipótesis [p0 , p1 , p, f (p)] =
−1 y [p0 , p1 , f (p), f (f (p))] = −1. Entonces, por la Observación 3.9, se tiene también
[p0 , p1 , f (f (p)), f (p)] = −1 y la Observación 3.6 se sigue que f (f (p)) = p
82
Teorema 8.13. Sean P(V ) un espacio proyectivo de dimensión n ≥ 2 y f : P(V ) → P(V )
una proyectividad distinta de la identidad. Entonces, si existe un hiperplano H ⊂ P(V )
de puntos invariantes, se da una de las siguientes situaciones:
(i) Existe otro punto invariante p0 ∈ H y una constante λ = 0, 1 tal que para cada
p ∈ H ∪ {p0 } se verifica que f (p) es el único punto de la recta < p0 , p > para el que
[< p0 , p > ∩H, p0 , p, f (p)] = λ.
(ii) No hay más puntos invariantes por f aparte de los de H, y conocidos un punto p1 ∈ H
y su imagen f (p1 ), si p0 =< p1 , f (p1 ) > ∩H, entonces f está determinada de la forma
siguiente (si dim P(V ) ≥ 2): para cada p ∈ H∪ < p1 , f (p1 ) >, si q =< p1 , p > ∩H, se
tiene f (p) =< p0 , p > ∩ < q, f (p1 ) >.
Demostración: El que haya un hiperplano H de puntos invariantes equivale a decir que
existe todo un hiperplano en V de vectores propios de un automorfismo de V que defina
f . Este hiperplano corresponderá entonces a un autovalor λ de multiplicidad al menos n.
Se pueden dar entonces dos casos:
Caso i) El autovalor λ tiene multiplicidad exactamente n, con lo que hay otro autovalor,
que (ver la Observación 8.3) supondremos que es 1 (por tanto, λ = 1, y tampoco es cero
por tratarse de un isomorfismo). Entonces la forma canónica de Jordan es diagonal (ya
que la dimensión del subespacio propio correspondiente a λ es precisamente n) y estamos
en el caso particular del Lema 8.6 en que r = 0, con lo que Λ es un punto p0 .
Caso ii) El autovalor λ tiene multiplicidad n + 1, y por tanto es el único autovalor (que,
de nuevo por la Observación 8.3, supondremos λ = 1. Se tiene entonces que la matriz de
Jordan J no es diagonal, pero como J − I debe tener rango uno debe ser:


1
1

J =




.


1
1
..
.
1
Sea R una referencia proyectiva de P(V ) respecto de la cual la matriz J represente a f .
Usando coordenadas respecto de R, H será el hiperplano de ecuación X0 = 0. Supongamos
que el punto p1 tenga coordenadas (1 : a1 : . . . : an ) (podemos suponer que la primera
coordenada no es nula, por no estar p1 en H). Entonces es un simple ejercicio comprobar
que f (p1 ) = (1 : a1 + 1 : a2 : . . . : an ) y que el punto p0 =< p1 , f (p1 ) > ∩H tiene
coordenadas (0 : 1 : 0 : . . . : 0) (obsérvese en particular que p0 no depende del punto p1
escogido). Tomemos ahora un punto arbitrario p ∈ H∪ < p1 , f (p1 ) >. Como acabamos
de observar, la intersección de < p, f (p) > con H debe ser el mismo punto p0 , luego f (p)
está en la recta < p0 , p >. Es también evidente que, como p está en la recta < p1 , q >,
83
entonces f (p) también está en < f (p1 ), f (q) >=< f (p1 ), q >. Como las rectas < p0 , p >
y < f (p1 ), q > son distintas (porque p no está en la recta < p0 , f (p1 ) =< p0 , p1 >) y
dos rectas distintas se cortan como mucho en un punto, se sigue que la intersección de
< p0 , p > y < q, f (p1 ) > es exactamente f (p).
Definición. Se llama homologı́a de centro p0 y eje el hiperplano H0 a una proyectividad de
P(V ) como en el teorema anterior. Una homologı́a como en el caso (i) se llama homologı́a
general, y λ se llama razón de la homologı́a. Una homologı́a como en el caso (ii) se llama
homologı́a especial.
Observación 8.14. Está claro que una homologı́a general está completamente determinada a partir del centro, eje y razón. En principio, una homologı́a especial parece determinada a partir del eje y de la imagen de un punto p1 (lo que determina automáticamente el
centro) sólo para puntos fuera de la recta < p1 , f (p1 ) >. Sin embargo, una vez conocida la
imagen de un punto p1 fuera de la recta < p1 , f (p1 ) >, haciendo jugar ahora a p1 el papel
de p1 , podemos conocer la imagen de cualquier punto fuera de < p1 , f (p1 ) >, en particular
de cualquier punto de < p1 , f (p1 ) >. Por eso es fundamental la hipótesis n ≥ 2, que hace
que en el caso n = 1 la situación sea menos completa (ver el Lema 8.5).
84
9. Correlaciones y cuádricas
La mejor forma de explicar lo que queremos hacer en este capı́tulo es revisar, con el
lenguaje de la geometrı́a proyectiva, la noción de polaridad respecto de una cónica que
vimos en el capı́tulo 4:
Ejemplo 9.1. Sea C una cónica no degenerada de P2 de ecuación


X0
(X0 X1 X2 )A  X1  = 0
X2
(donde A es una matriz simétrica no degenerada). Sea f : P2 → P2 la aplicación que
asocia a cada punto de P2 su recta polar respecto de C. Entonces, f es una proyectividad.
En efecto, si C es la cónica, sabemos que la recta polar del punto (a0 : a1 : a2 ) es


X0
(a0 a1 a2 )A  X1  = 0
X2
∗
es decir, la recta u0 X0 + u1 X1 + u2 X2 = 0, donde (u0 u1 u2 ) = (a0 a1 a2 )A. Como A es
simétrica, también podemos escribir
 
 
a0
u0
 u1  = A  a1 
u2
a2
lo que indica que f es la proyectividad de matriz A tomando la referencia canónica de
∗
y su referencia dual en P2 .
P2
Sin embargo, no todas las proyectividades de P2 en P2 son una polaridad. Por
∗
ejemplo, la proyectividad f : P2R → P2R que asocia a cada punto (a0 : a1 : a2 ) la recta
a1 X0 − a0 X1 + a2 x2 = 0 no puede ser la polaridad respecto de una cónica. En efecto, la
imagen del punto a = (0 : 1 : 1) es la recta f (a) de ecuación X0 + X2 = 0, que contiene al
punto b = (1 : 1 : −1), mientras que la imagen del punto b es la recta X0 − X1 − X2 = 0,
que no contiene al punto a. Por tanto, f no verifica la propiedad (ii) de la Proposición
4.6, por lo que no es la polaridad respecto de una cónica. El problema con este ejemplo
(como explicaremos en este capı́tulo)
 es que ftiene como matriz, respecto de las referencias
0 1 0

canónica y su dual, a la matriz −1 0 0 , que no es simétrica.
0 0 1
Una primera justificación de la observación anterior es que la polaridad respecto de
una cónica no degenerada C ⊂ P2k de matriz A se puede definir de la siguiente forma.
∗
85
Consideramos la forma bilineal B : k 3 × k 3 → k definida por


Y0
B((X0 , X1 , X2 ), (Y0 , Y1 , Y2 )) = (X0 X1 X2 )A  Y1  .
Y2
Entonces la recta polar respecto de C de un punto (a0 : a1 : a2 ) es la recta de ecuación
B((X0 , X1 , X2 ), (a0 , a1 , a2 )) = 0. En particular, el punto (b0 : b1 : b2 ) está en la recta
polar de (a0 : a1 : a2 ) si y sólo si B((b0 , b1 , b2 ), (a0 , a1 , a2 )) = 0, mientras que el punto
(a0 : a1 : a2 ) está en la recta polar de (b0 : b1 : b2 ) si y sólo si B((a0 , a1 , a2 ), (b0 , b1 , b2 )) = 0.
Por tanto, la propiedad (ii) de la Proposición 4.6 parece equivalente a que B sea una forma
bilineal simétrica, es decir, que A sea simétrica.
Nótese, finalmente, que la cónica C está determinada perfectamente por la forma
bilineal B (o, más precisamente, por su forma cuadrática asociada), ya que su ecuación es
precisamente B((X0 , X1 , X2 ), (X0 , X1 , X2 )) = 0.
En este capı́tulo nos proponemos estudiar generalización de cónica proyectiva (que,
como en geometrı́a afı́n, será la noción de cuádrica) y la noción de polaridad, que será
una aplicación proyectiva de un espacio proyectivo en su dual (pero no cualquiera, ya que
tendrá que verificar alguna condición de simetrı́a). Empezamos con una definición:
Definición. Llamaremos correlación a una aplicación proyectiva f : P(V )-----> P(V )∗ y
correlación no degenerada a una correlación que además sea una proyectividad (esta notación no es universal, y muchos autores llaman correlación a lo que nosotros llamamos
correlación no degenerada).
Observación 9.2. Veamos (por el momento en coordenadas) que la noción de correlación
f : P(V )-----> P(V )∗ no es más que la generalización a dimensión arbitraria de lo que hemos
visto en el Ejemplo 9.1. Para ello, fijamos una referencia proyectiva R de P(V ), tomamos
la referencia dual R∗ de P(V )∗ y consideramos A una matriz de f respecto de R y R∗ . Esto
quiere decir que, si un punto p (fuera del centro de f ) tiene coordenadas (a0 : . . . : an )
 
a0
.
respecto de R, entonces f (p) es el hiperplano coordenadas A  ..  respecto de R, es
an
decir, el hiperplano de ecuación


a0
.
(X0 . . . Xn )A  ..  = 0
an
respecto de R. En otras palabras, un punto de coordenadas (b0 : . . . : bn ) pertenece al
86
hiperplano f (p) si y sólo si


a0
.
(b0 . . . bn )A  ..  = 0.
an

 
a0
0
.. 
.. 


=
Obsérvese que, si p estuviera en el centro de f , entonces A
. , con lo que
.
0
an
la relación anterior se verifica para cualquier punto de coordenadas (b0 : . . . : bn ). Por
abuso de notación, diremos en tal caso que f (p) es todo P(V ). De esta forma, dar una
correlación es equivalente a dar una matriz A, y la imagen por la correlación de un punto
de coordenadas (a0 : . . . : an ) es el conjunto de puntos de coordenadas (b0 : . . . : bn ) para
los que se verifica la relación anterior.

También puede verse la correlación por medio de una forma bilineal. En efecto, basta
fijar una base asociada a la referencia R y definir B : V × V -----> k mediante
 
Y0
.
B(u, v) = (X0 . . . Xn )A  .. 
Yn
donde X0 , . . . , Xn e Y0 , . . . , Yn son respectivamente las coordenadas de u y v respecto de
dicha base. De este modo, la imagen por la correlación del punto [v] es el conjunto de
puntos de [u] que verifican B(u, v) = 0.
Dicho sin coordenadas, lo que tenemos es el siguiente resultado de Álgebra Lineal:
Proposición 9.3. Sea V un espacio vectoria sobre un cuerpo k. Entonces:
(i) Dado un homomorfismo F : V → V ∗ , la aplicación BF : V × V → k definida por
BF (u, v) = (F (v))(u) es una forma bilineal.
(ii) Dada una forma bilineal B : V × V → k, la aplicación FB : V → V ∗ definida por
FB (v) : V
u
→
→
k
B(u, v)
es una aplicación lineal.
Además, las asignaciones F → BF y B → FB definen biyecciones (una inversa de la otra)
entre el conjunto de homomorfismos V → V ∗ y el conjunto de formas bilineales V ×V → k.
Demostración: Se deja como ejercicio.
Definición. Llamaremos correlación asociada a una forma bilineal no nula B : V × V → k
a la correlación definida por el homomorfismo FB : V → V ∗ de la proposición anterior.
87
Observación 9.4. Por la Proposición 9.3, la correlación f : P(V )-----> P(V )∗ asociada a
una forma bilineal B : V × V → k está definida como
f ([v]) = {[u] ∈ P(V ) | B(u, v) = 0}.
Además, dos formas bilineales B, B definen la misma correlación si y sólo si los homomorfismos FB y FB definen la misma aplicación proyectiva. Por la Proposición 7.6(v),
esto es equivalente a que FB y FB sean proporcionales, lo que equivale a que B y B sean
proporcionales.
Proposición 9.5. Sea f : P(V )-----> P(V )∗ la correlación asociada a una forma bilineal
no nula B : V × V → k. Consideramos la forma bilineal B t : V × V → k definida
por B t (u, v) = B(v, u). Entonces la aplicación dual de f (ver Proposición 7.16) es la
aplicación f ∗ : P(V )-----> P(V )∗ asociada a B t , es decir, para todo p ∈ P(V ) se tiene que
f ∗ (p) = {q ∈ P(V ) | p ∈ f (q)}.
Demostración: Identificamos cada punto [v] ∈ P(V ) con el hiperplano Ω([v]) de P(V )∗
consistente en el conjunto de hiperplanos de P(V ) que pasan por p. Entonces, por definición
de aplicación dual, f ∗ manda [v] a la imagen inversa por f de Ω([v]), es decir al conjunto
{[u] ∈ P(V ) | [v] ∈ f ([u])}. Como f está asociada a B, se tendrá [v] ∈ f ([u]) si y sólo si
B(v, u) = 0, es decir B t (u, v) = 0, por lo que f ∗ es la correlación asociada a B t .
Definición. Llamaremos correlación dual o correlación transpuesta de una correlación f
a la aplicación f ∗ : P(V )-----> P(V )∗ del lema anterior. Nótese que, si f tiene matriz A
respecto de una referencia y su dual, entonces f ∗ tiene matriz At .
Proposición 9.6. Sea f : P(V )-----> P(V )∗ una correlación asociada a una forma bilineal
B : V × V → k. Entonces:
(i) f = f ∗ si y sólo si B es simétrica o antisimétrica.
(ii) Cada punto p ∈ P(V ) está en el hiperplano f (p) si y sólo si B es antisimétrica.
Demostración: Sabemos por la Proposición 9.5 que f ∗ está asociada a B t . Por tanto, por
la Observación 9.4, se tendrá f = f ∗ si y sólo si existe λ ∈ k \ {0} tal que B = λB t . Para
demostrar (i), basta ver que los únicos valores de λ para los que se puede dar esta igualdad
son 1 y −1. En efecto, transponiendo la igualdad y reiterando, se obtiene B t = λB =
λ(λB t ) = λ2 B t , lo que implica λ2 = 1 y por tanto λ = ±1. Esto demuestra (i).
Para demostrar (ii), la Observación 9.4 nos dice que [v] ∈ f ([v]) si y sólo si B(v, v) = 0.
Por tanto, cada punto estará en su imagen por f si y sólo si B(v, v) = 0 para todo
v ∈ V . Veamos que esta última condición es equivalente a que B sea una forma bilineal
88
antisimétrica. En efecto, si B(v, v) = 0 para todo v ∈ V , en particular se tendrá, para
cualesquiera u, v ∈ V ,
0 = B(u + v, u + v) = B(u, u) + B(u, v) + B(v, u) + B(v, v) = B(u, v) + B(v, u)
(donde hemos usado la bilinealidad de B). Por tanto, B(u, v) = −B(v, u) para cualesquiera
u, v ∈ V , es decir, B es antisimétrica.
Definición. Se llama correlación nula (o correlación antisimétrica) a una correlación f :
P(V )-----> P(V )∗ tal que p ∈ f (p) para cada p ∈ P(V ). Se llama polaridad o correlación
simétrica a una correlación f : P(V )-----> P(V )∗ que coincide con su dual f ∗ y tal que
el conjunto Q de los puntos p ∈ P(V ) para los que p ∈ f (p) no es todo P(V ). Por la
proposición anterior, tales correlaciones son, respectivamente, las correlaciones asociadas
a una forma bilineal antisimétrica y simétrica.
Ejemplo 9.7. Obsérvese que, como en una recta los hiperplanos son puntos, una correlación en una recta no es más que una aplicación proyectiva de la recta en sı́ misma. Si
f : L-----> L fuera una correlación nula en la recta L, entonces f (p) = p para todo p ∈ L,
luego p serı́a la identidad.
Observación 9.8. Nótese que, si el cuerpo k tiene caracterı́stica distinta de dos (lo que
supondremos siempre) no puede haber correlaciones nulas no degeneradas en un espacio
proyectivo de dimensión n par. El motivo es que si A es una matriz antisimétrica de orden
impar n + 1, entonces de la igualdad At = −A se sigue det A = det At = (−1)n+1 det A =
− det A, lo que implica det A = 0 (aquı́ hace falta usar que la caracterı́stica no es dos; en
caso contrario, 2 det A = 0 no implicarı́a det A = 0). En cambio, para n impar, la matriz


0 1
 −1 0








0 1
−1 0
..
.
0
−1








1
0
(donde las entradas no explicitadas son cero) es antisimétrica de orden par. En realidad,
puede demostrarse que cualquier correlación nula no degenerada admite una matriz de esa
forma respecto de un sistema de referencia adecuado.
Definición. Por abuso de notación, se suele llamar cuádrica en un espacio proyectivo P(V )
a un conjunto Q de puntos p ∈ f (p), donde f : P(V )-----> P(V )∗ es una polaridad, aunque en
89
realidad una cuádrica es una polaridad, en el sentido de que dos cuádricas se considerarán
iguales sólo si sus polaridades coinciden. Se llamará vértice de la cuádrica al centro de la
polaridad. Llamaremos rango de la cuádrica al rango de cualquier matriz que defina la
polaridad. Diremos que la cuádrica es no degenerada o no singular si el rango es máximo,
es decir, dim(V ) (equivalentemente, f es una proyectividad o, también, el lugar singular
es vacı́o).
Lema 9.9. Sea f : P(V )-----> P(V )∗ la polaridad asociada a una forma bilineal (simétrica)
B : V × V → k y sea Q ⊂ P(V ) el conjunto de puntos p ∈ P(V ) tales que p ∈ f (p).
Dado un subespacio P(W ) ⊂ P(V ) no contenido en Q, entonces la aplicación f|P(W ) :
P(W )-----> P(W )∗ definida por f|P(W ) (p) = f (p) ∩ P(W ) es la polaridad asociada a la restricción BW ×W . Además, como conjunto de puntos, esta cuádrica es la intersección de Q
con P(W ).
Demostración: Por definición, la correlación asociada a BW ×W asocia a cada [w] ∈ P(W )
el conjunto de puntos [u] ∈ P(W ) tales que BW ×W (u, w) = 0, que es precisamente f ([w]) ∩
P(W ). Además, [w] ∈ P(W ) está en el correspondiente conjunto de puntos si y sólo si
BW ×W (w, w) = 0, es decir, si y sólo si [w] ∈ Q.
Ejemplo 9.10. En coordenadas respecto de una referencia R (y su dual), la polaridad
de una cuádrica viene dada por una matriz simétrica A. Si el rango de A es r, entonces
sabemos que existe una matriz P de determinante no nulo tal que





P t AP = 




λ0
..








.
λr−1
0
..
.
0
con λo , . . . , λr−1 ∈ k \ {0} Esto quiere decir que, haciendo el cambio de coordenadas
 

X0
X0

.
 ..  = P  .. 
. ,
Xn
Xn

= 0. Por tanto:
la ecuación de la cuádrica queda λ0 X0 + . . . + λr−1 Xr−1
2
2
–Si la cuádrica tiene rango uno, su conjunto de puntos es un hiperplano, y se dice que
la cuádrica es un hiperplano doble.
90
–Si la cuádrica tiene rango dos, su conjunto de puntos es de la forma X0 + λλ10 X1 = 0.
λ1
Si − λ0 ∈ k, entonces dicho conjunto es la unión de los hiperplanos X0 + − λλ10 X1 = 0 y
X0 − − λλ10 X1 = 0, y se dice que la cuádrica es un par de hiperplanos reales (los hiperplanos
son distintos, pues λ1 = 0). Si, en cambio − λλ10 ∈ k, se dice que la cuádrica es un par de
hiperplanos imaginarios.
2
2
El resultado siguiente indica que la polaridad respecto de una cuádrica no degenerada
tiene el mismo sentido que vimos para cónicas (Proposición 4.2), aunque ahora lo haremos
sin coordenadas:
Proposición 9.11. Sea f : P(V )-----> P(V )∗ la polaridad de una cuádrica Q. Entonces,
para cualquier p ∈ Q se tiene:
(i) Una recta de f (p) que pase por p o bien está contenida en Q o corta a Q sólo en el
punto p.
(ii) Una recta que pase por p y no esté contenida en f (p) corta a Q exactamente en dos
puntos (siendo p uno de ellos).
Demostración: Sea L ⊂ f (p) tal que p ∈ L y supongamos que L contiene un punto q ∈ Q
distinto de L. Veamos entonces que L ⊂ Q, lo que demostrará (i). Observamos en primer
lugar que, como q ∈ f (p), entonces p ∈ f (q), y como q ∈ Q, entonces q ∈ f (q). Por tanto,
L ⊂ f (q), además de L ⊂ f (p) por hipótesis. Dado pues q ∈ L, se tendrá q ∈ f (p) y
q ∈ f (q), luego p, q ∈ f (q ), es decir, L ⊂ f (q ). En particular, q ∈ f (q ), es decir, q ∈ Q
como querı́amos.
Para demostrar (ii), sea ahora L una recta que pasa por p pero no está contenida en
f (p). En particular, f (p) es un hiperplano que corta a L sólo en el punto p. Consideramos
f|L : L-----> L definido en el Lema 9.9. Evidentemente, f|L (p) = f (p) ∩ L = p. Además, si
q ∈ L \ {p}, no puede ser L ⊂ f (q), ya que entonces p ∈ f (q), lo que implicarı́a q ∈ f (p),
es decir, q ∈ f (p)capL = p, que es absurdo. Por tanto, f|L (q) = f (q) ∩ L es un punto, lo
que implica que f|L es no degenerada, es decir, tiene rango dos. Por el Ejemplo 9.10, como
Q ∩ L tiene al menos el punto real p, consiste exactamente en dos puntos.
Definición. Dada una cuádrica no degenerada Q ⊂ P(V ), se llama hiperplano polar de un
punto respecto de la cuádrica a la imagen del punto respecto de la correlación f determinada
por la cuádrica (en el sentido del resultado anterior) Si p ∈ Q, llamaremos a f (p) hiperplano
tangente a la cuádrica Q en el punto p y lo denotaremos Tp Q. Más en general, se llama
subespacio polar de un subespacio Λ ⊂ P(V ) al subespacio que corresponde por dualidad
a f (Λ) ⊂ P(V )∗ . Se tiene entonces que la intersección de Q con el hiperplano polar de un
punto p es el conjunto de puntos q tales que el hiperplano tangente a Q en q pasa por p.
91
Proposición 9.12. Sea Q una cuádrica de rango r y vértice Λ0 en un espacio proyectivo
P(V ) de dimensión n. Entonces:
(i) Para cada p ∈ Q, la intersección de Q con el hiperplano tangente a Q en p es una
cuádrica en dicho hiperplano, que tiene rango r − 2 y vértice el subespacio generado
por p y Λ0 .
(ii) Los subespacios lineales contenidos en Q tienen dimensión a lo sumo
2n−r
2 .
Demostración: Para demostrar (i), tomamos coordenadas en P(V ) tales que el punto p
sea (1 : 0 : . . . : 0) y el hiperplano tangente a Q en p sea H : Xn = 0. La matriz de Q en
estas coordenadas tendrá entonces la forma
 0

0
...
0
p
0n


A=


0
..
.
p11
..
.
...
p1,n−1
..
.
p1n
..
.
0
p0n
p1,n−1
p1n
...
...
pn−1,n−1
pn−1,n
pn−1,n
pn,n







...
p1,n−1
p11


..
con p0n = 0. Además, como el rango de A es r, el rango de  ...

.
p1,n−1 . . . pn−1,n−1
es r − 2. Es claro que H ∩ Q es la cuádrica en H, cuya ecuación en las coordenadas
x0 , . . . , xn−1 consiste en hacer Xn = 0 en la ecuación de Q, es decir, es la cuádrica de
matriz
0

0
...
0
...
p1,n−1 
p11
0
.

..
..
.

.
.
.
0
p1,n−1
...
pn−1,n−1
que claramente tiene rango r − 2 y cuyo núcleo es el subespacio que corresponde al subespacio proyectivo generado por p y Λ0 .
Sea ahora Λ un subespacio lineal contenido en Q de dimensión m. La restricción de la
polaridad de Q a Λ es una aplicación proyectiva Λ-----> Ω(Λ) con centro Λ ∩ Λ0 . Por tanto
n − m − 1 = dim(Ω(Λ)) ≥ dim Λ − dim(Λ ∩ Λ0 ) − 1 ≥ dim Λ − dim Λ0 − 1 = m − (n − r) − 1
de donde se obtiene (ii).
Proposición 9.13. Sea P(V ) un espacio proyectivo de dimensión tres y sea Q ⊂ P(V )
una cuádrica no degenerada que contiene una recta L. Entonces por cada punto p ∈ Q
pasan exactamente dos rectas contenidas en Q.
Demostración: Por la Proposición 9.12(i) sabemos que la intersección de Q con el plano
tangente a Q en p es una cónica de rango uno, es decir, un par de rectas. El resultado
92
estará demostrado si demostramos que las rectas no son imaginarias. Distinguimos dos
casos:
–Si p ∈ L, la intersección de Q con su plano tangente en P contiene a la recta L, luego
el par de rectas no son imaginarias (ya que L es una de ellas).
–Si p ∈ L, entonces, la intersección de Q con el plano Π generado por p y L es una
cónica que pasa por p y contiene a la recta L. Por tanto, dicha cónica es un par de rectas
no imaginarias, una de ellas L, y otra recta L que pasa por p. Repitiendo el caso anterior
tomando L en lugar de L, se obtiene el resultado.
93
10. Espacio afı́n y espacio proyectivo
94
Descargar