Universidad Autónoma de Madrid Trabajo de Fin de Máster Teorema de Mordell-Weil Autor: Ana Zumalacárregui Pérez Tutor: Dr. Adolfo Quirós Gracián Septiembre 2010 hola Índice general 1. Introducción 1 2. Variedades proyectivas. Curvas planas. 2.1. Variedades Afines . . . . . . . . . . . . . 2.2. Variedades Proyectivas. . . . . . . . . . 2.3. Curvas . . . . . . . . . . . . . . . . . . . 2.4. Divisores . . . . . . . . . . . . . . . . . . 2.5. Diferenciales . . . . . . . . . . . . . . . . 2.6. Teorema de Riemann-Roch . . . . . . . 3. Curvas Elı́pticas 3.1. Ley de grupo . . . . . . . . . . . . . 3.2. Subgrupo de Torsión . . . . . . . . . 3.3. Valores absolutos y reducción de una 3.4. Emparejamiento de Weil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . curva elı́ptica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 10 12 15 17 . . . . 25 29 33 35 38 4. Versión débil del teorema 41 4.1. El emparejamiento de Kummer . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.2. Demostración del Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5. Descenso, Alturas y el Teorema de Mordell-Weil 5.1. Teorema del Descenso . . . . . . . . . . . . . . . . 5.2. Alturas en el espacio proyectivo . . . . . . . . . . . 5.3. Alturas en curvas elı́pticas . . . . . . . . . . . . . . 5.4. Puntos de torsión racionales . . . . . . . . . . . . . 5.5. Rango de E(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 51 60 67 71 6. Cómo calcular el grupo de Mordell-Weil 73 6.1. Calcular E(K)/mE(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 6.2. 2-Descenso Completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.3. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 7. Variedades Abelianas 7.1. Variedades Abelianas . . . . . . . . . . . . . 7.2. Homomorfismos entre variedades abelianas . 7.3. Variedades Jacobianas . . . . . . . . . . . . 7.4. Resultados en variedades abelianas . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 86 87 89 91 ÍNDICE GENERAL ii 7.4.1. Torsión en variedades abelianas . . . . . . . . . . . . . . . . . . . . . 7.4.2. Teorema de Weil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3. Conjetura de Mordell y Teorema de Faltings . . . . . . . . . . . . . Bibliografı́a 91 91 92 93 Capı́tulo 1 Introducción El estudio de las ecuaciones Diofánticas, soluciones enteras o racionales a ecuaciones polinómicas, se remonta a la antigua Grecia. Fue en el siglo III cuando Diofanto de Alejandrı́a se interesó por conocer las soluciones a las ecuaciones algebraicas. Su trabajo estaba tan alejado de las corrientes matemáticas de su época, que algunos de sus planteamientos y gran parte de la notación algebraica que desarrolló no tuvieron mucha influencia entre los matemáticos hasta más de mil años después, cuando su trabajo fue retomado por los franceses Viète y Fermat. A diferencia de sus contemporáneos, que derivaron las ecuaciones de las cónicas a partir de condiciones geométricas, el propio Diofanto estudió las ecuaciones algebraicas fuera de todo contexto geométrico, pero sin ignorar las implicaciones geométricas de sus hallazgos. Se podrı́a decir que el trabajo de este matemático ha tenido una profunda influencia en los matemáticos de los últimos tiempos, especialmente una vez que estuvieron preparados para unir álgebra y geometrı́a. El término Geometrı́a Diofántica tiene un origen más reciente y se refiere al estudio de las soluciones a ecuaciones Diofánticas a través de la combinación de técnicas de la teorı́a algebraica de números y la geometrı́a algebraica. Por un lado, el problema de encontrar soluciones enteras (o racionales) a ecuaciones polinómicas hace aparecer de manera natural la teorı́a algebraica de números, que describe los cuerpos y anillos en los que viven esas soluciones. Por el otro, se tiene que los mismos sistemas de ecuaciones en polinomios describen variedades algebraicas y es muy natural estudiar su estructura geométrica para poder atacar el problema. Ası́ es como nace la interacción entre estas dos áreas y estos dos puntos de vista o maneras de entender la geometrı́a Diofántica. El caso más sencillo que nos podemos encotrar en esta dirección es el estudio de las soluciones de una ecuación lineal, ax + by = c a, b, c ∈ Z, con a o b no nulos. En este caso sabemos que siempre existen soluciones racionales. Si aumentamos en uno el grado del polinomio, obtendremos ecuaciones cuadráticas como ax2 + bxy + cy 2 + dx + ey + f = 0 a, b, c, d, e, f ∈ Z, 1 2 CAPÍTULO 1. INTRODUCCIÓN con a o b no nulos. Éste tipo de ecuación es bien conocida, y describe las secciones cónicas. Tras un cambio de variable con coeficientes racionales, podemos transformar este tipo de ecuación en una de las tres siguientes: ax2 + by 2 = c Elipse, ax2 − by 2 = c Hipérbola, ax + by 2 = 0 Parábola. Para este tipo de ecuaciones tenemos el Teorema de Hasse-Minkowski que establece: Una ecuación cuadrática, ax2 + bxy + cy 2 + dx + ey + f = 0 a, b, c, d, e, f ∈ Z, con a o b distintos de 0, tiene soluciones racionales si y sólo si tiene soluciones en R y en Qp , el cuerpo de los números p-ádicos, para todo p primo. El resultado dice que la ecuación tendrá soluciones en Q sı́ y sólo si existen soluciones en cada una de sus compleciones. Es por esto que a este teorema se le conoce como principio Local-Global. El lema de Hensel nos dice que encontrar soluciones en Qp se reduce básicamente a trabajar en Z/pZ, donde tenemos herramientas poderosas como la ley de reciprocidad cuadrática. Hasta ahora no hemos empleado argumentos geométricos. Sin embargo, ya Diofanto habı́a observado que si somos capaces de encontrar un punto racional en cualquiera de estas curvas, entonces podemos construir todos los puntos racionales que queramos. Basta con trazar una recta que pase por dicho punto y que tenga pendiente racional. El punto de corte de dicha recta con la curva siempre será racional. Esta observación permite parametrizar los puntos racionales de una cónica a partir de la pendiente. Con este método, por ejemplo, se puede probar de manera sencilla que las ternas pitagóricas, soluciones enteras de la ecuación x2 + y 2 = z 2 , son infinitas y darlas de forma explı́cita. Diofanto aplicó este mismo ‘método de secantes’ a ecuaciones cúbicas y obtuvo sus resultados más espectaculares. Descubrió que, aunque su método no producı́a una parametrización de las soluciones racionales, permitı́a construir una solución racional a partir de dos soluciones dadas. Siglos después se descubrió que variando ligeramente el método de Diofanto se podı́an ‘sumar’ soluciones (puntos) y tener ası́ una estructura de grupo en la ecuación (o mejor dicho en la curva). La gran diferencia entre el enfoque de Diofanto y el enfoque actual es que él tan solo mostró interes en los algorı́tmos algebraicos, más que en las estructuras. Le interesaban fórmulas y procedimientos para resolver las ecuaciones, no tanto las estructuras abstractas para describir el conjunto de soluciones. No obstante, no hay duda de que se merece haber puesto nombre a las matemáticas que aquı́ vamos a discutir. Podrı́amos decir que a estas alturas se comprende bastante bien la aritmética en el primer tipo de curvas que hemos descrito, las de grados uno y dos. Ésto se debe principalmente 3 a que tanto las ecuaciones lineales como las cuadráticas producen curvas de género 0, y geométricamente pueden compararse a una recta, que es un objeto mucho más simple que los que vamos a estudiar. Si aumentamos la complejidad en un nivel, nos encontraremos con las curvas de género 1, las llamadas curvas elı́pticas, que son el objeto principal de este trabajo. Estas curvas vienen dadas por ecuaciones cúbicas en dos variables, y a diferencia de las anteriores, su estudio ha dado lugar al desarrollo de una mezcla muy rica de geometrı́a algebraica y teorı́a de números. Los más prominentes matemáticos de nuestro tiempo han contribuido al desarrollo de la teorı́a. Y podrı́amos decir que el conocimiento que se tiene de la teorı́a para curvas elı́pticas sobre cuerpos finitos y cuerpos locales es más o menos satisfactoria. Sin embargo, resulta que el principio Local-Global de Hasse para curvas de este tipo es falso. Este hecho, junto con otros muchos, hace realmente interesante el estudio de los puntos racionales de este tipo de curvas. Éste será el objetivo principal de este trabajo: tratar de comprender completamente la estructura de los puntos de una curva elı́ptica sobre un cuerpo global, y ser capaces de encontrarlos. Para ello, podrı́amos decir que la primera mitad del trabajo consiste en probar el Teorema de Mordell-Weil, que establece que todos los puntos racionales de una curva elı́ptica pueden generarse a partir de un número finito de ellos. Es decir, que todas las soluciones racionales de una de aquellas ecuaciones cúbicas que estudiaba Diofanto pueden construirse a partir de un número finito de ellas, empleando una variación de su método de la secante. La segunda parte del trabajo, sin embargo, se centra en justificar que todo el trabajo previo tuvo sentido. Con esto quiero decir que, tras haber probado que el grupo está finitamente generado, es natural preguntarse si es posible encontrar los generadores de manera efectiva. La respuesta es que sı́, pero no siempre o no todos ellos. Tras esta introducción los dos siguientes capı́tulos resumen la teorı́a y notación necesaria para poder enunciar y probar los teoremas de los capı́tulos 4 y 5. En el capı́tulo 2 se dan las definiciones y resultados básicos de geometrı́a algebraica que serán necesarios para poder definir rigurosamente lo que es una curva elı́ptica. El capı́tulo 3 se centra en los aspectos aritméticos de las curvas elı́pticas. Dado que la teorı́a en esta dirección es muy amplia, nos hemos visto obligados a restringirnos a aquellos resultados que se iban a necesitar más adelante. Dejamos de lado la teorı́a de curvas elı́pticas con multiplicación compleja o curvas sobre cuerpos finitos, entre otras muchas cosas. El capı́tulo 4 se centra en probar la versión débil del Teorema de Mordell-Weil, que asegura que el grupo de generadores de los puntos racionales es finito si lo consideramos bajo una relación de equivalencia lineal. Este resultado no sólo será una herramienta fundamental para probar el teorema en su versión fuerte, sino que además nos ayudará a entender también las dificultades para calcular de manera efectiva los generadores del grupo. En el capı́tulo 5 se hace una exposición de la teorı́a general de las funciones de altura, para 4 CAPÍTULO 1. INTRODUCCIÓN centrarnos después en las alturas sobre las curvas elı́pticas. Éstas, junto con el Teorema del Descenso y el Teorema débil de Mordell-Weil, son la herramienta básica e indispensable para poder probar el teorema que da nombre a este trabajo. Tras todo el trabajo realizado en los primeros 5 capı́tulos, el sexto trata de mostrar cómo podemos sacar ventaja del teorema. Y cómo emplear toda la teorı́a a nuestro alcance para poder calcular los puntos racionales con los que generar todos los demás. Para ello, en primer lugar se justifican teóricamente los pasos a dar, para después comprobar con un ejemplo sencillo que todo funciona, y mostrar también en qué puntos podemos encontrarnos con dificultades (que en ocasiones son insalvables). Estas dificultades, que hacen que los puntos racionales de una curva elı́ptica sean tan interesantes, se derivan principalmente del hecho de que el principio de Hasse-Minkowski es falso para este tipo de curvas. En el capı́tulo final se incluye una breve introducción a las variedades abelianas, que son la generalización natural de las curvas elı́pticas. Dicha teorı́a nació en el intento de Weil de extender el teorema de Mordell a cuerpos mayores que Q. Por ello mismo, he creido importante no sólo hablar aquı́ del teorema de Weil, que generaliza el teorema de Mordell(-Weil) a variedades abelianas, sino también citar algunos otros ejemplos en los que el estudio de variedades abelianas ha llevado a probar resultados tan maravillosos como el Teorema de Faltings, que establece que toda curva con género mayor que uno tiene a lo sumo un número finito de puntos racionales. A lo largo de todo el trabajo he querido no sólo justificar los resultados teóricos incluyendo todas las demostraciones, salvo un número finito de ellas, sino que además he procurado encontrar ejemplos que pudieran hacer más comprensible la teorı́a, ası́ como justificar la existencia de la misma. Por último, quisiera comentar brevemente la importancia que tienen las curvas elı́pticas hoy en dı́a, y por qué tiene sentido estudiarlas más allá de por su asombrosa belleza. A mı́ al menos no dejan de sorprenderme, aunque por suerte o por desgracia yo aún soy altamente impresionable. En primer lugar, y tal vez en la posición más evidente, destacarı́a las utilidades prácticas derivadas de los sistemas criptográficos que se han desarrollado en los últimos años, basados en la criptografı́a de clave pública de Diffie-Hellman, y que tienen como ventaja principal la dificultad de resolución del logaritmo discreto en el grupo de puntos de una curva elı́ptica, en este caso definida sobre un cuerpo finito, frente a la sencillez de los algoritmos de suma en el grupo. Objetos que se describen en este trabajo con fines púramente teóricos, como el emparejamiento de Weil por ejemplo, constituyen herramientas esenciales para entender las formas de ataque a estos criptosistemas y poder ası́ hacerlos más seguros. Inesperadamente, he tenido la ocasión de descubrir mientras estudiaba para este trabajo que la ley de grupo en una curva elı́ptica resulta ser la solución de muchas ecuaciones diferenciales que aparecen en aplicaciones en ingenierı́a, incluyendo electroestática, mecánica 5 de fluidos o fı́sica clásica. El ejemplo más sencillo de esta afirmación deriva del estudio de un simple péndulo, y ésta es la motivación natural para el nacimiento de las integrales elı́pticas. Para más información consultar [13] En último lugar, he de hablar sin duda de las matemáticas que pusieron en oı́dos de muchos por primera vez las curvas elı́pticas: el Último Teorema de Fermat. La historia de este estudio comenzó con Diofanto, y precisamente fue leyendo una traducción al latı́n del Arithmetica de Diofanto, cuando Pierre de Fermat enunció el ‘Teorema’ que a tantos matemáticos ha tenido atareados en los últimos años: Cuando n > 2 no existen soluciones racionales positivas a la ecuación, xn + y n = z n . Más de 300 años ha llevado probar este teorema, y muchas y muy importantes matemáticas se han desarrollado en el intento. Fue en 1994 cuando el inglés A. Wiles terminó con la demostración. Wiles atacó el enigma de Fermat resolviendo un problema totalmente diferente, relacionado precisamente con las curvas elı́pticas, que entonces ya era conocido como la Conjetura de Taniyama-Shimura. Fue G. Frey quien unos años antes probó cómo conectar esta conjetura con el Último Teorema de Fermat. 6 CAPÍTULO 1. INTRODUCCIÓN Capı́tulo 2 Variedades proyectivas. Curvas planas. A lo largo de todo este capı́tulo K denotará un cuerpo perfecto, y K su clausura algebraica. Por tanto la extensión K/K será de Galois y los elementos de K los fijados por el grupo de K-automorfismos Gal(K/K). Como en general nuestro objetivo es hacer aritmética, nos interesa trabajar con extensiones algebraicas sobre Q, Fp , que simplifica la exposición notablemente, aunque gran parte de la teorı́a expuesta puede extenderse a cuerpos más generales. 2.1. Variedades Afines Definición. El espacio afı́n de dimensión n, definido sobre K, se define como el conjunto de n-úplas, An = {(x1 , ..., xn ) : xi ∈ K, i = 1, ..., n}. Y, de manera similar, los puntos K-racionales de An son An (K) = {(x1 , ..., xn ) : xi ∈ K, i = 1, ..., n}, los puntos con coordenadas en K. Nótese que el grupo de Galois Gal(K/K) actúa sobre An : dado σ ∈ G(K/K) y P ∈ An (K), P σ = (x1 , ..., xn )σ = (xσ1 , ..., xσn ). De modo que An (K) puede caracterizarse como, An (K) = {P ∈ An : P σ = P para todo σ ∈ G(K/K)}. Definición. Un conjunto algebraico afı́n, es un subconjunto V ⊂ An de puntos que satisfacen una serie de ecuaciones, o equivalentemente son ceros una serie de polinomios en K[x1 , ..., xn ], V (I) = {P ∈ An : f (P ) = 0 para todo f ∈ I}. Sea V un conjunto algebraico, su ideal se define como I(V ) = {f ∈ K[x1 , ..., xn ] : f (P ) = 0 para todo P ∈ V }. 7 8 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Nótese que gracias al Teorema de la base de Hilbert, sabemos que el anillo K[x1 , ..., xn ] es Noetheriano, y por tanto todo ideal es finitamente generado, de modo que V (I) = V (f1 , ..., fm ) = V (f1 ) ∩ V (f2 ) ∩ · · · ∩ V (fm ). Definición. Un conjunto algebraico V ⊂ An es una variedad afı́n cuando el ideal de V , I(V ), es un ideal primo en K[x1 , ..., xn ]. Una variedad afı́n V , está definida sobre un cuerpo K siempre que su ideal pueda generarse por polinomios con coeficientes en K. En todo momento, hemos de tener en cuenta de que el concepto de variedad no deja de ser también geométrico. Y la condición de primalidad sobre el ideal I(V ) se traduce en que la variedad posee una única componente irreducible. Veamos sin embargo qué significa esta condición algebraicamente. Teorema 2.1 (Nullstellenssatz). Sea K un cuerpo algebraicamente cerrado. Si I / K[x1 , ..., xn ] es un ideal, entonces √ I(V (I)) = I √ donde I = {x ∈ K : xd ∈ I para algún d ∈ N}, denota el radical de I en K. El teorema anterior, nos asegura que si V es una variedad algebraica, entonces I(V (I)) = I. 2.2. Variedades Proyectivas. Definición. El espacio proyectivo n-dimensional, definido sobre K, se denota por Pn o Pn (K), y consiste en todas las (n + 1)-tuplas (x0 , ..., xn ) ∈ An+1 , distintas de (0, ..., 0), bajo la relación de equivalencia (x0 , ..., xn ) ∼ (λx0 , ..., λxn ), ∗ donde λ ∈ K . A la clase de equivalencia, ∗ {(λx0 , ..., λxn ) : λ ∈ K } ∈ An+1 \{0}/∼ la denotaremos por [x0 , ..., xn ], y las xi son las coordenadas homogéneas del correspondiente punto en Pn . El conjunto de puntos K-racionales de Pn , denotado por Pn (K), consiste en todos los puntos P = [x0 , ..., xn ] ∈ Pn , cuya clase tiene un representante con coordenadas homogéneas en K. Nótese que, al igual que en el caso afı́n, el grupo de Galois actúa sobre Pn , actuando sobre sus coordenadas homogéneas, P σ = [x0 , ..., xn ]σ = [xσ0 , ..., xσn ] para σ ∈ Gal(K/K). Y la acción está bien definida, pues respeta la relación de equivalencia, [λx0 , ..., λxn ]σ = [λσ xσ0 , ..., λσ xσn ] = [xσ0 , ..., xσn ] = [x0 , ..., xn ]σ . 2.2. VARIEDADES PROYECTIVAS. 9 Definición. Un polinomio f ∈ K[x0 , ..., xn ] es homogéneo de grado d, si f (λx0 , ..., λxn ) = λd f (x0 , ..., xn ) para todo λ ∈ K. Y un ideal I / K[x0 , ..., xn ] se dice homogéneo, si está generado por polinomios homogéneos. Para f un polinomio homogéneo dado tiene sentido preguntarse cuándo f (P ) = 0 si P ∈ Pn . Por ser f homogéneo esta condición es independiente de la elección de coordenadas homogéneas. Definición. Un conjunto algebraico proyectivo V (I) es el conjunto de puntos que se anulan en un ideal homogéneo I, V (I) = {P ∈ Pn : f (P ) = 0 para todo f ∈ I}. Además, dado V un conjunto algebraico proyectivo, el ideal (homogéneo) I(V ) está generado por el conjunto, {f ∈ K[x0 , ..., xn ] | f homogéneo , f (P ) = 0 para todo P ∈ V } ⊂ K[x0 , ..., xn ]. Un conjunto algebraico V está definido sobre K si su ideal homogéneo puede generarse por polinomios definidos en K[x0 , ..., xn ]. Los puntos K-racionales de la variedad V (K) ⊂ Pn (K) coinciden precisamente con V (K) = V ∩ Pn (K). Al igual que en el caso afı́n, V (K) puede también verse como el subconjunto de V que queda fijado por Gal(K/K), V (K) = {P ∈ V : P σ = P para todo σ ∈ Gal(K/K)}. Una de las inclusiones es trivial, pues P σ = P para todo P ∈ P(K). Pero para demostrar la inclusión contraria se necesita emplear el Teorema 90 de Hilbert y algunas nociones de cohomlogı́a de Galois. Definición. Un conjunto algebraico proyectivo, V ⊂ Pn , es una variedad preyectiva si su ideal I(V ) es primo en K[x0 , ..., xn ]. Resulta natural entender el espacio afı́n como subconjunto del espacio proyectivo, pues fijada una coordenada 0 ≤ i ≤ n, podemos definir la inclusión, φi : An −→ Pn (y1 , ..., yn ) 7−→ [y1 , ..., yi−1 , 1, yi , ..., yn ] Sea Hi = {[x0 , ..., xi−1 , 0, xi+1 , ..., xn ] ∈ Pn }, el hiperplano dado por xi = 0, y Ui su complementario, Ui = {[x0 , ..., xn ] ∈ Pn : xi 6= 0} = Pn \Hi existe una biyección natural, φ−1 i : Ui −→ An [x0 , ..., xn ] 7−→ (x0 /xi , ..., xi−1 /xi , xi+1 /xi , ..., xn /xi ) 10 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. De modo que podemos entender Anxi =1 ∼ = Ui ⊂ Pn , via la aplicación φi , para un i fijo. Fijada i, al hiperplano Hi , lo denotaremos como hiperplano del infinito H∞ . Dada una variedad proyectiva V ⊂ Pn tenemos que V ∩ Anxi =1 , que no es otra cosa que φ−1 i (Ui ∩ V ), es una variedad afı́n con ideal I(V ∩ Anxi =1 ) = {f (x0 , ..., xi−1 , 1, xi+1 , ..., xn ) : f ∈ I(V )} Los conjuntos U0 , ..., Un cubren todo el espacio proyectivo Pn , de modo que cualquier variedad proyectiva puede recubrirse totalmente por variedades afines. Para una coordenada i fija, siempre podemos entender una variedad proyectiva V como la unión de su parte afı́n y sus puntos del infinito, V ∩ Anxi =1 2.3. y V ∩ H∞ . Curvas Definición. Sea V /K una variedad afı́n definida sobre K, definimos el anillo de funciones regulares, o anillo de coordenadas afines como K[V ] = K[x1 , ..., xn ] . I(V ) Como I(V ) es primo, entonces K[V ] será un dominio. Diremos que el cuerpo de fracciones de K[V ] es el cuerpo el cuerpo de funciones racionales de la variedad V , que denotaremos por K(V ). De manera análoga se define el anillo de coordenadas proyectivas de V K[V ] = K[x0 , ..., xn ] , I(V ) que en este caso no son funciones en V , ya que ni siquiera un polinomio homogéneo define una función proyectiva. El cuerpo de funciones racionales de una variedad proyectiva V se define como f K(V ) = : f, g son homogéneos del mismo grado en K[x0 , ..., xn ] y g ∈ / I(V ) /∼ , g donde f f0 ∼ 0 g g ⇐⇒ f g 0 − f 0 g ∈ I(V ). Definición. La dimensión de una variedad afı́n es el grado de trascendencia de la extensión de cuerpos K(V )/K. Definición. Sea V ⊂ Pn una variedad proyectiva definida sobre K, y sea 0 ≤ i ≤ n tal que V ∩ Anxi =1 6= ∅, entonces la dimensión de V es la dimensión de V ∩ Anxi =1 . Una curva no es otra cosa que una variedad de dimensión 1. 2.3. CURVAS 11 Nótese que la dimensión de una variedad proyectiva no depende en ningún caso del abierto afı́n que hemos escogido. Ejemplo 2.1. Sea V ⊂ P2 la variedad proyectiva formada por los puntos que satisfacen la ecuación, y 2 z = x3 + Axz 2 + Bz 3 . Si escogemos el abierto afı́n dado por z = 1, tenemos V ∩ A{z=1} = {(x, y) : y 2 = x3 + Ax + B} Donde K(V ) = K(x, y) para x, y funciones que satisfacen la relación y = √ x3 + Ax + B. De modo que podemos construir la torre de cuerpos, K(V ) algebraica K(x) transcendente K con grado de trascendencia igual a 1, pues el elemento K(x). Ası́ que V es una curva dimK (V ) = 1. √ x3 + Ax + B es algebraico sobre En general, se tiene que si f ∈ K[x1 , ..., xn ] es primo y homogéneo, la variedad V (f ) = {P ∈ Pn : f (P ) = 0} es una hipersuperficie de dimensión n − 1, y su ideal I(V ) = (f ) es principal. Como caso particular, se tiene que una hipersuperficie en el plano proyectivo es una curva. Por tanto cualquier variedad plana definida por una ecuación es una curva y, equivalentemente, si tenemos un polinomio homogéneo y primo f (x, y, z) = 0, éste nos define una curva proyectiva plana. Definición. Una variedad proyectiva V ⊂ Pn es lisa en un punto P si la dimensión del espacio tangente a la variedad en P coincide con la dimensión de V . Existe una condición algebraica más sencilla para definir la lisitud sobre un punto, en términos de las ecuaciones que definen una curva proyectiva, cuando ésta es una curva plana. 12 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Definición. Dada una curva plana C : f (x, y, z) = 0, un punto P ∈ C es singular si y sólo si ∇f (x0 , y0 , z0 ) = (0, 0, 0) f (x0 , y0 , z0 ) = 0 Diremos que una curva es lisa o nosingular si no tiene puntos singulares. Para el caso que nos interesa, las curvas elı́pticas, ésta condición es suficiente, pues como ya veremos en el capı́tulo siguiente toda curva elı́ptica es isomorfa a una curva plana. 2.4. Divisores Definición. El grupo de divisores de una curva C, denotado por Div(C), es el grupo abeliano libre generado por los puntos de la curva. De modo que un divisor D ∈ Div(C) es una suma formal X D= np (P ), P ∈C donde np ∈ Z, y nP = 0 para todos los P ∈ C salvo un número finito de ellos. El grado de un divisor D se define como X deg(D) = np . P ∈C Los divisores de grado cero forman un subgrupo de Div(C), que denotaremos como Div 0 (C) = {D ∈ Div(C) : deg(D) = 0}. La suma de dos divisores se define de manera natural como X D + D0 = [np + n0P ](P ) P ∈C y el grupo Gal(K/K) actúa sobre Div(C) del siguiente modo Dσ = X nP (P σ ), P ∈C para todo σ ∈ Gal(K/K). Definición. Diremos que D está definido sobre K si Dσ = D para todo σ ∈ Gal(K/K). Nótese que si D = n1 (P1 ) + · · · + nk (Pk ) está definido sobre K, no necesariamente se tiene que P1 , ..., Pk ∈ C(K). Basta que el grupo de Galois permute los puntos P1 , ..., Pk de manera adecuada. 2.4. DIVISORES 13 Supongamos ahora que la curva C es lisa, entonces para una función f ∈ K(C)∗ podemos asociar a f el divisor X div(f ) = ordP (f ) (P ). P ∈C Ésta definición tiene sentido pues f sólo tiene un número finito de polos y ceros, de modo que ordP (f ) = 0 para todo P ∈ C salvo un número finito. Además resulta claro que div(f σ ) = (div(f ))σ para todo elemento σ ∈ Gal(K/K). Si ordP (f ) = 1 dado f ∈ K(C)∗ , entonces diremos que f es un parámetro en P . Definición. Diremos que un divisor D ∈ Div(C) es principal si es de la forma D = div(f ) para alguna función f ∈ K(C)∗ . Dos divisores D y D0 se dicen linealmente equivalentes, D ≡ D0 , si D − D0 es principal. Definición. El grupo de clases de divisores, o grupo de Picard, denotado por P ic(C) es el cociente del grupo de divisores dado por P ic(C) = Div(C)/P rin(C), ∗ donde P rin(C) = {div(f ) : f ∈ K (C)} denota el subgrupo de divisores principales de C. Analogamente podemos definir P ic0 (C) como P ic0 (C) = Div 0 (C)/P rin(C), ya que Div 0 (C) es un subgrupo de Div(C). Como ordP es una valoración discreta, la aplicación div : K(C)∗ −→ Div(C) f 7−→ div(f ) es un homomorfismo de grupos abelianos. Proposición 2.2. Sea C una curva suave, y f ∈ K(C)∗ . Entonces, (a) div(f ) = 0 si y sólo si f ∈ K ∗ , (b) deg(div(f )) = 0. Definición. Dadas dos curvas proyectivas planas C, C 0 , definidas por dos polinomios f, g ∈ K[x0 , ..., xn ], de grados d y e respectivamente, y sea S = C ∩ C 0 = {P ∈ Pn (K) : f (P ) = g(P ) = 0}, definimos la multiplicidad de intersección de C y C 0 en P como K(x1 , ..., xn ) 0 (C, C )P = dimK (f ∗ , g ∗ ) 14 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. donde f ∗ , g ∗ son los polinomios deshomogeneizados, i.e. V (f ∗ ) = C ∩ Anxi =1 y V (g ∗ ) = C 0 ∩ Anvi =1 para algún 0 ≤ i ≤ n. Definiremos el divisor de intersección como X C · C0 = (C, C 0 )P (P ). P ∈S Teorema 2.3 (Bézout). Sean C y C 0 dos curvas proyectivas planas definidas sobre un cuerpo K, sin componentes comunes (es decir, definidas por polinomios irreducibles distintos). Entonces el número total de puntos de intersección de C y C 0 en P2 (K), contados con multiplicidades, es igual al producto de los grados de C y C 0 . El teorema anterior establece que si D = C · C0 = X (C, C 0 )P (P ) P ∈C∩C 0 es el divisor de intersección de C = V (f ) y C 0 = V (g), entonces X deg(D) = (C, C 0 )P = deg(f )deg(g). P ∈C∩C 0 Ejemplo 2.2. Sea K un cuerpo con caracterı́stica char(K) 6= 2. Sean e1 , e2 , e3 ∈ K distintos. Entonces la curva definida por C : y 2 = (x − e1 )(x − e2 )(x − e3 ), es lisa, y posee un único punto en el infinito P∞ = [0, 1, 0]. Para i = 1, 2, 3, tenemos que Pi = (ei , 0) ∈ C. Calculemos div(x − ei ), para i = 1, 2, 3 y también div(y). En primer lugar, tenemos que la función homogénea en P2 de x − ei es (x − zei )/z. Para todo P = [a, b, 1] ∈ C distinto de P1 , P2 y P3 se tiene que (x − zei ) =0 ordP z ya que la función no tiene ni polos ni ceros en P . Para P1 tenemos que y es un parámetro, pues tiene un cero de primer orden en el punto. Además como y 2 = (x−e1 )(x−e2 )(x−e3 ), entonces y2 (x − e1 ) = . (x − e2 )(x − e3 ) Dado que (x − e2 ), (x − e3 ) 6= 0 en P1 , entonces (x − ze1 ) ordP1 = ordP1 (x − e1 ) = ordP1 (y 2 ) = 2ordP1 (y) = 2. z Del mismo modo se tiene que ordP2 (x − e2 ) = ordP3 (x − e3 ) = 2. 2.5. DIFERENCIALES 15 Veamos ahora el orden en el punto del infinito, P∞ = [0, 1, 0]. Tal y como ya hemos visto en la Proposición 2.2, el grado de un divisor principal siempre es cero. De modo que, dado que ordP (x − ei ) = 0 para todo P 6= Pi , P∞ , entonces tenemos que (x − zei ) = 2(Pi ) + nP∞ (P∞ ) =⇒ nP∞ = −2. div z Veamos a continuación qué sucede con el divisor de la función y/z ∈ K(C). Se tiene que si P = [a, b, 1] 6= P1 , P2 , P3 , entonces y ordP = 0, z ya que la función y/z sólo tiene ceros en P1 , P2 , P3 , pues C ∩ {y = 0} = {[x, 0, z] : (x − e1 z)(x − e2 z)(x − e3 z)/z 3 = 0} = {P1 , P2 , P3 } y C tiene un único polo en P∞ . Además el Teorema de Bezout nos asegura que el orden de intersección en los puntos Pi ha de ser uno, y por tanto la función y/z ∈ K(C) será un parámetro en P1 , P2 , P3 . De modo que, y = (P1 ) + (P2 ) + (P3 ) + nP∞ (P∞ ) con 3 + nP∞ = 0. div z De donde ordP∞ (y/z) = −3. Entonces, div 2.5. x − zei z = 2(Pi ) − 2(P∞ ) div y z = P1 + P2 + P3 − 3P∞ . Diferenciales Definición. Sea C una curva. El espacio de formas diferenciales sobre C, denotado por ΩC , es el K-espacio vectorial generado por los sı́mbolos de la forma dx con x ∈ K(C)∗ , sujetos a las relaciones habituales: (i) d(x + y) = dx + dy (ii) d(xy) = xdy + ydx (iii) da = 0 para todo x, y ∈ K(C). para todo x, y ∈ K(C). para todo a ∈ K. Proposición 2.4. Sea C una curva, y P ∈ C. Si t ∈ K(C)∗ es un parámetro en P entonces: (a) Para cada ω ∈ ΩC existe una única función g ∈ K(C), que depende de ω y t tal que ω = gdt. Denotaremos a la función g como ω/dt. (b) Sea f ∈ K(C), siguiendo con la notación anterior, diremos que g = df /dt si df = gdt. Si f es regular en P , entonces la función df /dt ∈ K(C) también es regular en P . 16 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. (c) Sea ω ∈ ΩC , con ω 6= 0. La cantidad ordP (ω/dt) es independiente de la elección de parámetro t. Llamaremos a esta cantidad orden de ω en P , y lo denotaremos por ordP (ω). (d) Sea ω ∈ ΩC con ω 6= 0. Entonces ordP (ω) = 0 para todo P ∈ C salvo un número finito de ellos. Definición. Para ω ∈ ΩC , el divisor asociado a ω se define como X div(ω) = ordP (ω)(P ). P ∈C Diremos que ω es holomorfo si ordP (ω) ≥ 0 para todo P ∈ C, y que no se anula si ordP (ω) ≤ 0 para todo P ∈ C. Nótese que si ω1 , ω2 ∈ ΩC son dos diferenciales no nulos, entonces la Proposición 2.4(a) implica que existe f ∈ K(C)∗ tal que ω1 = f ω2 . Y por tanto, div(ω1 ) = div(f ) + div(ω2 ). Los apartados (c) y (d) de la misma proposición aseguran que efectivamente div(ω) ∈ Div(C). Definición. Un divisor canónico es aquel que tiene un representante de la forma div(ω), para ω ∈ ΩC , dentro del grupo de Picard. Es decir, D ∈ Div(C) es un divisor canónico si y sólo si existe ω ∈ ΩC tal que D − div(ω) es principal. De hecho, de la Proposición 2.4 se sigue que todos los divisores canónicos son equivalentes. Ejemplo 2.3. Sea C la curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ), con e1 , e2 , e3 ∈ K. Vamos a calcular div(dx). Si P = [a, b, 1] 6= P1 = [ei , 0, 1], entonces (x − a) es un parámetro en P , y como dx = d(x − a), entonces ordP (dx) = ordP (d(x − a)) = 0. Para Pi = [e1 , 0, 1] ∈ C tenemos que y es un parámetro uniformizante en Pi . Como y 2 = f (x) = (x − e1 )(x − e2 )(x − e3 ), entonces 2ydy = f 0 (x)dx =⇒ dx = 2y dy. f 0 (x) 2.6. TEOREMA DE RIEMANN-ROCH 17 Como Pi es un punto liso de C, entonces se tiene que f 0 (ei ) 6= 0, y por tanto ordPi (dx) = 1. Veamos ahora qué sucede en P∞ = [0, 1, 0]. Tenemos que z x /y d (x /y ) −x /y d (z /y ) x/y dx = d = . =d z z/y (z /y )2 Un parámetro uniformizante en P∞ es t = x/y, y vimos en el Ejemplo 2.2 que z = t3 f y con f ∈ K(C) y f (P∞ ) 6= 0. Por lo tanto, d x z = t3 (−2f − tf 0 )dt = t−3 gdt, t6 f 2 donde g ∈ K(C) no tiene ceros en P∞ . De donde, ordP∞ (dx) = −3. Ası́, tenemos que div(dx) = (P1 ) + (P2 ) + (P3 ) − 3(P∞ ) Por tanto div(dx/y) = div(dx) − div(y) = 0, y dx/y ∈ ΩC es holomorfa y no se anula en C. 2.6. Teorema de Riemann-Roch Sobre el grupo de divisores de una curva Div(C) vamos a definir una relación de orden parcial, a partir de las multiplicidades de los mismos. Definición. Dados D, D0 ∈ Div(C), diremos que X X D= nP (P ) ≥ D0 = n0P (P ) P ∈C P ∈C si y sólo si nP ≥ n0P para todo P ∈ C. Diremos que D es positivo cuando D ≥ 0. Resulta claro que no todos los divisores de una misma curva serán comparables. Pero las desigualdades de divisores resultan útiles para describir los polos y ceros de las funciones. Ejemplo 2.4. Continuando con el ejemplo anterior, C una curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ) definida sobre K. Supongamos que para f ∈ K(C) se cumple P1 + P2 − 3P∞ ≤ div(f ) ≤ P1 + P2 + P3 − 2P∞ . La primera desigualdad nos dice que la función f tiene dos ceros de orden uno en P1 y P2 , y un único polo de orden a lo sumo 3 en P∞ . De modo que div(f ) debe ser P1 + P2 − 2P∞ 18 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. o bien P1 + P2 + Q − 3P∞ para algún Q ∈ C, pues por la Proposición 2.2(b) sabemos que deg(div(f )) = 0. La segunda desigualdad establece que div(f ) ha de coincidir con P1 + P2 + P3 − 3P∞ o bien con el divisor Pi + Pj − 2P∞ para i 6= j, ya que no puede tener ceros fuera de {P1 , P2 , P3 } y tiene un polo en P∞ de orden al menos 2. De modo que las únicas opciones para div(f ) son: (i) div(f ) = P1 + P2 + P3 − 3P∞ (ii) o bien div(f ) = P1 + P2 − 2P∞ . Para el caso (i), recordemos que según lo visto en el Ejemplo 2.2 div(y/z) = P1 + P2 + P3 − 3P∞ , y por la Proposición 2.2(a) sabemos que, div(f ) − div(y/z) = 0 ⇐⇒ f = λ(y/z) ∗ para λ ∈ K . Para el caso (ii) veamos que no existe ninguna función racional en esta curva con el divisor correspondiente. En primer lugar, como el divisor 2P∞ tiene grado 2 > 2g − 2 = 1, el Teorema de RiemannRoch, (ver más adelante), establece que el espacio L(2P∞ ) tiene dimensión `(2P∞ ) = 2, por tanto ha de existir una base de generadores K-linealmente indepencientes del tipo {1, g} para alguna función racional g de K(C). Por otro lado, sabemos que la función g = (x − zei )/z tiene divisor 2Pi − 2P∞ , y por tanto g ∈ L(2P∞ ). De modo que buscamos una función en L(2P∞ ) con divisor P1 + P2 − 2P∞ , que ha de ser de la forma: az + bx para a, b ∈ K. bz Pero dado que ésta es una función lineal con un único polo de orden 3 en P∞ , la recta az + bx tendrı́a que pasar por P1 , P2 , P∞ , lo cual es una contradicción pues la única recta que pasa por P1 y P2 pasa también por P3 . Podemos entonces concluir que la condición, P1 + P2 − 3P∞ ≤ div(f ) ≤ P1 + P2 + P3 − 2P∞ , se cumple para una única función racional, salvo multiplicación por constantes, y ésta es f = λ(y/z). Definición. Sea D ∈ Div(C). Asociamos a D el conjunto de funciones L(D) = {f ∈ K(C)∗ : D + div(f ) ≥ 0} ∪ {0}. Ejemplo 2.5. Si continuamos con el ejemplo anterior, entonces para P ∈ C denotaremos por P al divisor D = 1 · (P ) y por −P al divisor D0 = (−1) · (P ). Se tiene ası́ que L(P ) = {f ∈ K(C)∗ : div(f ) + P ≥ 0} = {f ∈ K(C)∗ : ordP (f ) + 1 ≥ 0 y ordQ (f ) ≥ 0 para todo Q ∈ C, Q 6= P } = {f ∈ K(C)∗ : f tiene como mucho un único polo en P }. 2.6. TEOREMA DE RIEMANN-ROCH 19 Del mismo modo, L(−P ) = {f ∈ K(C)∗ : div(f ) − P ≥ 0} = {f ∈ K(C)∗ : ordP (f ) ≥ 1 y ordQ (f ) ≥ 0 para todo Q ∈ C, Q 6= P } = {f ∈ K(C)∗ : f tiene un cero en P y no tiene polos en C}. Pero como el grado de un divisor principal es siempre cero, entonces f ha de ser constante con un cero en P , L(−P ) = {0}. Del mismo modo L(0) = {f ∈ K(C)∗ : div(f ) ≥ 0} = {K}, ya que toda función sin polos, ha de ser constante. Pues el número de polos y ceros ha de compensarse. Proposición 2.5 (Propiedades de L(D)). Sea D ∈ Div(C), para una curva C definida sobre K. (i) L(D) es un K-espacio vectorial (de dimensión finita). (ii) Si D ≤ D0 entonces L(D) ⊂ L(D0 ). (iii) Si D ≡ D0 , entonces L(D) ∼ = L(D0 ), son isomorfos como K-espacios vectoriales. Demostración. (i) Sea λ ∈ K, f ∈ L(D): a) 0 ∈ L(D) por definición. ∗ b) Si λ ∈ K , entonces div(λf ) = div(f ) =⇒ λf ∈ L(D). c) Si f, g ∈ L(D), para todo P ∈ C ordP f, ordP g ≥ −ordP (D) = nP . Por tanto ordP (f + g) ≥ mı́n(ordP f, ordP g) ≥ −D y por tanto f + g ∈ L(D). (ii) Si f ∈ L(D), div(f ) + D0 ≥ div(f ) + D ≥ 0 y entonces f ∈ L(D0 ). (iii) Como D ≡ D0 entonces existe h ∈ K(C)∗ tal que D = D0 + div(h), de modo que si f ∈ L(D0 ), entonces div(f ) + D0 = div(f ) + div(h) + D = div(f h) + D ≥ 0, De modo que f h ∈ L(D). Basta definir el isomorfismo, L(D0 ) ←→ L(D) f 7−→ fh g/h ←− g 20 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. que claramente es compatible con la suma y con el producto por escalares, ya que h 6= 0. Definición. Denotaremos por `(D) = dimK L(D) a su dimensión. Teorema 2.6 (Riemann-Roch). Sea C una curva lisa, y KC un divisor canónico en C. Existe un entero g ≥ 0, que sólo depende de la curva, llamado género de C tal que para cada divisor D ∈ Div(C), `(D) − `(KC − D) = degD − g + 1. Corolario 2.7 (Consecuencias). (i) Si D = 0, entonces el teorema establece que `(KC ) = g. (ii) Si D = KC , entonces degKC = 2g − 2. (iii) Si degD > 2g − 2, entonces: deg(K − D) < 0 =⇒ `(K − D) = 0 =⇒ l(D) = deg(D) − g + 1. Ejemplo 2.6. Tal y como ya vimos en el ejemplo 2.3. El divisor de dx/y era un divisor canónico en la curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ). Por el corolario anterior sabemos que 0 = div(dx/y) = 2g − 2 de donde se tiene que g = 1, la curva C tiene género 1. Proposición 2.8. Sea C/K una curva lisa y D ∈ DivK (K). Entonces existe una base de L(D) formada por funciones en K(C). Demostración. Como D está definido sobre K, entonce f σ ∈ L(Dσ ) = L(D) para todo f ∈ L(D) y σ ∈ Gal(K/K). De modo que Gal(K/K) actúa sobre L(D). Si denotamos por, L(D)K = {f ∈ L(D) : f σ = f para todo σ ∈ Gal(K/K)} entonces, L(D) ∼ = K ⊗K L(D)K el K−espacio vectorial L(D) tiene una base de vectores Gal(K/K)-invariantes, ver [3]. Y por tanto, dicha base pertenece al espacio de funciones racionales sobre K, K(C). 2.6. TEOREMA DE RIEMANN-ROCH 21 Proposición 2.9. Sea C ⊂ P2 una curva plana no singular de grado d, definida sobre un cuerpo K, C = V (f ) donde deg(f ) = d. Entonces su género es: g(C) = (d − 1)(d − 2) . 2 Demostración. Consideremos z = 0 la recta en el infinito, D := z · C el divisor de intersección y los espacios L(mD). Dado m ∈ N, definiremos como Vm al K-espacio vectorial de los polinomios homogéneos de grado m en K[x, y, z]. En primer lugar veamos que podemos definir una aplicación ψ: Vm −→ L(mD) g(x, y, z) 7−→ g(x,y,z) zm ya que g/z m ∈ K̄(C) está bien definida como aplicación racional, pues tanto g como z m son polinomios homogéneos de grado m. Además nótese que g/z m ∈ L(mD), o equivalentemente g + m(D) ≥ 0, zm pues g = (g) − (z m ) = (g · f ) − m(z · f ) zm pero por definición, (z · f ) = (C · {z = 0}) = D y por tanto g + mD = (g · f ) − mD + mD = (g · f ) ≥ 0 zm y entonces, g ∈ L(mD) zm para todo g ∈ Vm . A continuación veremos que existe una sucesión exacta φ ψ 0 −→ Vm−d −→ Vm −→ L(mD) −→ 0 h 7−→ hf g 7−→ g/z m Esto equivale a pedir, 1. Que la aplicación φ sea inyectiva: En primer lugar la aplicación está bien definida, pues como deg(h) = m − d, entonces deg(hf ) = deg(h) + deg(f ) = m y es homogéneo por ser producto de dos polinomios homogéneos. Además, φ(h1 ) = φ(h2 ) ⇐⇒ h1 f = h2 f la aplicación φ es inyectiva. ⇐⇒ (h1 − h2 )F = 0 ⇐⇒ h1 = h2 22 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. 2. Que, φ(Vm−d ) = Ker(ψ). Se sigue de las definiciones que g ∈ Ker(φ) sı́ y sólo si g/z m ≡ 0 (mód f ), de modo que g ∈ Ker(ψ) ⇐⇒ g/z m = f h para algún h ∈ K(C)∗ homogéneo de grado −d. De modo que g = f hz m = φ(hz m ) ∈ φ(Vm−d ). 3. Que la aplicación ψ sea sobreyectiva: Veamos que para todo t ∈ L(mD) existe un g ∈ Vm tal que, t= g ∈ L(mD). zm Sabemos que si t = rs , se cumple para s, r div(t) = (r · f ) − (s · f ) ≥ −mD = (z m · f ), (r · f ) + (z m · f ) ≥ (s · f ). Entonces, (rz m · f ) ≥ (s · f ) Por tanto existen a, b ∈ K̄[x, y, z] tales que, rz m = a · f + b · s Que bajo el cociente en K̄(C) equivale a decir que, f= r b = m = ψ(b) s z y por tanto ψ es sobreyectiva. Combinando las tres afirmaciones se tiene que la sucesión construida es exacta. Y comparando las dimensiones de la suceción se tiene que l(mD) = dimL(mD) = dimVm − dimVm−d . Donde dimK Vm m+2 (m + 2)(m + 1) = = , 2 2 pues existen exactamente m+2 monomios xi y j z k , de grado i + j + k = m, en K[x, y, z], 2 y todos ellos son K-linealmente independientes. De modo que, l(mD) = = (m + 2)(m + 1) (m − d + 2)(m − d + 1) − 2 2 2 2md + 3d − d 2 2.6. TEOREMA DE RIEMANN-ROCH Para todo m el teorema de Bézout asegura que, deg(mD) = m · deg(D) = m · d · 1 Y por tanto, para m suficientemente grande, tendremos deg(mD) = m · d > 2g − 2 pues g es finito. Del Teorema de Riemann-Roch se deduce que g = deg(mD) + 1 − l(mD) 2md + 3d − d2 = md + 1 − 2 (d − 2)(d − 1) d2 − 3d − 2 = . = 2 2 23 24 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Capı́tulo 3 Curvas Elı́pticas El objeto principal de nuestro estudio serán las curvas elı́pticas. Y trataremos de entender su geometrı́a. Para ello consideraremos los puntos con coordenadas sobre un cuerpo algebraicamente cerrado K, y más adelante nos centraremos en la aritmética con los puntos K-racionales de la curva, donde K será llegado el momento un cuerpo de números. Definición (1). Una curva elı́ptica es un par (E, O), donde E es una curva lisa de género uno y O ∈ E es un punto. La curva E está definida sobre un cuerpo K, denotaremos por E/K, si E está definida como variedad sobre K y O ∈ E(K). Definición (2). Una curva elı́ptica, es una curva plana y lisa, definida por una ecuación de Weierstrass C : y 2 z + a1 xyz + a3 yz 2 = x3 + a2 x2 z + a4 xz 2 + a6 z 3 . En general para simplificar, nos limitaremos a escribir la ecuación afı́n de la curva en el abierto A2z=1 , C : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , con un único punto en el infinito, z = 0, O = [0, 1, 0]. Como siempre, si a1 , .., a6 ∈ K diremos que E/K, E está definida sobre K Veamos a continuación que ambas definiciones son equivalentes. (1) =⇒ (2) Vamos a ver que dada E, puedo encontrar una curva plana C isomorfa a ella, del tipo descrito anteriormente. Para ello utilizaremos el teorema de Riemann-Roch. Consideremos: K = L(0) ⊂ L(O) ⊂ L(2O) ⊂ · · · ⊂ L(nO), donde `(0) = 1. Como g = 1, y si deg(D) ≥ 2g − 2 entonces el teorema asegura que `(D) = deg(D). Se tiene que para n ≥ 0: dim(L(nO)) = `(nO) = n Por la prpoposición 2.6 podemos elegir funciones de K(E) que formen una base de L(nO) para todo n. 25 26 CAPÍTULO 3. CURVAS ELÍPTICAS Si x, y ∈ K(E) son funciones con un polo doble y triple en O, respectivamente. Considero las bases: L(0) ∩ L(O) ∩ L(2O) ∩ L(3O) ∩ L(4O) ∩ L(5O) ∩ L(6O) = <1> = <1> = < 1, x > con ordP (x) = −2, x ∈ / L(O) = < 1, x, y > con ordP (y) = −3, y ∈ / L(2O) = < 1, x, x2 , y > con ordP (x2 ) = −4, x2 ∈ / L(3O) = < 1, x, x2 , xy, y > con ordP (xy) = −5, xy ∈ / L(4O) = < 1, x, x2 , x3 , xy, y, y 2 > con ordP (y 2 ) = ordP (x3 ) = −6 Entonces, dado que `(6O) = 6 el conjunto {1, x, x2 , x3 , xy, y, y 2 } de generadores ha de satisfacer una relación lineal, digamos A1 + A2 x + A3 y + Ay x2 + A5 xy + A6 x3 + A7 y 2 = 0, y sin pérdida de generalidad podemos asumir que Ai ∈ K. Con A5 A7 6= 0, ya que si no todos los términos tendrı́an un polo de distinto orden y la relación serı́a trivial, A1 = · · · = A7 = 0, ya que {1, x, x2 , xy, y} son linealmente independientes por construcción. Realizando un sencillo cambio de variable, x − 7 → −A6 A7 x y − 7 → A6 A27 y y tras dividir por A36 A47 obtenemos la siguiente ecuación de Weierstrass y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 con a1 , ..., a6 ∈ K, donde las funciones construidas x, y se conocen como coordenadas de Weierstrass. Esto nos define la aplicación, φ = [x, y, 1] : E −→ P2 P 7−→ [x(P ), y(P ), 1] cuya imagen cae en la curva C descrita por la ecuación de Weierstrass anterior. Además, por ser φ una aplicación racional y E una curvas lisa, automáticamente φ es un morfismo. Se tiene que φ(O) = [x(O), y(O), 1] = [x(O)/y(O), 1, 1, y(O)] = [0, 1, 0] y como y ∈ K(E), entonces hay un número infinito de puntos P ∈ E(K) con ordP (y) = 0, de hecho sólo puede haber un número finito de puntos en los que el orden no sea cero. Para cualquiera de estos puntos se tiene que φ(P ) = [x(P ), y(P ), 1] = [x(P )/y(P ), 1, 1/y(P )] 6= [0, 1, 0] = φ(O) 27 de modo que claramente la función φ es no constante. Y por ser φ : E −→ C un morfismo no constante entre curvas, entonces ha de ser sobreyectiva. El siguiente paso es probar que el morfismo φ es de grado 1, o equivalentemente, probar que K(E) = K(x, y). En primer lugar, dado que la función x tiene un polo de orden dos sobre O y ningún otro polo, entonces la aplicación φ1 = [x, 1] : E −→ P1 tiene grado 2, ya que φ−1 1 ([1, 0]) = {O}. De manera equivalente, se tiene que la aplicación φ2 = [y, 1] : E −→ P1 tiene grado 3. A continuación consideremos la torre de cuerpos, K(E) 66 66 66 66 [K(E):K(x)]=2 66[K(E):K(y)]=3 K(x, y) 6 H H v vv HH 666 H v HH 66 vvv HH 6 vv K(x) K(y) como [K(E) : K(x, y)] ha de dividir a 2 y a 3, se tiene que [K(E) : K(x, y)] = 1. Por último, hemos de demostrar que C es efectivamente lisa. Supongamos que C fuese singular, y por tanto birracionalmente equivalente a P1 , entonces habrı́a de existir una aplicación racional ψ : C −→ P1 de grado uno. Pero ψ ◦ φ : E −→ P1 serı́a una aplicación de grado uno entre E y P1 , dos curvas lisas, y por tanto un isomorfismo. Sin embargo esto es claramente una contradicción, pues dos curvas de géneros distintos no pueden ser isomorfas (recordemos que el género de E es uno por definición y que el género de P1 es cero). De donde se sigue que la aplicación φ : E −→ C es un isomorfismo de curvas. (2) =⇒ (1) Dado que el grado de una curva de Weierstrass es 3, y ésta es lisa, entonces sabemos por la Proposición 2.9 que el género de la curva es g(C) = (d − 1)(d − 2) = 1. 2 Basta entonces comprobar que C tiene al menos un punto K-racional, O, para ello veamos que si z = 0, C ∩ H∞ = [0, 1, 0] ∈ C(K). 28 CAPÍTULO 3. CURVAS ELÍPTICAS A partir de ahora consideraremos siempre una curva elı́ptica E/K, dada por una ecuación de Weierstrass, E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 ai ∈ K, y con punto base O = [0, 1, 0]. Si char(K) 6= 2, completando cuadrados podemos reducir la ecuación a una de la forma E : y 2 = 4x3 + b2 x2 + b4 x + b6 , donde b2 = a21 + 4a4 , b6 = a23 + 4a6 . b4 = 2a4 + a1 a3 , Y si además char(K) 6= 3, entonces completando cubos obtenemos con un cambio sencillo de variable E : y 2 = x3 − 27c4 x − 54c6 , con c4 = b22 − 24b4 , c6 = −b32 + 36b2 b4 − 216b6 . Definición. Si una curva elı́ptica se presenta con una ecuación de Weierstrass, E : y 2 = x3 + Ax + B entonces se dice que está en forma de Weierstrass reducida. Para una curva elı́ptica de ecuación reducida, E : y 2 = x3 + Ax + B tenemos que, a1 = a2 = a3 = 0 a4 = A a6 = B y b2 = 4A b4 = 2A b6 = 4B Definición. Dada E/K una curva elı́ptica en forma de Weierstrass E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 ai ∈ K, definiremos la cantidad ∆, determinante de la curva, como ∆ = −b22 b8 − 8b4 − 27b26 + 9b2 b4 b6 , donde b8 = a1 a6 + 4a2 a6 − a1 a3 a4 + a2 a23 − a4 . Si la curva se presenta en una forma de Weierstrass reducida, E : y 2 = x3 + Ax + B entonces ∆ = −16(4A3 + 27B 2 ), con b8 = −A2 . Una curva general de Weierstrass como las anteriores es lisa si y sólo si ∆ 6= 0 en K. 3.1. LEY DE GRUPO 3.1. 29 Ley de grupo Sea E una curva elı́ptca dada por una ecuación de Weierstrass. Entonces, E = {[x, y, 1] : x, y satisfacen la ecuación de Weierstrass} ∪ {O = [0, 1, 0]} ⊂ P2 . Sea L una lı́nea proyectiva. Dado que la ecuación de E es de grado 3, el teorema de Bezout nos asegura que L interseca a E en exactamente 3 puntos, con multiplicidades, digamos P, Q, R. Es claro que estos tres puntos no son necesariamente distintos, (véase el caso en que L es tangente a E). Podemos ası́ definir una ley de grupo ⊕ sobre E. Ley de Grupo para una curva elı́ptica: Sean P, Q ∈ E y L la lı́nea que pasa por P y Q, (si P = Q entonces L es tangente a E en el punto), sea R el tercer punto de intersección de L con E. Y llamemos L0 a la lı́nea que pasa por R y O, entonces el tercer punto de intersección de L0 y E es denotado por P ⊕ Q. A continuación, demostraremos que efectivamente la ley de grupo descrita anteriormente dota al conjunto de los puntos de E de una estructura de grupo. Proposición 3.1. Sea E una curva elı́ptica. Entonces la ley de grupo satisface, (a) Si una lı́nea L interseca a E en los puntos P, Q, R, (no necesariamente distintos), entonces (P ⊕ Q) ⊕ R = O. (b) Elemento neutro: P ⊕ O = P para todo P ∈ E. (c) Conmutatividad: P ⊕ Q = Q ⊕ P para todo P, Q ∈ E. (d) Elemento inverso: Dado P ∈ E, entonces existe un punto P ∈ E tal que P ⊕ (P ) = O. (e) Asociatividad: Dados P, Q, R ∈ E, entonces P ⊕ (Q ⊕ R) = (P ⊕ Q) ⊕ R. 30 CAPÍTULO 3. CURVAS ELÍPTICAS En otras palabras, (E, ⊕) es un grupo abeliano con elemento neutro O, donde ⊕ denota la ley de grupo. (f ) Si además E está definida sobre un cuerpo K, entonces E(K) = {(x, y) : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 } ∪ {O} es un subgrupo de (E, ⊕). Demostración. (a) El resultado se sigue de la definición de la ley de grupo, pues al sumar P ⊕ Q se obtiene el punto R0 , que es el tercer punto de intersección de la recta que pasa por R y O. De modo que R ⊕ R0 = O. (b) Veamos que efectivamente el elemento O, que define la ley de grupo, es neutro para la operación. Si tomamos la lı́nea que une O con un punto cualquiera P , ésta cortará por definición en un punto P 0 . Y el punto P ⊕ O es el tercer punto de intersección de la curva con la recta que pasa por P 0 y O, que no es otro sino P . (c) La conmutatividad se sigue directamente de la construcción de la ley, puesto que ésta es puramente geométrica, (basta darse cuenta de que la recta que pasa por P y Q coincide con la que pasa por Q y P ). (d) Defino el inverso (opuesto) como el punto P de intersección de la curva con la recta que pasa por O y P . Ahora, sabemos por el apartado (a) que, P ⊕ (P ) ⊕ O = O, y por el apartado (b), P ⊕ (P ) ⊕ O = P ⊕ (P ) = O. Nótese además, que con esta nueva notación el punto R0 de (a) coincide con R, y el punto P 0 de (b) es P . Además, la definición tiene sentido también para O, ya que O = O, la recta tangente a O corta tres veces (o con multiplicidad tres) al punto. (e) Para demostrar la asociatividad, vamos a definir una aplicación κ E −→ P ic0 (E) = Div 0 (E)/ ∼ P 7−→ (P ) − (O) 3.1. LEY DE GRUPO 31 que de hecho podemos restringir a los puntos K-racionales, 0 E(K) −→ DivK (E) P P donde D ∈ DivK (E) si y sólo si Dσ = nP (P σ ) = nP (P ) = D para todo σ ∈ Gal(K/K). Demostraremos que κ es una biyección: (I) Es inyectiva: Si κ(P ) = κ(Q), entonces (P ) − O ∼ (Q) − O de modo que existe una función f ∈ K(E) tal que div(f ) = P − Q =⇒ f ∈ L(Q) = K. Como f no puede tener ceros en P, Q, entonces P = Q. (II) Es sobreyectiva: Fijado D ∈ Div 0 (E) hemos de ver que existe un punto P ∈ E tal que P − O ∼ D. Como deg(D + O) = 1 > 2g − 1 = 0, el espacio L(D + O) tiene dimensión `(D + O) = deg(D + O) = 1. Entonces si f ∈ L(D + O), f ∈ / K, tenemos que div(f ) + D + O = P y por tanto D ∼ (P ) − (O). Dado que el grupo de Picard tiene una estructura natural de grupo, X D + D0 = (nP + n0P )(P ), P ∈E se tiene que la curva hereda esta estructura de grupo, mediante κ. Donde κ(O) = 0. Pero hemos de ver que la estructura de grupo que define κ coincide con la de E, es decir (P − O) + (Q − O) = (P ⊕ Q − O) en P ic0 (E). Sea ` la recta que pasa por P y Q, (` · E) = P + Q + R su divisor de intersección. Y L0 la recta que pasa por R y O, (`0 · E) = R + O + (P ⊕ Q). De modo que podemos definir los divisores de las funciones racionales 0 ` ` div = P + Q + R − 3O, div = (P ⊕ Q) + R − 2O, z z y por tanto ` div 0 = P + Q + R − 3O − ((P ⊕ Q) + R − 2O) = P + Q − (P ⊕ Q) − O ` 32 CAPÍTULO 3. CURVAS ELÍPTICAS de modo, dado que `/`0 ∈ K(E) se sigue que P − O + Q ∼ P ⊕ Q =⇒ (P − O) − (Q − O) ∼ (P ⊕ Q) − O. Ambas operaciones son compatibles, y la biyección es de hecho un isomorfismo de grupos. La asociatividad en (E, ⊕) se sigue de la del grupo de Picard. (f) Si P, Q ∈ E(K) entonces la ecuación de la recta que los une tendrá coeficientes en K, entonces las coordenadas del tercer punto de intersección vienen dadas por una combinación racional de coordenadas y coeficientes de la lı́nea y de E, de modo que estará en E(K). Si no resulta claro, basta consultar las fórmulas explı́citas de la ley de grupo dadas a continuación. Una vez definida la ley de grupo, no resulta muy complicado derivar fórmulas explı́citas para la misma. De este modo, si E/K es una curva elı́ptica con ecuación de Weierstrass general E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , o bien en forma reducida E : y 2 = x3 + Ax + B. Para P1 = (x1 , y1 ) y P2 = (x2 , y2 ) puntos generales de la curva definiremos las cantidades λ y ν: (i) λ = (ii) λ = y2 − y1 y1 x2 − y2 x1 , ν= si x1 6= x2 , x2 − x1 x2 − x1 3x21 + 2a2 x1 + a4 − a1 y1 −x31 + a4 x1 + 2a6 − a3 y1 , ν= si x1 = x2 , 2y1 + a1 x1 + a3 2y1 + a1 x1 + a3 para la ecuación general. Y e = y2 − y1 , νe = y1 x2 − y2 x1 si x1 6= x2 , (i) λ x2 − x1 x2 − x1 2 3 e = 3x1 + A , νe = −x1 + Ax1 + 2B si x1 = x2 , (ii) λ 2y1 2y1 en la ecuación reducida. e + νe), es la lı́nea que pasa por P1 , P2 o bien la Entonces y = λx + ν, (o en su caso y = λx lı́nea tangente a E en P1 = P2 . Y el punto P3 = P1 ⊕ P2 tiene coordenadas, e2 − (x1 + x2 ), x3 = λ2 + a1 λ − a2 − (x1 + x2 ) = λ e 3 − νe. y3 = −(λ + a1 )x3 − ν − a3 = −λx El algoritmo explı́cito viene dado por: (a) Fórmula para el inverso: −P = (x, −y − a1 x − a3 ) −P = (x, −y) para la fórmula general, y en la forma reducida. 3.2. SUBGRUPO DE TORSIÓN 33 (b) Fórmula de duplicación: [2]P x([2]P ) = x4 − b4 x2 − 2b6 x − b8 , 4x3 + b2 x2 + 2b4 x + b6 x([2]P ) = para la fórmula general, y x4 − 2Ax2 − 8Bx + A2 4(x3 + Ax + B) para la forma reducida. (c) Fórmula de la suma: P1 ⊕ P2 cuando P1 6= ±P2 y2 − y1 2 y2 − y1 x(P1 ⊕ P2 ) = − a2 − (x1 + x2 ), + a1 x2 − x1 x2 − x1 en el caso general, y x(P1 ⊕ P2 ) = 3.2. y2 − y1 x2 − x1 2 − (x1 + x2 ), en la ecuación reducida. Subgrupo de Torsión Tal y como ya hemos visto en la primera sección del capı́tulo, los puntos de la curva E/K forman un grupo abeliano con respecto de la operación ⊕. Y por tanto resulta natural tratar de entender su estructura como Z-módulo. Definición. Sea E una curva elı́ptica, y m ∈ Z un entero mayor que uno. Definiremos la m-torsión de E como E[m] = {P ∈ E : [m]P = O}. De manera análoga se definira la m-torsión racional como E[m](K) = {P ∈ E(K) : [m]P = O} ⊂ E(K). Definición. El subgrupo de torsión de E, denotado por Etors , es el conjunto de puntos de orden finito ∞ [ Etors = E[m]. m=1 Si E/K, entonces Etors (K) denota el conjunto de puntos de orden finito de E(K). Podemos definir para cada m ≥ 1 entero, un homomorfismo de grupos [m] : E −→ E P 7−→ [m]P que además es un morfismo. A este tipo de aplicaciones, que respetan tanto la estructura de grupo de (E, ⊕) como la estructura de variedad proyectiva de la curva, se las conoce como isogenias. En este caso tenemos que el conjunto de puntos de m-torsión, coincide exactamente con el núcleo de esta isogenia ker([m]) = E[m]. Además, aunque no incluiré la demostración, se tiene que deg([m]) = m2 . A partir de esta afirmación es sencillo deducir la estructura de la m-torsión. 34 CAPÍTULO 3. CURVAS ELÍPTICAS Proposición 3.2. Sea E/K una curva elı́ptica, y m ≥ 1 un entero. Entonces: (a) Si m 6= 0 in K, es decir char(K) = 0 o 0 < p = char(K) 6 | m, entonces E[m] ∼ = Z/mZ × Z/mZ. (b) Si char(K) = p y m = pe , entonces una de las siguientes afirmaciones es cierta para E: (i) E[pe ] = {O} para todo e = 1, 2, 3... e e ∼ (ii) E[p ] = Z/p Z para todo e = 1, 2, 3... Demostración. (a) Por ser [m] un morfismo separable, se sigue que deg[m] = |ker[m]| = |E[m]| = m2 . Como además para todo d|m se tiene que E[d] ⊂ E[m] por definición, la afirmación anterior nos dice que el grupo E[m] tiene un subgrupo de d2 elementos. Y escribiendo E[m] como producto de grupos cı́clicos, es sencillo darse cuenta de que el único grupo abeliano de m2 elementos con esta propiedad es Z/mZ × Z/mZ. (b) Este apartado se sigue de las propiedades del morfismo de Frobenius. Ver III.6.4. de [10] . Tal y como ya hemos dicho anteriormente, en este trabajo estamos interesados principalmente en el estudio de curvas elı́pticas definidas sobre cuerpos de números, de modo que de ahora en adelante nos centraremos únicamente en cuerpos de caracterı́stica cero. A partir de la ecuación de Weierstrass de una curva elı́ptica, a base de realizar iteraciones sobre la fórmula de duplicación dada en la sección 3.1, se pueden obtener fórmulas explı́citas para las coordenadas de los puntos de m torsión. De modo que es relativamente sencillo caracterizar dichos puntos. Ejemplo 3.1. Sea E : y 2 = (x−e1 )(x−e2 )(x−e3 ) la curva elı́ptica que venimos manejando en nuestros ejemplos. Entonces los puntos de [2]−torsión son aquellos para los que P ⊕ P = O, o equivalentemente P = −P . De la fórmula del inverso, tenemos que si P = (x0 , y0 ) entonces −P = (x0 , y0 − a1 x0 − a3 ), pero en este caso tenemos que a1 = a3 = 0, de modo que cualquier punto de [2]-torsión ha de cumplir la condición P = (x0 , y0 ) = (x0 , −y0 ) = −P =⇒ y0 = 0 =⇒ x0 = ei y por tanto tenemos los puntos de [2]-torsión E[2] = {P1 = (e1 , 0), P2 = (e2 , 0), P3 = (e3 , 0), O} que son precisamente los puntos con tangente vertical. 3.3. VALORES ABSOLUTOS Y REDUCCIÓN DE UNA CURVA ELÍPTICA. 35 Dado que el grupo de torsión de una curva elı́ptica es infinito, pues hay m2 puntos de m torsión para toda m ≥ 1, tal y como ya hemos visto, y dado que la proposición anterior nos proporciona todas las nociones necesarias para entender su estructura, resulta natural preguntarse por cómo serán los puntos de torsión K-racional. Como veremos más adelante, el Teorema de Mordell-Weil nos garantiza que el número de puntos de torsión K-racional es finito. Tal y como veremos en la sección 5.4 existen teoremas de estructura suficientemente fuertes, e incluso técnicas efectivas para poder calcular E(K)tors . 3.3. Valores absolutos y reducción de una curva elı́ptica. Recordemos que el conjunto de valores absolutos estándar sobre Q, que denotamos por MQ , contiene: (i) Un valor absoluto arquimediano, |x|∞ = máx{x, −x} que no es más que el valor absoluto usual. La compleción de Q con respecto a | · |∞ coincide con R. (ii) Para cada primo p ∈ Z, un valor absoluto (p-ádico) no arquimediano, cuya norma viene dada por, |x|p = p−vp (x) donde vp denota la valoración p-ádica de x, que puede definirse como el máximo exponente de p que divide a x, i.e. vp (x) = n ⇐⇒ x = pn a con p 6 |ab. b La compleción de los racionales con respecto de esta norma coincide con el cuerpo de los números p-ádicos Qp . La compleción del cuerpo K con respecto de una valoración v se denotará por Kv . Su anillo de enteros Rv = {x ∈ Kv : |x|v ≥ 0}, tiene ideal maximal Mv = {x ∈ Kv : |x| > 0} = πv Rv , donde πv es un uniformizante en v. Denotaremos por k = Rv /Mv al cuerpo residual de Rv . El conjunto de valores absolutos estándar de un cuerpo de números K, denotado por MK , es el conjunto de valores absolutos cuya restricción a Q es uno de los valores absolutos anteriores. Es decir, w ∈ MK ⇐⇒ ∃ v ∈ MQ tal que |x|w = |x|v para todo x ∈ Q. 36 CAPÍTULO 3. CURVAS ELÍPTICAS ∞ son los valores absolutos arquimedianos, mientras que M 0 denota el conjunto de Y MK K los valores absolutos no arquimedianos (finitos) en MK . Dada E/K una curva elı́ptica, y E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 su ecuación de Weierstrass. Entonces la sustitución (x, y) 7→ (u−2 x, u−3 y) da lugar a una nueva ecuación en la que los ai son reemplazados por ui ai . Definición. Sea E/K una curva elı́ptica. Una ecuación de Weierstrass para E se dice minimal en v si el valor v(∆) es mı́nimo, bajo la condición de que v(ai ) ≥ 0. Nótese que la condición de que v(ai ) ≥ 0 equivale a pedir que a1 , ..., a6 ∈ Rv . Y ésto necesariamente implica que ∆ ∈ Rv , por ser éste un anillo. Además, si la ecuación no es minimal, entonces existe un cambio de coordenadas que da lugar a un nuevo discriminante ∆0 = u12 ∆ ∈ R. De modo que v(∆) sólo puede cambiar por múltiplos de 12, de modo que si a1 , ..., a6 ∈ Rv y v(∆) < 12 =⇒ la ecuación es minimal. Si char(K) 6= 2, 3 entonces el recı́proco también es cierto y tenemos una caracterización de ecuaciones minimales. A continuación, vamos a centrarnos en la operación de reducción módulo πv , que denotaree Para ello, definiremos en primer lugar la aplicación de reducción natural, con mos por E. 0, respecto de una valoración v ∈ MK Rv −→ kv = Rv /Mv e t 7−→ t Habiendo escogido una ecuación minimal para E/Kv , podemos reducir sus coeficientes módulo πv para obtener una curva (tal vez singular) definida sobre kv , denotada por ev : y 2 + e E a1 xy + e a3 y = x3 + e a2 x2 + e a4 x + e a6 . ev /kv es la reducción de E módulo πv . Fijado un punto P ∈ E(Kv ), con La curva E coordenadas homogéneas P = [x0 , y0 , z0 ] tales que x0 , y0 , z0 ∈ Rv , el punto reducido e v ). Esta relación define la aplicación de reducción, Pe = [e x0 , ye0 , ze0 ] pertenece a E(k ev (kv ) E(Kv ) −→ E P 7−→ Pe ev /kv , puede ser singular. Pero en cualquier caso el conjunto de puntos La curva reducida E ens (kv ) forma un grupo. Podemos entonces definir dos conjuntos no singulares de la curva E de E(Kv ) ens (kv )}, E0 (Kv ) = {P ∈ E(Kv ) : Pe ∈ E e E1 (Kv ) = {P ∈ E(Kv ) : Pe = O}. Diremos que E0 (Kv ) es el conjunto de puntos de reducción nosingular y E1 (Kv ) el núcleo de reducción. 3.3. VALORES ABSOLUTOS Y REDUCCIÓN DE UNA CURVA ELÍPTICA. 37 0 una valoración discreta. Diremos que E/K tiene buena reDefinición. Sea v ∈ MK v ducción en v, si Ev /kv es nosingular. En cualquier otro caso diremos que E tiene mala 0 reducción en v. En general diremos que E/K tiene buena (resp. mala) redución en v ∈ MK si E tiene buena (resp. mala) reducción cuando se considera sobre la compleción Kv . A continuación enunciaremos las condiciones que ha de cumplir una curva para tener una buena reducción en v. Proposición 3.3. Sea E/K una curva elı́ptica dada por ecuación minimal de Weierstrass E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 . 0 Sea ∆ el discriminante de esta ecuación. Entonces E tiene una buena reducción en v ∈ MK ev /kv si y sólo si v(∆) = 0, i.e. si ∆ ∈ Rv∗ es una unidad. En este caso la curva reducida E es una curva elı́ptica. Ejemplo 3.2. Sea E : y 2 = x3 + Ax + B una curva elı́ptica definida sobre Q con A, B ∈ Z. Entonces, si vp (∆) = vp (−16(4A3 − 27B 2 )) = 0, e p es una curva elı́ptica, con ecuación de la ecuación es minimal y la curva reducida E/F Weierstrass ep : y 2 = x3 + Ap x + Bp E con A ≡ Ap (mód p) B ≡ Bp (mód p). Nótese que no siempre será posible escoger una única ecuación de Weierstrass de E sobre K 0 . Obsérvese que si tomamos cualquier que sea simultáneamente minimal para todo v ∈ MK ecuación de Weierstrass para E/K, E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , 0 , salvo un número finito, se tiene con discriminante ∆. Entonces para todos los v ∈ MK v(ai ) ≥ 0 para i = 1, ..., 6 y v(∆) = 0. Para todo v cumpliendo estas condiciones, la ecuación dada es minimal y la curva reducida 0, Ev /kv nosingular. De modo que E tiene una buena reducción en v para todos los v ∈ MK salvo una cantidad finita de ellos. 0 una valoración discreta tal que v(m) = 0 y E tiene una Proposición 3.4. Sea v ∈ MK buena reducción en v. Entonces la aplicación de reducción, ev (kv ) E(K)[m] −→ E P = [x0 , y0 , z0 ] 7−→ Pe = [e x0 , ye0 , ze0 ] es inyectiva. 38 CAPÍTULO 3. CURVAS ELÍPTICAS Demostración. Sean, ens (k)} y E1 (K) = {P ∈ E(K) : Pe = O}, e E0 (K) = {P ∈ E(K) : Pe ∈ E los puntos con reducción no singular y el núcleo de reducción respectivamente. Entonces se tiene que existe una sucesión exacta de grupos abelianos dada por, 0 −→ E1 (K) −→ E0 (K) −→ Ens (k) −→ 0 Donde E1 (K) no contiene puntos de orden m no triviales. Ver VII 3.1 de [10]. e es no singular, entonces se tiene que E0 (K) = E(K), y que E ens (k) = E(k). e Dado que E De modo que si dos puntos de m-torsión, digamos P1 , P2 ∈ E(K)[m], tienen la misma reducción en v, Pe, entonces P1 − P2 ∈ E1 (K), que no posee puntos no triviales de m-torsión. e De donde se sigue que la m-torsión de E(K) se inyecta en E(k). 3.4. Emparejamiento de Weil Sea E/K una curva elı́ptica definida sobre un cuerpo K. Para esta sección fijaremos m ≥ 2, un entero primo con p = char(K), si el cuerpo es de caracterı́stica positiva. Como grupo abstracto, el grupo de los puntos de m-torsión de E es isomorfo a E[m] ∼ = Z/mZ × Z/mZ. De modo que es un Z/mZ−módulo libre de rango dos. Dada una base {T1 , T2 } de E[m], se define el emparejamiento determinante de E[m] como det : E[m] × E[m] −→ Z/mZ (aT1 + bT2 , cT1 + dT2 ) 7−→ ad − bc cuyo valor es independiente de la elección de la base. Sin embargo, este emparejamiento no es invariante por la acción del grupo de Galois, i.e., si P, Q ∈ E[m] y σ ∈ Gal(K/K), entonces los valores de det(P σ , Qσ ) y de det(P, Q)σ no tienen por qué coincidir. Para conseguir invarianza en Gal(K/K) podemos emplear el emparejamiento modificado dado por ζ det(P,Q) , donde ζ es una raı́z primitiva m-ésima de la unidad. Para definir este emparejamiento intrı́nsecamente, P hemos de emplear un resultado sobre curvas elı́pticas que nos asegura que un divisor ni (Pi ) ∈ Div(E) es principal si y sólo si X ni = 0 y ⊕ [ni ]Pi = O. Sea T ∈ E[m]. Entonces existe una función f ∈ K(E) que satisface div(f ) = m(T )−m(O). Si además T 0 ∈ E cumple [m]T 0 = T , entonces existe una función similar g ∈ K(E) tal que div(g) = [m]∗ (T ) − [m]∗ (O). Donde [m]∗ es la aplicación inducida por la isogenia [m] entre los grupos de divisores, dada por X [m]∗ (Q) = e[m] (P ) · (P ) P ∈[m]−1 (Q) 3.4. EMPAREJAMIENTO DE WEIL 39 y e[m] (P ) es el ı́ndice de ramificación de [m] en P , que en este caso es 1 porque (m, p) = 1. De modo que, X div(g) = (T 0 + R) − (R), con [m]T 0 = T. R∈E[m] Nótese que div(g m ) = div(f ◦ [m]). Pues, en primer lugar tenemos que X m(T 0 + R) − m(R). div(g m ) = m · div(g) = R∈E[m] Por otro lado, f ◦ [m](P ) = f ([m]P ) donde div(f ) = m(T ) − m(O), de modo que X X div(f ◦ [m]) = m(T 0 + R) − m(R). R∈E[m] R∈E[m] ∗ De modo que, multiplicando f por una constante apropiada en K , podemos asumir que f ◦ [m] = g m . Consideremos ahora S ∈ E[m] otro punto de m-torsión, donde se permite S = T . Entonces para cada X ∈ E tenemos que g(X + S)m = f ([m]X + [m]S) = f ([m]X) = g(X)m . De modo que la función, X 7−→ g(X + S)/g(X) toma un número finito de valores, ya que cada X es llevado a una raı́z m-ésima de la unidad, g(X + S)/g(X) ∈ µm . En particular, la aplicación E −→ P1 S 7−→ [g(X + S)/g(X), 1] = [g(X + S), g(X)] es un morfismo por ser una aplicación racional entre curvas lisas. Como no es sobreyectivo ha de se constante. Éste hecho nos permite definir el emparejamiento, em : E[m] × E[m] −→ µm , (S, T ) 7−→ g(X + S)/g(X) tal que X ∈ E sea cualquier punto tal que g(X + S) y g(X) estén definidos y no sean cero. Recordemos que T aparece impı́citamente en la costrucción, en el divisor principal de g, de modo que efectivamente em depende de sus dos entradas. Aunque g está definida ∗ salvo multiplicación por escalares K , em (S, T ) no depende de dicha elección, ası́ como no depende de la elección de X, tal y como ya hemos visto. Definición. La aplicación que acabamos de definir, em : E[m] × E[m] −→ µm se conoce como el (m−)emparejamiento de Weil. A continuación se enumeran algunas de sus propiedades básicas del emparejamiento. 40 CAPÍTULO 3. CURVAS ELÍPTICAS Proposición 3.5. El emparejamiento de Weil tiene las siguientes propiedades: (a) Es bilineal, em (S1 + S2 , T ) = em (S1 , T )em (S2 , T, ) em (S, T1 + T2 ) = em (S, T1 )em (S, T2 ). (b) Es alternante, em (T, T ) = 1, y en consecuencia, junto con el apartado (a), se tiene que em (S, T ) = em (T, S)−1 . (c) Es no degenerado, Si em (S, T ) = 1 para todo S ∈ E[m] =⇒ T = O. (d) Es invariante por la acción del grupo de Galois, em (S, T )σ = em (S σ , T σ ) para todo σ ∈ Gal(K/K). (e) Es compatible, emm0 (S, T ) = em ([m0 ]S, T ) para todo S ∈ E[m0 m] y T ∈ E[m]. Corolario 3.6. Existen puntos T, S ∈ E[m] tales que em (S, T ) es una raı́z primitiva mésima de la unidad. En particular, si E[m] ⊂ E(K), entonces µm ⊂ K ∗ , donde µm denota el grupo (multiplicativo) formado por las raı́ces m-ésimas de la unidad. Capı́tulo 4 Versión débil del teorema El objetivo de este capı́tulo es probar una versión débil del teorema de Mordell-Weil, que es el primer paso para poder probar el Teorema de Mordell-Weil. Teorema 4.1 (Teorema débil de Mordell-Weil). Sea K un cuerpo de números, sea E/K una curva elı́ptica y m ≥ 2 un número entero. Entonces, E(K)/mE(K) es un grupo finito. En primer lugar vamos a probar el siguiente lema de reducción, que nos permitirá asumir en el futuro que E[m] ⊂ E(K) para probar la finitud de E(K)/mE(K). Lema 4.2. Sea K un cuerpo de números, L/K una extensión finita de Galois y m ≥ 2 un entero. Si E(L)/mE(L) es finito, entonces también lo es E(K)/mE(K) para cualquier curva elı́ptica E definida sobre K. Demostración. La inclusión natural E(K) ,→ E(L), induce una aplicación E(K)/mE(K) −→ E(L)/mE(L), con núcleo natural, Φ = {P + mE(K) : P ∈ E(K) ∩ mE(L)} = E(K) ∩ mE(L) . mE(K) Es decir, que para cada P + mE(K) ∈ Φ, existe un punto QP ∈ mE(L) tal que QP = P , (el punto QP no tiene por qué ser único). Podemos entonces construir una aplicación de conjuntos, que no será en general un homomorfismo de grupos, de la siguiente manera: λP : Gal(L/K) −→ E[m]. σ σ 7−→ QP − QP Nótese que efectivamente QσP − QP ∈ E[m], pues [m](QσP − QP ) = ([m]QP )σ − [m]QP = P − P = O, 41 42 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA ya que todo σ ∈ Gal(L/K) fija P ∈ E(K). Veamos ahora que existe una correspondencia entre aplicaciones de Gal(L/K) en E[m] y puntos de Φ. Sean P, P 0 ∈ E(K) ∩ mE(L) dos puntos que dan lugar a la misma aplicación λP = λP 0 , entonces se tiene que QσP − QP = QσP 0 − QP 0 ⇒ (QP − QP 0 )σ = QP − QP 0 para todo σ ∈ Gal(L/K). De modo que QP − QP 0 ∈ E(K), y por tanto: P − P 0 = [m]QP − [m]QP 0 ∈ mE(K) ⇒ P ≡ P0 (mód mE(K)) De modo que, Φ −→ M ap(Gal(L/K), E[m]) P 7−→ λP es inyectivo, y por tanto Φ ha de ser finito, ya que tanto Gal(L/K) como E[m] ∼ = Z/mZ × Z/mZ son grupos finitos, por lo cual existe un número finito de posibles aplicaciones entre ellos. Finalmente,podemos construir una sucesión exacta 0 → Φ → E(K)/mE(K) → E(L)/mE(L), donde tanto Φ como E(L)/mE(L) son finitos, de modo que E(K)/mE(K) ha de ser finito,ya que (E(K)/mE(K))/Φ ⊂ E(L)/mE(L). Gracias a este lema estamos en condiciones asumir que E[m] ⊂ E(K), pues de no ser ası́, siempre podemos construir una extensión finita de Galois L/K, que contenga a todas las coordenadas de los puntos de m-torsión, que ya sabemos que son finitos. Si logramos ver que el teorema es cierto para L, entonces el lema nos asegura que ha de cumplirse para el cuerpo original K. De modo que, sin pérdida de generalidad, asumiremos de ahora en adelante que E[m] ⊂ E(K). El siguiente paso en la prueba del teorema, es trasladar la condición de finitud de E(K)/mE(K) a una cierta condición sobre una extensión finita de K. 4.1. El emparejamiento de Kummer Definición. El Emparejamiento de Kummer, κ : E(K) × Gal(K/K) −→ E[m] se define de la siguiente manera. Sea P ∈ E(K) un punto, escogemos cualquier punto Q ∈ E(K) tal que [m]Q = P . Entonces, κ(P, σ) = Qσ − Q. 4.1. EL EMPAREJAMIENTO DE KUMMER 43 El siguiente resultado describe las propiedades básicas de este emparejamiento: Proposición 4.3. (a) El emparejamiento de Kummer está bien definido. (b) Es bilineal. (c) El núcleo izquierdo del emparejamiento es mE(K). (d) El núcleo derecho del emparejamiento es Gal(K/L). Donde L = K([m]−1 E(K)), es la menor extensión de cuerpos L/K que contiene las coordenadas de todos los puntos Q ∈ E(K) tales que [m]Q ∈ E(K). Demostración. (a) Hemos de probar que, efectivamente, κ(P, σ) ∈ E[m], y que su valor no depende de la elección de Q. En primer lugar, dado que el grupo de Galois actúa sobre los puntos de la curva elı́ptica, con P σ = (x, y)σ = (xσ , y σ ), fijando los puntos K−racionales de la misma, entonces se tiene que [m]κ(P, σ) = [m]Qσ − [m]Q = P σ − P = O. En segundo lugar, se tiene que si Q, Q0 ∈ E(K) son puntos distintos con [m]Q = [m]Q0 = P , entonces Q0 = Q + T donde T ∈ E[m], ya que [m]Q0 − [m]Q = O. Y ası́, (Q + T )σ − (Q + T ) = Qσ − Q + T σ − T = Qσ − Q, ya que hemos supuesto que E[m] ⊂ E(K), y todo σ ∈ Gal(K/K) fija K. (b) La linealidad en P se sigue de la acción del grupo de Galois sobre los puntos de la curva. Para la linealidad en Gal(K/K), veamos que dados σ, τ ∈ Gal(K/K), κ(P, στ ) = Qστ − Q = (Qσ − Q)τ + (Qτ − Q) = κ(P, σ)τ + κ(P, τ ). Pero como κ(P, σ) ∈ E[m] ⊂ E(K), entonces κ(P, σ)τ = κ(P, σ). Ası́, κ(P, στ ) = κ(P, σ) + κ(P, τ ). (c) En primer lugar supongamos que P ∈ mE(K), es decir existe Q ∈ E(K) tal que [m]Q = P , entonces κ(P, σ) = Qσ − Q = O para todo σ ∈ Gal(K/K), ya que Q queda fijado por Gal(K/K). Por otro lado, si κ(P, σ) = O para todo σ ∈ Gal(K/K), entonces Qσ = Q para todo σ ∈ Gal(K/K) de donde se sigue que Q ∈ E(K). (d) Si σ ∈ Gal(K/L), entonces κ(P, σ) = Qσ − Q = O para todo P ∈ E(K) 44 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA dado que por definición Q ∈ L. Recı́procamente, supongamos que σ ∈ Gal(K/K) satisface κ(P, σ) = O para todo P ∈ E(K), entonces, para todo punto Q ∈ E(K) tal que [m]Q ∈ E(K) se tiene, O = κ([m]Q, σ) = Qσ − Q. De modo que σ fija Q, y por tanto fija el cuerpo de definición de Q, digamos K(x(Q), y(Q)). Basta entonces darse cuenta de que L es, por construcción, la unión de todos estos cuerpos de definición ,de modo que σ fija L. Se sigue que σ ∈ Gal(K/L). Corolario 4.4. El emparejamiento de Kummer induce una forma bilineal perfecta: E(K)/mE(K) × Gal(L/K) −→ E[m] Demostración. Se sigue de la proposición anterior que mE(k) y Gal(K/L) son los respectivos núcleos de emparejamiento de Kummer. Basta recalcar que efectivamente la extensión L/K es de Galois, pues los elementos de Gal(K/K) llevan [m]−1 E(K) en sı́ mismo. Además, se sigue del apartado (d), que Gal(K/L) es el núcleo de, Gal(K/K) −→ Hom(E(K), E[m]) σ 7−→ κ(·, σ) y por tanto es un subgrupo normal de Gal(K/K), donde Gal(K/L) ∼ = Gal(K/K)/Gal(K/L). La bilinealidad se conserva al hacer el paso al cociente de manera natural. Lo más interesante de éste resultado es que establece una equivalencia entre la finitud de E(K)/mE(K) y la finitud de Gal(L/K). Pues si E(K)/mE(K) es finito, entonces tenemos que cada σ ∈ Gal(L/K) induce un homomorfismo, κ(·, σ) : E(K)/mE(K) −→ E[m]. Pero como E[m] y E(K)/mE(K) son finitos, también ha de serlo el grupo de homomorfismos Hom(E(K)/mE(K) , E[m]). Y como κ induce una forma bilinear perfecta, los homomorfismos dados por κ(·, σ), κ(·, τ ) coinciden sı́ y sólo si σ = τ . De donde se deduce la finitud de Gal(L/K). Con un argumento análogo a éste se deduce la equivalencia entre la finitud de Gal(L/K) y la de E(K)/mE(K). De modo que de ahora en adelante trataremos de probar que la extensión de cuerpos L = K([m]−1 E(K)) es de ı́ndice finito sobre K. 4.2. Demostración del Teorema Ahora estamos en posición de analizar la extensión de cuerpos L/K. Pero antes de comenzar interpretaremos la inyectividad de la torsión, e 0 0 ), E(K 0 )[m] ,→ E(k v 4.2. DEMOSTRACIÓN DEL TEOREMA 45 en términos de la acción del grupo de Galois. Las extensiones no ramificadas de K corresponden con extensiones del cuerpo residual k, de modo que el grupo absoluto de Galois de K se descompone como 1 −→ Gal(K/K ur ) −→ Gal(K/K) −→ Gal(K ur /K) −→ 1 || || Iv Gal(k/k) donde K ur a la máxima extensión no ramificada de K, e Iv es el subgrupo de inercia de Gal(K/K). En otras palabras Iv es el conjunto de elementos de Gal(K/K) que actúa trivialmente sobre k. Definición. Sea Σ un conjunto en el cual Gal(K/K) actúa. Diremos que Σ es no ramificado en v si la acción de Iv es trivial sobre Σ. Proposición 4.5. Sea L = K([m]−1 E(K)), el cuerpo definido anteriormente. Entonces se cumple, (a) La extensión L/K es abeliana y tiene exponente m, i.e., el grupo de Galois Gal(L/K) es abeliano, y todo elemento en Gal(L/K) tiene orden que divide a m. 0 e v ) singular } ∪ {v ∈ M 0 : v(m) 6= 0} ∪ M ∞ . La extensión (b) Sea S = {v ∈ MK : E(k K K L/K es no ramificada fuera de S, i.e., si v ∈ MK y v ∈ / S, entonces L/K es no ramificada en v. Demostración. (a) Tal y como vimos en la Proposición 4.3 , el emparejamiento de Kummer induce un homomorfismo de grupos inyectivo, φκ : Gal(L/K) ,→ Hom(E(K), E[m]) σ 7→ κ(·, σ) De donde se sigue que L/K es abeliana, pues el grupo de homomorfismos (isogenias) lo es. Además, dado σ ∈ Gal(L/K), se tiene que φκ (σ m ) = κ( · , σ m ) = [m]κ( · , σ) = O, de modo que σ m pertenece al núcleo derecho de la forma bilineal perfecta inducida por κ, y por tanto σ m = id ∈ Gal(L/K) =⇒ ord(σ)|m. (b) Sea v ∈ MK , con v ∈ / S. Para Q ∈ E(K) con [m]Q ∈ E(K), basta probar que K 0 = K(Q)/K es no ramificada en v, ya que L no es más que la composición de todos los K(Q), y la composición de extensiones no ramificadas es no ramificada. Sea v 0 ∈ MK 0 , un lugar de K 0 sobre v, i.e. el valor absoluto que define v 0 restringido a K coincide con v. Y sea kv0 0 /kv la correspondiente extensión de cuerpos residuales, recordemos que kv = Rv /Mv , donde Rv = {x ∈ K : |x|v ≤ 1} y Mv = {x ∈ K : |x|v < 1}. 46 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA Si v ∈ / S, E tiene una buena reducción en v, y por tanto también tiene una buena reducción en v 0 ya que podemos tomar la misma ecuación de Weierstrass, y |∆|v = |∆|v0 = 0 por hipótesis, pues v 0 está sobre v. De modo que tenemos la aplicación de reducción habitual, e 0 0 ), E(K 0 ) −→ E(k v que denotaremos como hasta ahora con una tilde. Sea Iv0 /v = {σ ∈ Gal(K/K) : |xσ − x|v < 1 para todo x ∈ Rv } ⊂ Gal(K/K), el Grupo de Inercia de v 0 /v, que por definición actúa trivialmente sobre el cuerpo residual kv0 0 , y por e v0 ). Dado σ ∈ Iv0 /v , tanto también sobre E(k σ −Q=Q eσ − Q e = O. e Q^ Por otra parte, como [m]Q ∈ E(K), entonces [m](Qσ − Q) = ([m]Q)σ − [m]Q = O. De modo que Qσ − Q es un punto de m-torsión en el núcleo de la aplicación de reducción. Se sigue de la Proposición 3.4 que, e 0 0 ), E(K 0 )[m] ,→ E(k v y por tanto Qσ − Q = O. De modo que todo elemento del grupo de inercia Iv0 /v fija Q, y por tanto se tiene que K 0 = K(Q) no ramifica sobre K en v 0 . Dado que ésto se cumple para todo v 0 situado sobre v, y para todo v ∈ / S, esto completa la prueba de que K 0 /K es no ramificado fuera de S. Lo único que falta para completar la prueba del Teorema de Mordell-Weil, es demostrar que de las propiedades anteriores se puede deducir la finitud de L/K. La prueba de este hecho reside en el Teorema de Hermite, corolario del Teorema de Minkowsky, que establece la finitud del grupo de clases. Teorema 4.6 (Hermite). Sea S un conjunto finito de lugares en K. Entonces existe un número finito de extensiones K 0 /K no ramificadas fuera de S con grado acotado, |K 0 : K| < N para algún N. Demostración. [Teorema débil de Mordell-Weil] Sea L = K([m]−1 E(K)), y 0 e v ) singular } ∪ {v ∈ M 0 : v(m) 6= 0} ∪ M ∞ , S = {v ∈ MK : E(k K K el conjunto de lugares definido en la Proposición 4.5. De ésta proposición se sigue que para todo Q ∈ E(K) con [m]Q ∈ E(K), la extensión K 0 = K(Q) es finita y no ramificada fuera del conjunto S. Además, dado que los conjugados de Galois de Q han de ser de la forma Q + T para algún T ∈ E[m] ⊂ E(K), se tiene que |K(Q) : K| ≤ m2 . 4.2. DEMOSTRACIÓN DEL TEOREMA 47 De modo que el Teorema de Hermite nos dice que cuando Q recorre [m]−1 E(K), sólo aparece un número finito de extensiones K 0 = K(Q)/K, todas de ı́ndice finito. Y dado que L es la composición de las K 0 , se tiene que L/K es finita. Por otro lado, tal y como ya hemos visto el emparejamiento de Kummer induce una forma bilineal perfecta, E(K)/mE(K) × Gal(L/K) −→ E[m], y por tanto la finitud de L/K equivale a la finitud de E(K)/mE(K). A pesar de que desde el comienzo del capı́tulo hemos asumido que K era un cuerpo de números, el Teorema 4.1 también es cierto para curvas definidas sobre ciertos cuerpos globales, como por ejemplo los p-ádicos. Ası́ se tiene que, E(Qp )/mE(Qp ) es finito para toda curva E/Qp . Se tiene de hecho, que el teorema que acabamos de probar también es cierto para cualquier cuerpo de funciones K = k(C), siendo C una curva proyectiva lisa y k un cuerpo algebraicamente cerrado. Sin embargo, la demostración para este caso ha de lidiar con el hecho de que para este tipo de cuerpos (I) El grupo de clases de ideales de K = k(C) es exactamente P ic(C), que no tiene por qué ser finito. (II) El grupo de unidades K ∗ , que coincide con k ∗ , no está finitamente generado. Sin embargo ambas dificultades pueden salvarse debido a que tan sólo se necesita finitud de orden m. Para más detalles consultar III.2 [11]. 48 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA Capı́tulo 5 Descenso, Alturas y el Teorema de Mordell-Weil El objetivo de este capı́tulo es probar que los puntos K-racionales de una curva elı́ptica E, definida sobre un cuerpo de números K, es un grupo finitamente generado. Hasta ahora hemos probado la versión débil del teorema, que establece que para todo entero m ≥ 2 el grupo cociente E(K)/mE(K) es finito. Pero sin embargo esto no implica necesariamente el teorema. Si consideramos por ejemplo una curva elı́ptica E/Qp , sobre un cuerpo local, entonces E(Qp ) posee un subgrupo isomorfo a Zp . De modo que, aunque E(Qp )/mE(Qp ) sea finito, el grupo E(Qp ) no está finitamente generado. Para ello emplearemos el método del descenso. El método del descenso infinito fue introducido por Pierre de Fermat en el siglo XVII. El método se basa a su vez en el axioma de que el conjunto de los números naturales es un conjunto bien ordenado. En este caso el orden vendrá impuesto por los valores reales de las llamadas funciones de altura, que cumpliendo una serie de propiedades nos garantizarán que el grupo de generadores ha de ser finito. En la primera parte del capı́tulo se enunciará y probará el Teorema del Descenso para funciones de altura y grupos abelianos lo más generales posibles, para más adelante estudiar la teorı́a general de las alturas en el espacio proyectivo, y ası́ poder definir después las alturas sobre las curvas elı́pticas. Se probará el Teorema principal para una curva elı́ptica general E/K, empleando por una parte la finitud de E(K)/2E(K) y por otra parte las propiedades de las funciones de altura construidas a lo largo del capı́tulo. Además, tal y como veremos en el capı́tulo siguiente, la demostración del Teorema del Descenso nos da una pista de cómo encontrar generadores de E(K) a partir de los generadores de E(K)/2E(K). 5.1. Teorema del Descenso Teorema 5.1 (Teorema del Descenso). Sea A un grupo abeliano. Supongamos que existe una función de altura, h : A −→ R 49 50 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL con las siguientes propiedades: (i) Dado Q ∈ A. Existe una constante C1 = C1 (Q), dependiendo de A y Q, tal que h(P + Q) ≤ 2h(P ) + C1 para todo P ∈ A (ii) Existe un entero m ≥ 2 y una constante C2 , que depende de A, tal que h(mP ) ≥ m2 h(P ) − C2 para todo P ∈ A (iii) Para cada constante C3 , el conjunto {P ∈ A : h(P ) ≤ C3 } es finito. Si además se tiene que para el entero m de (ii) el grupo A/mA es finito, entonces A es finitamente generado. Demostración. Sea {Q1 , ..., Qn } un conjunto representantes de todas las coclases de A/mA, y P un elemento cualquiera de A. Entonces, P = mP1 + Qi1 con 1 ≤ i1 ≤ n, de modo que P ≡ Qi1 (mód ()m). Podemos entonces construir una sucesión {Pj }, con Pj = mPj+1 + Qij+1 . La condición (ii) en Pj equivale a, h(Pj ) ≤ 1 (h(mPj ) + C2 ) m2 y por construcción = 1 (h(Pj−1 − Qij ) + C2 ) m2 con la condición (i), 1 (2h(Pj−1 ) + C1 (−Qij ) + C2 ) m2 Tomando C10 = máx{C1 (−Qs ) : s = 1, ..., n}, ≤ ≤ 1 (2h(Pj−1 ) + C10 + C2 ) m2 Empleando esta desigualdad repetidamente, tiene 1 2 k h(P ) + + h(Pn ) ≤ 2 m m2 0 k C +C ≤ m22 h(P ) + m12 −22 ≤ 21k h(P ) + 12 (C10 + C2 ) comenzando en Pk y volviendo hasta P , se 2 4 2k−1 + + · · · + m2 m2 m2 pues m ≥ 2. De modo que para k suficientemente grande, 1 h(P ) ≤ 1 + (C10 + C2 ). 2 (C10 + C2 ) 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 51 Como P es una combinación lineal de Pk y Q1 , ..., Qn k P = m Pk + k X mj−1 Qij . j=1 A partir de la condición (iii), se establece que el conjunto 1 {P ∈ A : h(P ) ≤ 1 + (C1 + C2 )} 2 es finito, digamos {Qn+1 , ..., Qr }. Entonces se tiene que A está generado por Q1 , ..., Qr . En primer lugar habremos de definir las funciones de altura para los puntos racionales de una curva elı́pticay ası́ poder utilizar el resultado anterior. Sin embargo lo realmente difı́cil es encontrar los generadores de E(K)/mE(K), y de hecho no existen algoritmos generales para atacar este problema. 5.2. Alturas en el espacio proyectivo Si queremos usar el Teorema del descenso para probar el Teorema de Mordell-Weil en el caso general, hemos de definir una función de altura sobre E(K). Para ello, intentaremos en primer lugar definir funciones de altura sobre el espacio proyectivo Pn (K), y luego tratar de entender cómo se comportan éstas al restringirlas a subconjuntos del espacio, en concreto a los puntos de una curva elı́ptica. Ejemplo 5.1. Sea P ∈ Pn (Q), un punto con coordenadas racionales. Dado que Z es un dominio de ideales principales, podemos encontrar coordenadas homogéneas P = [x0 , ..., xn ] que satisfagan x0 , ..., xn ∈ Z con (x0 , ...xn ) = 1, i.e. sin divisores comunes. En este caso, la altura natural de P es H(P ) = máx{|x0 |, ..., |xn |} Con esta definición, es claro que para cada constante C, el conjunto {P ∈ Pn (Q) : H(P ) ≤ C} es finito. Y tiene, de hecho, como mucho (2C + 1)n elementos. Ésta es la clase de condición de finitud que nos interesa para definir una altura. Si tratamos de generalizar este concepto de altura para cuerpos de números arbitrarios, nos encontraremos con que en muchos casos el anillo de enteros del cuerpo, OK , no es un dominio de ideales principales sino tan sólo un dominio de Dedekind. Por tanto hemos de tomar una dirección diferente, y normalizar los valores absolutos tal y cómo hicimos al comienzo de la sección 3.3. Definición. El conjunto de valores absolutos estándar en un cuerpo de números K, denotado por Mk , es el conjunto de todos los valores absolutos en K cuya restricción a Q coincide con uno de los valores absolutos en Q, p-ádicos o real. 52 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Definición. Dado v ∈ MK . El grado local en v es nv = |Kv : Qv |. Donde Kv y Qv son las respectivas compleciones de K y Q con respecto al valor absoluto v. Recordemos a continuación dos resultados básicos de la teorı́a algebraica de números: Teorema 5.2 (Fórmula de extensión). Sea L/K/Q una torre de cuerpos de números, y sea v ∈ MK . Entonces, X nw = [L : K]nv w∈ML ,w|v (donde w|v significa que la restricción de w a K coincide con v). Teorema 5.3 (Fórmula del producto). Sea x ∈ K ∗ . Entonces Y |x|nv v = 1. v∈Mk Definición. Dado P ∈ Pn (K), la altura de P (en el cuerpo K) viene dada por, Y HK (P ) = máx{|x0 |v , ..., |xn |v }nv . v∈MK Proposición 5.4. Sea P ∈ Pn (K), siendo K un cuerpo de números arbitrario. (a) La altura HK (P ) no depende de las coordenadas homogéneas escogidas para P . (b) La altura satisface HK (P ) ≥ 1, para todo punto P ∈ Pn (K). (c) Sea L/K una extensión finita. Entonces HL (P ) = HK (P )1/[K:Q] . Demostración. (a) Cualquier otra elección de coordenadas serı́a de la forma, [λx0 , ..., λxn ] para algún λ ∈ K ∗. De modo que, por la fórmula del producto, Q Q máx{|λx0 |, ..., |λxn |}nv = |λ|nv máx{|x0 |, ..., |xn |}nv v∈Mk v∈M Q k nv Q = |λ| máx{|x0 |, ..., |xn |}nv v∈M v∈Mk Qk = máx{|x0 |, ..., |xn |}nv . v∈Mk (b) En cualquier punto P en el espacio proyectivo podemos siempre encontrar coordenadas homogéneas en las que una de las coordenadas xi = 1, y por tanto |xi |v = 1 para todo valor absoluto normalizado v ∈ Mk . De modo que todos los factores del producto que define HK (P ) son al menos 1. 5.2. ALTURAS EN EL ESPACIO PROYECTIVO (c) De la fórmula de extensión se sigue, Q HL (P ) = máx{|xi |w }nw w∈M QL Q = máx{|xi |v }nw v∈MK w∈ML , w|v Q = máx{|xi |v }[L:K]nv 53 pues xi ∈ K, por 5.4, v∈MK = HK (P )[L:K] Si estamos en el caso K = Q, entonces HQ coincide con la altura que definimos en el Ejemplo 5.1. Basta tomar coordenadas homogéneas para P ∈ Pn (Q) con x0 , ..., xn ∈ Z y mcd(x0 , ..., xn ) = 1. Entonces se tiene que para todo valor absoluto no arquimediano, para las normas p-ádicas v ∈ MQ0 , |xi |v ≤ 1 para todo i y al menos una coordenada tiene valor absoluto unitario. De modo que el producto que define HQ (P ) sólo depende del valor absoluto arquimediano, i.e. HQ (P ) = máx{|x0 |∞ , ..., |xn |∞ }. En particular, el conjunto {P ∈ Pn (Q) : HQ (P ) ≤ C} es finito para toda constante C. Uno de nuestros objetivos es extender esta propiedad a HK para un cuerpo de números arbitrario. En ocasiones resulta más ventajoso trabajar con una función de altura que no dependa del cuerpo de definición. Definición. Para P ∈ Pn (Q), definiremos la altura (absoluta) de P , digamos H(P ), como sigue: sea K un cuerpo de números tal que P ∈ Pn (K). Entonces, H(P ) = HK (P )1/[K:Q] donde hemos de tomar la raı́z real positiva. De 5.4(c) se sigue que H(P ) está bien definida, y es independiente de la elección de K, y 5.4(b) implica que H(P ) ≥ 1 para todo P ∈ Pn (Q). A continuación, estudiaremos cómo varı́a la altura bajo aplicaciones racionales entre espacios proyectivos. Los resultados en esta dirección serán esenciales para poder probar las propiedades sobre altura que necesitamos para demostrar el Teorema. Definición. Un morfismo de grado d entre espacios proyectivos es una aplicación F : Pn −→ Pm P 7−→ [f0 (P ), ..., fn (P )] donde f0 , ..., fn ∈ Q[x0 , ..., xn ] son polinomios homogéneos de grado d, sin ningún cero en común en Q salvo x0 = · · · = xn = 0. Si F puede expresarse mediante polinomios fi con coeficientes en K/Q, entonces F está definido sobre K. 54 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Teorema 5.5. Sea F : Pn −→ Pm un morfismo de grado d. Entonces existen constantes positivas C1 y C2 , que dependen de F , tales que C1 H(P )d ≤ H(F (P )) ≤ C2 H(P )d para todo P ∈ Pn (Q). Antes de comenzar con la demostración, introduciremos algo de notación para hacer más sencilla la prueba. Digamos que F = [f0 , ..., fm ], donde los fi son polinomios homogéneos sin ceros comunes, y sea P = [x0 , ..., xn ] ∈ Pn (Q) un punto con corrdenadas algebraicas. Sea K un cuerpo de números que contenga x0 , ..., xn y a todos los coeficientes anj de los fj . Para cada valor absoluto v ∈ MK , definimos |P |v = máx |xi |v 0≤i≤n |F (P )|v = máx |fj (P )|v , 1≤j≤m y además diremos que |F |v = máx{|a|v : a es un coeficiente de algún fj }. Entonces, de la definición de altura se tiene Y Y HK (F (P )) = HK (P ) = |P |nv v |F (P )|nv v , v∈MK v∈MK y tiene sentido definir HK (F ) = Y |F |nv v . v∈MK En otras palabras, HK (F ) = H([a0 , ..., ai ]) donde a0 , .a1 , ... son los coeficientes de las funciones fj . Definiremos la función ∞ 1 si v ∈ MK (v) = 0 0 si v ∈ MK De modo que de la desigualdad triangular para el valor absoluto | · |v se deduce |t1 + t2 + · · · + tn |v ≤ n(v) máx{|t1 |v , ..., |tn |v }, para todo v ∈ MK , arquimediano o no arquimediano. Nótese que esta desigualdad coincide con la desigualdad triangular cuando v es no arquimediano, pero sin embargo para valores absolutos arquimedianos ésta es una desigualdad más débil |t1 + t2 + · · · + tn |v ≤ |t1 |v + · · · + |tn |v ≤ n(v) máx{|t1 |v , ..., |tn |v }, de modo que la llamaremos desigualdad triangular débil. Habiendo introducido la notación, podemos regresar a la prueba del Teorema 5.5 Demostración. La cota superior es relativamente sencilla de probar. Sea v ∈ MK , la desigualdad triangular débil establece (v) |fi (P )|v ≤ C1 |F |v |P |dv , 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 55 pues fi es homogénea de grado d. La constante C1 puede coincidir con el número de términos de fi , digamos fi (P ) = a1 n Y d xj j1 + · · · + aC1 j=0 n Y d xj jC−1 . j=0 n+d Nótese que el número de términos es a lo sumo n , pues éste es el número de posibles monomios de grado d con n + 1 variables. Dado que esta estimación se cumple para cada i, entonces (v) |F (P )|v = máx |fi (P )|v ≤ C1 |F |v |P |dv . 1≤i≤m Elevando a la potencia nv y tomando el producto en Mk se tiene Y (v)n Y Y Y v C1 v |F |nv v |P |dn |F (P )|nv v ≤ v . v∈MK v∈MK v∈MK v∈MK Como (v) = 0 para todo valor absoluto finito, se tiene que Y (v)n Y [K:Q] C1 v = Cinv = C1 , ∞ v∈MK v∈MK de modo que tomando la raı́z [K : Q]-ésima se tiene H(F (P )) ≤ C1 H(F )H(P )d . Vale la pena mencionar que en la prueba de la cota superior no hemos empleado la condición sobre la no existencia de ceros comunes de las funciones fi . Sin embargo, tendremos sin duda que emplear esta condición para probar la cota inferior, dado que sin ella existen contraejemplos. Asumiremos entonces que el conjunto {Q ∈ An+1 (Q) : f0 (Q) = · · · = fm (Q) = 0} = {(0, ..., 0)}, cuenta con un único punto. Entonces el Teorema 2.1 (Nullstellenstatz), establece que el ideal I = (f0 , ..., fm ) ∈ Q[x0 , ..., xn ] contiene a alguna potencia xdi i para i = 0, ..., n, ya que xi ∈ rad(I) = I(V (f0 , ..., fn )) pues xi se anula en V (f0 , ..., fn ) = {(0, ..., 0)}. De modo que existen polinomios gij ∈ Q[x0 , ..., xn ] y un entero e ≥ 1 tales que xei = n X gij fj para cada 0 ≤ i ≤ n. j=0 Podemos asumir que gij ∈ K[x0 , ..., xn ] son todos de grado e − d, ya que xei es homogéneo de grado e y todos los fj son homogéneos de grado d. 56 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Adoptaremos la siguiente notación, |G|v = máx{|b|v : b es un coeficiente de algún gij }, Y HK (G) = |G|nv v . v∈MK Nótese que tanto HK (G) como e pueden acotarse en términos de n, m, d y de HK (F ), ya que los coeficientes de los gij están claramente determinados por los de los fj . A su vez e puede acotarse con argumentoscombinatorios barajando las combinaciones posibles monomios de cada fj . Encontrar una buena cota Q[x0 , ..., xn ]-lineales de los n+d n en general no es una tarea fácil, pero para nosotros es suficiente saber que tanto e como HK (G) no dependen del punto P . Recordemos que P = [x0 , ..., xn ]. De la fórmula para xei se sigue P m (v) |xi |ev = gij (P )fj (P ) ≤ C2 máx |gij (P )fj (P )|v j=0 0≤j≤m v (v) ≤ C2 máx |gij (P )|v |F (P )|v , 0≤j≤m donde C2 no depende de P , sino del número de monomios en gij fj . Tomando el máximo sobre los i, obtenemos (v) |P |ev ≤ C2 máx |gij (P )|v |F (P )|v . i,j Cada gij es homogéneo de grado e − d, de modo que la desigualdad triangular débil implica que (v) |gij (P )|v ≤ C3 |G|v |P |e−d v . Donde C3 puede depender de e, que como ya vimos antes puede acotarse en términos de m, n y d. Sustituyendo esta estimación en la fórmula anterior, y multiplicando por |P |d−e v se tiene |P |dv ≤ (C2 C3 )(v) |G|v |F (P )|v . Tomando de nuevo el producto sobre las valoraciones y la raı́z [K : Q]-ésima, se tiene H(P ) ≤ CH(F (P )) que es el resultado deseado, ya que C = C2 C3 H(G) que no dependen más que de n, m, d y H(F ), pero no del punto P . Corolario 5.6. Sea A = (αij ) ∈ GLn+1 (Q), entonces la multiplicación por la matriz A induce un automorfismo A : Pn −→ Pn . Existen constantes C1 y C2 , que dependen de las entradas A, tales que C1 H(P ) ≤ H(F (P )) ≤ C2 H(P ) para todo P ∈ Pn (Q). 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 57 Demostración. Éste es 5.5 para morfismos de grado 1. Trataremos de analizar a continuación la relación que existe entre los coeficientes de un polinomio y la altura de sus raı́ces. Teorema 5.7. Sea f (t) = a0 td + a1 td−1 + · · · + ad = a0 (t − α1 ) · · · (t − αd ) ∈ Q[t] un polinomio de grado d. Entonces, H([a0 , ..., ad ]) ≤ 2d−1 d Y H(αj ) j=1 Demostración. Nótese en primer lugar que la desigualdad no se ve alterada si multiplicamos a f por una constante no nula. De modo que sin pérdida de generalidad podremos asumir que a0 = 1, es decir, que f es un polinomio mónico. Sea K = Q(α0 , ..., αd ), y para v ∈ MK , definimos η(v) = 2 1 ∞ si v ∈ MK 0 si v ∈ MK . Con esta nueva notación, podemos definir la siguiente desigualdad |x + y|v ≤ η(v) máx{|x|v , |y|v } para v ∈ Mk y x, y ∈ K, 0 que coincide con la desigualdad triangular débil para dos sumandos. Nótese que sii v ∈ MK y |x|v 6= |y|v , entonces la desigualdad se convierte en una identidad. Vamos a probar que, máx {|aj |v } ≤ η(v)d−1 1≤j≤d d Y máx{|αj |v , 1} j=1 Lo probaremos por inducción sobre d, el grado del polinomio mónico f . Para d = 1, tenemos que f (t) = t − α1 , y la desigualdad es directa máx{|α1 |v , 1} = 20 máx{|α1 |v , 1}. Supongamos ahora que el resultado es cierto para polinomios de grado d − 1, con raı́ces en K. Escojamos un ı́ndice k tal que |αk |v ≥ |αj |v para 1 ≤ j ≤ d, y definamos el polinomio g(t) = (t − α1 ) · · · (t − αk−1 )(t − αk+1 ) · · · (t − αd ) = b0 td−1 + b1 td−1 + · · · + bd−1 58 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL De modo que f (t) = g(t)(t − αk ), y comparando los coeficientes tenemos que ai = bi − αk bi−1 . Tenemos entonces que, máx {|ai |v } = 0≤i≤d máx {|bi − αk bi−1 |v } 0≤i≤d ≤ η(v) máx {|bi |v , |αk bi−1 |v } 0≤i≤d ≤ η(v) máx {|bi |v } máx{|αk |v , 1} ≤ 0≤i≤d d Q η(v)d−1 máx{|αj |v , 1} hipótesis sobre g j=1 Elevando cada término a la correspondiente potencia nv , y multiplicando a lo largo de MK , nv d Y Y Y η(v)d−1 HK ([a0 , ..., ad ]) = máx {|aj |v }nv ≤ máx{|αj |v , 1} v∈Mk 1≤j≤d j=1 v∈Mk Con η(v) ≤ 2 y la fórmula de extensión, (d−1)[K:Q] HK ([a0 , ..., ad ]) ≤ 2 d Y HK (αj ) j=1 de donde H([a0 , ..., ad ]) ≤ 2 d−1 d Y H(αj ). j=1 Ahora que conocemos ciertas propiedades aritméticas de la función de altura, resulta interesante tratar de entender cómo actúa el grupo de Galois sobre ésta función que hemos definido. Cabrı́a esperar que todos los conjugados de un punto compartiesen altura, pero esto no es en ningún caso un resultado evidente. Teorema 5.8. Sea P ∈ Pn (Q) y σ ∈ Gal(Q/Q). Entonces H(P σ ) = H(P ). Demostración. Sea K/Q un cuerpo tal que P ∈ Pn (K). El cuerpo K no tiene porqué ser de Galois sobre Q, pero σ define en cualquier caso un isomorfismo entre σ : K −→ K σ = {ασ : α ∈ K}, y del mismo modo innduce un isomorfismo entre valores absolutos de K y de K σ , σ : MK v −→ MK σ . 7−→ v σ Ası́, si x ∈ K y v ∈ MK , entonces el valor absoluto asociado v σ queda totalmente determinado por la relación |xσ |vσ = |x|v . Y σ también induce un isomorfismo entre Kv y Kvσσ , de modo que los grados locales satisfacen nv = nvσ . Ahora calculamos, Q HK σ (P σ ) = máx{|xσi |w }nw σ w∈M QK = máx{|xi |v }nvσ v∈M K Q = máx{|xi |v }nv = HK (P ) v∈MK 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 59 Dado que [K : Q] = [K σ : Q], empleando la definición de altura absoluta se tiene, H(P σ ) = H(P ). A continuación vamos a demostrar la propiedad principal de ésta función de altura que acabamos de definir, y para cuya demostración nos hemos estado preparando. Teorema 5.9. Sean C y d constantes positivas. Entonces el conjunto, {P ∈ Pn (Q) : HK (P ) ≤ C y [Q(P ) : Q] ≤ d} es finito. Donde Q(P ) es el mı́nimo cuerpo de definición de P , la mı́nima extensión de Q que contiene las coordenadas homogéneas normalizadas de P . En particular, para todo K cuerpo de números, {P ∈ Pn (K) : HK (P ) ≤ C} es un conjunto finito. Demostración. Sea P ∈ Pn (Q). Escogemos coordenadas homogéneas para P , digamos P = [x0 , ..., xn ], con algún xj = 1. Entonces Q(P ) = Q(x0 , ..., xn ), y tenemos una estimación sencilla de la altura Q máx {|xi |v }nv HQ(P ) (P ) = v∈MQ(P ) 0≤i≤n ! Q n v máx{|xi |v , 1} ≥ máx 0≤i≤n = v∈MQ(P ) máx HQ(P ) (xi ) 0≤i≤n De modo que si H(P ) ≤ C y [Q(P ) : Q] ≤ d, entonces máx H(xi ) ≤ C y máx[Q(xi ) : Q] ≤ d. Basta probar que el conjunto, {x ∈ Q : H(x) ≤ C y [Q(x) : Q] ≤ d} es finito. En otras palabras, hemos reducido el problema al caso de dimensión n = 1, digamos en P1 . Supongamos que x pertenece al conjunto, y por tanto si e = [Q(x) : Q] entonces e ≤ d. Sean {x = x1 , ..., xe } los conjugados de x. El polinomio mı́nimo de x sobre Q es, fx (t) = (t − x1 )(t − x2 ) · · · (t − xe ) = te + a1 te−1 + · · · + ae−1 t + ae ∈ Q[t]. Esamos ahora en posición de estimar, H([1, a1 , ..., ae ]) ≤ 2e−1 e Q H(xj ) (Teorema 5.7), j=1 = 2e−1 H(x)e (Teorema 5.9), ≤ (2C)d pues H(x) ≤ C y e ≤ d. 60 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Dado que a1 , ..., ae ∈ Q, entonces tal y como vimos en el ejemplo 5.1, existe un número finito de puntos P ∈ Pe (Q) con altura acotada (por (2C)d ), y por tanto un número finito de posibles polinomios fx (t). Como cada polinomio fx (t) tiene a lo sumo d raı́ces en K, entonces añade como mucho d elementos al conjunto. De ahı́ se sigue que el conjunto {P ∈ Pn (Q) : H(P ) ≤ C y [Q(P ) : Q] ≤ d} es finito para todo C y d constantes, de modo que si K es una extensión de cuerpos de Q, de ı́ndice finito e, se tiene que HK (P ) = H(P )e por definición, y por tanto el conjunto {P ∈ Pn (K) : HK (P ) ≤ C} ⊂ {P ∈ Pn (Q) : H(P ) ≤ C 1/e y [Q(P ) : Q] ≤ e} es finito, por ser subconjunto de un conjunto finito. 5.3. Alturas en curvas elı́pticas En esta sección utilizaremos toda la teorı́a de alturas desarrollada anteriormente para definir funciones de altura sobre curvas elı́pticas. Trataremos de entender cómo se combinan las funciones de altura con la ley de grupo de las curvas, y como corolario directo de los resultados en esta dirección obtendremos las propiedades necearias para cumplir las hipótesis del teorema del descenso, y ası́ poder probar el teorema de Mordell-Weil en el caso general. Sea E/K una curva elı́ptica. Recordemos que toda función f ∈ K(E) no constante, define un morfismo f : E → P1 , con [1, 0] si P es un polo de f, f (P ) = [f (P ), 1] en otro caso Parece razonable usar f para definir una función de altura sobre E(K) como Hf (P ) = H(f (P )). De todos modos, tal y como pudimos ver en el teorema 5.6, la función de altura H actúa multiplicativamente. Y dado que nos interesará en general entender sus propiedades aditivas, vamos a definir a partir de H una nueva función de altura. Definición. La altura (logarı́tmica absoluta) en el espacio proyectivo es la función h : Pn (Q) −→ R P 7−→ log H(P ) Nótese que la proposición 5.4(b) nos garantiza que h(P ) ≥ 0 para todo P . Definición. Sea E/K una curva elı́ptica, y f ∈ K(E) una función racional. La altura sobre E (relativa a f ) es la función hf : E(K) −→ R P 7−→ h(f (P )) En primer lugar, pondremos en términos de las nuevas funciones de altura la propiedad de finitud demostrada en la sección anterior. 5.3. ALTURAS EN CURVAS ELÍPTICAS 61 Proposición 5.10. Sea E/K una curva elı́ptica, y sea f ∈ K(E) una función no constante. Entonces para toda constrante C, el conjunto {P ∈ E(K) : hf (P ) ≤ C} es finito. Demostración. La función f ∈ K(E) está definida sobre K, y por tanto lleva puntos P ∈ E(K) a puntos f (P ) ∈ P1 (K). Por tanto f define una correspondencia entre los conjuntos: f {P ∈ E(K) : hf (P ) ≤ C} ←→ {Q ∈ P1 (K) : H(Q) ≤ eC } P ←→ f (P ) = Q Y aunque la relación del cardinal entre los conjuntos dependerá del grado de f , la correspondencia nos dá la equivalencia entre la finitud de los conjuntos y sabemos por 5.9 que uno de ellos es finito. El siguiente teorema nos da la relación esencial entre la ley de grupo en curvas elı́pticas y la altura de sus puntos. Lo cual nos servirá para probar que la función hf cumple las condiciones necesarias para poder probar el teorema de Mordell-Weil. Teorema 5.11. Sea E/K una curva elı́ptica, y f ∈ K(E) una función par. Entonces para todo P, Q ∈ E(K), se tiene hf (P + Q) + hf (P − Q) = 2hf (P ) + 2hf (Q) + O(1) Las constantes que aparecen en el término O(1) dependen de la curva E y de f , pero no de los puntos P, Q. Demostración. Tomando una ecuación de Weiestrass para E/K, E : y 2 = x3 + Ax + B. Comenzaremos probando el teorema para la función particular f = x. El caso general se sigue como un corolario sencillo de éste. Como hx (O) = 0 y hx (P ) = hx (−P ), el resultado es directo cuando P = O ó Q = O, pues de hecho se tiene hx (P + Q) + hx (P − Q) = 2hx (P ) + 2hx (Q). Ası́ que asumiremos que P, Q 6= O. Definimos la aplicación racional, x: E −→ P1 [x0 , y0 , 1] 7−→ [x0 , 1] O 7−→ [1, 0] y denotaremos por, x(P ) = [x1 , 1], x(Q) = [x2 , 1], x(P + Q) = [x3 , 1], x(P − Q) = [x4 , 1]. 62 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Donde x3 , x4 pueden valer ∞ si P = ±Q, ya que P = −Q =⇒ P + Q = O =⇒ [x3 , 1] = [1, 0], P =Q =⇒ P − Q = O =⇒ [x4 , 1] = [1, 0]. Si nos encontramos en el caso P 6= ±Q, las fórmulas descritas en 3.1 establecen que si P = [x1 , y1 , 1] y Q = [x2 , y2 , 1], entonces y2 − y1 2 x3 = x(P + Q) = − (x1 + x2 ) x2 − x1 y22 − 2Y1 y2 + y12 − x32 + x2 x1 (x1 + x2 ) = como E : y 2 = x3 + Ax + B (x2 − x1 )2 x32 + Ax2 + B − 2y1 y2 + x31 + Ax1 + B − x32 + x2 x1 (x1 + x2 ) = (x2 − x1 )2 (A + x1 x2 )(x1 + x2 ) + 2B − 2y1 y2 = . (x2 + x1 )2 − 4x1 x2 Del mismo modo, dado que −Q = [x2 , −y2 , 1], se tiene que −y2 − y1 2 − (x1 + x2 ) x4 = x(P − Q) = x2 − x1 y22 + 2y1 y2 + y12 − x32 + x2 x1 (x1 + x2 ) = (x2 − x1 )2 (A + x1 x2 )(x1 + x2 ) + 2B + 2y1 y2 = . (x2 + x1 )2 − 4x1 x2 Ası́ que se tienen las siguientes relaciones x3 + x4 = 2(x1 + x2 )(A + x1 x2 ) + 4B (x1 + x2 )2 − 4x1 x2 , x 3 x4 = (x1 x2 − A)2 − 4B(x1 + x2 ) . (x1 + x2 )2 − 4x1 x2 Definimos la aplicación g : P2 −→ P2 como g([t, u, v]) = [u2 − 4tv, 2u(At + v) + 4Bt2 , (v − At)2 − 4Btu]. Podemos construir el siguiente diagrama, E×E σ /E×E P1 × P1 ww ww w ww w {w P2 G P1 × PG1 g σ GG GG GG GG # / P2 donde G(P, Q) = (P + Q, P − Q), y la aplicación σ es composición de dos aplicaciones E × E −→ (P, Q) 7−→ P1 × P1 −→ P2 (x(P ), x(Q)) ([α1 , β1 ], [α2 , β2 ]) 7−→ [β1 β2 , α1 β2 + α2 β1 , α1 α2 ]. 5.3. ALTURAS EN CURVAS ELÍPTICAS 63 De modo que σ(P, Q) = [1, x1 + x2 , x1 x2 ]. Las fórmulas para x3 y x4 , muestran que el diagrama (P, Q) G / (P + Q, P − Q) _ ([x1 , 1], [x2 , 1]) ([x3 , 1], [x4 , 1]) g / [1, x3 + x4 , x3 x4 ] _ _ [1, x1 + x2 , x1 x2 ] _ es conmutativo, ya que g([1, x1 + x2 , x1 x2 ]) = [(x1 + x2 )2 − 4x1 x2 , 2(x1 + x2 )(A + x1 x2 ) + 4B, (x1 x2 − A)2 − 4B(x1 + x2 )] = [1, x3 + x4 , x3 x4 ] ∈ P2 . El siguiente paso es demostrar que g es un morfismo. Para ello hemos de demostrar que los tres polinomios homogéneos que definen a g, f1 ([t, u, v]) = u2 − 4tv f2 ([t, u, v]) = 2u(At − v) + 4Bt2 f3 ([t, u, v]) = (v − At)2 − 4Btu no tienen ceros comunes, salvo t = u = v = 0. Si t = 0, entonces u2 − 4tv = 0 (v − A)2 − 4Btu = 0 =⇒ u = v = 0. De modo que hemos de asumir que t 6= 0. Ası́ podemos definir una nueva cantidad x = u/2t. Nótese que si identificamos t = 1, u = x1 + x2 , v = x1 x2 , entonces la ecuación u2 − 4tv = 0 se convierte en (x1 − x2 )2 = 0, y x1 = x2 = u/2t, y estamos ocupándonos del caso P = ±Q. Con esta nueva cantidad x que hemos definido, la ecuación u2 − 4tv = 0 puede escribirse como x2 = v/t. Ası́, dividiendo por t2 las identidades f2 ([t, u, v]) = 0 y f3 ([t, u, v]) = 0 se tiene, en términos de x, el siguiente sistema 2u(At + v) + 4Bt2 = 0 ψ(x) = 4x(A + x2 ) + 4B = 4(x3 + Ax + B) = 0 =⇒ (v − At)2 − 4Btu = 0 φ(x) = (x2 − A)2 − 8Bx = x4 − 2Ax2 − 2Bx + A2 = 0 Nótese que, x([2]P ) = x4 − 2Ax2 − 8Bx + A2 φ(x(P )) = 4(x3 + Ax + B) ψ(x(P )) 64 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL no es más que la fórmula de la duplicación. Para probar que φ y ψ no tienen ninguna raı́z en común, basta con verificar la siguiente identidad formal (12x2 + 16A)φ(x) − (3x3 − 5Ax − 27B)ψ(x) = 4(4A3 + 27B 2 ) = 4∆ 6= 0. Es aquı́ donde la no singularidad de la ecuación de Weierstrass cumple un papel crucial, ya que ésto termina la demostración de que g es un morfismo. Y de nuevo en nuestro diagrama conmutativo podemos calcular, h(σ(P + Q, P − Q)) = h(σ ◦ G(P, Q)) = h(g ◦ σ(P, Q)) = 2h(σ(P, Q)) + O(1) Conmutatividad del diagrama Teorema 5.5 pues g es un morfismo de grado 2, por estar definido por polinomios homogéneos de grado dos. Para completar la prueba para f = x basta demostrar que h(σ(R1 , R2 )) = hx (R1 ) + hx (R2 ) + O(1) para todo R1 , R2 ∈ E(Q), ya que si empleamos la relación anterior tendremos h(σ(P +Q, P −Q)) = hx (P +Q)+hx (P −Q)+O(1) = 2hx (P )+2hx (Q)+O(1) = 2h(σ(P, Q))+O(1) que es el resultado que buscamos. En primer lugar, nótese que si R1 = O o R2 = O, entonces el resultado es trivial ya que h(σ(R1 , R2 )) = hx (R1 ) + hx (R2 ). De modo que, x(R1 ) = [α1 , 1] x(R2 ) = [α2 , 1], y por tanto h(σ(R1 , R2 )) = h([1, α1 + α2 , α1 α2 ]) y hx (R1 ) + hx (R2 ) = h(α1 ) + h(α2 ). Aplicando el resultado 5.7 al polinomio f (t) = (t − α1 )(t − α2 ) se obtiene 2−2 H(α1 )H(α2 ) ≤ H([1, α1 + α2 , α1 α2 ]) ≤ 2H(α1 )H(α2 ), y se sigue de las definiciones que, h(α1 ) + h(α2 ) − log 4 ≤ h([1, α1 + α2 , α1 α2 ]) ≤ h(α1 ) + h(α2 ) + log 2 que es la estimación que buscábamos. Corolario 5.12. Sea E/K una curva elı́ptica, y f ∈ K(E) una función par. (a) Dado Q ∈ E(K). Entonces hf (P + Q) ≤ 2hf (P ) + O(1) para todo P ∈ E(K) 5.3. ALTURAS EN CURVAS ELÍPTICAS 65 (b) Dado m ∈ Z, se cumple hf ([m]P ) = m2 hf (P ) + O(1) para todo P ∈ E(K) donde las constantes en O(1) dependen de E, f y de m. Demostración. (a) Dado que hf (P − Q) ≥ 0, el teorema 5.11 nos garantiza la desigualdad, hf (P + Q) ≤ hf (P + Q) + hf (P − Q) = 2hf (P ) + 2hf (Q) + O(1) (b) Como f es par, podemos asumir, sin pérdida de generalidad, que m ≥ 0. Para m = 0 y m = 1 el resultado resulta trivial. Supongamos que el resultado es cierto para m − 1 y m, con m > 1, y veamos que entonces también es cierto para m + 1. En el teorema 5.14, consideramos la identidad con [m]P y P respectivamente. De modo que hf ([m + 1]P ) = −hf ([m − 1]P ) + 2hf ([m]P ) + 2hf (P ) + O(1) = (−(m − 1)2 + 2m2 + 2)hf (P ) + O(1) (por hipótesis) = (m + 1)2 hf (P ) + O(1) Nótese que si f es impar, entonces f 2 es una función par. Y recordemos que por definición, Q H(f 2 (P )) = máx{|f 2 (P )|v , 1}nv Qv∈MQ(P ) nv 2 = v∈MQ(P ) máx{|f (P )|v , 1} Q 2 nv = = H(f (P ))2 v∈MQ(P ) máx{|f (P )|v , 1} Y por construcción de hf , se tiene hf 2 (P ) = h(f 2 (P )) = log H(f 2 (P )) = log H 2 (f (P )) = 2 log H(f (P )) = 2hf (P ). Con esta idea como base se puede ’casi’ extender el resultado anterior a toda clase de funciones, ver VIII.6.5 [10]. Ahora nos encontramos en condiciones de probar el resultado principal del trabajo. Teorema 5.13 (Mordell-Weil). Sea K un cuerpo de números, y E/K una curva elı́ptica. Entonces el grupo E(K) está finitamente generado. Demostración. Escojamos cualquier función par f ∈ K(E), por ejemplo f puede ser la coordenada x en la ecuación de Weierstrass reducida que define la curva E. El teorema de Mordell-Weil se sigue directamente de la versión débil del mismo con m = 2 junto con el teorema del descenso. Basta probar que la función de altura, hf : E(K) −→ R tiene las siguientes propiedades que garantizan que estamos bajo las hipótesis para emplear el Teorema 5.1. 66 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Hipótesis para el descenso: (i) Dado Q ∈ E(K). Existe una constante C1 , que depende de E, f y de Q, tal que hf (P + Q) ≤ 2hf (P ) + C1 para todo P ∈ E(K). (ii) Existe una constante C2 , dependiendo de E y f , tal que hf ([2]P ) ≥ 4hf (P ) − C2 para todo P ∈ E(K). (iii) Para cada constante C3 , el conjunto {P ∈ E(K) : hf (P ) ≤ C3 } es finito. La propiedad (i) no es sino 5.12(a), mientras que (ii) es el caso m = 2 en 5.12(b) y el apartado (iii) es el teorema 5.10. Esto completa la prueba del teorema de Mordell-Weil. A continuación, vamos a ilustrar con un ejemplo cómo emplear el método del descenso empleando las alturas definidas. Ejemplo 5.2. Sea E/Q la curva elı́ptica dada por la ecuación de Weierstrass, E : y 2 = x3 + 9. Tal y cómo hemos visto, si P = (α/β, y) ∈ E(Q), con α, β ∈ Z coprimos, entonces definimos la altura sobre E como hx (P ) = máx{|α|, |β|} donde | · | denota el valor absoluto usual (asociado al único lugar infinito en Q). Supongamos que hemos demostrado que E(Q)/2E(Q) está generado por el punto P = (6, 15). Entonces, se tiene que si un punto R ∈ / 2E(Q), entonces R + P, R − P ∈ 2E(Q), ya que R∈ / E(Q) =⇒ R ≡ P (mód 2E(Q)) ≡ −P (mód 2E(Q)). De la fórmula de la duplicación para E tenemos que un punto Q = (u, v) ∈ 2E(Q) si y sólo si x4 − 4x3 u − 72x − 36u = 0 tiene soluciones racionales. Pues recordemos que, 2 2 3x 9x4 Q = [2]R = (u, v) con u = − 2x = − 2x. 2y 4(x3 + 9) Partiendo de un punto 181479482 18128073165931 R= − , ∈ E(Q) 333756361 6097394959109 5.4. PUNTOS DE TORSIÓN RACIONALES 67 trataremos de descomponerlo en términos de P y de puntos de 2E(Q) de altura 1. En primer lugar, nótese que los únicos puntos de altura 1 son O, Q = (0, 3), −Q = (0, −3) pues hx (R) = 1 equivale a pedir que x = 0. Comenzamos con el punto R, que tiene alura hx (R) = 333756361. Se tiene que R ∈ / 2E(Q), aunque no lo justificaré de momento, esto implica que R + P, R − P ∈ 2E(Q). De modo que tenemos, 10406815022520 1711276861163052201 = [2]S1 , R+P = − ,− 5007404224729 11205183603973252067 497145 494391309 R−P = = [2]R1 , , 238144 116214272 2142 181437 15 183 con S1 = ,− y R1 = − , − 1369 50653 16 64 donde hx (R1 ) = 16 < hx (S1 ) = 2142. Tenemos entonces que R = [2]R1 + P , con hx (R1 ) = 16 << hx (R). En esta ocasión se tiene que R1 ∈ 2E(Q), pues x4 + 15 3 135 x − 72x + =0 4 4 tiene soluciones racionales, x = 3, y se tiene que R1 = [2]R2 , donde R2 = (3, −6) ∈ / 2E(Q). Nuevamente se tiene que R2 ± P ∈ 2E(Q), con R2 + P = (40, −253) = [2]S3 R2 − P = (0, −3) = [2]R3 donde con S3 = (−2, 1), R3 = Q = (0, 3). De modo que hemos conseguido lo que querı́amos, ya que hx (Q) = 1. Ası́ se tiene que, R = [2]R1 + P = [2]([2]R2 ) + P = [2]([4]R3 + [2]P ) = [5]P + [8]Q. Nótese que Q + Q = −Q, de modo que [3]Q = O, y entonces R = [5]P + [2]Q, donde Q ∈ E(Q)tors tiene orden 3. 5.4. Puntos de torsión racionales El Teorema de Mordell-Weil implica que el grupo de torsión racional de una curva elı́ptica, Etors (K), es finito. De modo que lo natural en este punto es preguntarse cómo es la estructura de Etors (K), o si es posible caracterizar los puntos de torsión. En realidad, en esta dirección se tienen resultados muy claros que nos hablan de la estructura de la torsión racional. En primer lugar caracterizaremos los puntos de m-torsión racionales. 68 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Teorema 5.14. Sea E/K una curva elı́ptica con ecuación de Weierstrass y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 con a1 , ..., a6 ∈ OK , siendo OK el anillo de enteros de K. Sea P ∈ E(K) un punto de torsión de orden exacto m ≥ 2. (a) Si m no es una potencia de primo, entonces x(P ), y(P ) ∈ OK . 0 , si denotamos por (b) Si m = pn para p primo, para cada v ∈ MK ordv (p) , rv = n p − pn−1 donde [·] denota la parte entera, entonces se tiene que ordv (x(P )) ≥ −2rv y ordv (y(P )) ≥ −3rv . En particular, si ordv (p) = 0, entonces x(P ), y(P ) son v-enteros (pertenecen a OKv ). El siguiente corolario fué probado independientemente por Nagell y Lutz, quienes descubrieron condiciones de divisibilidad en cierto modo más débiles que las que se dan en el teorema anterior, pero que caracterizan completamente los puntos de torsión racional para curvas definidas sobre Q. Corolario 5.15. Sea E/Q una curva elı́ptica con ecuación de Weierstrass y 2 = x3 + Ax + B A, B ∈ Z. Supongamos que P ∈ E(Q) es un punto no trivial de torsión. (a) x(P ), y(P ) ∈ Z. (b) O bien [2]P = O o bien y(P )2 divide a 4A3 + 27B 2 . Ejemplo 5.3. Sea E la curva del Ejemplo 5.2, E : y 2 = x3 + 9 = (x − ξ1 )(x − ξ2 )(x − ξ3 ), donde ξ1 , ξ2 y ξ3 son las tres raı́ces cúbicas de 9. Como vimos en el Ejemplo 3.1, los tres puntos de torsión no triviales de E son de la forma Pi = (ξi , 0), y ninguno de ellos es racional pues ξi ∈ / Q. De modo que el corolario anterior establece que todo P 0 ∈ E(Q)tors ha de cumplir la condición y(P 0 ) | 32 , y por tanto las opciones son y(P 0 ) ∈ {±1, ±3, ±9}. Tras unos cálculos sencillos se obtienen los puntos ±Q de [3]-torsión. Se puede concluir entonces que, Etors (Q) = {O, Q, −Q} ∼ = Z/3Z. Como ya vimos, el punto P = (6, 15) generaba el grupo E(Q)/2E(Q) ∼ = Z/2Z. Dado que P 6= ±Q, entonces tiene que ser un punto de orden infinito. 5.4. PUNTOS DE TORSIÓN RACIONALES 69 Veamos que todo punto en E(Q) ha de ser una combinación lineal de Q y P . Supongamos que existe un punto P 0 ∈ E(Q), linealmente independiente con P, Q. Entonces E(Q) tendrı́a un subgrupo isomorfo a Z/3Z ⊕ Z ⊕ Z, generado por P, Q y P 0 . Sin embargo, sabemos que al tomar el cociente con 2E(Q), tendrı́amos un subgrupo del subgrupo débil de Mordell-Weil isomorfo a Z/2Z⊕Z/2Z, generado por las coclases de P y P 0 , lo cual es una contradicción, pues E(Q)/2E(Q) sólo tenı́a un generador. De modo que podemos concluir que, E(Q) ∼ = Z/3Z ⊕ Z está generado por P y Q. Uno de los métodos más rapidos en la práctica para acortar el grupo de torsión de E(K) 0 , para los que E tenga una buena reducción, y es escoger varios lugares finitos v ∈ MK utilizar la aplicación de reducción, e v ), E(Kv )[m] ,→ E(k que es inyectivo para m primo con char(kv ). Ejemplo 5.4. La ecuación de Weierstrass, E : y 2 = x3 − 43x + 166 tiene 4A3 + 27B 2 = 215 · 13. Y por tanto cualquier punto de torsión en E(Q) tiene su segunda coordenada y ∈ {0, ±1, ±2, , ±4, , ±8, , ±16, ±32, ±64, ±128} 70 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL (puesto que y 2 divide a 4A3 + 27B 2 , o bien [2]P = O con y = 0). Tras unos pequeños cálculos se obtienen los puntos, {(3 ± 8), (−5, ±16), (11, ±32)} ⊂ Etors (Q). Por otra parte, dado que E tiene una buena reducción módulo 3, sabemos que Etors(Q) se e 3 ), y es sencillo comprobar que E(F e 3 ) = 7. Este hecho, sin embargo, no inyecta en E(F prueba nada, ya que la condición de divisibilidad tan sólo es necesaria, y no suficiente, pero empleando la fórmula de la duplicación para P = (3, 8) tenemos que x(P ) = 3, x([2]P ) = −5, x([4]P ) = 11, y x([8]P ) = 3. Por tanto [8]P = ±P , de modo que P ha de ser un punto de orden 7 o 9, (y P no es un punto de orden 3 pues [2]P 6= ±P ). De las condiciones anteriores se sigue que la única posibilidad es que el orden de P sea 7, y por tanto podemos concluir que Etors (Q) es un grupo cı́clico de orden 7, Etors (Q) = O, P = (3, 8), [2]P = (−5, 16), [3]P = (11, −32), [4] P = (11, 32), [5]P = (−5, −16), [6]P = (3, −8) ∼ = Z/7Z. Este ejemplo ilustra una manera sencilla de encontrar candidatos a ser puntos enteros de torsión. Dado que sólo hay un número finito de posibilidades, se consigue una cota para |Etors (Q)|. Pero para cada candidato hay que comprobar que efectivamente es un punto de torsión y para ello hay que ver que el orden de sea finito. Hasta ahora nos hemos preocupado en caracterizar el subgrupo de torsión de una curva elı́ptica dada, pero otro tipo de pregunta que resulta interesante serı́a: dado un primo p, existe una curva elı́ptica E definida sobre Q tal que E(Q) contenga algún punto de orden p? La respuesta para la mayorı́a de primos es no. La caracterización completa de los subgrupos de torsión sobre Q viene dada por el siguiente teorema de Mazur. Teorema 5.16 (Mazur). Sea E/Q una curva elı́ptica. Entonces el subgrupo de torsión Etors (Q) de E(Q) es isomorfo a unos de los siguientes quince grupos: Z/N Z Z/2Z ⊕ Z/2N Z con 1 ≤ N ≤ 10 o bien N = 12 con 1 ≤ N ≤ 4. Además, para cada uno de esos grupos existe al menos una curva E/Q, cuyo grupo de torsión racional es isomorfo a él. A continuación se incluye una tabla con ejemplos de cada uno de los posibles grupos de torsión caracterizados en el teorema. 5.5. RANGO DE E(K) 71 Curva = x3 − 2 y 2 = x3 + 8 y 2 = x3 + 4 y 2 = x3 + 4x 2 y − y = x3 − x2 y 2 = x3 + 1 2 y = x3 − 43x + 166 y 2 + 7xy = x3 + 16x 2 y + xy + y = x3 − x2 − 14x + 29 y 2 + xy = x3 − 45x + 81 2 y + 43xy − 210y = x3 − 210x2 y 2 = x3 − 4x 2 y = x3 + 2x2 − 3x y 2 + 5xy − 6y = x3 − 3x2 2 y + 17xy − 120y = x3 − 60x2 y2 Torsión trivial Z/2Z Z/3Z Z/4Z Z/5Z Z/6Z Z/7Z Z/8Z Z/9Z Z/10Z Z/12Z Z/2Z ⊕ Z/2Z Z/2Z ⊕ Z/4Z Z/2Z ⊕ Z/6Z Z/2Z ⊕ Z/8Z Generadores O [−2, 0, 1] [0, 2, 1] [2, 4, 1] [0, 1, 1] [2, 3, 1] [3, 8, 1] [−2, 10, 1] [3, 1, 1] [0, 9, 1] [0, 210, 1] [0, 0, 1], [2, 0, 1] [0, 0, 1], [3, 6, 1] [2, −2, 1], [−3, 18, 1] [30, −90, 1], [−40, 400, 1] Kamikenny demostró la finitud del número de los posibles grupos de torsión de las curvas elı́pticas definidas sobre cuerpos de números arbitrarios de grado hasta 14, y el caso general fué establecido por Merel en 1996. Teorema 5.17 (Merel). Para todo entero d ≥ 1, existe una constante N (d) tal que para todo cuerpo de números K/Q de grado como mucho d, y toda curva elı́ptica E/K, se tiene |Etors (K)| ≤ N (d). Es claro que el teorema de Mazur nos dice que N (0) = 16, pero sin embargo, el teorema establece que no puede haber puntos de orden 11 o 13 en E(Q) para ninguna curva elı́ptica, lo cual no es ni mucho menos directo. De modo que el Teorema de Mazur es algo más que un corolario del de Merel. 5.5. Rango de E(K) El Teorema de Mordell-Weil establece que el rango de E(K) es finito para cualquier curva elı́ptica E definida sobre un cuerpo de números K. Resulta natural entonces preguntarse cómo puede llegar a ser el rango. Sin ambargo, a pesar de haber visto que el subgrupo de torsión es relativamente sencillo de calcular, hasta ahora no se conocen algoritmos efectivos para calcular el rango de una curva elı́ptica en general. Existen muy pocos resultados generales concernientes al rango de las curvas elı́pticas. El rango de una curva elı́ptica sobre Q elegida al azar tiende a ser pequeño en general, y no es sencillo crear curvas E/Q de rango moderadamente alto. Sin embargo, se conjetura que existen curvas elı́pticas E/Q de rango arbitrariamente alto. En 1967 Safarevich y Tate demostraron que el resultado análogo es cierto para cuerpos de funciones Fp (t). De modo que es razonable pensar que la conjetura puede ser cierta. 72 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL En esta dirección, se han realizado construcciones de curvas con rango alto, familias con rango hasta 19, o bien curvas individuales de rangos más altos. Ejemplo 5.5. La curva E : y 2 + xy + y = x3 − x2 + αx + β, donde α = −20067762415575526585033208209338542750930230312178956502 β = 3448161179503055646703298569039072037485594435931918036126 6008296291939448732243429 tiene rango como mı́nimo 28. Este ejemplo se le debe a Elkies, que encontró en 2006 los siguientes puntos independientes de orden infinito en E: P1 = [−2124150091254381073292137463, 259854492051899599030515511070780628911531, 1], P2 = [2334509866034701756884754537, 18872004195494469180868316552803627931531, 1], P3 = [−1671736054062369063879038663, 251709377261144287808506947241319126049131, 1], P4 = [2139130260139156666492982137, 36639509171439729202421459692941297527531, 1], P5 = [1534706764467120723885477337, 85429585346017694289021032862781072799531, 1], P6 = [−2731079487875677033341575063, 262521815484332191641284072623902143387531, 1], P7 = [2775726266844571649705458537, 12845755474014060248869487699082640369931, 1], P8 = [1494385729327188957541833817, 88486605527733405986116494514049233411451, 1], P9 = [1868438228620887358509065257, 59237403214437708712725140393059358589131, 1], P10 = [2008945108825743774866542537, 47690677880125552882151750781541424711531, 1], P11 = [2348360540918025169651632937, 17492930006200557857340332476448804363531, 1], P12 = [−1472084007090481174470008663, 246643450653503714199947441549759798469131, 1], P13 = [2924128607708061213363288937, 28350264431488878501488356474767375899531, 1], P14 = [5374993891066061893293934537, 286188908427263386451175031916479893731531, 1], P15 = [1709690768233354523334008557, 71898834974686089466159700529215980921631, 1], P16 = [2450954011353593144072595187, 4445228173532634357049262550610714736531, 1], P17 = [2969254709273559167464674937, 32766893075366270801333682543160469687531, 1], P18 = [2711914934941692601332882937, 2068436612778381698650413981506590613531, 1], P19 = [20078586077996854528778328937, 2779608541137806604656051725624624030091531, 1], P20 = [2158082450240734774317810697, 34994373401964026809969662241800901254731, 1], P21 = [2004645458247059022403224937, 48049329780704645522439866999888475467531, 1], P22 = [2975749450947996264947091337, 33398989826075322320208934410104857869131, 1], P23 = [−2102490467686285150147347863, 259576391459875789571677393171687203227531, 1], P24 = [311583179915063034902194537, 168104385229980603540109472915660153473931, 1], P25 = [2773931008341865231443771817, 12632162834649921002414116273769275813451, 1], P26 = [2156581188143768409363461387, 35125092964022908897004150516375178087331, 1], P27 = [3866330499872412508815659137, 121197755655944226293036926715025847322531, 1], P28 = [2230868289773576023778678737, 28558760030597485663387020600768640028531, 1]. Consultar http : //web.math.hr/ duje/tors/rk28.html para más ejemplos. Capı́tulo 6 Cómo calcular el grupo de Mordell-Weil Tal y como ya vimos en el capı́tulo anterior, para poder calcular los generadores del grupo de Mordell-Weil E(K) basta con conocer los generadores de E(K)/mE(K) para algún m ≥ 2. Desafortunadamente, no existe hoy en dı́a ningún algoritmo conocido que garantice el cálculo de los generadores de E(K)/mE(K) en un tiempo finito. De ahora en adelante, siguiendo con la notación de capı́tulos anteriores, K será siempre un cuerpo de números y MK un conjunto completo de valores absolutos no equivalentes en K. 6.1. Calcular E(K)/mE(K) En esta sección E/K será una curva elı́ptica definida sobre K, y m ≥ 2 un entero. Asumiremos que E[m] ⊂ E(K). Y bajo estas hipótesis, tal y como vimos en la sección 4.1, existe un emparejamiento κ : E(K) × Gal(K/K) −→ E[m] (P, σ) 7−→ Qσ − Q donde Q ∈ E(K) satisface [m]Q = P . Además el resultado 4.3(c) dice que el núcleo por la izquierda es mE(K), de modo que podemos ver κ como un homomorfismo δE : E(K)/mE(K) −→ Hom(Gal(K/K), E[m]), donde δE (P ) es el homomorfismo, δE (P ) : Gal(K/K) −→ E[m] σ 7−→ κ(P, σ) Recordemos que si E[m] ⊂ E(K), entonces µm ⊂ K ∗ . Se sigue de las propiedades básicas del emparejamiento de Weil, Corolario 3.6, em : E[m] × E[m] −→ µm ⊂ K ∗ . 73 74 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Por otra parte µm ⊂ K ∗ , el Teorema 90 de Hilbert dice que todo homomorfismo de Gal(K/K) a µm , es de la forma ψβ : Gal(K/K) −→ µm σ σ 7−→ ββ ∗ para algún β ∈ K con β m ∈ K ∗ . En el lenguaje de la cohomologı́a de grupos, se reduce a H 1 (Gal(K/K), µm ) = Z 1 (Gal(K/K), µm ) ∼ ∗ = K /(K ∗ )m , 1 Bcont (Gal(K/K), µm ) donde H 1 (Gal(K/K), µm ) es el primer grupo de cohomologı́a de µm como Gal(K/K)-módulo. En otras palabras, existe un isomorfismo δK : K ∗ /(K ∗ )m −→ Hom(Gal(K/K), µm ) b 7−→ [σ 7→ β σ /β] ∗ donde β ∈ K se escoge de modo que β m = b. Empleando las aplicaciones δE y δK , podemos probar el Teorema de Mordell-Weil en su versión débil de una manera explı́cita, y derivar ası́ fórmular que nos permitiran calcular el grupo de Mordell-Weil en ciertos casos. Teorema 6.1. (a) Con la notación anterior, existe un emparejamiento bilineal b : E(K)/mE(K) × E[m] −→ K ∗ /(K ∗ )m tal que em (δE (P ), T ) = δK (b(P, T )). (b) El emparejamiento en (a) es no degenerado por la izquierda. ∞ , el conjunto de (c) Sea S ⊂ MK la unión de el conjunto de los lugares infinitos, MK primos finitos en los que E tiene una reducción mala, y el conjunto de primos finitos que dividen a m. Entonces la imagen del emparejamiento en (a) pertenece a al siguiente subgrupo de K ∗ /(K ∗ )m : K(S, m) = {b ∈ K ∗ /(K ∗ )m : ordv (b) ≡ 0 (mód m) para todo v ∈ / S} (d) El emparejamiento en (a) puede calcularse como sigue. Para cada T ∈ E[m], escogemos funciones fT , gT ∈ K(E) que satisfagan las siguientes condiciones: (1) div(fT ) = m(T ) − m(O) (2) fT ◦ [m] = gTm Entonces para todo punto P 6= T , b(P, T ) ≡ fT (P ) (mód (K ∗ )m ). Si P = T , podemos calcular b(T, T ) empleando la linealidad del emparejamiento. Por ejemplo, si [2]T 6= O, entonces b(T, T ) = fT (−T )−1 . Sea Q ∈ E(K) cualquier punto con Q 6= T , entonces b(T, T ) = fT (T + Q)fT (Q)−1 . 6.1. CALCULAR E(K)/M E(K) 75 Demostración. (a) En primer lugar, recordando la notación que hemos empleado, veamos que δK (b(P, T )) = em (δE (P ), T ) ∈ Hom(Gal(K/K), µm ), determina totalmente el emparejamiento b. Por un lado, em (δE (P ), T ) : Gal(K/K) −→ µm σ 7−→ gT (X + δE (P )(σ))/gT (X) = gT (X + κ(P, σ))/gT (X) = gT (X + (Qσ − Q))/gT (X) y además, δK (b(P, T )) : Gal(K/K) −→ µm σ 7−→ β(P, T )σ /β(P, T ) donde b(P, T ) = β(P, T )m . Por el teorema de Hilbert sabemos que todo homomorfismo entre Gal(K/K) y µm , cuando ∗ µm ∈ K , es de la forma σ 7−→ β σ /β de modo que em (δE (P )(·), T ) determina de manera única β(P, T ), y por tanto b(P, T ). La bilinealidad de b se sigue de la bilinealidad de los emparejamientos de Weil, em , y de Kummer, κ: em (δE (P + P 0 ), T ) = em (κ(P + P 0 , ·), T ) = em (κ(P, ·) + κ(P 0 , ·), T ) = em (κ(P, ·), T )em (κ(P 0 , ·), T ) em (δE (P ), T + T 0 ) = em (κ(P, ·), T + T 0 ) = em (κ(P, ·), T + T 0 ) = em (κ(P, ·), T )em (κ(P, ·), T 0 ) (b) Para probar que el emparejamiento es no degenerado por la izquierda, supondremos que b(P, T ) = 1 para todo T ∈ E[m]. Esto equivale a decir que para todo T ∈ E[m] y σ ∈ Gal(K/K), em (κ(P σ), T ) = 1. La condición de no degeneración del emparejamiento de Weil implica que κ(P, σ) = 0 para todo σ ∈ Gal(K/K), de modo que P ∈ mE(K). (c) Sea β(P, T ) = b(P, T )1/m , obtenido a partir del emparejamiento definido en (a). Entonces fijado (P, T ) ∈ E(k)/mE(K) × E[m], se tiene em (Qσ − Q, T ) = β(P, T )σ /β(P, T ) ∈ µm para todo σ ∈ Gal(K/K), donde [m]Q = P . Se sigue de las definiciones que K(β(P, T )) es un subcuerpo de L = K([m]−1 E(K)), el cuerpo descrito en 4.3.(d). Sabemos por el Teorema 4.5(b) que la extensión de cuerpos L/K es no ramificada fuera de S. Veamos ahora que si v ∈ MK es un lugar finito con v(m) = 0, entonces la extensión K(β(P, T ))/K no ramifica en v si y sólo si ordv (β(P, T )) ≡ 0 (mód m). Donde ordv : K ∗ −→ Z es la valoración normalizada asociada a v. Ésto dice precisamente que b(P, T ) ∈ K(S, m). 76 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL ∗ (d) Escojamos Q ∈ E(K) y β ∈ K , tales que P = [m]Q y b(P, T ) = β m . Entonces por definición se tiene que para todo σ ∈ Gal(K/K) em (δE (P )(σ), T ) = em (κ(P, σ), T ) = em (Qσ − Q, T ) = gT (X + (Qσ − Q))/gT (X), donde X ∈ E(K) es cualquier punto tal que gT (X + (Qσ − Q))gT (X) 6= 0. Por otro lado, en (a) hemos visto que em (δE (P )(σ), T ) = δK (b(P, T ))(σ) = β σ /β. De modo que si tomamos X = Q ∈ E(K), se tiene que gT (Qσ )/gT (Q) = β σ /β. Dado que δK define un isomorfismo, entonces gTm (Q) ≡ β m (mód (K ∗ )m ). Utilizando la definición de fT y gT vemos que gTm (Q) = fT ◦ [m](Q) = fT ([m]Q) = fT (P ) ∈ K ∗ , y por tanto fT (P ) ≡ b(T, P ) (mód (K ∗ )m ). Veremos a continuación cómo el teorema 6.1 nos permitirá calcular el grupo E(K)/mE(K), que como ya hemos visto nos permitirá encontrar los generadores del grupo de MordellWeil. En primer lugar, sabemos que el conjunto K(S, m) definido en 6.1(c) es finito, y podemos calcularlo de manera sencilla. Por otro lado, la función fT , que deriva de la construcción del emparejamiento de Weil, también resulta sencilla de calcular a partir de la ecuación de la curva E. De hecho, la condición div(fT ) = m(T ) − m(O) determina la función salvo multiplicación por escalares, pero la condición fT ◦ [m] = gTm con gT ∈ K(E) determina completamente la función. Para calcular el grupo E(K)/mE(K) tan sólo hemos de: 1. Fijar generadores T1 , T2 de E[m] ∼ = Z/mZ × Z/mZ. Entonces todo T ∈ E[m] es de la forma, T = [m1 ]T1 + [m2 ]T2 0 ≤ m1 , m1 < m. 2. Para todo (b1 , b2 ) ∈ K(S, m)×K(S, m), tenemos que comprobar si existe una solución (P, z1 , z2 ) ∈ E(K) × K ∗ × K ∗ del sistema: b1 z1m = fT1 (P ) b2 z2m = fT2 (P ) Pues recordemos que el apartado (d) del teorema anterior asegura que si P 6= T , entonces b(P, T ) ≡ fT (mód (K ∗ )m ), de modo que si bi zim = fTi (P ) para algún zi ∈ (K ∗ )m , entonces bi = b(P, Ti ) es preimagen del par (P, Ti ) ∈ E(K) × E[m]. Además dado que T1 , T2 generan E[m], se tiene por bilinealidad de b que b(P, [m1 ]T1 + [m2 ]T2 ) = b(P, T1 )m1 b(P, T2 )m2 = b([m1 ]P, T1 )b([m2 ]P, T2 ). 6.2. 2-DESCENSO COMPLETO 77 3. Por último, que b(P, T ) sea no degenerada por la izquierda implica que si b(P, T1 ) = b(P 0 , T1 ) b(P, T2 ) = b(P 0 , T2 ) =⇒ b(P, T ) = b(P 0 , T ) para todo T ∈ E[m] y por tanto P − P 0 ∈ mE(K), de modo que P = P 0 ∈ E(K)/mE(K) representan la misma coclase. De modo que resulta equivalente encontrar las parejas (b1 , b2 ) ∈ K(S, m) × K(S, m) para las que el sistema tiene solución (P, z1 , z2 ) ∈ E(K) × K ∗ × K ∗ , que encontrar los representantes P ∈ E(K) de las coclases de E(K)/mE(K). Pues de cada pareja se puede recuperar el punto P , tal y cómo se detalla a continuación. Además dado que hay un número finito de pares (b1 , b2 ), sólo hay un número finito de sistemas. En términos de x, y, en las ecuaciones de Weierstrass de la curva, estamos buscando elementos (x, y, z1 , z2 ) ∈ K × K × K × K ∗ × K ∗ tales que, 2 y + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 b1 z1m = fT1 (x, y) b2 z2m = fT2 (x, y) Las ecuaciones anteriores definen un espacio homogéneo HE (b1 , b2 ) para E/K, que a lo sumo cuenta con un punto K-racional. De modo que calcular E(K)/mE(K) depende de que seamos o no capaces de calcular la existencia (o no existencia) de puntos K-racionales en un conjunto finito de espacios homogéneos HE (b1 , b2 ). Veremos más adelante, que ésta no es una tarea sencilla en general, y que en muchos casos no será posible justificar dicha existencia (o no existencia), debido básicamente a que en este tipo de variedades algebraicas no se cumple el principio de Hasse (local-global). En ocasiones será casi directo descartar uno de estos espacios homogéneos, por ejemplo si no tiene puntos en Kv para algún v ∈ MK entonces tampoco tendrá puntos racionales. Sin embargo podemos encontrarnos con espacios homogéneos que tienen soluciones en todas las compleciones Kv , v ∈ Mk , y sin embargo no tienen puntos K-racionales. 6.2. 2-Descenso Completo Consideraremos el caso especial en el que m = 2, que es sin duda el más sencillo para trabajar. Bajo la suposición de que E[m] ⊂ E(K), podemos considerar una ecuación de Weierstrass de la forma E : y 2 = (x − e1 )(x − e2 )(x − e3 ) con e1 , e2 , e3 ∈ K. 78 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Entonces los 3 puntos notriviales de 2-Torsión son T1 = (e1 , 0), T2 = (e2 , 0), T3 = (e3 , 0). Dado que la recta x − ei = 0 es tangente a la curva E en el punto Ti , entonces tal y como vimos en la sección 2.4 div(x − ei ) = 2(Ti ) − 2(O) i = 1, 2, 3. De modo que en este caso tenemos que div(fT ) = div(x − e) cuando T = (e, 0) es uno de los puntos anteriores. Empleando la fórmula de la duplicación, para la curva E : y 2 = (x − e1 )(x − e2 )(x − e3 ) = x3 − x2 (e1 + e2 + e3 ) + x(e1 e2 + e1 e3 + e2 e3 ) − (e1 e2 e3 ), se tiene que, (x − e) ◦ [2] = (x2 − 2ex − 2e2 + 2(e1 + e2 + e3 )e − (e1 e2 + e1 e3 + e2 e3 ) 2y 2 , de modo que efectivamente fT (x, y) = x − e. Supongamos ahora que (b1 , b2 ) ∈ K(S, 2) × K(S, 2) y queremos dererminar cuándo existe algún punto P ∈ E(K)/2E(K) que cumpla b(P, T1 ) = b1 y b(P, T2 ) = b2 , donde recordemos que T1 , T2 son generadores de E[2] = {O, T1 , T2 , T1 +T2 } ∼ = Z/2Z×Z/2Z. Tal punto existirá si y sólo si existe una solución (x, y, z1 , z2 ) ∈ K × K × K ∗ × K ∗ del sistema de ecuaciones, 2 y = (x − e1 )(x − e2 )(x − e3 ), b1 z12 = x − e1 , b2 z22 = x − e2 , que sustiyendo las dos últimas ecuaciones en la primera, y definiendo una nueva variable z3 con y = b1 b2 z1 z2 z3 , se tiene el siguiente sistema de ecuaciones b1 b2 z32 = x − e3 , b1 z12 = x − e1 , b2 z22 = x − e2 . Finalmente, se obtienen el siguiente par de ecuaciones tras despejar la variable x: b1 z12 − b2 z22 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e2 . Esto nos da una colección finita de ecuaciones, una para cada par (b1 , b2 ), y emplearemos todas la técnicas a nuestra disposición para determinar cuando éstas tienen solución. Nótese que cuando encontramos una solución (z1 , z2 , z3 ) entonces recuperamos inmediatamente el correspondiente punto P = (x, y) ∈ E(K)/2E(K) con las fórmulas, x = b1 z12 + e1 y = b1 b2 z1 z2 z3 . Por último, hemos de lidiar con el hecho de que la definición que establecimos en 6.1(d) de b(P, T ) = fT (P ) no puede emplearse cuando P = T . Es decir, hay dos parejas (b1 , b2 ) 6.2. 2-DESCENSO COMPLETO 79 que no se pueden obtener con el procedimiento anterior, digamos (b(T1 , T1 ), b(T1 , T2 )) y (b(T2 , T1 ), b(T2 , T2 )). Estos valores se pueden sin embargo calcular aprovechando la bilinealidad de b, b(T1 , T2 ) = b(T1 , T1 + T2 )b(T1 , T2 )−1 = b(T1 , T3 )b(T1 , T2 )−1 e1 − e3 = , e1 − e2 y de manera análoga, b(T2 , T2 ) = e2 − e3 . e2 − e1 Vamos a recoger el procedimiento completo en la siguiente proposición. Proposición 6.2 (2-Descenso Completo). Sea E/K una curva elı́ptica dada por una ecuación de Weierstrass, y 2 = (x − e1 )(x − e2 )(x − e3 ) con e1 , e2 , e3 ∈ K. Sea S ⊂ MK un conjunto finito de lugares de K que incluya todos los lugares arquimedianos, todos los lugares que dividan a 2, y todos aquellos lugares en los que la curva E tenga una mala reducción. Además, sea K(S, 2) = {b ∈ K ∗ /(K ∗ )2 : ordv ≡ 0 (mód 2) para todo v ∈ / S}. Entonces existe un homomorfismo inyectivo E(K)/2E(K) −→ K(S, 2) × K(S, 2) definido por (x − e1 , x − e2 ) e1 −e3 , e1 − e2 e1 −e2 P = (x, y) − 7 → 3 e2 − e1 , ee22 −e −e 1 (1, 1) si x 6= e1 , e2 si x = e1 si x = e2 si P = O Sea (b1 , b2 ) ∈ K(S, 2) × K(S, 2), una pareja que no es imagen de uno de los tres puntos O, (e1 , 0), (e2 , 0). Entonces (b1 , b2 ) es la imagen de un punto P = (x, y) ∈ E(K)/2E(K) si y sólo si las ecuaciones b1 z12 − b2 z2 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e1 , tiene una solución (z1 , z2 , z3 ) ∈ K ∗ × K ∗ × K. Si tal solución existe, entonces podemos tomar P = (x, y) = (b1 z12 + e1 , b1 b2 z1 z2 z3 ). Demostración. Tal y como explicamos anteriormente, éste no es sino el caso m = 2 del teorema 6.1. 80 6.3. CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Un ejemplo A continuación ilustraremos cómo calcular E(K)/2E(K), y obtendremos los generadores del grupo de Mordell-Weil, en un caso concreto. Ejemplo 6.1. Tomemos E/Q la curva elı́ptica dada por, E : y 2 = x3 − 12x2 + 20x = x(x − 2)(x − 10), y con discriminante ∆ = 490600 = 214 52 . Tal y como ya hemos visto E tiene una buena reducción módulo cualquier primo salvo 2 y 5. Reduciendo la ecuación módulo 3, se tiene e : y 2 = x(x − 1)(x + 1) E es sencillo comprobar que e 3 ) = {P1 = (0, 0), P2 = (−1, 0), P3 = (1, 0), O}, E(F tiene cuatro puntos F3 -racionales. Dado que E[2] ∼ = Z/2Z × Z/2Z ⊂ Etors , que a su vez se e 3 ), tal y como vimos en el capı́tulo 3, se tiene que E[2] = Etors . inyecta en E(F Sea S = {2, 5, ∞} ⊂ MQ . Entonces un conjunto de representantes completo para Q(S, 2) = {b ∈ Q∗ /(Q∗ )2 : ordv (b) ≡ 0 (mód 2) para todo v ∈ / S} viene dado por {±1, ±2, ±5, ±10} en Q∗ /(Q∗ )2 , ya que, salvo por cuadrados, los elementos de Q(S, 2) no pueden ser divisibles por ningún primo distinto de 2, 5. Consideremos a continuación la aplicación definida en 6.2, con e1 = 0, e2 = 2, e3 = 10: E(Q)/2E(Q) −→ Q(S, 2) × Q(S, 2) (x, y) 7−→ (x, x − 2) si x 6= 0, 2 Hay 82 pares (b1 , b2 ) ∈ Q(S, 2) × Q(S, 2), y para cada par debemos comprobar cuando proviene de un elemento de E(Q)/2E(Q). Por ejemplo, usando el resultado 6.2, podemos calcular la imagen de E[2] en Q(S, 2) × Q(S, 2): O 7→ (1, 1), (0, 0) 7→ (5, −2), (2, 0) 7→ (2, −1), (10, 0) 7→ (10, 8) ≡ (10, 2) (mód (Q∗ )2 ). Aun falta determinar, para cada par (b1 , b2 ), cuando las ecuaciones b1 z12 − b2 z22 = 2, b1 z12 − b1 b2 z32 = 10, tienen una solución z1 , z2 , z3 ∈ Q. Por ejemplo, si b1 < 0 y b2 > 0, entonces el sistema no podrá tener soluciones racionales, pues ni siquiera tiene solucion en R. Empleando esta misma estrategia, vamos a encontrar cuáles de los 64 pares (b1 , b2 ) son preimagen de un punto P . Es decir, cúando el sistema tiene solucion. 6.3. UN EJEMPLO 81 1. Si b1 < 0 y b2 > 0, entonces b1 z1 − b2 z2 = 2 no tiene soluciones en R, y por tanto tampoco en Q. Con ésta condición descartamos las16 parejas: {(−1, 1), (−2, 1), (−5, 1), (−10, 1), (−1, 2), (−2, 2), (−5, 2), (−10, 2), (−1, 5), (−2, 5), (−5, 5), (−10, 5), (−1, 10), (−2, 10), (−5, 10), (−10, 10)}. 2. Si b1 < 0 y b2 < 0, entonces b1 z1 − b1 b2 z32 = 10 no tiene soluciones en R. Con esta condición descartamos las 16 parejas: {(−1, −1), (−2, −1), (−5, −1), (−10, −1), (−1, −2), (−2, −2), (−5, −2), (−10, −2), (−1, −5), (−2, −5), (−5, −5), (−10, −5), (−1, −10), (−2, −10), (−5, −10), (−10, −10)}. 3. Los cuatro puntos de torsión O, T1 = (0, 0), T2 = (0, 2), T3 = T1 + T2 = (0, 10), van a parar respectivamente a las cuatro parejas: {(1, 1), (5, −2), (2, −1), (10, 2)}. 4. La pareja (b1 , b2 ) = (1, −1), corresponde con el sistema 2 z1 + z22 = 2 z12 + z32 = 10 que tiene como solución (z1 , z2 , z3 ) = (1, 1, 3) que da lugar al punto P0 = (1, −3) ∈ E(Q). 5. Si sumamos el punto P0 = (1, −3) a los cuatro puntos de 2-torsión no triviales, corresponde con multiplicar sus correspondientes (b1 , b2 ), ya que para T fijo b(·, T ) es un homomorfismo. Este procedimiento nos da los tres pares: {(5, 2), (2, 1), (10, −2))} ⊂ Q(S, 2) × Q(S, 2). Que corresponden con los puntos, P1 = (20, 60), P2 = (18, −48), P3 = (10/9, −80/27) ∈ E(Q). 6. Si b1 6≡ 0 (mód 5), y b2 ≡ 0 (mód 5). Se tiene que ord5 (b1 z12 ) = 2ord5 (z1 ) tiene que ser par, y ord5 (b2 z22 ) = 2ord5 (z2 )+1 es impar. De modo que la ecuación b1 z12 −b2 z22 = 2 implica que z1 , z2 ∈ Z5 . De la segunda ecuación se tiene que z1 ≡ 0 (mód 5), y junto con la primera ecuación tenemos que 0 ≡ 2 (mód 5) lo cual es una contradicción. Por tanto, el sistema no puede tener soluciones en Q5 , y tampoco en Q, para los 8 nuevos pares: {(1, ±5), (2, ±5)(1, ±10)(2, ±10)}. 82 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL 7. Los 8 pares en el apartado anterior son Q5 -no triviales, i.e. el sistema no tiene soluciones en Q5 . De modo que si multiplicamos esos pares por el par Q-trivial (5, 2), obtendremos 8 nuevas parejas Q5 -no triviales: {(5, ±10), (10, ±10), (5, ±20) ≡ (5, ±5) (mód (Q∗ )2 ), (10, ±20) ≡ (10, ±5) (mód (Q∗ )2 )}. 8. La pareja (b1 , b2 ) = (1, 2), corresponde con el sistema 2 z1 − 2z22 = 2 z12 − 2z32 = 10 Como 2 no es residuo cuadrático módulo 5, la segunda ecuación implica que z1 ≡ z3 ≡ 0 (mód 5). Se tiene entonces que en la tercera ecuación, 0 ≡ 10 (mód 2)5, lo cual es una contradicción. Por tanto el sistema no tiene soluciones en Q5 . 9. Tomando este último par Q5 -no trivial del apartado anterior, y multiplicándolo por los 7 pares que ya tenemos en la tabla (correspondientes a los 7 puntos que ya hemos calculado), obtenemos 7 nuevas parejas Q5 -no triviales que completan la tabla. {(2, ±2), (5, ±1), (10, ±1), (1, −2)}. b2 \b1 1 2 5 10 -1 -2 -5 -10 1 O Q5 Q5 Q5 P0 Q5 Q5 Q5 2 P2 Q5 Q5 Q5 T2 Q5 Q5 Q5 5 Q5 P1 Q5 Q5 Q5 T1 Q5 Q5 10 Q5 T3 Q5 Q5 Q5 P3 Q5 Q5 -1 R R R R R R R R -2 R R R R R R R R -5 R R R R R R R R -10 R R R R R R R R Cálculo de E(Q)/2E(Q) para E : y 2 = x(x − 2)(x − 10). Ası́ hemos comprobado una a una las condiciones de compatibilidad de cada una de las 64 parejas (b1 , b2 ) ∈ Q(S, 2) × Q(S, 2). Y hemos obtenido los puntos, {O, T1 , T2 , T3 , P0 , P1 = P0 + T1 , P2 = P0 + T2 , P3 = P0 + T3 } = E(Q)/2E(Q). Para calcular los generadores de la parte libre de E(Q), basta darse cuenta de que podemos inyectar el cociente E(Q)/2E(Q) de manera natural en el grupo E(Q)/2E(Q) ,→ E(Q) ∼ = Etors × Zr . Y dado que Etors = E[2] = {O, T1 , T2 , T3 }, entonces los generadores de Zr han de ser imagen de alguno de los puntos {P0 , P1 , P2 , P3 } ⊂ E(Q)/2E(Q). 6.3. UN EJEMPLO 83 Y por construcción sabemos que estos cuatro puntos son linealmente dependientes, de modo que la parte libre del grupo tiene un sólo generador, digamos P . Podemos entonces concluir que, E(Q) ∼ = Z/2Z ⊕ Z/2Z ⊕ Z =< T1 , T2 , P > . Como ya hemos dicho anteriormente, resulta relativamente sencillo encontrar los generadores de E(Q) a partir de los de E(Q)/2E(Q), pero en general no será tan sencillo como en el ejemplo anterior. Pues tenemos un número finito de sistemas de ecuaciones que definen un número finito de espacios homogéneos, HE (b1 , b2 ) = {(z1 , z2 , z3 ) : b1 z12 − b2 z22 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e1 } ⊂ A3 (K), donde E : y 2 = (x − e1 )(x − e2 )(x − e3 ) es nuestra curva. Y para cada uno de ellos hemos de comprobar si tiene o no algún punto K-racional (que dará lugar a un punto P ∈ E(K)/2E(K)). La dificultad de este proceso radica en que no siempre podremos encontrar una solución racional, ni probar que no existen soluciones en alguna compleción Kv de K. Puede suceder incluso, que existiendo Kv -racionales para toda valoración v ∈ MK , puedan no existir puntos K-racionales, i.e. el principio Local-Global de Hasse no se puede aplicar a este tipo de variedades. 84 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Capı́tulo 7 Variedades Abelianas En su tesis doctoral, escrita entre 1927 y 1928, André Weil demostró que los puntos racionales de la variedad Jacobiana de cuelquier curva, definida sobre un cuerpo de números, era finitamente generada. Este resultado es conocido como el Teorema de Weil, y supone la generalización del teorema que habı́a probado Mordell años antes, que se ocupaba exclusivamente de las curvas elı́pticas definidas sobre Q. Como corolario directo del Teorema de Weil se obtiene la finitud de los generadores de cualquier curva elı́ptica definida sobre un cuerpo de números arbitrario K, es por eso que el resultado principal del trabajo se conoce como Teorema de Mordell-Weil. A partir de esta tesis, Weil comenzó a investigar las variedades abelianas. La mejor manera de comprender las variedades abelianas es como análogos de las curvas elı́pticas en dimensiones mayores. Una variedad abeliana es básicamente una variedad proyectiva A, con estructura de grupo abeliano en la que las operaciones suma e inverso son morfismos. En este caso, la Jacobiana de una variedad serı́a el análogo al grupo (E, ⊕) en una curva elı́ptica, aunque éste es un caso especial, ya que para las curvas elı́pticas la variedad y su jacobiana coinciden. Tal y como ya hemos visto, si E es una curva elı́ptica sobre un cuerpo algebraicamente cerrado K, entonces existe un isomorfismo canónico E(K) −→ P ic0 (E) P 7−→ (P ) − (O) que define una estructura de grupo en E a partir de la estructura natural en P ic0 (E). A través de esta construcción podemos encontrar dos generalizaciones distintas: (I) Sea C una curva, y Q ∈ C(K) un punto. Entonces existe una variedad abeliana J, llamada la variedad Jacobiana de la curva C, y una aplicación regular ϕ : C −→ J, tal que ϕ(Q) = 0 y 0 Div P (C) −→ J P i ni Pi 7−→ i ni ϕ(Pi ) induce un isomorfismo entre P ic0 (C) y J(K). La dimensión de J coincidirá con el género de C. 85 86 CAPÍTULO 7. VARIEDADES ABELIANAS (II) Sea A una variedad abeliana. Entonces existe una variedad abeliana dual A∨ tal que P ic0 (A) ∼ = A∨ (K) y P ic0 (A∨ ) ∼ = A(K), En el caso particular de una curva elı́ptica se tiene que su dual es ella misma, E = E ∨ . En general se tiene que A y A∨ son isogenas, pero no iguales (ni siquiera isomorfas). Nosotros sólo discutiremos la primera, y en esta ocasión no definiremos la variedad dual, para el lector interesado consultar [7]. La mayorı́a de los teoremas y resultados que se han descrito en este trabajo para curvas elı́pticas, pueden generalizarse a resultados sobre variedades abelianas. 7.1. Variedades Abelianas En primer lugar definiremos un grupo algebraico, que es un objeto que combina los conceptos de grupo y variedad, haciendo que ambas estructuras sean compatibles. Definición. Una grupo algebraico es una variedad algebraica G/K, (proyectiva o afı́n), junto con un punto OG ∈ G(K), y dos morfismos m : G × G −→ G, i : G −→ G . Que dota al conjunto de los puntos de G de una estructura de grupo. En otras palabras: (i) m(P, OG ) = m(OG , P ) = P para todo P ∈ G, (ii) m(P, i(P )) = OG para todo P ∈ G, (iii) m(P, m(Q, R)) = m(m(P, Q), R) para todo P, Q, R ∈ G. Si G, m e i están definidos sobre un cuerpo K, y OG ∈ G(K), entonces decimos que el grupo algebraico G está definido sobre K. En el caso particular de las curvas elı́pticas, m : E × E −→ E (P, Q) 7−→ P ⊕ Q i : E −→ E P 7−→ P la multiplicación coincide con la ley de grupo, y el elemento neutro coincide con O. Tal y como ya vimos, (E, ⊕, O) es un grupo. Sorprendentemente se tiene que un grupo algebraico es automáticamente no singular, y además si G es una variedad proyectiva, entonces la ley de grupo, definida por el morfismo m, es conmutativa en G, i.e. m(P, Q) = m(Q, P ) para todo P, Q ∈ G. Definición. Una variedad abeliana A es un grupo algebraico proyectivo. Dado que estamos trabajando con un grupo abeliano, de ahora en adelante emplearemos indistintamente la notación P ⊕A Q para denotar m(P, Q), y −P para i(P ). 7.2. HOMOMORFISMOS ENTRE VARIEDADES ABELIANAS 7.2. 87 Homomorfismos entre variedades abelianas Dado que hemos construido un objeto que tiene estructura de grupo y variedad, tiene sentido preguntarse qué clase de aplicaciones podemos definir entre estos objetos. De manera natural, nos interesará estudiar aquellos morfismos, (que respetan la estructura de variedad), que a su vez son compatibles con la ley de grupo que define m. Éstas aplicaciones serán los homomorfismos entre variedades abelianas. Definición. Sea A una variedad abeliana sobre K. Para un punto P ∈ A(K), definimos tP , la translación por P , como la composición m tP : A −→ A × A −→ A Q 7−→ (Q, P ) 7−→ m(P, Q) = Q ⊕A P Nótese que debido a que m es un morfismo, entonces también tP ∈ M or(A, A) para todo P ∈ A. De hecho, se trata de un isomorfismo, cuyo inverso es t−P . Además, si (A, m ∼ ⊕A , i) y (B, m0 ∼ ⊕B , i0 ) son variedades abelianas, y existe un morfismo ϕ : A −→ B, entonces se tiene que ϕ(m(P, Q)) = ϕ(P ⊕A Q) = ϕ(P ) ⊕B ϕ(Q) = m0 (ϕ(P ), ϕ(Q)) sı́ y sólo si ϕ(OA ) = OB . Este resultado se obtiene como corolario del teorema de Rigidez. Antes de enunciar este resultado recordemos unas definiciones. Definición. Una variedad algebraica V se dice completa, si para toda variedad algebraica W , la proyección: π : W × V −→ W es cerrada.Es decir, la imagen por π de cualquier subvariedad cerrada en W × V es cerrada en W . Teorema 7.1 (Rigidez). Sea ϕ una aplicación regular, ϕ : V × W −→ U entre variedades proyectivas, siendo V completa y V × W irreducible. Si existen puntos u0 ∈ U , v0 ∈ V y w0 ∈ W tales que ϕ(V × {w0 }) = {u0 } = ϕ({v0 } × W ) entonces ϕ(V × W ) = {u0 }. 88 CAPÍTULO 7. VARIEDADES ABELIANAS En otras palabras, si dos ’ejes de coordenadas’ colapsan en un punto, entonces todo el espacio colapsa en ese mismo punto. De este resultado, que no probaremos aquı́ (ver [6] para más detalles), se obtiene el siguiente corolario. Corolario 7.2. Dadas A, B variedades abelianas, y ϕ : A −→ B un morfismo entre ellas, entonces se tiene que la composición de ϕ con la traslación por −ϕ(OA ) es un morfismo y además es homomorfismo de grupos, de modo que ϕ ◦ t−ϕ(OA ) ∈ Hom(A, B). Recı́procamente, cualquier morfismo entre variedades abelianas, ϕ : A −→ B es composición de un homomorfismo y una traslación. Demostración. La aplicación regular ϕ manda el punto K-racional OA , a un punto K-racional Q en B. Tras componer con una traslación por −Q, podemos asumir que ϕ(OA ) = OB . Consideremos la aplicación, φ : A × A −→ B definida por φ(P, P 0 ) = ϕ(P ⊕A P 0 ) − (ϕ(P ) ⊕B ϕ(P 0 )). Con esto queremos decir que φ es la diferencia de dos aplicaciones regulares, A×A ϕ×ϕ m /A m0 ϕ B×B /B que es una aplicación regular. Entonces, φ(A × {OA }) = OB = φ({OA } × A) =⇒ φ = OB , esto quiere decir que ϕ es un homomorfismo. A partir de este corolario se deduce que si tenemos una variedad abeliana (A, m, OA ), siempre podemos definir la ley de grupo con respecto a un nuevo punto base P ∈ A como, m0 = ti(P ) ◦ m y (A, m0 , P ) será una variedad abeliana. Corolario 7.3. La ley de grupo en una variedad abeliana es conmutativa. 7.3. VARIEDADES JACOBIANAS 89 Demostración. Los grupos conmutativos se caracterizan por el hecho de que la aplicación que lleva a un elemento a su inverso es un homomorfismo. Dado que la aplicación inverso, i : A −→ A P 7−→ −P es un morfismo por definición, y además i(OA ) = OA , entonces i es un homomorfismo y por tanto A un grupo abeliano. Ejemplo 7.1. Sea A una variedad abeliana de dimensión d definida sobre C. Entonces se puede demostrar que existe un retı́culo Λ ⊂ Cd , y un isomorfismo analı́tico complejo, A(C) ∼ = Cd /Λ. El isomorfismo respeta tanto la extructura de variedad compleja como la de grupo abeliano. Para curvas elı́pticas, este resultado se ve reflejado en el Teorema de uniformización, que establece que toda curva elı́ptica definida sobre C es isomorfa a un toro complejo, EΛ (C) ∼ = C/Λ ←→ Λ retı́tculo en C. Y en dimensión 1 se tiene que todo retı́culo complejo define una curva elı́ptica, aunque para generalizar este resultado a variedades abelianas el retı́culo Λ ha de cumplir las condiciones de Riemann para que Cd /Λ sea una variedad abeliana. 7.3. Variedades Jacobianas La siguiente proposición, nos asegura que el grupo de Picard de una curva es esencialmente una variedad abeliana, a la que llamaremos variedad Jacobiana de la curva. Su dimensión coincidirá con el género de la curva en cuestión. Proposición 7.4. Sea C una curva proyectiva lisa de género g, definida sobre un cuerpo algebraicamente cerrado K. (a) La aplicación de grado deg : Div(C) −→ Z induce una sucesión exacta deg 0 −→ P ic0 (C) −→ P ic(C) −→ Z −→ 0, donde P ic0 (C) es el grupo de clases de divisores de grado cero en C. (b) Existe una variedad abeliana Jac(C), de dimensión g, y un isomorfismo natural de grupos ∼ P ic0 (C) −→ Jac(C). Definición. La variedad Jac(C) descrita en la proposición anterior para una curva proyectiva lisa C, es la variedad Jacobiana de C. 90 CAPÍTULO 7. VARIEDADES ABELIANAS Tal y como ya vimos, en el caso de las curvas elı́pticas, el grupo de Picard es isomorfo a la propia curva, de modo que se sigue que Jac(E) ∼ = E, para el caso de género 1. Para curvas de género mayor, describiremos la construcción algebraica de la variedad Jacobiana brevemente. Fijado un punto P0 ∈ C, una curva de género g > 1, consideraremos la aplicación φg : C g −→ P ic0 (C) (P1 , ..., Pg ) 7−→ (P1 ) + · · · (Pg ) − g(P0 ) El grupo simétrico Sg actúa sobre C g permutando las coordenadas, y la aplicación φg queda invariante bajo esta acción. Por tanto φg induce una aplicación sobre C (g) := C g /Sg . Se puede comprobar que C (g) es una variedad lisa , y que además φg : C (g) −→ P ic0 (C) es sobreyectiva, e inyectiva fuera de en un cerrado en la topologı́a de Zariski de C (g) . Además, la ley de grupo en P ic0 (C) induce una aplicación racional C (g) × C (g) −→ C (g) , que por desgracia no está definida en todas partes. De modo que la estrategia a seguir será tomar ciertos ’fragmentos’ del grupo y ’pegarlos’ para formar una variedad de grupo. La idea de ’pegar’ estos fragmentos se le debe a André Weil, y funciona en todas las caracterı́sticas. Sin embargo la construcción de la Jacobiana de una curva analı́tica, definida sobre C, es mucho más antigua, y emplea el Teorema de Riemann-Roch, ası́ como resultados de cohomologı́a, junto a algo de integrales elı́pticas. En lı́neas generales, la estrategia en este caso consiste en definir una aplicación Cg φ : C −→ Z P P 7−→ Z P ω1 , ..., P0 ωg P0 donde ω1 , ..., ωg es una base del espacio de formas diferenciales holomorfas ΩC . Y justificar que esta aplicación induce otra, φ : C −→ Cg /Λ, donde Λ viene dado como imagen de H1 (C, Z) −→ Z Cg Z Γ 7−→ ω1 , ..., ωg Γ Γ El retı́culo Λsatisface las condiciones de Riemann, y por tanto Cg /Λ será isomorfa (analı́ticamente) a una variedad abeliana. Denotando dicha variedad por Jac(C), uno puede verificar que φ puede extenderse de manera lineal a φ :P Div 0 (C) −→ Jac(C) P ni (Pi ) 7−→ [ni ]φ(Pi ) 7.4. RESULTADOS EN VARIEDADES ABELIANAS 91 que es una aplicación sobreyectiva cuyo núcleo es precisamente el conjunto de divisores principales. De modo que se tiene el isomorfismo deseado, ∼ P ic0 (C) −→ Jac(C). Si una curva C está definida sobre un cuerpo K, entonces su variedad Jacobiana también lo está. Y además, el isomorfismo definido entre P ic0 (C) y la Jacobiana, conmuta con la acción del grupo de Galois Gal(K/K). 7.4. Resultados en variedades abelianas Tal y como establecimos al comienzo del capı́tulo, muchos de los resultados que hemos enunciado y demostrado para curvas elı́pticas se pueden obtener como casos particulares de resultados más amplios sobre variedades abelianas. A continuación enunciaremos algunos de ellos. 7.4.1. Torsión en variedades abelianas Sea A una variedad abeliana de dimensión g, definida sobre un cuerpo K. Para n > 0 entero, definimos el morfismo nA : A −→ A P 7−→ P ⊕A · · · ⊕A P multiplicación por n en A. Denotaremos por A[n] al núcleo de la aplicación nA . Teorema 7.5. Sea A una variedad abeliana de dimensión g, definida sobre un cuerpo K. Entonces, 2g ∼ A[n] si char(K) 6 | n, = (Z/nZ) i A[pm ] ∼ si p = char(K), m > 0 = (Z/pm Z) donde i depende de A pero no de m, y puede tomar cualquier valor entre 0 y g. El entero i se conoce como p-rango de A. Este resultado es la generalización de la Proposición 3.2. Para curvas elı́pticas definidas sobre cuerpos de caracterı́stica positiva, se tiene que el p-rango es 1 si la curva es ordinaria, y 0 si es supersingular. Además, existe un emparejamiento canónico y no degenerado, A[n] × A∨ [n] −→ µn , que coincide en género 1 con el emparejamiento de Weil descrito en la sección 3.4. 7.4.2. Teorema de Weil Teorema 7.6 (Weil). Sea K un cuerpo de números, y A una variedad abeliana definida sobre K. Entonces A(K) está finitamente generada como grupo. Sin duda alguna, dado que una curva elı́ptica es una variedad abeliana de dimensión uno, este resultado es la generalización natural del Teorema de Mordell-Weil. En 1952 A. Nerón extendió el Teorema de Weil a variedades abelianas definidas sobre cuerpos finitamente generados sobre un cuerpo primo. 92 7.4.3. CAPÍTULO 7. VARIEDADES ABELIANAS Conjetura de Mordell y Teorema de Faltings En el año 1922, tras haber probado que todos los puntos racionales de una curva elı́ptica podı́an obtenerse a partir de un número finito de ellos, L.J. Mordell se dió cuenta de que para una serie de curvas de género mayor que uno, el número de puntos racionales tenı́a que ser finito. De modo que pensó que era razonable establecer la siguiente conjetura. Conjetura de Mordell: Si C es una curva proyectiva lisa de género g ≥ 2, definida sobre un cuerpo de números K, entonces el conjunto de puntos racionales C(K) es finito. Tal y como hemos podido ver en los ejemplos desarrollados en los capı́tulos 5 y 6, la conjetura no es cierta en el caso g = 1, ya que para curvas elı́pticas, hemos visto que es posible encontrar puntos racionales de orden infinito, lo cual implica directamente que E(K) no puede ser finito. Sin embargo la conjetura fué probada por G. Faltings en 1983, y puede extenderse a curvas no proyectivas y singulares, pues ésto sólo hace variar C(K) en un número finito de puntos. Ası́, el Teorema de Faltings establece que las ecuaciones de Fermat, xn + y n = z n , n ≥ 4, tienen sólo un número finito de soluciones (x, y, z) en cualquier cuerpo de números (salvo multiplicación por constantes). La demostración del Teorema de Faltinngs hace uso esencial de las variedades abelianas, pues se deduce de un importante resultado conocido como la Conjetura de Safarevich que establece la finitud de las clases de isomorfı́a de variedades abelianas bajo ciertas condiciones, ver II [3]. Bibliografı́a [1] J.W.S. Cassels, Lectures on elliptic curves. London Mathemacial Society Student Texts 24 (1991). [2] H. Cohen y G. Frey, Handbook of elliptic and hyperelliptic curve cryptography. Discrete Mathematics and its Applications (2006). [3] G. Cornell y J.H. Silverman (ed.) , Arithmetic Geometry Springer-Verlag (1986). [4] S. Lang, Fundamentals on Diophantine Geometry Springer-Verlag (1983). [5] S. Lang, Introduction to Algebraic Geometry. Tracts in Mathematics 5, Interscience Publishers (1964). [6] J.S. Milne, Algebraic Number Theory http : //www.jmilne.org/math/CourseN otes/AN T.pdf [7] J.S. Milne,Abelian Varieties http : //www.jmilne.org/math/CourseN otes/AV.pdf [8] D. Mumford, Abelian Varieties. Oxford University Press (1985). [9] J. Neukirch, Algebraic Number Theory. Grundlehren der mathematischen Wissenschaften 322, Springer Verlag (1999). [10] J.H. Silverman, The Arithmetic of Elliptic Curves, 2nd ed.. Graduate Texts in Mathematics 106, Springer Verlag (2009). [11] J.H. Silverman, Advaned Topics in the Arithmetic of Elliptic Curves. Graduate Texts in Mathematics 151, Springer-Verlag (1994). [12] A brief history of elliptic curves. http : //livetoad.org/Courses/Documents/132d/N otes/history of elliptic curves.pdf . Las ilustraciones de las páginas 27 y 28 pertenecen al depósito multimedia de Wikimedia Commons, y pueden encontrarse en: http : //commons.wikimedia.org/wiki/Category : Elliptic curves 93