Teorema de Mordell-Weil - Universidad Autónoma de Madrid

Universidad Autónoma de Madrid Trabajo de Fin de Máster Teorema de Mordell-Weil Autor: Ana Zumalacárregui Pérez Tutor: Dr. Adolfo Quirós Gracián Septiembre 2010 hola Índice general 1. Introducción 1 2. Variedades proyectivas. Curvas planas. 2.1. Variedades Afines . . . . . . . . . . . . . 2.2. Variedades Proyectivas. . . . . . . . . . 2.3. Curvas . . . . . . . . . . . . . . . . . . . 2.4. Divisores . . . . . . . . . . . . . . . . . . 2.5. Diferenciales . . . . . . . . . . . . . . . . 2.6. Teorema de Riemann-Roch . . . . . . . 3. Curvas Elı́pticas 3.1. Ley de grupo . . . . . . . . . . . . . 3.2. Subgrupo de Torsión . . . . . . . . . 3.3. Valores absolutos y reducción de una 3.4. Emparejamiento de Weil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . curva elı́ptica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 10 12 15 17 . . . . 25 29 33 35 38 4. Versión débil del teorema 41 4.1. El emparejamiento de Kummer . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.2. Demostración del Teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 5. Descenso, Alturas y el Teorema de Mordell-Weil 5.1. Teorema del Descenso . . . . . . . . . . . . . . . . 5.2. Alturas en el espacio proyectivo . . . . . . . . . . . 5.3. Alturas en curvas elı́pticas . . . . . . . . . . . . . . 5.4. Puntos de torsión racionales . . . . . . . . . . . . . 5.5. Rango de E(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 51 60 67 71 6. Cómo calcular el grupo de Mordell-Weil 73 6.1. Calcular E(K)/mE(K) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 6.2. 2-Descenso Completo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 6.3. Un ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 7. Variedades Abelianas 7.1. Variedades Abelianas . . . . . . . . . . . . . 7.2. Homomorfismos entre variedades abelianas . 7.3. Variedades Jacobianas . . . . . . . . . . . . 7.4. Resultados en variedades abelianas . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 86 87 89 91 ÍNDICE GENERAL ii 7.4.1. Torsión en variedades abelianas . . . . . . . . . . . . . . . . . . . . . 7.4.2. Teorema de Weil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4.3. Conjetura de Mordell y Teorema de Faltings . . . . . . . . . . . . . Bibliografı́a 91 91 92 93 Capı́tulo 1 Introducción El estudio de las ecuaciones Diofánticas, soluciones enteras o racionales a ecuaciones polinómicas, se remonta a la antigua Grecia. Fue en el siglo III cuando Diofanto de Alejandrı́a se interesó por conocer las soluciones a las ecuaciones algebraicas. Su trabajo estaba tan alejado de las corrientes matemáticas de su época, que algunos de sus planteamientos y gran parte de la notación algebraica que desarrolló no tuvieron mucha influencia entre los matemáticos hasta más de mil años después, cuando su trabajo fue retomado por los franceses Viète y Fermat. A diferencia de sus contemporáneos, que derivaron las ecuaciones de las cónicas a partir de condiciones geométricas, el propio Diofanto estudió las ecuaciones algebraicas fuera de todo contexto geométrico, pero sin ignorar las implicaciones geométricas de sus hallazgos. Se podrı́a decir que el trabajo de este matemático ha tenido una profunda influencia en los matemáticos de los últimos tiempos, especialmente una vez que estuvieron preparados para unir álgebra y geometrı́a. El término Geometrı́a Diofántica tiene un origen más reciente y se refiere al estudio de las soluciones a ecuaciones Diofánticas a través de la combinación de técnicas de la teorı́a algebraica de números y la geometrı́a algebraica. Por un lado, el problema de encontrar soluciones enteras (o racionales) a ecuaciones polinómicas hace aparecer de manera natural la teorı́a algebraica de números, que describe los cuerpos y anillos en los que viven esas soluciones. Por el otro, se tiene que los mismos sistemas de ecuaciones en polinomios describen variedades algebraicas y es muy natural estudiar su estructura geométrica para poder atacar el problema. Ası́ es como nace la interacción entre estas dos áreas y estos dos puntos de vista o maneras de entender la geometrı́a Diofántica. El caso más sencillo que nos podemos encotrar en esta dirección es el estudio de las soluciones de una ecuación lineal, ax + by = c a, b, c ∈ Z, con a o b no nulos. En este caso sabemos que siempre existen soluciones racionales. Si aumentamos en uno el grado del polinomio, obtendremos ecuaciones cuadráticas como ax2 + bxy + cy 2 + dx + ey + f = 0 a, b, c, d, e, f ∈ Z, 1 2 CAPÍTULO 1. INTRODUCCIÓN con a o b no nulos. Éste tipo de ecuación es bien conocida, y describe las secciones cónicas. Tras un cambio de variable con coeficientes racionales, podemos transformar este tipo de ecuación en una de las tres siguientes: ax2 + by 2 = c Elipse, ax2 − by 2 = c Hipérbola, ax + by 2 = 0 Parábola. Para este tipo de ecuaciones tenemos el Teorema de Hasse-Minkowski que establece: Una ecuación cuadrática, ax2 + bxy + cy 2 + dx + ey + f = 0 a, b, c, d, e, f ∈ Z, con a o b distintos de 0, tiene soluciones racionales si y sólo si tiene soluciones en R y en Qp , el cuerpo de los números p-ádicos, para todo p primo. El resultado dice que la ecuación tendrá soluciones en Q sı́ y sólo si existen soluciones en cada una de sus compleciones. Es por esto que a este teorema se le conoce como principio Local-Global. El lema de Hensel nos dice que encontrar soluciones en Qp se reduce básicamente a trabajar en Z/pZ, donde tenemos herramientas poderosas como la ley de reciprocidad cuadrática. Hasta ahora no hemos empleado argumentos geométricos. Sin embargo, ya Diofanto habı́a observado que si somos capaces de encontrar un punto racional en cualquiera de estas curvas, entonces podemos construir todos los puntos racionales que queramos. Basta con trazar una recta que pase por dicho punto y que tenga pendiente racional. El punto de corte de dicha recta con la curva siempre será racional. Esta observación permite parametrizar los puntos racionales de una cónica a partir de la pendiente. Con este método, por ejemplo, se puede probar de manera sencilla que las ternas pitagóricas, soluciones enteras de la ecuación x2 + y 2 = z 2 , son infinitas y darlas de forma explı́cita. Diofanto aplicó este mismo ‘método de secantes’ a ecuaciones cúbicas y obtuvo sus resultados más espectaculares. Descubrió que, aunque su método no producı́a una parametrización de las soluciones racionales, permitı́a construir una solución racional a partir de dos soluciones dadas. Siglos después se descubrió que variando ligeramente el método de Diofanto se podı́an ‘sumar’ soluciones (puntos) y tener ası́ una estructura de grupo en la ecuación (o mejor dicho en la curva). La gran diferencia entre el enfoque de Diofanto y el enfoque actual es que él tan solo mostró interes en los algorı́tmos algebraicos, más que en las estructuras. Le interesaban fórmulas y procedimientos para resolver las ecuaciones, no tanto las estructuras abstractas para describir el conjunto de soluciones. No obstante, no hay duda de que se merece haber puesto nombre a las matemáticas que aquı́ vamos a discutir. Podrı́amos decir que a estas alturas se comprende bastante bien la aritmética en el primer tipo de curvas que hemos descrito, las de grados uno y dos. Ésto se debe principalmente 3 a que tanto las ecuaciones lineales como las cuadráticas producen curvas de género 0, y geométricamente pueden compararse a una recta, que es un objeto mucho más simple que los que vamos a estudiar. Si aumentamos la complejidad en un nivel, nos encontraremos con las curvas de género 1, las llamadas curvas elı́pticas, que son el objeto principal de este trabajo. Estas curvas vienen dadas por ecuaciones cúbicas en dos variables, y a diferencia de las anteriores, su estudio ha dado lugar al desarrollo de una mezcla muy rica de geometrı́a algebraica y teorı́a de números. Los más prominentes matemáticos de nuestro tiempo han contribuido al desarrollo de la teorı́a. Y podrı́amos decir que el conocimiento que se tiene de la teorı́a para curvas elı́pticas sobre cuerpos finitos y cuerpos locales es más o menos satisfactoria. Sin embargo, resulta que el principio Local-Global de Hasse para curvas de este tipo es falso. Este hecho, junto con otros muchos, hace realmente interesante el estudio de los puntos racionales de este tipo de curvas. Éste será el objetivo principal de este trabajo: tratar de comprender completamente la estructura de los puntos de una curva elı́ptica sobre un cuerpo global, y ser capaces de encontrarlos. Para ello, podrı́amos decir que la primera mitad del trabajo consiste en probar el Teorema de Mordell-Weil, que establece que todos los puntos racionales de una curva elı́ptica pueden generarse a partir de un número finito de ellos. Es decir, que todas las soluciones racionales de una de aquellas ecuaciones cúbicas que estudiaba Diofanto pueden construirse a partir de un número finito de ellas, empleando una variación de su método de la secante. La segunda parte del trabajo, sin embargo, se centra en justificar que todo el trabajo previo tuvo sentido. Con esto quiero decir que, tras haber probado que el grupo está finitamente generado, es natural preguntarse si es posible encontrar los generadores de manera efectiva. La respuesta es que sı́, pero no siempre o no todos ellos. Tras esta introducción los dos siguientes capı́tulos resumen la teorı́a y notación necesaria para poder enunciar y probar los teoremas de los capı́tulos 4 y 5. En el capı́tulo 2 se dan las definiciones y resultados básicos de geometrı́a algebraica que serán necesarios para poder definir rigurosamente lo que es una curva elı́ptica. El capı́tulo 3 se centra en los aspectos aritméticos de las curvas elı́pticas. Dado que la teorı́a en esta dirección es muy amplia, nos hemos visto obligados a restringirnos a aquellos resultados que se iban a necesitar más adelante. Dejamos de lado la teorı́a de curvas elı́pticas con multiplicación compleja o curvas sobre cuerpos finitos, entre otras muchas cosas. El capı́tulo 4 se centra en probar la versión débil del Teorema de Mordell-Weil, que asegura que el grupo de generadores de los puntos racionales es finito si lo consideramos bajo una relación de equivalencia lineal. Este resultado no sólo será una herramienta fundamental para probar el teorema en su versión fuerte, sino que además nos ayudará a entender también las dificultades para calcular de manera efectiva los generadores del grupo. En el capı́tulo 5 se hace una exposición de la teorı́a general de las funciones de altura, para 4 CAPÍTULO 1. INTRODUCCIÓN centrarnos después en las alturas sobre las curvas elı́pticas. Éstas, junto con el Teorema del Descenso y el Teorema débil de Mordell-Weil, son la herramienta básica e indispensable para poder probar el teorema que da nombre a este trabajo. Tras todo el trabajo realizado en los primeros 5 capı́tulos, el sexto trata de mostrar cómo podemos sacar ventaja del teorema. Y cómo emplear toda la teorı́a a nuestro alcance para poder calcular los puntos racionales con los que generar todos los demás. Para ello, en primer lugar se justifican teóricamente los pasos a dar, para después comprobar con un ejemplo sencillo que todo funciona, y mostrar también en qué puntos podemos encontrarnos con dificultades (que en ocasiones son insalvables). Estas dificultades, que hacen que los puntos racionales de una curva elı́ptica sean tan interesantes, se derivan principalmente del hecho de que el principio de Hasse-Minkowski es falso para este tipo de curvas. En el capı́tulo final se incluye una breve introducción a las variedades abelianas, que son la generalización natural de las curvas elı́pticas. Dicha teorı́a nació en el intento de Weil de extender el teorema de Mordell a cuerpos mayores que Q. Por ello mismo, he creido importante no sólo hablar aquı́ del teorema de Weil, que generaliza el teorema de Mordell(-Weil) a variedades abelianas, sino también citar algunos otros ejemplos en los que el estudio de variedades abelianas ha llevado a probar resultados tan maravillosos como el Teorema de Faltings, que establece que toda curva con género mayor que uno tiene a lo sumo un número finito de puntos racionales. A lo largo de todo el trabajo he querido no sólo justificar los resultados teóricos incluyendo todas las demostraciones, salvo un número finito de ellas, sino que además he procurado encontrar ejemplos que pudieran hacer más comprensible la teorı́a, ası́ como justificar la existencia de la misma. Por último, quisiera comentar brevemente la importancia que tienen las curvas elı́pticas hoy en dı́a, y por qué tiene sentido estudiarlas más allá de por su asombrosa belleza. A mı́ al menos no dejan de sorprenderme, aunque por suerte o por desgracia yo aún soy altamente impresionable. En primer lugar, y tal vez en la posición más evidente, destacarı́a las utilidades prácticas derivadas de los sistemas criptográficos que se han desarrollado en los últimos años, basados en la criptografı́a de clave pública de Diffie-Hellman, y que tienen como ventaja principal la dificultad de resolución del logaritmo discreto en el grupo de puntos de una curva elı́ptica, en este caso definida sobre un cuerpo finito, frente a la sencillez de los algoritmos de suma en el grupo. Objetos que se describen en este trabajo con fines púramente teóricos, como el emparejamiento de Weil por ejemplo, constituyen herramientas esenciales para entender las formas de ataque a estos criptosistemas y poder ası́ hacerlos más seguros. Inesperadamente, he tenido la ocasión de descubrir mientras estudiaba para este trabajo que la ley de grupo en una curva elı́ptica resulta ser la solución de muchas ecuaciones diferenciales que aparecen en aplicaciones en ingenierı́a, incluyendo electroestática, mecánica 5 de fluidos o fı́sica clásica. El ejemplo más sencillo de esta afirmación deriva del estudio de un simple péndulo, y ésta es la motivación natural para el nacimiento de las integrales elı́pticas. Para más información consultar [13] En último lugar, he de hablar sin duda de las matemáticas que pusieron en oı́dos de muchos por primera vez las curvas elı́pticas: el Último Teorema de Fermat. La historia de este estudio comenzó con Diofanto, y precisamente fue leyendo una traducción al latı́n del Arithmetica de Diofanto, cuando Pierre de Fermat enunció el ‘Teorema’ que a tantos matemáticos ha tenido atareados en los últimos años: Cuando n > 2 no existen soluciones racionales positivas a la ecuación, xn + y n = z n . Más de 300 años ha llevado probar este teorema, y muchas y muy importantes matemáticas se han desarrollado en el intento. Fue en 1994 cuando el inglés A. Wiles terminó con la demostración. Wiles atacó el enigma de Fermat resolviendo un problema totalmente diferente, relacionado precisamente con las curvas elı́pticas, que entonces ya era conocido como la Conjetura de Taniyama-Shimura. Fue G. Frey quien unos años antes probó cómo conectar esta conjetura con el Último Teorema de Fermat. 6 CAPÍTULO 1. INTRODUCCIÓN Capı́tulo 2 Variedades proyectivas. Curvas planas. A lo largo de todo este capı́tulo K denotará un cuerpo perfecto, y K su clausura algebraica. Por tanto la extensión K/K será de Galois y los elementos de K los fijados por el grupo de K-automorfismos Gal(K/K). Como en general nuestro objetivo es hacer aritmética, nos interesa trabajar con extensiones algebraicas sobre Q, Fp , que simplifica la exposición notablemente, aunque gran parte de la teorı́a expuesta puede extenderse a cuerpos más generales. 2.1. Variedades Afines Definición. El espacio afı́n de dimensión n, definido sobre K, se define como el conjunto de n-úplas, An = {(x1 , ..., xn ) : xi ∈ K, i = 1, ..., n}. Y, de manera similar, los puntos K-racionales de An son An (K) = {(x1 , ..., xn ) : xi ∈ K, i = 1, ..., n}, los puntos con coordenadas en K. Nótese que el grupo de Galois Gal(K/K) actúa sobre An : dado σ ∈ G(K/K) y P ∈ An (K), P σ = (x1 , ..., xn )σ = (xσ1 , ..., xσn ). De modo que An (K) puede caracterizarse como, An (K) = {P ∈ An : P σ = P para todo σ ∈ G(K/K)}. Definición. Un conjunto algebraico afı́n, es un subconjunto V ⊂ An de puntos que satisfacen una serie de ecuaciones, o equivalentemente son ceros una serie de polinomios en K[x1 , ..., xn ], V (I) = {P ∈ An : f (P ) = 0 para todo f ∈ I}. Sea V un conjunto algebraico, su ideal se define como I(V ) = {f ∈ K[x1 , ..., xn ] : f (P ) = 0 para todo P ∈ V }. 7 8 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Nótese que gracias al Teorema de la base de Hilbert, sabemos que el anillo K[x1 , ..., xn ] es Noetheriano, y por tanto todo ideal es finitamente generado, de modo que V (I) = V (f1 , ..., fm ) = V (f1 ) ∩ V (f2 ) ∩ · · · ∩ V (fm ). Definición. Un conjunto algebraico V ⊂ An es una variedad afı́n cuando el ideal de V , I(V ), es un ideal primo en K[x1 , ..., xn ]. Una variedad afı́n V , está definida sobre un cuerpo K siempre que su ideal pueda generarse por polinomios con coeficientes en K. En todo momento, hemos de tener en cuenta de que el concepto de variedad no deja de ser también geométrico. Y la condición de primalidad sobre el ideal I(V ) se traduce en que la variedad posee una única componente irreducible. Veamos sin embargo qué significa esta condición algebraicamente. Teorema 2.1 (Nullstellenssatz). Sea K un cuerpo algebraicamente cerrado. Si I / K[x1 , ..., xn ] es un ideal, entonces √ I(V (I)) = I √ donde I = {x ∈ K : xd ∈ I para algún d ∈ N}, denota el radical de I en K. El teorema anterior, nos asegura que si V es una variedad algebraica, entonces I(V (I)) = I. 2.2. Variedades Proyectivas. Definición. El espacio proyectivo n-dimensional, definido sobre K, se denota por Pn o Pn (K), y consiste en todas las (n + 1)-tuplas (x0 , ..., xn ) ∈ An+1 , distintas de (0, ..., 0), bajo la relación de equivalencia (x0 , ..., xn ) ∼ (λx0 , ..., λxn ), ∗ donde λ ∈ K . A la clase de equivalencia, ∗ {(λx0 , ..., λxn ) : λ ∈ K } ∈ An+1 \{0}/∼ la denotaremos por [x0 , ..., xn ], y las xi son las coordenadas homogéneas del correspondiente punto en Pn . El conjunto de puntos K-racionales de Pn , denotado por Pn (K), consiste en todos los puntos P = [x0 , ..., xn ] ∈ Pn , cuya clase tiene un representante con coordenadas homogéneas en K. Nótese que, al igual que en el caso afı́n, el grupo de Galois actúa sobre Pn , actuando sobre sus coordenadas homogéneas, P σ = [x0 , ..., xn ]σ = [xσ0 , ..., xσn ] para σ ∈ Gal(K/K). Y la acción está bien definida, pues respeta la relación de equivalencia, [λx0 , ..., λxn ]σ = [λσ xσ0 , ..., λσ xσn ] = [xσ0 , ..., xσn ] = [x0 , ..., xn ]σ . 2.2. VARIEDADES PROYECTIVAS. 9 Definición. Un polinomio f ∈ K[x0 , ..., xn ] es homogéneo de grado d, si f (λx0 , ..., λxn ) = λd f (x0 , ..., xn ) para todo λ ∈ K. Y un ideal I / K[x0 , ..., xn ] se dice homogéneo, si está generado por polinomios homogéneos. Para f un polinomio homogéneo dado tiene sentido preguntarse cuándo f (P ) = 0 si P ∈ Pn . Por ser f homogéneo esta condición es independiente de la elección de coordenadas homogéneas. Definición. Un conjunto algebraico proyectivo V (I) es el conjunto de puntos que se anulan en un ideal homogéneo I, V (I) = {P ∈ Pn : f (P ) = 0 para todo f ∈ I}. Además, dado V un conjunto algebraico proyectivo, el ideal (homogéneo) I(V ) está generado por el conjunto, {f ∈ K[x0 , ..., xn ] | f homogéneo , f (P ) = 0 para todo P ∈ V } ⊂ K[x0 , ..., xn ]. Un conjunto algebraico V está definido sobre K si su ideal homogéneo puede generarse por polinomios definidos en K[x0 , ..., xn ]. Los puntos K-racionales de la variedad V (K) ⊂ Pn (K) coinciden precisamente con V (K) = V ∩ Pn (K). Al igual que en el caso afı́n, V (K) puede también verse como el subconjunto de V que queda fijado por Gal(K/K), V (K) = {P ∈ V : P σ = P para todo σ ∈ Gal(K/K)}. Una de las inclusiones es trivial, pues P σ = P para todo P ∈ P(K). Pero para demostrar la inclusión contraria se necesita emplear el Teorema 90 de Hilbert y algunas nociones de cohomlogı́a de Galois. Definición. Un conjunto algebraico proyectivo, V ⊂ Pn , es una variedad preyectiva si su ideal I(V ) es primo en K[x0 , ..., xn ]. Resulta natural entender el espacio afı́n como subconjunto del espacio proyectivo, pues fijada una coordenada 0 ≤ i ≤ n, podemos definir la inclusión, φi : An −→ Pn (y1 , ..., yn ) 7−→ [y1 , ..., yi−1 , 1, yi , ..., yn ] Sea Hi = {[x0 , ..., xi−1 , 0, xi+1 , ..., xn ] ∈ Pn }, el hiperplano dado por xi = 0, y Ui su complementario, Ui = {[x0 , ..., xn ] ∈ Pn : xi 6= 0} = Pn \Hi existe una biyección natural, φ−1 i : Ui −→ An [x0 , ..., xn ] 7−→ (x0 /xi , ..., xi−1 /xi , xi+1 /xi , ..., xn /xi ) 10 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. De modo que podemos entender Anxi =1 ∼ = Ui ⊂ Pn , via la aplicación φi , para un i fijo. Fijada i, al hiperplano Hi , lo denotaremos como hiperplano del infinito H∞ . Dada una variedad proyectiva V ⊂ Pn tenemos que V ∩ Anxi =1 , que no es otra cosa que φ−1 i (Ui ∩ V ), es una variedad afı́n con ideal I(V ∩ Anxi =1 ) = {f (x0 , ..., xi−1 , 1, xi+1 , ..., xn ) : f ∈ I(V )} Los conjuntos U0 , ..., Un cubren todo el espacio proyectivo Pn , de modo que cualquier variedad proyectiva puede recubrirse totalmente por variedades afines. Para una coordenada i fija, siempre podemos entender una variedad proyectiva V como la unión de su parte afı́n y sus puntos del infinito, V ∩ Anxi =1 2.3. y V ∩ H∞ . Curvas Definición. Sea V /K una variedad afı́n definida sobre K, definimos el anillo de funciones regulares, o anillo de coordenadas afines como K[V ] = K[x1 , ..., xn ] . I(V ) Como I(V ) es primo, entonces K[V ] será un dominio. Diremos que el cuerpo de fracciones de K[V ] es el cuerpo el cuerpo de funciones racionales de la variedad V , que denotaremos por K(V ). De manera análoga se define el anillo de coordenadas proyectivas de V K[V ] = K[x0 , ..., xn ] , I(V ) que en este caso no son funciones en V , ya que ni siquiera un polinomio homogéneo define una función proyectiva. El cuerpo de funciones racionales de una variedad proyectiva V se define como f K(V ) = : f, g son homogéneos del mismo grado en K[x0 , ..., xn ] y g ∈ / I(V ) /∼ , g donde f f0 ∼ 0 g g ⇐⇒ f g 0 − f 0 g ∈ I(V ). Definición. La dimensión de una variedad afı́n es el grado de trascendencia de la extensión de cuerpos K(V )/K. Definición. Sea V ⊂ Pn una variedad proyectiva definida sobre K, y sea 0 ≤ i ≤ n tal que V ∩ Anxi =1 6= ∅, entonces la dimensión de V es la dimensión de V ∩ Anxi =1 . Una curva no es otra cosa que una variedad de dimensión 1. 2.3. CURVAS 11 Nótese que la dimensión de una variedad proyectiva no depende en ningún caso del abierto afı́n que hemos escogido. Ejemplo 2.1. Sea V ⊂ P2 la variedad proyectiva formada por los puntos que satisfacen la ecuación, y 2 z = x3 + Axz 2 + Bz 3 . Si escogemos el abierto afı́n dado por z = 1, tenemos V ∩ A{z=1} = {(x, y) : y 2 = x3 + Ax + B} Donde K(V ) = K(x, y) para x, y funciones que satisfacen la relación y = √ x3 + Ax + B. De modo que podemos construir la torre de cuerpos, K(V ) algebraica K(x) transcendente K con grado de trascendencia igual a 1, pues el elemento K(x). Ası́ que V es una curva dimK (V ) = 1. √ x3 + Ax + B es algebraico sobre En general, se tiene que si f ∈ K[x1 , ..., xn ] es primo y homogéneo, la variedad V (f ) = {P ∈ Pn : f (P ) = 0} es una hipersuperficie de dimensión n − 1, y su ideal I(V ) = (f ) es principal. Como caso particular, se tiene que una hipersuperficie en el plano proyectivo es una curva. Por tanto cualquier variedad plana definida por una ecuación es una curva y, equivalentemente, si tenemos un polinomio homogéneo y primo f (x, y, z) = 0, éste nos define una curva proyectiva plana. Definición. Una variedad proyectiva V ⊂ Pn es lisa en un punto P si la dimensión del espacio tangente a la variedad en P coincide con la dimensión de V . Existe una condición algebraica más sencilla para definir la lisitud sobre un punto, en términos de las ecuaciones que definen una curva proyectiva, cuando ésta es una curva plana. 12 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Definición. Dada una curva plana C : f (x, y, z) = 0, un punto P ∈ C es singular si y sólo si ∇f (x0 , y0 , z0 ) = (0, 0, 0) f (x0 , y0 , z0 ) = 0 Diremos que una curva es lisa o nosingular si no tiene puntos singulares. Para el caso que nos interesa, las curvas elı́pticas, ésta condición es suficiente, pues como ya veremos en el capı́tulo siguiente toda curva elı́ptica es isomorfa a una curva plana. 2.4. Divisores Definición. El grupo de divisores de una curva C, denotado por Div(C), es el grupo abeliano libre generado por los puntos de la curva. De modo que un divisor D ∈ Div(C) es una suma formal X D= np (P ), P ∈C donde np ∈ Z, y nP = 0 para todos los P ∈ C salvo un número finito de ellos. El grado de un divisor D se define como X deg(D) = np . P ∈C Los divisores de grado cero forman un subgrupo de Div(C), que denotaremos como Div 0 (C) = {D ∈ Div(C) : deg(D) = 0}. La suma de dos divisores se define de manera natural como X D + D0 = [np + n0P ](P ) P ∈C y el grupo Gal(K/K) actúa sobre Div(C) del siguiente modo Dσ = X nP (P σ ), P ∈C para todo σ ∈ Gal(K/K). Definición. Diremos que D está definido sobre K si Dσ = D para todo σ ∈ Gal(K/K). Nótese que si D = n1 (P1 ) + · · · + nk (Pk ) está definido sobre K, no necesariamente se tiene que P1 , ..., Pk ∈ C(K). Basta que el grupo de Galois permute los puntos P1 , ..., Pk de manera adecuada. 2.4. DIVISORES 13 Supongamos ahora que la curva C es lisa, entonces para una función f ∈ K(C)∗ podemos asociar a f el divisor X div(f ) = ordP (f ) (P ). P ∈C Ésta definición tiene sentido pues f sólo tiene un número finito de polos y ceros, de modo que ordP (f ) = 0 para todo P ∈ C salvo un número finito. Además resulta claro que div(f σ ) = (div(f ))σ para todo elemento σ ∈ Gal(K/K). Si ordP (f ) = 1 dado f ∈ K(C)∗ , entonces diremos que f es un parámetro en P . Definición. Diremos que un divisor D ∈ Div(C) es principal si es de la forma D = div(f ) para alguna función f ∈ K(C)∗ . Dos divisores D y D0 se dicen linealmente equivalentes, D ≡ D0 , si D − D0 es principal. Definición. El grupo de clases de divisores, o grupo de Picard, denotado por P ic(C) es el cociente del grupo de divisores dado por P ic(C) = Div(C)/P rin(C), ∗ donde P rin(C) = {div(f ) : f ∈ K (C)} denota el subgrupo de divisores principales de C. Analogamente podemos definir P ic0 (C) como P ic0 (C) = Div 0 (C)/P rin(C), ya que Div 0 (C) es un subgrupo de Div(C). Como ordP es una valoración discreta, la aplicación div : K(C)∗ −→ Div(C) f 7−→ div(f ) es un homomorfismo de grupos abelianos. Proposición 2.2. Sea C una curva suave, y f ∈ K(C)∗ . Entonces, (a) div(f ) = 0 si y sólo si f ∈ K ∗ , (b) deg(div(f )) = 0. Definición. Dadas dos curvas proyectivas planas C, C 0 , definidas por dos polinomios f, g ∈ K[x0 , ..., xn ], de grados d y e respectivamente, y sea S = C ∩ C 0 = {P ∈ Pn (K) : f (P ) = g(P ) = 0}, definimos la multiplicidad de intersección de C y C 0 en P como K(x1 , ..., xn ) 0 (C, C )P = dimK (f ∗ , g ∗ ) 14 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. donde f ∗ , g ∗ son los polinomios deshomogeneizados, i.e. V (f ∗ ) = C ∩ Anxi =1 y V (g ∗ ) = C 0 ∩ Anvi =1 para algún 0 ≤ i ≤ n. Definiremos el divisor de intersección como X C · C0 = (C, C 0 )P (P ). P ∈S Teorema 2.3 (Bézout). Sean C y C 0 dos curvas proyectivas planas definidas sobre un cuerpo K, sin componentes comunes (es decir, definidas por polinomios irreducibles distintos). Entonces el número total de puntos de intersección de C y C 0 en P2 (K), contados con multiplicidades, es igual al producto de los grados de C y C 0 . El teorema anterior establece que si D = C · C0 = X (C, C 0 )P (P ) P ∈C∩C 0 es el divisor de intersección de C = V (f ) y C 0 = V (g), entonces X deg(D) = (C, C 0 )P = deg(f )deg(g). P ∈C∩C 0 Ejemplo 2.2. Sea K un cuerpo con caracterı́stica char(K) 6= 2. Sean e1 , e2 , e3 ∈ K distintos. Entonces la curva definida por C : y 2 = (x − e1 )(x − e2 )(x − e3 ), es lisa, y posee un único punto en el infinito P∞ = [0, 1, 0]. Para i = 1, 2, 3, tenemos que Pi = (ei , 0) ∈ C. Calculemos div(x − ei ), para i = 1, 2, 3 y también div(y). En primer lugar, tenemos que la función homogénea en P2 de x − ei es (x − zei )/z. Para todo P = [a, b, 1] ∈ C distinto de P1 , P2 y P3 se tiene que (x − zei ) =0 ordP z ya que la función no tiene ni polos ni ceros en P . Para P1 tenemos que y es un parámetro, pues tiene un cero de primer orden en el punto. Además como y 2 = (x−e1 )(x−e2 )(x−e3 ), entonces y2 (x − e1 ) = . (x − e2 )(x − e3 ) Dado que (x − e2 ), (x − e3 ) 6= 0 en P1 , entonces (x − ze1 ) ordP1 = ordP1 (x − e1 ) = ordP1 (y 2 ) = 2ordP1 (y) = 2. z Del mismo modo se tiene que ordP2 (x − e2 ) = ordP3 (x − e3 ) = 2. 2.5. DIFERENCIALES 15 Veamos ahora el orden en el punto del infinito, P∞ = [0, 1, 0]. Tal y como ya hemos visto en la Proposición 2.2, el grado de un divisor principal siempre es cero. De modo que, dado que ordP (x − ei ) = 0 para todo P 6= Pi , P∞ , entonces tenemos que (x − zei ) = 2(Pi ) + nP∞ (P∞ ) =⇒ nP∞ = −2. div z Veamos a continuación qué sucede con el divisor de la función y/z ∈ K(C). Se tiene que si P = [a, b, 1] 6= P1 , P2 , P3 , entonces y ordP = 0, z ya que la función y/z sólo tiene ceros en P1 , P2 , P3 , pues C ∩ {y = 0} = {[x, 0, z] : (x − e1 z)(x − e2 z)(x − e3 z)/z 3 = 0} = {P1 , P2 , P3 } y C tiene un único polo en P∞ . Además el Teorema de Bezout nos asegura que el orden de intersección en los puntos Pi ha de ser uno, y por tanto la función y/z ∈ K(C) será un parámetro en P1 , P2 , P3 . De modo que, y = (P1 ) + (P2 ) + (P3 ) + nP∞ (P∞ ) con 3 + nP∞ = 0. div z De donde ordP∞ (y/z) = −3. Entonces, div 2.5. x − zei z = 2(Pi ) − 2(P∞ ) div y z = P1 + P2 + P3 − 3P∞ . Diferenciales Definición. Sea C una curva. El espacio de formas diferenciales sobre C, denotado por ΩC , es el K-espacio vectorial generado por los sı́mbolos de la forma dx con x ∈ K(C)∗ , sujetos a las relaciones habituales: (i) d(x + y) = dx + dy (ii) d(xy) = xdy + ydx (iii) da = 0 para todo x, y ∈ K(C). para todo x, y ∈ K(C). para todo a ∈ K. Proposición 2.4. Sea C una curva, y P ∈ C. Si t ∈ K(C)∗ es un parámetro en P entonces: (a) Para cada ω ∈ ΩC existe una única función g ∈ K(C), que depende de ω y t tal que ω = gdt. Denotaremos a la función g como ω/dt. (b) Sea f ∈ K(C), siguiendo con la notación anterior, diremos que g = df /dt si df = gdt. Si f es regular en P , entonces la función df /dt ∈ K(C) también es regular en P . 16 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. (c) Sea ω ∈ ΩC , con ω 6= 0. La cantidad ordP (ω/dt) es independiente de la elección de parámetro t. Llamaremos a esta cantidad orden de ω en P , y lo denotaremos por ordP (ω). (d) Sea ω ∈ ΩC con ω 6= 0. Entonces ordP (ω) = 0 para todo P ∈ C salvo un número finito de ellos. Definición. Para ω ∈ ΩC , el divisor asociado a ω se define como X div(ω) = ordP (ω)(P ). P ∈C Diremos que ω es holomorfo si ordP (ω) ≥ 0 para todo P ∈ C, y que no se anula si ordP (ω) ≤ 0 para todo P ∈ C. Nótese que si ω1 , ω2 ∈ ΩC son dos diferenciales no nulos, entonces la Proposición 2.4(a) implica que existe f ∈ K(C)∗ tal que ω1 = f ω2 . Y por tanto, div(ω1 ) = div(f ) + div(ω2 ). Los apartados (c) y (d) de la misma proposición aseguran que efectivamente div(ω) ∈ Div(C). Definición. Un divisor canónico es aquel que tiene un representante de la forma div(ω), para ω ∈ ΩC , dentro del grupo de Picard. Es decir, D ∈ Div(C) es un divisor canónico si y sólo si existe ω ∈ ΩC tal que D − div(ω) es principal. De hecho, de la Proposición 2.4 se sigue que todos los divisores canónicos son equivalentes. Ejemplo 2.3. Sea C la curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ), con e1 , e2 , e3 ∈ K. Vamos a calcular div(dx). Si P = [a, b, 1] 6= P1 = [ei , 0, 1], entonces (x − a) es un parámetro en P , y como dx = d(x − a), entonces ordP (dx) = ordP (d(x − a)) = 0. Para Pi = [e1 , 0, 1] ∈ C tenemos que y es un parámetro uniformizante en Pi . Como y 2 = f (x) = (x − e1 )(x − e2 )(x − e3 ), entonces 2ydy = f 0 (x)dx =⇒ dx = 2y dy. f 0 (x) 2.6. TEOREMA DE RIEMANN-ROCH 17 Como Pi es un punto liso de C, entonces se tiene que f 0 (ei ) 6= 0, y por tanto ordPi (dx) = 1. Veamos ahora qué sucede en P∞ = [0, 1, 0]. Tenemos que z x /y d (x /y ) −x /y d (z /y ) x/y dx = d = . =d z z/y (z /y )2 Un parámetro uniformizante en P∞ es t = x/y, y vimos en el Ejemplo 2.2 que z = t3 f y con f ∈ K(C) y f (P∞ ) 6= 0. Por lo tanto, d x z = t3 (−2f − tf 0 )dt = t−3 gdt, t6 f 2 donde g ∈ K(C) no tiene ceros en P∞ . De donde, ordP∞ (dx) = −3. Ası́, tenemos que div(dx) = (P1 ) + (P2 ) + (P3 ) − 3(P∞ ) Por tanto div(dx/y) = div(dx) − div(y) = 0, y dx/y ∈ ΩC es holomorfa y no se anula en C. 2.6. Teorema de Riemann-Roch Sobre el grupo de divisores de una curva Div(C) vamos a definir una relación de orden parcial, a partir de las multiplicidades de los mismos. Definición. Dados D, D0 ∈ Div(C), diremos que X X D= nP (P ) ≥ D0 = n0P (P ) P ∈C P ∈C si y sólo si nP ≥ n0P para todo P ∈ C. Diremos que D es positivo cuando D ≥ 0. Resulta claro que no todos los divisores de una misma curva serán comparables. Pero las desigualdades de divisores resultan útiles para describir los polos y ceros de las funciones. Ejemplo 2.4. Continuando con el ejemplo anterior, C una curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ) definida sobre K. Supongamos que para f ∈ K(C) se cumple P1 + P2 − 3P∞ ≤ div(f ) ≤ P1 + P2 + P3 − 2P∞ . La primera desigualdad nos dice que la función f tiene dos ceros de orden uno en P1 y P2 , y un único polo de orden a lo sumo 3 en P∞ . De modo que div(f ) debe ser P1 + P2 − 2P∞ 18 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. o bien P1 + P2 + Q − 3P∞ para algún Q ∈ C, pues por la Proposición 2.2(b) sabemos que deg(div(f )) = 0. La segunda desigualdad establece que div(f ) ha de coincidir con P1 + P2 + P3 − 3P∞ o bien con el divisor Pi + Pj − 2P∞ para i 6= j, ya que no puede tener ceros fuera de {P1 , P2 , P3 } y tiene un polo en P∞ de orden al menos 2. De modo que las únicas opciones para div(f ) son: (i) div(f ) = P1 + P2 + P3 − 3P∞ (ii) o bien div(f ) = P1 + P2 − 2P∞ . Para el caso (i), recordemos que según lo visto en el Ejemplo 2.2 div(y/z) = P1 + P2 + P3 − 3P∞ , y por la Proposición 2.2(a) sabemos que, div(f ) − div(y/z) = 0 ⇐⇒ f = λ(y/z) ∗ para λ ∈ K . Para el caso (ii) veamos que no existe ninguna función racional en esta curva con el divisor correspondiente. En primer lugar, como el divisor 2P∞ tiene grado 2 > 2g − 2 = 1, el Teorema de RiemannRoch, (ver más adelante), establece que el espacio L(2P∞ ) tiene dimensión `(2P∞ ) = 2, por tanto ha de existir una base de generadores K-linealmente indepencientes del tipo {1, g} para alguna función racional g de K(C). Por otro lado, sabemos que la función g = (x − zei )/z tiene divisor 2Pi − 2P∞ , y por tanto g ∈ L(2P∞ ). De modo que buscamos una función en L(2P∞ ) con divisor P1 + P2 − 2P∞ , que ha de ser de la forma: az + bx para a, b ∈ K. bz Pero dado que ésta es una función lineal con un único polo de orden 3 en P∞ , la recta az + bx tendrı́a que pasar por P1 , P2 , P∞ , lo cual es una contradicción pues la única recta que pasa por P1 y P2 pasa también por P3 . Podemos entonces concluir que la condición, P1 + P2 − 3P∞ ≤ div(f ) ≤ P1 + P2 + P3 − 2P∞ , se cumple para una única función racional, salvo multiplicación por constantes, y ésta es f = λ(y/z). Definición. Sea D ∈ Div(C). Asociamos a D el conjunto de funciones L(D) = {f ∈ K(C)∗ : D + div(f ) ≥ 0} ∪ {0}. Ejemplo 2.5. Si continuamos con el ejemplo anterior, entonces para P ∈ C denotaremos por P al divisor D = 1 · (P ) y por −P al divisor D0 = (−1) · (P ). Se tiene ası́ que L(P ) = {f ∈ K(C)∗ : div(f ) + P ≥ 0} = {f ∈ K(C)∗ : ordP (f ) + 1 ≥ 0 y ordQ (f ) ≥ 0 para todo Q ∈ C, Q 6= P } = {f ∈ K(C)∗ : f tiene como mucho un único polo en P }. 2.6. TEOREMA DE RIEMANN-ROCH 19 Del mismo modo, L(−P ) = {f ∈ K(C)∗ : div(f ) − P ≥ 0} = {f ∈ K(C)∗ : ordP (f ) ≥ 1 y ordQ (f ) ≥ 0 para todo Q ∈ C, Q 6= P } = {f ∈ K(C)∗ : f tiene un cero en P y no tiene polos en C}. Pero como el grado de un divisor principal es siempre cero, entonces f ha de ser constante con un cero en P , L(−P ) = {0}. Del mismo modo L(0) = {f ∈ K(C)∗ : div(f ) ≥ 0} = {K}, ya que toda función sin polos, ha de ser constante. Pues el número de polos y ceros ha de compensarse. Proposición 2.5 (Propiedades de L(D)). Sea D ∈ Div(C), para una curva C definida sobre K. (i) L(D) es un K-espacio vectorial (de dimensión finita). (ii) Si D ≤ D0 entonces L(D) ⊂ L(D0 ). (iii) Si D ≡ D0 , entonces L(D) ∼ = L(D0 ), son isomorfos como K-espacios vectoriales. Demostración. (i) Sea λ ∈ K, f ∈ L(D): a) 0 ∈ L(D) por definición. ∗ b) Si λ ∈ K , entonces div(λf ) = div(f ) =⇒ λf ∈ L(D). c) Si f, g ∈ L(D), para todo P ∈ C ordP f, ordP g ≥ −ordP (D) = nP . Por tanto ordP (f + g) ≥ mı́n(ordP f, ordP g) ≥ −D y por tanto f + g ∈ L(D). (ii) Si f ∈ L(D), div(f ) + D0 ≥ div(f ) + D ≥ 0 y entonces f ∈ L(D0 ). (iii) Como D ≡ D0 entonces existe h ∈ K(C)∗ tal que D = D0 + div(h), de modo que si f ∈ L(D0 ), entonces div(f ) + D0 = div(f ) + div(h) + D = div(f h) + D ≥ 0, De modo que f h ∈ L(D). Basta definir el isomorfismo, L(D0 ) ←→ L(D) f 7−→ fh g/h ←− g 20 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. que claramente es compatible con la suma y con el producto por escalares, ya que h 6= 0. Definición. Denotaremos por `(D) = dimK L(D) a su dimensión. Teorema 2.6 (Riemann-Roch). Sea C una curva lisa, y KC un divisor canónico en C. Existe un entero g ≥ 0, que sólo depende de la curva, llamado género de C tal que para cada divisor D ∈ Div(C), `(D) − `(KC − D) = degD − g + 1. Corolario 2.7 (Consecuencias). (i) Si D = 0, entonces el teorema establece que `(KC ) = g. (ii) Si D = KC , entonces degKC = 2g − 2. (iii) Si degD > 2g − 2, entonces: deg(K − D) < 0 =⇒ `(K − D) = 0 =⇒ l(D) = deg(D) − g + 1. Ejemplo 2.6. Tal y como ya vimos en el ejemplo 2.3. El divisor de dx/y era un divisor canónico en la curva C : y 2 = (x − e1 )(x − e2 )(x − e3 ). Por el corolario anterior sabemos que 0 = div(dx/y) = 2g − 2 de donde se tiene que g = 1, la curva C tiene género 1. Proposición 2.8. Sea C/K una curva lisa y D ∈ DivK (K). Entonces existe una base de L(D) formada por funciones en K(C). Demostración. Como D está definido sobre K, entonce f σ ∈ L(Dσ ) = L(D) para todo f ∈ L(D) y σ ∈ Gal(K/K). De modo que Gal(K/K) actúa sobre L(D). Si denotamos por, L(D)K = {f ∈ L(D) : f σ = f para todo σ ∈ Gal(K/K)} entonces, L(D) ∼ = K ⊗K L(D)K el K−espacio vectorial L(D) tiene una base de vectores Gal(K/K)-invariantes, ver [3]. Y por tanto, dicha base pertenece al espacio de funciones racionales sobre K, K(C). 2.6. TEOREMA DE RIEMANN-ROCH 21 Proposición 2.9. Sea C ⊂ P2 una curva plana no singular de grado d, definida sobre un cuerpo K, C = V (f ) donde deg(f ) = d. Entonces su género es: g(C) = (d − 1)(d − 2) . 2 Demostración. Consideremos z = 0 la recta en el infinito, D := z · C el divisor de intersección y los espacios L(mD). Dado m ∈ N, definiremos como Vm al K-espacio vectorial de los polinomios homogéneos de grado m en K[x, y, z]. En primer lugar veamos que podemos definir una aplicación ψ: Vm −→ L(mD) g(x, y, z) 7−→ g(x,y,z) zm ya que g/z m ∈ K̄(C) está bien definida como aplicación racional, pues tanto g como z m son polinomios homogéneos de grado m. Además nótese que g/z m ∈ L(mD), o equivalentemente g + m(D) ≥ 0, zm pues g = (g) − (z m ) = (g · f ) − m(z · f ) zm pero por definición, (z · f ) = (C · {z = 0}) = D y por tanto g + mD = (g · f ) − mD + mD = (g · f ) ≥ 0 zm y entonces, g ∈ L(mD) zm para todo g ∈ Vm . A continuación veremos que existe una sucesión exacta φ ψ 0 −→ Vm−d −→ Vm −→ L(mD) −→ 0 h 7−→ hf g 7−→ g/z m Esto equivale a pedir, 1. Que la aplicación φ sea inyectiva: En primer lugar la aplicación está bien definida, pues como deg(h) = m − d, entonces deg(hf ) = deg(h) + deg(f ) = m y es homogéneo por ser producto de dos polinomios homogéneos. Además, φ(h1 ) = φ(h2 ) ⇐⇒ h1 f = h2 f la aplicación φ es inyectiva. ⇐⇒ (h1 − h2 )F = 0 ⇐⇒ h1 = h2 22 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. 2. Que, φ(Vm−d ) = Ker(ψ). Se sigue de las definiciones que g ∈ Ker(φ) sı́ y sólo si g/z m ≡ 0 (mód f ), de modo que g ∈ Ker(ψ) ⇐⇒ g/z m = f h para algún h ∈ K(C)∗ homogéneo de grado −d. De modo que g = f hz m = φ(hz m ) ∈ φ(Vm−d ). 3. Que la aplicación ψ sea sobreyectiva: Veamos que para todo t ∈ L(mD) existe un g ∈ Vm tal que, t= g ∈ L(mD). zm Sabemos que si t = rs , se cumple para s, r div(t) = (r · f ) − (s · f ) ≥ −mD = (z m · f ), (r · f ) + (z m · f ) ≥ (s · f ). Entonces, (rz m · f ) ≥ (s · f ) Por tanto existen a, b ∈ K̄[x, y, z] tales que, rz m = a · f + b · s Que bajo el cociente en K̄(C) equivale a decir que, f= r b = m = ψ(b) s z y por tanto ψ es sobreyectiva. Combinando las tres afirmaciones se tiene que la sucesión construida es exacta. Y comparando las dimensiones de la suceción se tiene que l(mD) = dimL(mD) = dimVm − dimVm−d . Donde dimK Vm m+2 (m + 2)(m + 1) = = , 2 2 pues existen exactamente m+2 monomios xi y j z k , de grado i + j + k = m, en K[x, y, z], 2 y todos ellos son K-linealmente independientes. De modo que, l(mD) = = (m + 2)(m + 1) (m − d + 2)(m − d + 1) − 2 2 2 2md + 3d − d 2 2.6. TEOREMA DE RIEMANN-ROCH Para todo m el teorema de Bézout asegura que, deg(mD) = m · deg(D) = m · d · 1 Y por tanto, para m suficientemente grande, tendremos deg(mD) = m · d > 2g − 2 pues g es finito. Del Teorema de Riemann-Roch se deduce que g = deg(mD) + 1 − l(mD) 2md + 3d − d2 = md + 1 − 2 (d − 2)(d − 1) d2 − 3d − 2 = . = 2 2 23 24 CAPÍTULO 2. VARIEDADES PROYECTIVAS. CURVAS PLANAS. Capı́tulo 3 Curvas Elı́pticas El objeto principal de nuestro estudio serán las curvas elı́pticas. Y trataremos de entender su geometrı́a. Para ello consideraremos los puntos con coordenadas sobre un cuerpo algebraicamente cerrado K, y más adelante nos centraremos en la aritmética con los puntos K-racionales de la curva, donde K será llegado el momento un cuerpo de números. Definición (1). Una curva elı́ptica es un par (E, O), donde E es una curva lisa de género uno y O ∈ E es un punto. La curva E está definida sobre un cuerpo K, denotaremos por E/K, si E está definida como variedad sobre K y O ∈ E(K). Definición (2). Una curva elı́ptica, es una curva plana y lisa, definida por una ecuación de Weierstrass C : y 2 z + a1 xyz + a3 yz 2 = x3 + a2 x2 z + a4 xz 2 + a6 z 3 . En general para simplificar, nos limitaremos a escribir la ecuación afı́n de la curva en el abierto A2z=1 , C : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , con un único punto en el infinito, z = 0, O = [0, 1, 0]. Como siempre, si a1 , .., a6 ∈ K diremos que E/K, E está definida sobre K Veamos a continuación que ambas definiciones son equivalentes. (1) =⇒ (2) Vamos a ver que dada E, puedo encontrar una curva plana C isomorfa a ella, del tipo descrito anteriormente. Para ello utilizaremos el teorema de Riemann-Roch. Consideremos: K = L(0) ⊂ L(O) ⊂ L(2O) ⊂ · · · ⊂ L(nO), donde `(0) = 1. Como g = 1, y si deg(D) ≥ 2g − 2 entonces el teorema asegura que `(D) = deg(D). Se tiene que para n ≥ 0: dim(L(nO)) = `(nO) = n Por la prpoposición 2.6 podemos elegir funciones de K(E) que formen una base de L(nO) para todo n. 25 26 CAPÍTULO 3. CURVAS ELÍPTICAS Si x, y ∈ K(E) son funciones con un polo doble y triple en O, respectivamente. Considero las bases: L(0) ∩ L(O) ∩ L(2O) ∩ L(3O) ∩ L(4O) ∩ L(5O) ∩ L(6O) = <1> = <1> = < 1, x > con ordP (x) = −2, x ∈ / L(O) = < 1, x, y > con ordP (y) = −3, y ∈ / L(2O) = < 1, x, x2 , y > con ordP (x2 ) = −4, x2 ∈ / L(3O) = < 1, x, x2 , xy, y > con ordP (xy) = −5, xy ∈ / L(4O) = < 1, x, x2 , x3 , xy, y, y 2 > con ordP (y 2 ) = ordP (x3 ) = −6 Entonces, dado que `(6O) = 6 el conjunto {1, x, x2 , x3 , xy, y, y 2 } de generadores ha de satisfacer una relación lineal, digamos A1 + A2 x + A3 y + Ay x2 + A5 xy + A6 x3 + A7 y 2 = 0, y sin pérdida de generalidad podemos asumir que Ai ∈ K. Con A5 A7 6= 0, ya que si no todos los términos tendrı́an un polo de distinto orden y la relación serı́a trivial, A1 = · · · = A7 = 0, ya que {1, x, x2 , xy, y} son linealmente independientes por construcción. Realizando un sencillo cambio de variable, x − 7 → −A6 A7 x y − 7 → A6 A27 y y tras dividir por A36 A47 obtenemos la siguiente ecuación de Weierstrass y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 con a1 , ..., a6 ∈ K, donde las funciones construidas x, y se conocen como coordenadas de Weierstrass. Esto nos define la aplicación, φ = [x, y, 1] : E −→ P2 P 7−→ [x(P ), y(P ), 1] cuya imagen cae en la curva C descrita por la ecuación de Weierstrass anterior. Además, por ser φ una aplicación racional y E una curvas lisa, automáticamente φ es un morfismo. Se tiene que φ(O) = [x(O), y(O), 1] = [x(O)/y(O), 1, 1, y(O)] = [0, 1, 0] y como y ∈ K(E), entonces hay un número infinito de puntos P ∈ E(K) con ordP (y) = 0, de hecho sólo puede haber un número finito de puntos en los que el orden no sea cero. Para cualquiera de estos puntos se tiene que φ(P ) = [x(P ), y(P ), 1] = [x(P )/y(P ), 1, 1/y(P )] 6= [0, 1, 0] = φ(O) 27 de modo que claramente la función φ es no constante. Y por ser φ : E −→ C un morfismo no constante entre curvas, entonces ha de ser sobreyectiva. El siguiente paso es probar que el morfismo φ es de grado 1, o equivalentemente, probar que K(E) = K(x, y). En primer lugar, dado que la función x tiene un polo de orden dos sobre O y ningún otro polo, entonces la aplicación φ1 = [x, 1] : E −→ P1 tiene grado 2, ya que φ−1 1 ([1, 0]) = {O}. De manera equivalente, se tiene que la aplicación φ2 = [y, 1] : E −→ P1 tiene grado 3. A continuación consideremos la torre de cuerpos, K(E) 66 66 66 66 [K(E):K(x)]=2 66[K(E):K(y)]=3 K(x, y) 6 H H v vv HH 666 H v HH 66 vvv HH 6 vv K(x) K(y) como [K(E) : K(x, y)] ha de dividir a 2 y a 3, se tiene que [K(E) : K(x, y)] = 1. Por último, hemos de demostrar que C es efectivamente lisa. Supongamos que C fuese singular, y por tanto birracionalmente equivalente a P1 , entonces habrı́a de existir una aplicación racional ψ : C −→ P1 de grado uno. Pero ψ ◦ φ : E −→ P1 serı́a una aplicación de grado uno entre E y P1 , dos curvas lisas, y por tanto un isomorfismo. Sin embargo esto es claramente una contradicción, pues dos curvas de géneros distintos no pueden ser isomorfas (recordemos que el género de E es uno por definición y que el género de P1 es cero). De donde se sigue que la aplicación φ : E −→ C es un isomorfismo de curvas. (2) =⇒ (1) Dado que el grado de una curva de Weierstrass es 3, y ésta es lisa, entonces sabemos por la Proposición 2.9 que el género de la curva es g(C) = (d − 1)(d − 2) = 1. 2 Basta entonces comprobar que C tiene al menos un punto K-racional, O, para ello veamos que si z = 0, C ∩ H∞ = [0, 1, 0] ∈ C(K). 28 CAPÍTULO 3. CURVAS ELÍPTICAS A partir de ahora consideraremos siempre una curva elı́ptica E/K, dada por una ecuación de Weierstrass, E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 ai ∈ K, y con punto base O = [0, 1, 0]. Si char(K) 6= 2, completando cuadrados podemos reducir la ecuación a una de la forma E : y 2 = 4x3 + b2 x2 + b4 x + b6 , donde b2 = a21 + 4a4 , b6 = a23 + 4a6 . b4 = 2a4 + a1 a3 , Y si además char(K) 6= 3, entonces completando cubos obtenemos con un cambio sencillo de variable E : y 2 = x3 − 27c4 x − 54c6 , con c4 = b22 − 24b4 , c6 = −b32 + 36b2 b4 − 216b6 . Definición. Si una curva elı́ptica se presenta con una ecuación de Weierstrass, E : y 2 = x3 + Ax + B entonces se dice que está en forma de Weierstrass reducida. Para una curva elı́ptica de ecuación reducida, E : y 2 = x3 + Ax + B tenemos que,   a1 = a2 = a3 = 0 a4 = A  a6 = B y   b2 = 4A b4 = 2A  b6 = 4B Definición. Dada E/K una curva elı́ptica en forma de Weierstrass E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 ai ∈ K, definiremos la cantidad ∆, determinante de la curva, como ∆ = −b22 b8 − 8b4 − 27b26 + 9b2 b4 b6 , donde b8 = a1 a6 + 4a2 a6 − a1 a3 a4 + a2 a23 − a4 . Si la curva se presenta en una forma de Weierstrass reducida, E : y 2 = x3 + Ax + B entonces ∆ = −16(4A3 + 27B 2 ), con b8 = −A2 . Una curva general de Weierstrass como las anteriores es lisa si y sólo si ∆ 6= 0 en K. 3.1. LEY DE GRUPO 3.1. 29 Ley de grupo Sea E una curva elı́ptca dada por una ecuación de Weierstrass. Entonces, E = {[x, y, 1] : x, y satisfacen la ecuación de Weierstrass} ∪ {O = [0, 1, 0]} ⊂ P2 . Sea L una lı́nea proyectiva. Dado que la ecuación de E es de grado 3, el teorema de Bezout nos asegura que L interseca a E en exactamente 3 puntos, con multiplicidades, digamos P, Q, R. Es claro que estos tres puntos no son necesariamente distintos, (véase el caso en que L es tangente a E). Podemos ası́ definir una ley de grupo ⊕ sobre E. Ley de Grupo para una curva elı́ptica: Sean P, Q ∈ E y L la lı́nea que pasa por P y Q, (si P = Q entonces L es tangente a E en el punto), sea R el tercer punto de intersección de L con E. Y llamemos L0 a la lı́nea que pasa por R y O, entonces el tercer punto de intersección de L0 y E es denotado por P ⊕ Q. A continuación, demostraremos que efectivamente la ley de grupo descrita anteriormente dota al conjunto de los puntos de E de una estructura de grupo. Proposición 3.1. Sea E una curva elı́ptica. Entonces la ley de grupo satisface, (a) Si una lı́nea L interseca a E en los puntos P, Q, R, (no necesariamente distintos), entonces (P ⊕ Q) ⊕ R = O. (b) Elemento neutro: P ⊕ O = P para todo P ∈ E. (c) Conmutatividad: P ⊕ Q = Q ⊕ P para todo P, Q ∈ E. (d) Elemento inverso: Dado P ∈ E, entonces existe un punto P ∈ E tal que P ⊕ (P ) = O. (e) Asociatividad: Dados P, Q, R ∈ E, entonces P ⊕ (Q ⊕ R) = (P ⊕ Q) ⊕ R. 30 CAPÍTULO 3. CURVAS ELÍPTICAS En otras palabras, (E, ⊕) es un grupo abeliano con elemento neutro O, donde ⊕ denota la ley de grupo. (f ) Si además E está definida sobre un cuerpo K, entonces E(K) = {(x, y) : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 } ∪ {O} es un subgrupo de (E, ⊕). Demostración. (a) El resultado se sigue de la definición de la ley de grupo, pues al sumar P ⊕ Q se obtiene el punto R0 , que es el tercer punto de intersección de la recta que pasa por R y O. De modo que R ⊕ R0 = O. (b) Veamos que efectivamente el elemento O, que define la ley de grupo, es neutro para la operación. Si tomamos la lı́nea que une O con un punto cualquiera P , ésta cortará por definición en un punto P 0 . Y el punto P ⊕ O es el tercer punto de intersección de la curva con la recta que pasa por P 0 y O, que no es otro sino P . (c) La conmutatividad se sigue directamente de la construcción de la ley, puesto que ésta es puramente geométrica, (basta darse cuenta de que la recta que pasa por P y Q coincide con la que pasa por Q y P ). (d) Defino el inverso (opuesto) como el punto P de intersección de la curva con la recta que pasa por O y P . Ahora, sabemos por el apartado (a) que, P ⊕ (P ) ⊕ O = O, y por el apartado (b), P ⊕ (P ) ⊕ O = P ⊕ (P ) = O. Nótese además, que con esta nueva notación el punto R0 de (a) coincide con R, y el punto P 0 de (b) es P . Además, la definición tiene sentido también para O, ya que O = O, la recta tangente a O corta tres veces (o con multiplicidad tres) al punto. (e) Para demostrar la asociatividad, vamos a definir una aplicación κ E −→ P ic0 (E) = Div 0 (E)/ ∼ P 7−→ (P ) − (O) 3.1. LEY DE GRUPO 31 que de hecho podemos restringir a los puntos K-racionales, 0 E(K) −→ DivK (E) P P donde D ∈ DivK (E) si y sólo si Dσ = nP (P σ ) = nP (P ) = D para todo σ ∈ Gal(K/K). Demostraremos que κ es una biyección: (I) Es inyectiva: Si κ(P ) = κ(Q), entonces (P ) − O ∼ (Q) − O de modo que existe una función f ∈ K(E) tal que div(f ) = P − Q =⇒ f ∈ L(Q) = K. Como f no puede tener ceros en P, Q, entonces P = Q. (II) Es sobreyectiva: Fijado D ∈ Div 0 (E) hemos de ver que existe un punto P ∈ E tal que P − O ∼ D. Como deg(D + O) = 1 > 2g − 1 = 0, el espacio L(D + O) tiene dimensión `(D + O) = deg(D + O) = 1. Entonces si f ∈ L(D + O), f ∈ / K, tenemos que div(f ) + D + O = P y por tanto D ∼ (P ) − (O). Dado que el grupo de Picard tiene una estructura natural de grupo, X D + D0 = (nP + n0P )(P ), P ∈E se tiene que la curva hereda esta estructura de grupo, mediante κ. Donde κ(O) = 0. Pero hemos de ver que la estructura de grupo que define κ coincide con la de E, es decir (P − O) + (Q − O) = (P ⊕ Q − O) en P ic0 (E). Sea ` la recta que pasa por P y Q, (` · E) = P + Q + R su divisor de intersección. Y L0 la recta que pasa por R y O, (`0 · E) = R + O + (P ⊕ Q). De modo que podemos definir los divisores de las funciones racionales 0 ` ` div = P + Q + R − 3O, div = (P ⊕ Q) + R − 2O, z z y por tanto ` div 0 = P + Q + R − 3O − ((P ⊕ Q) + R − 2O) = P + Q − (P ⊕ Q) − O ` 32 CAPÍTULO 3. CURVAS ELÍPTICAS de modo, dado que `/`0 ∈ K(E) se sigue que P − O + Q ∼ P ⊕ Q =⇒ (P − O) − (Q − O) ∼ (P ⊕ Q) − O. Ambas operaciones son compatibles, y la biyección es de hecho un isomorfismo de grupos. La asociatividad en (E, ⊕) se sigue de la del grupo de Picard. (f) Si P, Q ∈ E(K) entonces la ecuación de la recta que los une tendrá coeficientes en K, entonces las coordenadas del tercer punto de intersección vienen dadas por una combinación racional de coordenadas y coeficientes de la lı́nea y de E, de modo que estará en E(K). Si no resulta claro, basta consultar las fórmulas explı́citas de la ley de grupo dadas a continuación. Una vez definida la ley de grupo, no resulta muy complicado derivar fórmulas explı́citas para la misma. De este modo, si E/K es una curva elı́ptica con ecuación de Weierstrass general E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , o bien en forma reducida E : y 2 = x3 + Ax + B. Para P1 = (x1 , y1 ) y P2 = (x2 , y2 ) puntos generales de la curva definiremos las cantidades λ y ν: (i) λ = (ii) λ = y2 − y1 y1 x2 − y2 x1 , ν= si x1 6= x2 , x2 − x1 x2 − x1 3x21 + 2a2 x1 + a4 − a1 y1 −x31 + a4 x1 + 2a6 − a3 y1 , ν= si x1 = x2 , 2y1 + a1 x1 + a3 2y1 + a1 x1 + a3 para la ecuación general. Y e = y2 − y1 , νe = y1 x2 − y2 x1 si x1 6= x2 , (i) λ x2 − x1 x2 − x1 2 3 e = 3x1 + A , νe = −x1 + Ax1 + 2B si x1 = x2 , (ii) λ 2y1 2y1 en la ecuación reducida. e + νe), es la lı́nea que pasa por P1 , P2 o bien la Entonces y = λx + ν, (o en su caso y = λx lı́nea tangente a E en P1 = P2 . Y el punto P3 = P1 ⊕ P2 tiene coordenadas, e2 − (x1 + x2 ), x3 = λ2 + a1 λ − a2 − (x1 + x2 ) = λ e 3 − νe. y3 = −(λ + a1 )x3 − ν − a3 = −λx El algoritmo explı́cito viene dado por: (a) Fórmula para el inverso: −P = (x, −y − a1 x − a3 ) −P = (x, −y) para la fórmula general, y en la forma reducida. 3.2. SUBGRUPO DE TORSIÓN 33 (b) Fórmula de duplicación: [2]P x([2]P ) = x4 − b4 x2 − 2b6 x − b8 , 4x3 + b2 x2 + 2b4 x + b6 x([2]P ) = para la fórmula general, y x4 − 2Ax2 − 8Bx + A2 4(x3 + Ax + B) para la forma reducida. (c) Fórmula de la suma: P1 ⊕ P2 cuando P1 6= ±P2 y2 − y1 2 y2 − y1 x(P1 ⊕ P2 ) = − a2 − (x1 + x2 ), + a1 x2 − x1 x2 − x1 en el caso general, y x(P1 ⊕ P2 ) = 3.2. y2 − y1 x2 − x1 2 − (x1 + x2 ), en la ecuación reducida. Subgrupo de Torsión Tal y como ya hemos visto en la primera sección del capı́tulo, los puntos de la curva E/K forman un grupo abeliano con respecto de la operación ⊕. Y por tanto resulta natural tratar de entender su estructura como Z-módulo. Definición. Sea E una curva elı́ptica, y m ∈ Z un entero mayor que uno. Definiremos la m-torsión de E como E[m] = {P ∈ E : [m]P = O}. De manera análoga se definira la m-torsión racional como E[m](K) = {P ∈ E(K) : [m]P = O} ⊂ E(K). Definición. El subgrupo de torsión de E, denotado por Etors , es el conjunto de puntos de orden finito ∞ [ Etors = E[m]. m=1 Si E/K, entonces Etors (K) denota el conjunto de puntos de orden finito de E(K). Podemos definir para cada m ≥ 1 entero, un homomorfismo de grupos [m] : E −→ E P 7−→ [m]P que además es un morfismo. A este tipo de aplicaciones, que respetan tanto la estructura de grupo de (E, ⊕) como la estructura de variedad proyectiva de la curva, se las conoce como isogenias. En este caso tenemos que el conjunto de puntos de m-torsión, coincide exactamente con el núcleo de esta isogenia ker([m]) = E[m]. Además, aunque no incluiré la demostración, se tiene que deg([m]) = m2 . A partir de esta afirmación es sencillo deducir la estructura de la m-torsión. 34 CAPÍTULO 3. CURVAS ELÍPTICAS Proposición 3.2. Sea E/K una curva elı́ptica, y m ≥ 1 un entero. Entonces: (a) Si m 6= 0 in K, es decir char(K) = 0 o 0 < p = char(K) 6 | m, entonces E[m] ∼ = Z/mZ × Z/mZ. (b) Si char(K) = p y m = pe , entonces una de las siguientes afirmaciones es cierta para E: (i) E[pe ] = {O} para todo e = 1, 2, 3... e e ∼ (ii) E[p ] = Z/p Z para todo e = 1, 2, 3... Demostración. (a) Por ser [m] un morfismo separable, se sigue que deg[m] = |ker[m]| = |E[m]| = m2 . Como además para todo d|m se tiene que E[d] ⊂ E[m] por definición, la afirmación anterior nos dice que el grupo E[m] tiene un subgrupo de d2 elementos. Y escribiendo E[m] como producto de grupos cı́clicos, es sencillo darse cuenta de que el único grupo abeliano de m2 elementos con esta propiedad es Z/mZ × Z/mZ. (b) Este apartado se sigue de las propiedades del morfismo de Frobenius. Ver III.6.4. de [10] . Tal y como ya hemos dicho anteriormente, en este trabajo estamos interesados principalmente en el estudio de curvas elı́pticas definidas sobre cuerpos de números, de modo que de ahora en adelante nos centraremos únicamente en cuerpos de caracterı́stica cero. A partir de la ecuación de Weierstrass de una curva elı́ptica, a base de realizar iteraciones sobre la fórmula de duplicación dada en la sección 3.1, se pueden obtener fórmulas explı́citas para las coordenadas de los puntos de m torsión. De modo que es relativamente sencillo caracterizar dichos puntos. Ejemplo 3.1. Sea E : y 2 = (x−e1 )(x−e2 )(x−e3 ) la curva elı́ptica que venimos manejando en nuestros ejemplos. Entonces los puntos de [2]−torsión son aquellos para los que P ⊕ P = O, o equivalentemente P = −P . De la fórmula del inverso, tenemos que si P = (x0 , y0 ) entonces −P = (x0 , y0 − a1 x0 − a3 ), pero en este caso tenemos que a1 = a3 = 0, de modo que cualquier punto de [2]-torsión ha de cumplir la condición P = (x0 , y0 ) = (x0 , −y0 ) = −P =⇒ y0 = 0 =⇒ x0 = ei y por tanto tenemos los puntos de [2]-torsión E[2] = {P1 = (e1 , 0), P2 = (e2 , 0), P3 = (e3 , 0), O} que son precisamente los puntos con tangente vertical. 3.3. VALORES ABSOLUTOS Y REDUCCIÓN DE UNA CURVA ELÍPTICA. 35 Dado que el grupo de torsión de una curva elı́ptica es infinito, pues hay m2 puntos de m torsión para toda m ≥ 1, tal y como ya hemos visto, y dado que la proposición anterior nos proporciona todas las nociones necesarias para entender su estructura, resulta natural preguntarse por cómo serán los puntos de torsión K-racional. Como veremos más adelante, el Teorema de Mordell-Weil nos garantiza que el número de puntos de torsión K-racional es finito. Tal y como veremos en la sección 5.4 existen teoremas de estructura suficientemente fuertes, e incluso técnicas efectivas para poder calcular E(K)tors . 3.3. Valores absolutos y reducción de una curva elı́ptica. Recordemos que el conjunto de valores absolutos estándar sobre Q, que denotamos por MQ , contiene: (i) Un valor absoluto arquimediano, |x|∞ = máx{x, −x} que no es más que el valor absoluto usual. La compleción de Q con respecto a | · |∞ coincide con R. (ii) Para cada primo p ∈ Z, un valor absoluto (p-ádico) no arquimediano, cuya norma viene dada por, |x|p = p−vp (x) donde vp denota la valoración p-ádica de x, que puede definirse como el máximo exponente de p que divide a x, i.e. vp (x) = n ⇐⇒ x = pn a con p 6 |ab. b La compleción de los racionales con respecto de esta norma coincide con el cuerpo de los números p-ádicos Qp . La compleción del cuerpo K con respecto de una valoración v se denotará por Kv . Su anillo de enteros Rv = {x ∈ Kv : |x|v ≥ 0}, tiene ideal maximal Mv = {x ∈ Kv : |x| > 0} = πv Rv , donde πv es un uniformizante en v. Denotaremos por k = Rv /Mv al cuerpo residual de Rv . El conjunto de valores absolutos estándar de un cuerpo de números K, denotado por MK , es el conjunto de valores absolutos cuya restricción a Q es uno de los valores absolutos anteriores. Es decir, w ∈ MK ⇐⇒ ∃ v ∈ MQ tal que |x|w = |x|v para todo x ∈ Q. 36 CAPÍTULO 3. CURVAS ELÍPTICAS ∞ son los valores absolutos arquimedianos, mientras que M 0 denota el conjunto de Y MK K los valores absolutos no arquimedianos (finitos) en MK . Dada E/K una curva elı́ptica, y E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 su ecuación de Weierstrass. Entonces la sustitución (x, y) 7→ (u−2 x, u−3 y) da lugar a una nueva ecuación en la que los ai son reemplazados por ui ai . Definición. Sea E/K una curva elı́ptica. Una ecuación de Weierstrass para E se dice minimal en v si el valor v(∆) es mı́nimo, bajo la condición de que v(ai ) ≥ 0. Nótese que la condición de que v(ai ) ≥ 0 equivale a pedir que a1 , ..., a6 ∈ Rv . Y ésto necesariamente implica que ∆ ∈ Rv , por ser éste un anillo. Además, si la ecuación no es minimal, entonces existe un cambio de coordenadas que da lugar a un nuevo discriminante ∆0 = u12 ∆ ∈ R. De modo que v(∆) sólo puede cambiar por múltiplos de 12, de modo que si a1 , ..., a6 ∈ Rv y v(∆) < 12 =⇒ la ecuación es minimal. Si char(K) 6= 2, 3 entonces el recı́proco también es cierto y tenemos una caracterización de ecuaciones minimales. A continuación, vamos a centrarnos en la operación de reducción módulo πv , que denotaree Para ello, definiremos en primer lugar la aplicación de reducción natural, con mos por E. 0, respecto de una valoración v ∈ MK Rv −→ kv = Rv /Mv e t 7−→ t Habiendo escogido una ecuación minimal para E/Kv , podemos reducir sus coeficientes módulo πv para obtener una curva (tal vez singular) definida sobre kv , denotada por ev : y 2 + e E a1 xy + e a3 y = x3 + e a2 x2 + e a4 x + e a6 . ev /kv es la reducción de E módulo πv . Fijado un punto P ∈ E(Kv ), con La curva E coordenadas homogéneas P = [x0 , y0 , z0 ] tales que x0 , y0 , z0 ∈ Rv , el punto reducido e v ). Esta relación define la aplicación de reducción, Pe = [e x0 , ye0 , ze0 ] pertenece a E(k ev (kv ) E(Kv ) −→ E P 7−→ Pe ev /kv , puede ser singular. Pero en cualquier caso el conjunto de puntos La curva reducida E ens (kv ) forma un grupo. Podemos entonces definir dos conjuntos no singulares de la curva E de E(Kv ) ens (kv )}, E0 (Kv ) = {P ∈ E(Kv ) : Pe ∈ E e E1 (Kv ) = {P ∈ E(Kv ) : Pe = O}. Diremos que E0 (Kv ) es el conjunto de puntos de reducción nosingular y E1 (Kv ) el núcleo de reducción. 3.3. VALORES ABSOLUTOS Y REDUCCIÓN DE UNA CURVA ELÍPTICA. 37 0 una valoración discreta. Diremos que E/K tiene buena reDefinición. Sea v ∈ MK v ducción en v, si Ev /kv es nosingular. En cualquier otro caso diremos que E tiene mala 0 reducción en v. En general diremos que E/K tiene buena (resp. mala) redución en v ∈ MK si E tiene buena (resp. mala) reducción cuando se considera sobre la compleción Kv . A continuación enunciaremos las condiciones que ha de cumplir una curva para tener una buena reducción en v. Proposición 3.3. Sea E/K una curva elı́ptica dada por ecuación minimal de Weierstrass E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 . 0 Sea ∆ el discriminante de esta ecuación. Entonces E tiene una buena reducción en v ∈ MK ev /kv si y sólo si v(∆) = 0, i.e. si ∆ ∈ Rv∗ es una unidad. En este caso la curva reducida E es una curva elı́ptica. Ejemplo 3.2. Sea E : y 2 = x3 + Ax + B una curva elı́ptica definida sobre Q con A, B ∈ Z. Entonces, si vp (∆) = vp (−16(4A3 − 27B 2 )) = 0, e p es una curva elı́ptica, con ecuación de la ecuación es minimal y la curva reducida E/F Weierstrass ep : y 2 = x3 + Ap x + Bp E con A ≡ Ap (mód p) B ≡ Bp (mód p). Nótese que no siempre será posible escoger una única ecuación de Weierstrass de E sobre K 0 . Obsérvese que si tomamos cualquier que sea simultáneamente minimal para todo v ∈ MK ecuación de Weierstrass para E/K, E : y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 , 0 , salvo un número finito, se tiene con discriminante ∆. Entonces para todos los v ∈ MK v(ai ) ≥ 0 para i = 1, ..., 6 y v(∆) = 0. Para todo v cumpliendo estas condiciones, la ecuación dada es minimal y la curva reducida 0, Ev /kv nosingular. De modo que E tiene una buena reducción en v para todos los v ∈ MK salvo una cantidad finita de ellos. 0 una valoración discreta tal que v(m) = 0 y E tiene una Proposición 3.4. Sea v ∈ MK buena reducción en v. Entonces la aplicación de reducción, ev (kv ) E(K)[m] −→ E P = [x0 , y0 , z0 ] 7−→ Pe = [e x0 , ye0 , ze0 ] es inyectiva. 38 CAPÍTULO 3. CURVAS ELÍPTICAS Demostración. Sean, ens (k)} y E1 (K) = {P ∈ E(K) : Pe = O}, e E0 (K) = {P ∈ E(K) : Pe ∈ E los puntos con reducción no singular y el núcleo de reducción respectivamente. Entonces se tiene que existe una sucesión exacta de grupos abelianos dada por, 0 −→ E1 (K) −→ E0 (K) −→ Ens (k) −→ 0 Donde E1 (K) no contiene puntos de orden m no triviales. Ver VII 3.1 de [10]. e es no singular, entonces se tiene que E0 (K) = E(K), y que E ens (k) = E(k). e Dado que E De modo que si dos puntos de m-torsión, digamos P1 , P2 ∈ E(K)[m], tienen la misma reducción en v, Pe, entonces P1 − P2 ∈ E1 (K), que no posee puntos no triviales de m-torsión. e De donde se sigue que la m-torsión de E(K) se inyecta en E(k). 3.4. Emparejamiento de Weil Sea E/K una curva elı́ptica definida sobre un cuerpo K. Para esta sección fijaremos m ≥ 2, un entero primo con p = char(K), si el cuerpo es de caracterı́stica positiva. Como grupo abstracto, el grupo de los puntos de m-torsión de E es isomorfo a E[m] ∼ = Z/mZ × Z/mZ. De modo que es un Z/mZ−módulo libre de rango dos. Dada una base {T1 , T2 } de E[m], se define el emparejamiento determinante de E[m] como det : E[m] × E[m] −→ Z/mZ (aT1 + bT2 , cT1 + dT2 ) 7−→ ad − bc cuyo valor es independiente de la elección de la base. Sin embargo, este emparejamiento no es invariante por la acción del grupo de Galois, i.e., si P, Q ∈ E[m] y σ ∈ Gal(K/K), entonces los valores de det(P σ , Qσ ) y de det(P, Q)σ no tienen por qué coincidir. Para conseguir invarianza en Gal(K/K) podemos emplear el emparejamiento modificado dado por ζ det(P,Q) , donde ζ es una raı́z primitiva m-ésima de la unidad. Para definir este emparejamiento intrı́nsecamente, P hemos de emplear un resultado sobre curvas elı́pticas que nos asegura que un divisor ni (Pi ) ∈ Div(E) es principal si y sólo si X ni = 0 y ⊕ [ni ]Pi = O. Sea T ∈ E[m]. Entonces existe una función f ∈ K(E) que satisface div(f ) = m(T )−m(O). Si además T 0 ∈ E cumple [m]T 0 = T , entonces existe una función similar g ∈ K(E) tal que div(g) = [m]∗ (T ) − [m]∗ (O). Donde [m]∗ es la aplicación inducida por la isogenia [m] entre los grupos de divisores, dada por X [m]∗ (Q) = e[m] (P ) · (P ) P ∈[m]−1 (Q) 3.4. EMPAREJAMIENTO DE WEIL 39 y e[m] (P ) es el ı́ndice de ramificación de [m] en P , que en este caso es 1 porque (m, p) = 1. De modo que, X div(g) = (T 0 + R) − (R), con [m]T 0 = T. R∈E[m] Nótese que div(g m ) = div(f ◦ [m]). Pues, en primer lugar tenemos que X m(T 0 + R) − m(R). div(g m ) = m · div(g) = R∈E[m] Por otro lado, f ◦ [m](P ) = f ([m]P ) donde div(f ) = m(T ) − m(O), de modo que X X div(f ◦ [m]) = m(T 0 + R) − m(R). R∈E[m] R∈E[m] ∗ De modo que, multiplicando f por una constante apropiada en K , podemos asumir que f ◦ [m] = g m . Consideremos ahora S ∈ E[m] otro punto de m-torsión, donde se permite S = T . Entonces para cada X ∈ E tenemos que g(X + S)m = f ([m]X + [m]S) = f ([m]X) = g(X)m . De modo que la función, X 7−→ g(X + S)/g(X) toma un número finito de valores, ya que cada X es llevado a una raı́z m-ésima de la unidad, g(X + S)/g(X) ∈ µm . En particular, la aplicación E −→ P1 S 7−→ [g(X + S)/g(X), 1] = [g(X + S), g(X)] es un morfismo por ser una aplicación racional entre curvas lisas. Como no es sobreyectivo ha de se constante. Éste hecho nos permite definir el emparejamiento, em : E[m] × E[m] −→ µm , (S, T ) 7−→ g(X + S)/g(X) tal que X ∈ E sea cualquier punto tal que g(X + S) y g(X) estén definidos y no sean cero. Recordemos que T aparece impı́citamente en la costrucción, en el divisor principal de g, de modo que efectivamente em depende de sus dos entradas. Aunque g está definida ∗ salvo multiplicación por escalares K , em (S, T ) no depende de dicha elección, ası́ como no depende de la elección de X, tal y como ya hemos visto. Definición. La aplicación que acabamos de definir, em : E[m] × E[m] −→ µm se conoce como el (m−)emparejamiento de Weil. A continuación se enumeran algunas de sus propiedades básicas del emparejamiento. 40 CAPÍTULO 3. CURVAS ELÍPTICAS Proposición 3.5. El emparejamiento de Weil tiene las siguientes propiedades: (a) Es bilineal, em (S1 + S2 , T ) = em (S1 , T )em (S2 , T, ) em (S, T1 + T2 ) = em (S, T1 )em (S, T2 ). (b) Es alternante, em (T, T ) = 1, y en consecuencia, junto con el apartado (a), se tiene que em (S, T ) = em (T, S)−1 . (c) Es no degenerado, Si em (S, T ) = 1 para todo S ∈ E[m] =⇒ T = O. (d) Es invariante por la acción del grupo de Galois, em (S, T )σ = em (S σ , T σ ) para todo σ ∈ Gal(K/K). (e) Es compatible, emm0 (S, T ) = em ([m0 ]S, T ) para todo S ∈ E[m0 m] y T ∈ E[m]. Corolario 3.6. Existen puntos T, S ∈ E[m] tales que em (S, T ) es una raı́z primitiva mésima de la unidad. En particular, si E[m] ⊂ E(K), entonces µm ⊂ K ∗ , donde µm denota el grupo (multiplicativo) formado por las raı́ces m-ésimas de la unidad. Capı́tulo 4 Versión débil del teorema El objetivo de este capı́tulo es probar una versión débil del teorema de Mordell-Weil, que es el primer paso para poder probar el Teorema de Mordell-Weil. Teorema 4.1 (Teorema débil de Mordell-Weil). Sea K un cuerpo de números, sea E/K una curva elı́ptica y m ≥ 2 un número entero. Entonces, E(K)/mE(K) es un grupo finito. En primer lugar vamos a probar el siguiente lema de reducción, que nos permitirá asumir en el futuro que E[m] ⊂ E(K) para probar la finitud de E(K)/mE(K). Lema 4.2. Sea K un cuerpo de números, L/K una extensión finita de Galois y m ≥ 2 un entero. Si E(L)/mE(L) es finito, entonces también lo es E(K)/mE(K) para cualquier curva elı́ptica E definida sobre K. Demostración. La inclusión natural E(K) ,→ E(L), induce una aplicación E(K)/mE(K) −→ E(L)/mE(L), con núcleo natural, Φ = {P + mE(K) : P ∈ E(K) ∩ mE(L)} = E(K) ∩ mE(L) . mE(K) Es decir, que para cada P + mE(K) ∈ Φ, existe un punto QP ∈ mE(L) tal que QP = P , (el punto QP no tiene por qué ser único). Podemos entonces construir una aplicación de conjuntos, que no será en general un homomorfismo de grupos, de la siguiente manera: λP : Gal(L/K) −→ E[m]. σ σ 7−→ QP − QP Nótese que efectivamente QσP − QP ∈ E[m], pues [m](QσP − QP ) = ([m]QP )σ − [m]QP = P − P = O, 41 42 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA ya que todo σ ∈ Gal(L/K) fija P ∈ E(K). Veamos ahora que existe una correspondencia entre aplicaciones de Gal(L/K) en E[m] y puntos de Φ. Sean P, P 0 ∈ E(K) ∩ mE(L) dos puntos que dan lugar a la misma aplicación λP = λP 0 , entonces se tiene que QσP − QP = QσP 0 − QP 0 ⇒ (QP − QP 0 )σ = QP − QP 0 para todo σ ∈ Gal(L/K). De modo que QP − QP 0 ∈ E(K), y por tanto: P − P 0 = [m]QP − [m]QP 0 ∈ mE(K) ⇒ P ≡ P0 (mód mE(K)) De modo que, Φ −→ M ap(Gal(L/K), E[m]) P 7−→ λP es inyectivo, y por tanto Φ ha de ser finito, ya que tanto Gal(L/K) como E[m] ∼ = Z/mZ × Z/mZ son grupos finitos, por lo cual existe un número finito de posibles aplicaciones entre ellos. Finalmente,podemos construir una sucesión exacta 0 → Φ → E(K)/mE(K) → E(L)/mE(L), donde tanto Φ como E(L)/mE(L) son finitos, de modo que E(K)/mE(K) ha de ser finito,ya que (E(K)/mE(K))/Φ ⊂ E(L)/mE(L). Gracias a este lema estamos en condiciones asumir que E[m] ⊂ E(K), pues de no ser ası́, siempre podemos construir una extensión finita de Galois L/K, que contenga a todas las coordenadas de los puntos de m-torsión, que ya sabemos que son finitos. Si logramos ver que el teorema es cierto para L, entonces el lema nos asegura que ha de cumplirse para el cuerpo original K. De modo que, sin pérdida de generalidad, asumiremos de ahora en adelante que E[m] ⊂ E(K). El siguiente paso en la prueba del teorema, es trasladar la condición de finitud de E(K)/mE(K) a una cierta condición sobre una extensión finita de K. 4.1. El emparejamiento de Kummer Definición. El Emparejamiento de Kummer, κ : E(K) × Gal(K/K) −→ E[m] se define de la siguiente manera. Sea P ∈ E(K) un punto, escogemos cualquier punto Q ∈ E(K) tal que [m]Q = P . Entonces, κ(P, σ) = Qσ − Q. 4.1. EL EMPAREJAMIENTO DE KUMMER 43 El siguiente resultado describe las propiedades básicas de este emparejamiento: Proposición 4.3. (a) El emparejamiento de Kummer está bien definido. (b) Es bilineal. (c) El núcleo izquierdo del emparejamiento es mE(K). (d) El núcleo derecho del emparejamiento es Gal(K/L). Donde L = K([m]−1 E(K)), es la menor extensión de cuerpos L/K que contiene las coordenadas de todos los puntos Q ∈ E(K) tales que [m]Q ∈ E(K). Demostración. (a) Hemos de probar que, efectivamente, κ(P, σ) ∈ E[m], y que su valor no depende de la elección de Q. En primer lugar, dado que el grupo de Galois actúa sobre los puntos de la curva elı́ptica, con P σ = (x, y)σ = (xσ , y σ ), fijando los puntos K−racionales de la misma, entonces se tiene que [m]κ(P, σ) = [m]Qσ − [m]Q = P σ − P = O. En segundo lugar, se tiene que si Q, Q0 ∈ E(K) son puntos distintos con [m]Q = [m]Q0 = P , entonces Q0 = Q + T donde T ∈ E[m], ya que [m]Q0 − [m]Q = O. Y ası́, (Q + T )σ − (Q + T ) = Qσ − Q + T σ − T = Qσ − Q, ya que hemos supuesto que E[m] ⊂ E(K), y todo σ ∈ Gal(K/K) fija K. (b) La linealidad en P se sigue de la acción del grupo de Galois sobre los puntos de la curva. Para la linealidad en Gal(K/K), veamos que dados σ, τ ∈ Gal(K/K), κ(P, στ ) = Qστ − Q = (Qσ − Q)τ + (Qτ − Q) = κ(P, σ)τ + κ(P, τ ). Pero como κ(P, σ) ∈ E[m] ⊂ E(K), entonces κ(P, σ)τ = κ(P, σ). Ası́, κ(P, στ ) = κ(P, σ) + κ(P, τ ). (c) En primer lugar supongamos que P ∈ mE(K), es decir existe Q ∈ E(K) tal que [m]Q = P , entonces κ(P, σ) = Qσ − Q = O para todo σ ∈ Gal(K/K), ya que Q queda fijado por Gal(K/K). Por otro lado, si κ(P, σ) = O para todo σ ∈ Gal(K/K), entonces Qσ = Q para todo σ ∈ Gal(K/K) de donde se sigue que Q ∈ E(K). (d) Si σ ∈ Gal(K/L), entonces κ(P, σ) = Qσ − Q = O para todo P ∈ E(K) 44 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA dado que por definición Q ∈ L. Recı́procamente, supongamos que σ ∈ Gal(K/K) satisface κ(P, σ) = O para todo P ∈ E(K), entonces, para todo punto Q ∈ E(K) tal que [m]Q ∈ E(K) se tiene, O = κ([m]Q, σ) = Qσ − Q. De modo que σ fija Q, y por tanto fija el cuerpo de definición de Q, digamos K(x(Q), y(Q)). Basta entonces darse cuenta de que L es, por construcción, la unión de todos estos cuerpos de definición ,de modo que σ fija L. Se sigue que σ ∈ Gal(K/L). Corolario 4.4. El emparejamiento de Kummer induce una forma bilineal perfecta: E(K)/mE(K) × Gal(L/K) −→ E[m] Demostración. Se sigue de la proposición anterior que mE(k) y Gal(K/L) son los respectivos núcleos de emparejamiento de Kummer. Basta recalcar que efectivamente la extensión L/K es de Galois, pues los elementos de Gal(K/K) llevan [m]−1 E(K) en sı́ mismo. Además, se sigue del apartado (d), que Gal(K/L) es el núcleo de, Gal(K/K) −→ Hom(E(K), E[m]) σ 7−→ κ(·, σ) y por tanto es un subgrupo normal de Gal(K/K), donde Gal(K/L) ∼ = Gal(K/K)/Gal(K/L). La bilinealidad se conserva al hacer el paso al cociente de manera natural. Lo más interesante de éste resultado es que establece una equivalencia entre la finitud de E(K)/mE(K) y la finitud de Gal(L/K). Pues si E(K)/mE(K) es finito, entonces tenemos que cada σ ∈ Gal(L/K) induce un homomorfismo, κ(·, σ) : E(K)/mE(K) −→ E[m]. Pero como E[m] y E(K)/mE(K) son finitos, también ha de serlo el grupo de homomorfismos Hom(E(K)/mE(K) , E[m]). Y como κ induce una forma bilinear perfecta, los homomorfismos dados por κ(·, σ), κ(·, τ ) coinciden sı́ y sólo si σ = τ . De donde se deduce la finitud de Gal(L/K). Con un argumento análogo a éste se deduce la equivalencia entre la finitud de Gal(L/K) y la de E(K)/mE(K). De modo que de ahora en adelante trataremos de probar que la extensión de cuerpos L = K([m]−1 E(K)) es de ı́ndice finito sobre K. 4.2. Demostración del Teorema Ahora estamos en posición de analizar la extensión de cuerpos L/K. Pero antes de comenzar interpretaremos la inyectividad de la torsión, e 0 0 ), E(K 0 )[m] ,→ E(k v 4.2. DEMOSTRACIÓN DEL TEOREMA 45 en términos de la acción del grupo de Galois. Las extensiones no ramificadas de K corresponden con extensiones del cuerpo residual k, de modo que el grupo absoluto de Galois de K se descompone como 1 −→ Gal(K/K ur ) −→ Gal(K/K) −→ Gal(K ur /K) −→ 1 || || Iv Gal(k/k) donde K ur a la máxima extensión no ramificada de K, e Iv es el subgrupo de inercia de Gal(K/K). En otras palabras Iv es el conjunto de elementos de Gal(K/K) que actúa trivialmente sobre k. Definición. Sea Σ un conjunto en el cual Gal(K/K) actúa. Diremos que Σ es no ramificado en v si la acción de Iv es trivial sobre Σ. Proposición 4.5. Sea L = K([m]−1 E(K)), el cuerpo definido anteriormente. Entonces se cumple, (a) La extensión L/K es abeliana y tiene exponente m, i.e., el grupo de Galois Gal(L/K) es abeliano, y todo elemento en Gal(L/K) tiene orden que divide a m. 0 e v ) singular } ∪ {v ∈ M 0 : v(m) 6= 0} ∪ M ∞ . La extensión (b) Sea S = {v ∈ MK : E(k K K L/K es no ramificada fuera de S, i.e., si v ∈ MK y v ∈ / S, entonces L/K es no ramificada en v. Demostración. (a) Tal y como vimos en la Proposición 4.3 , el emparejamiento de Kummer induce un homomorfismo de grupos inyectivo, φκ : Gal(L/K) ,→ Hom(E(K), E[m]) σ 7→ κ(·, σ) De donde se sigue que L/K es abeliana, pues el grupo de homomorfismos (isogenias) lo es. Además, dado σ ∈ Gal(L/K), se tiene que φκ (σ m ) = κ( · , σ m ) = [m]κ( · , σ) = O, de modo que σ m pertenece al núcleo derecho de la forma bilineal perfecta inducida por κ, y por tanto σ m = id ∈ Gal(L/K) =⇒ ord(σ)|m. (b) Sea v ∈ MK , con v ∈ / S. Para Q ∈ E(K) con [m]Q ∈ E(K), basta probar que K 0 = K(Q)/K es no ramificada en v, ya que L no es más que la composición de todos los K(Q), y la composición de extensiones no ramificadas es no ramificada. Sea v 0 ∈ MK 0 , un lugar de K 0 sobre v, i.e. el valor absoluto que define v 0 restringido a K coincide con v. Y sea kv0 0 /kv la correspondiente extensión de cuerpos residuales, recordemos que kv = Rv /Mv , donde Rv = {x ∈ K : |x|v ≤ 1} y Mv = {x ∈ K : |x|v < 1}. 46 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA Si v ∈ / S, E tiene una buena reducción en v, y por tanto también tiene una buena reducción en v 0 ya que podemos tomar la misma ecuación de Weierstrass, y |∆|v = |∆|v0 = 0 por hipótesis, pues v 0 está sobre v. De modo que tenemos la aplicación de reducción habitual, e 0 0 ), E(K 0 ) −→ E(k v que denotaremos como hasta ahora con una tilde. Sea Iv0 /v = {σ ∈ Gal(K/K) : |xσ − x|v < 1 para todo x ∈ Rv } ⊂ Gal(K/K), el Grupo de Inercia de v 0 /v, que por definición actúa trivialmente sobre el cuerpo residual kv0 0 , y por e v0 ). Dado σ ∈ Iv0 /v , tanto también sobre E(k σ −Q=Q eσ − Q e = O. e Q^ Por otra parte, como [m]Q ∈ E(K), entonces [m](Qσ − Q) = ([m]Q)σ − [m]Q = O. De modo que Qσ − Q es un punto de m-torsión en el núcleo de la aplicación de reducción. Se sigue de la Proposición 3.4 que, e 0 0 ), E(K 0 )[m] ,→ E(k v y por tanto Qσ − Q = O. De modo que todo elemento del grupo de inercia Iv0 /v fija Q, y por tanto se tiene que K 0 = K(Q) no ramifica sobre K en v 0 . Dado que ésto se cumple para todo v 0 situado sobre v, y para todo v ∈ / S, esto completa la prueba de que K 0 /K es no ramificado fuera de S. Lo único que falta para completar la prueba del Teorema de Mordell-Weil, es demostrar que de las propiedades anteriores se puede deducir la finitud de L/K. La prueba de este hecho reside en el Teorema de Hermite, corolario del Teorema de Minkowsky, que establece la finitud del grupo de clases. Teorema 4.6 (Hermite). Sea S un conjunto finito de lugares en K. Entonces existe un número finito de extensiones K 0 /K no ramificadas fuera de S con grado acotado, |K 0 : K| < N para algún N. Demostración. [Teorema débil de Mordell-Weil] Sea L = K([m]−1 E(K)), y 0 e v ) singular } ∪ {v ∈ M 0 : v(m) 6= 0} ∪ M ∞ , S = {v ∈ MK : E(k K K el conjunto de lugares definido en la Proposición 4.5. De ésta proposición se sigue que para todo Q ∈ E(K) con [m]Q ∈ E(K), la extensión K 0 = K(Q) es finita y no ramificada fuera del conjunto S. Además, dado que los conjugados de Galois de Q han de ser de la forma Q + T para algún T ∈ E[m] ⊂ E(K), se tiene que |K(Q) : K| ≤ m2 . 4.2. DEMOSTRACIÓN DEL TEOREMA 47 De modo que el Teorema de Hermite nos dice que cuando Q recorre [m]−1 E(K), sólo aparece un número finito de extensiones K 0 = K(Q)/K, todas de ı́ndice finito. Y dado que L es la composición de las K 0 , se tiene que L/K es finita. Por otro lado, tal y como ya hemos visto el emparejamiento de Kummer induce una forma bilineal perfecta, E(K)/mE(K) × Gal(L/K) −→ E[m], y por tanto la finitud de L/K equivale a la finitud de E(K)/mE(K). A pesar de que desde el comienzo del capı́tulo hemos asumido que K era un cuerpo de números, el Teorema 4.1 también es cierto para curvas definidas sobre ciertos cuerpos globales, como por ejemplo los p-ádicos. Ası́ se tiene que, E(Qp )/mE(Qp ) es finito para toda curva E/Qp . Se tiene de hecho, que el teorema que acabamos de probar también es cierto para cualquier cuerpo de funciones K = k(C), siendo C una curva proyectiva lisa y k un cuerpo algebraicamente cerrado. Sin embargo, la demostración para este caso ha de lidiar con el hecho de que para este tipo de cuerpos (I) El grupo de clases de ideales de K = k(C) es exactamente P ic(C), que no tiene por qué ser finito. (II) El grupo de unidades K ∗ , que coincide con k ∗ , no está finitamente generado. Sin embargo ambas dificultades pueden salvarse debido a que tan sólo se necesita finitud de orden m. Para más detalles consultar III.2 [11]. 48 CAPÍTULO 4. VERSIÓN DÉBIL DEL TEOREMA Capı́tulo 5 Descenso, Alturas y el Teorema de Mordell-Weil El objetivo de este capı́tulo es probar que los puntos K-racionales de una curva elı́ptica E, definida sobre un cuerpo de números K, es un grupo finitamente generado. Hasta ahora hemos probado la versión débil del teorema, que establece que para todo entero m ≥ 2 el grupo cociente E(K)/mE(K) es finito. Pero sin embargo esto no implica necesariamente el teorema. Si consideramos por ejemplo una curva elı́ptica E/Qp , sobre un cuerpo local, entonces E(Qp ) posee un subgrupo isomorfo a Zp . De modo que, aunque E(Qp )/mE(Qp ) sea finito, el grupo E(Qp ) no está finitamente generado. Para ello emplearemos el método del descenso. El método del descenso infinito fue introducido por Pierre de Fermat en el siglo XVII. El método se basa a su vez en el axioma de que el conjunto de los números naturales es un conjunto bien ordenado. En este caso el orden vendrá impuesto por los valores reales de las llamadas funciones de altura, que cumpliendo una serie de propiedades nos garantizarán que el grupo de generadores ha de ser finito. En la primera parte del capı́tulo se enunciará y probará el Teorema del Descenso para funciones de altura y grupos abelianos lo más generales posibles, para más adelante estudiar la teorı́a general de las alturas en el espacio proyectivo, y ası́ poder definir después las alturas sobre las curvas elı́pticas. Se probará el Teorema principal para una curva elı́ptica general E/K, empleando por una parte la finitud de E(K)/2E(K) y por otra parte las propiedades de las funciones de altura construidas a lo largo del capı́tulo. Además, tal y como veremos en el capı́tulo siguiente, la demostración del Teorema del Descenso nos da una pista de cómo encontrar generadores de E(K) a partir de los generadores de E(K)/2E(K). 5.1. Teorema del Descenso Teorema 5.1 (Teorema del Descenso). Sea A un grupo abeliano. Supongamos que existe una función de altura, h : A −→ R 49 50 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL con las siguientes propiedades: (i) Dado Q ∈ A. Existe una constante C1 = C1 (Q), dependiendo de A y Q, tal que h(P + Q) ≤ 2h(P ) + C1 para todo P ∈ A (ii) Existe un entero m ≥ 2 y una constante C2 , que depende de A, tal que h(mP ) ≥ m2 h(P ) − C2 para todo P ∈ A (iii) Para cada constante C3 , el conjunto {P ∈ A : h(P ) ≤ C3 } es finito. Si además se tiene que para el entero m de (ii) el grupo A/mA es finito, entonces A es finitamente generado. Demostración. Sea {Q1 , ..., Qn } un conjunto representantes de todas las coclases de A/mA, y P un elemento cualquiera de A. Entonces, P = mP1 + Qi1 con 1 ≤ i1 ≤ n, de modo que P ≡ Qi1 (mód ()m). Podemos entonces construir una sucesión {Pj }, con Pj = mPj+1 + Qij+1 . La condición (ii) en Pj equivale a, h(Pj ) ≤ 1 (h(mPj ) + C2 ) m2 y por construcción = 1 (h(Pj−1 − Qij ) + C2 ) m2 con la condición (i), 1 (2h(Pj−1 ) + C1 (−Qij ) + C2 ) m2 Tomando C10 = máx{C1 (−Qs ) : s = 1, ..., n}, ≤ ≤ 1 (2h(Pj−1 ) + C10 + C2 ) m2 Empleando esta desigualdad repetidamente, tiene 1 2 k h(P ) + + h(Pn ) ≤ 2 m m2 0 k C +C ≤ m22 h(P ) + m12 −22 ≤ 21k h(P ) + 12 (C10 + C2 ) comenzando en Pk y volviendo hasta P , se 2 4 2k−1 + + · · · + m2 m2 m2 pues m ≥ 2. De modo que para k suficientemente grande, 1 h(P ) ≤ 1 + (C10 + C2 ). 2 (C10 + C2 ) 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 51 Como P es una combinación lineal de Pk y Q1 , ..., Qn k P = m Pk + k X mj−1 Qij . j=1 A partir de la condición (iii), se establece que el conjunto 1 {P ∈ A : h(P ) ≤ 1 + (C1 + C2 )} 2 es finito, digamos {Qn+1 , ..., Qr }. Entonces se tiene que A está generado por Q1 , ..., Qr . En primer lugar habremos de definir las funciones de altura para los puntos racionales de una curva elı́pticay ası́ poder utilizar el resultado anterior. Sin embargo lo realmente difı́cil es encontrar los generadores de E(K)/mE(K), y de hecho no existen algoritmos generales para atacar este problema. 5.2. Alturas en el espacio proyectivo Si queremos usar el Teorema del descenso para probar el Teorema de Mordell-Weil en el caso general, hemos de definir una función de altura sobre E(K). Para ello, intentaremos en primer lugar definir funciones de altura sobre el espacio proyectivo Pn (K), y luego tratar de entender cómo se comportan éstas al restringirlas a subconjuntos del espacio, en concreto a los puntos de una curva elı́ptica. Ejemplo 5.1. Sea P ∈ Pn (Q), un punto con coordenadas racionales. Dado que Z es un dominio de ideales principales, podemos encontrar coordenadas homogéneas P = [x0 , ..., xn ] que satisfagan x0 , ..., xn ∈ Z con (x0 , ...xn ) = 1, i.e. sin divisores comunes. En este caso, la altura natural de P es H(P ) = máx{|x0 |, ..., |xn |} Con esta definición, es claro que para cada constante C, el conjunto {P ∈ Pn (Q) : H(P ) ≤ C} es finito. Y tiene, de hecho, como mucho (2C + 1)n elementos. Ésta es la clase de condición de finitud que nos interesa para definir una altura. Si tratamos de generalizar este concepto de altura para cuerpos de números arbitrarios, nos encontraremos con que en muchos casos el anillo de enteros del cuerpo, OK , no es un dominio de ideales principales sino tan sólo un dominio de Dedekind. Por tanto hemos de tomar una dirección diferente, y normalizar los valores absolutos tal y cómo hicimos al comienzo de la sección 3.3. Definición. El conjunto de valores absolutos estándar en un cuerpo de números K, denotado por Mk , es el conjunto de todos los valores absolutos en K cuya restricción a Q coincide con uno de los valores absolutos en Q, p-ádicos o real. 52 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Definición. Dado v ∈ MK . El grado local en v es nv = |Kv : Qv |. Donde Kv y Qv son las respectivas compleciones de K y Q con respecto al valor absoluto v. Recordemos a continuación dos resultados básicos de la teorı́a algebraica de números: Teorema 5.2 (Fórmula de extensión). Sea L/K/Q una torre de cuerpos de números, y sea v ∈ MK . Entonces, X nw = [L : K]nv w∈ML ,w|v (donde w|v significa que la restricción de w a K coincide con v). Teorema 5.3 (Fórmula del producto). Sea x ∈ K ∗ . Entonces Y |x|nv v = 1. v∈Mk Definición. Dado P ∈ Pn (K), la altura de P (en el cuerpo K) viene dada por, Y HK (P ) = máx{|x0 |v , ..., |xn |v }nv . v∈MK Proposición 5.4. Sea P ∈ Pn (K), siendo K un cuerpo de números arbitrario. (a) La altura HK (P ) no depende de las coordenadas homogéneas escogidas para P . (b) La altura satisface HK (P ) ≥ 1, para todo punto P ∈ Pn (K). (c) Sea L/K una extensión finita. Entonces HL (P ) = HK (P )1/[K:Q] . Demostración. (a) Cualquier otra elección de coordenadas serı́a de la forma, [λx0 , ..., λxn ] para algún λ ∈ K ∗. De modo que, por la fórmula del producto, Q Q máx{|λx0 |, ..., |λxn |}nv = |λ|nv máx{|x0 |, ..., |xn |}nv v∈Mk v∈M Q k nv Q = |λ| máx{|x0 |, ..., |xn |}nv v∈M v∈Mk Qk = máx{|x0 |, ..., |xn |}nv . v∈Mk (b) En cualquier punto P en el espacio proyectivo podemos siempre encontrar coordenadas homogéneas en las que una de las coordenadas xi = 1, y por tanto |xi |v = 1 para todo valor absoluto normalizado v ∈ Mk . De modo que todos los factores del producto que define HK (P ) son al menos 1. 5.2. ALTURAS EN EL ESPACIO PROYECTIVO (c) De la fórmula de extensión se sigue, Q HL (P ) = máx{|xi |w }nw w∈M QL Q = máx{|xi |v }nw v∈MK w∈ML , w|v Q = máx{|xi |v }[L:K]nv 53 pues xi ∈ K, por 5.4, v∈MK = HK (P )[L:K] Si estamos en el caso K = Q, entonces HQ coincide con la altura que definimos en el Ejemplo 5.1. Basta tomar coordenadas homogéneas para P ∈ Pn (Q) con x0 , ..., xn ∈ Z y mcd(x0 , ..., xn ) = 1. Entonces se tiene que para todo valor absoluto no arquimediano, para las normas p-ádicas v ∈ MQ0 , |xi |v ≤ 1 para todo i y al menos una coordenada tiene valor absoluto unitario. De modo que el producto que define HQ (P ) sólo depende del valor absoluto arquimediano, i.e. HQ (P ) = máx{|x0 |∞ , ..., |xn |∞ }. En particular, el conjunto {P ∈ Pn (Q) : HQ (P ) ≤ C} es finito para toda constante C. Uno de nuestros objetivos es extender esta propiedad a HK para un cuerpo de números arbitrario. En ocasiones resulta más ventajoso trabajar con una función de altura que no dependa del cuerpo de definición. Definición. Para P ∈ Pn (Q), definiremos la altura (absoluta) de P , digamos H(P ), como sigue: sea K un cuerpo de números tal que P ∈ Pn (K). Entonces, H(P ) = HK (P )1/[K:Q] donde hemos de tomar la raı́z real positiva. De 5.4(c) se sigue que H(P ) está bien definida, y es independiente de la elección de K, y 5.4(b) implica que H(P ) ≥ 1 para todo P ∈ Pn (Q). A continuación, estudiaremos cómo varı́a la altura bajo aplicaciones racionales entre espacios proyectivos. Los resultados en esta dirección serán esenciales para poder probar las propiedades sobre altura que necesitamos para demostrar el Teorema. Definición. Un morfismo de grado d entre espacios proyectivos es una aplicación F : Pn −→ Pm P 7−→ [f0 (P ), ..., fn (P )] donde f0 , ..., fn ∈ Q[x0 , ..., xn ] son polinomios homogéneos de grado d, sin ningún cero en común en Q salvo x0 = · · · = xn = 0. Si F puede expresarse mediante polinomios fi con coeficientes en K/Q, entonces F está definido sobre K. 54 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Teorema 5.5. Sea F : Pn −→ Pm un morfismo de grado d. Entonces existen constantes positivas C1 y C2 , que dependen de F , tales que C1 H(P )d ≤ H(F (P )) ≤ C2 H(P )d para todo P ∈ Pn (Q). Antes de comenzar con la demostración, introduciremos algo de notación para hacer más sencilla la prueba. Digamos que F = [f0 , ..., fm ], donde los fi son polinomios homogéneos sin ceros comunes, y sea P = [x0 , ..., xn ] ∈ Pn (Q) un punto con corrdenadas algebraicas. Sea K un cuerpo de números que contenga x0 , ..., xn y a todos los coeficientes anj de los fj . Para cada valor absoluto v ∈ MK , definimos |P |v = máx |xi |v 0≤i≤n |F (P )|v = máx |fj (P )|v , 1≤j≤m y además diremos que |F |v = máx{|a|v : a es un coeficiente de algún fj }. Entonces, de la definición de altura se tiene Y Y HK (F (P )) = HK (P ) = |P |nv v |F (P )|nv v , v∈MK v∈MK y tiene sentido definir HK (F ) = Y |F |nv v . v∈MK En otras palabras, HK (F ) = H([a0 , ..., ai ]) donde a0 , .a1 , ... son los coeficientes de las funciones fj . Definiremos la función ∞ 1 si v ∈ MK (v) = 0 0 si v ∈ MK De modo que de la desigualdad triangular para el valor absoluto | · |v se deduce |t1 + t2 + · · · + tn |v ≤ n(v) máx{|t1 |v , ..., |tn |v }, para todo v ∈ MK , arquimediano o no arquimediano. Nótese que esta desigualdad coincide con la desigualdad triangular cuando v es no arquimediano, pero sin embargo para valores absolutos arquimedianos ésta es una desigualdad más débil |t1 + t2 + · · · + tn |v ≤ |t1 |v + · · · + |tn |v ≤ n(v) máx{|t1 |v , ..., |tn |v }, de modo que la llamaremos desigualdad triangular débil. Habiendo introducido la notación, podemos regresar a la prueba del Teorema 5.5 Demostración. La cota superior es relativamente sencilla de probar. Sea v ∈ MK , la desigualdad triangular débil establece (v) |fi (P )|v ≤ C1 |F |v |P |dv , 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 55 pues fi es homogénea de grado d. La constante C1 puede coincidir con el número de términos de fi , digamos fi (P ) = a1 n Y d xj j1 + · · · + aC1 j=0 n Y d xj jC−1 . j=0 n+d Nótese que el número de términos es a lo sumo n , pues éste es el número de posibles monomios de grado d con n + 1 variables. Dado que esta estimación se cumple para cada i, entonces (v) |F (P )|v = máx |fi (P )|v ≤ C1 |F |v |P |dv . 1≤i≤m Elevando a la potencia nv y tomando el producto en Mk se tiene Y (v)n Y Y Y v C1 v |F |nv v |P |dn |F (P )|nv v ≤ v . v∈MK v∈MK v∈MK v∈MK Como (v) = 0 para todo valor absoluto finito, se tiene que Y (v)n Y [K:Q] C1 v = Cinv = C1 , ∞ v∈MK v∈MK de modo que tomando la raı́z [K : Q]-ésima se tiene H(F (P )) ≤ C1 H(F )H(P )d . Vale la pena mencionar que en la prueba de la cota superior no hemos empleado la condición sobre la no existencia de ceros comunes de las funciones fi . Sin embargo, tendremos sin duda que emplear esta condición para probar la cota inferior, dado que sin ella existen contraejemplos. Asumiremos entonces que el conjunto {Q ∈ An+1 (Q) : f0 (Q) = · · · = fm (Q) = 0} = {(0, ..., 0)}, cuenta con un único punto. Entonces el Teorema 2.1 (Nullstellenstatz), establece que el ideal I = (f0 , ..., fm ) ∈ Q[x0 , ..., xn ] contiene a alguna potencia xdi i para i = 0, ..., n, ya que xi ∈ rad(I) = I(V (f0 , ..., fn )) pues xi se anula en V (f0 , ..., fn ) = {(0, ..., 0)}. De modo que existen polinomios gij ∈ Q[x0 , ..., xn ] y un entero e ≥ 1 tales que xei = n X gij fj para cada 0 ≤ i ≤ n. j=0 Podemos asumir que gij ∈ K[x0 , ..., xn ] son todos de grado e − d, ya que xei es homogéneo de grado e y todos los fj son homogéneos de grado d. 56 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Adoptaremos la siguiente notación, |G|v = máx{|b|v : b es un coeficiente de algún gij }, Y HK (G) = |G|nv v . v∈MK Nótese que tanto HK (G) como e pueden acotarse en términos de n, m, d y de HK (F ), ya que los coeficientes de los gij están claramente determinados por los de los fj . A su vez e puede acotarse con argumentoscombinatorios barajando las combinaciones posibles monomios de cada fj . Encontrar una buena cota Q[x0 , ..., xn ]-lineales de los n+d n en general no es una tarea fácil, pero para nosotros es suficiente saber que tanto e como HK (G) no dependen del punto P . Recordemos que P = [x0 , ..., xn ]. De la fórmula para xei se sigue P m (v) |xi |ev = gij (P )fj (P ) ≤ C2 máx |gij (P )fj (P )|v j=0 0≤j≤m v (v) ≤ C2 máx |gij (P )|v |F (P )|v , 0≤j≤m donde C2 no depende de P , sino del número de monomios en gij fj . Tomando el máximo sobre los i, obtenemos (v) |P |ev ≤ C2 máx |gij (P )|v |F (P )|v . i,j Cada gij es homogéneo de grado e − d, de modo que la desigualdad triangular débil implica que (v) |gij (P )|v ≤ C3 |G|v |P |e−d v . Donde C3 puede depender de e, que como ya vimos antes puede acotarse en términos de m, n y d. Sustituyendo esta estimación en la fórmula anterior, y multiplicando por |P |d−e v se tiene |P |dv ≤ (C2 C3 )(v) |G|v |F (P )|v . Tomando de nuevo el producto sobre las valoraciones y la raı́z [K : Q]-ésima, se tiene H(P ) ≤ CH(F (P )) que es el resultado deseado, ya que C = C2 C3 H(G) que no dependen más que de n, m, d y H(F ), pero no del punto P . Corolario 5.6. Sea A = (αij ) ∈ GLn+1 (Q), entonces la multiplicación por la matriz A induce un automorfismo A : Pn −→ Pn . Existen constantes C1 y C2 , que dependen de las entradas A, tales que C1 H(P ) ≤ H(F (P )) ≤ C2 H(P ) para todo P ∈ Pn (Q). 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 57 Demostración. Éste es 5.5 para morfismos de grado 1. Trataremos de analizar a continuación la relación que existe entre los coeficientes de un polinomio y la altura de sus raı́ces. Teorema 5.7. Sea f (t) = a0 td + a1 td−1 + · · · + ad = a0 (t − α1 ) · · · (t − αd ) ∈ Q[t] un polinomio de grado d. Entonces, H([a0 , ..., ad ]) ≤ 2d−1 d Y H(αj ) j=1 Demostración. Nótese en primer lugar que la desigualdad no se ve alterada si multiplicamos a f por una constante no nula. De modo que sin pérdida de generalidad podremos asumir que a0 = 1, es decir, que f es un polinomio mónico. Sea K = Q(α0 , ..., αd ), y para v ∈ MK , definimos η(v) = 2 1 ∞ si v ∈ MK 0 si v ∈ MK . Con esta nueva notación, podemos definir la siguiente desigualdad |x + y|v ≤ η(v) máx{|x|v , |y|v } para v ∈ Mk y x, y ∈ K, 0 que coincide con la desigualdad triangular débil para dos sumandos. Nótese que sii v ∈ MK y |x|v 6= |y|v , entonces la desigualdad se convierte en una identidad. Vamos a probar que, máx {|aj |v } ≤ η(v)d−1 1≤j≤d d Y máx{|αj |v , 1} j=1 Lo probaremos por inducción sobre d, el grado del polinomio mónico f . Para d = 1, tenemos que f (t) = t − α1 , y la desigualdad es directa máx{|α1 |v , 1} = 20 máx{|α1 |v , 1}. Supongamos ahora que el resultado es cierto para polinomios de grado d − 1, con raı́ces en K. Escojamos un ı́ndice k tal que |αk |v ≥ |αj |v para 1 ≤ j ≤ d, y definamos el polinomio g(t) = (t − α1 ) · · · (t − αk−1 )(t − αk+1 ) · · · (t − αd ) = b0 td−1 + b1 td−1 + · · · + bd−1 58 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL De modo que f (t) = g(t)(t − αk ), y comparando los coeficientes tenemos que ai = bi − αk bi−1 . Tenemos entonces que, máx {|ai |v } = 0≤i≤d máx {|bi − αk bi−1 |v } 0≤i≤d ≤ η(v) máx {|bi |v , |αk bi−1 |v } 0≤i≤d ≤ η(v) máx {|bi |v } máx{|αk |v , 1} ≤ 0≤i≤d d Q η(v)d−1 máx{|αj |v , 1} hipótesis sobre g j=1 Elevando cada término a la correspondiente potencia nv , y multiplicando a lo largo de MK ,  nv d Y Y Y η(v)d−1 HK ([a0 , ..., ad ]) = máx {|aj |v }nv ≤ máx{|αj |v , 1} v∈Mk 1≤j≤d j=1 v∈Mk Con η(v) ≤ 2 y la fórmula de extensión, (d−1)[K:Q] HK ([a0 , ..., ad ]) ≤ 2 d Y HK (αj ) j=1 de donde H([a0 , ..., ad ]) ≤ 2 d−1 d Y H(αj ). j=1 Ahora que conocemos ciertas propiedades aritméticas de la función de altura, resulta interesante tratar de entender cómo actúa el grupo de Galois sobre ésta función que hemos definido. Cabrı́a esperar que todos los conjugados de un punto compartiesen altura, pero esto no es en ningún caso un resultado evidente. Teorema 5.8. Sea P ∈ Pn (Q) y σ ∈ Gal(Q/Q). Entonces H(P σ ) = H(P ). Demostración. Sea K/Q un cuerpo tal que P ∈ Pn (K). El cuerpo K no tiene porqué ser de Galois sobre Q, pero σ define en cualquier caso un isomorfismo entre σ : K −→ K σ = {ασ : α ∈ K}, y del mismo modo innduce un isomorfismo entre valores absolutos de K y de K σ , σ : MK v −→ MK σ . 7−→ v σ Ası́, si x ∈ K y v ∈ MK , entonces el valor absoluto asociado v σ queda totalmente determinado por la relación |xσ |vσ = |x|v . Y σ también induce un isomorfismo entre Kv y Kvσσ , de modo que los grados locales satisfacen nv = nvσ . Ahora calculamos, Q HK σ (P σ ) = máx{|xσi |w }nw σ w∈M QK = máx{|xi |v }nvσ v∈M K Q = máx{|xi |v }nv = HK (P ) v∈MK 5.2. ALTURAS EN EL ESPACIO PROYECTIVO 59 Dado que [K : Q] = [K σ : Q], empleando la definición de altura absoluta se tiene, H(P σ ) = H(P ). A continuación vamos a demostrar la propiedad principal de ésta función de altura que acabamos de definir, y para cuya demostración nos hemos estado preparando. Teorema 5.9. Sean C y d constantes positivas. Entonces el conjunto, {P ∈ Pn (Q) : HK (P ) ≤ C y [Q(P ) : Q] ≤ d} es finito. Donde Q(P ) es el mı́nimo cuerpo de definición de P , la mı́nima extensión de Q que contiene las coordenadas homogéneas normalizadas de P . En particular, para todo K cuerpo de números, {P ∈ Pn (K) : HK (P ) ≤ C} es un conjunto finito. Demostración. Sea P ∈ Pn (Q). Escogemos coordenadas homogéneas para P , digamos P = [x0 , ..., xn ], con algún xj = 1. Entonces Q(P ) = Q(x0 , ..., xn ), y tenemos una estimación sencilla de la altura Q máx {|xi |v }nv HQ(P ) (P ) = v∈MQ(P ) 0≤i≤n ! Q n v máx{|xi |v , 1} ≥ máx 0≤i≤n = v∈MQ(P ) máx HQ(P ) (xi ) 0≤i≤n De modo que si H(P ) ≤ C y [Q(P ) : Q] ≤ d, entonces máx H(xi ) ≤ C y máx[Q(xi ) : Q] ≤ d. Basta probar que el conjunto, {x ∈ Q : H(x) ≤ C y [Q(x) : Q] ≤ d} es finito. En otras palabras, hemos reducido el problema al caso de dimensión n = 1, digamos en P1 . Supongamos que x pertenece al conjunto, y por tanto si e = [Q(x) : Q] entonces e ≤ d. Sean {x = x1 , ..., xe } los conjugados de x. El polinomio mı́nimo de x sobre Q es, fx (t) = (t − x1 )(t − x2 ) · · · (t − xe ) = te + a1 te−1 + · · · + ae−1 t + ae ∈ Q[t]. Esamos ahora en posición de estimar, H([1, a1 , ..., ae ]) ≤ 2e−1 e Q H(xj ) (Teorema 5.7), j=1 = 2e−1 H(x)e (Teorema 5.9), ≤ (2C)d pues H(x) ≤ C y e ≤ d. 60 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Dado que a1 , ..., ae ∈ Q, entonces tal y como vimos en el ejemplo 5.1, existe un número finito de puntos P ∈ Pe (Q) con altura acotada (por (2C)d ), y por tanto un número finito de posibles polinomios fx (t). Como cada polinomio fx (t) tiene a lo sumo d raı́ces en K, entonces añade como mucho d elementos al conjunto. De ahı́ se sigue que el conjunto {P ∈ Pn (Q) : H(P ) ≤ C y [Q(P ) : Q] ≤ d} es finito para todo C y d constantes, de modo que si K es una extensión de cuerpos de Q, de ı́ndice finito e, se tiene que HK (P ) = H(P )e por definición, y por tanto el conjunto {P ∈ Pn (K) : HK (P ) ≤ C} ⊂ {P ∈ Pn (Q) : H(P ) ≤ C 1/e y [Q(P ) : Q] ≤ e} es finito, por ser subconjunto de un conjunto finito. 5.3. Alturas en curvas elı́pticas En esta sección utilizaremos toda la teorı́a de alturas desarrollada anteriormente para definir funciones de altura sobre curvas elı́pticas. Trataremos de entender cómo se combinan las funciones de altura con la ley de grupo de las curvas, y como corolario directo de los resultados en esta dirección obtendremos las propiedades necearias para cumplir las hipótesis del teorema del descenso, y ası́ poder probar el teorema de Mordell-Weil en el caso general. Sea E/K una curva elı́ptica. Recordemos que toda función f ∈ K(E) no constante, define un morfismo f : E → P1 , con [1, 0] si P es un polo de f, f (P ) = [f (P ), 1] en otro caso Parece razonable usar f para definir una función de altura sobre E(K) como Hf (P ) = H(f (P )). De todos modos, tal y como pudimos ver en el teorema 5.6, la función de altura H actúa multiplicativamente. Y dado que nos interesará en general entender sus propiedades aditivas, vamos a definir a partir de H una nueva función de altura. Definición. La altura (logarı́tmica absoluta) en el espacio proyectivo es la función h : Pn (Q) −→ R P 7−→ log H(P ) Nótese que la proposición 5.4(b) nos garantiza que h(P ) ≥ 0 para todo P . Definición. Sea E/K una curva elı́ptica, y f ∈ K(E) una función racional. La altura sobre E (relativa a f ) es la función hf : E(K) −→ R P 7−→ h(f (P )) En primer lugar, pondremos en términos de las nuevas funciones de altura la propiedad de finitud demostrada en la sección anterior. 5.3. ALTURAS EN CURVAS ELÍPTICAS 61 Proposición 5.10. Sea E/K una curva elı́ptica, y sea f ∈ K(E) una función no constante. Entonces para toda constrante C, el conjunto {P ∈ E(K) : hf (P ) ≤ C} es finito. Demostración. La función f ∈ K(E) está definida sobre K, y por tanto lleva puntos P ∈ E(K) a puntos f (P ) ∈ P1 (K). Por tanto f define una correspondencia entre los conjuntos: f {P ∈ E(K) : hf (P ) ≤ C} ←→ {Q ∈ P1 (K) : H(Q) ≤ eC } P ←→ f (P ) = Q Y aunque la relación del cardinal entre los conjuntos dependerá del grado de f , la correspondencia nos dá la equivalencia entre la finitud de los conjuntos y sabemos por 5.9 que uno de ellos es finito. El siguiente teorema nos da la relación esencial entre la ley de grupo en curvas elı́pticas y la altura de sus puntos. Lo cual nos servirá para probar que la función hf cumple las condiciones necesarias para poder probar el teorema de Mordell-Weil. Teorema 5.11. Sea E/K una curva elı́ptica, y f ∈ K(E) una función par. Entonces para todo P, Q ∈ E(K), se tiene hf (P + Q) + hf (P − Q) = 2hf (P ) + 2hf (Q) + O(1) Las constantes que aparecen en el término O(1) dependen de la curva E y de f , pero no de los puntos P, Q. Demostración. Tomando una ecuación de Weiestrass para E/K, E : y 2 = x3 + Ax + B. Comenzaremos probando el teorema para la función particular f = x. El caso general se sigue como un corolario sencillo de éste. Como hx (O) = 0 y hx (P ) = hx (−P ), el resultado es directo cuando P = O ó Q = O, pues de hecho se tiene hx (P + Q) + hx (P − Q) = 2hx (P ) + 2hx (Q). Ası́ que asumiremos que P, Q 6= O. Definimos la aplicación racional, x: E −→ P1 [x0 , y0 , 1] 7−→ [x0 , 1] O 7−→ [1, 0] y denotaremos por, x(P ) = [x1 , 1], x(Q) = [x2 , 1], x(P + Q) = [x3 , 1], x(P − Q) = [x4 , 1]. 62 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Donde x3 , x4 pueden valer ∞ si P = ±Q, ya que P = −Q =⇒ P + Q = O =⇒ [x3 , 1] = [1, 0], P =Q =⇒ P − Q = O =⇒ [x4 , 1] = [1, 0]. Si nos encontramos en el caso P 6= ±Q, las fórmulas descritas en 3.1 establecen que si P = [x1 , y1 , 1] y Q = [x2 , y2 , 1], entonces y2 − y1 2 x3 = x(P + Q) = − (x1 + x2 ) x2 − x1 y22 − 2Y1 y2 + y12 − x32 + x2 x1 (x1 + x2 ) = como E : y 2 = x3 + Ax + B (x2 − x1 )2 x32 + Ax2 + B − 2y1 y2 + x31 + Ax1 + B − x32 + x2 x1 (x1 + x2 ) = (x2 − x1 )2 (A + x1 x2 )(x1 + x2 ) + 2B − 2y1 y2 = . (x2 + x1 )2 − 4x1 x2 Del mismo modo, dado que −Q = [x2 , −y2 , 1], se tiene que −y2 − y1 2 − (x1 + x2 ) x4 = x(P − Q) = x2 − x1 y22 + 2y1 y2 + y12 − x32 + x2 x1 (x1 + x2 ) = (x2 − x1 )2 (A + x1 x2 )(x1 + x2 ) + 2B + 2y1 y2 = . (x2 + x1 )2 − 4x1 x2 Ası́ que se tienen las siguientes relaciones x3 + x4 = 2(x1 + x2 )(A + x1 x2 ) + 4B (x1 + x2 )2 − 4x1 x2 , x 3 x4 = (x1 x2 − A)2 − 4B(x1 + x2 ) . (x1 + x2 )2 − 4x1 x2 Definimos la aplicación g : P2 −→ P2 como g([t, u, v]) = [u2 − 4tv, 2u(At + v) + 4Bt2 , (v − At)2 − 4Btu]. Podemos construir el siguiente diagrama, E×E σ /E×E P1 × P1 ww ww w ww w {w P2 G P1 × PG1 g σ GG GG GG GG # / P2 donde G(P, Q) = (P + Q, P − Q), y la aplicación σ es composición de dos aplicaciones E × E −→ (P, Q) 7−→ P1 × P1 −→ P2 (x(P ), x(Q)) ([α1 , β1 ], [α2 , β2 ]) 7−→ [β1 β2 , α1 β2 + α2 β1 , α1 α2 ]. 5.3. ALTURAS EN CURVAS ELÍPTICAS 63 De modo que σ(P, Q) = [1, x1 + x2 , x1 x2 ]. Las fórmulas para x3 y x4 , muestran que el diagrama (P, Q) G / (P + Q, P − Q) _ ([x1 , 1], [x2 , 1]) ([x3 , 1], [x4 , 1]) g / [1, x3 + x4 , x3 x4 ] _ _ [1, x1 + x2 , x1 x2 ] _ es conmutativo, ya que g([1, x1 + x2 , x1 x2 ]) = [(x1 + x2 )2 − 4x1 x2 , 2(x1 + x2 )(A + x1 x2 ) + 4B, (x1 x2 − A)2 − 4B(x1 + x2 )] = [1, x3 + x4 , x3 x4 ] ∈ P2 . El siguiente paso es demostrar que g es un morfismo. Para ello hemos de demostrar que los tres polinomios homogéneos que definen a g,   f1 ([t, u, v]) = u2 − 4tv f2 ([t, u, v]) = 2u(At − v) + 4Bt2  f3 ([t, u, v]) = (v − At)2 − 4Btu no tienen ceros comunes, salvo t = u = v = 0. Si t = 0, entonces u2 − 4tv = 0 (v − A)2 − 4Btu = 0 =⇒ u = v = 0. De modo que hemos de asumir que t 6= 0. Ası́ podemos definir una nueva cantidad x = u/2t. Nótese que si identificamos t = 1, u = x1 + x2 , v = x1 x2 , entonces la ecuación u2 − 4tv = 0 se convierte en (x1 − x2 )2 = 0, y x1 = x2 = u/2t, y estamos ocupándonos del caso P = ±Q. Con esta nueva cantidad x que hemos definido, la ecuación u2 − 4tv = 0 puede escribirse como x2 = v/t. Ası́, dividiendo por t2 las identidades f2 ([t, u, v]) = 0 y f3 ([t, u, v]) = 0 se tiene, en términos de x, el siguiente sistema 2u(At + v) + 4Bt2 = 0 ψ(x) = 4x(A + x2 ) + 4B = 4(x3 + Ax + B) = 0 =⇒ (v − At)2 − 4Btu = 0 φ(x) = (x2 − A)2 − 8Bx = x4 − 2Ax2 − 2Bx + A2 = 0 Nótese que, x([2]P ) = x4 − 2Ax2 − 8Bx + A2 φ(x(P )) = 4(x3 + Ax + B) ψ(x(P )) 64 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL no es más que la fórmula de la duplicación. Para probar que φ y ψ no tienen ninguna raı́z en común, basta con verificar la siguiente identidad formal (12x2 + 16A)φ(x) − (3x3 − 5Ax − 27B)ψ(x) = 4(4A3 + 27B 2 ) = 4∆ 6= 0. Es aquı́ donde la no singularidad de la ecuación de Weierstrass cumple un papel crucial, ya que ésto termina la demostración de que g es un morfismo. Y de nuevo en nuestro diagrama conmutativo podemos calcular, h(σ(P + Q, P − Q)) = h(σ ◦ G(P, Q)) = h(g ◦ σ(P, Q)) = 2h(σ(P, Q)) + O(1) Conmutatividad del diagrama Teorema 5.5 pues g es un morfismo de grado 2, por estar definido por polinomios homogéneos de grado dos. Para completar la prueba para f = x basta demostrar que h(σ(R1 , R2 )) = hx (R1 ) + hx (R2 ) + O(1) para todo R1 , R2 ∈ E(Q), ya que si empleamos la relación anterior tendremos h(σ(P +Q, P −Q)) = hx (P +Q)+hx (P −Q)+O(1) = 2hx (P )+2hx (Q)+O(1) = 2h(σ(P, Q))+O(1) que es el resultado que buscamos. En primer lugar, nótese que si R1 = O o R2 = O, entonces el resultado es trivial ya que h(σ(R1 , R2 )) = hx (R1 ) + hx (R2 ). De modo que, x(R1 ) = [α1 , 1] x(R2 ) = [α2 , 1], y por tanto h(σ(R1 , R2 )) = h([1, α1 + α2 , α1 α2 ]) y hx (R1 ) + hx (R2 ) = h(α1 ) + h(α2 ). Aplicando el resultado 5.7 al polinomio f (t) = (t − α1 )(t − α2 ) se obtiene 2−2 H(α1 )H(α2 ) ≤ H([1, α1 + α2 , α1 α2 ]) ≤ 2H(α1 )H(α2 ), y se sigue de las definiciones que, h(α1 ) + h(α2 ) − log 4 ≤ h([1, α1 + α2 , α1 α2 ]) ≤ h(α1 ) + h(α2 ) + log 2 que es la estimación que buscábamos. Corolario 5.12. Sea E/K una curva elı́ptica, y f ∈ K(E) una función par. (a) Dado Q ∈ E(K). Entonces hf (P + Q) ≤ 2hf (P ) + O(1) para todo P ∈ E(K) 5.3. ALTURAS EN CURVAS ELÍPTICAS 65 (b) Dado m ∈ Z, se cumple hf ([m]P ) = m2 hf (P ) + O(1) para todo P ∈ E(K) donde las constantes en O(1) dependen de E, f y de m. Demostración. (a) Dado que hf (P − Q) ≥ 0, el teorema 5.11 nos garantiza la desigualdad, hf (P + Q) ≤ hf (P + Q) + hf (P − Q) = 2hf (P ) + 2hf (Q) + O(1) (b) Como f es par, podemos asumir, sin pérdida de generalidad, que m ≥ 0. Para m = 0 y m = 1 el resultado resulta trivial. Supongamos que el resultado es cierto para m − 1 y m, con m > 1, y veamos que entonces también es cierto para m + 1. En el teorema 5.14, consideramos la identidad con [m]P y P respectivamente. De modo que hf ([m + 1]P ) = −hf ([m − 1]P ) + 2hf ([m]P ) + 2hf (P ) + O(1) = (−(m − 1)2 + 2m2 + 2)hf (P ) + O(1) (por hipótesis) = (m + 1)2 hf (P ) + O(1) Nótese que si f es impar, entonces f 2 es una función par. Y recordemos que por definición, Q H(f 2 (P )) = máx{|f 2 (P )|v , 1}nv Qv∈MQ(P ) nv 2 = v∈MQ(P ) máx{|f (P )|v , 1} Q 2 nv = = H(f (P ))2 v∈MQ(P ) máx{|f (P )|v , 1} Y por construcción de hf , se tiene hf 2 (P ) = h(f 2 (P )) = log H(f 2 (P )) = log H 2 (f (P )) = 2 log H(f (P )) = 2hf (P ). Con esta idea como base se puede ’casi’ extender el resultado anterior a toda clase de funciones, ver VIII.6.5 [10]. Ahora nos encontramos en condiciones de probar el resultado principal del trabajo. Teorema 5.13 (Mordell-Weil). Sea K un cuerpo de números, y E/K una curva elı́ptica. Entonces el grupo E(K) está finitamente generado. Demostración. Escojamos cualquier función par f ∈ K(E), por ejemplo f puede ser la coordenada x en la ecuación de Weierstrass reducida que define la curva E. El teorema de Mordell-Weil se sigue directamente de la versión débil del mismo con m = 2 junto con el teorema del descenso. Basta probar que la función de altura, hf : E(K) −→ R tiene las siguientes propiedades que garantizan que estamos bajo las hipótesis para emplear el Teorema 5.1. 66 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Hipótesis para el descenso: (i) Dado Q ∈ E(K). Existe una constante C1 , que depende de E, f y de Q, tal que hf (P + Q) ≤ 2hf (P ) + C1 para todo P ∈ E(K). (ii) Existe una constante C2 , dependiendo de E y f , tal que hf ([2]P ) ≥ 4hf (P ) − C2 para todo P ∈ E(K). (iii) Para cada constante C3 , el conjunto {P ∈ E(K) : hf (P ) ≤ C3 } es finito. La propiedad (i) no es sino 5.12(a), mientras que (ii) es el caso m = 2 en 5.12(b) y el apartado (iii) es el teorema 5.10. Esto completa la prueba del teorema de Mordell-Weil. A continuación, vamos a ilustrar con un ejemplo cómo emplear el método del descenso empleando las alturas definidas. Ejemplo 5.2. Sea E/Q la curva elı́ptica dada por la ecuación de Weierstrass, E : y 2 = x3 + 9. Tal y cómo hemos visto, si P = (α/β, y) ∈ E(Q), con α, β ∈ Z coprimos, entonces definimos la altura sobre E como hx (P ) = máx{|α|, |β|} donde | · | denota el valor absoluto usual (asociado al único lugar infinito en Q). Supongamos que hemos demostrado que E(Q)/2E(Q) está generado por el punto P = (6, 15). Entonces, se tiene que si un punto R ∈ / 2E(Q), entonces R + P, R − P ∈ 2E(Q), ya que R∈ / E(Q) =⇒ R ≡ P (mód 2E(Q)) ≡ −P (mód 2E(Q)). De la fórmula de la duplicación para E tenemos que un punto Q = (u, v) ∈ 2E(Q) si y sólo si x4 − 4x3 u − 72x − 36u = 0 tiene soluciones racionales. Pues recordemos que, 2 2 3x 9x4 Q = [2]R = (u, v) con u = − 2x = − 2x. 2y 4(x3 + 9) Partiendo de un punto 181479482 18128073165931 R= − , ∈ E(Q) 333756361 6097394959109 5.4. PUNTOS DE TORSIÓN RACIONALES 67 trataremos de descomponerlo en términos de P y de puntos de 2E(Q) de altura 1. En primer lugar, nótese que los únicos puntos de altura 1 son O, Q = (0, 3), −Q = (0, −3) pues hx (R) = 1 equivale a pedir que x = 0. Comenzamos con el punto R, que tiene alura hx (R) = 333756361. Se tiene que R ∈ / 2E(Q), aunque no lo justificaré de momento, esto implica que R + P, R − P ∈ 2E(Q). De modo que tenemos, 10406815022520 1711276861163052201 = [2]S1 , R+P = − ,− 5007404224729 11205183603973252067 497145 494391309 R−P = = [2]R1 , , 238144 116214272 2142 181437 15 183 con S1 = ,− y R1 = − , − 1369 50653 16 64 donde hx (R1 ) = 16 < hx (S1 ) = 2142. Tenemos entonces que R = [2]R1 + P , con hx (R1 ) = 16 << hx (R). En esta ocasión se tiene que R1 ∈ 2E(Q), pues x4 + 15 3 135 x − 72x + =0 4 4 tiene soluciones racionales, x = 3, y se tiene que R1 = [2]R2 , donde R2 = (3, −6) ∈ / 2E(Q). Nuevamente se tiene que R2 ± P ∈ 2E(Q), con R2 + P = (40, −253) = [2]S3 R2 − P = (0, −3) = [2]R3 donde con S3 = (−2, 1), R3 = Q = (0, 3). De modo que hemos conseguido lo que querı́amos, ya que hx (Q) = 1. Ası́ se tiene que, R = [2]R1 + P = [2]([2]R2 ) + P = [2]([4]R3 + [2]P ) = [5]P + [8]Q. Nótese que Q + Q = −Q, de modo que [3]Q = O, y entonces R = [5]P + [2]Q, donde Q ∈ E(Q)tors tiene orden 3. 5.4. Puntos de torsión racionales El Teorema de Mordell-Weil implica que el grupo de torsión racional de una curva elı́ptica, Etors (K), es finito. De modo que lo natural en este punto es preguntarse cómo es la estructura de Etors (K), o si es posible caracterizar los puntos de torsión. En realidad, en esta dirección se tienen resultados muy claros que nos hablan de la estructura de la torsión racional. En primer lugar caracterizaremos los puntos de m-torsión racionales. 68 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL Teorema 5.14. Sea E/K una curva elı́ptica con ecuación de Weierstrass y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 con a1 , ..., a6 ∈ OK , siendo OK el anillo de enteros de K. Sea P ∈ E(K) un punto de torsión de orden exacto m ≥ 2. (a) Si m no es una potencia de primo, entonces x(P ), y(P ) ∈ OK . 0 , si denotamos por (b) Si m = pn para p primo, para cada v ∈ MK ordv (p) , rv = n p − pn−1 donde [·] denota la parte entera, entonces se tiene que ordv (x(P )) ≥ −2rv y ordv (y(P )) ≥ −3rv . En particular, si ordv (p) = 0, entonces x(P ), y(P ) son v-enteros (pertenecen a OKv ). El siguiente corolario fué probado independientemente por Nagell y Lutz, quienes descubrieron condiciones de divisibilidad en cierto modo más débiles que las que se dan en el teorema anterior, pero que caracterizan completamente los puntos de torsión racional para curvas definidas sobre Q. Corolario 5.15. Sea E/Q una curva elı́ptica con ecuación de Weierstrass y 2 = x3 + Ax + B A, B ∈ Z. Supongamos que P ∈ E(Q) es un punto no trivial de torsión. (a) x(P ), y(P ) ∈ Z. (b) O bien [2]P = O o bien y(P )2 divide a 4A3 + 27B 2 . Ejemplo 5.3. Sea E la curva del Ejemplo 5.2, E : y 2 = x3 + 9 = (x − ξ1 )(x − ξ2 )(x − ξ3 ), donde ξ1 , ξ2 y ξ3 son las tres raı́ces cúbicas de 9. Como vimos en el Ejemplo 3.1, los tres puntos de torsión no triviales de E son de la forma Pi = (ξi , 0), y ninguno de ellos es racional pues ξi ∈ / Q. De modo que el corolario anterior establece que todo P 0 ∈ E(Q)tors ha de cumplir la condición y(P 0 ) | 32 , y por tanto las opciones son y(P 0 ) ∈ {±1, ±3, ±9}. Tras unos cálculos sencillos se obtienen los puntos ±Q de [3]-torsión. Se puede concluir entonces que, Etors (Q) = {O, Q, −Q} ∼ = Z/3Z. Como ya vimos, el punto P = (6, 15) generaba el grupo E(Q)/2E(Q) ∼ = Z/2Z. Dado que P 6= ±Q, entonces tiene que ser un punto de orden infinito. 5.4. PUNTOS DE TORSIÓN RACIONALES 69 Veamos que todo punto en E(Q) ha de ser una combinación lineal de Q y P . Supongamos que existe un punto P 0 ∈ E(Q), linealmente independiente con P, Q. Entonces E(Q) tendrı́a un subgrupo isomorfo a Z/3Z ⊕ Z ⊕ Z, generado por P, Q y P 0 . Sin embargo, sabemos que al tomar el cociente con 2E(Q), tendrı́amos un subgrupo del subgrupo débil de Mordell-Weil isomorfo a Z/2Z⊕Z/2Z, generado por las coclases de P y P 0 , lo cual es una contradicción, pues E(Q)/2E(Q) sólo tenı́a un generador. De modo que podemos concluir que, E(Q) ∼ = Z/3Z ⊕ Z está generado por P y Q. Uno de los métodos más rapidos en la práctica para acortar el grupo de torsión de E(K) 0 , para los que E tenga una buena reducción, y es escoger varios lugares finitos v ∈ MK utilizar la aplicación de reducción, e v ), E(Kv )[m] ,→ E(k que es inyectivo para m primo con char(kv ). Ejemplo 5.4. La ecuación de Weierstrass, E : y 2 = x3 − 43x + 166 tiene 4A3 + 27B 2 = 215 · 13. Y por tanto cualquier punto de torsión en E(Q) tiene su segunda coordenada y ∈ {0, ±1, ±2, , ±4, , ±8, , ±16, ±32, ±64, ±128} 70 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL (puesto que y 2 divide a 4A3 + 27B 2 , o bien [2]P = O con y = 0). Tras unos pequeños cálculos se obtienen los puntos, {(3 ± 8), (−5, ±16), (11, ±32)} ⊂ Etors (Q). Por otra parte, dado que E tiene una buena reducción módulo 3, sabemos que Etors(Q) se e 3 ), y es sencillo comprobar que E(F e 3 ) = 7. Este hecho, sin embargo, no inyecta en E(F prueba nada, ya que la condición de divisibilidad tan sólo es necesaria, y no suficiente, pero empleando la fórmula de la duplicación para P = (3, 8) tenemos que x(P ) = 3, x([2]P ) = −5, x([4]P ) = 11, y x([8]P ) = 3. Por tanto [8]P = ±P , de modo que P ha de ser un punto de orden 7 o 9, (y P no es un punto de orden 3 pues [2]P 6= ±P ). De las condiciones anteriores se sigue que la única posibilidad es que el orden de P sea 7, y por tanto podemos concluir que Etors (Q) es un grupo cı́clico de orden 7, Etors (Q) = O, P = (3, 8), [2]P = (−5, 16), [3]P = (11, −32), [4] P = (11, 32), [5]P = (−5, −16), [6]P = (3, −8) ∼ = Z/7Z. Este ejemplo ilustra una manera sencilla de encontrar candidatos a ser puntos enteros de torsión. Dado que sólo hay un número finito de posibilidades, se consigue una cota para |Etors (Q)|. Pero para cada candidato hay que comprobar que efectivamente es un punto de torsión y para ello hay que ver que el orden de sea finito. Hasta ahora nos hemos preocupado en caracterizar el subgrupo de torsión de una curva elı́ptica dada, pero otro tipo de pregunta que resulta interesante serı́a: dado un primo p, existe una curva elı́ptica E definida sobre Q tal que E(Q) contenga algún punto de orden p? La respuesta para la mayorı́a de primos es no. La caracterización completa de los subgrupos de torsión sobre Q viene dada por el siguiente teorema de Mazur. Teorema 5.16 (Mazur). Sea E/Q una curva elı́ptica. Entonces el subgrupo de torsión Etors (Q) de E(Q) es isomorfo a unos de los siguientes quince grupos: Z/N Z Z/2Z ⊕ Z/2N Z con 1 ≤ N ≤ 10 o bien N = 12 con 1 ≤ N ≤ 4. Además, para cada uno de esos grupos existe al menos una curva E/Q, cuyo grupo de torsión racional es isomorfo a él. A continuación se incluye una tabla con ejemplos de cada uno de los posibles grupos de torsión caracterizados en el teorema. 5.5. RANGO DE E(K) 71 Curva = x3 − 2 y 2 = x3 + 8 y 2 = x3 + 4 y 2 = x3 + 4x 2 y − y = x3 − x2 y 2 = x3 + 1 2 y = x3 − 43x + 166 y 2 + 7xy = x3 + 16x 2 y + xy + y = x3 − x2 − 14x + 29 y 2 + xy = x3 − 45x + 81 2 y + 43xy − 210y = x3 − 210x2 y 2 = x3 − 4x 2 y = x3 + 2x2 − 3x y 2 + 5xy − 6y = x3 − 3x2 2 y + 17xy − 120y = x3 − 60x2 y2 Torsión trivial Z/2Z Z/3Z Z/4Z Z/5Z Z/6Z Z/7Z Z/8Z Z/9Z Z/10Z Z/12Z Z/2Z ⊕ Z/2Z Z/2Z ⊕ Z/4Z Z/2Z ⊕ Z/6Z Z/2Z ⊕ Z/8Z Generadores O [−2, 0, 1] [0, 2, 1] [2, 4, 1] [0, 1, 1] [2, 3, 1] [3, 8, 1] [−2, 10, 1] [3, 1, 1] [0, 9, 1] [0, 210, 1] [0, 0, 1], [2, 0, 1] [0, 0, 1], [3, 6, 1] [2, −2, 1], [−3, 18, 1] [30, −90, 1], [−40, 400, 1] Kamikenny demostró la finitud del número de los posibles grupos de torsión de las curvas elı́pticas definidas sobre cuerpos de números arbitrarios de grado hasta 14, y el caso general fué establecido por Merel en 1996. Teorema 5.17 (Merel). Para todo entero d ≥ 1, existe una constante N (d) tal que para todo cuerpo de números K/Q de grado como mucho d, y toda curva elı́ptica E/K, se tiene |Etors (K)| ≤ N (d). Es claro que el teorema de Mazur nos dice que N (0) = 16, pero sin embargo, el teorema establece que no puede haber puntos de orden 11 o 13 en E(Q) para ninguna curva elı́ptica, lo cual no es ni mucho menos directo. De modo que el Teorema de Mazur es algo más que un corolario del de Merel. 5.5. Rango de E(K) El Teorema de Mordell-Weil establece que el rango de E(K) es finito para cualquier curva elı́ptica E definida sobre un cuerpo de números K. Resulta natural entonces preguntarse cómo puede llegar a ser el rango. Sin ambargo, a pesar de haber visto que el subgrupo de torsión es relativamente sencillo de calcular, hasta ahora no se conocen algoritmos efectivos para calcular el rango de una curva elı́ptica en general. Existen muy pocos resultados generales concernientes al rango de las curvas elı́pticas. El rango de una curva elı́ptica sobre Q elegida al azar tiende a ser pequeño en general, y no es sencillo crear curvas E/Q de rango moderadamente alto. Sin embargo, se conjetura que existen curvas elı́pticas E/Q de rango arbitrariamente alto. En 1967 Safarevich y Tate demostraron que el resultado análogo es cierto para cuerpos de funciones Fp (t). De modo que es razonable pensar que la conjetura puede ser cierta. 72 CAPÍTULO 5. DESCENSO, ALTURAS Y EL TEOREMA DE MORDELL-WEIL En esta dirección, se han realizado construcciones de curvas con rango alto, familias con rango hasta 19, o bien curvas individuales de rangos más altos. Ejemplo 5.5. La curva E : y 2 + xy + y = x3 − x2 + αx + β, donde α = −20067762415575526585033208209338542750930230312178956502 β = 3448161179503055646703298569039072037485594435931918036126 6008296291939448732243429 tiene rango como mı́nimo 28. Este ejemplo se le debe a Elkies, que encontró en 2006 los siguientes puntos independientes de orden infinito en E: P1 = [−2124150091254381073292137463, 259854492051899599030515511070780628911531, 1], P2 = [2334509866034701756884754537, 18872004195494469180868316552803627931531, 1], P3 = [−1671736054062369063879038663, 251709377261144287808506947241319126049131, 1], P4 = [2139130260139156666492982137, 36639509171439729202421459692941297527531, 1], P5 = [1534706764467120723885477337, 85429585346017694289021032862781072799531, 1], P6 = [−2731079487875677033341575063, 262521815484332191641284072623902143387531, 1], P7 = [2775726266844571649705458537, 12845755474014060248869487699082640369931, 1], P8 = [1494385729327188957541833817, 88486605527733405986116494514049233411451, 1], P9 = [1868438228620887358509065257, 59237403214437708712725140393059358589131, 1], P10 = [2008945108825743774866542537, 47690677880125552882151750781541424711531, 1], P11 = [2348360540918025169651632937, 17492930006200557857340332476448804363531, 1], P12 = [−1472084007090481174470008663, 246643450653503714199947441549759798469131, 1], P13 = [2924128607708061213363288937, 28350264431488878501488356474767375899531, 1], P14 = [5374993891066061893293934537, 286188908427263386451175031916479893731531, 1], P15 = [1709690768233354523334008557, 71898834974686089466159700529215980921631, 1], P16 = [2450954011353593144072595187, 4445228173532634357049262550610714736531, 1], P17 = [2969254709273559167464674937, 32766893075366270801333682543160469687531, 1], P18 = [2711914934941692601332882937, 2068436612778381698650413981506590613531, 1], P19 = [20078586077996854528778328937, 2779608541137806604656051725624624030091531, 1], P20 = [2158082450240734774317810697, 34994373401964026809969662241800901254731, 1], P21 = [2004645458247059022403224937, 48049329780704645522439866999888475467531, 1], P22 = [2975749450947996264947091337, 33398989826075322320208934410104857869131, 1], P23 = [−2102490467686285150147347863, 259576391459875789571677393171687203227531, 1], P24 = [311583179915063034902194537, 168104385229980603540109472915660153473931, 1], P25 = [2773931008341865231443771817, 12632162834649921002414116273769275813451, 1], P26 = [2156581188143768409363461387, 35125092964022908897004150516375178087331, 1], P27 = [3866330499872412508815659137, 121197755655944226293036926715025847322531, 1], P28 = [2230868289773576023778678737, 28558760030597485663387020600768640028531, 1]. Consultar http : //web.math.hr/ duje/tors/rk28.html para más ejemplos. Capı́tulo 6 Cómo calcular el grupo de Mordell-Weil Tal y como ya vimos en el capı́tulo anterior, para poder calcular los generadores del grupo de Mordell-Weil E(K) basta con conocer los generadores de E(K)/mE(K) para algún m ≥ 2. Desafortunadamente, no existe hoy en dı́a ningún algoritmo conocido que garantice el cálculo de los generadores de E(K)/mE(K) en un tiempo finito. De ahora en adelante, siguiendo con la notación de capı́tulos anteriores, K será siempre un cuerpo de números y MK un conjunto completo de valores absolutos no equivalentes en K. 6.1. Calcular E(K)/mE(K) En esta sección E/K será una curva elı́ptica definida sobre K, y m ≥ 2 un entero. Asumiremos que E[m] ⊂ E(K). Y bajo estas hipótesis, tal y como vimos en la sección 4.1, existe un emparejamiento κ : E(K) × Gal(K/K) −→ E[m] (P, σ) 7−→ Qσ − Q donde Q ∈ E(K) satisface [m]Q = P . Además el resultado 4.3(c) dice que el núcleo por la izquierda es mE(K), de modo que podemos ver κ como un homomorfismo δE : E(K)/mE(K) −→ Hom(Gal(K/K), E[m]), donde δE (P ) es el homomorfismo, δE (P ) : Gal(K/K) −→ E[m] σ 7−→ κ(P, σ) Recordemos que si E[m] ⊂ E(K), entonces µm ⊂ K ∗ . Se sigue de las propiedades básicas del emparejamiento de Weil, Corolario 3.6, em : E[m] × E[m] −→ µm ⊂ K ∗ . 73 74 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Por otra parte µm ⊂ K ∗ , el Teorema 90 de Hilbert dice que todo homomorfismo de Gal(K/K) a µm , es de la forma ψβ : Gal(K/K) −→ µm σ σ 7−→ ββ ∗ para algún β ∈ K con β m ∈ K ∗ . En el lenguaje de la cohomologı́a de grupos, se reduce a H 1 (Gal(K/K), µm ) = Z 1 (Gal(K/K), µm ) ∼ ∗ = K /(K ∗ )m , 1 Bcont (Gal(K/K), µm ) donde H 1 (Gal(K/K), µm ) es el primer grupo de cohomologı́a de µm como Gal(K/K)-módulo. En otras palabras, existe un isomorfismo δK : K ∗ /(K ∗ )m −→ Hom(Gal(K/K), µm ) b 7−→ [σ 7→ β σ /β] ∗ donde β ∈ K se escoge de modo que β m = b. Empleando las aplicaciones δE y δK , podemos probar el Teorema de Mordell-Weil en su versión débil de una manera explı́cita, y derivar ası́ fórmular que nos permitiran calcular el grupo de Mordell-Weil en ciertos casos. Teorema 6.1. (a) Con la notación anterior, existe un emparejamiento bilineal b : E(K)/mE(K) × E[m] −→ K ∗ /(K ∗ )m tal que em (δE (P ), T ) = δK (b(P, T )). (b) El emparejamiento en (a) es no degenerado por la izquierda. ∞ , el conjunto de (c) Sea S ⊂ MK la unión de el conjunto de los lugares infinitos, MK primos finitos en los que E tiene una reducción mala, y el conjunto de primos finitos que dividen a m. Entonces la imagen del emparejamiento en (a) pertenece a al siguiente subgrupo de K ∗ /(K ∗ )m : K(S, m) = {b ∈ K ∗ /(K ∗ )m : ordv (b) ≡ 0 (mód m) para todo v ∈ / S} (d) El emparejamiento en (a) puede calcularse como sigue. Para cada T ∈ E[m], escogemos funciones fT , gT ∈ K(E) que satisfagan las siguientes condiciones: (1) div(fT ) = m(T ) − m(O) (2) fT ◦ [m] = gTm Entonces para todo punto P 6= T , b(P, T ) ≡ fT (P ) (mód (K ∗ )m ). Si P = T , podemos calcular b(T, T ) empleando la linealidad del emparejamiento. Por ejemplo, si [2]T 6= O, entonces b(T, T ) = fT (−T )−1 . Sea Q ∈ E(K) cualquier punto con Q 6= T , entonces b(T, T ) = fT (T + Q)fT (Q)−1 . 6.1. CALCULAR E(K)/M E(K) 75 Demostración. (a) En primer lugar, recordando la notación que hemos empleado, veamos que δK (b(P, T )) = em (δE (P ), T ) ∈ Hom(Gal(K/K), µm ), determina totalmente el emparejamiento b. Por un lado, em (δE (P ), T ) : Gal(K/K) −→ µm σ 7−→ gT (X + δE (P )(σ))/gT (X) = gT (X + κ(P, σ))/gT (X) = gT (X + (Qσ − Q))/gT (X) y además, δK (b(P, T )) : Gal(K/K) −→ µm σ 7−→ β(P, T )σ /β(P, T ) donde b(P, T ) = β(P, T )m . Por el teorema de Hilbert sabemos que todo homomorfismo entre Gal(K/K) y µm , cuando ∗ µm ∈ K , es de la forma σ 7−→ β σ /β de modo que em (δE (P )(·), T ) determina de manera única β(P, T ), y por tanto b(P, T ). La bilinealidad de b se sigue de la bilinealidad de los emparejamientos de Weil, em , y de Kummer, κ: em (δE (P + P 0 ), T ) = em (κ(P + P 0 , ·), T ) = em (κ(P, ·) + κ(P 0 , ·), T ) = em (κ(P, ·), T )em (κ(P 0 , ·), T ) em (δE (P ), T + T 0 ) = em (κ(P, ·), T + T 0 ) = em (κ(P, ·), T + T 0 ) = em (κ(P, ·), T )em (κ(P, ·), T 0 ) (b) Para probar que el emparejamiento es no degenerado por la izquierda, supondremos que b(P, T ) = 1 para todo T ∈ E[m]. Esto equivale a decir que para todo T ∈ E[m] y σ ∈ Gal(K/K), em (κ(P σ), T ) = 1. La condición de no degeneración del emparejamiento de Weil implica que κ(P, σ) = 0 para todo σ ∈ Gal(K/K), de modo que P ∈ mE(K). (c) Sea β(P, T ) = b(P, T )1/m , obtenido a partir del emparejamiento definido en (a). Entonces fijado (P, T ) ∈ E(k)/mE(K) × E[m], se tiene em (Qσ − Q, T ) = β(P, T )σ /β(P, T ) ∈ µm para todo σ ∈ Gal(K/K), donde [m]Q = P . Se sigue de las definiciones que K(β(P, T )) es un subcuerpo de L = K([m]−1 E(K)), el cuerpo descrito en 4.3.(d). Sabemos por el Teorema 4.5(b) que la extensión de cuerpos L/K es no ramificada fuera de S. Veamos ahora que si v ∈ MK es un lugar finito con v(m) = 0, entonces la extensión K(β(P, T ))/K no ramifica en v si y sólo si ordv (β(P, T )) ≡ 0 (mód m). Donde ordv : K ∗ −→ Z es la valoración normalizada asociada a v. Ésto dice precisamente que b(P, T ) ∈ K(S, m). 76 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL ∗ (d) Escojamos Q ∈ E(K) y β ∈ K , tales que P = [m]Q y b(P, T ) = β m . Entonces por definición se tiene que para todo σ ∈ Gal(K/K) em (δE (P )(σ), T ) = em (κ(P, σ), T ) = em (Qσ − Q, T ) = gT (X + (Qσ − Q))/gT (X), donde X ∈ E(K) es cualquier punto tal que gT (X + (Qσ − Q))gT (X) 6= 0. Por otro lado, en (a) hemos visto que em (δE (P )(σ), T ) = δK (b(P, T ))(σ) = β σ /β. De modo que si tomamos X = Q ∈ E(K), se tiene que gT (Qσ )/gT (Q) = β σ /β. Dado que δK define un isomorfismo, entonces gTm (Q) ≡ β m (mód (K ∗ )m ). Utilizando la definición de fT y gT vemos que gTm (Q) = fT ◦ [m](Q) = fT ([m]Q) = fT (P ) ∈ K ∗ , y por tanto fT (P ) ≡ b(T, P ) (mód (K ∗ )m ). Veremos a continuación cómo el teorema 6.1 nos permitirá calcular el grupo E(K)/mE(K), que como ya hemos visto nos permitirá encontrar los generadores del grupo de MordellWeil. En primer lugar, sabemos que el conjunto K(S, m) definido en 6.1(c) es finito, y podemos calcularlo de manera sencilla. Por otro lado, la función fT , que deriva de la construcción del emparejamiento de Weil, también resulta sencilla de calcular a partir de la ecuación de la curva E. De hecho, la condición div(fT ) = m(T ) − m(O) determina la función salvo multiplicación por escalares, pero la condición fT ◦ [m] = gTm con gT ∈ K(E) determina completamente la función. Para calcular el grupo E(K)/mE(K) tan sólo hemos de: 1. Fijar generadores T1 , T2 de E[m] ∼ = Z/mZ × Z/mZ. Entonces todo T ∈ E[m] es de la forma, T = [m1 ]T1 + [m2 ]T2 0 ≤ m1 , m1 < m. 2. Para todo (b1 , b2 ) ∈ K(S, m)×K(S, m), tenemos que comprobar si existe una solución (P, z1 , z2 ) ∈ E(K) × K ∗ × K ∗ del sistema: b1 z1m = fT1 (P ) b2 z2m = fT2 (P ) Pues recordemos que el apartado (d) del teorema anterior asegura que si P 6= T , entonces b(P, T ) ≡ fT (mód (K ∗ )m ), de modo que si bi zim = fTi (P ) para algún zi ∈ (K ∗ )m , entonces bi = b(P, Ti ) es preimagen del par (P, Ti ) ∈ E(K) × E[m]. Además dado que T1 , T2 generan E[m], se tiene por bilinealidad de b que b(P, [m1 ]T1 + [m2 ]T2 ) = b(P, T1 )m1 b(P, T2 )m2 = b([m1 ]P, T1 )b([m2 ]P, T2 ). 6.2. 2-DESCENSO COMPLETO 77 3. Por último, que b(P, T ) sea no degenerada por la izquierda implica que si b(P, T1 ) = b(P 0 , T1 ) b(P, T2 ) = b(P 0 , T2 ) =⇒ b(P, T ) = b(P 0 , T ) para todo T ∈ E[m] y por tanto P − P 0 ∈ mE(K), de modo que P = P 0 ∈ E(K)/mE(K) representan la misma coclase. De modo que resulta equivalente encontrar las parejas (b1 , b2 ) ∈ K(S, m) × K(S, m) para las que el sistema tiene solución (P, z1 , z2 ) ∈ E(K) × K ∗ × K ∗ , que encontrar los representantes P ∈ E(K) de las coclases de E(K)/mE(K). Pues de cada pareja se puede recuperar el punto P , tal y cómo se detalla a continuación. Además dado que hay un número finito de pares (b1 , b2 ), sólo hay un número finito de sistemas. En términos de x, y, en las ecuaciones de Weierstrass de la curva, estamos buscando elementos (x, y, z1 , z2 ) ∈ K × K × K × K ∗ × K ∗ tales que,  2  y + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 b1 z1m = fT1 (x, y)  b2 z2m = fT2 (x, y) Las ecuaciones anteriores definen un espacio homogéneo HE (b1 , b2 ) para E/K, que a lo sumo cuenta con un punto K-racional. De modo que calcular E(K)/mE(K) depende de que seamos o no capaces de calcular la existencia (o no existencia) de puntos K-racionales en un conjunto finito de espacios homogéneos HE (b1 , b2 ). Veremos más adelante, que ésta no es una tarea sencilla en general, y que en muchos casos no será posible justificar dicha existencia (o no existencia), debido básicamente a que en este tipo de variedades algebraicas no se cumple el principio de Hasse (local-global). En ocasiones será casi directo descartar uno de estos espacios homogéneos, por ejemplo si no tiene puntos en Kv para algún v ∈ MK entonces tampoco tendrá puntos racionales. Sin embargo podemos encontrarnos con espacios homogéneos que tienen soluciones en todas las compleciones Kv , v ∈ Mk , y sin embargo no tienen puntos K-racionales. 6.2. 2-Descenso Completo Consideraremos el caso especial en el que m = 2, que es sin duda el más sencillo para trabajar. Bajo la suposición de que E[m] ⊂ E(K), podemos considerar una ecuación de Weierstrass de la forma E : y 2 = (x − e1 )(x − e2 )(x − e3 ) con e1 , e2 , e3 ∈ K. 78 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Entonces los 3 puntos notriviales de 2-Torsión son T1 = (e1 , 0), T2 = (e2 , 0), T3 = (e3 , 0). Dado que la recta x − ei = 0 es tangente a la curva E en el punto Ti , entonces tal y como vimos en la sección 2.4 div(x − ei ) = 2(Ti ) − 2(O) i = 1, 2, 3. De modo que en este caso tenemos que div(fT ) = div(x − e) cuando T = (e, 0) es uno de los puntos anteriores. Empleando la fórmula de la duplicación, para la curva E : y 2 = (x − e1 )(x − e2 )(x − e3 ) = x3 − x2 (e1 + e2 + e3 ) + x(e1 e2 + e1 e3 + e2 e3 ) − (e1 e2 e3 ), se tiene que, (x − e) ◦ [2] = (x2 − 2ex − 2e2 + 2(e1 + e2 + e3 )e − (e1 e2 + e1 e3 + e2 e3 ) 2y 2 , de modo que efectivamente fT (x, y) = x − e. Supongamos ahora que (b1 , b2 ) ∈ K(S, 2) × K(S, 2) y queremos dererminar cuándo existe algún punto P ∈ E(K)/2E(K) que cumpla b(P, T1 ) = b1 y b(P, T2 ) = b2 , donde recordemos que T1 , T2 son generadores de E[2] = {O, T1 , T2 , T1 +T2 } ∼ = Z/2Z×Z/2Z. Tal punto existirá si y sólo si existe una solución (x, y, z1 , z2 ) ∈ K × K × K ∗ × K ∗ del sistema de ecuaciones,  2  y = (x − e1 )(x − e2 )(x − e3 ), b1 z12 = x − e1 ,  b2 z22 = x − e2 , que sustiyendo las dos últimas ecuaciones en la primera, y definiendo una nueva variable z3 con y = b1 b2 z1 z2 z3 , se tiene el siguiente sistema de ecuaciones b1 b2 z32 = x − e3 , b1 z12 = x − e1 , b2 z22 = x − e2 . Finalmente, se obtienen el siguiente par de ecuaciones tras despejar la variable x: b1 z12 − b2 z22 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e2 . Esto nos da una colección finita de ecuaciones, una para cada par (b1 , b2 ), y emplearemos todas la técnicas a nuestra disposición para determinar cuando éstas tienen solución. Nótese que cuando encontramos una solución (z1 , z2 , z3 ) entonces recuperamos inmediatamente el correspondiente punto P = (x, y) ∈ E(K)/2E(K) con las fórmulas, x = b1 z12 + e1 y = b1 b2 z1 z2 z3 . Por último, hemos de lidiar con el hecho de que la definición que establecimos en 6.1(d) de b(P, T ) = fT (P ) no puede emplearse cuando P = T . Es decir, hay dos parejas (b1 , b2 ) 6.2. 2-DESCENSO COMPLETO 79 que no se pueden obtener con el procedimiento anterior, digamos (b(T1 , T1 ), b(T1 , T2 )) y (b(T2 , T1 ), b(T2 , T2 )). Estos valores se pueden sin embargo calcular aprovechando la bilinealidad de b, b(T1 , T2 ) = b(T1 , T1 + T2 )b(T1 , T2 )−1 = b(T1 , T3 )b(T1 , T2 )−1 e1 − e3 = , e1 − e2 y de manera análoga, b(T2 , T2 ) = e2 − e3 . e2 − e1 Vamos a recoger el procedimiento completo en la siguiente proposición. Proposición 6.2 (2-Descenso Completo). Sea E/K una curva elı́ptica dada por una ecuación de Weierstrass, y 2 = (x − e1 )(x − e2 )(x − e3 ) con e1 , e2 , e3 ∈ K. Sea S ⊂ MK un conjunto finito de lugares de K que incluya todos los lugares arquimedianos, todos los lugares que dividan a 2, y todos aquellos lugares en los que la curva E tenga una mala reducción. Además, sea K(S, 2) = {b ∈ K ∗ /(K ∗ )2 : ordv ≡ 0 (mód 2) para todo v ∈ / S}. Entonces existe un homomorfismo inyectivo E(K)/2E(K) −→ K(S, 2) × K(S, 2) definido por  (x   − e1 , x − e2 )    e1 −e3 , e1 − e2 e1 −e2 P = (x, y) − 7 → 3  e2 − e1 , ee22 −e  −e  1   (1, 1) si x 6= e1 , e2 si x = e1 si x = e2 si P = O Sea (b1 , b2 ) ∈ K(S, 2) × K(S, 2), una pareja que no es imagen de uno de los tres puntos O, (e1 , 0), (e2 , 0). Entonces (b1 , b2 ) es la imagen de un punto P = (x, y) ∈ E(K)/2E(K) si y sólo si las ecuaciones b1 z12 − b2 z2 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e1 , tiene una solución (z1 , z2 , z3 ) ∈ K ∗ × K ∗ × K. Si tal solución existe, entonces podemos tomar P = (x, y) = (b1 z12 + e1 , b1 b2 z1 z2 z3 ). Demostración. Tal y como explicamos anteriormente, éste no es sino el caso m = 2 del teorema 6.1. 80 6.3. CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Un ejemplo A continuación ilustraremos cómo calcular E(K)/2E(K), y obtendremos los generadores del grupo de Mordell-Weil, en un caso concreto. Ejemplo 6.1. Tomemos E/Q la curva elı́ptica dada por, E : y 2 = x3 − 12x2 + 20x = x(x − 2)(x − 10), y con discriminante ∆ = 490600 = 214 52 . Tal y como ya hemos visto E tiene una buena reducción módulo cualquier primo salvo 2 y 5. Reduciendo la ecuación módulo 3, se tiene e : y 2 = x(x − 1)(x + 1) E es sencillo comprobar que e 3 ) = {P1 = (0, 0), P2 = (−1, 0), P3 = (1, 0), O}, E(F tiene cuatro puntos F3 -racionales. Dado que E[2] ∼ = Z/2Z × Z/2Z ⊂ Etors , que a su vez se e 3 ), tal y como vimos en el capı́tulo 3, se tiene que E[2] = Etors . inyecta en E(F Sea S = {2, 5, ∞} ⊂ MQ . Entonces un conjunto de representantes completo para Q(S, 2) = {b ∈ Q∗ /(Q∗ )2 : ordv (b) ≡ 0 (mód 2) para todo v ∈ / S} viene dado por {±1, ±2, ±5, ±10} en Q∗ /(Q∗ )2 , ya que, salvo por cuadrados, los elementos de Q(S, 2) no pueden ser divisibles por ningún primo distinto de 2, 5. Consideremos a continuación la aplicación definida en 6.2, con e1 = 0, e2 = 2, e3 = 10: E(Q)/2E(Q) −→ Q(S, 2) × Q(S, 2) (x, y) 7−→ (x, x − 2) si x 6= 0, 2 Hay 82 pares (b1 , b2 ) ∈ Q(S, 2) × Q(S, 2), y para cada par debemos comprobar cuando proviene de un elemento de E(Q)/2E(Q). Por ejemplo, usando el resultado 6.2, podemos calcular la imagen de E[2] en Q(S, 2) × Q(S, 2): O 7→ (1, 1), (0, 0) 7→ (5, −2), (2, 0) 7→ (2, −1), (10, 0) 7→ (10, 8) ≡ (10, 2) (mód (Q∗ )2 ). Aun falta determinar, para cada par (b1 , b2 ), cuando las ecuaciones b1 z12 − b2 z22 = 2, b1 z12 − b1 b2 z32 = 10, tienen una solución z1 , z2 , z3 ∈ Q. Por ejemplo, si b1 < 0 y b2 > 0, entonces el sistema no podrá tener soluciones racionales, pues ni siquiera tiene solucion en R. Empleando esta misma estrategia, vamos a encontrar cuáles de los 64 pares (b1 , b2 ) son preimagen de un punto P . Es decir, cúando el sistema tiene solucion. 6.3. UN EJEMPLO 81 1. Si b1 < 0 y b2 > 0, entonces b1 z1 − b2 z2 = 2 no tiene soluciones en R, y por tanto tampoco en Q. Con ésta condición descartamos las16 parejas: {(−1, 1), (−2, 1), (−5, 1), (−10, 1), (−1, 2), (−2, 2), (−5, 2), (−10, 2), (−1, 5), (−2, 5), (−5, 5), (−10, 5), (−1, 10), (−2, 10), (−5, 10), (−10, 10)}. 2. Si b1 < 0 y b2 < 0, entonces b1 z1 − b1 b2 z32 = 10 no tiene soluciones en R. Con esta condición descartamos las 16 parejas: {(−1, −1), (−2, −1), (−5, −1), (−10, −1), (−1, −2), (−2, −2), (−5, −2), (−10, −2), (−1, −5), (−2, −5), (−5, −5), (−10, −5), (−1, −10), (−2, −10), (−5, −10), (−10, −10)}. 3. Los cuatro puntos de torsión O, T1 = (0, 0), T2 = (0, 2), T3 = T1 + T2 = (0, 10), van a parar respectivamente a las cuatro parejas: {(1, 1), (5, −2), (2, −1), (10, 2)}. 4. La pareja (b1 , b2 ) = (1, −1), corresponde con el sistema 2 z1 + z22 = 2 z12 + z32 = 10 que tiene como solución (z1 , z2 , z3 ) = (1, 1, 3) que da lugar al punto P0 = (1, −3) ∈ E(Q). 5. Si sumamos el punto P0 = (1, −3) a los cuatro puntos de 2-torsión no triviales, corresponde con multiplicar sus correspondientes (b1 , b2 ), ya que para T fijo b(·, T ) es un homomorfismo. Este procedimiento nos da los tres pares: {(5, 2), (2, 1), (10, −2))} ⊂ Q(S, 2) × Q(S, 2). Que corresponden con los puntos, P1 = (20, 60), P2 = (18, −48), P3 = (10/9, −80/27) ∈ E(Q). 6. Si b1 6≡ 0 (mód 5), y b2 ≡ 0 (mód 5). Se tiene que ord5 (b1 z12 ) = 2ord5 (z1 ) tiene que ser par, y ord5 (b2 z22 ) = 2ord5 (z2 )+1 es impar. De modo que la ecuación b1 z12 −b2 z22 = 2 implica que z1 , z2 ∈ Z5 . De la segunda ecuación se tiene que z1 ≡ 0 (mód 5), y junto con la primera ecuación tenemos que 0 ≡ 2 (mód 5) lo cual es una contradicción. Por tanto, el sistema no puede tener soluciones en Q5 , y tampoco en Q, para los 8 nuevos pares: {(1, ±5), (2, ±5)(1, ±10)(2, ±10)}. 82 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL 7. Los 8 pares en el apartado anterior son Q5 -no triviales, i.e. el sistema no tiene soluciones en Q5 . De modo que si multiplicamos esos pares por el par Q-trivial (5, 2), obtendremos 8 nuevas parejas Q5 -no triviales: {(5, ±10), (10, ±10), (5, ±20) ≡ (5, ±5) (mód (Q∗ )2 ), (10, ±20) ≡ (10, ±5) (mód (Q∗ )2 )}. 8. La pareja (b1 , b2 ) = (1, 2), corresponde con el sistema 2 z1 − 2z22 = 2 z12 − 2z32 = 10 Como 2 no es residuo cuadrático módulo 5, la segunda ecuación implica que z1 ≡ z3 ≡ 0 (mód 5). Se tiene entonces que en la tercera ecuación, 0 ≡ 10 (mód 2)5, lo cual es una contradicción. Por tanto el sistema no tiene soluciones en Q5 . 9. Tomando este último par Q5 -no trivial del apartado anterior, y multiplicándolo por los 7 pares que ya tenemos en la tabla (correspondientes a los 7 puntos que ya hemos calculado), obtenemos 7 nuevas parejas Q5 -no triviales que completan la tabla. {(2, ±2), (5, ±1), (10, ±1), (1, −2)}. b2 \b1 1 2 5 10 -1 -2 -5 -10 1 O Q5 Q5 Q5 P0 Q5 Q5 Q5 2 P2 Q5 Q5 Q5 T2 Q5 Q5 Q5 5 Q5 P1 Q5 Q5 Q5 T1 Q5 Q5 10 Q5 T3 Q5 Q5 Q5 P3 Q5 Q5 -1 R R R R R R R R -2 R R R R R R R R -5 R R R R R R R R -10 R R R R R R R R Cálculo de E(Q)/2E(Q) para E : y 2 = x(x − 2)(x − 10). Ası́ hemos comprobado una a una las condiciones de compatibilidad de cada una de las 64 parejas (b1 , b2 ) ∈ Q(S, 2) × Q(S, 2). Y hemos obtenido los puntos, {O, T1 , T2 , T3 , P0 , P1 = P0 + T1 , P2 = P0 + T2 , P3 = P0 + T3 } = E(Q)/2E(Q). Para calcular los generadores de la parte libre de E(Q), basta darse cuenta de que podemos inyectar el cociente E(Q)/2E(Q) de manera natural en el grupo E(Q)/2E(Q) ,→ E(Q) ∼ = Etors × Zr . Y dado que Etors = E[2] = {O, T1 , T2 , T3 }, entonces los generadores de Zr han de ser imagen de alguno de los puntos {P0 , P1 , P2 , P3 } ⊂ E(Q)/2E(Q). 6.3. UN EJEMPLO 83 Y por construcción sabemos que estos cuatro puntos son linealmente dependientes, de modo que la parte libre del grupo tiene un sólo generador, digamos P . Podemos entonces concluir que, E(Q) ∼ = Z/2Z ⊕ Z/2Z ⊕ Z =< T1 , T2 , P > . Como ya hemos dicho anteriormente, resulta relativamente sencillo encontrar los generadores de E(Q) a partir de los de E(Q)/2E(Q), pero en general no será tan sencillo como en el ejemplo anterior. Pues tenemos un número finito de sistemas de ecuaciones que definen un número finito de espacios homogéneos, HE (b1 , b2 ) = {(z1 , z2 , z3 ) : b1 z12 − b2 z22 = e2 − e1 , b1 z12 − b1 b2 z32 = e3 − e1 } ⊂ A3 (K), donde E : y 2 = (x − e1 )(x − e2 )(x − e3 ) es nuestra curva. Y para cada uno de ellos hemos de comprobar si tiene o no algún punto K-racional (que dará lugar a un punto P ∈ E(K)/2E(K)). La dificultad de este proceso radica en que no siempre podremos encontrar una solución racional, ni probar que no existen soluciones en alguna compleción Kv de K. Puede suceder incluso, que existiendo Kv -racionales para toda valoración v ∈ MK , puedan no existir puntos K-racionales, i.e. el principio Local-Global de Hasse no se puede aplicar a este tipo de variedades. 84 CAPÍTULO 6. CÓMO CALCULAR EL GRUPO DE MORDELL-WEIL Capı́tulo 7 Variedades Abelianas En su tesis doctoral, escrita entre 1927 y 1928, André Weil demostró que los puntos racionales de la variedad Jacobiana de cuelquier curva, definida sobre un cuerpo de números, era finitamente generada. Este resultado es conocido como el Teorema de Weil, y supone la generalización del teorema que habı́a probado Mordell años antes, que se ocupaba exclusivamente de las curvas elı́pticas definidas sobre Q. Como corolario directo del Teorema de Weil se obtiene la finitud de los generadores de cualquier curva elı́ptica definida sobre un cuerpo de números arbitrario K, es por eso que el resultado principal del trabajo se conoce como Teorema de Mordell-Weil. A partir de esta tesis, Weil comenzó a investigar las variedades abelianas. La mejor manera de comprender las variedades abelianas es como análogos de las curvas elı́pticas en dimensiones mayores. Una variedad abeliana es básicamente una variedad proyectiva A, con estructura de grupo abeliano en la que las operaciones suma e inverso son morfismos. En este caso, la Jacobiana de una variedad serı́a el análogo al grupo (E, ⊕) en una curva elı́ptica, aunque éste es un caso especial, ya que para las curvas elı́pticas la variedad y su jacobiana coinciden. Tal y como ya hemos visto, si E es una curva elı́ptica sobre un cuerpo algebraicamente cerrado K, entonces existe un isomorfismo canónico E(K) −→ P ic0 (E) P 7−→ (P ) − (O) que define una estructura de grupo en E a partir de la estructura natural en P ic0 (E). A través de esta construcción podemos encontrar dos generalizaciones distintas: (I) Sea C una curva, y Q ∈ C(K) un punto. Entonces existe una variedad abeliana J, llamada la variedad Jacobiana de la curva C, y una aplicación regular ϕ : C −→ J, tal que ϕ(Q) = 0 y 0 Div P (C) −→ J P i ni Pi 7−→ i ni ϕ(Pi ) induce un isomorfismo entre P ic0 (C) y J(K). La dimensión de J coincidirá con el género de C. 85 86 CAPÍTULO 7. VARIEDADES ABELIANAS (II) Sea A una variedad abeliana. Entonces existe una variedad abeliana dual A∨ tal que P ic0 (A) ∼ = A∨ (K) y P ic0 (A∨ ) ∼ = A(K), En el caso particular de una curva elı́ptica se tiene que su dual es ella misma, E = E ∨ . En general se tiene que A y A∨ son isogenas, pero no iguales (ni siquiera isomorfas). Nosotros sólo discutiremos la primera, y en esta ocasión no definiremos la variedad dual, para el lector interesado consultar [7]. La mayorı́a de los teoremas y resultados que se han descrito en este trabajo para curvas elı́pticas, pueden generalizarse a resultados sobre variedades abelianas. 7.1. Variedades Abelianas En primer lugar definiremos un grupo algebraico, que es un objeto que combina los conceptos de grupo y variedad, haciendo que ambas estructuras sean compatibles. Definición. Una grupo algebraico es una variedad algebraica G/K, (proyectiva o afı́n), junto con un punto OG ∈ G(K), y dos morfismos m : G × G −→ G, i : G −→ G . Que dota al conjunto de los puntos de G de una estructura de grupo. En otras palabras: (i) m(P, OG ) = m(OG , P ) = P para todo P ∈ G, (ii) m(P, i(P )) = OG para todo P ∈ G, (iii) m(P, m(Q, R)) = m(m(P, Q), R) para todo P, Q, R ∈ G. Si G, m e i están definidos sobre un cuerpo K, y OG ∈ G(K), entonces decimos que el grupo algebraico G está definido sobre K. En el caso particular de las curvas elı́pticas, m : E × E −→ E (P, Q) 7−→ P ⊕ Q i : E −→ E P 7−→ P la multiplicación coincide con la ley de grupo, y el elemento neutro coincide con O. Tal y como ya vimos, (E, ⊕, O) es un grupo. Sorprendentemente se tiene que un grupo algebraico es automáticamente no singular, y además si G es una variedad proyectiva, entonces la ley de grupo, definida por el morfismo m, es conmutativa en G, i.e. m(P, Q) = m(Q, P ) para todo P, Q ∈ G. Definición. Una variedad abeliana A es un grupo algebraico proyectivo. Dado que estamos trabajando con un grupo abeliano, de ahora en adelante emplearemos indistintamente la notación P ⊕A Q para denotar m(P, Q), y −P para i(P ). 7.2. HOMOMORFISMOS ENTRE VARIEDADES ABELIANAS 7.2. 87 Homomorfismos entre variedades abelianas Dado que hemos construido un objeto que tiene estructura de grupo y variedad, tiene sentido preguntarse qué clase de aplicaciones podemos definir entre estos objetos. De manera natural, nos interesará estudiar aquellos morfismos, (que respetan la estructura de variedad), que a su vez son compatibles con la ley de grupo que define m. Éstas aplicaciones serán los homomorfismos entre variedades abelianas. Definición. Sea A una variedad abeliana sobre K. Para un punto P ∈ A(K), definimos tP , la translación por P , como la composición m tP : A −→ A × A −→ A Q 7−→ (Q, P ) 7−→ m(P, Q) = Q ⊕A P Nótese que debido a que m es un morfismo, entonces también tP ∈ M or(A, A) para todo P ∈ A. De hecho, se trata de un isomorfismo, cuyo inverso es t−P . Además, si (A, m ∼ ⊕A , i) y (B, m0 ∼ ⊕B , i0 ) son variedades abelianas, y existe un morfismo ϕ : A −→ B, entonces se tiene que ϕ(m(P, Q)) = ϕ(P ⊕A Q) = ϕ(P ) ⊕B ϕ(Q) = m0 (ϕ(P ), ϕ(Q)) sı́ y sólo si ϕ(OA ) = OB . Este resultado se obtiene como corolario del teorema de Rigidez. Antes de enunciar este resultado recordemos unas definiciones. Definición. Una variedad algebraica V se dice completa, si para toda variedad algebraica W , la proyección: π : W × V −→ W es cerrada.Es decir, la imagen por π de cualquier subvariedad cerrada en W × V es cerrada en W . Teorema 7.1 (Rigidez). Sea ϕ una aplicación regular, ϕ : V × W −→ U entre variedades proyectivas, siendo V completa y V × W irreducible. Si existen puntos u0 ∈ U , v0 ∈ V y w0 ∈ W tales que ϕ(V × {w0 }) = {u0 } = ϕ({v0 } × W ) entonces ϕ(V × W ) = {u0 }. 88 CAPÍTULO 7. VARIEDADES ABELIANAS En otras palabras, si dos ’ejes de coordenadas’ colapsan en un punto, entonces todo el espacio colapsa en ese mismo punto. De este resultado, que no probaremos aquı́ (ver [6] para más detalles), se obtiene el siguiente corolario. Corolario 7.2. Dadas A, B variedades abelianas, y ϕ : A −→ B un morfismo entre ellas, entonces se tiene que la composición de ϕ con la traslación por −ϕ(OA ) es un morfismo y además es homomorfismo de grupos, de modo que ϕ ◦ t−ϕ(OA ) ∈ Hom(A, B). Recı́procamente, cualquier morfismo entre variedades abelianas, ϕ : A −→ B es composición de un homomorfismo y una traslación. Demostración. La aplicación regular ϕ manda el punto K-racional OA , a un punto K-racional Q en B. Tras componer con una traslación por −Q, podemos asumir que ϕ(OA ) = OB . Consideremos la aplicación, φ : A × A −→ B definida por φ(P, P 0 ) = ϕ(P ⊕A P 0 ) − (ϕ(P ) ⊕B ϕ(P 0 )). Con esto queremos decir que φ es la diferencia de dos aplicaciones regulares, A×A ϕ×ϕ m /A m0 ϕ B×B /B que es una aplicación regular. Entonces, φ(A × {OA }) = OB = φ({OA } × A) =⇒ φ = OB , esto quiere decir que ϕ es un homomorfismo. A partir de este corolario se deduce que si tenemos una variedad abeliana (A, m, OA ), siempre podemos definir la ley de grupo con respecto a un nuevo punto base P ∈ A como, m0 = ti(P ) ◦ m y (A, m0 , P ) será una variedad abeliana. Corolario 7.3. La ley de grupo en una variedad abeliana es conmutativa. 7.3. VARIEDADES JACOBIANAS 89 Demostración. Los grupos conmutativos se caracterizan por el hecho de que la aplicación que lleva a un elemento a su inverso es un homomorfismo. Dado que la aplicación inverso, i : A −→ A P 7−→ −P es un morfismo por definición, y además i(OA ) = OA , entonces i es un homomorfismo y por tanto A un grupo abeliano. Ejemplo 7.1. Sea A una variedad abeliana de dimensión d definida sobre C. Entonces se puede demostrar que existe un retı́culo Λ ⊂ Cd , y un isomorfismo analı́tico complejo, A(C) ∼ = Cd /Λ. El isomorfismo respeta tanto la extructura de variedad compleja como la de grupo abeliano. Para curvas elı́pticas, este resultado se ve reflejado en el Teorema de uniformización, que establece que toda curva elı́ptica definida sobre C es isomorfa a un toro complejo, EΛ (C) ∼ = C/Λ ←→ Λ retı́tculo en C. Y en dimensión 1 se tiene que todo retı́culo complejo define una curva elı́ptica, aunque para generalizar este resultado a variedades abelianas el retı́culo Λ ha de cumplir las condiciones de Riemann para que Cd /Λ sea una variedad abeliana. 7.3. Variedades Jacobianas La siguiente proposición, nos asegura que el grupo de Picard de una curva es esencialmente una variedad abeliana, a la que llamaremos variedad Jacobiana de la curva. Su dimensión coincidirá con el género de la curva en cuestión. Proposición 7.4. Sea C una curva proyectiva lisa de género g, definida sobre un cuerpo algebraicamente cerrado K. (a) La aplicación de grado deg : Div(C) −→ Z induce una sucesión exacta deg 0 −→ P ic0 (C) −→ P ic(C) −→ Z −→ 0, donde P ic0 (C) es el grupo de clases de divisores de grado cero en C. (b) Existe una variedad abeliana Jac(C), de dimensión g, y un isomorfismo natural de grupos ∼ P ic0 (C) −→ Jac(C). Definición. La variedad Jac(C) descrita en la proposición anterior para una curva proyectiva lisa C, es la variedad Jacobiana de C. 90 CAPÍTULO 7. VARIEDADES ABELIANAS Tal y como ya vimos, en el caso de las curvas elı́pticas, el grupo de Picard es isomorfo a la propia curva, de modo que se sigue que Jac(E) ∼ = E, para el caso de género 1. Para curvas de género mayor, describiremos la construcción algebraica de la variedad Jacobiana brevemente. Fijado un punto P0 ∈ C, una curva de género g > 1, consideraremos la aplicación φg : C g −→ P ic0 (C) (P1 , ..., Pg ) 7−→ (P1 ) + · · · (Pg ) − g(P0 ) El grupo simétrico Sg actúa sobre C g permutando las coordenadas, y la aplicación φg queda invariante bajo esta acción. Por tanto φg induce una aplicación sobre C (g) := C g /Sg . Se puede comprobar que C (g) es una variedad lisa , y que además φg : C (g) −→ P ic0 (C) es sobreyectiva, e inyectiva fuera de en un cerrado en la topologı́a de Zariski de C (g) . Además, la ley de grupo en P ic0 (C) induce una aplicación racional C (g) × C (g) −→ C (g) , que por desgracia no está definida en todas partes. De modo que la estrategia a seguir será tomar ciertos ’fragmentos’ del grupo y ’pegarlos’ para formar una variedad de grupo. La idea de ’pegar’ estos fragmentos se le debe a André Weil, y funciona en todas las caracterı́sticas. Sin embargo la construcción de la Jacobiana de una curva analı́tica, definida sobre C, es mucho más antigua, y emplea el Teorema de Riemann-Roch, ası́ como resultados de cohomologı́a, junto a algo de integrales elı́pticas. En lı́neas generales, la estrategia en este caso consiste en definir una aplicación Cg φ : C −→ Z P P 7−→ Z P ω1 , ..., P0 ωg P0 donde ω1 , ..., ωg es una base del espacio de formas diferenciales holomorfas ΩC . Y justificar que esta aplicación induce otra, φ : C −→ Cg /Λ, donde Λ viene dado como imagen de H1 (C, Z) −→ Z Cg Z Γ 7−→ ω1 , ..., ωg Γ Γ El retı́culo Λsatisface las condiciones de Riemann, y por tanto Cg /Λ será isomorfa (analı́ticamente) a una variedad abeliana. Denotando dicha variedad por Jac(C), uno puede verificar que φ puede extenderse de manera lineal a φ :P Div 0 (C) −→ Jac(C) P ni (Pi ) 7−→ [ni ]φ(Pi ) 7.4. RESULTADOS EN VARIEDADES ABELIANAS 91 que es una aplicación sobreyectiva cuyo núcleo es precisamente el conjunto de divisores principales. De modo que se tiene el isomorfismo deseado, ∼ P ic0 (C) −→ Jac(C). Si una curva C está definida sobre un cuerpo K, entonces su variedad Jacobiana también lo está. Y además, el isomorfismo definido entre P ic0 (C) y la Jacobiana, conmuta con la acción del grupo de Galois Gal(K/K). 7.4. Resultados en variedades abelianas Tal y como establecimos al comienzo del capı́tulo, muchos de los resultados que hemos enunciado y demostrado para curvas elı́pticas se pueden obtener como casos particulares de resultados más amplios sobre variedades abelianas. A continuación enunciaremos algunos de ellos. 7.4.1. Torsión en variedades abelianas Sea A una variedad abeliana de dimensión g, definida sobre un cuerpo K. Para n > 0 entero, definimos el morfismo nA : A −→ A P 7−→ P ⊕A · · · ⊕A P multiplicación por n en A. Denotaremos por A[n] al núcleo de la aplicación nA . Teorema 7.5. Sea A una variedad abeliana de dimensión g, definida sobre un cuerpo K. Entonces, 2g ∼ A[n] si char(K) 6 | n, = (Z/nZ) i A[pm ] ∼ si p = char(K), m > 0 = (Z/pm Z) donde i depende de A pero no de m, y puede tomar cualquier valor entre 0 y g. El entero i se conoce como p-rango de A. Este resultado es la generalización de la Proposición 3.2. Para curvas elı́pticas definidas sobre cuerpos de caracterı́stica positiva, se tiene que el p-rango es 1 si la curva es ordinaria, y 0 si es supersingular. Además, existe un emparejamiento canónico y no degenerado, A[n] × A∨ [n] −→ µn , que coincide en género 1 con el emparejamiento de Weil descrito en la sección 3.4. 7.4.2. Teorema de Weil Teorema 7.6 (Weil). Sea K un cuerpo de números, y A una variedad abeliana definida sobre K. Entonces A(K) está finitamente generada como grupo. Sin duda alguna, dado que una curva elı́ptica es una variedad abeliana de dimensión uno, este resultado es la generalización natural del Teorema de Mordell-Weil. En 1952 A. Nerón extendió el Teorema de Weil a variedades abelianas definidas sobre cuerpos finitamente generados sobre un cuerpo primo. 92 7.4.3. CAPÍTULO 7. VARIEDADES ABELIANAS Conjetura de Mordell y Teorema de Faltings En el año 1922, tras haber probado que todos los puntos racionales de una curva elı́ptica podı́an obtenerse a partir de un número finito de ellos, L.J. Mordell se dió cuenta de que para una serie de curvas de género mayor que uno, el número de puntos racionales tenı́a que ser finito. De modo que pensó que era razonable establecer la siguiente conjetura. Conjetura de Mordell: Si C es una curva proyectiva lisa de género g ≥ 2, definida sobre un cuerpo de números K, entonces el conjunto de puntos racionales C(K) es finito. Tal y como hemos podido ver en los ejemplos desarrollados en los capı́tulos 5 y 6, la conjetura no es cierta en el caso g = 1, ya que para curvas elı́pticas, hemos visto que es posible encontrar puntos racionales de orden infinito, lo cual implica directamente que E(K) no puede ser finito. Sin embargo la conjetura fué probada por G. Faltings en 1983, y puede extenderse a curvas no proyectivas y singulares, pues ésto sólo hace variar C(K) en un número finito de puntos. Ası́, el Teorema de Faltings establece que las ecuaciones de Fermat, xn + y n = z n , n ≥ 4, tienen sólo un número finito de soluciones (x, y, z) en cualquier cuerpo de números (salvo multiplicación por constantes). La demostración del Teorema de Faltinngs hace uso esencial de las variedades abelianas, pues se deduce de un importante resultado conocido como la Conjetura de Safarevich que establece la finitud de las clases de isomorfı́a de variedades abelianas bajo ciertas condiciones, ver II [3]. Bibliografı́a [1] J.W.S. Cassels, Lectures on elliptic curves. London Mathemacial Society Student Texts 24 (1991). [2] H. Cohen y G. Frey, Handbook of elliptic and hyperelliptic curve cryptography. Discrete Mathematics and its Applications (2006). [3] G. Cornell y J.H. Silverman (ed.) , Arithmetic Geometry Springer-Verlag (1986). [4] S. Lang, Fundamentals on Diophantine Geometry Springer-Verlag (1983). [5] S. Lang, Introduction to Algebraic Geometry. Tracts in Mathematics 5, Interscience Publishers (1964). [6] J.S. Milne, Algebraic Number Theory http : //www.jmilne.org/math/CourseN otes/AN T.pdf [7] J.S. Milne,Abelian Varieties http : //www.jmilne.org/math/CourseN otes/AV.pdf [8] D. Mumford, Abelian Varieties. Oxford University Press (1985). [9] J. Neukirch, Algebraic Number Theory. Grundlehren der mathematischen Wissenschaften 322, Springer Verlag (1999). [10] J.H. Silverman, The Arithmetic of Elliptic Curves, 2nd ed.. Graduate Texts in Mathematics 106, Springer Verlag (2009). [11] J.H. Silverman, Advaned Topics in the Arithmetic of Elliptic Curves. Graduate Texts in Mathematics 151, Springer-Verlag (1994). [12] A brief history of elliptic curves. http : //livetoad.org/Courses/Documents/132d/N otes/history of elliptic curves.pdf . Las ilustraciones de las páginas 27 y 28 pertenecen al depósito multimedia de Wikimedia Commons, y pueden encontrarse en: http : //commons.wikimedia.org/wiki/Category : Elliptic curves 93

Teorema de Mordell-Weil - Universidad Autónoma de Madrid

Documentos relacionados

Productos

Apoyo

Teorema de Mordell-Weil - Universidad Autónoma de Madrid

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib