La tesis de Tate I

La tesis de Tate I 1. Recordando los p-ádicos En principio los números p-adicos (p es primo) son una notación conveniente para hablar simultáneamente de las soluciones de una ecuación módulo p, p2 , p3 ,. . . Por ejemplo, la ecuación x2 = −1 tiene la solución x1 = 2 módulo 5, la cual se puede “elevar” de forma única a la solución x2 = 7 = 2 + 1 · 5 módulo 52 , y ésta a x3 = 57 = 2 + 1 · 5 + 2 · 52 módulo 53 . este procedimiento repetido hasta el infinito lleva a que el “número 5-ádico” x = 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + 4 · 55 + . . . es solución de la ecuación x2 = −1. Lo que se quiere decir con esto es que tomando los n primeros sumandos tenemos una solución xn , módulo 5n . En general, dado un primo p el conjunto Zp de enteros p-ádicos es el formado por las series formales evaluadas en x = p con coeficientes en {0, 1, 2, , . . . p − 1}, Zp = {a0 + a1 p + a2 p2 + a3 p3 + . . . : 0 ≤ aj < p}. Evidentemente cada entero no negativo se puede considerar p-ádico escribiéndolo en base p y tomando ak = 0 para k grande. En general hay una inyección natural j : Z ,→ Zp en la que para cada r ∈ Z se considera xn ∈ {0, 1, 2, , . . . pn − 1} con xn ≡ r (mod pn ) y las cifras de xn en base p son {a0 , a1 , . . . , an−1 }. Si en Z se considera la norma multiplicativa dada por knkp = p−k si pk kn y k0kp = 0, tendremos una distancia en Z, d(n, m) = kn − mkp y consecuentemente una topologı́a métrica inducida en la que dos enteros están cercanos si son congruentes módulo una potencia de p grande. Teniendo en cuenta la inyección j, Zp es el completado de Z, es decir, Zp es Z y todos los lı́mites de sucesiones de números enteros que a la larga sean congruentes módulo potencias de p arbitrariamente grandes. n n Por ejemplo, P∞ xn n= 10 +1 tiende a 1 en Z2 y la sucesión xn con 4xn +1 ≡ 0 (mod 5 ) tiende a n=0 5 en Z5 (ejercicio). La norma en Z induce la norma p-ádica en Zp ( 0 si x = 0 kxkp = P n p−k si x = ∞ n=k an p con ak 6= 0 Hay una aparente similitud formal entre Zp y los números reales en [0, 1) escritos en base p, sólo hay que cambiar las potencias de p−1 por potencias de p y los an desempeñan el papel de cifras. Sin embargo topológicamente reales y p-ádicos son muy diferentes. En los reales se cumple la bien conocida desigualdad triangular |a + b| ≤ |a| + |b| y en los p-ádicos algo mucho más fuerte, la desigualdad ultramétrica 1 ka + bkp ≤ máx(kakp , kbkp ). Con ésta por ejemplo dados A y B a distancia d > 0 no existe ningún punto medio M tal que su distancia a A y a B sea d/2. Las normas que satisfacen la desigualdad ultramétrica se dice que son no arquimedianas. Según [Sw] el nombre viene porque Arquı́medes escribió sobre números grandes y una norma no Arquimediana tiene la propiedad de que knk permanece acotado. Módulo pr se puede sumar, restar, multiplicar y muchas veces dividir, los únicos denominadores problemáticos son los que contienen potencias de p. Por ello Zp es un anillo y considerandos formalmente fracciones del tipo x/pm con x ∈ Zp , m ∈ N se tiene un cuerpo, éste es Qp , Qp = {a−m p−m +a−m+1 p−m+1 +a−m+2 p−m+2 +· · ·+a0 +a1 p+a2 p2 +. . . : 0 ≤ aj < p}. La norma kxkp también tiene sentido en Qp con la única diferencia de que k puede ser negativo. Al igual que en Zp es multiplicativa: kxkp kykp = kxykp . También se puede extender la inyección j de forma que j : Q ,→ Qp . Por ejemplo 1/6 ∈ Q se puede escribir como (1/3)2−1 . En Z2 se cumple que 1/3 es 1 + 21 + 23 + 25 + 27 + . . . (¡comprobarlo!) por tanto el número racional 1/6 corresponde a 2−1 + 1 + 22 + 24 + 26 + . . . La aspiración final al introducir los p-ádicos es muchas veces tratar de obtener información sobre soluciones enteras o racionales estudiando congruencias con respecto a todos los módulos. Factorizando, por el teorema chino del resto, basta considerar módulos que sean primos o potencias de primos, y como hemos visto en el primer ejemplo, a veces lo que ocurre módulo pk condiciona lo que ocurre módulo pk+1 y todas estas congruencias quedan resumidas en un número p-ádico El esquema de reflejar fielmente las soluciones enteras en soluciones p-ádicas rara vez tiene un éxito completo (lo que se llama un principio local-global ), por ejemplo, se pueden dar ecuaciones cúbicas en dos variables que no tienen soluciones en Q pero sı́ en todos los Qp (y en R). Los p-ádicos están entre lo continuo y lo discreto, por una parte se puede hacer análisis en ellos y por otra representan soluciones de congruencias con módulo variable. Vistas la aplicaciones que tienen uno podrı́a replantearse la frase incial, ¿hasta que punto son una notación o un objeto matemático con entidad propia? ¿Cuando pensamos en un número real imaginamos que es sólo una notación para una familia de sucesiones de Cauchy de racionales? Bibliografı́a: [Ca1], [Ca2], [Sw]. 2 2. Análisis armónico en grupos Las funciones de L2 (T) se analizan en términos de e(nx), las de L2 (R) con e(ξx) a través de la transformada de Fourier, las funciones definidas en (Z/qZ)∗ con los caracteres de Dirichlet, las de Z/qZ con raı́ces de la unidad a través de la transformada de Fourier discreta. Todos estos ejemplos y otros que veremos más adelante se pueden unificar desarrollando el análisis de Fourier en grupos. Aquı́ nos centraremos en el caso abeliano pero hay también una teorı́a no abeliana en la que aparecen las representaciones (véanse algunos comentarios y ejemplos en [Dy-Mc]). En primer lugar, antes de hacer análisis se necesita una topologı́a que debe ser compatible con la operación de grupo. Si (G, ∗) es el grupo abeliano a considerar, exigimos que las funciones a(x, y) = x∗y, b(x) = x−1 sean continuas con la topologı́a escogida. Además es necesaria una condición técnica y es que el espacio topológico obtenido sea localmente compacto (cada punto tiene algún entorno abierto contenido en un compacto) y Hausdorff. Con todo esto se dice que G es un grupo abeliano localmente compacto. Los grupos abelianos finitos (sumas directas de Z/qZ) quedan totalmente determinados por sus grupos de caracteres y a su vez éstos sirven para analizar todas las funciones de ellos en C. Lo que intentamos es copiar este esquema a la situación general. Cuando G es un grupo abeliano localmente compacto se dice que una función χ : G −→ {z ∈ C : |z| = 1} es un carácter si es un homomorfismo continuo. Si el grupo es finito, la única topologı́a posible es la discreta (todo es abierto) y la continuidad es superflua, con lo que se vuelve al concepto clásico de carácter. b es un grupo con el producto El conjunto de caracteres de G, denotado con G, de funciones que se puede dotar de la topologı́a llamada compacta-abierta con la que dos funciones están cercanas si su diferencia es pequeña en compactos grandes. Si G no fuera localmente compacto esta comparación de caracteres serı́a imposible porque la diferencia podrı́a no estar acotada incluso en entornos arbitrariamente pequeños. Veamos algunos ejemplos sencillos: Ejemplo 1. (R, +). Cada carácter se puede escribir como χ(x) = e(f (x)) con f continua. La condición de homomorfismo requiere χ(0) = 1 y podemos suponer f (0) = 0, además f (x) + f (y) = f (x + y). Entonces f es necesariamente lineal ([Sp], Cap.8, Ej.7). Por 3 tanto b = {χξ con χξ (x) = e(ξx), ξ ∈ R}. G Ejemplo 2. (T, +). El argumento es el mismo pero ahora ξ debe ser entero para que χ esté bien definida en T, entonces b = {χn con χn (x) = e(ξn), n ∈ Z}. G Ejemplo 3. (R+ , ·). Este ejemplo se reduce al primero notando que φ(x) = log x establece un isomorfismo φ : (R+ , ·) −→ (R, +) y los caracteres en (R+ , ·) son simplemente χξ (log x), b = {cξ con cξ (x) = xiξ , ξ ∈ R}. G Ejemplo 4. (Z/qZ, +). El grupo está generado por 1 que es de orden q, ası́ que χ(1) debe ser de la forma e(m/q) para que el orden divida a q. La propiedad de homomorfismo implica n χ(n) = χ(1) y por tanto b = {χm con χm (n) = e(mn/q), 0 ≤ m < q}. G Ejemplo 5. ((Z/pZ)∗ , ·). Se tiene el isomorfismo φ : (Z/(p − 1)Z, +) −→ ((Z/pZ)∗ , ·) que actúa como φ(n) = g n donde g es una raı́z primitiva (generador del grupo multiplicativo). Los caracteres son entonces b = {χj con χj (n) = e(j indg (n)/(p − 1)), 0 ≤ j < p − 1}, G es decir, los caracteres de Dirichlet (para módulo q = p primo) [Da] p.37. Ahora queremos definir una medida que sea compatible con la operación de grupo para poder integrar sobre él. Ésta es la llamada medida de Haar. Para ser más precisos, se dice que una medida de Radon (positiva) es una medida de Haar en un grupo abeliano localmente compacto (G, ∗) si para todo conjunto medible E se cumple µ(E) = µ(g ∗ E). En el caso de (R, +) la medida de Lebesgue es una medida de Haar y se puede entender la invariancia por traslaciones como la igualdad entre diferenciales dx = d(x − x0 ) Z Z Z µ(E) = 1 dx = 1 d(x − x0 ) = 1 dx = µ(x0 + E). E x0 +E x0 +E 4 Esta medida de Haar pasa a (T, +) por el homomorfismo natural (R, +) −→ (T, +). También (R+ , ·) hereda esta medida a través del isomorfismo φ(x) = log x, es decir, Z Z dx . µ(E) = dφ(x) = E E x La invariancia se puede ver como la identidad diferencial x−1 dx = (λx)−1 d(λx). En grupos finitos, la medida de Haar es una P trivialidad porque se tiene que cumplir µ({1}) = µ({g ∗ 1}) = µ({g}) y como g∈G µ({g}) = µ(G) estos valores no pueden ser nulos. Se tiene por tanto que cualquier medida de Haar en un grupo finito es, salvo multiplicar por una constante, la medida de contar. En general, si G es discreto (si tiene la topologı́a discreta) un argumento similar lleva a la misma conclusión. A este nivel las preguntas básicas son las siguientes: a) ¿Existe siempre una medida de Haar? b) ¿Es única? c) ¿Cómo se halla? Las dos primeras preguntas las responde un teorema que afirma que para grupos abelianos localmente compactos (de hecho también para los no abelianos) existe una medida de Haar y cualquier otra es un múltiplo suyo [Ra-Va] p.12. La demostración no es fácil pero mirando la parte de existencia desde lejos uno llega a la conclusión de que por el teorema de representación de Riesz [Ru] basta hallarPun funcional lineal invariante por el grupo. Moralmente el candidato es L[f ] = g∈G f (g ∗ x) pero esto habitualmente no tiene sentido si G no es finito y aparecen sumas finitas, aproximaciones, supremos y demás. La tercera pregunta se puede eludir con unas consideraciones filosóficas. ¿Qué es hallar una medida? Nos parece que la medida de Lebesgue es tangible y que en los ejemplos 1, 2 y 3 hemos hallado realmente la medida de Haar pero ¿cómo calculamos la medida de un conjunto? No hay ninguna forma clara. Si queremos medir el conjunto de Cantor ponemos y quitamos intervalitos usando las propiedades aditivas de la medida y que [a, b] mide b − a. Cuando nos enfrentemos a la medida de Haar en Qp o en los adeles, haremos algo parecido, sabremos la medida de algunos intervalitos (en realidad bolas) y todos los conjuntos que mediremos serán uniones de ellos. De este modo, esta medida la habremos hallado tanto o tan poco como la usual de Lebesgue. Por mucha teorı́a de la medida que sepamos, decir que el área del cı́rculo es πR2 sigue siendo una genialidad de Arquı́medes y todas nuestras σ-álgebras son inútiles porque el cı́rculo no es unión de unos pocos cuadraditos. 5 Con todo esto se puede definir una transformada de Fourier Z b f (χ) = f (x)χ(x) dµ G b Sin entrar en detalles, supondremos siempre donde µ es la medida de Haar y χ ∈ G. que f es suficientemente buena como para que no haya problemas con la convergencia de las integrales. el gran teorema es que se comporta como la transformada de Fourier de siempre, es decir, que para f con regularidad suficiente se cumple la fórmula de inversión Z fb(χ)χ(x) dν f (x) = C b G b y C es una constante que normalizando adecuadonde ν es la medida de Haar en G damente las medidas µ y ν se puede escoger como 1. b es discreto y por Todavı́a hay más, si G es compacto, se puede probar que G tanto la integral anterior es una suma (la medida es la de contar). Veamos lo que quiere decir esto en los ejemplos anteriores. Ejemplo 1. Como ya hemos observado, dµ = dx es la medida de Lebesgue. Por otro lado la b dada por φ(ξ) = χξ es claramente un isomorfismo, y también aplicación φ : R −→ G un homomorfismo (ξ1 y ξ2 cercanos ⇒ χξ1 y χξ2 cercanos) por tanto la medida de Haar es la inducida por la de Lebesgue. Se tiene entonces la fórmula de inversión de toda la vida: Z Z fb(ξ)e(xξ) dξ fb(ξ) = f (x)e(−ξx) dx, f (x) = C R R b con R. Es fácil ver que (por ejemplo eligiendo como f donde se ha identificado G una gaussiana) C = 1. Ejemplo 2. b como antes es Z en lugar de R. Como Z Ahora el grupo que “parametriza” G es discreto, la medida es la de contar (esto es consecuencia de que T es compacto). Por tanto Z X fb(n) = f (x)e(−nx) dx, f (x) = C fb(n)e(nx). T n∈Z De nuevo C = 1 y se tiene el análisis armónico clásico para funciones 1-periódicas. 6 Ejemplo 3. El isomorfismo (R+ , ·) ∼ = (R, +) permite repetir el primer ejemplo cambiando lo que hay que cambiar, llegándose a Z Z −iξ dx b , f (x) = C fb(ξ)xiξ dξ f (ξ) = f (x)x + x R R Esto parece nuevo, pero si escribimos s = −iξ veremos que esconde un viejo conocido: la transformada de Mellin. La constante es C = 1/2π en este caso. Ejemplo 4. b es la discreta por ser grupos finitos y por tanto µ y ν son La topologı́a de G y G las medidas de contar. Se sigue fb(m) = q−1 X f (n)e(−nm/q), f (n) = C n=0 q−1 X fb(m)e(nm/q). m=0 Ésta es la transformada de Fourier discreta y es fácil ver que C = 1/q (basta tomar f ≡ 1, entonces fb(0) = q y se anula en el resto). Ejemplo 5. Es similar al ejemplo anterior, fb(j) = p−1 X f (n)χj (n), f (n) = C n=1 p−2 X fb(j)χj (n). j=0 Nótese que ésta fórmula se puede demostrar a partir de las relaciones de ortogonalidad. Como antes, se tiene C = 1/(p − 1). Bibliografı́a: [Ka] (sólo una brevı́sima introducción), [Ra-Va]. 3. Ejercicios de análisis en los p-ádicos Al ser Qp un cuerpo, hay dos tipos de grupos que se pueden considerar, el aditivo y el multiplicativo. Sólo describiremos el grupo de caracteres del primero a pesar de que en la tesis de Tate aparecen algunos caracteres multiplicativos sencillos (¿se pueden describir fácilmente todos? quizá el comentario acerca de Jbk en [Sw] p.128 sugiera que no). El procedimiento será “artesanal” sin emplear apenas ninguna maquinaria teórica. Sea χ un carácter en (Qp , +). Supongamos primero que χ(1) = 1, entonces por la propiedad de homomorfismo χ(pn ) = 1 para n ∈ N, ası́ pues, para cualquier x = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 + a0 + a1 p + a2 p2 + . . . 7 se tiene χ(x) = χ(λ(x)) donde λ(x) es la “parte fraccionaria” de x, λ(x) = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 . Como 1 = p−1 + p .veces . . + p−1 entonces 1 = (χ(p−1 ))p , es decir, χ(p−1 ) es una raı́z p-ésima de la unidad, digamos χ(p−1 ) = e(x0 /p), 0 ≤ x0 < p. De la misma forma debe cumplirse χ(p−2 ) = e(x1 /p2 ) con 0 ≤ x1 < p2 , y para preservar la relación χ(p−1 ) = (χ(p−2 ))p es necesario x1 ≡ x0 (mod p). En general χ(p−k−1 ) = e(xk /pk+1 ) con xk ≡ xk−1 (mod pk ). Esta sucesión P x0 , x1 , x2 , . . . determina un entero p-ádico ξ = b0 + b1 p1 + b2 p2 + . . . con xk = kr=0 br pr y por tanto χ(p−k−1 ) = e(λ(ξ/pk+1 )). De aquı́ se deduce que cualquier carácter con χ(1) = 1 es de la forma χ(x) = e(λ(ξx)). ¿Y si χ(1) 6= 1? Siempre χ(1) debe ser una raı́z pr -ésima de la unidad, porque pn → 0 en Qp cuando n → ∞, implica por la continuidad de los caracteres que n χ(1))p → 1 en C. Si es una raı́z pr -ésima de la unidad, χ(pr ) = 1 y el mismo argumento se puede aplicar salvo que ahora hay ı́ndices desplazados r unidades: χ(pr−1 ) = e(x0 /p), χ(pr−2 ) = e(x1 /p2 ), etc. lo que se refleja en que pr ξ ∈ Zp . En definitiva, los caracteres son los mismos que hemos hallado pero ahora ξ puede estar en Qp , no necesariamente en Zp . Con sı́mbolos: b p = {χξ con χξ = e(λ(ξx)), ξ ∈ Qp }. Q b p ya La aplicación ξ 7→ χξ da un isomorfismo de Qp en su grupo de caracteres Q que χξ+η = χξ χη . Se prueba que también es un homeomorfismo y en este sentido Qp es su propio grupo de caracteres. Estudiemos ahora las propiedades de la medida de Haar µ. al ser Zp compacto en Qp (ejercicio) su medida debe ser finita (por definición de medida de Radon) y por tanto se puede normalizar µ de forma que µ(Zp ) = 1. Nótese que Zp = {x ∈ Qp : kxkp ≤ 1} y la propiedad caracterı́stica de la medida de Haar implica que todas las bolas cerradas de radio 1 también miden uno (son trasladados de Zp ). Calculemos ahora la medida del resto de las bolas cerradas. Por supuesto basta considerar las de radio r = p−k , k ∈ Z. Si por ejemplo k = 1, p−1 Zp = [ p−1 1 2 {a0 + a1 p + a2 p + . . . } = a0 =0 [ {x ∈ Qp : kx − a0 kp ≤ p−1 } a0 =0 8 y teniendo en cuenta la invariancia por traslaciones, 1 = pµ({x ∈ Qp : kxkp ≤ p−1 }) ⇒ µ({x ∈ Qp : kxkp ≤ p−1 }) = p−1 . Para k = −1, p−1 [ {x ∈ Qp : kxkp ≤ p} = {x ∈ Qp : kx − a−1 =0 a−1 kp ≤ 1} p de donde µ({x ∈ Qp : kxkp ≤ p}) = p. Con otros exponentes se razona de forma análoga y se tiene en general que la medida de una bola cerrada B r de radio r es para r = p−k , k ∈ Z. µ(B r ) = r e(E) = µ(αE) define otra medida de Haar Dado α ∈ Q∗p = Qp − {0}, claramente µ en Qp y por la unicidad debe cumplirse µ e = λα µ. Por el cálculo hecho con las bolas cerradas, se cumple λα = kαkp . Se puede entender esto como la fórmula de cambio de variable para cambios lineales: dµ(αx) = kαkp dµ(x). Esto implica que Z ∗ µ (E) = λ E dµ(x) kxkp define una medida de Haar en el grupo multiplicativo (Q∗p , ·) para cada λ ∈ R+ . Esta medida se suele normalizar de forma que Z∗p (los elementos invertibles en Zp , esto es, los que cumplen kxkp = 1) midan uno, lo cual requiere λ = p/(p − 1). Veamos el cálculo como ejemplo: Z Z dµ(x) ∗ ∗ −1 µ (Zp ) = 1 ⇔ λ = = dµ(x) = µ(Z∗p ). kxk ∗ ∗ p Zp Zp Con la descomposición Zp = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . y la fórmula de cambio de variables antes mencionada, 1 = µ(Zp ) = ∞ X µ(p k k=0 Z∗p ) = µ(Z∗p ) ∞ X k=0 y entonces λ = (1 − p−1 )−1 . 9 p−k Volviendo al caso aditivo, comprobemos que la fórmula de inversión se cumple con constante C = 1, es decir, Z Z f (x)e(−λ(ξx)) dµ(x), f (x) = fb(ξ)e(λ(xξ)) dµ(ξ). fb(ξ) = Qp Qp Para la prueba de que la constante es 1 basta verificar esta fórmula para alguna función (no idénticamente nula). Tomaremos ( 1 si x ∈ Zp f (x) = 0 si x 6∈ Zp que es relevante en la tesis de Tate. De la igualdad Z Z b e(−λ(ξx)) dµ(x) = f (ξ) = e(−λ(λ(ξ)x)) dµ(x) = fb(λ(ξ)) Zp Zp se deduce fb(ξ) = fb(0) = 1 para ξ ∈ Zp . En el resto de los casos basta considerar ξ = m/pk con p 6 |m, k ∈ Z+ . Se tiene fb(m/pk ) = Z e(−λ(mx/pk )) dµ(x) = Zp pk −1 Z X e(−λ(mx/pk )) dµ(x). n+pk Zp n=0 Con la traslación x 7→ x − n y el cambio x 7→ pk x esto es igual a pk −1 X k pk −1 Z k e(−mn/p ) e(−λ(mx/p )) dµ(x) = p k Zp n=0 X k Z e(−mn/p ) p−k dµ(x) Zp n=0 que se anula por ser suma de las raı́ces de la unidad. Con ello hemos probado fe(ξ) = f (ξ) y por tanto la constante en la fórmula de inversión es 1. Para terminar creando un poco de intriga, calculemos la llamada “función zeta local” correspondiente a Qp , que se define como Z Zp (s) = kxksp dµ∗ (x). Zp −{0} Por la descomposición ya empleada Zp − {0} = Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . se sigue Z ∞ Z ∞ X X s ∗ −ks Zp (s) = kxkp dµ (x) = p dµ∗ (x) = k=0 ∞ X k=0 pk Z∗p k=0 p−ks µ∗ (pk Z∗p ) = ∞ X k=0 10 pk Z∗p p−ks µ∗ (Z∗p ) = (1 − p−s )−1 . Entonces la función zeta local es justo el trozo de la función zeta de Riemann que corresponde al primo p. Bibliografı́a: [Ca-Fr], [Ra-Va], [Ro], [Sw]. Referencias [Ca1] J.W.S. Cassels. Diophantine equations with special reference to elliptic curves. J. London Math. Soc. 41 1966 193–291. [Ca2] J.W.S. Cassels. Lectures on elliptic curves. London Mathematical Society Student Texts, 24. Cambridge University Press, Cambridge, 1991. [Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic Press, London; Thompson Book Co., Inc., Washington, D.C. 1967. [Da] H. Davenport. Multiplicative number theory. Graduate texts in Mathematics 74. Springer-Verlag, New York-Berlin, 1980. [Dy-Mc] H. Dym, H.P. McKean. Fourier series and integrals. Academic Press, New York-London, 1972. [Ka] Y. Katznelson. An introduction to harmonic analysis. Dover Publications, Inc., New York, 1976. [Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999. [Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145. [Ru] W. Rudin. Análisis real y complejo McGraw-Hill, 1987. [Sp] M. Spivak. Calculus. Reverté. Barcelona 1984. [Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001. 11 La tesis de Tate II En vez de estudiar directamente la generalización de los p-ádicos en cualquier cuerpo de números nos centraremos en Q(i). Hay dos particularidades que hacen que sea más sencillo. La primera es que su grado sobre Q es pequeño y la segunda, la más importante, es que su anillo de enteros Z[i] es un dominio de factorización única, por lo cual se puede hablar sin peligro de números primos. La razón para detenernos en este ejemplo es poder practicar con algunos cálculos explı́citos. Dentro de la teorı́a, Q(i) no tiene ningún papel destacado y sacrificando los ejemplos, todo lo que se cuenta aquı́ se podrı́a englobar en un marco general condensado en pocas páginas [Ca-Fr], [Sw]. 1. p-ádicos gaussianos Un entero p-ádico quedaba determinado por una sucesión de enteros x1 , x2 , x3 , . . . tales que xn ≡ xn+1 (mod pn ). Se pueden escoger aj pertenecientes a un sistema completo de restos módulo 0 ≤ aj < p, tales que x1 ≡ a0 (mod p) e P p, digamos j n inductivamente (xn+1 − j<n aj p )/p ≡ an (mod p) lo que conduce a la representaP ción del entero p-ádico como una serie aj pj . No hay ninguna dificultad para P copiar esto en Z[i] y dado un primo gaussiano π definir los “enteros π-ádicos” j≥0 aj π j donde los aj pertenecen a un sistema completo de restos módulo π, es decir, a un conjunto de representantes de las clases de Z[i]/hπi. Un entero positivo adquiere una representación p-ádica finita sin más que escribirlo en base p, como a0 + a1 p + a2 p2 + · · · + ak pk . En general se tiene una inyección j : Z ,→ Zp donde los negativos tienen representaciónes infinitas. Por ejemplo en Z2 , −100 = 28 − 27 = 22 + 23 + 24 − 27 = 22 + 23 + 24 + 27 + 28 + 29 + 210 + 211 + . . . P j donde se ha usado la identidad 2-ádica −1 = ∞ j=0 2 que harı́a las delicias de Euler P (nótese que d(−1, j<n 2j ) = 2−n , ejercicio). De la misma forma hay una inyección j : Z[i] ,→ Zπ [i] donde Zπ [i] son los enteros π-ádicos antes definidos. Por ejemplo, si π = 2+ i se tiene Z[i]/h2 + ii = {0, 1, 2, i, 1 + i}. Podemos utilizar estos números como coeficientes para tratar de escribir un entero gaussiano en base π. Hay números que, como antes los positivos, tendrán representaciones finitas mientras que para otros serán infinitas. El proceso es algorı́tmico, esencialmente divisiones sucesivas permitiendo sólo los restos 0, 1, 2, i, 1 + i. Ası́ para escribir la expresión 1 π-ádica de 100 se puede seguir el esquema: 100 = (40 − 20i)π + 0 40 − 20i = (12 − 16i)π + 0 12 − 16i = (1 − 9i)π + 1 + i 1 − 9i = (−2 − 4i)π + 1 + i −2 − 4i = (−2 − i)π + 1 −2 − i = (−1)π + 0 → → → → → → 100 = (40 − 20i)π 100 = (12 − 16i)π 2 100 = (1 + i)π 2 + (1 − 9i)π 3 100 = (1 + i)π 2 + (1 + i)π 3 + (−2 − 4i)π 4 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (−2 − i)π 5 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 − π 6 Se podrı́a seguir dividiendo −1 por π, con P∞−1 j= (−1)π + 1 + i, o bien utilizar directamente la identidad −1 = (1 + i) j=0 π (ejercicio), en cualquier caso se concluye 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (1 + i)π 6 + (1 + i)π 7 + (1 + i)π 8 + . . . Enseguida veremos una pequeña sorpresa por la que los π-ádicos tienen representaciones mucho más sencillas de lo que sugiere el ejemplo anterior. Al igual que en Z, cada primo gaussiano π da lugar a una norma multiplicativa en Z[i], kzkπ = (π · π)−k si π k ||z y k0kπ = 0. La introducción del conjugado π asegura la positividad. Hay una distancia asociada a esta norma y Zπ [i], que más propiamente deberı́a escribirse como (Z[i])π , es el completado de Z[i] con ella. Considerando el cuerpo de fracciones de Zπ [i] o completando P Q(i), se jobtiene el cuerpo Qπ (i), cuyos elementos se pueden escribir como series j≥−m aj π con los aj como antes. Estudiaremos ahora con un poco más de detalle cuáles son estos cuerpos, para ello hay que recordar que los primos gaussianos son, salvo primos asociados, exactamente los descritos en los tres puntos siguientes, donde p representa a un primo racional (p ∈ Z): 1) 2) 3) p ≡ 3 (mod 4) π ∈ Z[i] con ππ = p ≡ 1 (mod 4) 1+i En el primer caso Z[i]/ < p >= Fp [i] = {a + ib : 0 ≤ a, b < p} y todos los elementos de Qp (i) son de la forma X (aj + bj i)pn = α + iβ j≥−m 2 con α, β ∈ Qp . Nótese que i = en este caso √ −1 6∈ Qp porque −1 no es residuo cuadrático módulo p. Entonces Qp (i) = {α + iβ : α, β ∈ Qp } y [Qp (i) : Qp ] = 2. En el segundo caso Z[i]/ < π > sólo tiene p elementos, la norma de π. De la igualdad p = π · π está claro que Qp está incluido en Qπ (i). En este caso −1 es residuo cuadrático módulo p y x2 ≡ −1 (mod √ p) tiene dos soluciones que pueden elevarse a soluciones p-ádicas, entonces i = −1 y π = a + bi están realmente en Qp y lo mismo ocurre con todas las expresiones π-ádicas finitas de Qπ (i). Por la compleción y doble inclusión se sigue Qπ (i) = Qp . Es instructivo ver las cuentas en un caso sencillo: si p = 5 y π = 2 + i, según se calculó en la primera parte, 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . es una solución en Q5 de x2 = −1, por tanto este número 5-ádico es i o −i y {π, π} = {α, β} con α = 4 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . − β = 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . De kπkπ = 1 (porque 2 + i no divide a 2 − i) se deduce β 6= π, ası́ que π = β y 2 3 −i + . . . Con esto se puede transformar una serie del tipo P = 2j + 1 · 5 + 2 · 5 + 1 · 5 P aj π en otra de la forma bj 5j con 0 ≤ bj < 5. El último caso tiene particularidades de los dos anteriores, por un lado 2 = (1 + i)(1 − i) pero a diferencia del análisis anterior, 1 + i y 1 − i no son coprimos, k1 − ik1+i = 2−1 porque 1 − i = (−i)(1 + i) ası́ que no se puede proceder de la misma forma. De hecho i 6∈ Q2 porque x2 ≡ −1 (mod 4) no tiene solución. Entonces Q1+i (i) = {α + iβ : α, β ∈ Q2 } y [Q1+i (i) : Q2 ] = 2 como en el primer caso. Si uno lo prefiere puede ver la igualdad anterior explı́citamente a través de (1 + i)2k = ik 2k y (1 + i)2k+1 = (ik + ik+1 )2k . 2. Caracteres y transformadas de Fourier Si p ≡ 3 (mod 4), como grupo aditivo (y también como espacio vectorial sobre Qp ) se tiene Qp (i) ∼ = Qp ⊕ Qp con el isomorfismo canónico α + iβ 7→ (α, β), que es homeomorfismo cuando se incorpora la topologı́a. Esto implica que los caracteres de Qp (i) son productos de caracteres de Qp , es decir, [ Q p (i) = ψη1 η2 con ψη1 η2 (α + iβ) = e(λ(η1 α) + λ(η2 β)), 3 η1 , η2 ∈ Qp donde λ indica la “parte fraccionaria” de la anterior entrega. Lo mismo ocurre en Q1+i (i). Por otro lado hemos visto que Qπ (i) = Qp cuando π · π = p ≡ 1 (mod 4) y entonces en este caso los caracteres son ψξ (x) = e(λ(ξx)). Si en el primer caso que hemos analizado se escribe ξ = (η1 − iη2 )/2, para x = α+iβ ∈ Qp (i) se tiene ψη1 η2 (x) = e(2λ(<(ξx))). Este dos artificial causará algún problema más adelante con la normalización de la medida de Haar pero permite la siguiente descripción de los caracteres en todos los casos que es generalizable a otros cuerpos de números. Para cualquier primo gaussiano π, se tiene \ Q π (i) = ψξ con ψξ (x) = e(λ(TrQ π (i)/Qp (ξx))), ξ ∈ Qπ (i) . Aquı́ Tr denota la traza, la suma de todos los conjugados. Sin entrar en tecnicismos, TrQ (i)/Q (1) = [Qπ (i) : Qp ], y si i 6∈ Qp , TrQ (i)/Q (i) = 0, además la traza es π p π p Qp -lineal. Se cumple que ξ 7→ ψξ establece, como en el caso de Q un isomorfismo y homeomorfismo entre el grupo localmente compacto Qπ (i) y su grupo de caracteres. Pasemos ahora a algunas consideraciones sobre la medida de Haar y a algunos cálculos con la transformada de Fourier. La normalización natural de la medida de Haar es µ(Zπ [i]) = 1 pero siguiendo a Tate es conveniente hacer un ligero cambio para obtener fórmulas más simétricas (véase el comentario en p.124 (v) de [Sw]). Independientemente de la normalización se cumple dµ(αx) = kαkπ dµ(x). Esta fórmula se podrı́a haber usado para elegir la definición de kαkπ entre diferentes posibilidades de normas multiplicativas. Por ejemplo, para π = p ≡ 3 (mod 4) puede parecer poco natural kpkp = p−2 en vez de p−1 , como en Z, pero es necesaria para respetar la anterior porque una bola cerrada de radio 1 es unión de p2 bolas unidad disjuntas dilatadas multiplicando por p p−1 p−1 {x ∈ Qp (i) : kxkp ≤ 1} = Zp [i] = [ [ a0 =0 b0 =0 x − (a0 + b0 i) ≤1 . x ∈ Qp (i) : p p Esto y la unicidad de la medida de Haar es suficente, como en la primera parte, para demostrar que kαkπ es la constante correcta en este caso en el cambio de variables de medidas. El resto de los casos es análogo. Sea f la función caracterı́stica de Zπ [i] ( 1 si x ∈ Zπ [i] f (x) = 0 si x ∈ 6 Zπ [i] 4 Calculemos su transformada de Fourier bajo la normalización µ(Zπ [i]) = 1 que después modificaremos ligeramente. Si π · π = p ≡ 1 (mod 4), Zπ [i] = Zp y como habı́amos visto en la primera parte, b f = f. Si π = p ≡ 3 (mod 4) no hay gran diferencia en el argumento debido a que Qπ (i) ∼ = Qp ⊕ Qp permite descomponer la integral que define fb en producto de dos integrales (una por cada coordenada) y cada una de ellas se anula si y sólo si la parte real o imaginaria de ξ no están en Zp . Entonces en este caso también se tiene fb = f . La salvedad aparece para π = 1 + i porque en este caso ψξ es trivial en Z1+i [i] si y sólo si 2ξ ∈ Z1+i [i]. Esto es muy sencillo de comprobar explı́citamente, ya que x = α + iβ, ξ = ξ1 + iξ2 ⇒ TrQ Q2 (ξx) = (2ξ1 )α − (2ξ2 )β. 1+i (i)/ Entonces el mismo argumento esbozado antes produce, suponiendo µ(Z1+i [i]) = 1, ( 1 si ξ ∈ 2−1 Z1+i [i] fb(ξ) = 0 si ξ 6∈ 2−1 Z1+i [i] La fórmula de inversión implica f = c(fb)b y la constante no es uno como en los casos anteriores (en los que fb = f ). Para hallarla, basta comparar f (0) = 1 con Z b b (f ) (0) = fb(ξ) dµ(ξ) = µ(Z1+i [i]) = k2−1 k1+i = 4. Entonces c = 1/4. Si se quiere unificar la fórmula de inversión para que no dependa del primo gaussiano, lo cual es muy conveniente, hay que redefinir el valor de µ(Z1+i [i]) asignándole convencionalmente el valor 1/2, con ello ( 1/2 si ξ ∈ 2−1 Z1+i [i] fb(ξ) = 0 si ξ 6∈ 2−1 Z1+i [i] y (fb)b(0) = 21 µ(2−1 Z1+i [i]) = 1 y por tanto la constante en la fórmula de inversión es uno. En resumen, conveniendo ( 1 si π · π 6= 2 µ(Z1+i [i]) = 1/2 si π · π = 2 se cumple Z f (x) = Z fb(ξ)ψ(xξ) dξ donde Qπ (i) f (x)ψ(ξx) dx fb(ξ) = Qπ (i) 5 para f suficientemente regular y ψ(t) = e TrQ (i)/Q (t) , con π|p. π p La medida de Haar µ∗ en el grupo multiplicativo de Qπ (i) es dµ∗ (x) = c dµ(x) kxkπ para c una constante positiva (basta ver que el lado derecho es invariante por multiplicaciones). Esta medida se suele normalizar de forma que µ∗ (Z∗π [i]) = 1 donde Z∗π [i] indica las unidades de Zπ [i], los que tienen inverso en este mismo anillo. El cálculo de normalización c que corresponde a este convenio es similar al de la primera parte y se basa en las descomposiciones Zπ [i] = {0} ∪ Z∗p [i] ∪ pZ∗p [i] ∪ p2 Z∗p [i] ∪ . . . Zπ [i] = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . Zπ [i] = {0} ∪ Z∗π [i] ∪ πZ∗π [i] ∪π 2 Z∗π [i] si π = p ≡ 3 (mod 4) si π · π = p ≡ 1 (mod 4) ∪ ... si π · π = 2. Por ejemplo, en el primer caso da lugar a 1= ∞ X µ(p k Z∗p [i]) = µ(Z∗p [i]) ∞ X p−2k k=0 k=0 que junto con 1 = cµ(Z∗π [i]) lleva a c = (1 − p−2 )−1 . En general  −2 −1  si π = p ≡ 3 (mod 4) (1 − p ) c = (1 − p−1 )−1 si π · π = p ≡ 1 (mod 4)   −1 −1 2(1 − 2 ) si π · π = 2 Las descomposiciones anteriores también permiten calcular la llamada “función zeta local” Z Zπ (s) = kxksπ dµ∗ (x). Zπ [i]−{0} Con ellas se tiene  −2s −1  (1 − p ) Zπ (s) = (1 − p−s )−1   (1 − 2−s )−1 si π = p ≡ 3 (mod 4) si π · π = p ≡ 1 (mod 4) si π · π = 2 6 De nuevo el producto de las funciones zeta locales es conocido: (1 − 2−s )−1 Y (1 − p−2s )−1 Y Y −1 X (1 − p−s )−2 = 1 − (ππ)−s = p≡1 p≡3 π I 1 N (I)s donde I recorre los ideales no nulos de Z[i] y N (I) es su norma. Ésta es la función ζ de Dedekind. Expresiones todavı́a más familiares son ∞ X I 1 1 X r(n) = ζ(s)L(s, χ ) = 4 N (I)s 4 n=1 ns donde χ4 es el carácter no principal módulo 4 y r(n) es el número de representaciones como suma de dos cuadrados. 3. Adeles e ideles Tanto en Q como en Q(i) hemos introducido normas multiplicativas asociadas a cada primo. En general en un cuerpo K se dice que k · k : K −→ R es una valoración si kxk > 0 para x 6= 0, k0k = 0 y se cumple kxyk = kxk · kyk, kx + ykα ≤ kxkα + kykα para alguna constante α > 0. Una valoración da lugar a una distancia d(x, y) = kx − ykα y con ella a una topologı́a métrica sobre K. Todas las potencias positivas de una valoración correponden a la misma distancia, se dice que estas valoraciones son equivalentes y que determinan un lugar (¿sitio?, en inglés place). Todo esto no es más que poner nombres a lo que ya sabı́amos. El teorema de Ostrowski afina un poco más [Ra-Va] p.158 y dice que en Q las únicas valoraciones salvo equivalencias (esto es, lugares) son las k · kp y el valor absoluto de toda la vida. Se dice que este último corresponde al lugar del infinito o al primo del infinito y a veces se denota con k · k∞ . La topologı́a inducida es la usual y el completado con respecto a esta norma es Q∞ = R (por definición de los números reales [Sp]). En Q(i) se tiene algo similar (Lemas 16 y 17 de [Sw]) pero el lugar del infinito queda representado por kzk∞ = zz y el completado es en este caso Q∞ (i) = C. Vemos que en Q y en Q(i) todos los lugares corresponden a valoraciones no arquimedianas excepto una, k · k∞ . En otros cuerpos de números hay más pero siempre un número finito. En Q y Q(i) las valoraciones elegidas para representar los lugares tienen además la propiedad especial dµ(αx) = kαk dµ(x) 7 donde µ es la medida de Haar. Esto ya lo hemos probado excepto para k · k = k · k∞ (ejercicio sencillo). Todas estas valoraciones no son independientes sino que están ligadas por las fórmulas producto en Q y Q(i) Y Y kxk∞ kxkp = 1 y kzk∞ kzkπ = 1 p π para cualesquiera x ∈ Q, z ∈ Q(i) no nulos. Los adeles (¿adèles?) son el espacio básico en el que desarrollar el análisis armónico en todos los lugares simultáneamente permitiendo combinar información de ellos. Por ejemplo, a partir de la propiedad f = fb que tiene la propiedad caracterı́stica de Zp se podrá obtener la ecuación funcional de la función ζ de Riemann. Lo mismo ocurrirá con la ζ de Dedekind en Z[i]. Además el fallo de la relación f = fb cuando π = 1 + i explicará un factor nuevo en la ecuación funcional. Los adeles constituyen, por tanto, un marco en el que tratar el paso de local a global. En palabras de [Ro] p.140 “En cierto sentido, se pueden comparar los adeles en aritmética con los haces en geometrı́a analı́tica, a condición de reemplazar la cohomologı́a de haces por el análisis”. A pesar de toda esta propaganda la definición del conjunto de adeles que denotaremos con A, no es complicada. En Q es el conjunto formado por “vectores infinitos” x = (x0 , x1 , x2 , . . . ) de Q∞ × Q2 × Q3 × Q5 × . . . (recuérdese que Q∞ = R) tales que kxj kpj ≤ 1 para todo j ≥ 1 salvo un número finito de excepciones. Esto significa que x0 ∈ R y xj ∈ Zpj , j ≥ 1, excepto para una cantidad finita de valores de j. En Q(i) la definición es similar salvo que ahora las valoraciones no arquimedianas están asociadas a primos gaussianos, ası́ A ⊂ Q∞ (i) × Qπ1 (i) × Qπ2 (i) × Qπ3 (i) × . . . En general, dado un cuerpo de números K siempre hay una cantidad numerable de lugares y sólo un número finito de ellos corresponden a valoraciones arquimedianas (a “primos del infinito”). Si se denotan por K0 , K1 , K2 , . . . los cuerpos completados con respecto a cada uno de los lugares, entonces A es el subconjunto de K0 × K1 × K2 × . . . formado por los vectores infinitos x con kxj kj ≤ 1 excepto para una cantidad finita de ı́ndices. Operando coordenada a coordenada A adquiere una estructura de anillo. El conjunto de ideles (¿idèles?), que denotaremos con I, es el grupo multiplicativo formado por las unidades A∗ , es decir, son vectores infinitos x de coordenadas no nulas tales que kxj kj = 1 salvo para una cantidad finita de ı́ndices j. Hay una inyección natural de K en el conjunto de adeles K −→ A x 7→ (x, x, x, . . . ) 8 que aplica K ∗ = K − {0} dentro de I. Por ejemplo, en Q la imagen de x = 33/100 está en A porque kxk2 = 4, kxk5 = 25 y para el resto de los primos kxkp ≤ 1 porque no dividen al denominador. De hecho kxk3 = 3−1 , kxk11 = 11−1 y kxkp = 1 si p 6= 2, 3, 5, 11 (además para “p = ∞”, kxk∞ = 00 33), entonces la imagen de x está en I. La norma Y kxk = kxj kj j está bien definida en I, pues en el producto casi todos los factores son unos, y por la fórmula producto, que se cumple en general, K ∗ está dentro del núcleo del homomorfismo I −→ (R∗ , ·) que define esta norma. El objetivo es hacer análisis armónico en A y en I, para lo cual no basta con una descripción conjuntista o algebraica, es necesaria una topologı́a. En cada coordenada de A se tiene una topologı́a Tj inducida por una valoración k · kj . Se toma en A la topologı́a generada por la base de abiertos {U0 × U1 × U2 × . . . } donde para todas las valoraciones arquimedianas y un número finito de las no arquimedianas Uj ∈ Tj mientras que en el resto de los casos Uj = {x : kxkj ≤ 1}. La topologı́a en I es similar pero ahora en casi todos los casos Uj = {x : kxkj = 1}. Un comentario un poco técnico, pero nada profundo, es que a pesar de que I ⊂ A como conjuntos, no es ası́ como espacios topológicos. Es decir, la topologı́a en I no es la topologı́a relativa inducida por la de A (hay un ejemplo en la p.50 de [Sw]). Todo este lı́o topológico, desde el punto de vista del análisis armónico se reflejará en que los caracteres de A son productos de los caractares de cada coordenada, eligiendo todos triviales excepto un número finito de ellos. Además las medidas de Haar en A y en I son el producto de las medidas de Haar (aditivas y multiplicativas respectivamente). Las demostraciones detalladas están en [Ra-Va] §5.1. La idea subyacente es que al limitar mucho los abiertos reduciéndolos en casi todas las coordenadas a uno no trivial, limitamos mucho la posibilidad de funciones regulares no constantes en cada coordenada. El concepto topológico y algebraico natural para extasiarse con estas demostraciones, que ya aparece en el original de Tate [Ca-Fr], es el de producto directo restringido. Analicemos con más detalle la estructura del conjunto de caracteresQen A. Si el cuerpo de base s Q, los caracteres en A serán de la forma e(ξ0 x0 ) e(λ(ξj xj )) con casi todos los términos del producto iguales a uno, lo cual está asegurado si casi todo ξj ∈ Zpj . Esto permite asignar a cada (ξ0 , ξ1 , ξ2 , . . . ) ∈ A un carácter y para que esta asignación tenga cierta buena propiedad que veremos a continuación es conveniente cambiar el signo de ξ0 . Es decir, a ξ = (ξ0 , ξ1 , ξ2 , . . . ) ∈ A se le asigna el carácter Y ψξ (x) = e(−ξ0 x0 ) e(λ(ξj xj )). j 9 b y la buena propiedad a la La aplicación ξ 7→ ψξ muestra que A es isomorfo a A que nos hemos referido es que ψ1 valga uno en Q (considerado como subconjunto de A) donde 1 = (1, 1, 1, . . . ). Por ejemplo, si x = (7/6, 7/6, 7/6, . . . ) entonces λ(7/6) = 1/2 para p = 2, λ(7/6) = 2/3 para p = 3 y λ(7/6) = 0 en el resto de los casos, y se tiene ψ1 (x) = e(−7/6 + 1/2 + 2/3) = 1. El caso general es un sencillo cálculo con congruencias (ejercicio). En Q(i), teniendo en cuenta que C = R⊕R, el carácter de la primera coordenada de A (correspondiente a C) deberı́a escribirse como χ(x10 + ix20 i) = e(ξ01 x10 + iξ02 x20 ) pero de nuevo para preservar la buena propiedad ψ1 = 1 (y un poco más en este caso), se introduce un coeficiente 2 y se cambia un signo. Aquı́ la simetrı́a es más patente porque se pueden escribir todos los factores de ψξ en términos de la traza: Y ψξ (x) = e(−TrC/Q (ξ0 x0 )) e λ(TrQ (i)/Q (ξj xj )) . p πj p j Nótese que TrC/Q (ξ01 + iξ02 )(x10 + ix20 ) = 2ξ01 x10 − 2ξ02 x20 . p Los caracteres en A permiten definir la transformada de Fourier. Dada una función de la forma F : A −→ C ∞ Y (x0 , x1 , x2 , . . . ) 7→ fj (xj ) j=0 en el caso de Q su transformada de Fourier es Z ∞ Z Y fj (xj )e(−λ(ξj xj )) dµj (xj ), Fb(ξ) = F (x)ψξ (x) dµ(x) = fe0 (x0 ) j=1 Qpj donde fe0 (x0 ) = fb0 (−x0 ) con fb0 la transformada de Fourier clásica. Los factores en el producto son las transformadas de Fourier p-ádicas. Estos dos tipos de transformadas cumplen la fórmula de inversión con constante 1 y el cambio fe0 ↔ fb0 no modifica esta propiedad (el cambio de signo es involutivo). Por tanto Fb también satisface la fórmula de inversión con constante 1. Un comentario adyacente respecto a la regularidad es que la existencia de Fb queda asegurada exigiendo que f0 sea de decaimiento rápido (de la clase de Schwartz) y que el resto de las fj tengan soporte compacto en Qpj y de hecho que salvo un número finito sean la función caracterı́stica de Zpj . Con ello el producto infinito acaba siendo un producto de unos (véase la primera parte). Las funciones con tal regularidad se dice que están en la clase (adélica) de Schwartz-Bruhat. Condiciones tan férreas no debieran sorprender mucho dado lo poco fina que es la topologı́a en A en comparación con la topologı́a producto. 10 En Q(i) el convenio sobre la medida de Haar en el caso especial π = 1 + i nos permitió salvar la fórmula de inversión con constante 1 para los lugares no arquimedianos, pero ahora el primo del infinito requiere unas consideraciones más cuidadosas que en Q. Si ξ0 = ξ01 + iξ02 , x0 = x10 + ix20 entonces la transformada de Fourier asociada al carácter e(−TrC/Q (ξ0 x0 )) p Z ∞ Z ∞ T f0 (ξ0 ) = −∞ −∞ f0 (x0 )e(TrC/Q (ξ0 x0 )) dx10 dx20 p no satisface la fórmula de inversión con constante 1 sino con constante 4 (ejercicio). Para subsanar esta anomalı́a es obligado reemplazar la medida de Haar natural de C, dx10 dx20 (el área), por su doble dµ0 (x0 ) = 2dx10 dx20 , con ello Z e f0 (ξ0 ) = f0 (x0 )e(TrC/Q (ξ0 x0 )) dµ0 (x0 ) p C es la transformada de Fourier buena en C (en la p.129 de [Sw] aparentemente hay una errata). Para F como antes, en el caso de Q(i) la transformada de Fourier en A es Z b F (ξ) = F (x)ψξ (x) dµ(x) ∞ Z Y e fj (xj )e − λ(TrQ (i)/Q (ξj xj )) dµj (xj ). = f0 (x0 ) πj p j=1 Qπj (i) Una de las buenas propiedades que se puede obtener a partir de la fórmula de inversión con constante 1 es que µ(A/K) = 1 con µ la medida inducida por la de Haar en A. Para practicar con el significado de este cociente probaremos aquı́ este resultado para K = Q y K = Q(i) con cálculos directos, sin emplear análisis armónico. Si K = Q, dado (x0 , x1 , x2 , . . . ) ∈ A sólo un número finito de las xj con j ≥ 1 tiene “parte fraccionaria” no nula, esto es, λ(xj ) 6= 0. Escogiendo x ∈ Q igual a la suma de estas partes fraccionarias se sigue (x0 − x, x1 − x, x2 − x, x3 − x, . . . ) ∈ R × Z2 × Z3 × Z5 × . . . Además los x con esta propiedad están totalmente determinados salvo por la suma de un entero, por consiguiente A/Q = T × Z2 × Z3 × Z5 × . . . 11 con T = R/Z (un purista puede cambiar la igualdad por un isomorfismo y homeomorfismo, y de paso mejorar la notación A/Q que usamos sin explicaciones). De aquı́, si µp es la medida de Haar normalizada en Qp , Y µ(A/Q) = 1 · µp (Zp ) = 1. p En el caso K = Q(i) se procede igual, salvo que ahora µ1+i (Z1+i [i]) = 1/2 y el factor arquimediano es C/Z × Z que mide 2 con la medida µ0 , entonces 1 · 1 · 1 · · · · = 1. 2 Es chocante a primera vista que el convenio de normalización para µ0 haya compensado exactamente el de µ1+i . µ(A/Q(i)) = 2 · 4. Funciones zeta globales Dada una función suficientemente regular F : A −→ C le asignaremos la función zeta global Z F (x)kxks dµ∗ (x). Z(F, s) = I ∗ Aquı́ dµ es la medida de Haar en I que coincide con el producto de la medidas de Haar (multiplicativas) en cada coordenada. Si consideramos funciones que factorizan y son tan buenas como las de la clase de Schwartz-Bruhat mencionadas anteriormente, ∞ Z Y Z(F, s) = fj (xj )kxksj dµ∗j (x − j) j=0 Kj∗ y esto define una función analı́tica en algún semiplano <s > σ0 . Ası́, la función zeta global para K = Q y K = Q(i) es esencialmente el producto de las funciones zeta locales que ya habı́amos calculado aunque evidentemente hay una dependencia en la función F escogida. 2 Por ejemplo, en Q, tomemos f0 (x) = e−πx , que cumple f0 = fe0 = fb0 , y el resto de las fj iguales a las funciones caracterı́sticas de Zpj , que también cumplen fj = fbj . Con un cambio de variable sencillo se lleva a cabo el cálculo Z ∞ Z −s/2 s dx0 =π e−t ts/2−1 dt = π −s/2 Γ(s/2). f0 (x0 )|x0 | |x0 | 0 R∗ Q Entonces para F = fj Y Z(F, s) = π −s/2 Γ(s/2) Zp (s) = π −s/2 Γ(s/2)ζ(s). p 12 ¡La función ζ de Riemann con el mismo factor que aparece en la ecuación funcional! 2 2 En Q(i) tomemos f0 (x + iy) = e−2π(x +y ) que cumple f0 = fe0 , y el resto de las fj iguales a las funciones caracterı́sticas de Zπj , que análogamente cumplen fj = fbj excepto para π = 1 + i donde hay un 2 que no encaja. De nuevo un cambio de variable lleva a Z Z ∞ 1 2 2 2 s 2dxdy f0 (x + iy)(x + y ) 2 = 4π e−2πr r2s−1 dr = (2π)1−s Γ(s) 2 x +y 2 C∗ 0 y se tiene Y 1 Zπ (s) = 2−s π 1−s Γ(s)ζZ[i] (s) Z(F, s) = (2π)1−s Γ(s) 2 π con ζZ[i] la función ζ de Dedekind en Z[i]. Esta vez el éxito es parcial porque sobra el factor 2−s para que se obtenga lo que aparece en la ecuación funcional. El éxito de la tesis de Tate fue deducir la extensión analı́tica y la ecuación funcional de una amplia familia de funciones L a partir de la fórmula de sumación de Poisson en los adeles. Los factores de la ecuación funcional provienen de los lugares arquimedianos y de otros correspondientes a primos con propiedades excepcionales. En el ejemplo anterior, 2−s se compensa justamente con el precio que hay que pagar por fj 6= fbj para π = 1 + i. Para ser más concretos, Tate consideró funciones zeta globales más generales: Z Z(F, s) = F (x)χ(x)kxks dµ∗ (x) I donde χ es un carácter (multiplicativo) en I que es trivial en K ∗ . Bajo condiciones de regularidad sobre F (digamos como las mencionadas antes), esto define una función holomorfa en <s > σ0 . Lo que Tate prueba es que Z tiene una extensión meromorfa con a lo más dos polos simples en s = 0 y en s = 1, y que se cumple la ecuación funcional Z(F, χ, s) = Z(Fb, χ b, 1 − s) donde χ b(x) = χ(x−1 ). En Q habı́amos escogido F = Fb (y χ el carácter trivial). Por ello Z(F, s) = π −s/2 Γ(s/2)ζ(s) es invariante al cambiar s por 1−s. En Q(i) no se tiene exactamente F = Fb porque el factor correspondiente a π = 1+i falla, y en el cálculo de Z(Fb, χ b, s) debemos reemplazar la zeta local Z1+i por un nuevo factor: Z Y 1 1−s b Z(F , χ b, s) = (2π) Γ(s) Zπ (s) · g(x)kxks1+i dµ∗1+i (x) ∗ 2 Z1+i [i] π6=1+i 13 donde g es la transformada de Fourier de la función caracterı́stica de Z1+i [i], que como habı́amos visto era la función caracterı́stica de 2−1 Z1+i [i]. Esto permite deducir que la integral anterior es 22s−1 /(1 − 2−s ) (ejercicio). Ası́ pues Y Z(Fb, χ b, s) = 2s−1 π 1−s Γ(s)(1 − 2−s )−1 Zπ (s) = 2s−1 π 1−s Γ(s)ζZ[i] (s). π6=1+i Entonces la igualdad Z(F, χ, s) = Z(Fb, χ b, 1 − s) se lee como π 1−s Γ(s)ζZ[i] (s) = π s Γ(1 − s)ζZ[i] (1 − s). Escogiendo caracteres χ no triviales surgen funciones Z distintas de la ζ de Dedekind que permiten estudiar problemas relacionados con el grupo de clases. Incluso en Z[i], con una elección adecuada de χ, se puede probar la equidistribución angular de los primos gaussianos. Referencias [Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic Press, London; Thompson Book Co., Inc., Washington, D.C. 1967. [Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999. [Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145. [Sp] M. Spivak. Calculus. Reverté. Barcelona 1984. [Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001. 14

La tesis de Tate I

Documentos relacionados

Productos

Apoyo

La tesis de Tate I

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib