La tesis de Tate I 1. Recordando los p-ádicos En principio los números p-adicos (p es primo) son una notación conveniente para hablar simultáneamente de las soluciones de una ecuación módulo p, p2 , p3 ,. . . Por ejemplo, la ecuación x2 = −1 tiene la solución x1 = 2 módulo 5, la cual se puede “elevar” de forma única a la solución x2 = 7 = 2 + 1 · 5 módulo 52 , y ésta a x3 = 57 = 2 + 1 · 5 + 2 · 52 módulo 53 . este procedimiento repetido hasta el infinito lleva a que el “número 5-ádico” x = 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + 4 · 55 + . . . es solución de la ecuación x2 = −1. Lo que se quiere decir con esto es que tomando los n primeros sumandos tenemos una solución xn , módulo 5n . En general, dado un primo p el conjunto Zp de enteros p-ádicos es el formado por las series formales evaluadas en x = p con coeficientes en {0, 1, 2, , . . . p − 1}, Zp = {a0 + a1 p + a2 p2 + a3 p3 + . . . : 0 ≤ aj < p}. Evidentemente cada entero no negativo se puede considerar p-ádico escribiéndolo en base p y tomando ak = 0 para k grande. En general hay una inyección natural j : Z ,→ Zp en la que para cada r ∈ Z se considera xn ∈ {0, 1, 2, , . . . pn − 1} con xn ≡ r (mod pn ) y las cifras de xn en base p son {a0 , a1 , . . . , an−1 }. Si en Z se considera la norma multiplicativa dada por knkp = p−k si pk kn y k0kp = 0, tendremos una distancia en Z, d(n, m) = kn − mkp y consecuentemente una topologı́a métrica inducida en la que dos enteros están cercanos si son congruentes módulo una potencia de p grande. Teniendo en cuenta la inyección j, Zp es el completado de Z, es decir, Zp es Z y todos los lı́mites de sucesiones de números enteros que a la larga sean congruentes módulo potencias de p arbitrariamente grandes. n n Por ejemplo, P∞ xn n= 10 +1 tiende a 1 en Z2 y la sucesión xn con 4xn +1 ≡ 0 (mod 5 ) tiende a n=0 5 en Z5 (ejercicio). La norma en Z induce la norma p-ádica en Zp ( 0 si x = 0 kxkp = P n p−k si x = ∞ n=k an p con ak 6= 0 Hay una aparente similitud formal entre Zp y los números reales en [0, 1) escritos en base p, sólo hay que cambiar las potencias de p−1 por potencias de p y los an desempeñan el papel de cifras. Sin embargo topológicamente reales y p-ádicos son muy diferentes. En los reales se cumple la bien conocida desigualdad triangular |a + b| ≤ |a| + |b| y en los p-ádicos algo mucho más fuerte, la desigualdad ultramétrica 1 ka + bkp ≤ máx(kakp , kbkp ). Con ésta por ejemplo dados A y B a distancia d > 0 no existe ningún punto medio M tal que su distancia a A y a B sea d/2. Las normas que satisfacen la desigualdad ultramétrica se dice que son no arquimedianas. Según [Sw] el nombre viene porque Arquı́medes escribió sobre números grandes y una norma no Arquimediana tiene la propiedad de que knk permanece acotado. Módulo pr se puede sumar, restar, multiplicar y muchas veces dividir, los únicos denominadores problemáticos son los que contienen potencias de p. Por ello Zp es un anillo y considerandos formalmente fracciones del tipo x/pm con x ∈ Zp , m ∈ N se tiene un cuerpo, éste es Qp , Qp = {a−m p−m +a−m+1 p−m+1 +a−m+2 p−m+2 +· · ·+a0 +a1 p+a2 p2 +. . . : 0 ≤ aj < p}. La norma kxkp también tiene sentido en Qp con la única diferencia de que k puede ser negativo. Al igual que en Zp es multiplicativa: kxkp kykp = kxykp . También se puede extender la inyección j de forma que j : Q ,→ Qp . Por ejemplo 1/6 ∈ Q se puede escribir como (1/3)2−1 . En Z2 se cumple que 1/3 es 1 + 21 + 23 + 25 + 27 + . . . (¡comprobarlo!) por tanto el número racional 1/6 corresponde a 2−1 + 1 + 22 + 24 + 26 + . . . La aspiración final al introducir los p-ádicos es muchas veces tratar de obtener información sobre soluciones enteras o racionales estudiando congruencias con respecto a todos los módulos. Factorizando, por el teorema chino del resto, basta considerar módulos que sean primos o potencias de primos, y como hemos visto en el primer ejemplo, a veces lo que ocurre módulo pk condiciona lo que ocurre módulo pk+1 y todas estas congruencias quedan resumidas en un número p-ádico El esquema de reflejar fielmente las soluciones enteras en soluciones p-ádicas rara vez tiene un éxito completo (lo que se llama un principio local-global ), por ejemplo, se pueden dar ecuaciones cúbicas en dos variables que no tienen soluciones en Q pero sı́ en todos los Qp (y en R). Los p-ádicos están entre lo continuo y lo discreto, por una parte se puede hacer análisis en ellos y por otra representan soluciones de congruencias con módulo variable. Vistas la aplicaciones que tienen uno podrı́a replantearse la frase incial, ¿hasta que punto son una notación o un objeto matemático con entidad propia? ¿Cuando pensamos en un número real imaginamos que es sólo una notación para una familia de sucesiones de Cauchy de racionales? Bibliografı́a: [Ca1], [Ca2], [Sw]. 2 2. Análisis armónico en grupos Las funciones de L2 (T) se analizan en términos de e(nx), las de L2 (R) con e(ξx) a través de la transformada de Fourier, las funciones definidas en (Z/qZ)∗ con los caracteres de Dirichlet, las de Z/qZ con raı́ces de la unidad a través de la transformada de Fourier discreta. Todos estos ejemplos y otros que veremos más adelante se pueden unificar desarrollando el análisis de Fourier en grupos. Aquı́ nos centraremos en el caso abeliano pero hay también una teorı́a no abeliana en la que aparecen las representaciones (véanse algunos comentarios y ejemplos en [Dy-Mc]). En primer lugar, antes de hacer análisis se necesita una topologı́a que debe ser compatible con la operación de grupo. Si (G, ∗) es el grupo abeliano a considerar, exigimos que las funciones a(x, y) = x∗y, b(x) = x−1 sean continuas con la topologı́a escogida. Además es necesaria una condición técnica y es que el espacio topológico obtenido sea localmente compacto (cada punto tiene algún entorno abierto contenido en un compacto) y Hausdorff. Con todo esto se dice que G es un grupo abeliano localmente compacto. Los grupos abelianos finitos (sumas directas de Z/qZ) quedan totalmente determinados por sus grupos de caracteres y a su vez éstos sirven para analizar todas las funciones de ellos en C. Lo que intentamos es copiar este esquema a la situación general. Cuando G es un grupo abeliano localmente compacto se dice que una función χ : G −→ {z ∈ C : |z| = 1} es un carácter si es un homomorfismo continuo. Si el grupo es finito, la única topologı́a posible es la discreta (todo es abierto) y la continuidad es superflua, con lo que se vuelve al concepto clásico de carácter. b es un grupo con el producto El conjunto de caracteres de G, denotado con G, de funciones que se puede dotar de la topologı́a llamada compacta-abierta con la que dos funciones están cercanas si su diferencia es pequeña en compactos grandes. Si G no fuera localmente compacto esta comparación de caracteres serı́a imposible porque la diferencia podrı́a no estar acotada incluso en entornos arbitrariamente pequeños. Veamos algunos ejemplos sencillos: Ejemplo 1. (R, +). Cada carácter se puede escribir como χ(x) = e(f (x)) con f continua. La condición de homomorfismo requiere χ(0) = 1 y podemos suponer f (0) = 0, además f (x) + f (y) = f (x + y). Entonces f es necesariamente lineal ([Sp], Cap.8, Ej.7). Por 3 tanto b = {χξ con χξ (x) = e(ξx), ξ ∈ R}. G Ejemplo 2. (T, +). El argumento es el mismo pero ahora ξ debe ser entero para que χ esté bien definida en T, entonces b = {χn con χn (x) = e(ξn), n ∈ Z}. G Ejemplo 3. (R+ , ·). Este ejemplo se reduce al primero notando que φ(x) = log x establece un isomorfismo φ : (R+ , ·) −→ (R, +) y los caracteres en (R+ , ·) son simplemente χξ (log x), b = {cξ con cξ (x) = xiξ , ξ ∈ R}. G Ejemplo 4. (Z/qZ, +). El grupo está generado por 1 que es de orden q, ası́ que χ(1) debe ser de la forma e(m/q) para que el orden divida a q. La propiedad de homomorfismo implica n χ(n) = χ(1) y por tanto b = {χm con χm (n) = e(mn/q), 0 ≤ m < q}. G Ejemplo 5. ((Z/pZ)∗ , ·). Se tiene el isomorfismo φ : (Z/(p − 1)Z, +) −→ ((Z/pZ)∗ , ·) que actúa como φ(n) = g n donde g es una raı́z primitiva (generador del grupo multiplicativo). Los caracteres son entonces b = {χj con χj (n) = e(j indg (n)/(p − 1)), 0 ≤ j < p − 1}, G es decir, los caracteres de Dirichlet (para módulo q = p primo) [Da] p.37. Ahora queremos definir una medida que sea compatible con la operación de grupo para poder integrar sobre él. Ésta es la llamada medida de Haar. Para ser más precisos, se dice que una medida de Radon (positiva) es una medida de Haar en un grupo abeliano localmente compacto (G, ∗) si para todo conjunto medible E se cumple µ(E) = µ(g ∗ E). En el caso de (R, +) la medida de Lebesgue es una medida de Haar y se puede entender la invariancia por traslaciones como la igualdad entre diferenciales dx = d(x − x0 ) Z Z Z µ(E) = 1 dx = 1 d(x − x0 ) = 1 dx = µ(x0 + E). E x0 +E x0 +E 4 Esta medida de Haar pasa a (T, +) por el homomorfismo natural (R, +) −→ (T, +). También (R+ , ·) hereda esta medida a través del isomorfismo φ(x) = log x, es decir, Z Z dx . µ(E) = dφ(x) = E E x La invariancia se puede ver como la identidad diferencial x−1 dx = (λx)−1 d(λx). En grupos finitos, la medida de Haar es una P trivialidad porque se tiene que cumplir µ({1}) = µ({g ∗ 1}) = µ({g}) y como g∈G µ({g}) = µ(G) estos valores no pueden ser nulos. Se tiene por tanto que cualquier medida de Haar en un grupo finito es, salvo multiplicar por una constante, la medida de contar. En general, si G es discreto (si tiene la topologı́a discreta) un argumento similar lleva a la misma conclusión. A este nivel las preguntas básicas son las siguientes: a) ¿Existe siempre una medida de Haar? b) ¿Es única? c) ¿Cómo se halla? Las dos primeras preguntas las responde un teorema que afirma que para grupos abelianos localmente compactos (de hecho también para los no abelianos) existe una medida de Haar y cualquier otra es un múltiplo suyo [Ra-Va] p.12. La demostración no es fácil pero mirando la parte de existencia desde lejos uno llega a la conclusión de que por el teorema de representación de Riesz [Ru] basta hallarPun funcional lineal invariante por el grupo. Moralmente el candidato es L[f ] = g∈G f (g ∗ x) pero esto habitualmente no tiene sentido si G no es finito y aparecen sumas finitas, aproximaciones, supremos y demás. La tercera pregunta se puede eludir con unas consideraciones filosóficas. ¿Qué es hallar una medida? Nos parece que la medida de Lebesgue es tangible y que en los ejemplos 1, 2 y 3 hemos hallado realmente la medida de Haar pero ¿cómo calculamos la medida de un conjunto? No hay ninguna forma clara. Si queremos medir el conjunto de Cantor ponemos y quitamos intervalitos usando las propiedades aditivas de la medida y que [a, b] mide b − a. Cuando nos enfrentemos a la medida de Haar en Qp o en los adeles, haremos algo parecido, sabremos la medida de algunos intervalitos (en realidad bolas) y todos los conjuntos que mediremos serán uniones de ellos. De este modo, esta medida la habremos hallado tanto o tan poco como la usual de Lebesgue. Por mucha teorı́a de la medida que sepamos, decir que el área del cı́rculo es πR2 sigue siendo una genialidad de Arquı́medes y todas nuestras σ-álgebras son inútiles porque el cı́rculo no es unión de unos pocos cuadraditos. 5 Con todo esto se puede definir una transformada de Fourier Z b f (χ) = f (x)χ(x) dµ G b Sin entrar en detalles, supondremos siempre donde µ es la medida de Haar y χ ∈ G. que f es suficientemente buena como para que no haya problemas con la convergencia de las integrales. el gran teorema es que se comporta como la transformada de Fourier de siempre, es decir, que para f con regularidad suficiente se cumple la fórmula de inversión Z fb(χ)χ(x) dν f (x) = C b G b y C es una constante que normalizando adecuadonde ν es la medida de Haar en G damente las medidas µ y ν se puede escoger como 1. b es discreto y por Todavı́a hay más, si G es compacto, se puede probar que G tanto la integral anterior es una suma (la medida es la de contar). Veamos lo que quiere decir esto en los ejemplos anteriores. Ejemplo 1. Como ya hemos observado, dµ = dx es la medida de Lebesgue. Por otro lado la b dada por φ(ξ) = χξ es claramente un isomorfismo, y también aplicación φ : R −→ G un homomorfismo (ξ1 y ξ2 cercanos ⇒ χξ1 y χξ2 cercanos) por tanto la medida de Haar es la inducida por la de Lebesgue. Se tiene entonces la fórmula de inversión de toda la vida: Z Z fb(ξ)e(xξ) dξ fb(ξ) = f (x)e(−ξx) dx, f (x) = C R R b con R. Es fácil ver que (por ejemplo eligiendo como f donde se ha identificado G una gaussiana) C = 1. Ejemplo 2. b como antes es Z en lugar de R. Como Z Ahora el grupo que “parametriza” G es discreto, la medida es la de contar (esto es consecuencia de que T es compacto). Por tanto Z X fb(n) = f (x)e(−nx) dx, f (x) = C fb(n)e(nx). T n∈Z De nuevo C = 1 y se tiene el análisis armónico clásico para funciones 1-periódicas. 6 Ejemplo 3. El isomorfismo (R+ , ·) ∼ = (R, +) permite repetir el primer ejemplo cambiando lo que hay que cambiar, llegándose a Z Z −iξ dx b , f (x) = C fb(ξ)xiξ dξ f (ξ) = f (x)x + x R R Esto parece nuevo, pero si escribimos s = −iξ veremos que esconde un viejo conocido: la transformada de Mellin. La constante es C = 1/2π en este caso. Ejemplo 4. b es la discreta por ser grupos finitos y por tanto µ y ν son La topologı́a de G y G las medidas de contar. Se sigue fb(m) = q−1 X f (n)e(−nm/q), f (n) = C n=0 q−1 X fb(m)e(nm/q). m=0 Ésta es la transformada de Fourier discreta y es fácil ver que C = 1/q (basta tomar f ≡ 1, entonces fb(0) = q y se anula en el resto). Ejemplo 5. Es similar al ejemplo anterior, fb(j) = p−1 X f (n)χj (n), f (n) = C n=1 p−2 X fb(j)χj (n). j=0 Nótese que ésta fórmula se puede demostrar a partir de las relaciones de ortogonalidad. Como antes, se tiene C = 1/(p − 1). Bibliografı́a: [Ka] (sólo una brevı́sima introducción), [Ra-Va]. 3. Ejercicios de análisis en los p-ádicos Al ser Qp un cuerpo, hay dos tipos de grupos que se pueden considerar, el aditivo y el multiplicativo. Sólo describiremos el grupo de caracteres del primero a pesar de que en la tesis de Tate aparecen algunos caracteres multiplicativos sencillos (¿se pueden describir fácilmente todos? quizá el comentario acerca de Jbk en [Sw] p.128 sugiera que no). El procedimiento será “artesanal” sin emplear apenas ninguna maquinaria teórica. Sea χ un carácter en (Qp , +). Supongamos primero que χ(1) = 1, entonces por la propiedad de homomorfismo χ(pn ) = 1 para n ∈ N, ası́ pues, para cualquier x = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 + a0 + a1 p + a2 p2 + . . . 7 se tiene χ(x) = χ(λ(x)) donde λ(x) es la “parte fraccionaria” de x, λ(x) = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 . Como 1 = p−1 + p .veces . . + p−1 entonces 1 = (χ(p−1 ))p , es decir, χ(p−1 ) es una raı́z p-ésima de la unidad, digamos χ(p−1 ) = e(x0 /p), 0 ≤ x0 < p. De la misma forma debe cumplirse χ(p−2 ) = e(x1 /p2 ) con 0 ≤ x1 < p2 , y para preservar la relación χ(p−1 ) = (χ(p−2 ))p es necesario x1 ≡ x0 (mod p). En general χ(p−k−1 ) = e(xk /pk+1 ) con xk ≡ xk−1 (mod pk ). Esta sucesión P x0 , x1 , x2 , . . . determina un entero p-ádico ξ = b0 + b1 p1 + b2 p2 + . . . con xk = kr=0 br pr y por tanto χ(p−k−1 ) = e(λ(ξ/pk+1 )). De aquı́ se deduce que cualquier carácter con χ(1) = 1 es de la forma χ(x) = e(λ(ξx)). ¿Y si χ(1) 6= 1? Siempre χ(1) debe ser una raı́z pr -ésima de la unidad, porque pn → 0 en Qp cuando n → ∞, implica por la continuidad de los caracteres que n χ(1))p → 1 en C. Si es una raı́z pr -ésima de la unidad, χ(pr ) = 1 y el mismo argumento se puede aplicar salvo que ahora hay ı́ndices desplazados r unidades: χ(pr−1 ) = e(x0 /p), χ(pr−2 ) = e(x1 /p2 ), etc. lo que se refleja en que pr ξ ∈ Zp . En definitiva, los caracteres son los mismos que hemos hallado pero ahora ξ puede estar en Qp , no necesariamente en Zp . Con sı́mbolos: b p = {χξ con χξ = e(λ(ξx)), ξ ∈ Qp }. Q b p ya La aplicación ξ 7→ χξ da un isomorfismo de Qp en su grupo de caracteres Q que χξ+η = χξ χη . Se prueba que también es un homeomorfismo y en este sentido Qp es su propio grupo de caracteres. Estudiemos ahora las propiedades de la medida de Haar µ. al ser Zp compacto en Qp (ejercicio) su medida debe ser finita (por definición de medida de Radon) y por tanto se puede normalizar µ de forma que µ(Zp ) = 1. Nótese que Zp = {x ∈ Qp : kxkp ≤ 1} y la propiedad caracterı́stica de la medida de Haar implica que todas las bolas cerradas de radio 1 también miden uno (son trasladados de Zp ). Calculemos ahora la medida del resto de las bolas cerradas. Por supuesto basta considerar las de radio r = p−k , k ∈ Z. Si por ejemplo k = 1, p−1 Zp = [ p−1 1 2 {a0 + a1 p + a2 p + . . . } = a0 =0 [ {x ∈ Qp : kx − a0 kp ≤ p−1 } a0 =0 8 y teniendo en cuenta la invariancia por traslaciones, 1 = pµ({x ∈ Qp : kxkp ≤ p−1 }) ⇒ µ({x ∈ Qp : kxkp ≤ p−1 }) = p−1 . Para k = −1, p−1 [ {x ∈ Qp : kxkp ≤ p} = {x ∈ Qp : kx − a−1 =0 a−1 kp ≤ 1} p de donde µ({x ∈ Qp : kxkp ≤ p}) = p. Con otros exponentes se razona de forma análoga y se tiene en general que la medida de una bola cerrada B r de radio r es para r = p−k , k ∈ Z. µ(B r ) = r e(E) = µ(αE) define otra medida de Haar Dado α ∈ Q∗p = Qp − {0}, claramente µ en Qp y por la unicidad debe cumplirse µ e = λα µ. Por el cálculo hecho con las bolas cerradas, se cumple λα = kαkp . Se puede entender esto como la fórmula de cambio de variable para cambios lineales: dµ(αx) = kαkp dµ(x). Esto implica que Z ∗ µ (E) = λ E dµ(x) kxkp define una medida de Haar en el grupo multiplicativo (Q∗p , ·) para cada λ ∈ R+ . Esta medida se suele normalizar de forma que Z∗p (los elementos invertibles en Zp , esto es, los que cumplen kxkp = 1) midan uno, lo cual requiere λ = p/(p − 1). Veamos el cálculo como ejemplo: Z Z dµ(x) ∗ ∗ −1 µ (Zp ) = 1 ⇔ λ = = dµ(x) = µ(Z∗p ). kxk ∗ ∗ p Zp Zp Con la descomposición Zp = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . y la fórmula de cambio de variables antes mencionada, 1 = µ(Zp ) = ∞ X µ(p k k=0 Z∗p ) = µ(Z∗p ) ∞ X k=0 y entonces λ = (1 − p−1 )−1 . 9 p−k Volviendo al caso aditivo, comprobemos que la fórmula de inversión se cumple con constante C = 1, es decir, Z Z f (x)e(−λ(ξx)) dµ(x), f (x) = fb(ξ)e(λ(xξ)) dµ(ξ). fb(ξ) = Qp Qp Para la prueba de que la constante es 1 basta verificar esta fórmula para alguna función (no idénticamente nula). Tomaremos ( 1 si x ∈ Zp f (x) = 0 si x 6∈ Zp que es relevante en la tesis de Tate. De la igualdad Z Z b e(−λ(ξx)) dµ(x) = f (ξ) = e(−λ(λ(ξ)x)) dµ(x) = fb(λ(ξ)) Zp Zp se deduce fb(ξ) = fb(0) = 1 para ξ ∈ Zp . En el resto de los casos basta considerar ξ = m/pk con p 6 |m, k ∈ Z+ . Se tiene fb(m/pk ) = Z e(−λ(mx/pk )) dµ(x) = Zp pk −1 Z X e(−λ(mx/pk )) dµ(x). n+pk Zp n=0 Con la traslación x 7→ x − n y el cambio x 7→ pk x esto es igual a pk −1 X k pk −1 Z k e(−mn/p ) e(−λ(mx/p )) dµ(x) = p k Zp n=0 X k Z e(−mn/p ) p−k dµ(x) Zp n=0 que se anula por ser suma de las raı́ces de la unidad. Con ello hemos probado fe(ξ) = f (ξ) y por tanto la constante en la fórmula de inversión es 1. Para terminar creando un poco de intriga, calculemos la llamada “función zeta local” correspondiente a Qp , que se define como Z Zp (s) = kxksp dµ∗ (x). Zp −{0} Por la descomposición ya empleada Zp − {0} = Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . se sigue Z ∞ Z ∞ X X s ∗ −ks Zp (s) = kxkp dµ (x) = p dµ∗ (x) = k=0 ∞ X k=0 pk Z∗p k=0 p−ks µ∗ (pk Z∗p ) = ∞ X k=0 10 pk Z∗p p−ks µ∗ (Z∗p ) = (1 − p−s )−1 . Entonces la función zeta local es justo el trozo de la función zeta de Riemann que corresponde al primo p. Bibliografı́a: [Ca-Fr], [Ra-Va], [Ro], [Sw]. Referencias [Ca1] J.W.S. Cassels. Diophantine equations with special reference to elliptic curves. J. London Math. Soc. 41 1966 193–291. [Ca2] J.W.S. Cassels. Lectures on elliptic curves. London Mathematical Society Student Texts, 24. Cambridge University Press, Cambridge, 1991. [Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic Press, London; Thompson Book Co., Inc., Washington, D.C. 1967. [Da] H. Davenport. Multiplicative number theory. Graduate texts in Mathematics 74. Springer-Verlag, New York-Berlin, 1980. [Dy-Mc] H. Dym, H.P. McKean. Fourier series and integrals. Academic Press, New York-London, 1972. [Ka] Y. Katznelson. An introduction to harmonic analysis. Dover Publications, Inc., New York, 1976. [Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999. [Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145. [Ru] W. Rudin. Análisis real y complejo McGraw-Hill, 1987. [Sp] M. Spivak. Calculus. Reverté. Barcelona 1984. [Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001. 11 La tesis de Tate II En vez de estudiar directamente la generalización de los p-ádicos en cualquier cuerpo de números nos centraremos en Q(i). Hay dos particularidades que hacen que sea más sencillo. La primera es que su grado sobre Q es pequeño y la segunda, la más importante, es que su anillo de enteros Z[i] es un dominio de factorización única, por lo cual se puede hablar sin peligro de números primos. La razón para detenernos en este ejemplo es poder practicar con algunos cálculos explı́citos. Dentro de la teorı́a, Q(i) no tiene ningún papel destacado y sacrificando los ejemplos, todo lo que se cuenta aquı́ se podrı́a englobar en un marco general condensado en pocas páginas [Ca-Fr], [Sw]. 1. p-ádicos gaussianos Un entero p-ádico quedaba determinado por una sucesión de enteros x1 , x2 , x3 , . . . tales que xn ≡ xn+1 (mod pn ). Se pueden escoger aj pertenecientes a un sistema completo de restos módulo 0 ≤ aj < p, tales que x1 ≡ a0 (mod p) e P p, digamos j n inductivamente (xn+1 − j<n aj p )/p ≡ an (mod p) lo que conduce a la representaP ción del entero p-ádico como una serie aj pj . No hay ninguna dificultad para P copiar esto en Z[i] y dado un primo gaussiano π definir los “enteros π-ádicos” j≥0 aj π j donde los aj pertenecen a un sistema completo de restos módulo π, es decir, a un conjunto de representantes de las clases de Z[i]/hπi. Un entero positivo adquiere una representación p-ádica finita sin más que escribirlo en base p, como a0 + a1 p + a2 p2 + · · · + ak pk . En general se tiene una inyección j : Z ,→ Zp donde los negativos tienen representaciónes infinitas. Por ejemplo en Z2 , −100 = 28 − 27 = 22 + 23 + 24 − 27 = 22 + 23 + 24 + 27 + 28 + 29 + 210 + 211 + . . . P j donde se ha usado la identidad 2-ádica −1 = ∞ j=0 2 que harı́a las delicias de Euler P (nótese que d(−1, j<n 2j ) = 2−n , ejercicio). De la misma forma hay una inyección j : Z[i] ,→ Zπ [i] donde Zπ [i] son los enteros π-ádicos antes definidos. Por ejemplo, si π = 2+ i se tiene Z[i]/h2 + ii = {0, 1, 2, i, 1 + i}. Podemos utilizar estos números como coeficientes para tratar de escribir un entero gaussiano en base π. Hay números que, como antes los positivos, tendrán representaciones finitas mientras que para otros serán infinitas. El proceso es algorı́tmico, esencialmente divisiones sucesivas permitiendo sólo los restos 0, 1, 2, i, 1 + i. Ası́ para escribir la expresión 1 π-ádica de 100 se puede seguir el esquema: 100 = (40 − 20i)π + 0 40 − 20i = (12 − 16i)π + 0 12 − 16i = (1 − 9i)π + 1 + i 1 − 9i = (−2 − 4i)π + 1 + i −2 − 4i = (−2 − i)π + 1 −2 − i = (−1)π + 0 → → → → → → 100 = (40 − 20i)π 100 = (12 − 16i)π 2 100 = (1 + i)π 2 + (1 − 9i)π 3 100 = (1 + i)π 2 + (1 + i)π 3 + (−2 − 4i)π 4 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (−2 − i)π 5 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 − π 6 Se podrı́a seguir dividiendo −1 por π, con P∞−1 j= (−1)π + 1 + i, o bien utilizar directamente la identidad −1 = (1 + i) j=0 π (ejercicio), en cualquier caso se concluye 100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (1 + i)π 6 + (1 + i)π 7 + (1 + i)π 8 + . . . Enseguida veremos una pequeña sorpresa por la que los π-ádicos tienen representaciones mucho más sencillas de lo que sugiere el ejemplo anterior. Al igual que en Z, cada primo gaussiano π da lugar a una norma multiplicativa en Z[i], kzkπ = (π · π)−k si π k ||z y k0kπ = 0. La introducción del conjugado π asegura la positividad. Hay una distancia asociada a esta norma y Zπ [i], que más propiamente deberı́a escribirse como (Z[i])π , es el completado de Z[i] con ella. Considerando el cuerpo de fracciones de Zπ [i] o completando P Q(i), se jobtiene el cuerpo Qπ (i), cuyos elementos se pueden escribir como series j≥−m aj π con los aj como antes. Estudiaremos ahora con un poco más de detalle cuáles son estos cuerpos, para ello hay que recordar que los primos gaussianos son, salvo primos asociados, exactamente los descritos en los tres puntos siguientes, donde p representa a un primo racional (p ∈ Z): 1) 2) 3) p ≡ 3 (mod 4) π ∈ Z[i] con ππ = p ≡ 1 (mod 4) 1+i En el primer caso Z[i]/ < p >= Fp [i] = {a + ib : 0 ≤ a, b < p} y todos los elementos de Qp (i) son de la forma X (aj + bj i)pn = α + iβ j≥−m 2 con α, β ∈ Qp . Nótese que i = en este caso √ −1 6∈ Qp porque −1 no es residuo cuadrático módulo p. Entonces Qp (i) = {α + iβ : α, β ∈ Qp } y [Qp (i) : Qp ] = 2. En el segundo caso Z[i]/ < π > sólo tiene p elementos, la norma de π. De la igualdad p = π · π está claro que Qp está incluido en Qπ (i). En este caso −1 es residuo cuadrático módulo p y x2 ≡ −1 (mod √ p) tiene dos soluciones que pueden elevarse a soluciones p-ádicas, entonces i = −1 y π = a + bi están realmente en Qp y lo mismo ocurre con todas las expresiones π-ádicas finitas de Qπ (i). Por la compleción y doble inclusión se sigue Qπ (i) = Qp . Es instructivo ver las cuentas en un caso sencillo: si p = 5 y π = 2 + i, según se calculó en la primera parte, 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . es una solución en Q5 de x2 = −1, por tanto este número 5-ádico es i o −i y {π, π} = {α, β} con α = 4 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . − β = 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . De kπkπ = 1 (porque 2 + i no divide a 2 − i) se deduce β 6= π, ası́ que π = β y 2 3 −i + . . . Con esto se puede transformar una serie del tipo P = 2j + 1 · 5 + 2 · 5 + 1 · 5 P aj π en otra de la forma bj 5j con 0 ≤ bj < 5. El último caso tiene particularidades de los dos anteriores, por un lado 2 = (1 + i)(1 − i) pero a diferencia del análisis anterior, 1 + i y 1 − i no son coprimos, k1 − ik1+i = 2−1 porque 1 − i = (−i)(1 + i) ası́ que no se puede proceder de la misma forma. De hecho i 6∈ Q2 porque x2 ≡ −1 (mod 4) no tiene solución. Entonces Q1+i (i) = {α + iβ : α, β ∈ Q2 } y [Q1+i (i) : Q2 ] = 2 como en el primer caso. Si uno lo prefiere puede ver la igualdad anterior explı́citamente a través de (1 + i)2k = ik 2k y (1 + i)2k+1 = (ik + ik+1 )2k . 2. Caracteres y transformadas de Fourier Si p ≡ 3 (mod 4), como grupo aditivo (y también como espacio vectorial sobre Qp ) se tiene Qp (i) ∼ = Qp ⊕ Qp con el isomorfismo canónico α + iβ 7→ (α, β), que es homeomorfismo cuando se incorpora la topologı́a. Esto implica que los caracteres de Qp (i) son productos de caracteres de Qp , es decir, [ Q p (i) = ψη1 η2 con ψη1 η2 (α + iβ) = e(λ(η1 α) + λ(η2 β)), 3 η1 , η2 ∈ Qp donde λ indica la “parte fraccionaria” de la anterior entrega. Lo mismo ocurre en Q1+i (i). Por otro lado hemos visto que Qπ (i) = Qp cuando π · π = p ≡ 1 (mod 4) y entonces en este caso los caracteres son ψξ (x) = e(λ(ξx)). Si en el primer caso que hemos analizado se escribe ξ = (η1 − iη2 )/2, para x = α+iβ ∈ Qp (i) se tiene ψη1 η2 (x) = e(2λ(<(ξx))). Este dos artificial causará algún problema más adelante con la normalización de la medida de Haar pero permite la siguiente descripción de los caracteres en todos los casos que es generalizable a otros cuerpos de números. Para cualquier primo gaussiano π, se tiene \ Q π (i) = ψξ con ψξ (x) = e(λ(TrQ π (i)/Qp (ξx))), ξ ∈ Qπ (i) . Aquı́ Tr denota la traza, la suma de todos los conjugados. Sin entrar en tecnicismos, TrQ (i)/Q (1) = [Qπ (i) : Qp ], y si i 6∈ Qp , TrQ (i)/Q (i) = 0, además la traza es π p π p Qp -lineal. Se cumple que ξ 7→ ψξ establece, como en el caso de Q un isomorfismo y homeomorfismo entre el grupo localmente compacto Qπ (i) y su grupo de caracteres. Pasemos ahora a algunas consideraciones sobre la medida de Haar y a algunos cálculos con la transformada de Fourier. La normalización natural de la medida de Haar es µ(Zπ [i]) = 1 pero siguiendo a Tate es conveniente hacer un ligero cambio para obtener fórmulas más simétricas (véase el comentario en p.124 (v) de [Sw]). Independientemente de la normalización se cumple dµ(αx) = kαkπ dµ(x). Esta fórmula se podrı́a haber usado para elegir la definición de kαkπ entre diferentes posibilidades de normas multiplicativas. Por ejemplo, para π = p ≡ 3 (mod 4) puede parecer poco natural kpkp = p−2 en vez de p−1 , como en Z, pero es necesaria para respetar la anterior porque una bola cerrada de radio 1 es unión de p2 bolas unidad disjuntas dilatadas multiplicando por p p−1 p−1 {x ∈ Qp (i) : kxkp ≤ 1} = Zp [i] = [ [ a0 =0 b0 =0 x − (a0 + b0 i) ≤1 . x ∈ Qp (i) : p p Esto y la unicidad de la medida de Haar es suficente, como en la primera parte, para demostrar que kαkπ es la constante correcta en este caso en el cambio de variables de medidas. El resto de los casos es análogo. Sea f la función caracterı́stica de Zπ [i] ( 1 si x ∈ Zπ [i] f (x) = 0 si x ∈ 6 Zπ [i] 4 Calculemos su transformada de Fourier bajo la normalización µ(Zπ [i]) = 1 que después modificaremos ligeramente. Si π · π = p ≡ 1 (mod 4), Zπ [i] = Zp y como habı́amos visto en la primera parte, b f = f. Si π = p ≡ 3 (mod 4) no hay gran diferencia en el argumento debido a que Qπ (i) ∼ = Qp ⊕ Qp permite descomponer la integral que define fb en producto de dos integrales (una por cada coordenada) y cada una de ellas se anula si y sólo si la parte real o imaginaria de ξ no están en Zp . Entonces en este caso también se tiene fb = f . La salvedad aparece para π = 1 + i porque en este caso ψξ es trivial en Z1+i [i] si y sólo si 2ξ ∈ Z1+i [i]. Esto es muy sencillo de comprobar explı́citamente, ya que x = α + iβ, ξ = ξ1 + iξ2 ⇒ TrQ Q2 (ξx) = (2ξ1 )α − (2ξ2 )β. 1+i (i)/ Entonces el mismo argumento esbozado antes produce, suponiendo µ(Z1+i [i]) = 1, ( 1 si ξ ∈ 2−1 Z1+i [i] fb(ξ) = 0 si ξ 6∈ 2−1 Z1+i [i] La fórmula de inversión implica f = c(fb)b y la constante no es uno como en los casos anteriores (en los que fb = f ). Para hallarla, basta comparar f (0) = 1 con Z b b (f ) (0) = fb(ξ) dµ(ξ) = µ(Z1+i [i]) = k2−1 k1+i = 4. Entonces c = 1/4. Si se quiere unificar la fórmula de inversión para que no dependa del primo gaussiano, lo cual es muy conveniente, hay que redefinir el valor de µ(Z1+i [i]) asignándole convencionalmente el valor 1/2, con ello ( 1/2 si ξ ∈ 2−1 Z1+i [i] fb(ξ) = 0 si ξ 6∈ 2−1 Z1+i [i] y (fb)b(0) = 21 µ(2−1 Z1+i [i]) = 1 y por tanto la constante en la fórmula de inversión es uno. En resumen, conveniendo ( 1 si π · π 6= 2 µ(Z1+i [i]) = 1/2 si π · π = 2 se cumple Z f (x) = Z fb(ξ)ψ(xξ) dξ donde Qπ (i) f (x)ψ(ξx) dx fb(ξ) = Qπ (i) 5 para f suficientemente regular y ψ(t) = e TrQ (i)/Q (t) , con π|p. π p La medida de Haar µ∗ en el grupo multiplicativo de Qπ (i) es dµ∗ (x) = c dµ(x) kxkπ para c una constante positiva (basta ver que el lado derecho es invariante por multiplicaciones). Esta medida se suele normalizar de forma que µ∗ (Z∗π [i]) = 1 donde Z∗π [i] indica las unidades de Zπ [i], los que tienen inverso en este mismo anillo. El cálculo de normalización c que corresponde a este convenio es similar al de la primera parte y se basa en las descomposiciones Zπ [i] = {0} ∪ Z∗p [i] ∪ pZ∗p [i] ∪ p2 Z∗p [i] ∪ . . . Zπ [i] = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . Zπ [i] = {0} ∪ Z∗π [i] ∪ πZ∗π [i] ∪π 2 Z∗π [i] si π = p ≡ 3 (mod 4) si π · π = p ≡ 1 (mod 4) ∪ ... si π · π = 2. Por ejemplo, en el primer caso da lugar a 1= ∞ X µ(p k Z∗p [i]) = µ(Z∗p [i]) ∞ X p−2k k=0 k=0 que junto con 1 = cµ(Z∗π [i]) lleva a c = (1 − p−2 )−1 . En general −2 −1 si π = p ≡ 3 (mod 4) (1 − p ) c = (1 − p−1 )−1 si π · π = p ≡ 1 (mod 4) −1 −1 2(1 − 2 ) si π · π = 2 Las descomposiciones anteriores también permiten calcular la llamada “función zeta local” Z Zπ (s) = kxksπ dµ∗ (x). Zπ [i]−{0} Con ellas se tiene −2s −1 (1 − p ) Zπ (s) = (1 − p−s )−1 (1 − 2−s )−1 si π = p ≡ 3 (mod 4) si π · π = p ≡ 1 (mod 4) si π · π = 2 6 De nuevo el producto de las funciones zeta locales es conocido: (1 − 2−s )−1 Y (1 − p−2s )−1 Y Y −1 X (1 − p−s )−2 = 1 − (ππ)−s = p≡1 p≡3 π I 1 N (I)s donde I recorre los ideales no nulos de Z[i] y N (I) es su norma. Ésta es la función ζ de Dedekind. Expresiones todavı́a más familiares son ∞ X I 1 1 X r(n) = ζ(s)L(s, χ ) = 4 N (I)s 4 n=1 ns donde χ4 es el carácter no principal módulo 4 y r(n) es el número de representaciones como suma de dos cuadrados. 3. Adeles e ideles Tanto en Q como en Q(i) hemos introducido normas multiplicativas asociadas a cada primo. En general en un cuerpo K se dice que k · k : K −→ R es una valoración si kxk > 0 para x 6= 0, k0k = 0 y se cumple kxyk = kxk · kyk, kx + ykα ≤ kxkα + kykα para alguna constante α > 0. Una valoración da lugar a una distancia d(x, y) = kx − ykα y con ella a una topologı́a métrica sobre K. Todas las potencias positivas de una valoración correponden a la misma distancia, se dice que estas valoraciones son equivalentes y que determinan un lugar (¿sitio?, en inglés place). Todo esto no es más que poner nombres a lo que ya sabı́amos. El teorema de Ostrowski afina un poco más [Ra-Va] p.158 y dice que en Q las únicas valoraciones salvo equivalencias (esto es, lugares) son las k · kp y el valor absoluto de toda la vida. Se dice que este último corresponde al lugar del infinito o al primo del infinito y a veces se denota con k · k∞ . La topologı́a inducida es la usual y el completado con respecto a esta norma es Q∞ = R (por definición de los números reales [Sp]). En Q(i) se tiene algo similar (Lemas 16 y 17 de [Sw]) pero el lugar del infinito queda representado por kzk∞ = zz y el completado es en este caso Q∞ (i) = C. Vemos que en Q y en Q(i) todos los lugares corresponden a valoraciones no arquimedianas excepto una, k · k∞ . En otros cuerpos de números hay más pero siempre un número finito. En Q y Q(i) las valoraciones elegidas para representar los lugares tienen además la propiedad especial dµ(αx) = kαk dµ(x) 7 donde µ es la medida de Haar. Esto ya lo hemos probado excepto para k · k = k · k∞ (ejercicio sencillo). Todas estas valoraciones no son independientes sino que están ligadas por las fórmulas producto en Q y Q(i) Y Y kxk∞ kxkp = 1 y kzk∞ kzkπ = 1 p π para cualesquiera x ∈ Q, z ∈ Q(i) no nulos. Los adeles (¿adèles?) son el espacio básico en el que desarrollar el análisis armónico en todos los lugares simultáneamente permitiendo combinar información de ellos. Por ejemplo, a partir de la propiedad f = fb que tiene la propiedad caracterı́stica de Zp se podrá obtener la ecuación funcional de la función ζ de Riemann. Lo mismo ocurrirá con la ζ de Dedekind en Z[i]. Además el fallo de la relación f = fb cuando π = 1 + i explicará un factor nuevo en la ecuación funcional. Los adeles constituyen, por tanto, un marco en el que tratar el paso de local a global. En palabras de [Ro] p.140 “En cierto sentido, se pueden comparar los adeles en aritmética con los haces en geometrı́a analı́tica, a condición de reemplazar la cohomologı́a de haces por el análisis”. A pesar de toda esta propaganda la definición del conjunto de adeles que denotaremos con A, no es complicada. En Q es el conjunto formado por “vectores infinitos” x = (x0 , x1 , x2 , . . . ) de Q∞ × Q2 × Q3 × Q5 × . . . (recuérdese que Q∞ = R) tales que kxj kpj ≤ 1 para todo j ≥ 1 salvo un número finito de excepciones. Esto significa que x0 ∈ R y xj ∈ Zpj , j ≥ 1, excepto para una cantidad finita de valores de j. En Q(i) la definición es similar salvo que ahora las valoraciones no arquimedianas están asociadas a primos gaussianos, ası́ A ⊂ Q∞ (i) × Qπ1 (i) × Qπ2 (i) × Qπ3 (i) × . . . En general, dado un cuerpo de números K siempre hay una cantidad numerable de lugares y sólo un número finito de ellos corresponden a valoraciones arquimedianas (a “primos del infinito”). Si se denotan por K0 , K1 , K2 , . . . los cuerpos completados con respecto a cada uno de los lugares, entonces A es el subconjunto de K0 × K1 × K2 × . . . formado por los vectores infinitos x con kxj kj ≤ 1 excepto para una cantidad finita de ı́ndices. Operando coordenada a coordenada A adquiere una estructura de anillo. El conjunto de ideles (¿idèles?), que denotaremos con I, es el grupo multiplicativo formado por las unidades A∗ , es decir, son vectores infinitos x de coordenadas no nulas tales que kxj kj = 1 salvo para una cantidad finita de ı́ndices j. Hay una inyección natural de K en el conjunto de adeles K −→ A x 7→ (x, x, x, . . . ) 8 que aplica K ∗ = K − {0} dentro de I. Por ejemplo, en Q la imagen de x = 33/100 está en A porque kxk2 = 4, kxk5 = 25 y para el resto de los primos kxkp ≤ 1 porque no dividen al denominador. De hecho kxk3 = 3−1 , kxk11 = 11−1 y kxkp = 1 si p 6= 2, 3, 5, 11 (además para “p = ∞”, kxk∞ = 00 33), entonces la imagen de x está en I. La norma Y kxk = kxj kj j está bien definida en I, pues en el producto casi todos los factores son unos, y por la fórmula producto, que se cumple en general, K ∗ está dentro del núcleo del homomorfismo I −→ (R∗ , ·) que define esta norma. El objetivo es hacer análisis armónico en A y en I, para lo cual no basta con una descripción conjuntista o algebraica, es necesaria una topologı́a. En cada coordenada de A se tiene una topologı́a Tj inducida por una valoración k · kj . Se toma en A la topologı́a generada por la base de abiertos {U0 × U1 × U2 × . . . } donde para todas las valoraciones arquimedianas y un número finito de las no arquimedianas Uj ∈ Tj mientras que en el resto de los casos Uj = {x : kxkj ≤ 1}. La topologı́a en I es similar pero ahora en casi todos los casos Uj = {x : kxkj = 1}. Un comentario un poco técnico, pero nada profundo, es que a pesar de que I ⊂ A como conjuntos, no es ası́ como espacios topológicos. Es decir, la topologı́a en I no es la topologı́a relativa inducida por la de A (hay un ejemplo en la p.50 de [Sw]). Todo este lı́o topológico, desde el punto de vista del análisis armónico se reflejará en que los caracteres de A son productos de los caractares de cada coordenada, eligiendo todos triviales excepto un número finito de ellos. Además las medidas de Haar en A y en I son el producto de las medidas de Haar (aditivas y multiplicativas respectivamente). Las demostraciones detalladas están en [Ra-Va] §5.1. La idea subyacente es que al limitar mucho los abiertos reduciéndolos en casi todas las coordenadas a uno no trivial, limitamos mucho la posibilidad de funciones regulares no constantes en cada coordenada. El concepto topológico y algebraico natural para extasiarse con estas demostraciones, que ya aparece en el original de Tate [Ca-Fr], es el de producto directo restringido. Analicemos con más detalle la estructura del conjunto de caracteresQen A. Si el cuerpo de base s Q, los caracteres en A serán de la forma e(ξ0 x0 ) e(λ(ξj xj )) con casi todos los términos del producto iguales a uno, lo cual está asegurado si casi todo ξj ∈ Zpj . Esto permite asignar a cada (ξ0 , ξ1 , ξ2 , . . . ) ∈ A un carácter y para que esta asignación tenga cierta buena propiedad que veremos a continuación es conveniente cambiar el signo de ξ0 . Es decir, a ξ = (ξ0 , ξ1 , ξ2 , . . . ) ∈ A se le asigna el carácter Y ψξ (x) = e(−ξ0 x0 ) e(λ(ξj xj )). j 9 b y la buena propiedad a la La aplicación ξ 7→ ψξ muestra que A es isomorfo a A que nos hemos referido es que ψ1 valga uno en Q (considerado como subconjunto de A) donde 1 = (1, 1, 1, . . . ). Por ejemplo, si x = (7/6, 7/6, 7/6, . . . ) entonces λ(7/6) = 1/2 para p = 2, λ(7/6) = 2/3 para p = 3 y λ(7/6) = 0 en el resto de los casos, y se tiene ψ1 (x) = e(−7/6 + 1/2 + 2/3) = 1. El caso general es un sencillo cálculo con congruencias (ejercicio). En Q(i), teniendo en cuenta que C = R⊕R, el carácter de la primera coordenada de A (correspondiente a C) deberı́a escribirse como χ(x10 + ix20 i) = e(ξ01 x10 + iξ02 x20 ) pero de nuevo para preservar la buena propiedad ψ1 = 1 (y un poco más en este caso), se introduce un coeficiente 2 y se cambia un signo. Aquı́ la simetrı́a es más patente porque se pueden escribir todos los factores de ψξ en términos de la traza: Y ψξ (x) = e(−TrC/Q (ξ0 x0 )) e λ(TrQ (i)/Q (ξj xj )) . p πj p j Nótese que TrC/Q (ξ01 + iξ02 )(x10 + ix20 ) = 2ξ01 x10 − 2ξ02 x20 . p Los caracteres en A permiten definir la transformada de Fourier. Dada una función de la forma F : A −→ C ∞ Y (x0 , x1 , x2 , . . . ) 7→ fj (xj ) j=0 en el caso de Q su transformada de Fourier es Z ∞ Z Y fj (xj )e(−λ(ξj xj )) dµj (xj ), Fb(ξ) = F (x)ψξ (x) dµ(x) = fe0 (x0 ) j=1 Qpj donde fe0 (x0 ) = fb0 (−x0 ) con fb0 la transformada de Fourier clásica. Los factores en el producto son las transformadas de Fourier p-ádicas. Estos dos tipos de transformadas cumplen la fórmula de inversión con constante 1 y el cambio fe0 ↔ fb0 no modifica esta propiedad (el cambio de signo es involutivo). Por tanto Fb también satisface la fórmula de inversión con constante 1. Un comentario adyacente respecto a la regularidad es que la existencia de Fb queda asegurada exigiendo que f0 sea de decaimiento rápido (de la clase de Schwartz) y que el resto de las fj tengan soporte compacto en Qpj y de hecho que salvo un número finito sean la función caracterı́stica de Zpj . Con ello el producto infinito acaba siendo un producto de unos (véase la primera parte). Las funciones con tal regularidad se dice que están en la clase (adélica) de Schwartz-Bruhat. Condiciones tan férreas no debieran sorprender mucho dado lo poco fina que es la topologı́a en A en comparación con la topologı́a producto. 10 En Q(i) el convenio sobre la medida de Haar en el caso especial π = 1 + i nos permitió salvar la fórmula de inversión con constante 1 para los lugares no arquimedianos, pero ahora el primo del infinito requiere unas consideraciones más cuidadosas que en Q. Si ξ0 = ξ01 + iξ02 , x0 = x10 + ix20 entonces la transformada de Fourier asociada al carácter e(−TrC/Q (ξ0 x0 )) p Z ∞ Z ∞ T f0 (ξ0 ) = −∞ −∞ f0 (x0 )e(TrC/Q (ξ0 x0 )) dx10 dx20 p no satisface la fórmula de inversión con constante 1 sino con constante 4 (ejercicio). Para subsanar esta anomalı́a es obligado reemplazar la medida de Haar natural de C, dx10 dx20 (el área), por su doble dµ0 (x0 ) = 2dx10 dx20 , con ello Z e f0 (ξ0 ) = f0 (x0 )e(TrC/Q (ξ0 x0 )) dµ0 (x0 ) p C es la transformada de Fourier buena en C (en la p.129 de [Sw] aparentemente hay una errata). Para F como antes, en el caso de Q(i) la transformada de Fourier en A es Z b F (ξ) = F (x)ψξ (x) dµ(x) ∞ Z Y e fj (xj )e − λ(TrQ (i)/Q (ξj xj )) dµj (xj ). = f0 (x0 ) πj p j=1 Qπj (i) Una de las buenas propiedades que se puede obtener a partir de la fórmula de inversión con constante 1 es que µ(A/K) = 1 con µ la medida inducida por la de Haar en A. Para practicar con el significado de este cociente probaremos aquı́ este resultado para K = Q y K = Q(i) con cálculos directos, sin emplear análisis armónico. Si K = Q, dado (x0 , x1 , x2 , . . . ) ∈ A sólo un número finito de las xj con j ≥ 1 tiene “parte fraccionaria” no nula, esto es, λ(xj ) 6= 0. Escogiendo x ∈ Q igual a la suma de estas partes fraccionarias se sigue (x0 − x, x1 − x, x2 − x, x3 − x, . . . ) ∈ R × Z2 × Z3 × Z5 × . . . Además los x con esta propiedad están totalmente determinados salvo por la suma de un entero, por consiguiente A/Q = T × Z2 × Z3 × Z5 × . . . 11 con T = R/Z (un purista puede cambiar la igualdad por un isomorfismo y homeomorfismo, y de paso mejorar la notación A/Q que usamos sin explicaciones). De aquı́, si µp es la medida de Haar normalizada en Qp , Y µ(A/Q) = 1 · µp (Zp ) = 1. p En el caso K = Q(i) se procede igual, salvo que ahora µ1+i (Z1+i [i]) = 1/2 y el factor arquimediano es C/Z × Z que mide 2 con la medida µ0 , entonces 1 · 1 · 1 · · · · = 1. 2 Es chocante a primera vista que el convenio de normalización para µ0 haya compensado exactamente el de µ1+i . µ(A/Q(i)) = 2 · 4. Funciones zeta globales Dada una función suficientemente regular F : A −→ C le asignaremos la función zeta global Z F (x)kxks dµ∗ (x). Z(F, s) = I ∗ Aquı́ dµ es la medida de Haar en I que coincide con el producto de la medidas de Haar (multiplicativas) en cada coordenada. Si consideramos funciones que factorizan y son tan buenas como las de la clase de Schwartz-Bruhat mencionadas anteriormente, ∞ Z Y Z(F, s) = fj (xj )kxksj dµ∗j (x − j) j=0 Kj∗ y esto define una función analı́tica en algún semiplano <s > σ0 . Ası́, la función zeta global para K = Q y K = Q(i) es esencialmente el producto de las funciones zeta locales que ya habı́amos calculado aunque evidentemente hay una dependencia en la función F escogida. 2 Por ejemplo, en Q, tomemos f0 (x) = e−πx , que cumple f0 = fe0 = fb0 , y el resto de las fj iguales a las funciones caracterı́sticas de Zpj , que también cumplen fj = fbj . Con un cambio de variable sencillo se lleva a cabo el cálculo Z ∞ Z −s/2 s dx0 =π e−t ts/2−1 dt = π −s/2 Γ(s/2). f0 (x0 )|x0 | |x0 | 0 R∗ Q Entonces para F = fj Y Z(F, s) = π −s/2 Γ(s/2) Zp (s) = π −s/2 Γ(s/2)ζ(s). p 12 ¡La función ζ de Riemann con el mismo factor que aparece en la ecuación funcional! 2 2 En Q(i) tomemos f0 (x + iy) = e−2π(x +y ) que cumple f0 = fe0 , y el resto de las fj iguales a las funciones caracterı́sticas de Zπj , que análogamente cumplen fj = fbj excepto para π = 1 + i donde hay un 2 que no encaja. De nuevo un cambio de variable lleva a Z Z ∞ 1 2 2 2 s 2dxdy f0 (x + iy)(x + y ) 2 = 4π e−2πr r2s−1 dr = (2π)1−s Γ(s) 2 x +y 2 C∗ 0 y se tiene Y 1 Zπ (s) = 2−s π 1−s Γ(s)ζZ[i] (s) Z(F, s) = (2π)1−s Γ(s) 2 π con ζZ[i] la función ζ de Dedekind en Z[i]. Esta vez el éxito es parcial porque sobra el factor 2−s para que se obtenga lo que aparece en la ecuación funcional. El éxito de la tesis de Tate fue deducir la extensión analı́tica y la ecuación funcional de una amplia familia de funciones L a partir de la fórmula de sumación de Poisson en los adeles. Los factores de la ecuación funcional provienen de los lugares arquimedianos y de otros correspondientes a primos con propiedades excepcionales. En el ejemplo anterior, 2−s se compensa justamente con el precio que hay que pagar por fj 6= fbj para π = 1 + i. Para ser más concretos, Tate consideró funciones zeta globales más generales: Z Z(F, s) = F (x)χ(x)kxks dµ∗ (x) I donde χ es un carácter (multiplicativo) en I que es trivial en K ∗ . Bajo condiciones de regularidad sobre F (digamos como las mencionadas antes), esto define una función holomorfa en <s > σ0 . Lo que Tate prueba es que Z tiene una extensión meromorfa con a lo más dos polos simples en s = 0 y en s = 1, y que se cumple la ecuación funcional Z(F, χ, s) = Z(Fb, χ b, 1 − s) donde χ b(x) = χ(x−1 ). En Q habı́amos escogido F = Fb (y χ el carácter trivial). Por ello Z(F, s) = π −s/2 Γ(s/2)ζ(s) es invariante al cambiar s por 1−s. En Q(i) no se tiene exactamente F = Fb porque el factor correspondiente a π = 1+i falla, y en el cálculo de Z(Fb, χ b, s) debemos reemplazar la zeta local Z1+i por un nuevo factor: Z Y 1 1−s b Z(F , χ b, s) = (2π) Γ(s) Zπ (s) · g(x)kxks1+i dµ∗1+i (x) ∗ 2 Z1+i [i] π6=1+i 13 donde g es la transformada de Fourier de la función caracterı́stica de Z1+i [i], que como habı́amos visto era la función caracterı́stica de 2−1 Z1+i [i]. Esto permite deducir que la integral anterior es 22s−1 /(1 − 2−s ) (ejercicio). Ası́ pues Y Z(Fb, χ b, s) = 2s−1 π 1−s Γ(s)(1 − 2−s )−1 Zπ (s) = 2s−1 π 1−s Γ(s)ζZ[i] (s). π6=1+i Entonces la igualdad Z(F, χ, s) = Z(Fb, χ b, 1 − s) se lee como π 1−s Γ(s)ζZ[i] (s) = π s Γ(1 − s)ζZ[i] (1 − s). Escogiendo caracteres χ no triviales surgen funciones Z distintas de la ζ de Dedekind que permiten estudiar problemas relacionados con el grupo de clases. Incluso en Z[i], con una elección adecuada de χ, se puede probar la equidistribución angular de los primos gaussianos. Referencias [Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic Press, London; Thompson Book Co., Inc., Washington, D.C. 1967. [Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999. [Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145. [Sp] M. Spivak. Calculus. Reverté. Barcelona 1984. [Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001. 14