La tesis de Tate I

Anuncio
La tesis de Tate I
1.
Recordando los p-ádicos
En principio los números p-adicos (p es primo) son una notación conveniente para
hablar simultáneamente de las soluciones de una ecuación módulo p, p2 , p3 ,. . . Por
ejemplo, la ecuación x2 = −1 tiene la solución x1 = 2 módulo 5, la cual se puede
“elevar” de forma única a la solución x2 = 7 = 2 + 1 · 5 módulo 52 , y ésta a
x3 = 57 = 2 + 1 · 5 + 2 · 52 módulo 53 . este procedimiento repetido hasta el infinito
lleva a que el “número 5-ádico”
x = 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + 4 · 55 + . . .
es solución de la ecuación x2 = −1. Lo que se quiere decir con esto es que tomando
los n primeros sumandos tenemos una solución xn , módulo 5n .
En general, dado un primo p el conjunto Zp de enteros p-ádicos es el formado
por las series formales evaluadas en x = p con coeficientes en {0, 1, 2, , . . . p − 1},
Zp = {a0 + a1 p + a2 p2 + a3 p3 + . . . : 0 ≤ aj < p}.
Evidentemente cada entero no negativo se puede considerar p-ádico escribiéndolo
en base p y tomando ak = 0 para k grande. En general hay una inyección natural
j : Z ,→ Zp en la que para cada r ∈ Z se considera xn ∈ {0, 1, 2, , . . . pn − 1} con
xn ≡ r (mod pn ) y las cifras de xn en base p son {a0 , a1 , . . . , an−1 }.
Si en Z se considera la norma multiplicativa dada por knkp = p−k si pk kn y
k0kp = 0, tendremos una distancia en Z, d(n, m) = kn − mkp y consecuentemente
una topologı́a métrica inducida en la que dos enteros están cercanos si son congruentes módulo una potencia de p grande. Teniendo en cuenta la inyección j, Zp es el
completado de Z, es decir, Zp es Z y todos los lı́mites de sucesiones de números enteros que a la larga sean congruentes módulo potencias de p arbitrariamente grandes.
n
n
Por ejemplo,
P∞ xn n= 10 +1 tiende a 1 en Z2 y la sucesión xn con 4xn +1 ≡ 0 (mod 5 )
tiende a n=0 5 en Z5 (ejercicio). La norma en Z induce la norma p-ádica en Zp
(
0
si x = 0
kxkp =
P
n
p−k si x = ∞
n=k an p con ak 6= 0
Hay una aparente similitud formal entre Zp y los números reales en [0, 1) escritos
en base p, sólo hay que cambiar las potencias de p−1 por potencias de p y los
an desempeñan el papel de cifras. Sin embargo topológicamente reales y p-ádicos
son muy diferentes. En los reales se cumple la bien conocida desigualdad triangular
|a + b| ≤ |a| + |b| y en los p-ádicos algo mucho más fuerte, la desigualdad ultramétrica
1
ka + bkp ≤ máx(kakp , kbkp ). Con ésta por ejemplo dados A y B a distancia d > 0 no
existe ningún punto medio M tal que su distancia a A y a B sea d/2. Las normas que
satisfacen la desigualdad ultramétrica se dice que son no arquimedianas. Según [Sw]
el nombre viene porque Arquı́medes escribió sobre números grandes y una norma
no Arquimediana tiene la propiedad de que knk permanece acotado.
Módulo pr se puede sumar, restar, multiplicar y muchas veces dividir, los únicos
denominadores problemáticos son los que contienen potencias de p. Por ello Zp es
un anillo y considerandos formalmente fracciones del tipo x/pm con x ∈ Zp , m ∈ N
se tiene un cuerpo, éste es Qp ,
Qp = {a−m p−m +a−m+1 p−m+1 +a−m+2 p−m+2 +· · ·+a0 +a1 p+a2 p2 +. . . : 0 ≤ aj < p}.
La norma kxkp también tiene sentido en Qp con la única diferencia de que k puede
ser negativo. Al igual que en Zp es multiplicativa:
kxkp kykp = kxykp .
También se puede extender la inyección j de forma que j : Q ,→ Qp . Por ejemplo
1/6 ∈ Q se puede escribir como (1/3)2−1 . En Z2 se cumple que 1/3 es 1 + 21 +
23 + 25 + 27 + . . . (¡comprobarlo!) por tanto el número racional 1/6 corresponde a
2−1 + 1 + 22 + 24 + 26 + . . .
La aspiración final al introducir los p-ádicos es muchas veces tratar de obtener información sobre soluciones enteras o racionales estudiando congruencias con
respecto a todos los módulos. Factorizando, por el teorema chino del resto, basta
considerar módulos que sean primos o potencias de primos, y como hemos visto en
el primer ejemplo, a veces lo que ocurre módulo pk condiciona lo que ocurre módulo
pk+1 y todas estas congruencias quedan resumidas en un número p-ádico El esquema
de reflejar fielmente las soluciones enteras en soluciones p-ádicas rara vez tiene un
éxito completo (lo que se llama un principio local-global ), por ejemplo, se pueden
dar ecuaciones cúbicas en dos variables que no tienen soluciones en Q pero sı́ en
todos los Qp (y en R).
Los p-ádicos están entre lo continuo y lo discreto, por una parte se puede hacer
análisis en ellos y por otra representan soluciones de congruencias con módulo variable. Vistas la aplicaciones que tienen uno podrı́a replantearse la frase incial, ¿hasta
que punto son una notación o un objeto matemático con entidad propia? ¿Cuando
pensamos en un número real imaginamos que es sólo una notación para una familia
de sucesiones de Cauchy de racionales?
Bibliografı́a: [Ca1], [Ca2], [Sw].
2
2.
Análisis armónico en grupos
Las funciones de L2 (T) se analizan en términos de e(nx), las de L2 (R) con e(ξx)
a través de la transformada de Fourier, las funciones definidas en (Z/qZ)∗ con los
caracteres de Dirichlet, las de Z/qZ con raı́ces de la unidad a través de la transformada de Fourier discreta. Todos estos ejemplos y otros que veremos más adelante se
pueden unificar desarrollando el análisis de Fourier en grupos. Aquı́ nos centraremos
en el caso abeliano pero hay también una teorı́a no abeliana en la que aparecen las
representaciones (véanse algunos comentarios y ejemplos en [Dy-Mc]).
En primer lugar, antes de hacer análisis se necesita una topologı́a que debe ser
compatible con la operación de grupo. Si (G, ∗) es el grupo abeliano a considerar,
exigimos que las funciones a(x, y) = x∗y, b(x) = x−1 sean continuas con la topologı́a
escogida. Además es necesaria una condición técnica y es que el espacio topológico
obtenido sea localmente compacto (cada punto tiene algún entorno abierto contenido
en un compacto) y Hausdorff. Con todo esto se dice que G es un grupo abeliano
localmente compacto.
Los grupos abelianos finitos (sumas directas de Z/qZ) quedan totalmente determinados por sus grupos de caracteres y a su vez éstos sirven para analizar todas
las funciones de ellos en C. Lo que intentamos es copiar este esquema a la situación general. Cuando G es un grupo abeliano localmente compacto se dice que una
función
χ : G −→ {z ∈ C : |z| = 1}
es un carácter si es un homomorfismo continuo. Si el grupo es finito, la única topologı́a posible es la discreta (todo es abierto) y la continuidad es superflua, con lo
que se vuelve al concepto clásico de carácter.
b es un grupo con el producto
El conjunto de caracteres de G, denotado con G,
de funciones que se puede dotar de la topologı́a llamada compacta-abierta con la
que dos funciones están cercanas si su diferencia es pequeña en compactos grandes.
Si G no fuera localmente compacto esta comparación de caracteres serı́a imposible
porque la diferencia podrı́a no estar acotada incluso en entornos arbitrariamente
pequeños.
Veamos algunos ejemplos sencillos:
Ejemplo 1. (R, +).
Cada carácter se puede escribir como χ(x) = e(f (x)) con f continua. La condición de homomorfismo requiere χ(0) = 1 y podemos suponer f (0) = 0, además
f (x) + f (y) = f (x + y). Entonces f es necesariamente lineal ([Sp], Cap.8, Ej.7). Por
3
tanto
b = {χξ con χξ (x) = e(ξx), ξ ∈ R}.
G
Ejemplo 2. (T, +).
El argumento es el mismo pero ahora ξ debe ser entero para que χ esté bien
definida en T, entonces
b = {χn con χn (x) = e(ξn), n ∈ Z}.
G
Ejemplo 3. (R+ , ·).
Este ejemplo se reduce al primero notando que φ(x) = log x establece un isomorfismo φ : (R+ , ·) −→ (R, +) y los caracteres en (R+ , ·) son simplemente χξ (log x),
b = {cξ con cξ (x) = xiξ , ξ ∈ R}.
G
Ejemplo 4. (Z/qZ, +).
El grupo está generado por 1 que es de orden q, ası́ que χ(1) debe ser de la
forma e(m/q) para que el orden divida a q. La propiedad de homomorfismo implica
n
χ(n) = χ(1) y por tanto
b = {χm con χm (n) = e(mn/q), 0 ≤ m < q}.
G
Ejemplo 5. ((Z/pZ)∗ , ·).
Se tiene el isomorfismo φ : (Z/(p − 1)Z, +) −→ ((Z/pZ)∗ , ·) que actúa como
φ(n) = g n donde g es una raı́z primitiva (generador del grupo multiplicativo). Los
caracteres son entonces
b = {χj con χj (n) = e(j indg (n)/(p − 1)), 0 ≤ j < p − 1},
G
es decir, los caracteres de Dirichlet (para módulo q = p primo) [Da] p.37.
Ahora queremos definir una medida que sea compatible con la operación de
grupo para poder integrar sobre él. Ésta es la llamada medida de Haar. Para ser
más precisos, se dice que una medida de Radon (positiva) es una medida de Haar
en un grupo abeliano localmente compacto (G, ∗) si para todo conjunto medible E
se cumple µ(E) = µ(g ∗ E).
En el caso de (R, +) la medida de Lebesgue es una medida de Haar y se puede
entender la invariancia por traslaciones como la igualdad entre diferenciales dx =
d(x − x0 )
Z
Z
Z
µ(E) =
1 dx =
1 d(x − x0 ) =
1 dx = µ(x0 + E).
E
x0 +E
x0 +E
4
Esta medida de Haar pasa a (T, +) por el homomorfismo natural (R, +) −→ (T, +).
También (R+ , ·) hereda esta medida a través del isomorfismo φ(x) = log x, es decir,
Z
Z
dx
.
µ(E) =
dφ(x) =
E
E x
La invariancia se puede ver como la identidad diferencial x−1 dx = (λx)−1 d(λx).
En grupos finitos, la medida de Haar es una
P trivialidad porque se tiene que
cumplir µ({1}) = µ({g ∗ 1}) = µ({g}) y como g∈G µ({g}) = µ(G) estos valores
no pueden ser nulos. Se tiene por tanto que cualquier medida de Haar en un grupo
finito es, salvo multiplicar por una constante, la medida de contar. En general, si
G es discreto (si tiene la topologı́a discreta) un argumento similar lleva a la misma
conclusión.
A este nivel las preguntas básicas son las siguientes:
a) ¿Existe siempre una medida de Haar?
b) ¿Es única?
c) ¿Cómo se halla?
Las dos primeras preguntas las responde un teorema que afirma que para grupos
abelianos localmente compactos (de hecho también para los no abelianos) existe una
medida de Haar y cualquier otra es un múltiplo suyo [Ra-Va] p.12. La demostración
no es fácil pero mirando la parte de existencia desde lejos uno llega a la conclusión
de que por el teorema de representación de Riesz [Ru] basta hallarPun funcional
lineal invariante por el grupo. Moralmente el candidato es L[f ] = g∈G f (g ∗ x)
pero esto habitualmente no tiene sentido si G no es finito y aparecen sumas finitas,
aproximaciones, supremos y demás.
La tercera pregunta se puede eludir con unas consideraciones filosóficas. ¿Qué es
hallar una medida? Nos parece que la medida de Lebesgue es tangible y que en los
ejemplos 1, 2 y 3 hemos hallado realmente la medida de Haar pero ¿cómo calculamos
la medida de un conjunto? No hay ninguna forma clara. Si queremos medir el conjunto de Cantor ponemos y quitamos intervalitos usando las propiedades aditivas de
la medida y que [a, b] mide b − a. Cuando nos enfrentemos a la medida de Haar en
Qp o en los adeles, haremos algo parecido, sabremos la medida de algunos intervalitos (en realidad bolas) y todos los conjuntos que mediremos serán uniones de ellos.
De este modo, esta medida la habremos hallado tanto o tan poco como la usual de
Lebesgue. Por mucha teorı́a de la medida que sepamos, decir que el área del cı́rculo
es πR2 sigue siendo una genialidad de Arquı́medes y todas nuestras σ-álgebras son
inútiles porque el cı́rculo no es unión de unos pocos cuadraditos.
5
Con todo esto se puede definir una transformada de Fourier
Z
b
f (χ) =
f (x)χ(x) dµ
G
b Sin entrar en detalles, supondremos siempre
donde µ es la medida de Haar y χ ∈ G.
que f es suficientemente buena como para que no haya problemas con la convergencia
de las integrales. el gran teorema es que se comporta como la transformada de Fourier
de siempre, es decir, que para f con regularidad suficiente se cumple la fórmula de
inversión
Z
fb(χ)χ(x) dν
f (x) = C
b
G
b y C es una constante que normalizando adecuadonde ν es la medida de Haar en G
damente las medidas µ y ν se puede escoger como 1.
b es discreto y por
Todavı́a hay más, si G es compacto, se puede probar que G
tanto la integral anterior es una suma (la medida es la de contar).
Veamos lo que quiere decir esto en los ejemplos anteriores.
Ejemplo 1.
Como ya hemos observado, dµ = dx es la medida de Lebesgue. Por otro lado la
b dada por φ(ξ) = χξ es claramente un isomorfismo, y también
aplicación φ : R −→ G
un homomorfismo (ξ1 y ξ2 cercanos ⇒ χξ1 y χξ2 cercanos) por tanto la medida de
Haar es la inducida por la de Lebesgue. Se tiene entonces la fórmula de inversión de
toda la vida:
Z
Z
fb(ξ)e(xξ) dξ
fb(ξ) =
f (x)e(−ξx) dx,
f (x) = C
R
R
b con R. Es fácil ver que (por ejemplo eligiendo como f
donde se ha identificado G
una gaussiana) C = 1.
Ejemplo 2.
b como antes es Z en lugar de R. Como Z
Ahora el grupo que “parametriza” G
es discreto, la medida es la de contar (esto es consecuencia de que T es compacto).
Por tanto
Z
X
fb(n) =
f (x)e(−nx) dx,
f (x) = C
fb(n)e(nx).
T
n∈Z
De nuevo C = 1 y se tiene el análisis armónico clásico para funciones 1-periódicas.
6
Ejemplo 3.
El isomorfismo (R+ , ·) ∼
= (R, +) permite repetir el primer ejemplo cambiando lo
que hay que cambiar, llegándose a
Z
Z
−iξ dx
b
,
f (x) = C
fb(ξ)xiξ dξ
f (ξ) =
f (x)x
+
x
R
R
Esto parece nuevo, pero si escribimos s = −iξ veremos que esconde un viejo conocido: la transformada de Mellin. La constante es C = 1/2π en este caso.
Ejemplo 4.
b es la discreta por ser grupos finitos y por tanto µ y ν son
La topologı́a de G y G
las medidas de contar. Se sigue
fb(m) =
q−1
X
f (n)e(−nm/q),
f (n) = C
n=0
q−1
X
fb(m)e(nm/q).
m=0
Ésta es la transformada de Fourier discreta y es fácil ver que C = 1/q (basta tomar
f ≡ 1, entonces fb(0) = q y se anula en el resto).
Ejemplo 5.
Es similar al ejemplo anterior,
fb(j) =
p−1
X
f (n)χj (n),
f (n) = C
n=1
p−2
X
fb(j)χj (n).
j=0
Nótese que ésta fórmula se puede demostrar a partir de las relaciones de ortogonalidad. Como antes, se tiene C = 1/(p − 1).
Bibliografı́a: [Ka] (sólo una brevı́sima introducción), [Ra-Va].
3.
Ejercicios de análisis en los p-ádicos
Al ser Qp un cuerpo, hay dos tipos de grupos que se pueden considerar, el aditivo
y el multiplicativo. Sólo describiremos el grupo de caracteres del primero a pesar
de que en la tesis de Tate aparecen algunos caracteres multiplicativos sencillos (¿se
pueden describir fácilmente todos? quizá el comentario acerca de Jbk en [Sw] p.128 sugiera
que no). El procedimiento será “artesanal” sin emplear apenas ninguna maquinaria
teórica.
Sea χ un carácter en (Qp , +). Supongamos primero que χ(1) = 1, entonces por
la propiedad de homomorfismo χ(pn ) = 1 para n ∈ N, ası́ pues, para cualquier
x = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 + a0 + a1 p + a2 p2 + . . .
7
se tiene χ(x) = χ(λ(x)) donde λ(x) es la “parte fraccionaria” de x,
λ(x) = a−m p−m + a−m+1 p−m+1 + · · · + a−1 p−1 .
Como 1 = p−1 + p .veces
. . + p−1 entonces 1 = (χ(p−1 ))p , es decir, χ(p−1 ) es una raı́z
p-ésima de la unidad, digamos χ(p−1 ) = e(x0 /p), 0 ≤ x0 < p. De la misma forma
debe cumplirse χ(p−2 ) = e(x1 /p2 ) con 0 ≤ x1 < p2 , y para preservar la relación
χ(p−1 ) = (χ(p−2 ))p es necesario x1 ≡ x0 (mod p). En general χ(p−k−1 ) = e(xk /pk+1 )
con xk ≡ xk−1 (mod pk ). Esta sucesión
P x0 , x1 , x2 , . . . determina un entero p-ádico
ξ = b0 + b1 p1 + b2 p2 + . . . con xk = kr=0 br pr y por tanto χ(p−k−1 ) = e(λ(ξ/pk+1 )).
De aquı́ se deduce que cualquier carácter con χ(1) = 1 es de la forma
χ(x) = e(λ(ξx)).
¿Y si χ(1) 6= 1? Siempre χ(1) debe ser una raı́z pr -ésima de la unidad, porque
pn → 0 en Qp cuando n → ∞, implica por la continuidad de los caracteres que
n
χ(1))p → 1 en C. Si es una raı́z pr -ésima de la unidad, χ(pr ) = 1 y el mismo
argumento se puede aplicar salvo que ahora hay ı́ndices desplazados r unidades:
χ(pr−1 ) = e(x0 /p), χ(pr−2 ) = e(x1 /p2 ), etc. lo que se refleja en que pr ξ ∈ Zp . En
definitiva, los caracteres son los mismos que hemos hallado pero ahora ξ puede estar
en Qp , no necesariamente en Zp . Con sı́mbolos:
b p = {χξ con χξ = e(λ(ξx)), ξ ∈ Qp }.
Q
b p ya
La aplicación ξ 7→ χξ da un isomorfismo de Qp en su grupo de caracteres Q
que χξ+η = χξ χη . Se prueba que también es un homeomorfismo y en este sentido Qp
es su propio grupo de caracteres.
Estudiemos ahora las propiedades de la medida de Haar µ. al ser Zp compacto
en Qp (ejercicio) su medida debe ser finita (por definición de medida de Radon) y
por tanto se puede normalizar µ de forma que
µ(Zp ) = 1.
Nótese que Zp = {x ∈ Qp : kxkp ≤ 1} y la propiedad caracterı́stica de la medida
de Haar implica que todas las bolas cerradas de radio 1 también miden uno (son
trasladados de Zp ). Calculemos ahora la medida del resto de las bolas cerradas. Por
supuesto basta considerar las de radio r = p−k , k ∈ Z.
Si por ejemplo k = 1,
p−1
Zp =
[
p−1
1
2
{a0 + a1 p + a2 p + . . . } =
a0 =0
[
{x ∈ Qp : kx − a0 kp ≤ p−1 }
a0 =0
8
y teniendo en cuenta la invariancia por traslaciones,
1 = pµ({x ∈ Qp : kxkp ≤ p−1 }) ⇒ µ({x ∈ Qp : kxkp ≤ p−1 }) = p−1 .
Para k = −1,
p−1
[
{x ∈ Qp : kxkp ≤ p} =
{x ∈ Qp : kx −
a−1 =0
a−1
kp ≤ 1}
p
de donde µ({x ∈ Qp : kxkp ≤ p}) = p.
Con otros exponentes se razona de forma análoga y se tiene en general que la
medida de una bola cerrada B r de radio r es
para r = p−k , k ∈ Z.
µ(B r ) = r
e(E) = µ(αE) define otra medida de Haar
Dado α ∈ Q∗p = Qp − {0}, claramente µ
en Qp y por la unicidad debe cumplirse µ
e = λα µ. Por el cálculo hecho con las bolas
cerradas, se cumple λα = kαkp . Se puede entender esto como la fórmula de cambio
de variable para cambios lineales:
dµ(αx) = kαkp dµ(x).
Esto implica que
Z
∗
µ (E) = λ
E
dµ(x)
kxkp
define una medida de Haar en el grupo multiplicativo (Q∗p , ·) para cada λ ∈ R+ . Esta
medida se suele normalizar de forma que Z∗p (los elementos invertibles en Zp , esto
es, los que cumplen kxkp = 1) midan uno, lo cual requiere λ = p/(p − 1). Veamos el
cálculo como ejemplo:
Z
Z
dµ(x)
∗
∗
−1
µ (Zp ) = 1 ⇔ λ =
=
dµ(x) = µ(Z∗p ).
kxk
∗
∗
p
Zp
Zp
Con la descomposición Zp = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . y la fórmula de cambio de
variables antes mencionada,
1 = µ(Zp ) =
∞
X
µ(p
k
k=0
Z∗p )
=
µ(Z∗p )
∞
X
k=0
y entonces λ = (1 − p−1 )−1 .
9
p−k
Volviendo al caso aditivo, comprobemos que la fórmula de inversión se cumple
con constante C = 1, es decir,
Z
Z
f (x)e(−λ(ξx)) dµ(x),
f (x) =
fb(ξ)e(λ(xξ)) dµ(ξ).
fb(ξ) =
Qp
Qp
Para la prueba de que la constante es 1 basta verificar esta fórmula para alguna
función (no idénticamente nula). Tomaremos
(
1 si x ∈ Zp
f (x) =
0 si x 6∈ Zp
que es relevante en la tesis de Tate.
De la igualdad
Z
Z
b
e(−λ(ξx)) dµ(x) =
f (ξ) =
e(−λ(λ(ξ)x)) dµ(x) = fb(λ(ξ))
Zp
Zp
se deduce fb(ξ) = fb(0) = 1 para ξ ∈ Zp . En el resto de los casos basta considerar
ξ = m/pk con p 6 |m, k ∈ Z+ . Se tiene
fb(m/pk ) =
Z
e(−λ(mx/pk )) dµ(x) =
Zp
pk −1 Z
X
e(−λ(mx/pk )) dµ(x).
n+pk Zp
n=0
Con la traslación x 7→ x − n y el cambio x 7→ pk x esto es igual a
pk −1
X
k
pk −1
Z
k
e(−mn/p )
e(−λ(mx/p )) dµ(x) =
p k Zp
n=0
X
k
Z
e(−mn/p )
p−k dµ(x)
Zp
n=0
que se anula por ser suma de las raı́ces de la unidad. Con ello hemos probado
fe(ξ) = f (ξ) y por tanto la constante en la fórmula de inversión es 1.
Para terminar creando un poco de intriga, calculemos la llamada “función zeta
local” correspondiente a Qp , que se define como
Z
Zp (s) =
kxksp dµ∗ (x).
Zp −{0}
Por la descomposición ya empleada Zp − {0} = Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . . se sigue
Z
∞ Z
∞
X
X
s
∗
−ks
Zp (s) =
kxkp dµ (x) =
p
dµ∗ (x)
=
k=0
∞
X
k=0
pk Z∗p
k=0
p−ks µ∗ (pk Z∗p ) =
∞
X
k=0
10
pk Z∗p
p−ks µ∗ (Z∗p ) = (1 − p−s )−1 .
Entonces la función zeta local es justo el trozo de la función zeta de Riemann que
corresponde al primo p.
Bibliografı́a: [Ca-Fr], [Ra-Va], [Ro], [Sw].
Referencias
[Ca1] J.W.S. Cassels. Diophantine equations with special reference to elliptic curves.
J. London Math. Soc. 41 1966 193–291.
[Ca2] J.W.S. Cassels. Lectures on elliptic curves. London Mathematical Society Student Texts, 24. Cambridge University Press, Cambridge, 1991.
[Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic
Press, London; Thompson Book Co., Inc., Washington, D.C. 1967.
[Da] H. Davenport. Multiplicative number theory. Graduate texts in Mathematics
74. Springer-Verlag, New York-Berlin, 1980.
[Dy-Mc] H. Dym, H.P. McKean. Fourier series and integrals. Academic Press, New
York-London, 1972.
[Ka] Y. Katznelson. An introduction to harmonic analysis. Dover Publications, Inc.,
New York, 1976.
[Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999.
[Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145.
[Ru] W. Rudin. Análisis real y complejo McGraw-Hill, 1987.
[Sp] M. Spivak. Calculus. Reverté. Barcelona 1984.
[Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London
Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001.
11
La tesis de Tate II
En vez de estudiar directamente la generalización de los p-ádicos en cualquier
cuerpo de números nos centraremos en Q(i). Hay dos particularidades que hacen que
sea más sencillo. La primera es que su grado sobre Q es pequeño y la segunda, la más
importante, es que su anillo de enteros Z[i] es un dominio de factorización única, por
lo cual se puede hablar sin peligro de números primos. La razón para detenernos en
este ejemplo es poder practicar con algunos cálculos explı́citos. Dentro de la teorı́a,
Q(i) no tiene ningún papel destacado y sacrificando los ejemplos, todo lo que se
cuenta aquı́ se podrı́a englobar en un marco general condensado en pocas páginas
[Ca-Fr], [Sw].
1.
p-ádicos gaussianos
Un entero p-ádico quedaba determinado por una sucesión de enteros x1 , x2 , x3 , . . .
tales que xn ≡ xn+1 (mod pn ). Se pueden escoger aj pertenecientes a un sistema
completo de restos módulo
0 ≤ aj < p, tales que x1 ≡ a0 (mod p) e
P p, digamos
j
n
inductivamente (xn+1 − j<n aj p )/p ≡ an (mod p) lo que conduce a la representaP
ción del entero p-ádico como una serie aj pj . No hay ninguna dificultad para
P copiar
esto en Z[i] y dado un primo gaussiano π definir los “enteros π-ádicos” j≥0 aj π j
donde los aj pertenecen a un sistema completo de restos módulo π, es decir, a un
conjunto de representantes de las clases de Z[i]/hπi.
Un entero positivo adquiere una representación p-ádica finita sin más que escribirlo en base p, como a0 + a1 p + a2 p2 + · · · + ak pk . En general se tiene una inyección
j : Z ,→ Zp donde los negativos tienen representaciónes infinitas. Por ejemplo en Z2 ,
−100 = 28 − 27 = 22 + 23 + 24 − 27 = 22 + 23 + 24 + 27 + 28 + 29 + 210 + 211 + . . .
P
j
donde se ha usado la identidad 2-ádica −1 = ∞
j=0 2 que harı́a las delicias de Euler
P
(nótese que d(−1, j<n 2j ) = 2−n , ejercicio). De la misma forma hay una inyección
j : Z[i] ,→ Zπ [i] donde Zπ [i] son los enteros π-ádicos antes definidos.
Por ejemplo, si π = 2+ i se tiene Z[i]/h2 + ii = {0, 1, 2, i, 1 + i}. Podemos utilizar
estos números como coeficientes para tratar de escribir un entero gaussiano en base π.
Hay números que, como antes los positivos, tendrán representaciones finitas mientras
que para otros serán infinitas. El proceso es algorı́tmico, esencialmente divisiones
sucesivas permitiendo sólo los restos 0, 1, 2, i, 1 + i. Ası́ para escribir la expresión
1
π-ádica de 100 se puede seguir el esquema:
100 = (40 − 20i)π + 0
40 − 20i = (12 − 16i)π + 0
12 − 16i = (1 − 9i)π + 1 + i
1 − 9i = (−2 − 4i)π + 1 + i
−2 − 4i = (−2 − i)π + 1
−2 − i = (−1)π + 0
→
→
→
→
→
→
100 = (40 − 20i)π
100 = (12 − 16i)π 2
100 = (1 + i)π 2 + (1 − 9i)π 3
100 = (1 + i)π 2 + (1 + i)π 3 + (−2 − 4i)π 4
100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (−2 − i)π 5
100 = (1 + i)π 2 + (1 + i)π 3 + π 4 − π 6
Se podrı́a seguir dividiendo −1 por π, con
P∞−1 j= (−1)π + 1 + i, o bien utilizar
directamente la identidad −1 = (1 + i) j=0 π (ejercicio), en cualquier caso se
concluye
100 = (1 + i)π 2 + (1 + i)π 3 + π 4 + (1 + i)π 6 + (1 + i)π 7 + (1 + i)π 8 + . . .
Enseguida veremos una pequeña sorpresa por la que los π-ádicos tienen representaciones mucho más sencillas de lo que sugiere el ejemplo anterior.
Al igual que en Z, cada primo gaussiano π da lugar a una norma multiplicativa
en Z[i],
kzkπ = (π · π)−k si π k ||z y k0kπ = 0.
La introducción del conjugado π asegura la positividad. Hay una distancia asociada
a esta norma y Zπ [i], que más propiamente deberı́a escribirse como (Z[i])π , es el
completado de Z[i] con ella. Considerando el cuerpo de fracciones de Zπ [i] o completando
P Q(i), se jobtiene el cuerpo Qπ (i), cuyos elementos se pueden escribir como
series j≥−m aj π con los aj como antes.
Estudiaremos ahora con un poco más de detalle cuáles son estos cuerpos, para
ello hay que recordar que los primos gaussianos son, salvo primos asociados, exactamente los descritos en los tres puntos siguientes, donde p representa a un primo
racional (p ∈ Z):
1)
2)
3)
p ≡ 3 (mod 4)
π ∈ Z[i] con ππ = p ≡ 1 (mod 4)
1+i
En el primer caso Z[i]/ < p >= Fp [i] = {a + ib : 0 ≤ a, b < p} y todos los
elementos de Qp (i) son de la forma
X
(aj + bj i)pn = α + iβ
j≥−m
2
con α, β ∈ Qp .
Nótese que i =
en este caso
√
−1 6∈ Qp porque −1 no es residuo cuadrático módulo p. Entonces
Qp (i) = {α + iβ : α, β ∈ Qp }
y [Qp (i) : Qp ] = 2.
En el segundo caso Z[i]/ < π > sólo tiene p elementos, la norma de π. De la
igualdad p = π · π está claro que Qp está incluido en Qπ (i). En este caso −1 es
residuo cuadrático módulo p y x2 ≡ −1 (mod
√ p) tiene dos soluciones que pueden
elevarse a soluciones p-ádicas, entonces i = −1 y π = a + bi están realmente en
Qp y lo mismo ocurre con todas las expresiones π-ádicas finitas de Qπ (i). Por la
compleción y doble inclusión se sigue
Qπ (i) = Qp .
Es instructivo ver las cuentas en un caso sencillo: si p = 5 y π = 2 + i, según se
calculó en la primera parte, 2 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . . es una solución en
Q5 de x2 = −1, por tanto este número 5-ádico es i o −i y {π, π} = {α, β} con
α = 4 + 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . .
− β = 1 · 5 + 2 · 52 + 1 · 53 + 3 · 54 + . . .
De kπkπ = 1 (porque 2 + i no divide a 2 − i) se deduce β 6= π, ası́ que π = β y
2
3
−i
+ . . . Con esto se puede transformar una serie del tipo
P = 2j + 1 · 5 + 2 · 5 + 1 · 5 P
aj π en otra de la forma
bj 5j con 0 ≤ bj < 5.
El último caso tiene particularidades de los dos anteriores, por un lado 2 =
(1 + i)(1 − i) pero a diferencia del análisis anterior, 1 + i y 1 − i no son coprimos,
k1 − ik1+i = 2−1 porque 1 − i = (−i)(1 + i) ası́ que no se puede proceder de la misma
forma. De hecho i 6∈ Q2 porque x2 ≡ −1 (mod 4) no tiene solución. Entonces
Q1+i (i) = {α + iβ : α, β ∈ Q2 }
y [Q1+i (i) : Q2 ] = 2 como en el primer caso. Si uno lo prefiere puede ver la igualdad
anterior explı́citamente a través de (1 + i)2k = ik 2k y (1 + i)2k+1 = (ik + ik+1 )2k .
2.
Caracteres y transformadas de Fourier
Si p ≡ 3 (mod 4), como grupo aditivo (y también como espacio vectorial sobre
Qp ) se tiene
Qp (i) ∼
= Qp ⊕ Qp
con el isomorfismo canónico α + iβ 7→ (α, β), que es homeomorfismo cuando se
incorpora la topologı́a. Esto implica que los caracteres de Qp (i) son productos de
caracteres de Qp , es decir,
[
Q
p (i) = ψη1 η2 con ψη1 η2 (α + iβ) = e(λ(η1 α) + λ(η2 β)),
3
η1 , η2 ∈ Qp
donde λ indica la “parte fraccionaria” de la anterior entrega. Lo mismo ocurre en
Q1+i (i). Por otro lado hemos visto que Qπ (i) = Qp cuando π · π = p ≡ 1 (mod 4) y
entonces en este caso los caracteres son ψξ (x) = e(λ(ξx)).
Si en el primer caso que hemos analizado se escribe ξ = (η1 − iη2 )/2, para
x = α+iβ ∈ Qp (i) se tiene ψη1 η2 (x) = e(2λ(<(ξx))). Este dos artificial causará algún
problema más adelante con la normalización de la medida de Haar pero permite la
siguiente descripción de los caracteres en todos los casos que es generalizable a otros
cuerpos de números. Para cualquier primo gaussiano π, se tiene
\
Q
π (i) = ψξ con ψξ (x) = e(λ(TrQ
π (i)/Qp
(ξx))),
ξ ∈ Qπ (i) .
Aquı́ Tr denota la traza, la suma de todos los conjugados. Sin entrar en tecnicismos,
TrQ (i)/Q (1) = [Qπ (i) : Qp ], y si i 6∈ Qp , TrQ (i)/Q (i) = 0, además la traza es
π
p
π
p
Qp -lineal. Se cumple que ξ 7→ ψξ establece, como en el caso de Q un isomorfismo y
homeomorfismo entre el grupo localmente compacto Qπ (i) y su grupo de caracteres.
Pasemos ahora a algunas consideraciones sobre la medida de Haar y a algunos
cálculos con la transformada de Fourier.
La normalización natural de la medida de Haar es µ(Zπ [i]) = 1 pero siguiendo
a Tate es conveniente hacer un ligero cambio para obtener fórmulas más simétricas
(véase el comentario en p.124 (v) de [Sw]). Independientemente de la normalización
se cumple
dµ(αx) = kαkπ dµ(x).
Esta fórmula se podrı́a haber usado para elegir la definición de kαkπ entre diferentes
posibilidades de normas multiplicativas. Por ejemplo, para π = p ≡ 3 (mod 4) puede
parecer poco natural kpkp = p−2 en vez de p−1 , como en Z, pero es necesaria para
respetar la anterior porque una bola cerrada de radio 1 es unión de p2 bolas unidad
disjuntas dilatadas multiplicando por p
p−1 p−1
{x ∈ Qp (i) : kxkp ≤ 1} = Zp [i] =
[ [
a0 =0 b0 =0
x − (a0 + b0 i) ≤1 .
x ∈ Qp (i) : p
p
Esto y la unicidad de la medida de Haar es suficente, como en la primera parte, para
demostrar que kαkπ es la constante correcta en este caso en el cambio de variables
de medidas. El resto de los casos es análogo.
Sea f la función caracterı́stica de Zπ [i]
(
1 si x ∈ Zπ [i]
f (x) =
0 si x ∈
6 Zπ [i]
4
Calculemos su transformada de Fourier bajo la normalización µ(Zπ [i]) = 1 que
después modificaremos ligeramente.
Si π · π = p ≡ 1 (mod 4), Zπ [i] = Zp y como habı́amos visto en la primera parte,
b
f = f.
Si π = p ≡ 3 (mod 4) no hay gran diferencia en el argumento debido a que
Qπ (i) ∼
= Qp ⊕ Qp permite descomponer la integral que define fb en producto de dos
integrales (una por cada coordenada) y cada una de ellas se anula si y sólo si la
parte real o imaginaria de ξ no están en Zp . Entonces en este caso también se tiene
fb = f .
La salvedad aparece para π = 1 + i porque en este caso ψξ es trivial en Z1+i [i] si
y sólo si 2ξ ∈ Z1+i [i]. Esto es muy sencillo de comprobar explı́citamente, ya que
x = α + iβ,
ξ = ξ1 + iξ2
⇒
TrQ
Q2 (ξx) = (2ξ1 )α − (2ξ2 )β.
1+i (i)/
Entonces el mismo argumento esbozado antes produce, suponiendo µ(Z1+i [i]) = 1,
(
1 si ξ ∈ 2−1 Z1+i [i]
fb(ξ) =
0 si ξ 6∈ 2−1 Z1+i [i]
La fórmula de inversión implica f = c(fb)b y la constante no es uno como en los
casos anteriores (en los que fb = f ). Para hallarla, basta comparar f (0) = 1 con
Z
b
b
(f ) (0) = fb(ξ) dµ(ξ) = µ(Z1+i [i]) = k2−1 k1+i = 4.
Entonces c = 1/4. Si se quiere unificar la fórmula de inversión para que no dependa del primo gaussiano, lo cual es muy conveniente, hay que redefinir el valor de
µ(Z1+i [i]) asignándole convencionalmente el valor 1/2, con ello
(
1/2 si ξ ∈ 2−1 Z1+i [i]
fb(ξ) =
0
si ξ 6∈ 2−1 Z1+i [i]
y (fb)b(0) = 21 µ(2−1 Z1+i [i]) = 1 y por tanto la constante en la fórmula de inversión
es uno.
En resumen, conveniendo
(
1
si π · π 6= 2
µ(Z1+i [i]) =
1/2 si π · π = 2
se cumple
Z
f (x) =
Z
fb(ξ)ψ(xξ) dξ
donde
Qπ (i)
f (x)ψ(ξx) dx
fb(ξ) =
Qπ (i)
5
para f suficientemente regular y ψ(t) = e TrQ (i)/Q (t) , con π|p.
π
p
La medida de Haar µ∗ en el grupo multiplicativo de Qπ (i) es
dµ∗ (x) = c
dµ(x)
kxkπ
para c una constante positiva (basta ver que el lado derecho es invariante por multiplicaciones). Esta medida se suele normalizar de forma que
µ∗ (Z∗π [i]) = 1
donde Z∗π [i] indica las unidades de Zπ [i], los que tienen inverso en este mismo anillo.
El cálculo de normalización c que corresponde a este convenio es similar al de la
primera parte y se basa en las descomposiciones
Zπ [i] = {0} ∪ Z∗p [i] ∪ pZ∗p [i] ∪ p2 Z∗p [i] ∪ . . .
Zπ [i] = {0} ∪ Z∗p ∪ pZ∗p ∪ p2 Z∗p ∪ . . .
Zπ [i] = {0} ∪
Z∗π [i]
∪
πZ∗π [i]
∪π
2
Z∗π [i]
si π = p ≡ 3 (mod 4)
si π · π = p ≡ 1 (mod 4)
∪ ...
si π · π = 2.
Por ejemplo, en el primer caso da lugar a
1=
∞
X
µ(p
k
Z∗p [i])
=
µ(Z∗p [i])
∞
X
p−2k
k=0
k=0
que junto con 1 = cµ(Z∗π [i]) lleva a c = (1 − p−2 )−1 . En general

−2 −1

si π = p ≡ 3 (mod 4)
(1 − p )
c = (1 − p−1 )−1
si π · π = p ≡ 1 (mod 4)


−1 −1
2(1 − 2 )
si π · π = 2
Las descomposiciones anteriores también permiten calcular la llamada “función
zeta local”
Z
Zπ (s) =
kxksπ dµ∗ (x).
Zπ [i]−{0}
Con ellas se tiene

−2s −1

(1 − p )
Zπ (s) = (1 − p−s )−1


(1 − 2−s )−1
si π = p ≡ 3 (mod 4)
si π · π = p ≡ 1 (mod 4)
si π · π = 2
6
De nuevo el producto de las funciones zeta locales es conocido:
(1 − 2−s )−1
Y
(1 − p−2s )−1
Y
Y
−1 X
(1 − p−s )−2 =
1 − (ππ)−s
=
p≡1
p≡3
π
I
1
N (I)s
donde I recorre los ideales no nulos de Z[i] y N (I) es su norma. Ésta es la función
ζ de Dedekind. Expresiones todavı́a más familiares son
∞
X
I
1
1 X r(n)
=
ζ(s)L(s,
χ
)
=
4
N (I)s
4 n=1 ns
donde χ4 es el carácter no principal módulo 4 y r(n) es el número de representaciones
como suma de dos cuadrados.
3.
Adeles e ideles
Tanto en Q como en Q(i) hemos introducido normas multiplicativas asociadas a
cada primo. En general en un cuerpo K se dice que k · k : K −→ R es una valoración
si kxk > 0 para x 6= 0, k0k = 0 y se cumple
kxyk = kxk · kyk,
kx + ykα ≤ kxkα + kykα
para alguna constante α > 0. Una valoración da lugar a una distancia d(x, y) =
kx − ykα y con ella a una topologı́a métrica sobre K. Todas las potencias positivas
de una valoración correponden a la misma distancia, se dice que estas valoraciones
son equivalentes y que determinan un lugar (¿sitio?, en inglés place).
Todo esto no es más que poner nombres a lo que ya sabı́amos. El teorema de
Ostrowski afina un poco más [Ra-Va] p.158 y dice que en Q las únicas valoraciones
salvo equivalencias (esto es, lugares) son las k · kp y el valor absoluto de toda la vida.
Se dice que este último corresponde al lugar del infinito o al primo del infinito y a
veces se denota con k · k∞ . La topologı́a inducida es la usual y el completado con
respecto a esta norma es Q∞ = R (por definición de los números reales [Sp]).
En Q(i) se tiene algo similar (Lemas 16 y 17 de [Sw]) pero el lugar del infinito
queda representado por kzk∞ = zz y el completado es en este caso Q∞ (i) = C.
Vemos que en Q y en Q(i) todos los lugares corresponden a valoraciones no
arquimedianas excepto una, k · k∞ . En otros cuerpos de números hay más pero
siempre un número finito.
En Q y Q(i) las valoraciones elegidas para representar los lugares tienen además
la propiedad especial
dµ(αx) = kαk dµ(x)
7
donde µ es la medida de Haar. Esto ya lo hemos probado excepto para k · k = k · k∞
(ejercicio sencillo).
Todas estas valoraciones no son independientes sino que están ligadas por las
fórmulas producto en Q y Q(i)
Y
Y
kxk∞
kxkp = 1
y
kzk∞
kzkπ = 1
p
π
para cualesquiera x ∈ Q, z ∈ Q(i) no nulos.
Los adeles (¿adèles?) son el espacio básico en el que desarrollar el análisis armónico en todos los lugares simultáneamente permitiendo combinar información de ellos.
Por ejemplo, a partir de la propiedad f = fb que tiene la propiedad caracterı́stica de
Zp se podrá obtener la ecuación funcional de la función ζ de Riemann. Lo mismo
ocurrirá con la ζ de Dedekind en Z[i]. Además el fallo de la relación f = fb cuando
π = 1 + i explicará un factor nuevo en la ecuación funcional. Los adeles constituyen,
por tanto, un marco en el que tratar el paso de local a global. En palabras de [Ro]
p.140 “En cierto sentido, se pueden comparar los adeles en aritmética con los haces
en geometrı́a analı́tica, a condición de reemplazar la cohomologı́a de haces por el
análisis”.
A pesar de toda esta propaganda la definición del conjunto de adeles que denotaremos con A, no es complicada. En Q es el conjunto formado por “vectores infinitos”
x = (x0 , x1 , x2 , . . . ) de Q∞ × Q2 × Q3 × Q5 × . . . (recuérdese que Q∞ = R) tales que
kxj kpj ≤ 1 para todo j ≥ 1 salvo un número finito de excepciones. Esto significa
que x0 ∈ R y xj ∈ Zpj , j ≥ 1, excepto para una cantidad finita de valores de j.
En Q(i) la definición es similar salvo que ahora las valoraciones no arquimedianas
están asociadas a primos gaussianos, ası́ A ⊂ Q∞ (i) × Qπ1 (i) × Qπ2 (i) × Qπ3 (i) × . . .
En general, dado un cuerpo de números K siempre hay una cantidad numerable
de lugares y sólo un número finito de ellos corresponden a valoraciones arquimedianas
(a “primos del infinito”).
Si se denotan por K0 , K1 , K2 , . . . los cuerpos completados con respecto a cada
uno de los lugares, entonces A es el subconjunto de K0 × K1 × K2 × . . . formado por
los vectores infinitos x con kxj kj ≤ 1 excepto para una cantidad finita de ı́ndices.
Operando coordenada a coordenada A adquiere una estructura de anillo. El
conjunto de ideles (¿idèles?), que denotaremos con I, es el grupo multiplicativo
formado por las unidades A∗ , es decir, son vectores infinitos x de coordenadas no
nulas tales que kxj kj = 1 salvo para una cantidad finita de ı́ndices j. Hay una
inyección natural de K en el conjunto de adeles
K −→ A
x 7→ (x, x, x, . . . )
8
que aplica K ∗ = K − {0} dentro de I. Por ejemplo, en Q la imagen de x = 33/100
está en A porque kxk2 = 4, kxk5 = 25 y para el resto de los primos kxkp ≤ 1
porque no dividen al denominador. De hecho kxk3 = 3−1 , kxk11 = 11−1 y kxkp = 1
si p 6= 2, 3, 5, 11 (además para “p = ∞”, kxk∞ = 00 33), entonces la imagen de x
está en I. La norma
Y
kxk =
kxj kj
j
está bien definida en I, pues en el producto casi todos los factores son unos, y
por la fórmula producto, que se cumple en general, K ∗ está dentro del núcleo del
homomorfismo I −→ (R∗ , ·) que define esta norma.
El objetivo es hacer análisis armónico en A y en I, para lo cual no basta con una
descripción conjuntista o algebraica, es necesaria una topologı́a. En cada coordenada
de A se tiene una topologı́a Tj inducida por una valoración k · kj . Se toma en A la
topologı́a generada por la base de abiertos {U0 × U1 × U2 × . . . } donde para todas
las valoraciones arquimedianas y un número finito de las no arquimedianas Uj ∈ Tj
mientras que en el resto de los casos Uj = {x : kxkj ≤ 1}. La topologı́a en I es
similar pero ahora en casi todos los casos Uj = {x : kxkj = 1}. Un comentario
un poco técnico, pero nada profundo, es que a pesar de que I ⊂ A como conjuntos,
no es ası́ como espacios topológicos. Es decir, la topologı́a en I no es la topologı́a
relativa inducida por la de A (hay un ejemplo en la p.50 de [Sw]).
Todo este lı́o topológico, desde el punto de vista del análisis armónico se reflejará en que los caracteres de A son productos de los caractares de cada coordenada,
eligiendo todos triviales excepto un número finito de ellos. Además las medidas de
Haar en A y en I son el producto de las medidas de Haar (aditivas y multiplicativas respectivamente). Las demostraciones detalladas están en [Ra-Va] §5.1. La idea
subyacente es que al limitar mucho los abiertos reduciéndolos en casi todas las coordenadas a uno no trivial, limitamos mucho la posibilidad de funciones regulares no
constantes en cada coordenada. El concepto topológico y algebraico natural para
extasiarse con estas demostraciones, que ya aparece en el original de Tate [Ca-Fr],
es el de producto directo restringido.
Analicemos con más detalle la estructura del conjunto de caracteresQen A.
Si el cuerpo de base s Q, los caracteres en A serán de la forma e(ξ0 x0 ) e(λ(ξj xj ))
con casi todos los términos del producto iguales a uno, lo cual está asegurado si casi
todo ξj ∈ Zpj . Esto permite asignar a cada (ξ0 , ξ1 , ξ2 , . . . ) ∈ A un carácter y para
que esta asignación tenga cierta buena propiedad que veremos a continuación es
conveniente cambiar el signo de ξ0 . Es decir, a ξ = (ξ0 , ξ1 , ξ2 , . . . ) ∈ A se le asigna
el carácter
Y
ψξ (x) = e(−ξ0 x0 )
e(λ(ξj xj )).
j
9
b y la buena propiedad a la
La aplicación ξ 7→ ψξ muestra que A es isomorfo a A
que nos hemos referido es que ψ1 valga uno en Q (considerado como subconjunto
de A) donde 1 = (1, 1, 1, . . . ). Por ejemplo, si x = (7/6, 7/6, 7/6, . . . ) entonces
λ(7/6) = 1/2 para p = 2, λ(7/6) = 2/3 para p = 3 y λ(7/6) = 0 en el resto de los
casos, y se tiene ψ1 (x) = e(−7/6 + 1/2 + 2/3) = 1. El caso general es un sencillo
cálculo con congruencias (ejercicio).
En Q(i), teniendo en cuenta que C = R⊕R, el carácter de la primera coordenada
de A (correspondiente a C) deberı́a escribirse como χ(x10 + ix20 i) = e(ξ01 x10 + iξ02 x20 )
pero de nuevo para preservar la buena propiedad ψ1 = 1 (y un poco más en este
caso), se introduce un coeficiente 2 y se cambia un signo. Aquı́ la simetrı́a es más
patente porque se pueden escribir todos los factores de ψξ en términos de la traza:
Y
ψξ (x) = e(−TrC/Q (ξ0 x0 ))
e λ(TrQ (i)/Q (ξj xj )) .
p
πj
p
j
Nótese que TrC/Q (ξ01 + iξ02 )(x10 + ix20 ) = 2ξ01 x10 − 2ξ02 x20 .
p
Los caracteres en A permiten definir la transformada de Fourier. Dada una función de la forma
F : A −→ C
∞
Y
(x0 , x1 , x2 , . . . ) 7→
fj (xj )
j=0
en el caso de Q su transformada de Fourier es
Z
∞ Z
Y
fj (xj )e(−λ(ξj xj )) dµj (xj ),
Fb(ξ) = F (x)ψξ (x) dµ(x) = fe0 (x0 )
j=1 Qpj
donde fe0 (x0 ) = fb0 (−x0 ) con fb0 la transformada de Fourier clásica. Los factores en el
producto son las transformadas de Fourier p-ádicas. Estos dos tipos de transformadas
cumplen la fórmula de inversión con constante 1 y el cambio fe0 ↔ fb0 no modifica
esta propiedad (el cambio de signo es involutivo). Por tanto Fb también satisface la
fórmula de inversión con constante 1.
Un comentario adyacente respecto a la regularidad es que la existencia de Fb
queda asegurada exigiendo que f0 sea de decaimiento rápido (de la clase de Schwartz)
y que el resto de las fj tengan soporte compacto en Qpj y de hecho que salvo un
número finito sean la función caracterı́stica de Zpj . Con ello el producto infinito
acaba siendo un producto de unos (véase la primera parte). Las funciones con tal
regularidad se dice que están en la clase (adélica) de Schwartz-Bruhat. Condiciones
tan férreas no debieran sorprender mucho dado lo poco fina que es la topologı́a en
A en comparación con la topologı́a producto.
10
En Q(i) el convenio sobre la medida de Haar en el caso especial π = 1 + i
nos permitió salvar la fórmula de inversión con constante 1 para los lugares no
arquimedianos, pero ahora el primo del infinito requiere unas consideraciones más
cuidadosas que en Q. Si ξ0 = ξ01 + iξ02 , x0 = x10 + ix20 entonces la transformada de
Fourier asociada al carácter e(−TrC/Q (ξ0 x0 ))
p
Z
∞
Z
∞
T f0 (ξ0 ) =
−∞
−∞
f0 (x0 )e(TrC/Q (ξ0 x0 )) dx10 dx20
p
no satisface la fórmula de inversión con constante 1 sino con constante 4 (ejercicio).
Para subsanar esta anomalı́a es obligado reemplazar la medida de Haar natural de
C, dx10 dx20 (el área), por su doble dµ0 (x0 ) = 2dx10 dx20 , con ello
Z
e
f0 (ξ0 ) =
f0 (x0 )e(TrC/Q (ξ0 x0 )) dµ0 (x0 )
p
C
es la transformada de Fourier buena en C (en la p.129 de [Sw] aparentemente hay
una errata). Para F como antes, en el caso de Q(i) la transformada de Fourier en
A es
Z
b
F (ξ) =
F (x)ψξ (x) dµ(x)
∞ Z
Y
e
fj (xj )e − λ(TrQ (i)/Q (ξj xj )) dµj (xj ).
= f0 (x0 )
πj
p
j=1 Qπj (i)
Una de las buenas propiedades que se puede obtener a partir de la fórmula
de inversión con constante 1 es que µ(A/K) = 1 con µ la medida inducida por
la de Haar en A. Para practicar con el significado de este cociente probaremos
aquı́ este resultado para K = Q y K = Q(i) con cálculos directos, sin emplear
análisis armónico.
Si K = Q, dado (x0 , x1 , x2 , . . . ) ∈ A sólo un número finito de las xj con j ≥ 1
tiene “parte fraccionaria” no nula, esto es, λ(xj ) 6= 0. Escogiendo x ∈ Q igual a la
suma de estas partes fraccionarias se sigue
(x0 − x, x1 − x, x2 − x, x3 − x, . . . ) ∈ R × Z2 × Z3 × Z5 × . . .
Además los x con esta propiedad están totalmente determinados salvo por la suma
de un entero, por consiguiente
A/Q = T × Z2 × Z3 × Z5 × . . .
11
con T = R/Z
(un purista puede cambiar la igualdad por un isomorfismo y homeomorfismo, y de
paso mejorar la notación A/Q que usamos sin explicaciones). De aquı́, si µp es la
medida de Haar normalizada en Qp ,
Y
µ(A/Q) = 1 ·
µp (Zp ) = 1.
p
En el caso K = Q(i) se procede igual, salvo que ahora µ1+i (Z1+i [i]) = 1/2 y el
factor arquimediano es C/Z × Z que mide 2 con la medida µ0 , entonces
1
· 1 · 1 · · · · = 1.
2
Es chocante a primera vista que el convenio de normalización para µ0 haya compensado exactamente el de µ1+i .
µ(A/Q(i)) = 2 ·
4.
Funciones zeta globales
Dada una función suficientemente regular F : A −→ C le asignaremos la función
zeta global
Z
F (x)kxks dµ∗ (x).
Z(F, s) =
I
∗
Aquı́ dµ es la medida de Haar en I que coincide con el producto de la medidas
de Haar (multiplicativas) en cada coordenada. Si consideramos funciones que factorizan y son tan buenas como las de la clase de Schwartz-Bruhat mencionadas
anteriormente,
∞ Z
Y
Z(F, s) =
fj (xj )kxksj dµ∗j (x − j)
j=0
Kj∗
y esto define una función analı́tica en algún semiplano <s > σ0 . Ası́, la función zeta
global para K = Q y K = Q(i) es esencialmente el producto de las funciones zeta
locales que ya habı́amos calculado aunque evidentemente hay una dependencia en
la función F escogida.
2
Por ejemplo, en Q, tomemos f0 (x) = e−πx , que cumple f0 = fe0 = fb0 , y el resto
de las fj iguales a las funciones caracterı́sticas de Zpj , que también cumplen fj = fbj .
Con un cambio de variable sencillo se lleva a cabo el cálculo
Z ∞
Z
−s/2
s dx0
=π
e−t ts/2−1 dt = π −s/2 Γ(s/2).
f0 (x0 )|x0 |
|x0 |
0
R∗
Q
Entonces para F = fj
Y
Z(F, s) = π −s/2 Γ(s/2)
Zp (s) = π −s/2 Γ(s/2)ζ(s).
p
12
¡La función ζ de Riemann con el mismo factor que aparece en la ecuación funcional!
2
2
En Q(i) tomemos f0 (x + iy) = e−2π(x +y ) que cumple f0 = fe0 , y el resto de las
fj iguales a las funciones caracterı́sticas de Zπj , que análogamente cumplen fj = fbj
excepto para π = 1 + i donde hay un 2 que no encaja. De nuevo un cambio de
variable lleva a
Z
Z ∞
1
2
2
2 s 2dxdy
f0 (x + iy)(x + y ) 2
= 4π
e−2πr r2s−1 dr = (2π)1−s Γ(s)
2
x +y
2
C∗
0
y se tiene
Y
1
Zπ (s) = 2−s π 1−s Γ(s)ζZ[i] (s)
Z(F, s) = (2π)1−s Γ(s)
2
π
con ζZ[i] la función ζ de Dedekind en Z[i]. Esta vez el éxito es parcial porque sobra
el factor 2−s para que se obtenga lo que aparece en la ecuación funcional.
El éxito de la tesis de Tate fue deducir la extensión analı́tica y la ecuación
funcional de una amplia familia de funciones L a partir de la fórmula de sumación
de Poisson en los adeles. Los factores de la ecuación funcional provienen de los lugares
arquimedianos y de otros correspondientes a primos con propiedades excepcionales.
En el ejemplo anterior, 2−s se compensa justamente con el precio que hay que pagar
por fj 6= fbj para π = 1 + i.
Para ser más concretos, Tate consideró funciones zeta globales más generales:
Z
Z(F, s) = F (x)χ(x)kxks dµ∗ (x)
I
donde χ es un carácter (multiplicativo) en I que es trivial en K ∗ . Bajo condiciones de
regularidad sobre F (digamos como las mencionadas antes), esto define una función
holomorfa en <s > σ0 . Lo que Tate prueba es que Z tiene una extensión meromorfa
con a lo más dos polos simples en s = 0 y en s = 1, y que se cumple la ecuación
funcional
Z(F, χ, s) = Z(Fb, χ
b, 1 − s)
donde χ
b(x) = χ(x−1 ).
En Q habı́amos escogido F = Fb (y χ el carácter trivial). Por ello Z(F, s) =
π −s/2 Γ(s/2)ζ(s) es invariante al cambiar s por 1−s. En Q(i) no se tiene exactamente
F = Fb porque el factor correspondiente a π = 1+i falla, y en el cálculo de Z(Fb, χ
b, s)
debemos reemplazar la zeta local Z1+i por un nuevo factor:
Z
Y
1
1−s
b
Z(F , χ
b, s) = (2π) Γ(s)
Zπ (s) ·
g(x)kxks1+i dµ∗1+i (x)
∗
2
Z1+i [i]
π6=1+i
13
donde g es la transformada de Fourier de la función caracterı́stica de Z1+i [i], que
como habı́amos visto era la función caracterı́stica de 2−1 Z1+i [i]. Esto permite deducir
que la integral anterior es 22s−1 /(1 − 2−s ) (ejercicio). Ası́ pues
Y
Z(Fb, χ
b, s) = 2s−1 π 1−s Γ(s)(1 − 2−s )−1
Zπ (s) = 2s−1 π 1−s Γ(s)ζZ[i] (s).
π6=1+i
Entonces la igualdad Z(F, χ, s) = Z(Fb, χ
b, 1 − s) se lee como
π 1−s Γ(s)ζZ[i] (s) = π s Γ(1 − s)ζZ[i] (1 − s).
Escogiendo caracteres χ no triviales surgen funciones Z distintas de la ζ de
Dedekind que permiten estudiar problemas relacionados con el grupo de clases.
Incluso en Z[i], con una elección adecuada de χ, se puede probar la equidistribución
angular de los primos gaussianos.
Referencias
[Ca-Fr] J. W. S. Cassels, A. Fröhlich (Ed.) Algebraic number theory. Academic
Press, London; Thompson Book Co., Inc., Washington, D.C. 1967.
[Ra-Va] D. Ramakrishnan, R.J. Valenza. Fourier analysis on number fields. Graduate Texts in Mathematics, 186. Springer-Verlag, New York, 1999.
[Ro] A. Robert. Des adèles: pourquoi? Enseignement Math. (2) 20 (1974), 133–145.
[Sp] M. Spivak. Calculus. Reverté. Barcelona 1984.
[Sw] H.P.F. Swinnerton-Dyer. A brief guide to algebraic number theory. London
Mathematical Society Student Texts, 50. Cambridge University Press, Cambridge, 2001.
14
Descargar