Fenomenologia de las Interacciones Fundamentales

Anuncio
Fenomenologia de las Interacciones
Fundamentales - 2013
High Energy Physics Theory Group
Universidad de Oviedo
HEP Theory
1
Contents
1 Seccion cero: preliminares
1.1 Fuentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Convenios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
5
6
2 Introduccion
7
3 El lenguage natural de la Naturaleza: Teoria Cuantica de Campos
3.1 Mecanica cuantica en el gran canonico ↔ Teoria Cuantica de Campos .
3.2 Imagen de Schrodinger vs. imagen Heisenberg en mecanica cuantica . .
3.3 Campos en espacio-tiempo . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Las teorias de campos son teorias efectivas . . . . . . . . . . . . . . . .
4 Elementos basicos de Teoria Cuantica de Campos
4.1 Calculando amplitudes de scattering . . . . . . . . . . . .
4.1.1 La moral del asunto . . . . . . . . . . . . . . . . .
4.2 Path integrals como formalismo natural en Teoria Cuantica
4.2.1 Path integrals en mecanica cuantica . . . . . . . . .
4.2.2 Ordenados temporales y path integral . . . . . . . .
4.3 Fuentes y funciones generatrices . . . . . . . . . . . . . . .
4.4 Path integrals en Teoria Cuantica de Campos . . . . . . .
4.5 Campos libres . . . . . . . . . . . . . . . . . . . . . . . . .
4.6 Propagadores . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Funciones de Green . . . . . . . . . . . . . . . . . .
4.7 Campos en interaccion . . . . . . . . . . . . . . . . . . . .
4.7.1 Interacciones relevantes y el IR . . . . . . . . . . .
4.8 Calculando correladores para campos en interaccion . . . .
4.8.1 λ φ4 hasta O(λ) . . . . . . . . . . . . . . . . . . . .
4.9 La moral del asunto-parte II . . . . . . . . . . . . . . . . .
4.10 Ejemplo: interacciones nucleares . . . . . . . . . . . . . . .
5 Spin 21
5.1 Preludio historico . . . . . . . .
5.2 La ecuacion de Dirac . . . . . .
5.2.1 Soluciones de la ecuacion
5.2.2 Spin 21 . . . . . . . . . .
5.3 Masa cero y quiralidad . . . . .
5.4 El campo de spin 21 cuantizado .
5.4.1 Cuantizacion canonica .
. . . . . .
. . . . . .
de Dirac .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . .
. . . . . . .
de Campos
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
9
12
13
14
14
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
15
17
18
18
19
23
24
25
26
28
30
31
33
33
34
37
39
.
.
.
.
.
.
.
40
41
43
44
46
47
48
49
6 Interacciones electromagneticas: QED
6.1 Invariancia gauge . . . . . . . . . . . . . . . . . . .
6.2 Reglas de Feynman . . . . . . . . . . . . . . . . . .
6.2.1 Patas externas . . . . . . . . . . . . . . . .
6.2.2 El vertice de QED y el momento magnetico
6.3 QED en el SM . . . . . . . . . . . . . . . . . . . . .
6.3.1 e+ e− → µ+ µ− . . . . . . . . . . . . . . . .
6.3.2 Crossing y e− µ− → e− µ− . . . . . . . . . .
6.4 El limite de masa 0 y quiralidad . . . . . . . . . . .
6.4.1 Conservacion de helicidad a altas energias .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
49
50
52
53
54
55
55
60
62
63
7 La interaccion fuerte: QCD
7.1 Fotografiando protones: la estructura de los hadrones
7.1.1 Scattering inelastico . . . . . . . . . . . . . .
7.1.2 Gluones . . . . . . . . . . . . . . . . . . . . .
7.2 QCD . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2.1 QCD con varios flavors . . . . . . . . . . . . .
7.2.2 La constante de acoplo de QCD . . . . . . . .
7.2.3 Hadrones y el infrarojo de QCD . . . . . . . .
7.2.4 Simetria quiral en QCD . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
64
64
66
68
68
71
73
75
75
.
.
.
.
.
.
.
.
77
77
77
79
80
82
84
86
87
A El grupo de Lorentz
A.1 Rotaciones en 3d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.2 Rotaciones en 4d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
A.3 El grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
90
91
92
B Spinorologia
B.1 El SM con spinores left . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
95
C Simetrias y corrientes conservadas
96
D La particula libre en formalismo de path integral
97
E Tiempo euclideo, path integrals y mecanica estadistica
98
8 La fuerza electrodebil
8.1 Teorias con vertices de 4 fermiones . . .
8.2 Teorias para campos gauge con masa . .
8.3 Ruptura de simetria local . . . . . . . .
8.4 El sector bosonico del SM: gauge+Higgs
8.5 La materia del SM . . . . . . . . . . . .
8.5.1 Interacciones en el SM . . . . . .
8.5.2 Violacion de CP y CKM . . . . .
8.5.3 Neutrinos . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
F Simetrias
F.1 Simetrias globales . . . . . . . .
F.2 Simetrias locales (gauge) . . . .
F.3 Ruptura espontanea de simetria
F.4 Simetrias anomalas . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
G Reglas de Feynman para el SM con una generacion
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
100
100
101
102
103
103
1
Seccion cero: preliminares
La teoria cuantica de campos es el pilar fundamental de nuestra descripcion de la Naturaleza. Juega un papel clave en fisica, desde fisica de la materia condensada, mecanica
estadistica hasta fisica de altas energias. En particular, es el lenguaje natural en el que
formular una descripcion fundamental de la Naturaleza.
Ya que la descripcion a nivel mas basico de la Naturaleza ha de ser en terminos de
una teoria cuantica de campos, los libros de teoria cuantica de campos son una buenisima
fuente de bibliografia.
1.1
Fuentes
Hay muchos y muy buenos libros. Una lista parcial (y no ordenada) es
• M.Peskin V.Schroeder, An introduction to Quantum Field Theory
Es uno de los libros mas utilizados, casi un libro standard.
• A.Zee, Quantum Field Theory in a nutshell
Es un libro escrito de manera bastante informal, muy facil de leer y con mucha fisica.
Muy recomendable.
• M.Maggiore, A Modern Introduction to Quantum Field Theory
Un libro conciso pero que aun asi contiene los detalles tecnicos relevantes. Escrito
ademas con una perspectiva moderna.
• M Srednicki, Quantum Field Theory
Un libro muy muy completo, con todos los detalles tecnicos explicitos.
• T.Banks, Modern Quantum Field Theory
Un libro escrito con un enfoque moderno. Aunque quizas un poquito avanzado, su
lectura es muy recomendable.
• C.Itzykson, B.Zuber, Quantum Field Theory
Uno de los clasicos. Aunque escrito en un lenguaje un poco obsoleto hoy en dia, es
una fuente fundamental para los desarrollos mas clasicos.
• S.Weinberg, The Quantum Theory of Fields
Los 3 volumenes de Weinberg lo contienen todo, si bien un poco dificil de leer.
• L.Alvarez-Gaume y M.A.Vazquez-Mozo, An invitation to Quantum Field Theory
Una introduccion a la teoria cuantica de campos sencilla y concisa sin muchos engorros tecnicos.
5
• A.Altman, B.Simons, Condensed Matter Field Theory
Es un libro de fisica de la materia condensada. Su introduccion a la teoria cuantica de
campos –especialmente no relativista– es muy util y muy fisica. Tambien se pueden
encontrar trocitos en la pagina web de Ben Simons
http://www.tcm.phy.cam.ac.uk/~bds10/tp3.html
Ademas de estos libros existen muy buenas notas en internet. Son particularmente
utiles las notas de David Tong para los Mathematical Tripos de Cambridge. Se pueden
encontrar online en
http://www.damtp.cam.ac.uk/user/tong/qft/qft.pdf
Tambien hay libros mas enfocados a la descripcion de la fenomenologia
• F.Halzen and A. Martin, Quarks and Leptons
Libro muy sencillo y muy util.
• J.Donogue, E.Golowich, B.Holstein, Dynamics of the Standard Model
• H.Georgi, Weak interactions and modern particle theory
Por ultimo, en la pagina web del Particle Data Group se puede saber todo lo mas intimo
sobre las particulas elementales
• http://pdg.lbl.gov
1.2
Convenios
Vamos a asumir la metrica de Minkowski en signatura mostly minus, es decir ηµν =
diag(+, −, −, −). Ademas usaremos unidades tales que ~ = c = 1.
Haremos transformadas de Fourier como
Z
Z
dd p
i p·x
f (p) e
f (p) = dd x f (x) e−i p·x
(1)
f (x) =
(2 π)d
La δ de Dirac es
δ(x) =
Z
dd p i p·x
e
(2 π)d
6
(2)
2
Introduccion
Todo el mundo sabe que la materia esta hecha de atomos. Los atomos son electricamente
neutros: tienen una nube exterior de electrones con carga electromagnetica negativa compensada por la carga positiva del nucleo. Que esto es asi lo sabemos en particular gracias
a los experimentos de Rutherford: al bombardear una lamina de metal con particulas α
–que son particulas mucho mas masivas que los electrones con carga positiva– la mayoria
pasan de largo. Sin emabrgo, de cuando en cuando, las particulas α son rebotadas hacia
atras, como si chocasen con algo muy masivo, muy localizado y de carga positiva: el nucleo
atomico.
El atomo se mantiene unido debido a interacciones electromagneticas (su nombre tecnico es QED, de Quantum ElectroDynamics, Electrodinamica Cuantica). La energia necesaria para quitarle un electron a un atomo –energia de ionizacion– es del ordenden de los
10 eV –13.6 eV para el H–. Eso implica que el tamagno tipico de un atomo son1 unos
10−9 m como estimacion grosera (en realidad es mas bien del orden de 10−10 m).
Mientras que el tamagno tipico del atomo es del orden de 10−10 m, el tamagno de un
nucleo es del orden de 10−15 m . Sin embargo, el nucleo atomico a su vez esta formado por
protones y neutrones. Dada la escala de longitud caracteristica, la energia tipica es del
orden de M eV , que es mucho mayor que la energia tipica de ligadura electromagnetica.
Esto, unido al hecho de que los nucleones tienen carga positiva o neutra –y todo el mundo
sabe que las cargas iguales se repelen electromagneticamente– implica la existencia de
una nueva fuerza mucho mas fuerte que la interaccion electromagnetica que mantiene
unidos los nucelos: es la interaccion fuerte (su nombre tecnico es QCD, de Quantum
ChromoDynamics, Cromodinamica Cuantica). Experimentos con protones demostraron
de hecho que estos no son particulas elementales, sino que estan formados por quarks
interaccionando a traves de la interaccion fuerte. Si bien los nucleones son neutros bajo
esta fuerza, las interacciones residuales son las que mantienen los nucleos unidos.
Por otra parte, es conocido desde principios del siglo pasado que los nucleos cambian su
naturaleza al cambiar un proton en un neutron emitiendo radiacion β: es la desintegracion
nuclear β. La responsable de dicho decaimiento es la interaccion debil.
Ademas de estas fuerzas que actuan entre particulas microscopicas, existe la fuerza de
gravedad. Sin embargo su intensidad es mucho menor que las otras tres. Por ejemplo, la
atraccion gravitatoria entre dos electrones dividida por su repulsion electrostatica es del
orden de 10−80 . Asi pues, en presencia de cualquier otra carga la interaccion gravitatoria
es despreciable. El origen de esta enorme diferencia de escalas es un misterio. Sin embargo, a escalas astronomicas donde las galaxias, estrellas etc. son neutras, la interaccion
gravitatoria es la unica interaccion, y por lo tanto crucial.
Las fuerzas electromagnetica, debil y fuerte rigen las interacciones de las particulas que
creemos elementales: los leptones y los quarks. Nuestra tarea es estudiar esta estructura
1
Supongamos que queremos probar un atomo con luz a una cierta frecuencia (i.e. energia). Del principio
de incertidumbre de Heisenberg ∆p ∆x ∼ ~. Multiplicando por c, y como para una particula sin masa
E = p c, tenemos ∆E ∆x ∼ ~ c ∼ 10−7 eV m. Esa energia ha de ser basicamente esos ∼ 10 eV , asi pues
podemos despejar de aca ∆x para obtener una idea del tamagno tipico de un atomo.
7
Figure 1: Los ingredientes del SM
de particulas y sus interacciones. La teoria que describe esto es el Modelo Estandard
(SM). Sus ingredientes estan recogidos en (1).
3
El lenguage natural de la Naturaleza: Teoria Cuantica de Campos
Es un hecho que la Naturaleza sigue las leyes de la mecanica cuantica. Esto es: una
particula esta descrita por una funcion de onda que vive en un espacio de Hilbert tal que
su cuadrado representa la amplitud de probabilidad de encontrarla en un cierto punto.
La evolucion temporal del sistema –de la funcion de onda, ya que estamos implicitamente
discutiendo la imagen de Schrodinger– la dicta la ecuacion de Schrodinger
8
Ĥ |ψ(t)i = i ∂t |ψ(t)i
(3)
donde Ĥ es el hamiltoniano del sistema. Ya que la probabilidad total ha de ser 1 en
cualquier instante, Ĥ ha de ser un operador hermitico para asegurar la unitariedad.
En nuestra discusion, completamente general, debemos especificar que hacer cuando
nuestro sistema contiene mas de una particula. Es sabido que esencialmente hay dos tipos
de particulas: bosones y fermiones. La diferencia es que la funcion de onda de un sistema
de bosones es simetrica bajo el intercambio de las particulas dos a dos, mientras que la
funcion de onda de los fermiones es antisimetrica bajo el intercambio de particulas dos a
dos. COn esta informacion podemos en principio describir basicamente cualquier sistema.
En esta discusion general no hemos asumido ninguna caracteristica en particular de
las particulas. Asi, por ejemplo, podriamos pensar que estamos describiendo un gas de
electrones en un metal. Estos electrones son basicamente libres, asi que para cada uno
Ĥ = P̂ 2 /2 m. La funcion de onda total sera la antisimetrizacion de las funciones de los N
electrones en el gas. En la practica sin embargo esto es un engorro, ya que N es un numero
enorme. De hecho, de modo efectivo N es infinito. En tal caso esta claro que tratar el
sistema como un sistema sin numero fijo de particulas es mas conveniente, es decir, es mas
sencillo tratar el sistema en el gran canonico.
En este ejemplo el uso del colectivo gran canonico es un poco circunstancial, en tanto
que depende del sistema en particular y de que tiene muchas particulas. Sin embargo, hay
una situacion en la que el uso del gran canonico nos viene impuesto por la cinematica: un
sistema en el que altas energias –velocidades– esten involucradas se describira por leyes
relativistas. Como, a grosso modo, E = m c2 el numero de particulas no estara fijo. Asi
pues, en los casos en los que tratemos con particulas a muy alta energia la descripcion
correcta sera en terminos de mecanica cuantica sin un numero fijo de particulas, ya que
estas se pueden crear y destruir –algo de alguna manera implicito en E = m c2 –.
Por otra parte, como sabemos que a nivel fundamental la Naturaleza sigue –insistamos
en que nos estamos olvidando de la interaccion gravitatoria– las leyes de la Relatividad
Especial, resulta que cualquier teoria fundamental que imaginemos debe ser una mecanica
cuantica en el gran canonico, es decir, sin numero fijo de particulas.
3.1
Mecanica cuantica en el gran canonico ↔ Teoria Cuantica de
Campos
En mecanica cuantica un sistema se describe por un estado |ψi que es un vector en un
espacio de Hilbert H . En la imagen de Schrodinger dichos vectores dependen del tiempo,
asi que |ψi = |ψ(t)i. La evolucion temporal la dicta la ecuacion de Schrodinger
Ĥ |ψi = i ∂t |ψi
(4)
En general el sistema contendra N particulas, asi que en general |ψi es una function de
e.g. sus N posiciones {~x1 , · · · , ~xN }. Ademas, si las particulas son identicas, es necesario
especificar que ocurre bajo el intercambio de dos particulas: la funcion de onda ha de ser
9
simetrica para bosones y antisimetrica para fermiones. Dejando de lado por un momento
las propiedades de simetria de la funcion de onda, en el limite en el que la interaccion
entre las particulas es muy pequegna, el espacio de Hilbert total se puede escribir como
HN = H1 ⊗ · · · ⊗ HN , es decir, como el producto tensorial de los espacios de Hilbert de
cada particula por separado. El estado |ψi se escribe por lo tanto
|ψi = |ψ1 i ⊗ · · · ⊗ |ψN i
(5)
Una notacion mas util es etiquetar cada particula por sus numeros cuanticos: energia,
spin. . . . Llamemoslos en general En con n = 1, · · · , N . Es decir, E1 son los numeros
cuanticos de la particula 1, E2 los de la particula 2 y asi sucesivamente. En esta notacion
el estado es
|ψi = |E1 i ⊗ · · · ⊗ |EN i
(6)
En esta funcion de onda por supuesto puede ocurrir que los numeros cuanticos de la
particula n y los de la m sean identicos. De hecho, otra manera de etiquetar el sistema
es contando cuantas particulas tienen ciertos numeros cuanticos. Siendo mas concretos,
supongamos un sistema donde solo hay un numero cuantico discreto E. Supongamos que
los posibles valores de E son 1, 2, 3 · · · . Si hay N particulas en el sistema, habra n1 en el
estado E1 con E = 1, n2 en el estado E2 con n = 2 y asi sucesivamente. Escogiendo un
orden para los posibles estados, la funcion de onda se escribe simplemente como
X
|ψi = |n1 , · · · , nN i
ni = N
(7)
Por supuesto, en realidad debemos imponer las pertinentes propiedades de simetria en la
funcion de onda, que en esta base –que se llama base de numeros de ocupacion– se traducen
en que ni puede ser 0 o 1 para fermiones y cualquier entero positivo para bosones. Estas
funciones de onda viven en un espacio que vamos a llamar FN .
En muchas situaciones es conveniente no fijar el numero de particulas. Por ejemplo, si
estamos tratando electrones en metales estos se comportan como un gas con un numero de
particulas enorme, de manera que es conveniente tratarlos como si el numero de electrones
no fuese fijo –mas tecnicamente en el gran canonico–. El paso crucial entonces es que para
considerar dichos sistemas es conveniente considerar el estado del sistema en el espacio de
Fock 2
F =
∞
M
FN
(8)
N =0
Es importante darse cuenta de que en la suma F0 –i.e. no particulas– tambien esta incluido
en la suma. Este estado es un poco especial. Se llama vacio y lo denotaremos como |0i.
En este espacio es natural construir unos operadores creacion/aniquilacion que nos
mueven entre FN y FM :
2
Victor Fock fue el fisico ruso que lo introdujo.
10
aniquilacion âEn : FN → FN −1
creacion
Estos operadores actuan como
â†En
(9)
: FN → FN +1
âEn |n1 , · · · , nn , · · · i = âEn |n1 , · · · , nn − 1, · · · i
â†En |n1 , · · · , nn , · · · i = â†En |n1 , · · · , nn + 1, · · · i
(10)
(11)
(12)
Es decir, âEn toma un estado con N particulas y lo lleva a un estado con N − 1 particulas
destruyendo una particula en el estado En (y el converso para â†En . Por supuesto, âEn
aniquila el vacio, es decir
Estos operadores satisfacen que3
bosones
fermiones
âEn |0i = 0
(13)
[âλ , â†γ ] = (2 π)3 δ(λ − γ)
(14)
(15)
(16)
{âλ , â†γ } = (2 π)3 δ(λ − γ)
Estas relaciones de conmutacion aseguran que los estados fermionicos tengan 0 o 1 particulas por estado y arbitrarias para estados bosonicos.
Supongamos ahora el sistema mas sencillo que podemos imaginar: un conjunto de
bosones libres. En este caso los estados estan etiquetados simplemente por el momento
p~ de la particula. 4 Las funciones de onda para cada boson son simplemente ondas
planas e−i p~·~x (omitamos por sencillez el factor de normalizacion). Como cuando creamos
una particula esta viene con la funcion de onda e−i p~·~x es natural considerar la cantidad
âp~ ei~p·~x + âp†~ e−i~p·~x . Como el sistema contiene todos los posibles estados, es natural sumar
dichas cantidades para todos los estados, construyendo asi el operador (devolvamos ahora
todas las normalizaciones correctamente)
Z
h
i
d3 p~
† −i~
i~
p·~
x
p·~
x
p
φ̂(~x) =
âp~ e + âp~ e
ωp~2 = p~2 + m2
(17)
3
(2 π)
2 ωp~
Esta claro –lo veremos explicitamente mas abajo– que si devolvemos este operador a funcion esto simplemente describe un campo clasico, de manera que los modos de Fourier se
corresponden con las particulas.
3
El (2 π)3 es debido a como definimos la funcion δ.
Si el sistema esta en R3 el momento p~ es continuo, pero mas alla de tecnicalidades, es como si los En
se corresponden con los p~.
4
11
La leccion que se aprende aqui es que un sistema de particulas en donde el numero
de particulas no esta fijo necesariamente se describe en terminos de campos cuanticos.
Alternativamente un campo cuantico describe un sistema cuantico de particulas donde el
numero no esta fijo. Notese que esto es completamente general: solo hemos asumido un
sistema sin un numero fijo de particulas libres. En particular, la relacion de dispersion ωp~
puede ser cualquiera. En el caso particular en el que estemos interesados en una teoria que
describa particulas moviendose a velocidades comparables a la de la luz, ωp~ = p~2 + m2 .
Evidentemente este sera el caso si queremos estudiar los constituyentes mas fundamentales.
Es evidente ahora por que un sistema relativista cuantico debe describirse por un campo
cuantico: la ecuacion de Einstein E = m c2 implica que materia y energia son intercambiables, esto es, una teoria relativista debe permitir crear y destruir particulas (cambiar
masa por energia). Por lo tanto es natural que un sistema relativista cuantico se describa
por una teoria cuantica de campos.
3.2
Imagen de Schrodinger vs. imagen Heisenberg en mecanica
cuantica
En la representacion de Schrodinger el estado de un sistema se describe por un vector en un
espacio de Hilbert |ψi que depende del tiempo, y cuya evolucion temporal esta governada
por la ecuacion de Schrodinger
Ĥ |ψi = i ∂t |ψi
(18)
Evidentemente aca el estado del sistema evoluciona con el tiempo, asi que en realidad
|ψi = |ψ(t)i. Sin embargo los operadores –entre ellos el hamiltoniano Ĥ– se asumen
independientes del tiempo. Esta es la imagen de Schrodinger.
Supongamos un estado en un instante t0 especificado por |ψ(t0 )i. La pregunta es
como evoluciona dicho estado en el tiempo. Tal evolucion ha de ser implementada por un
operador evolucion Û (t, t0 ), tal que
|ψ(t)i = Û (t, t0 ) |ψ(t0 )i
(19)
Evidentemente la evolucion ha de ser tal que la norma del estado se conserve
hψ(t)|ψ(t)i = hψ(t0 )|Û † (t, t0 ) Û (t, t0 ) |ψ(t0 )i = hψ(t0 )|ψ(t0 )i
⇐⇒
Û (t, t0 )† Û (t, t0 ) = 1l
(20)
Enchufando esto en la ecuacion de Schrodinger
Ĥ Û (t, t0 )|ψ(t0 )i = i ∂t Û (t, t0 ) |ψ(t0 )i
(21)
Por lo tanto el operador evolucion satisface la ecuacion de operadores
Ĥ Û (t, t0 ) = i ∂t Û (t, t0 )
12
(22)
Por lo tanto, si conocemos el operador de evolucion a traves de su ecuacion de Schrodinger
podemos simplemente considerar nuestros estados a un tiempo fijo dado t0 como independientes del tiempo y pasar toda la evolucion temporal a los operadores. Por ejemplo, si
tenemos un operador O (por ejemplo momento angular, o spin o cualquier otro operador),
el elemento de matriz en la imagen de Schrodinger se escribe como
hψ(t)| Ô |ψ(t)i = hψ(t0 )| Û † (t, t0 ) Ô Û (t, t0 ) |ψ(t0 )i
(23)
Esto sugiere que si consideramos los estados como independientes del tiempo, los operadores
contienen la dependencia temporal. Esto se conoce como imagen de Heisenberg. En vista
de (23), un operador en la imagen de Schrodinger OS se escribe como un operador en la
imagen de Heisenberg OH como
ÔH = Û † (t, t0 ) ÔS Û (t, t0 )
ÔS = Û (t, t0 ) ÔH Û † (t, t0 )
⇐⇒
(24)
Volviendo a la ecuacion que especifica el operador evolucion, esta es una ecuacion
diferencial de primer orden, asi que necesita una condicion de contorno. Dicha condicion
de contorno es obvia
Û (t0 , t0 ) = 1l
(25)
Por lo tanto la solucion de la ecuacion diferencial es sencilla
Û (t, t0 ) = e−i Ĥ (t−t0 )
3.3
(26)
Campos en espacio-tiempo
Apliquemos esto a nuestro operador campo. Para ello veamos que ocurre con los operadores
creacion/desctruccion al pasarlos a la imagen de Heisenberg. Usando que Û (t, t0 ) = e−i Ĥ t
(escojamos coordenadas tal que t0 = 0), estos e convierten en
ei Ĥ t âp†~ e−i Ĥ t = ei ωp~ âp†~
ei Ĥ t âp~ e−i Ĥ t = e−i ωp~ âp~
(27)
Usando esto, podemos pasarle la dependencia temporal al campo, produciendo el operador campo en la imagen de Heisenberg φ̂(~x, t) = Û † (t, t0 ) φ̂(~x) Û (t, t0 ). Explicitamente
Z
h
i
d3 p~
−i p·x
† i p·x
p
âp e
+ âp e
(28)
φ̂(~x, t) =
(2 π)3 2 ωp~
Donde la contraccion p · x esta hecha con la metrica de Minkowski, es decir, p · x = ωp~ t − p~,
que es evidentemente invariante bajo transformaciones de Lorentz. Como todo viene en
terminos del 4-vector p = (ωp~ , p~), hemos simplificado la notacion y etiquetando a los
operadores creacion/aniquilacion por p.
A la vista de la forma del campo en imagen de Heisenberg, dado que ωp~2 = p~2 + m2 ,
esta claro que satisface la ecuacion de Klein-Gordon (x = (t, ~x))
13
∂ 2 + m2 φ̂(x) = 0
⇐⇒
∂02 − ∂~ 2 + m2 φ̂(x) = 0
(29)
Vemos de nuevo como recuperamos la cuantizacion canonica de un campo escalar que
satisface la ecuacion de Klein-Gordon. Dicha ecuacion se deriva de un lagrangiano que es
1
1
∂µ φ ∂ µ φ − m2 φ2
(30)
2
2
Es importante recalcar que nuestra expresion para el campo es bajo la asuncion de que
las particulas no interactuan. Esto es explicito por ejemplo en el que el espacio sobre el
que actuan los operadores creaccion/destruccion esta compuesto de productos tensoriales
de espacios de Hilbert de una sola particula. Evidentemente en el mundo real las particulas
interactuan. Comencemos por suponer que la interaccion es debil. En ese caso, esta aproximacion libre es correcta y podemos incorporar poco a poco la interaccion asumiendola
como una perturbacion pequegna. Evidentemente, una vez el efecto de la interaccion esta
tenido en cuenta, la expresion para el campo cuantico ya no sera la sencilla expansion en
modos que vimos.
L=
3.3.1
Causalidad
En una teoria relativista debemos preocuparnos de que las segnales no se propaguen mas
rapido que la luz. En teoria cuantica de campos esto se manifiesta en que el conmutador
de campo en dos puntos diferentes se anula si estos dos puntos no estan uno dentro del
cono de luz del otro. Esto es tanto como decir que las perturbaciones solo afectan a otros
puntos dentro del cono de luz de uno dado. Aunque aqui no lo vamos a hacer explicito, se
puede ver que en efecto esto es asi para el campo escalar.
Es importante recalcar que el uso de conmutadores esta intimamente ligado a que el
campo es de spin entero –en particular escalar–. Veremos que si el campo es de spin
semientero necesitaremos cambiar [] → {}, lo que lleva incorporado el principio de exclusion de Pauli. Esa es la conexion entre spin y estadistica conocida como teorema de
spin/estadistica.
3.4
Las teorias de campos son teorias efectivas
Hemos particularizado nuestra discusion para campos escalares reales, pero evidentemente
la podriamos haber generalizado a campos complejos, fermionicos y campos gauge. Sigamos
sin embargo con nuestro ejemplo del campo escalar real. Dicho ejemplo podemos de hecho
pensarlo como una situacion fisica de verdad: el π 0 es una particula escalar sin carga
electrica que se describe por un campo escalar real. La teoria que hemos analizado describe
pues π 0 ’s libres, y en lo que resta vamos a desarrollar la teoria del π 0 y sus interacciones. 5
En el mundo real hay otros dos compagneros cargados π ± , ademas de una torre enorme de otras
particulas. Consideremos de momento el subsector que solo contiene π 0 .
5
14
Como es sabido, el π 0 no es fundamental en el sentido de que esta hecho de dos quarks.
Sin embargo es obvio que a bajas energias dichos quarks son irrelevantes: el π 0 se ve
como una particula fundamental. Es mas, a bajas energias, las interacciones del π 0 son
despreciables, con lo que una buena aproximacion es la teoria libre de arriba. Podemos
entonces agnadirle interaccion, exactamente tal y como vamos a hacer. Sin embargo la
teoria que obtendremos no sera valida a energias arbitrarias. Es obvio que cuando la
energia crece, la descripcion correcta no es en terminos de π 0 , sino en terminos de quarks
y gluones libres, es decir, la descripcion correcta sera QCD.6 Por lo tanto, debemos pensar
en la teoria que describe el π 0 como en una teoria efectiva, valida en un cierto rango
de energias. Esta es la imagen moderna de las teorias de campos, basada en los trabajos
seminales de Ken Wilson, que situa todas las teorias de campos como teorias efectivas:
a cada escala de energia los grados de libertad relevantes seran distintos, y por lo tanto
la teoria que describe de modo efectivo la fisica –de ahi el nombre de teoria efectiva– sera
diferente.
Para entenderlo mejor, consideremos una analogia sugerida por David Gross: consideremos un fluido, por ejemplo el agua del mar. Si uno considera un objeto muy grande
–e.g. un barco–, la fisica relevante es la de las olas moviendolo, todo ello descrito por las
ecuaciones de Navier-Stokes. Con especificar unos pocos parametros –densidad, numero
de Reynolds–. Al ir considerando objetos mas y mas pequegnos –longitud∼ 1/energia–
empieza a ser mas relevante especificar mas y mas cosas –si es agua de mar, su tension
superficial. . . –. Si seguimos reduciendo el tamagno de la “sonda” de hecho en cierto momento nos encontraremos con que la descripcion en terminos de fluido en si misma es
incorrecta. . . para cuando estemos usando un objeto del tamagno de la molecula de agua
esta claro que la descripcion en terminos de un continuo gobernado por las ecuaciones de
Navier-Stokes no tiene sentido! Esto es exactamente igual al ejemplo analogo del π 0 y
QCD.
En lo sucesivo deberemos pensar que estamos cosntruyendo una teoria de campos que
describe los grados de libertad efectivos relevantes para la descripcion a esa energia. Por
ejemplo, nuestro campo escalar real sera un π 0 y asumimos que estamos midiendo a escalas
mucho mas pequegnas que ΛQCD .
4
Elementos basicos de Teoria Cuantica de Campos
En el mundo real las particulas –y por ende los campos cuanticos que las describen–
interaccionan. La manifestacion mas directa de esto es que dos particulas chocan y se
desvian cuando se encuentran. Es por esto que uno de los intereses primarios es calcular
amplitudes de scattering entre particulas. Supongamos que en un tiempo Ti tenemos un
6
QCD es el acronimo en ingles de CromoDinamica Cuantica (Quantum ChromoDynamics). Es la teoria
que describe la fuerza nuclear fuerte. Es como el electromagnetismo pero con mas fotones –que se llaman
de hecho gluones–. Los gluones median la interaccion entre quarks. QCD se hace fuertemente acoplada a
bajas energias. Por debajo de una energia que se denota como ΛQCD los quarks y los gluones solo existen
como estados ligados neutros: π 0 , π ± , proton, neutron. . .
15
cierto numero m de particulas en un cierto estado etiquetado por los momentos ~ki de cada
particula (y sus espines etc.). La pregunta es cual es la probablidad de que a un tiempo
final Tf el estado contenga n particulas en otro determinado estado etiquetado por los
correspondientes p~i . Es decir, debemos calcular
h~p1 , · · · , p~n ; Tf |~k1 , · · · , ~km ; Ti i
(31)
Implicitamente asumimos que Ti → −∞ y Tf → ∞, de manera que en estos estados
iniciales y finales las particulas no interactuan –por ejemplo porque todas las particulas
acaban sufientemente separadas como para que sus interacciones sean despreciables–. A
estos estados que contienen basicamente particulas libres se les llama estados asintoticos. Al
estado inicial |~k1 , · · · , ~km ; Ti i con Ti → −∞ se le llama estado in y al final |~p1 , · · · , p~n ; Ti i
con Tf → ∞ se le llama estado out. Asi pues, llamando en general al estado in como |ini
y al out como |outi moralmente queremos calcular
lim
ti →−∞, tf →∞
hout| Û (tin , tout ) |ini
(32)
Donde Û es el correspondiente operador de evolucion. Esto usualmente se denota asumiendo la existencia de un operador unitario Ŝ que implementa esta transicion como
hout| Ŝ |ini
(33)
Al operador Ŝ se le llama matriz S. Normalmente se separa de la matriz S el caso trivial
de no interaccion. Es decir, se escribe Ŝ = 1l + i T̂ , donde T̂ mide la probabilidad de
transicion entre estados diferentes. Como solemos estar interesados en estados inicial y
final diferentes, en realidad normalmente calculamos hout| T̂ |ini
En un experimento de verdad se hacen chocar haces de particulas y se observa el resultado. Una manera de comparar dichos resultados de manera independiente del tamagno
del haz de particulas, el numero de particulas u otros detalles dependientes del experimento
en particular es calculando la seccion eficaz (cross section en ingles). A groso modo, si
un haz de particulas con NA particulas choca con un haz de NB particulas en una superficie A, algunas particulas chocaran mientras que otras ni se veran entre si. El numero de
scatterings # sera
NA NB
(34)
A
donde σ es la cantidad que controla la probablidad intrinseca al tipo de particulas de
interaccion (es decir, σ lleva la informacion de como es la interaccion entre las particulas
d A y las de B). Esta cantidad intrinseca al tipo de particulas y su dinamica es la seccion
eficaz.
Otra cantidad con interpretacion fisica muy directa es la probabilidad de desintegracion
(decay rate en ingles). Si tenemos NA particulas no estable, que se desintegran en ciertas
otras particulas, podemos contar el numero de desintegraciones por unidad de tiempo.
#scatterings = σ
16
Dividiendo por el numero de particulas tenemos una medida intrinseca de la probabilidad
de desintegracion. Es decir
#desintegraciones = Γ NA
(35)
donde Γ es el decay rate.
Aunque no vamos a desarrollar toda la teoria de scattering, la cuestion es que tanto σ
como Γ se pueden definir de modo diferencial, es decir, contando decaimientos o scatterings
por angulo solido. En realidad en un experimento de verdad nunca hay un estado puro ni
se mide un estado puro. Asi pues en realidad lo que tenemos por ejemplo en una colision
es que los haces de particulas tienen una distribucion de momentos centrada en un cierto
valor. Por el mismo motivo, lo que medimos al final tiene tambien una cierta distribucion
de momentos. Es por eso por lo que al escribir las secciones eficaces/probabilidades de
desintegracion estas vienen en terminos del elemento de matriz S correspondiente a la
transicion entre el estado in y el out correspondientes multiplicado por el numero de
estados out que tenemos. Por lo tanto, en ambos casos se puede dar una expresion que
esquematicamente es de la forma
dσ = |Mi→f | dΦ
dΓ = |MA→f | dΦ
(36)
Donde dΦ es el elemento de volumen en espacio de fases, es decir, la densidad de estados correspondiente, mientras que |Mi→f es el elemento de matriz correspondiente a la
transicion. Si bien dΦ es una cantidad puramente cinematica, Mi→f es una cantidad que
contiene informacion sobre la teoria en si. Esto es lo que mas nos urge calcular, lo realmente no trivial y lo que se persigue estudiar en cualquier experimento. Esta claro que
este elemento de matriz es
Mi→f = hout| Ŝ |ini = hout| T̂ |ini = h~p1 , · · · , p~n ; Tf |~k1 , · · · , ~km ; Ti i
4.1
(37)
Calculando amplitudes de scattering
Resulta que se puede dar una expresion generica para dichas amplitudes de probabilidad.7 .
Para ello necesitamos introducir el ordenado temporal de campos
h
i
T φ̂(x) φ̂(y) = θ(x0 − y 0 ) φ̂(x) φ̂(y) + θ(y 0 − x0 ) φ̂(y) φ̂(x)
(38)
Con esto las amplitudes de probabilidad relevantes se pueden escribir como
√
√
m
n
Y
i Z Y i Z hp~ · · · p~n |~k1 · · · ~km iout =
2
2
2
2 in 1
k
−
m
p
−
m
i=1 i
j=1 j
Z
m
n Z
h
i
Y
Y
4
−i ki ·xi
d xi e
d4 yj ei pj ·yj hT φ̂(x1 ) · · · φ̂(xm ) φ̂(y1 ) · · · φ̂(yn ) i
i=1
7
j=1
Aqui no la vamos a derivar. Las demostraciones se pueden consultar en la bibliografia.
17
(39)
A esta expresion, que permite escribir amplitudes de probabilidad de transicion entre
estados en terminos de correladores, se le llama formula de reducion de LSZ, en honor a
sus descubridores Lehmann, Symanzik y Zimmermann.
En esta expresion los campos que entran son los campos de Heisenberg –i.e. en espaciotiempo– “exactos”. Cuando las particulas estan muy separadas, como vimos, tienden a los
campos libres que conocemos, pero para una situacion general seran cosas complicadisimas
cuya expresion no sabemos. En cualquier caso, la virtud de LSZ es permitir reducir el
calculo de scatterings a calcular las funciones
h
i
h T φ̂(x1 ) · · · φ̂(xn ) i
(40)
Dichas funciones a n puntos se llaman funciones de Green, o correladores –o simplemente
funciones a n puntos–. Dichas funciones han de ser calculadas off shell, es decir, sin asumir
que los campos φ satisfacen la ecuacion de movimiento libre. Los prefactores de ki2 − m2
y p2i − m2 sin embargo si son explicitamente on-shell –porque ki , pi son momentos de
particulas que entran y salen, es decir, particulas fisicas–. Ya que estos factores son 0
–precisamente por ser particulas fisicas satisfacen que e.g. p2i = m2 –, LSZ nos instruye a
seleccionar los polos de las funciones a n puntos que cancelen dichos ceros.
4.1.1
La moral del asunto
Lo relevante de la discusion de arriba es que en teoria cuantica de campos las cantidades
centrales son las funciones de correlacion a n puntos, que son valores de expectacion de
ordenados temporales de campos de Heisenberg –i.e. en espacio-tiempo–
h
i
h T φ̂(x1 ) · · · φ̂(xn ) i
(41)
Conocer estas funciones de manera exacta para cualquier n equivale a resolver la teoria, es
decir, a poder calcular cualquier observable de manera exacta. Es por ello que estas cantidades son elementos absolutamente centrales en teoria cuantica de campos. Calcularlos
es el objetivo central.
4.2
Path integrals como formalismo natural en Teoria Cuantica
de Campos
Hasta ahora una fuente comun de engorro es el hecho de que, pese a estar especialmente
interesados en teorias invariantes Lorentz, hemos estado usando un formalismo manifiestamente no covariante, basado en el formalismo hamiltoniano donde t juega un papel
distinguido. Para “poner remedio” a esto debemos usar el formalismo de la integral de
caminos (path integral en ingles) introducido por Feynman. La ventaja agnadida es que
los ordenados temporales apareceran de manera natural, de manera que el path integral
esta adaptado como un guante a calcular las funciones de correlacion que, como vimos
antes, son las cantidades centrales en teoria cuantica de campos. Sin embargo, antes
18
de aplicarlo a la teoria cuantica de campos, veamoslo en el contexto mas familiar de la
mecanica cuantica
4.2.1
Path integrals en mecanica cuantica
Es natural preguntarse por la propagacion de las particulas en mecanica cuantica. En
mecanica clasica una particula se propaga entre qI y qF siguiendo una trayectoria. Eso
es una funcion q(t) tal que q(tI ) = qI y q(tF ) = qF . En mecanica cuantica, debido a
que posicion y momento no conmutan, este concepto no existe. Esto de hecho es lo que
el experimento de la doble rendija pone de manifiesto: una particula no pasa por una
rendija o por la otra, sino que la probabilidad de deteccion es la suma de las amplitudes
de probabilidad para la particula pasando por cada uno de los dos agujeros.
Tratemos de hacer esto explicito. Consideremos la propagacion de una particula libre
entre qI y qF en un tiempo T = tF − tI . La amplitud de probabilidad asociada a dicho
proceso es
hqF | e−i Ĥ T |qI i
(42)
Donde e−i Ĥ T no es mas que el operador evolucion. Notese que estamos en la representacion
de Schrodinger, donde los estados dependen del tiempo (de hecho por ejemplo |qI i =
T
. Entonces
|q(tI )i!). Dividamos ahora el intervalo T en N subintervalos de tamagno δt = N
−i Ĥ T
−i Ĥ δt
−i Ĥ δt
e
=e
···e
. Tras cada δt podemos insertar una identidad escrita como
Z
dqi |qi i hqi |
(43)
donde el subindice i significa “tras i intervalos δt”. Explicitamente
hqF | e−i Ĥ T |qI i = hqF | e−i Ĥ δt · · · e−i Ĥ δt |qI i
(44)
Z
N
−1
Y
=
dqi hqF | e−i Ĥ δt |qN −1 i hqN −1 | e−i H δt |qN −2 i · · · hq1 | e−i Ĥ δt |qI i
i=1
Una vez mas, recordemos que |qi i = q(ti )i.
Si llamamos qI = q0 y qF = qN esto es
hqF | e
−i Ĥ T
|qI i =
N
−1
Y
i=0
Z
dqi hqi+1 | e−i Ĥ δt |qi i
(45)
Recordemos que estamos estudiando una particula libre. Como el hamiltoniano es sencil2
lamente 2P̂m , esta claro que es mas sencillo trabajar en espacio de momentos. Insertemos
una identidad en espacio de momentos. Para cada ti tenemos
Z
dpi
|pi i hpi | = 1
(46)
(2 π)
19
Para ver que esto es correcto, consideremos hqi0 |qi i = δ(qi0 − qi ). Como hpi | qi i = e−i pi qi ,
eso es
Z
Z
dpi i pi (qi0 −qi )
dpi
0
(47)
hqi |pi i hpi |qi i =
e
= δ(qi0 − qi )
(2 π)
(2 π)
Es decir, la “asignacion” de (2 π)’s es correcta. Notese ademas que
Z
Z
0
0
0
hpi |pi i = dqi hpi |qi i hqi |pi i = dqi ei qi (pi −pi ) = (2 π) δ(p0i − pi )
(48)
Volviendo ahora a nuestro calculo, insertemos 1 escrito en espacio de momentos de
manera que
−i Ĥ T
hqF | e
|qI i =
N
−1
Y
i=0
Z
Z
dqi
dpi+1
(2 π)
Z
dpi
hqi+1 |pi+1 i hpi+1 | e−i Ĥ δt |pi i hpi |qi i
(2 π)
(49)
Usando que hpi | qi i = e−i pi qi , esto es
N
−1
Y
i=0
Z
dqi
Z
dpi+1
(2 π)
Z
dpi i pi+1 qi+1
e
hpi+1 | e−i Ĥ δt |pi i e−i pi qi
(2 π)
(50)
p2
i
Por otra parte, como |pi i son autoestados del hamiltoniano e−i Ĥ δt |pi i = e−i 2 m δt |pi i, asi
que
p2
i
hpi+1 | e−i Ĥ δt |pi i = (2 π) e−i 2 m δt δ(pi+1 − pi )
(51)
Asi que en nuestro calculo
N
−1
Y
i=0
Z
dqi
Z
Z
dpi+1
(2 π)
p2
dpi i pi+1 qi+1 −i pi qi
i
e
e
(2 π) e−i 2 m δt δ(pi+1 − pi )
(2 π)
(52)
Integrando en dpi+1 queda
N
−1
Y
i=0
Esto es
N
−1
Y
i=0
Z
Z
dqi
Z
dqi
Z
dpi i pi qi+1 −i pi qi −i p2i δt
e
e
e 2m
(2 π)
dpi −i
e
(2 π)
Podemos completar el cuadrado hasta tener
20
p2
i +p (qi+1 −qi )
i
2m
δt
δt
(53)
(54)
N
−1
Y
i=0
Z
dqi
hZ
dpi −i
e
(2 π)
√m
(qi+1 −qi )
2
δt
p
√ i +
2m
2
i
δt
e
m
2
i
(qi+1 −qi )
δt
2
δt
(55)
La integral en dpi es facil de hacer. Como pi corre en (−∞, ∞), podemos absorver el
termino lineal. Por lo tanto
Z
dpi −i
e
(2 π)
√m
(qi+1 −qi )
2
δt
p
√ i +
2m
2
δt
Z
=
La integral Gaussiana es facil de hacer
Z ∞
dpi −i p2i δt
e 2m =
(2 π)
2
dx e−x =
√
r
2mi 1
−
δt (2 π)
Z
∞
dx e−x
2
(56)
−∞
π
(57)
−∞
Asi que todo junto
Z
dpi −i
e
(2 π)
√m
(qi+1 −qi )
2
δt
p
√ i +
2m
2
δt
r
=
−im
2 π δt
(58)
Por lo que, metiendo esto en nuestro calculo, tenemos que
hqF | e−i Ĥ T |qI i =
Esto lo podemos re-escribir como
−i Ĥ T
hqF | e
|qI i =
−1 Z
− i m N2 NY
2 π δt
i
i=0
−1 Z
− i m N2 NY
2 π δt
=
dqi e
m
2
dqi
i=0
−1 Z
− i m N2 NY
2 π δt
Y
i
dqi e
i=0
(qi+1 −qi )
δt
i
e
m
2
PN −1
i=0
2
δt
(qi+1 −qi )
δt
m
2
2
(qi+1 −qi )
δt
(59)
δt
2
δt
(60)
Tomemos ahora el limite de N → ∞. En tal caso δt → 0. De hecho
(qi+1 − qi )
→ q̇
δt
δt
i=0
Definiendo el simbolo
Z
Dq = lim
N →∞
N
−1
X
→
Z
21
i=0
dt
(61)
ti
−1 Z
− i m N2 NY
2 π δt
tf
dqi
(62)
Notese que aqui se asume que q0 = qI y qN = qF .
Puesto todo junto, resulta al final que
Z
R tF
1
2
−i Ĥ (tF −tI )
hqF | e
|qI i = Dq ei tI dt 2 m q̇
(63)
Si hubiesemos hecho el mismo razonamiento para una particula en interaccion hubiesemos obtenido8
Z
R tF
1
2
−i Ĥ (tF −tI )
hqF | e
|qI i = Dq ei tI dt 2 m q̇ − V
(64)
Ahora bien, la cantidad 12 m q̇ 2 − V no es mas que el lagrangiano clasico de la particula,
con lo que la formula en general se escribe como
Z
−i Ĥ (tF −tI )
hqF | e
|qI i = Dq ei S
(65)
Notese que en el exponente del integrando ha aparecido
la accion clasica de la particula. Por
R
otra parte, al obtener esta formula, y oculto en Dq esta el hecho de que estamos sumando
a todos las posibles trayectorias. Puesto todo junto, hemos obtenido una expresion para
la propagacion de la particula que es la suma de todas las posibles trayectorias clasicas
pesadas con su correspondiente accion.9
Supongamos ahora que estamos interesados en la probabilidad de evolucion de un estado
inicial |Ii en uno final |F i entre tI y tF . Esto esta dado por hF |e−i Ĥ (tF −tI ) |Ii. Insertando
identidades escritas en terminos de autoestados en espacio de posiciones
Z
Z
−i Ĥ (tF −tI )
hF |e
|Ii = dqI
dqF hF |qF i hqF | e−i Ĥ (tF −tI ) |qI i hqI |Ii
(66)
Pero hqI |Ii y hqF |F i no son mas que las funciones de onda asociadas a los estados incial y
final en espacio de posciones. Por lo tanto
Z
Z
−i Ĥ (tF −tI )
hF |e
|Ii = dqI
dqF ψF∗ (qF ) hqF | e−i Ĥ (tF −tI ) |qI i ψI (qI )
(67)
Es decir, podemos escribir la evolucion de un estado en terminos del path integral hqF | e−i Ĥ (tF −tI ) |qI i.
Si recuperamos los factores de c y ~ dicho path integral es
Z
S
−i Ĥ (tF −tI )
(68)
hqF | e
|qI i = Dq ei ~
En el limite ~ → 0 la exponencial oscila infinitamente y esta dominada por los puntos de
accion estacionaria. Es decir, en el limite ~ → 0, que es el limite clasico, el path integral
8
Notese que esto es un poco mas sutil, ya que la interaccion es V = V (q, p), con lo que |pi ya no es
autoestado del hamiltoniano. Para una discusion del caso general en detalle ver la bibliografia.
9
La explicacion en el capitulo 1 del libro de Zee sobre el path integral y su significado, sobre todo en el
contexto del experimento de la doble rendija con infinitas rendijas es muy recomendable!
22
localiza en las configuraciones con δS = 0, es decir, en las configuraciones clasicas. De esta
manera el mundo clasico emerge.
4.2.2
Ordenados temporales y path integral
Supongamos que queremos calcular la siguiente cantidad
Z
Dq A[q(t1 )] ei S
(69)
con q(tI ) = qI y q(tF ) = qF . Aqui A es un funcional de la funcion q(t1 ).
Para hacer esto volvamos atras en la definicion de path integral. Recordemos que
dividiendo el intervalo tF − tI in subintervalos infinitesimales
Z
q(tF )=qF
iS
Dq e
q(tI )=qI
N
−1
Y
i=0
Z
dqi hqi+1 | e−i Ĥ δt |qi i = hqF | e−i Ĥ T |qI i =
(70)
donde hemos hecho explicitos los limites de integracion. Esta claro por lo tanto que
Z
iS
Dq A[q(t1 )] e
=
N
−1
Y
i=0
|no I
Z
−i Ĥ δt
dqi hqi+1 | e
|qi i
Z
dqI hqI+1 | e−i Ĥ δt A[q(t1 )] |qI i (71)
Donde I es el intervalo donde esta t1 . Es decir, A[q(t1 )] aparece en el factor que corresponde
al subintervalo donde esta t1 . Ahora bien, hqI+1 | e−i Ĥ δt A[q(t1 )] |qI i es el elemento de matriz
del operador de Heisenberg A[q̂(t1 )], es decir, hqF | e−i Ĥ T A[q̂(t1 )] |qI i
Supongamos ahora
Z
Dq A[q(t1 )] B[q(t2 )] ei S
(72)
Por las mismas, esto es
Z
Dq A[q(t1 )] B[q(t2 )] ei S =
N
−1
Y
i=0
|no I1 , I2
Z
dqi hqi+1 | e
−i Ĥ δt
(73)
|qi i
Z
dqI1 hqI1 +1 | e
−i Ĥ δt
A[q(t1 )] |qI1 i
Z
dqI2 hqI2 +1 | e−i Ĥ δt B[q(t2 )] |qI2 i
Donde I1 es el intervalo que contiene t1 e I2 el que contiene t2 . Supongamos que t2 < t1 .
Entonces al pasar a operadores esto es
hqF | e−i Ĥ T A[q̂(t1 )] B[q̂(t2 )] |qI i
ya que primero actua el operador que esta antes al subdividir el intervalo.
23
(74)
Si por el contrario embargo, si t1 < t2 , como en el path integral A[q(t1 )] y B[q(t2 )] son
funciones (numeros!10 ), podemos escribir
Z
Z
iS
Dq A[q(t1 )] B[q(t2 )] e = Dq B[q(t2 )] A[q(t1 )] ei S
(76)
y por el mismo motivo que antes, esto es
hqF | e−i Ĥ T B[q̂(t2 )] A[q̂(t1 )] |qI i
(77)
Por lo tanto, si t1 > t2 el path integral calcula A[q̂(t1 )] B[q̂(t2 )], y si t2 > t1 calcula
B[q̂(t2 )] A[q̂(t1 )] Esto es, de manera automatica el path integral implementa de manera
natural los ordenados temporales!!! Es decir
Z
h
i
Dq A[q(t1 )] B[q(t2 )] ei S = hqF | e−i Ĥ T T A[q̂(t1 )] B[q̂(t2 )] |qI i
(78)
4.3
Fuentes y funciones generatrices
Volvamos a la ecuacion anterior para el caso mas sencillo, donde A[q(t)] = q
Z
Dq q(t1 ) ei S = hqF | e−i Ĥ T q̂(t1 ) |qI i
(79)
Construyamos la siguiente cantidad
Z[J] =
Si t1 ∈ [tI , tF ] esta claro que
δ Z[J]
=
δJ(t1 )
R
R
R tF
Dq ei S+ tI J(t) q(t)
R
Dq ei S
R tF
Dq q(t1 ) ei S+ tI
R
Dq ei S
(80)
J(t) q(t)
Asi pues, si ahora evaluamos esta derivada funcional en J(t) = 0 tenemos que
R
Dq q(t1 ) ei S
hqF | e−i Ĥ T q̂(t1 ) |qI i
δ Z[J]
|J=0 = R
=
δJ(t1 )
Dq ei S
hqF | e−i Ĥ T |qI i
(81)
(82)
Es por lo tanto evidente que
10
Notese que si estuviesemos discutiendo fermiones, A[q(t1 )] y B[q(t2 )] serian variables Grassman, y
por lo tanto en lugar de conmutar, anticonmutarian. Esta es una manera de argumentar que el ordenado
temporal para fermiones debe ser
h
i
T ψ̄(t1 ) ψ(t2 ) = θ(t1 − t2 ) ψ̄(t1 ) ψ(t2 ) − θ(t2 − t1 ) ψ(t2 ) ψ̄(t1 )
(75)
24
n
δ Z[J]
|J=0 =
δJ(t1 ) · · · δJ(tn )
R
iS
Dq q(t1 ) · · · q(tn ) e
R
Dq ei S
=
h
i
hqF | e−i Ĥ T T q̂(t1 ) · · · q̂(tn ) |qI i
hqF | e−i Ĥ T |qI i
Es decir, Z[J] lo podemos pensar como funcional generador de las funciones
h
i
hqF | e−i Ĥ T T q̂(t1 ) · · · q̂(tn ) |qI i
G(t1 , · · · , tn ) =
hqF | e−i Ĥ T |qI i
Volvamos a la definicion de Z[J]. En el numerador tenemos
Z
Z
R
R
i S+ J(t) q(t)
Dq e
= Dq ei L+i J(t) q(t)
(83)
(84)
(85)
Es decir, el numerador es el path integral para una particula con una accion en la que
hemos agnadido la interaccion extra i J q. Para entenderlo tomemos el ejemplo sencillo de
una particula libre. En tal caso L + Jq = 12 m q̇ 2 + i J q. La ecuacion de movimiento es
m q̈ = i J
R
(86)
Es decir, J es una fuente externa. Esto es, al agnadir el termino J q es como haber
agnadido una fuente externa J para q. La funcion generatriz Z[J] por lo tanto tiene en
cuenta la respuesta del sistema a una fuente externa J.
4.4
Path integrals en Teoria Cuantica de Campos
El path integral esta formulado de manera natural en terminos del lagrangiano, que a su vez
esta adaptado a mantener explicitas todas las simetrias de una teoria invariante Lorentz.
Por otra parte, el path integral incorpora de manera natural ordenados temporales. Esto
sugiere que la teoria de campos se formula de manera natural en terminos de path integrals.
El path integral para un campo es la generalizacion obvia del path integral en mecanica
cuantica.11
−i Ĥ (tF −tI )
hφF | e
|φI i =
Z
φ(tF )=φF
φ(tI )=φI
Dφ ei
R tF
tI
dt L
(87)
A la vista de que al agnadir fuentes tenemos un funcional generador para ordenados temporales, y dado que, calculados en el vacio dichos ordenados temporales son los correladores
a n puntos centrales en teoria de campos, esta claro que nos interesa tomar el limite
tI → −∞, t → ∞ con φI = φF = vacio. En tal caso podemos definir
11
Una manera de argumentar esto es discretizando el campo, de manera que el campo es una coleccion
finita de particulas en un cierto potencial. Para cada particula podemos usar la derivacion de path integral
conocida. Tomando despues el limite continuo de este sistema recuperamos el path integral para campos.
25
Z[J] =
De manera que
R
R
Dφ ei S+ J φ
R
Dφ ei S
h
i
hT φ̂(x1 ) · · · φ̂(xn ) i =
(88)
δ n Z[J]
|J(x)=0
δJ(x1 ) · · · δJ(xn )
(89)
Notese que el denominador en Z[J] es tal que, para la funcion a 0 puntos, que no es mas
que la norma del vacio, tenemos h0|0i = 1.
Es importante darse cuenta de que esta formula es obvia de generalizar a teorias con un
numero arbitrario de campos, a su vez estos de un tipo arbitrario (fermionicos, bosonicos,
complejos, reales, spin 1. . . incluso a priori spin 2!). De esta manera al menos en principio,
podemos calcular un correlador arbitrario en una teoria arbitraria a traves de una integral.
4.5
Campos libres
Fijemonos en el caso mas sencillo del campo escalar real sin interacciones. La accion es
Z
1
1
(90)
S = d4 x (∂φ)2 − m2 φ2
2
2
Por lo tanto el funcional generador es
Z
Z
R
R
−1
i d4 x 12 (∂φ)2 − 12 m2 φ2 + d4 x J(x) φ(x)
Z[J] = N
Dφ e
N = Dφ ei S
(91)
No es para nada obvio que esta integral tenga sentido (converja). Para empezar, es una
integral de una funcion oscilatoria. Para darle sentido
podemos hacer m2 → m2 − i y
R
tomar el limite → 0+ . Asi, el exponente adquiere − d4 x φ2 , que hace que la exponencial
se atenue en φ → ∞, haciendo que la integral converja. Asi pues hemos de calcular
Z[J] = N
−1
Z
i
Dφ e
R
d4 x
1
2
R
(∂φ)2 − 12 (m2 −i ) φ2 + d4 x J(x) φ(x)
N =
Z
Dφ ei S
(92)
Fijemonos en el exponente. Integrando por partes podemos escribir
Z
Z
Z
−i 2
−i
1
1
2
4
d x φ [∂ +(m −i )] φ+ d x J(x) φ(x) = d4 x φ [∂ 2 +(m2 −i )] φ+ J(x) φ(x)+ φ(x) J(x)
2
2
2
2
(93)
Transformando de Fourier
Z
d4 p
φ=
φ(p) ei p·x
(94)
(2 π)4
4
Tenemos
26
Z
Z
Z
d4 q i 2
1
1
2
φ(q)
[p
−
(m
−
i
)]
φ(p)
+
J(q)
φ(p)
+
φ(q)
J(p)
ei (p+q)·x
(2 π)4
2
2
2
(95)
4
La integral en d x es una δ, y por lo tanto
Z
d4 p
1
1
i
(96)
φ(−p) [p2 − (m2 − i )] φ(p) + J(−p) φ(p) + φ(−p) J(p)
4
(2 π)
2
2
2
4
dx
d4 p
(2 π)4
Por ahorrar notacion llamemos ∆(p) = 2i [p2 − (m2 − i )]. Evidentemente ∆(−p) = ∆(p).
Asi pues
Z
1
1
d4 p
φ(−p) ∆(p) φ(p) + J(−p) φ(p) + φ(−p) J(p)
(97)
4
(2 π)
2
2
Esto se puede escribir como
Z
h
d4 p
J(−p) i h
J(p) i J(−p) J(p)
∆(p) φ(−p) +
φ(p) +
−
(2 π)4
2 ∆(−p)
2 ∆(p)
4∆
(98)
Por lo tanto
Z[J] = N −1
Z
R
Dφ e
d4 p
(2 π)4
∆(p)
h
J(−p)
φ(−p)+ 2 ∆(−p)
ih
J(p)
φ(p)+ 2 ∆(p)
i
e
−
R
d4 p J(−p) J(p)
4∆
(2 π)4
(99)
Como la integral en Dφ corre en φ ∈ [−∞, ∞], podemos reabsorver el desplazamiento
finito J/2∆, de manera que
Z
R d4 p J(−p) J(p)
R d4 p
−
∆(p) φ(−p) φ(p)
−1
4
4∆
(2
π)
Z[J] = e
N
(100)
Dφ e (2 π)4
Pero
N
Asi que
−1
Z
R
Dφ e
d4 p
(2 π)4
i
Z[J] = e 2
R
∆(p) φ(−p) φ(p)
=1
d4 p J(−p) J(p)
(2 π)4 p2 −m2 +i Transformando de Fourier de vuelta a espacio de posiciones
h
i
1
Z[J] = e 2
R
d4 x
R
d4 y J(x)
d4 p i ei p·(x−y)
(2 π)4 p2 −m2 +i (101)
(102)
J(y)
(103)
La cantidad en el exponente es central en Teoria Cuantica de Campos, conocida como
propagador de Feynman DF , asi que
1
Z[J] = e 2
R
d4 x
R
d4 y J(x)DF (x−y) J(y)
27
(104)
Por lo tanto tomando la segunda derivada con respecto a las fuentes y poniendolas luego
a cero tenemos que
h
i
hT φ̂(x) φ̂(y) i = DF (x − y)
(105)
Notese que dado que conocemos exactamente Z[J] podemos calcular todas las funciones
de correlacion en la teoria libre.
4.6
Propagadores
Hemos encontrado que el propagador de Feynman es una cantidad de imporancia central
en teoria cuantica de campos, ya que es el correlador mas basico –veremos mas adelante
esto hecho explicito–.
Para entender el significado de DF , supongamos un campo libre, y escribamoslo como
φ̂(x) = φ̂(x)+ + φ̂(x)−
(106)
Con
+
φ̂ (x) =
Z
d3 p~
p
âp e−i p·x
(2 π)3 2 ωp~
−
φ̂ (x) =
Recordemos ahora que DF esta definido como
Z
d3 p~
p
â†p ei p·x
(2 π)3 2 ωp~
DF (x − y) = θ(x0 − y 0 ) [φ̂+ (x), φ̂− (y)] + θ(y 0 − x0 ) [φ̂+ (y), φ̂− (x)]
(107)
(108)
Explicitamente, usando quien es φ̂± , esto es
Z
d3 ~q
d3 p~
p
p
θ(x0 − y 0 ) e−i p·x ei q·y [âp~ , â†q~]
3
3
(2 π)
2 ωp~
(2 π)
2 ωq~
Z
Z
d3 p~
d3 ~q
p
p
+
θ(y 0 − x0 ) e−i p·y ei q·x [âp~ , â†q~]
3
3
(2 π)
2 ωp~
(2 π)
2 ωq~
Z
(109)
Usando las reglas de conmutacion de los operadores creacion/destruccion
Z
Z
d3 p~
d3 ~q
p
p
θ(x0 − y 0 ) e−i p·x ei q·y (2 π)3 δ(~p − ~q)
3
3
(2 π)
2 ωp~
(2 π)
2 ωq~
Z
Z
3
3
d p~
d ~q
p
p
θ(y 0 − x0 ) e−i p·y ei q·x (2 π)3 δ(~p − ~q) =
+
3
3
(2 π)
2 ωp~
(2 π)
2 ωq~
Z
h
i
3
d p~
0
0
−i p·(x−y)
0
0
i p·(x−y)
θ(x
−
y
)
e
+
θ(y
−
x
)
e
(110)
(2 π)3 2 ωp~
Esta integral se puede re-escribir como una integral 4-dimensional
28
= φ+ (x)φ+ (y) + φ+ (x)φ− (y) + φ− (x)φ+ (y)
+φ− (x)φ− (y)
= φ+ (x)φ+ (y) + φ− (y)φ+ (x) + φ− (x)φ+ (y)
+φ− (x)φ− (y) + [φ+ (x), φ− (y)]
= : φ(x)φ(y) : + [φ+ (x), φ− (y)] ,
(5.73)
lons denote normal ordering. Similarly for y 0 > x0
= : φ(x)φ(y) : +[φ+ (y), φ− (x)]. Therefore
x)φ(y)} = : φ(x)φ(y) : + D(x − y) ,
(5.74)
D
F (x − y) =
Z
d4 p
i
ei p·(x−y)
(2 π)4 p2 − m2 + i (111)
En donde se asume que va a 0+ . Demostremos esto haciendo la integral en dp0 explicita.
0
0
esφ−(llamemos
)[φ+ (x), φ− (y)] +El
θ(yintegrando
− x0 )[φ+ (y),
(x)] . (5.75)z = x − y por sencillez de notacion)
Z term
Z
e expectation value of the normal ordered
d2 p~ −i p~·~z
dp0
1
0
ei p0 z
(112)
ecause there is always either one annihilation op- 3 e
2
2
2
π)
(2 π) p0 − p~ − m + i or a creation operator acting on "0|. Instead(2the
d a†p is a c-number,
also D(x −
Lasointegral
eny) pis0 alac-number,
podemos hacer
p
D(x − y)"0|0! = integrando
D(x − y). Therefore
D(x
is m2 − i .
2+
estan en −p~y)
pagator,
usando el teorema de los residuos. Los polos del
Como es pequegno podemos expandir en serie y
escribir los polos aproximadamente como
0|T {φ(x)φ(y)}|0! = D(x − y) .
(5.76)
p−
' −ωp~ + i
(113)
p+
' ωp~ − i
0
0
mutators we find
2
2
p
1 " 0
ωp~ =# + p~2 + m2 .
0 Donde
−ip(x−y)como 0siempre
0 ip(x−y)
θ(x − y )e
.
+ θ(y − x )e
2Ep
Notese que los polos estan ligeramente desplazados del eje real: el polo con parte real
(5.77)
negativa esta ligeramente
subido en la parte positiva compleja mientras que el polo con
can be computed explicitly, but it is more useful
negativa esta un poco mas bajado (ver fig. (2).
four-dimensionalparte
integral,
=
!
i
d4 p
e−ip(x−y) ,
(2π)4 p2 − m2 + i$
p0
(5.78)
ve the equivalence of eqs. (5.77) and (5.78), observe
q. (5.78) can be written as
! +∞ 0
0
0
0
dp
i
e−ip (x −y ) ,
(5.79)
0 )2 − E 2 + i$
2π
(p
−∞
p
m2 )1/2 . The integral over p0 can be computed
p0 -plane. The i$ factor displaces slightly the poles Fig. 5.1 The position of the poles in
Posicion
de los
polos en el plano complejo p0 .
the complex
p0 -plane.
)). Thus2:the
he poles are at ±p0 % Ep (1 − i$/(2Ep2Figure
ghtly displaced below the real axis and the pole at
La axis,
cuestion
es in
que
usar. En particular, queremos un contorno
displaced above the real
as shown
Fig.contorno
5.1.
tal que la
contribucion del semicirculo en el infinito sea nula. Supongamos z > 0. En tal caso
0
la exponencial ei p0 z decaeria para z0 → ∞ si p0 tuviese una pequegna parte imaginaria
positiva. Por lo tanto vemos que para z 0 > 0 debemos cerrar el contorno por arriba,
atrapando el polo p−
0 . El residuo en este polo es
0
Resp0 =p−0
h
i
1
1 −i ωp~ z0
i p0 z 0
e
=−
e
2
2
2
p0 − p~ − m + i 2 ωp~
(114)
Este es rodeado en sentido contrario a las agujas del reloj, y por lo tanto da una
contribucion que es directamente el residuo de arriba, es decir, contribuye
−(2 π i)
1 −i ωp~ z0
e
θ(z 0 )
2 ωp~
29
(115)
Por otra parte, cuando z 0 < 0 la exponencial se atenua si p0 tiene una pequegna parte
imaginaria negativa. Debemos por lo tanto cerrar el contorno por abajo de manera que
rodeamos el polo p+
0 . En el
Resp0 =p+0
h
i
1
1 i ωp~ z0
i p0 z 0
e
=
e
2
2
2
p0 − p~ − m + i 2 ωp~
(116)
Como este polo es rodeado en el sentido de las agujas del reloj contribuye como menos lo
de arriba, es decir
−(2 π i)
1 i ωp~ z0
e
θ(−z 0 )
2 ωp~
(117)
Por lo tanto
DF (x − y) =
Z
i
1 −i ωp~ z0
d2 p~ −i p~·~z h 1 i ωp~ z0
0
0
e
e
e
θ(−z
)
+
θ(z
)
(2 π)3
2 ωp~
2 ωp~
(118)
que es la expresion de partida. Asi pues, resumiendo, el propagador de Feynman DF
se puede escribir en notacion covariante usando la prescripcion de +i , que nos fuerza a
escoger un contorno tal que se recupera la expresion correcta de la funcion a dos puntos.
4.6.1
Funciones de Green
Podemos actuar con el operador de Klein-Gordon sobre el propagador de Feynman. Esta
claro que en el limite → 0 lo que obtenemos es
∂ 2 + m2 DF = i δ 4 (x)
(119)
siendo δ 4 (x) la δ de Dirac en espacio de Minkwoski (a veces suprimiremos el superindice)
Z
d4 p i p· x
4
e
(120)
δ (x) =
(2 π)4
La ecuacion de arriba es familiar: DF es simplemente una funcion de Green para el operador
de Klein-Gordon! En general, la ecuacion de Klein-Gordon con fuente δ tiene como solucion
2
∂ +m
2
4
G = −i δ (x)
⇐⇒
G=
Z
i
d4 p
ei p·(x−y)
4
2
(2 π) p − m2
(121)
Es trivial que G satisface la ecuacion de Klein-Gordon con fuente δ para cualquier p tal
que p2 6= m2 . El problema es que ocurre precisamente en p2 = 0. En tal caso uno debe
de dar una prescripcion para rodear los polos. Una posibilidad es la prescripcion +i , que
lleva al propagador de Feynman como acabamos de ver. Pero esta claro que uno puede
tomar otras prescripciones. Las mas relevantes son
30
• Propagador retardado:
escogiendo el contorno cerrado por arriba, solo cuando z 0 > 0 la contribucion del
semicirculo se anula. Como este propagador tiene z 0 > 0 se le conoce como propagador retardado DR (x − y). En teoria clasica, si uno conoce la configuracion del
campo en un instante de tiempo es este propagador el que la hace avanzar en el
tiempo.
• Propagador avanzado:
escogiendo el contorno cerrado por abajo, solo cuando z 0 < 0 la contribucion del semicirculo se anula. Como este propagador tiene z 0 < 0 se le conoce como propagador
avanzado DA (x − y). En la teoria clasica se usara cuando uno conoce la configuracion
final y pretende encontrar de donde viene esta atras en el tiempo.
Volviendo al propagador de Feynman, vemos que es tal que propaga frecuencias posi0
tivas –es decir, el trozo con e−i ωp~ z – adelante en el tiempo –debido al θ(z 0 )– y frecuencias
0
negativas –el trozo con ei ωp~ z – atras en el tiempo –debido al θ(−z 0 )–.
4.7
Campos en interaccion
Hasta ahora hemos asumido que el sistema no contiene interacciones, es decir, hemos
cuantizado un sistema clasico con lagrangiano
1
1
∂µ φ ∂ µ φ − m2 φ2
(122)
2
2
Esta claro que el campo no tiene por que ser libre. En general podemos considerar un
lagrangiano clasico compatible con todas las simetrias. En este caso, estamos asumiendo
un campo escalar, asi que la unica restriccion es invariancia Lorentz. Por lo tanto, el
lagrangiano mas general sera de la forma:
L=
L=
X
1
1
∂µ φ ∂ µ φ − m2 φ2 −
λn φn
2
2
n>2
(123)
Es evidente que la ecuacion de movimiento ya no es simplemente la ecuacion de KleinGordon, sino que se convierte en
X
2
2
2
~
n λn φn−1
(124)
∂0 − ∂ + m φ(x) = −
n>2
Esta claro que los coeficientes λn controlan las no-linealidades, es decir, las interacciones
del campo (en este caso consigo mismo).
Volviendo a la accion es
Z
X
1
1
S = d4 x ∂µ φ ∂ µ φ − m2 φ2 −
λn φn
(125)
2
2
n>2
31
Asumiendo unidades en las que [~] = [c] = 1, como la accion ha de ser adimensional, si xµ
tiene unidades de E −1 , vemos que [φ] = E, de manera que
[λn ] = 4 − n
(126)
Ya que los coeficientes λn son dimensionales, en realidad no tiene mucho sentido decir que controlan la intensidad de las interacciones. Es natural construir constantes de
acoplamiento adimensionales gn usando alguna escala de energia tipica E que tenga el
problema
;
gn = E n−4 λn
[gn ] = 0
(127)
Manteniendo λn fijo, esta claro que segun n el comportamiento de gn es muy diferente al
variar la escala caracteristica E. Esta escala podemos pensarla como la escala a la que
estamos observando el sistema, y por lo tanto marca el rango de energias en el que estamos
interesados. Como nuestro mundo es un mundo de baja energia, en realidad estamos
interesados en estudiar el sistema a bajas E. En otras palabras, estamos interesados en la
teoria efectiva a baja energia. Segun n cosas muy diferentes ocurren
• n > 4: el exponente de E es positivo, por lo que al ir E a cero gn va a cero. Estos
terminos se llaman irrelevantes.
• n = 4: en este caso gn = λn y –al menos naifmente– no hay dependencia con E. Estos
terminos se llaman marginales.
• n < 4: el exponente de E es negativo, y por lo tanto estos gn se hacen mayores y
mayores al decrecer E. Estos terminos se llaman relevantes.
Esta observacion es crucial. Al final, nuestro modelo sencillo de teoria escalar podria
representar el campo del π 0 . En principio parece que uno deberia tener en cuenta las
infinitas interacciones del π 0 consigo mismo, lo que parece algo imposible de analizar. Sin
embargo, dado que al final el π 0 es observado en un mundo de baja energia, todas las
interacciones con n > 4 son basicamente despreciables. Por lo tanto es suficiente con
considerar
1
1
∂µ φ ∂ µ φ − m2 φ2 − λ3 φ3 − λ4 φ4
2
2
De hecho, imponiendo simetria bajo φ → −φ, los unicos terminos relevantes son
L=
(128)
1
1
∂µ φ ∂ µ φ − m2 φ2 − λ φ4
(129)
2
2
Este es el modelo sencillo con el que trabajaremos para hacer calculos explicitos de aqui
en adelante. Dado que un campo en interaccion se describe clasicamente por una ecuacion
mucho mas complicada que la ecuacion de Klein-Gordon, evidentemente la cuantizacion
de este sistema ya no dara algo tan sencillo como
L=
32
φ̂(~x, t)
4.7.1
Z
i
h
d3 p~
−i p·x
† i p·x
p
e
â
e
+
â
p
p
(2 π)3 2 ωp~
(130)
Interacciones relevantes y el IR
Como vimos, las interacciones irrelevantes no cambian la fisica de bajas energias (infrarojo=IR), ya que en ese regimen son despreciables. Sin embargo las interacciones relevantes
son cruciales para entender el IR. Las interacciones marginales pueden, por efectos cuanticos, volverse relevantes y cambiar completamente las propiedades del IR. De hecho esto es lo
que ocurre en QCD: la interaccion de QCD –como el electromagnetismo– es marginal en 4d.
Sin embargo, a diferencia del electromagnetismo, QCD es una interaccion marginalmente
relevante, es decir, se vuelve, por efectos cuanticos, muy fuerte en el IR. Esto es lo que
genera el confinamiento de los quarks y gluones en π 0 , π ± , protones, mesones. . . Podemos
ahora entender mejor algunos comentarios anteriores: en QCD naifmente tenemos una
interaccion marginal que se vuelve relevante, creciendo por lo tanto al bajar la energia. A
una cierta escala de energias ΛQCD la interaccion se hace tan fuerte que quarks y gluones
ya no existen libres. Por debajo de esa energia, la teoria efectiva es una teoria para π 0 ,
π ± , protones, mesones . . . Nosotros estamos considerando el subsector de dicha teoria que
solo contiene π 0 !
4.8
Calculando correladores para campos en interaccion
La definition de Z[J] nos permite a priori calcular funciones de correlacion en terminos
del path integral en general, haya o no interaccion. En principio es posible calcular directamente el path integral (sea analiticamente o numericamente, en la lattice). Sin embargo
en la practica, mas alla de simulacion numerica, es generalmente imposible calcular el funcional generador de manera exacta. Por eso debemos recurrir a la teoria de perturbaciones.
En nuestro ejemplo de λ φ4 , tenemos que12
Z
Z
R
1 2 1 2 2 λ 4
i S+ J φ
∂φ − m φ − φ
(131)
S=
Z[J] = D e
2
2
4!
λ
R
4
Supongamos λ pequegno. Expandiendo el trozo e−i 4! φ tenemos
Z
Z
Z
R
R
iλ
i S0 + J φ
4
d x Dφ φ(x)4 ei S+ J φ + · · ·
(132)
Z[J] = Dφ e
−
4!
donde
Z
1 2 1 2 2
(133)
S0 =
∂φ − m φ
2
2
Ahora bien, cada insercion de φ(x) la podemos cambiar por una derivada con respecto
a J(x). Es decir, esta claro que
12
Asumamos que
R
ei S = 1.
33
Z
R
4 i S+ J φ
Dφ φ(x) e
=
Z
Dφ
R
δ4
i S+ J φ
e
δJ(x)4
Asi pues, podemos escribir que
Z
Z
Z
R
R
iλ
δ4
i S0 + J φ
4
i S+ J φ
Z[J] = Dφ e
−
d x Dφ
e
+ ···
4!
δJ(x)4
con lo que resumando la serie, al menos formalmente, podemos escribir
Z
R 4
4
R
λ
−i 4!
d x δ 4
δJ(x)
Z[J] = e
Dφ ei S0 + J φ
(134)
(135)
(136)
Pero la integral con la accion libre la sabemos hacer, asi que podemos escribir
−i
Z[J] = e
λ
4!
R
d4 x
δ4
δJ(x)4
1
e2
R
d4 x
R
d4 y J(x)DF (x−y) J(y)
(137)
Dado este resultado, podemos, al menos en principio, calcular las amplitudes de scattering
al orden deseado.
4.8.1
λ φ4 hasta O(λ)
En teoria de perturbaciones uno asume λ << 1, de manera que la exponencial de antes se
puede expandir. Supongamos que nos contentamos con precision O(λ). Entonces podemos
expandir la exponencial y escribir
Z
R 4 R 4
1
δ4
λ
d x d y J(x)DF (x−y) J(y)
2
d4 x
)
e
(138)
ZO(λ) [J] ∼ (1 − i
4!
δJ(x)4
Para calcular el scattering de 2 particulas en 2 particulas necesitamos el correlador a
4 puntos, es decir, la 4 derivada de ZO(λ) [J] con respecto a J. Del termino sin λ, a orden
0 el correlador es pues simplemente el correlador a 4 puntos libre, que se puede calcular
facilmente usando el resultado para la teoria libre de antes.
h
i
hT φ̂(x1 ) φ̂(x2 ) φ̂(x3 ) φ̂(x4 ) i
(139)
= DF (x1 − x2 ) DF (x3 − x4 ) + DF (x1 − x3 ) DF (x2 − x4 ) + DF (x1 − x4 ) DF (x2 − x4 )
Ahora bien, esto es el producto de dos propagadores de Feynman, mientras que LSZ pone
4 factores de (p2i −m2 ). Al poner las particulas externas on shell estos dan 4 ceros mientras
que los propagadores dan solo dos polos. Por lo tanto la amplitud a orden λ0 es cero.
A orden λ debemos calcular
Z
h
i
4
4
−i λ d x hT φ̂(x1 ) φ̂(x2 ) φ̂(x3 ) φ̂(x4 ) φ̂(x) i
(140)
Al tener 8 campos, esta cantidad sera proporcional a 4 propagadores, con lo que potencialmente algunos terminos podran cancelar los 4 ceros en la formula de LSZ. La cuestion
34
clave es que al expandir el correlador de arriba, de los muchos terminos que saldran, solo
unos pocos son tales que se producen los polos deseados, es decir, muchos de los terminos
en el teorema de Wick no contribuyen a la amplitud de scattering porque no contienen los
polos apropiados. De hecho, los terminos que contribuyen son de la forma
Z
d4 x DF (x1 − x) DF (x2 − x) DF (x3 − x) DF (x4 − x)
(141)
Al pasar a espacio de momentos es facil ver que esto produce polos que cancelan los ceros
de la formula LSZ, dejando al final simplemente −i λ. Mas explicitamente, debemos pues
calcular
λ
−i
4!
Z
d4 x
1
δ4
δ4
2
e
δJ(x)4 δJ(x1 ) δJ(x2 ) δJ(x3 ) δJ(x4 )
R
d4 x
R
d4 y J(x)DF (x−y) J(y)
|J=0
(142)
La manera mas sencilla de hacer esto es expandiendo la exponencial
1
R
e2
X
d4 x
R
1
n!
2n
d4 y J(x)DF (x−y) J(y)
Z
dx1 · · ·
Z
dxn
=
Z
(143)
dy1 · · · dyn J(x1 ) · · · J(xn ) J(y1 ) · · · J(yn ) DF (x1 − y1 ) · · · DF (xn − yn )
Ya que el termino relevante es una derivada octava, esta claro que, una vez ponemos a 0 las
J el unico termino relevante de la serie es n = 4. Tomando aqui derivadas salen un monton
de terminos. Pero como sabemos, LSZ nos instruye a buscar aquellos que produzcan polos
al poner las particulas externas on shell. Dichos terminos son cosas de la forma
−i λ DF (x1 − x) DF (x2 − x) DF (x3 − x) DF (x4 − x)
(144)
Volvamos por un momento al termino de orden λ0 . Si DF (x − y) es pensado como la
propagacion de una particula entre x e y resulta que esto es simplemente los 3 posibles
diagramas representando las maneras de unir 3 puntos (ver fig(4)).
1:⌦
⌦:3
1:⌦
⌦:3
1:⌦
⌦:3
2:⌦
⌦:4
2:⌦
⌦:4
2:⌦
⌦:4
Figure 3: Las 3 posibles propagaciones. En el ultimo las lineas se cruzan sin intersecarse.
Por otra parte, en esta interpretacion diagramatica, el primer diagrama que contribuye, a
orden λ, se corresponde con
35
⌦:3
1:⌦
⌦:3
1:⌦
⌦:3
⌦:4
2:⌦
⌦:4
2:⌦
⌦:4
Figure 4: Primer diagrama contribuyendo a orden λ1 . El punto gordo es la interaccion en
x.
Notese que, siguiendo con la interpretacion de que el propagador representa la propagacion
de una particula, este primer termino que contribuye al scattering se puede entender como
un diagrama en el que todos los puntos xi estan conectados a traves del punto de interaccion
x. Por otra parte, a orden λ0 , ninguno de los terminos que teniamos conectaba todos los
puntos y consecuentemente obvtuvimos cero. Si siguiesemos yendo a ordenes mas altos
de nuevo veriamos que solo algunos terminos contribuyen, y de nuevo corresponderian a
diagramas en los que todos los puntos estan conectados entre si a traves de interacciones.
Es decir, de esta manera aprendemos que solo los diagramas conexos contribuyen a los
scatterings.
De hecho, el patron que emerge es que las contribuciones a la amplitud de scattering se
pueden construir orden a orden con estos dibujos –que se llaman diagramas de Feynman–,
donde solo diagramas conexos contribuyen. Las conexiones internas –“puntos gordos”– se
corresponden con la interaccion y se conocen como vertices. En el caso de λ φ4 tenemos que
por cada vertice 13 hemos de poner un factor −i λ. Estos vertices se unen con propagadores
para formar el diagrama completo. Usualmente se trabaja en espacio de momentos, donde
todo es mas sencillo. Siendo mas explicitos, en el caso que nos ocupa –λ φ4 – dichas reglas
en espacio de momentos son
1. Dibujar un diagrama hecho a partir de lineas que se juntan en vertices con estrictamente 4 segmentos.
2. Asignar un momento pi a cada linea.
3. En cada vertice entran 4 momentos. Imponer conservacion del momento en cada
vertice y agnadir un factor
−i λ
(145)
4. Por cada linea interna agnadir un propagador de Feynman con el momento correspondiente
13
Notese que en realidad hay varias combinaciones de este diagrama, que corresponden a las diferentes
maneras de poner los numeros externos etiquetando los puntos. Esta claro que hay 4! dichas maneras.
λ
Por eso definimos la interaccion con 4!
, de manera que la primera contribucion a la amplitud de scattering
–vertice a secas– sea simplemente −i λ.
36
DF =
p2
i
− m2 + i (146)
5. Por cada lazo cerrado (el nombre tecnico es loop) agnadir una integral al momento
corriendo en el loop
Z
d4 p
(2 π)4
(147)
Antes de seguir, algunos comentarios sobre estas reglas
• El hecho de que en (1) tengamos vertices con 4 patas se debe a que estamos considerando una interaccion φ4 . Para una interaccion φn los vertices tendran n patas.
• El que el factor del vertice sea simplemente −i λ se debe a que hemos tomado que
Hint = 4!λ φ4 . Sin el 4! tendriamos un factor de 24 extra.
• En esta prescripcion solo contribuyen diagramas conexos. Los no conexos simplemente dan cero debido a los ceros en LSZ. Por ejemplo, cosas como el primer diagrama
en la figura (4) no deben ser incluidas.
• En esta prescripcion, esto da directamente el elemento de matriz in h~p1 · · · p~n |~k1 · · · ~km iout .
• Hemos basicamente olvidado las patas externas. Las patas externas son los estados
in y out. Esto nos permite entender ahora mejor la formula de LSZ: debido a los
factores de p2i − m2 , solo los polos del correlador contribuyen. Es decir, debido
a los numeradores p2i − m2 , la amplitud debe tambien tener polos (p2i − m2 )−1 al
poner on shell particulas externas. Dichos polos no son mas que las patas externas
del diagrama. Podriamos haberlas tenido en cuenta, pero en tal caso deberiamos
tambien tener en cuenta los factores de p2 − m2 en la formula de LSZ para calcular
la amplitud (que evidentemente cancelan los propagadores externos)
En resumen, siguiendo estas reglas podemos calcular en principio a un orden arbitrario
en λ, ya que cada termino en la expansion de la formula de LSZ se corresponde con un
diagrama, para el que tenemos reglas sencillas para proceder.
4.9
La moral del asunto-parte II
El mensaje a extraer es que las cantidades centrales en Teoria Cuantica de Campos son las
funciones a n puntos. En particular, las amplitudes de scattering –observables fisicos por
excelencia– se escriben en terminos de correladores.
De modo practico, cada tipo de particula vendra descrito por un campo relativista. Que
tipo de campo –aunque hemos trabajado por sencillez con el campo escalar real, podriamos
considerar campos vectoriales, spinoriales. . . –. Una accion clasica –que es un escalar de
37
Lorentz con un termino cinetico con dos derivadas– describira la fisica clasica del problema.
Metiendo dicho lagrangiano en el path integral podemos cuantizar el sistema a la manera
de antes: escribimos el path integral con fuentes como funcional generador, y vemos los
terminos de interaccion como derivadas funcionales con respecto a las fuentes. De este
modo en principio podemos calcular Z exacto en terminos del caso libre. En la practica
esto nos da, igual que para el campo escalar, una manera de proceder iterativamente,
asumiendo la constante de acoplo pequegna, a calcular las funciones de correlacion. Esta
construccion se puede codificar en las reglas de Feynman. Las amplitudes de scattering
las podemos deducir de las reglas de Feynman que vienen de dicho lagrangiano ya que son
basicamente las funciones de correlacion conexas. Resumiendo de nuevo, a grosso modo
1. Por cada tipo de particula en el problema habra un campo (con las propiedades bajo
transformaciones de Lorentz adecuadas: spinor, vector, escalar. . . ). Un lagrangiano
clasico recogera la dinamica de estos campos.
2. El L sera de la forma Lf ree + Lint , donde Lf ree son los terminos cineticos (cuadraticos
en derivadas de los campos) y el resto –las interacciones – son Lint .
3. Cada Lf ree para cada campo conduce a un propagador de Feynman para dicho campo.
Para el campo escalar real, en espacio de momentos, tenemos una regla de Feynman
que asigna a la linea correspondiente a cada campo
DF =
p2
i
− m2 + i (148)
Aqui esto no esta on shell, es decir, tal que p2 no es necesariamente m2 .
4. Cada termino en Lint es un polinomio en los campos (e.g. λ φ4 ) que conduce, en
las reglas de Feynman, a un vertice que une las lineas de cada tipo de campo en el
polinomio. Dicho vertice contribuye –factores combinatorios a parte–
−i λ
(149)
Con estas reglas podemos calcular a cualquier orden en λ cualquier proceso:
1. por cada particula que entra/sale dibujamos una linea externa.
2. las conectamos –diagramas conexos solo, ya que los no conexos dan 0 por los ceros
de LSZ– con los vertices de los que disponemos, usando tal vez mas propagadores.
Cada vertice contribuye −i λ
3. si queremos calcular a orden λn debemos escribir todos los diagramas que contengan
n vertices, calcular su valor usando las reglas de Feynman y sumarlos. Eso sera M.
4. conocido M, una vez tenidos en cuenta los espacios de fases correspondientes –que
es solo dependiente de la cinematica–, podemos calcular secciones eficaces.
38
4.10
Ejemplo: interacciones nucleares
En QCD –mas adelante lo veremos mas explicito– las excitaciones de mas baja energia (las
mas ligeras) son los piones –escalares– y los nucleones –fermiones–. Como el pion es un
escalar, introduzcamos un campo escalar π con masa mπ . Como cada nucleon –neutron
y proton– es un fermion, introduzcamos dos campos de spin 1/2 –ver siguiente capitulo–
que llamaremos ni , tal que n1 sera el proton y n2 el neutron. Como su masa es casi casi
igual, supongamos que ambos tienen masa mn . El Lagrangiano mas general posible con
interacciones marginales es
Z
1
m2
∂µ π ∂ µ π − π π 2 + n̄i γ µ ∂µ ni − mn n̄i ni − λ n̄i γ5 nj π
(150)
S=
2
2
En
R realidad el prion es un pseudoescalar, por lo que el termino de interaccion deberia ser
λ n̄i γ5 ni π. De momento olvidemonos de esta sutileza.
Calculemos ahora el proceso ni + ni → nj + nj . Como mn >> mπ , podemos suponer
que los nucleones estan en reposo. El diagrama relevante es
Ya que conocemos el propagador del escalar (pion) podemos calcular el diagrama, que
vale
M = (−i λ)2
p2
i
1
= −i λ2 2
2
− mπ + i p − m2π + i (151)
Comparando con la regla de oro de Fermi, esto debe ser esencialmente la transformada
de Fourier del potencial de interaccion entre nucleones
Z
d3 p~ e−i p~·(~x1 −~x2 )
V = −λ
(152)
(2 π)3 p~2 + m2π − i La integral converge sin necesidad del i . Debemos pues calcular
Z
d3 p~ e−i p~·~z
(2 π)3 p~2 + m2π
Donde ~x1 − ~x2 = ~z. Para hacer esta integral escribamosla en coordenadas polares
Z
−i p z cos θ
dθ dφ dp
2 e
sin
θ
p
(2 π)3
p2 + m2π
39
(153)
(154)
Donde usamos la notacion |~x| = x. Aqui p ∈ [0, ∞]. Integrando en φ, θ
Z
dp
p2
(2 π)2 p~2 + m2
Z
−i p z cos θ
dθ e
sin θ = −i
Z
dp
ei p z − e−i p z
p2
(2 π)2 p2 + m2π
pz
(155)
La integral es
i
−
z
Z
∞
0
p
dp
(ei p z − e−i p z )
2
2
(2 π) p + m2π
(156)
Separemos la integral como
Z ∞
Z ∞
dp
i
dp
p
p
i
ipz
e +
e−i p z
−
2
2
2
2
2
z 0 (2 π) p + mπ
z 0 (2 π) p + m2π
En la segunda integral hagamos p → −p. Tenemos
Z ∞
Z −∞
i
dp
p
dp
p
i
ipz
e +
ei p z
−
2
2
2
2
2
z 0 (2 π) p + mπ
z 0
(2 π) p + m2π
(157)
(158)
Invirtiendo los limites de integracion en la segunda integral tenemos
i
−
z
Z
∞
i
dp
p
ei p z −
2
2
2
(2 π) p + mπ
z
Z
0
i
dp
p
ei p z = −
2
2
2
(2 π) p + mπ
z
Z
∞
dp
p
ei p z
2
2
2
(2
π)
p
+
m
0
−∞
−∞
π
(159)
La integral a hacer ahora tiene los polos en ±i mπ . Como z > 0, podems cerrar el contorno
por arriba, capturando en sentido contrahorario el polo en i mπ . Por lo tanto la integral es
(2 π i) Res. Esto es
Z ∞
dp
i 2 π i e− m z
1 − mπ z
i
p
ipz
e
=
−
=
e
(160)
−
z −∞ (2 π)2 p2 + m2π
z (2 π)2 2
4πz
Por lo tanto
1 − mπ z
e
(161)
4πz
Esto se conoce como potencial de Yukawa. Media, de modo efectivo, la interaccion entre
particulas atomicas a traves de mesones. De la formula de arriba se desprende que, para
cargas iguales, el campo escalar produce una fuerza atractiva, mientras que para cargas
diferentes produce una fuerza repulsiva.
V = −λ2
5
Spin
1
2
Hasta ahora hemos trabajado con particulas escalares. Por eso nuestros operadores creacion/destruccion eran simplemente {â, ↠}, de manera que al combinarlos en campos lo
40
que obtenemos es un campo escalar. Sin embargo sabemos que hay particulas de spin 1/2
–i.e. fermiones. De hecho, las particulas fundamentales leptones y quarks son fermiones
de spin 1/2!
5.1
Preludio historico
Es interesante conocer el desarrollo historico de las ideas. Tras el descrubrimiento de la
mecanica cuantica, una pregunta evidente era su generalizacion relativista. En mecanica
cuantica los postulados fundamentales son la asuncion de que un sistema se describe por
una funcion de onda compleja que vive en un espacio de Hilbert cuya evolucion temporal
esta descrita por una ecuacion de Schrodinger
Ĥ ψ = i ∂t ψ
(162)
El que aparezca solo la primera derivada temporal esta intimamente ligado con la conservacion de la probabilidad en la interpretacion de Copenhage. Tomemos la particula libre
por sencillez –escojamos la masa para simplificar los factores numericos a 1 y asi no liarnos
con numeros irrelevantes–
−∂~ 2 ψ = i ∂t ψ
(163)
Si definimos la densidad de probabilidad como ρ = ψ ? ψ, resulta que, usando la eq. de
Schrodinger
~ − i ψ ∂ψ
~ ? = ∂~~j
∂t ρ = ∂t ψ ψ ? + ψ ∂t ψ ? = i ∂~ 2 ψ ψ ? − i ψ ∂~ 2 ψ ? = ∂~ iψ ? ∂ψ
(164)
Donde hemos definido una corriente de probabilidad ~j. Es decir, la ecuacion de Schrodinger
asegura una ley de conservacion de la probabilidad. Como las soluciones de la ecuacion de
Schrodinger son ondas planas
2
ψ = ei p~
t−i p
~·~
x
(165)
Esta claro que ρ = 1 –es decir, recuperamos la familiar particula libre completamente
localizada en espacio de momentos y deslocalizada en espacio de posiciones.
Si quisiesemos estudiar una particula relativista, en principio lo natural seria tomar el
hamiltoniano para una particula relativista y cuantizarlo
p promoviendo {~x, p~} a operadores.
Sin embargo la relacion de dispersion relativista E = p~2 + m2 , debido a la raiz cuadrada,
no se deja. La solucion obvia es tomar E 2 = p~2 + m2 , lo que llevaria a una ecuacion de
Schrodinger de la forma
−∂t2 ψ = (−∂~ 2 + m2 ) ψ
(166)
Esta es la ecuacion de Klein-Gordon. Como lleva una derivada temporal segunda ahora la
ley de conservacion ∂t ρ = ∂~~j exige definir
41
ρ = i ψ ? ∂t ψ − i ψ ∂ t ψ ?
~j = i ψ ? ∂~ ψ − i ψ ∂~ ψ ?
(167)
ωp2 = p~2 + m2
(168)
En notacion covariante, podriamos definir un cuadrivector j µ = (ρ, ~j), tal que la ecuacion
de continuidad es simplemente ∂µ j µ = 0.
Las soluciones de la eq. de Klein-Gordon son tambien ondas planas de la forma
ψ = e±i ωp t±i p~·~x
Sin embargo ahora tendriamos que
ρ ∼ ±ωp
(169)
Es decir, nada asegura que tengamos probabilidades positivas. Como esto es un desastre
enorme, Dirac, intentado encontrar una teoria con probabilidades positivas trato de buscar
un hamiltoniano compatible con la relacion de dispersion relativista a la vez que con
primeras derivadas. Propuso
ˆ
ĤD = α
~ · P~ + β m
(170)
de manera que la dinamica de la funcion de onda venga dada de nuevo por una ecuacion
con derivada primera respecto al tiempo ĤD ψ = i∂t ψ.
Para que este hamiltoniano sea consistente con la relatividad especial, debe ocurrir que
ˆ
Ĥ 2 = P~ 2 + m2 . Eso implica que
D
{αi , αj } = 2 δij
β2 = 1
{αi , β} = 0
(171)
Evidentemente esto con numeros no se puede hacer, asi que Dirac se vio obligado a asumir
que sus {αi , β} son matrices y que por lo tanto ψ es un “vector” columna en el espacio
donde estas matrices actuan.
Supongamos por un momento que m = 0. En tal caso las relaciones de arriba se
satisfacen para αi = σi , siendo σi las matrices de Pauli. Como estas son 2 × 2, el ψ es
un vector columna con dos entradas. La ecuacion de Dirac queda entonces (escojamos la
particula moviendose solo en el eje x = x3 por sencillez)
i ∂x − i ∂t
0
ψ1
=0
(172)
0
−i ∂x − i ∂t
ψ2
Con lo que las soluciones son de la forma
i p (−t−x) e
ψ=
ei p (t−x)
(173)
Y la densidad de probabilidad, que es ρ = ψ † ψ seria ρ ∼ 1 –es decir, una constante, modulo
la normalizacion que no estamos discutiendo–. Esto sin embargo no tiene sentido en una
teoria relativista: si ψ es una “funcion de onda”, la particula tendria una probabilidad no
42
nula de presencia en cualquier parte del espacio, en particular fuera del cono de luz. Eso
es evidentemente un sinsentido en una teoria relativista.
Ademas, actuando con i∂t resulta que tendriamos soluciones de energia negativa y
positiva, lo que tampoco tiene ningun sentido.
Dirac decidio interpretar las soluciones de energia negativa como un hueco de energia
positiva. Es decir, asumio que el espacio estaba lleno de electrones hasta una energia E0 .
Las excitaciones de electrones sobre esa energia son las que veriamos en la experiencia.
Podemos poner ese E0 –que es analogo a la energia de Fermi en materia condensada– a
0. Excitando un electron del mar de electrones de E < 0 a E > 0 dejamos en el mar un
hueco, que se comportaria como estas nuevas soluciones extragnas.
Al hacer esto Dirac estaba cambiando de una mecanica cuantica a una teoria cuantica
de campos. En lenguaje moderno, la clave es que ψ no es una funcion de onda, sino
un campo cuantico que contiene todas las posibles excitaciones con un numero arbitrario
de particulas –el mar de Dirac esta ahi contenido!–. Ademas, desde este punto de vista,
interpretando ψ no como una funcion de onda, sino como un campo, la causalidad se
manifiesta como la propagacion nula de las perturbaciones del campo fuera del cono de
luz, es decir, en que el conmutador –en realidad anticonmutador– del campo es cero fuera
del cono de luz.
La interpretacion moderna es como dijimos antes: para un sistema relativista debemos
permitir creacion/destruccion de particulas. El formalismo adecuado es el de la teoria
cuantica de campos. Para el caso del electron lo que debemos hacer es intoducir un campo
–ahora fermionico dado el spin 21 – y escribir una teoria de campos para sus interacciones.
5.2
La ecuacion de Dirac
La leccion es que para el electron debemos usar un campo cuya ecuacion de movimiento
es la ecuacion de Dirac
~ + m βψ
i ∂t ψ = −i α
~ · ∂ψ
(174)
Con
{αi , αj } = 2 δij
β2 = 1
{αi , β} = 0
(175)
Multipliquemos por β y definamos γ µ = (β, β α
~ ). Entonces la ecuacion de Dirac queda
(i γ µ ∂µ − m) ψ = 0
(176)
{γ µ , γ ν } = 2 η µν
(177)
Usando las propiedades de (β, α
~)
Notese que se puede definir una quinta matriz de Dirac
γ5 = i γ0 γ1 γ2 γ3
43
(178)
tal que anticonmuta con todas las otras matrices {γ µ , γ 5 } = 0.
Definiendo
ψ̄ = ψ † γ 0
(179)
es muy facil ver que
;
j µ = i ψ̄ γ µ ψ
∂µ j µ = 0
Una posible solucion para {~
α, β} es la representacion de Dirac-Pauli
0 ~σ
1l 0
α
~=
β=
~σ 0
0 − 1l
(180)
(181)
Evidentemente esto implica que nuestro ψ es ahora de 4 componentes. Notese que antes
era de dos componentes debido a que al tener m = 0 la matriz β simplemente no esta. Asi
pues, para m = 0, la representacion minima es de dos componentes, mientras que para
m 6= 0 la representacion minima es de 4 componentes. A estos “vectores” ψ se les llama
spinores.
5.2.1
Soluciones de la ecuacion de Dirac
El hamiltoniano de Dirac es
m ~σ · p~ˆ
~σ · p~ˆ −m
ĤD =
!
(182)
Escribiendo
−i E t
ψ=e
uA
uB
(183)
con uA, B dos spinores de 2 componentes, tenemos, en espacio de momentos
~σ · p~ uA = (E + m) uB
~σ · p~ uB = (E − m) uA
(184)
Ya que m > 0, es ahora obvio que tenemos dos soluciones en funcion de que E sea mayor
o menor que 0:
• E > 0: en tal caso E + m 6= 0 y podemos escribir, usando la primera ecuacion, que
~σ · p~
uA
E+m
Notese que si metemos esto en la segunda ecuacion
uB =
~σ · p~
~σ · p~
uA = (E − m) uA
E+m
44
(185)
(186)
tenemos
σi σj pi pj uA = (E 2 − m2 ) uA
(187)
Usando las propiedades de las matrices de Pauli
p~2 uA = (E 2 − m2 ) uA
(188)
Y dado que la particula esta on shell satisface E 2 − m2 = p~2 , de manera que la
segunda ecuacion se satisface automaticamente,
Volviendo a la solucion que obtuvimos, como uA es un spinor de dos componentes
arbitrario, podemos escoger como base entre
i
χ ={
1
0
0
,
}
1
(189)
Asi pues, el spinor completo es
i
u =
χi
~
σ ·~
p
E+m
χi
(190)
• E < 0: en tal caso E − m 6= 0 y podemos escribir
uA =
~σ · p~
uB
E−m
(191)
Al igual que antes, ahora la primera ecuacion se satisface automaticamente. Ahora
tambien uB es un spinor de dos componentes arbitrario, podemos escoger como base
de vuelta ξ i , asi pues, el spinor completo es
ui+2 =
~
σ ·(−~
p)
|E|−m
i
χ
χi
!
(192)
Notese que podemos pensar los spinores ui+2 como de energia positiva –por eso hemos
puesto |E|– y momento negativo –dependen de −~p–.
Notese que u1 , u2 se corresponden con E > 0 y u3 , u4 se corresponden con E < 0.
Volviendo a la notacion de Dirac, la ecuacion de Dirac en espacio de momentos es (es
tradicional definir e.g. p/ = γ µ pµ )
(p/ − m) ψ = 0
Para los spinores u1,2 podemos escribir
45
(193)
(p/ − m) ui = 0
i = 1, 2
(194)
En espacio de posiciones estos spinores son
u1, 2 = u1, 2 (~p) e−i p~·~x
(195)
Sin embargo, para los spinores de energia negativa, que dependen de −~p, podemos escribir
u3, 4 = u3, 4 (−~p) ei p~·~x
(196)
Es util definir u3 (−~p) = v 2 (~p), u4 (−~p) = v 1 (~p), de manera que la ecuacion de Dirac para
estos v i es (hay que mandar (E, p~) a −(E, p~))
(p/ + m) v i = 0
i = 1, 2
(197)
Si tuviesemos un campo electromagnetico de fondo la diferencia entre ui , v i seria evidente:
en presencia de un Aµ la ecuacion de Dirac para ui seria –esto lo veremos mas profundamente en el capitulo siguiente–
/ − m) ui = 0
(p/ − i e A
i = 1, 2
(198)
De manera que los v i satisfarian una ecuacion analoga pero cambiando −e por +e, es decir,
la carga opuesta. Son las antiparticulas. Esta es la realizacion explicita de la teoria del
mar de Dirac: las soluciones de energia negativa tienen carga opuesta y por lo tanto se
comportan exactamente como la original pero con la carga al reves, esto es, como un hueco
en el mar de electrones. A esta nueva particula de carga opuesta se le llama positron. A
veces se denota como e+ por contra al electron, que seria e− .
Por ultimo, los spinores ui , v i satisfacen las reglas de completitud
X
X
ui (~p) ūi (~p) = (p/ + m)
v i (~p) v̄ i (~p) = (p/ − m)
(199)
i=1, 2
5.2.2
Spin
i=1, 2
1
2
El momento angular definido de manera usual es
L̂ = ~xˆ × p~ˆ
(200)
~ˆ = −i (~
[ĤD , L]
α × p~ˆ)
(201)
Usando las reglas de conmutacion usuales [x̂i , p̂j ] = i δij , es facil ver que el hamiltoniano
de Dirac satisface que
Es decir, el momento angular no se conserva!. Sin embargo, si definimos
~σ 0
ˆ
~
Σ=
0 ~σ
46
(202)
resulta que
~ˆ = 2 i (~
[ĤD , Σ]
α × p~ˆ)
(203)
Asi pues esta claro que definiendo un momento angular total como
ˆ ~ˆ 1 ~ˆ
J~ = L
+ Σ
2
(204)
~ˆ = 0.
si tendremos [ĤD , J]
~ˆ es el spin. Esta pues claro que el
El momento angular “intrinseco” representado por Σ
~ˆ ψ 6= 0. Es util formar la cantidad escalar
electron tiene spin, ya que evidentemente Σ
λ=
1~
Σ · ~up
2
(205)
donde up = |~pp~| es el vector unitario que apunta en la direccion de movimiento. A h se
llama helicidad. Da informacion sobre la proyeccion del spin a lo largo de la direccion
de movimiento. Si tomamos la base ξ i de arriba, esta claro que χ1 tiene helicidad 1/2
mientras que χ2 tiene helicidad −1/2. Esto indica que el electon –o mas generalmente
aquello descrito por el campo de Dirac– tiene spin 1/2.
5.3
Masa cero y quiralidad
Como vimos, si la masa es 0 en realidad no necesitamos la matriz β. A la vez, las relaciones restantes se satisfacen facilmente tomando αi = σi . La ecuacion para dicho caso es
simplemente
~σ · p~ ψ = E ψ
(206)
Pero en el lado izquierdo de la ecuacion lo que tenemos es proporcional la helicidad: las
soluciones de energia positiva tienen helicidad positiva mientras que las soluciones de energia negativa tienen helicidad negativa.
Con esto en mente podemos construir otra representacion de las matrices de Dirac:
0 1l
0 σi
0
i
γ =
γ =
(207)
1l 0
−σ i 0
En esta representacion
− 1l 0
0 1l
P± =
1l ± γ 5
2
5
γ =
Asi pues
47
(208)
(209)
es un proyector a las dos componentes superiores (para P− ) o a las 2 inferiores (para P+ ).
Estas dos componentes son los spinores de dos componentes con helicidades positiva –
left handed – o negativa –right handed – minimales que podemos definir para particulas sin
masa.
5.4
1
2
El campo de spin
cuantizado
Siguiendo la estrategia general, si estamos interesados en una teoria cuantica para el electron debemos empezar por asociar un campo al electron. Vimos que para el electron de
masa m, como es un fermion, debemos usar el campo de Dirac. La ecuacion de Dirac se
sigue de la accion
Z
S = d4 x i ψ̄ ∂/ψ − m ψ̄ ψ
(210)
Tomando la variacion de S con respecto a ψ̄ es directo que la ecuacion de movimiento para
ψ es la ecuacion de Dirac.
Para construir una teoria cuantica de campos de particulas de spin 12 , procediendo
segun la hoja de ruta, debemos construir el funcional generador
Z
R 4
/
ψ̄ ψ+J¯ ψ+ψ̄ J
¯
Z[J, J] = Dψ̄ Dψ ei d x i ψ̄ ∂ψ+m
(211)
¯ J} son las fuentes, de manera que Z[J,
¯ J] es el funcional generador.
Donde {J,
Como es una teoria libre la unica regla de Feynman es el propagador. Para calcularla
vamos a seguir un pequegno atajo. Ya que sabemos que el propagador de Feynman es la
funcion de Green con la prescripcion +i para rodear los polos, podemos tomar la ecuacion
de Dirac y ponerle una fuente tipo δ en el espacio de spinores
(i ∂/ + m) G = −i δ
(212)
En espacio de momentos esto es
(p/ − m) G = i
;
G=
Recuperando la prescripcion del i DF =
i
p/ − m
i
p/ − m + i (213)
(214)
Muchas veces es util multiplicar y dividir por p/ + m. En el denominador, usando las
propiedades de las γ’s
(p/ − m) (p/ + m) = p2 − m2
De manera que podemos escribir
48
(215)
DF =
i (p/ + m)
p2 − m2 + i (216)
Notese que la estructura analitica del propagador –la presencia de polos– es igual a la
del caso escalar. De hecho refleja el hecho basado en la asuncion tan general como es la
causalidad de que el termino cinetico tiene dos derivadas.
5.4.1
Cuantizacion canonica
Aunque no lo vamos a hacer en detalle, si fuesemos a estudiar la cuantizacion canonica
de un sistema de fermiones procederiamos como en el caso bosonico: introduciriamos un
espacio de Fock y unos operadores creacion/destruccion actuando sobre los estados de
dicho espacio. Llamemos a esos operadores {b, b† }. La clave es que, dado que la particula
a crear es spinorial, en lugar de imponer unas relaciones de conmutacion [am , a†n ] = δm, n ,
hay que imponer relaciones de anticonmutacion tipo
{bm , b†n } = δm,n
R
que hacen que el anticonmutador del campo ψ ∼ bp u(p) ei p x + c.c
{ψ̄(t, ~x), ψ(t0 , ~y )}
(217)
(218)
se anulen fuera del cono de luz. Es decir, la condicion de causalidad fuerza para la particula de spin 1/2 a usar anticonmutadores. Notese que los anticonmutadores hacen que el
cuadrado del operador creacion sea 0: no podemos poner mas de una particula en
cada estado. Esto no es mas que el principio de exclusion de Pauli, que viene forzado
por la causalidad. Esta relacion entre spin y estadistica a traves de la causalidad en teoria
cuantica de campos se conoce como teorema de spin estadistica.
6
Interacciones electromagneticas: QED
QED es la teoria que describe las interacciones electromagneticas. Todas las particulas cargadas sienten esta fuerza. Como es una fuerza de largo alcance es –junto con la gravedad–
la relevante a las escalas de nuestra experiencia cotidiana. Empecemos pues por estas
familiares interacciones electromagneticas. Siguiendo nuestra estrategia general, para escribir una teoria para las interacciones electromagneticas entre materia –particulas de spin
1/2– cargada neesitaremos, para empezar, un campo asociado a cada tipo de particula
con carga electromagnetica. Consideremos por sencillez uno de ellos, por ejemplo nuestro
familiar electron. Como describimos, siguiendo la estrategia general, si estamos interesados
en una teoria cuantica para el electron debemos empezar por asociar un campo al electron.
Vimos que para el electron de masa m, como es un fermion, debemos usar el campo de
Dirac. La ecuacion de Dirac se sigue de la accion
49
S=
Z
d4 x i ψ̄ ∂/ψ − m ψ̄ ψ
(219)
Tomando la variacion de S con respecto a ψ̄ es directo que la ecuacion de movimiento para
ψ es la ecuacion de Dirac.
Esta accion es invariante bajo
ψ → ei α ψ
(220)
j µ = i ψ̄γ µ ψ
(221)
donde α es un numero –transformacion global, ya que el campo transforma igual en todos
los puntos del espacio!!!–. La corriente conservada es
Notese que j 0 = ρ es la densidad de probabilidad que vimos antes.
Como al final esta es la corriente asociada a la carga electrica del electron, es razonable,
si queremos tener en cuenta la interaccion electromagnetica,
acoplarla al campo electroR
µ
magnetico agnadiendo un termino en la accion − e Aµ j , es decir, considerando
Z
S = d4 x i ψ̄ γ µ (∂µ + i e Aµ )ψ − m ψ̄ ψ
(222)
donde e es la carga del electron –tomemosla en valor absoluto. El signo sera el signo global
del termino de interaccion–.
6.1
Invariancia gauge
Todo el mundo sabe que el campo electromagnetico se obtiene a partir del potencial vector
Aµ . Construyendo el tensor de campo
Fµν = ∂µ Aν − ∂ν Aµ
(223)
tenemos que los campos electrico y magnetico son
1
ijk F jk
(224)
2
~ B}
~ se obtienen si hacemos
Ahora bien, a la vista de Fµν , esta claro que los mismos {E,
Ei = F0i
Bi =
Aµ → Aµ + ∂µ ϕ
(225)
donde ϕ es una funcion arbitraria. Esta transfromacion se conoce como transformacion
gauge.
Esta transformacion tiene un curioso efecto sobre el lagrangiano de Dirac: si hacemos
una transformacion gauge tenemos que
Z
S → d4 x i ψ̄ γ µ (∂µ + i e Aµ + i e ∂µ ϕ)ψ + m ψ̄ ψ
(226)
50
Ahora bien, si ahora hacemos una rotacion local en la fase de ψ tal que ψ → eiα ψ; y
asumimos que α en lugar de ser un numero real es una funcion real α = −e ϕ, resulta que
el termino con ϕ desaparece por completo: la accion es invariante gauge. Como la
transformacion gauge en el campo de materia es una rotacion de fase, i.e. el grupo U (1),
la invariancia gauge es bajo el grupo U (1).
De hecho, podemos construir
Dµ = ∂µ + i e Aµ
(227)
que es un operador diferencial que actua sobre un campo ψ. La clave es que bajo transformacion gauge
ψ → ei e ϕ ψ
Aµ → Aµ − ∂µ ϕ
(228)
resulta que
Dµ ψ → ei ϕ Dµ ψ
(229)
es decir, Dµ ψ se transforma bajo rotacion gauge como ψ. Por eso al objeto Dµ se le llama
derivada covariante, ya que Dµ ψ es covariante bajo la transformacion U (1).
El principio de invariancia gauge es absolutamente central en fisica. Ya que debemos
preservar la invariancia gauge, podemos seguir ese principio para escribir el termino cinetico
para el Aµ . Como ha de ser un escalar con dos derivadas, la expresion mas general es
Z
S[A] =
α1 ∂µ Aν ∂ µ Aν + α2 ∂µ Aν ∂ ν Aµ
(230)
con α1, 2 dos numeros a ajustar para que S[A] sea invariante gauge. Bajo una transformacion gauge infinitesimal
δS[A] =
Z
α1 ∂µ Aν ∂ µ ∂ ν ϕ + α1 ∂µ ∂ν ϕ ∂ µ ∂ ν ϕ + α2 ∂µ ∂ν ϕ ∂ ν Aµ + α2 ∂µ Aν ∂ ν ∂ µ ϕ (231)
asi
si α2 = −α1 el S[A] es invariante gauge. Pero en tal caso resulta que S[A] ∼
R que µν
Fµν F . Esto era de esperar, ya que F µν era invariante. 14
Asi pues, el lagrangiano describiendo de manera invariante gauge la interaccion entre
electrones y fotones es
Z
1
(232)
S = d4 x − Fµν F µν + i ψ̄ γ µ (∂µ + i e Aµ )ψ + m ψ̄ ψ
4
La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando el
funcional generador –que contiene toda la informacion de la teoria–
14
En realidad es covariante gauge, si bien al estar en la representacion adjunta, que es trivial para U (1),
aparece como invariante. Esto sera importante para teorias no abelianas.
51
Z=
Z
DAµ Dψ̄ Dψ ei
R
d4 x − 41 Fµν F µν +i ψ̄ γ µ (∂µ +i e Aµ )ψ+m ψ̄ ψ+J¯ ψ+ψ̄ J+Jµ Aµ
(233)
Esto esta sin embargo mal definido, ya que debido a la invariancia gauge todos los Aµ
conectados por Aµ → Aµ + ∂µ ϕ son equivalentes. Asi pues la integracion funcional sobre
Aµ “cuenta de mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que
se puede hacer de manera precisa –aunque aqui no vamos a entrar en ello en detalle–.
6.2
Reglas de Feynman
Siguiendo nuestra hoja de ruta, vamos a asumir que la constante de acoplo –en este caso
la carga del electron– es pequegna, de manera que podemos hacer teoria de perturbaciones. Para ello necesitamos conocer las reglas de Feynman. Ya sabemos el propagador
del fermion:
De =
i (p/ + m)
− m2 + i p2
(234)
El propagador del campo gauge –cuyo cuanto es el foton– se podria calcular de manera
analoga. Sin embargo, como dijimos antes, debido a la invariancia gauge el calculo es
un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de
Feynman–, cuando
Dγ =
i η µν
p2 + i (235)
Por ultimo el vertice de interaccion, que se puede leer directamente del lagrangiano
ψ̄γ Aµ da una regla para el vertice de 2 fermiones y un foton
µ
V = −i e γ µ
Resumiendo
52
(236)
La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando el
funcional
generador
–que se
contiene
la informacion
teoria–
La teoria
cuantica
obtienetoda
siguiendo
la hoja de
de la
ruta
usual, es decir, considerando el
funcional Zgenerador –que contiene
toda la informacion de la teoria–
R 4 1
µ⌫
µ
¯
(@µ +i e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ
Z = DAZµ D ¯ D ei d x 4 FRµ⌫ F +i
(232)
4x 1 F
µ⌫ +i ¯ µ (@ +i e A ) +m ¯ +J¯ + ¯ J+J Aµ
i
d
F
µ⌫
µ
µ
µ
4
Z = DAµ D ¯ D e
(232)
Esto esta sin embargo mal definido, ya que debido a la invariancia gauge todos los Aµ
conectados
poresta
Aµ !
son definido,
equivalentes.
Asidebido
pues laa integracion
funcional
sobrelos Aµ
Esto
sin Aembargo
ya que
la invariancia
gauge todos
µ + @µ ' mal
La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando
el
Aµ “cuenta
de mas”
Hay que eliminar
esas
redundancias,
lo que sobre
conectados
pormuchas
Aµ ! Aconfiguraciones.
Asi pues
la integracion
funcional
µ + @µ ' son equivalentes.
funcional generador
–que contiene toda la informacion de la teoria–
se puede
hacer
de
manera
precisa
–aunque
aqui
no
vamos
a
entrar
en
ello
en
detalle–.
Aµ “cuenta de mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que
Z
R 4 aqui
se puede hacer de manera precisa –aunque
noµ⌫ vamos
entrar
en ello en detalle–.
1
¯ µ (@aµ +i
e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ
Z = DAµ D ¯ D ei d x 4 Fµ⌫ F +i
(232)
6.2
Reglas de Feynman
6.2 Reglas
desin
Feynman
Esto esta
Ya sabemos el propagador
delembargo
fermion:mal definido, ya que debido a la invariancia gauge todos los Aµ
conectados por Aµ ! Aµ + @µ ' son equivalentes. Asi pues la integracion funcional sobre
Ya sabemos el propagador del fermion:
Aµ “cuenta de mas” muchas
configuraciones.
Hay que eliminar esas redundancias, lo que
i (p/ + m)
De =
(233)
se puede hacer de manera
precisa
–aunque
aqui no vamos a entrar en ello
en detalle–.
2 i+
(p/i +
p2e m
✏ m)
D = 2
(233)
2 + i✏
p
m
El propagador del campo gauge –cuyo cuanto es el foton– se podria calcular de manera
6.2
Reglas
de
Feynman
analoga. El
Sinpropagador
embargo,
como
dijimos
antes,
debido
laelinvariancia
gauge el
calculo
del
campo
gauge
–cuyo
cuantoa es
foton– se podria
calcular
dees
manera
un poco
mas sutil.
Contentemonos
con el resultado
en un
gauge
particular
–gauge
de
analoga.
Sin embargo,
como dijimos
antes, debido
a la
invariancia
gauge
el calculo
es
Ya sabemos
el propagador
del fermion:
Feynman–,
cuando
un poco
mas sutil. Contentemonos con el resultado en un gauge particular –gauge de
Feynman–, cuando
i (p/ + m)
µ⌫ e
i ⌘D
= 2
(233)
D = 2
(234)
pµ⌫ m2 + i ✏
i
⌘
p + i✏
D =
El propagador del campo gauge
–cuyo
es el foton– se podria calcular(234)
de manera
p2 +cuanto
ileer
✏ directamente
Por ultimo el vertice de interaccion, que se puede
del lagrangiano
analoga. Sin embargo, como dijimos antes, debido a la invariancia gauge el calculo es
¯ µ Aµ daPor
unaultimo
regla para
el vertice
de 2 fermiones
foton leer directamente del lagrangiano
el vertice
de interaccion,
que yseunpuede
poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de
¯ µ Aµun
da una regla para el vertice de 2 fermiones y un foton
Feynman–, cuando
µ
V = ie
(235)
V = i e µ i ⌘ µ⌫
(235)
D = 2
(234)
6.2.1 Patas externas
p + i✏
6.2.1 Patas
externas
Por para
ultimocalcular
el vertice
de interaccion,
que se nos
puede
del lagrangiano
Como vimos antes,
amplitudes
de scattering
valeleer
condirectamente
considerar dia¯ µ AEntonces,
da unapara
regla
para el amplitudes
vertice
de 2de
fermiones
gramasComo
conexos.
si adoptamos
la prescripcion
de noy un
poner
los con
propagadores
µantes,
vimos
calcular
scattering
nosfoton
vale
considerar dia-
$
$
externos
ya tendremos
cuenta lossi factores
de LSZ.
Para el campo
escalar,
vimos,
gramas
conexos. enEntonces,
adoptamos
la prescripcion
de no
ponercomo
los propagadores
µ
Vespacio
=
eso eraexternos
todo. Sin
embargo, sientenemos
campos
conde
interno
–por ejemplo
ya tendremos
cuenta los
factores
LSZ.i ePara
el campo
escalar, spin,
comoovimos, (235)
polarizacion
un Sin
foton–
debemos
indicar su
estadocon
de polarizacion.
Asi–por
puesejemplo spin, o
eso erapara
todo.
embargo,
si tenemos
campos
espacio interno
6.2.1 para
Patas
externas
polarizacion
un foton–
debemos indicar su estado de polarizacion. Asi pues
• Fermion in/out: u/ ū
Como
vimos
antes,
para
calcular amplitudes de scattering nos vale con considerar dia• Fermion in/out: u/ ū
gramas
conexos.
• Antifermion
in/out:
v̄/ v Entonces, si adoptamos la prescripcion de no poner los propagadores
externos ya in/out:
tendremos
• Antifermion
v̄/ ven cuenta los factores de LSZ. Para el campo escalar, como vimos,
?
• Foton in/out:
µ / ✏µ Sin embargo, si tenemos campos con espacio interno –por ejemplo spin, o
eso era ✏todo.
?
• Foton
in/out: para
✏µ / ✏un
µ foton– debemos indicar su estado de polarizacion. Asi pues
polarizacion
$
6.2.1
Patas externas
• Fermion in/out: u/ ū
Como vimos antes, para calcular •amplitudes
dev̄/scattering
nos vale con considerar diaAntifermion in/out:
v 49
49
gramas conexos. Entonces, si adoptamos
la
prescripcion
de
no poner los propagadores
?
• Foton in/out: ✏µ / ✏µ
externos ya tendremos en cuenta los factores de LSZ. Para el campo escalar, como vimos,
eso era todo. Sin embargo, si tenemos campos con espacio interno –por ejemplo spin, o
polarizacion para un foton– debemos indicar su estado de polarizacion.
Asi pues
49
• Fermion in/out: u/ ū
• Antifermion in/out: v̄/ v
• Foton in/out: µ / ?µ
Los {u, v} son nuestros viejos conocidos spinoriales. Recordemos que sus relaciones de
completitud son
X
X
ui (~p) ūi (~p) = (p/ + m)
v i (~p) v̄ i (~p) = (p/ − m)
(237)
i=1, 2
i=1, 2
Por otra parte µ representa la polarizacion del foton. Fijando completamente el gauge,
si el foton tiene momento q, el satisface
~q · = 0
0 = 0
Suponiendo el foton moviendose en x3 , podemos resolver estos constraints como
53
(238)


ξ1
~1 =  0 
0


0
~2 =  ξ2 
0
(239)
Es util formar las combinaciones circularmente polarizadas L, R como
1
1
~R = √ (~1 − i~2 )
~L = − √ (~1 + i~2 )
2
2
Estos tambien satisface una relacion de completitud
X
qi qj
(λ )?i (λ )j = δij − 2
~q
λ=R, L
(240)
(241)
Resumiendo, para las patas externas fermionicas
u
6.2.2
ū
v̄
v
El vertice de QED y el momento magnetico
Si nos fijamos en el vertice de QED, por ejemplo para un electron entrando y saliendo
tenemos que este contribuye a cada diagrama como
ūout γ µ uin
(242)
Esto se puede escribir como (descomposicion de Gordon)
ūout γ µ uin = ūin
donde
i
1 h
(pin + pout )µ + i σ µν (pout − pin )ν uout
2m
i µ ν
[γ , γ ]
2
Notemos que, en por ejemplo la representacion de Dirac-Pauli
i
−σ i 0
0i
σ =
0 σi
2
σ µν =
(243)
(244)
(245)
En esta representacion
5
γ =
1l 0
0 − 1l
54
(246)
Asi que podemos escribir que σ 0i γ 5 = S i , esto es, el termino con σ µν representa una
interaccion asociada al spin 1/2. Debe ser por lo tanto mediada por el campo magnetico.
Por lo tanto, para un electron la interaccion es debida tanto a su carga como a su momento
magnetico –que es debido a su spin–.
Evidentemente este vertice esta corregido por diagramas de orden superior. Dichas
correcciones cambian ligeramente la razon entre el acoplo “electrico” y el “magnetico”. La
magnitud de dicha correccion es muy sensible a nueva fisica –en particular para el muon:
es el famoso g − 2, que es la desviacion del valor, en cierta normalizacion 2, de ese momento
magnetico con respecto a QED–.
6.3
QED en el SM
En nuestra discusion sobre QED hemos supuesto por sencillez que solo hay un tipo de particula cargada bajo el campo electromagnetico: el electron. En realidad hay mas particulas
fundamentales con carga electromagnetica: tanto los quarks como los leptones –salvo los
neutrinos– tienen carga electrica. Asi pues, podramos haber escrito todos esos campos
como un “vector” Ψi = (electron, muon, . . . ) y escribir un lagrangiano general.15 Hasta
ahora nos hemos centrado en el trozo que solo contiene al electron. Sin embargo, ademas
de este, en realidad el foton se acopla a todas las demas particulas. Es particularmente
util un tipo de proceso en el que un electron y un positron se aniquilan en un foton que
produce despues un par de otro tipo de particula, por ejemplo un muon.
6.3.1
e+ e− → µ+ µ−
El proceso e+ e− → µ+ µ− es de gran importancia: es un proceso clave en QED basico
en un colisionador de leptones como era LEP. Ademas sirve como modelo simplificado
para procesos de QCD e+ e− → q q̄. Es por eso por lo que es muy interesante calcularlo
explicitamente.
El diagrama relevante es (5).
Usando las reglas de Feynman, este vale
0
v̄ s (p0 )(−i e γ µ ) us (p)
−i ηµν r
0
ū (k)(−i e γ ν ) v r (k 0 )
2
q
(247)
donde estamos exhibiendo explicitamente los indices de spin {s, s0 , r, r0 } de los fermiones.
Por lo tanto –llamemos M al diagrama, ya que controla el elemento de matriz que
queremos calcular–
M = −i
e 2 s0 0 µ s
0
v̄ (p ) γ u (p) ūr (k) γµ v r (k 0 )
2
q
(248)
En realidad necesitamos |M|2 . Para ello necesitamos calcular en general (v̄ γ µ u)? . Usando
las propiedades de las matrices γ y los spinores, resulta que
15
En realidad esto no tendria sentido, ya que las otras fuerzas de la naturaleza si distinguen esos otros
tipos de particulas. Por eso no vamos ni siquiera a escribir dicha teoria para Ψi .
55
Figure 5: Diagrama relevante para e+ e− → µ+ µ−
(v̄ γ µ u)? = ū γ µ v
(249)
Por lo tanto
e4 s0 0 µ s
r
r0
0
s
ν s0 0
r0
0
r
|M| = 4 v̄ (p ) γ u (p) ū (k) γµ v (k ) ū (p) γ v (p ) v̄ (k ) γν u (k)
q
(250)
e 4 s0 0 µ s
s
ν s0 0
r
r0
0 r0
0
r
v̄
(p
)
γ
u
(p)
ū
(p)
γ
v
(p
)
ū
(k)
γ
v
(k
)v̄
(k
)
γ
u
(k)
µ
ν
q4
(251)
2
Esto lo podemos reordenar como
|M|2 =
Como muchas veces en el experimento no hay control sobre la polarizacion vamos a tomar
el promedio en spin. Para eso hay que sumar a {s, s0 , r, r0 } y dividir entre los 4 posibles
estados. Es decir
|Mup |2 =
1 e4
4 q4
X s, s0 , r, r0
0
0
0
0
v̄ s (p0 ) γ µ us (p) ūs (p) γ ν v s (p0 ) ūr (k) γµ v r (k 0 )v̄ r (k 0 ) γν ur (k)
(252)
Debido a las sumas sobre spines, podemos usar las relaciones de completitud. Trozo a
trozo
56
X
0
X
0
v̄ s (p0 ) γ µ us (p) ūs (p) γ ν v s (p0 ) =
s, s0
0
0
µ
ν
usβ (p) ūsγ (p) γγρ
vρs (p0 )
v̄αs (p0 ) γαβ
(253)
s, s0
Donde hemos sacado explicitamente los indices spinoriales –indices griegos–. Reordenando
X
X 0
0
µ
ν
γγρ
(254)
usβ (p) ūsγ (p)
v̄αs (p0 ) vρs (p0 ) γαβ
s0
s
Usando las relaciones de completitud (para los spinores del electron, por eso debemos usar
la masa del electron me )
µ
ν
(p/ + me )βγ (p/0 − me )ρα γαβ
γγρ
= Tr (p/0 − me )γ µ (p/ + me ) γ ν
(255)
Haciendo lo mismo para el otro trozo –donde ahora aparecera la masa del muon mµ –
X
0
X
0
ūr (k) γµ v r (k 0 )v̄ r (k 0 ) γν ur (k) =
r, r0
r, r0
X
=
0
0
ūrα (k) (γµ )αβ vβr (k 0 )v̄γr (k 0 ) (γν )γρ urρ (k)
r
(256)
X 0
0
ūrα (k) urρ (k)
vβr (k 0 )v̄γr (k 0 ) (γν )γρ (γµ )αβ
r0
Usando las relaciones de completitud
X
r
X 0
0
ūrα (k) urρ (k)
vβr (k 0 )v̄γr (k 0 ) (γν )γρ (γµ )αβ = (k/ + mµ )ρα (k/0 − mµ )βγ (γν )γρ (γ(257)
µ )αβ
r0
= Tr (k/ + mµ ) γµ (k/0 − mµ ) γ ν
Asi que todo junto
|Mup |2 =
e4
0
µ
0
ν
/
/
/
Tr
(
p
−
m
)γ
(
p
+
m
)
γ
Tr
(
k
+
m
)
γ
(
k
−
m
)
γ
/
e
e
ν
µ
µ
µ
4 q4
(258)
Necesitamos calcular cada traza. En general tenemos que calcular
/ + m) γ ν
Tr (P/ − m)γ µ (L
/ γ ν + m P/ γ µ γ ν − m γ µ L
/ γ ν − m2 γ µ γ ν
= Tr P/ γ µ L
Usando las identidades para trazas de matrices γ esto es
Que es
/ γ ν − m2 Tr γ µ γ ν = Pα Lβ Tr γ α γ µ γ β γ ν − m2 Tr γ µ γ ν
Tr P/ γ µ L
57
(259)
(260)
4 Pα Lβ η αµ η βν − η αβ η µν + η αν η µβ − 4 m2 η µν = 4 P µ Lν + P ν Lµ − P L η µν − m2 η µν
(261)
Asi pues
Tr (p/0 − me )γ µ (p/ + me ) γ ν = 4 p0µ pν + p0ν pµ − p0 p η µν − m2e η µν
(262)
y
Tr (k/ + mµ ) γµ (k/0 − mµ ) γν = 4 kµ0 kν + kν0 kµ − k 0 k ηµν − m2µ ηµν
(263)
Como me << mµ , hagamos la simplificacion de me = 0. Entonces el producto de los dos
trozos de arriba es
16 p0µ pν +p0ν pµ −p0 p η µν kµ0 kν +kν0 kµ −k 0 k ηµν −m2µ ηµν = 32 (p0 k 0 ) (p k)+(p0 k) (p k 0 )+m2µ p0 p
(264)
Asi que todo junto
8 e4 0 0
0
0
2 0
(p
k
)
(p
k)
+
(p
k)
(p
k
)
+
m
p
p
(265)
µ
q4
Particularicemos ahora estas formulas para el sistema centro de masas, donde el 3-momento
inicial total es 0. Como los electrones son de masa 0 sus 4-momentos son p = (E, 0, 0, E)
y p = (E, 0, 0, −E). Analogamente, para los muones salientes k = (E, ~k) y k 0 = (E, −~k),
como en la figura (6). Llamaremos θ al angulo entre ~k y el eje x3 en donde apuntan los
momentos iniciales de los electrones, es decir ~k · ~xˆ3 = |~k| cos θ.
Entonces
|Mup |2 =
p0 k 0 = p0 k 0 = E 2 −E |~k| cos θ
p0 k = p k 0 = E 2 +E |~k| cos θ
p0 p = 2 E 2 q 2 = (p+p0 )2 = 4 E 2
(266)
Asi que
m2µ m2µ 2 i
|Mup | = e
1 + 2 + 1 − 2 cos θ
(267)
E
E
Para calcular la seccion eficaz necesitamos multiplicar por el elemento de volumen en el
espacio de fases. En este caso, en el sistema centro de masas con dos particulas de igual
masa en el estado final esta dado por (se puede ver la derivacion en la bibliografia. Aqui
copiemos el resultado final solamente)
2
4
h
|~k|
3
32 π 2 Ecm
58
(268)
Figure 6: Cinematica en centro de masas para e+ e− → µ+ µ−
Usando esto tenemos que la seccion eficaz diferencial es el elemento de volumen en el
espacio de fases de arriba multiplicado por la amplitud que calculamos, es decir
p
e4 E 2 − m2µ h
m2µ m2µ 2 i
dσ
=
1
+
+
1
−
cos θ
(269)
3
dΩ
32 π 2 Ecm
E2
E2
Donde hemos usado que como las particulas externas son fisicas E 2 = ~k 2 + m2µ . Ademas,
dado que Ecm = 2 E, podemos escribir
r
m2µ h
m2µ m2µ 2 i
dσ
e4
=
1
−
1
+
+
1
−
cos θ
(270)
dΩ
256 π 2 E 2
E2
E2
E2
La cantidad e2 /4π se define como la constante de estructura fina. Es una redefinicion
de la carga del electron –al final en lo que estamos haciendo teoria de perturbaciones– que
es util –porque quita 4π del medio–. En terminos de ella
r
m2µ h
m2µ m2µ 2 i
dσ
α2
=
1 − 2 1 + 2 + 1 − 2 cos θ
(271)
dΩ
16 E 2
E
E
E
Podemos integrar las coordenadas angulares para tener la seccion eficaz global. Como dΩ
es el elemento de volumen en la 2-esfera
α2
σ=
16 E 2
r
m2µ
1− 2
E
Z
0
π
dθ sin θ
Z
2π
dφ
0
59
h
1+
m2µ m2µ 2 i
+
1
−
cos θ
E2
E2
(272)
s
E
Figure 7: Seccion eficaz e+ e− → µ+ µ− .
Integrando
r
m2µ m2µ π α2
σ=
1
−
1
+
(273)
3 E2
E2
E2
Si dibujamos esto tenemos (7)
La linea punteada vertical representa el corte cinematico: necesitamos una energia de
al menos mµ para poder producir los muones. Esta grafica se superpone perfecta a los
resultados experimentales.
6.3.2
Crossing y e− µ− → e− µ−
Supongamos que queremos calcular ahora un proceso muy parecido: e− µ− → e− µ− . El
diagrama relevante es (8)
Esto vale
e2
−i ηµν
ν
0
(ū(k)
(−i
e
γ
)
u(k
)
=
ū(p0 ) γ µ ) u(p) ū(k) γµ ) u(k 0 )
q2
q2
(274)
Notese que este resultado se puede obtener a partir del anterior si cambiamos el muon en
el estado inicial por un antimuon en el estado final y viceversa para el electron en estado
final. Esto es una manifestacion de la simetria de cruce.
La amplitud es
M = ū(p0 ) (−i e γ µ ) u(p)
|M|2 =
e4
(ū(p0 ) γ µ ) u(p)) (ū(p) γ ν ) u(p0 )) (ū(k) γµ ) u(k 0 )) ((ū(k 0 ) γν ) u(k))
q4
(275)
Esto lo podemos escribir en forma mas concisa: introduciendo dos tensores asociados a los
vertices del electron y del muon –que no son mas que las corrientes al cuadrado–
0
µ
ν
0
Lµν
electron = (ū(p ) γ u(p)) (ū(p) γ u(p ))
0
0
Lµν
muon = (ū(k) γµ u(k )) ((ū(k ) γν u(k)) (276)
60
Figure 8: Diagrama relevante para e− µ− → e− µ−
La amplitud es simplemente
e4
[Le ]µν [Lµ ]µν
q4
Fijemonos en el tensor electronico. Promediando a spines
|M|2 =
(277)
X
1 X
1
µ
µ
ν
ν
ūα (p0 ) uρ (p0 )
uβ (p) ūγ (p) γαβ
γγρ
= (p/ + m)ρα (p/ + m)βγ γαβ
γγρ
4 s
4
s0
(278)
Esto es (suprimimos la barra ya que siempre vamos a considerar cantidades promediadas
a spin)
L̄µν
electron =
Lµν
electron =
Asi que
1 0
Tr (p/ + m) γ µ (p/ + m) γ ν
4
0 µ ν
0 ν µ
0
2
µν
Lµν
electron = (p ) p + (p ) p − (p p + m ) η
(279)
(280)
Notese que el momento del foton es q = p + p0 . Como
0 ν
2 0ν
0
2
ν
pµ Lµν
electron = p p p +p p −(p p+m ) p
02 ν
0
0 ν
0
2
0ν
p0µ Lµν
electron = p p +(p p )(p ) −(p p+m ) p
(281)
61
Como p2 = (p0 )2 = m2
2
ν
0ν
p0µ Lµν
electron = m (p − p )
2
0ν
ν
pµ Lµν
electron = m (p − p )
(282)
Ası́ pues
qµ Lµν
electron = 0
(283)
Como ademas el tensor es simetrico, esta claro que contraer con p, p0 por cualquier lado
da 0. Como en espacio de momentos ∂µ ∼ pµ , esto simplemente refleja la conservacion de
la corriente del electron.
6.4
El limite de masa 0 y quiralidad
Reconsideremos la teoria cuantica de campos para fermiones libres. El lagrangiano es
Z
S = d4 x i ψ̄ γ µ (∂µ + m) ψ̄ ψ
(284)
Recordemos que la corriente conservada asociada a rotaciones U (1) globales es –agnadamosle
un subindice V cuyo significado quedara claro en breve–
jVµ = ψ̄ γ µ ψ
En la representacion de Weyl
0 1l
0 σi
0
i
γ =
γ =
1l 0
−σ i 0
(285)
5
γ =
− 1l 0
0 1l
(286)
Ya que para las γ µ tenemos una misma estructura de bloques, podemos construir
σ µ = ( 1,
l ~σ )
σ̄ µ = ( 1,
l −~σ )
(287)
Ademas, ya que en esta representacion las quiralidades estan claramente separadas, podemos escribir
ψL
ψ=
(288)
ψR
con ψL, R dos spinores de Weyl –i.e. de dos componentes quirales–. El lagrangiano es
Z
(289)
S = d4 x i ψR† σ µ ∂µ ψR + i ψL† σ̄ µ ∂µ ψL + m ψL† ψR + m ψR† ψL
El unico termino que mezcla las quiralidades left y right es el termino de masa. Ademas,
la corriente conservada es
jVµ = ψL† σ̄ µ ψL + ψR† σ̄ µ ψR
62
(290)
Supongamos que el fermion tuviese m = 0. En tal caso
Z
S = d4 x i ψR† σ µ ∂µ ψR + i ψL† σ̄ µ ∂µ ψL
(291)
En este caso las componentes left y right son independientes, y de hecho podriamos en
principio considerar simplemente la componente e.g. left por separado. Ya que left y
right son independientes, tenemos dos corrientes conservadas asociadas a las rotaciones
ψL, R → ei αL, R ψL, R independientes:
jLµ = ψL† σ̄ µ ψL
jRµ = ψR† σ µ ψR
(292)
Cambiando a la base suma/diferencia
jVµ = jLµ + jRµ = ψL† σ̄ µ ψL + ψR† σ µ ψR
jAµ = jLµ − jRµ = ψL† σ̄ µ ψL − ψR† σ µ ψR
(293)
(294)
Donde reconocemos nuestra querida corriente jVµ que es la unica conservada si tenemos
m = 0. Sin embargo, en el caso de m = 0, la corriente jAµ tambien se conserva. Volviendo
a spinores de Dirac
jVµ = ψ̄ γ µ ψ
jAµ = ψ̄ γ 5 γ µ ψ
(295)
γ5
que se corresponden respectivamente a rotaciones ψ → eiαV ψ y ψ → eiαA ψ. Mientras
que jVµ es una corriente vectorial, que se corresponde con rotaciones iguales para las dos
quiralidades, jAµ es una corriente axial –es un pseudovector debido al γ 5 – que se corresponde
a rotaciones opuestas para cada quiralidad. En el caso de m = 0 solo las rotaciones
vectoriales son simetria, pero en el caso de masa 0 ambas lo son.
Notese que, para un fermion de Dirac de masa 0, podriamos acoplar cualquiera de las dos
jA, V al campo electromagnetico. Sin embargo, en realidad las rotaciones axiales no son una
simetria de verdad, ya que los efectos cuanticos la rompen –es una simetria anomala–
. Es por eso por lo que QED acopla la corriente vectorial al campo electromagnetico.
Mas generalmente, las teorias quirales llevan a simetrias con quiralidad definida que son
potencialmente anomalas. Sin embargo, el SM –la naturaleza– es una teoria quiral. De
hecho la cancelacion de dichas anomalias es un exito espectacular del SM. Mas adelante
hablaremos de esto en un poco mas de detalle.
Un “corolario” es que el termino de masa, al mezclar las dos quiralidades, es incompatible con la simetria quiral. Esta observacion sera crucial mas adelante.
6.4.1
Conservacion de helicidad a altas energias
Un corolario de la discusion anterior es que a altas energias, cuando E >> m, la masa
de las particulas es despreciable. En tal caso el unico termino en QED que mezcla las
dos quiralidades –la masa– es despreciable, con lo que la teoria se vuelve de modo efectivo
63
quiral. Es por ello por lo que –mas alla de las anomalias antes mencionadas, que son efectos
no perturbativos y por lo tanto muy pequegnos en QED perturbativa– a altas energias la
quiralidad se conserva.
7
La interaccion fuerte: QCD
Las interacciones electromagneticas son sensibles a la carga electrica. Como el foton es una
particula sin masa, el alcance de la interaccion electromagnetica es infinito, lo que explica
que sea la interaccion dominante en nuestro mundo de baja energia. Por ser la interaccion
mas accesible la podemos usar para ”iluminar” otras particulas, ver su posible estructura
interna y estudiar otras fuerzas.
7.1
Fotografiando protones: la estructura de los hadrones
Queremos iluminar con luz –fotones– particulas para ver su estructura interna. Supongamos que mandamos un foton –emitido por ejemplo por un electron– a una particula.
Supongamos la luz no muy energetica (es decir, su q 2 es pequegno), y la particula suficientemente pesada como para asumir que casi no sufre retroceso. Ya que no rompemos la
particula que estamos estudiando, el scattering es elastico.
En general, el acoplo de la luz a dicha particula sera a traves de un vertice efectivo
−i e F (q) η 0µ
(296)
Donde F (q) codifica toda la posible estructura interna. El que solo aparezca η 0µ es debido
a que asumimos que el retroceso es nulo, esto es, que la particula que estamos iluminando
esta en reposo.
El diagrama relevante es (9).
Figure 9: Diagrama relevante para estudiar factores de forma.
Dicho diagrama vale
M = ū(kf ) (−i e γ µ ) u(ki )
−i ηµ0
e2
(−i
e
F
(q))
=
i
F (q) ū(kf ) γ 0 u(ki )
q2
q2
64
(297)
Promediando sobre spines para los electrones (ahora es solo un 1/2 porque hay solo dos
spines)
X
X 0
e4
2
s
s
s
s0
0
0
|Mup | =
|F |
ūα (kf ) uρ (kf )
ūγ (ki ) uβ γαβ
γγρ
4
2q
s
s0
2
(298)
Usando las relaciones de completidud y las identidades de las trazas de las γ
2 e4 F 2 e4 |F |2 2
0
0
2 (kf )0 (ki )0 − kf ki + m (299)
Tr (k/f + m) γ (k/i + m) γ =
|Mup | =
2 q4
q4
2
Dado que la particula iluminada no retrocede, podemos escribir (ki )0 = (kf )0 = E y
|~ki | = |~kf | = k, asi como ~ki · ~kf = k 2 cos θ, de manera que esto lleva a
|Mup |2 =
Ademas
4 e4 |F |2 2 k2
2 θ
E
1
−
sin
q4
E2
2
(300)
θ
2
(301)
q 2 = (kf −ki )2 = kf2 +ki2 −2 kf ki = 2 m2 −2 E 2 +2 k 2 cos θ = −2 k 2 (1−cos θ) = −4 k 2 sin2
asi que
|Mup |2 =
e4 |F |2
4 k 4 sin4
θ
2
k2
θ
E 2 1 − 2 sin2
E
2
(302)
k2
2 θ
sin
|F (q)|2
E2
2
(303)
En este caso, en el que bombardeamos una particula que no sufre retroceso, el volumen
del espacio de fases es simplemente (16 π 2 ) –es razonable que no tenga dependencia en
momento y energia: al final es como si la particula es tan pesada que pudiese absorver una
cantidad arbitraria de energia/momento sin inmutarse–. Asi pues
α2 E 2
dσ
=
dΩ
4 k 4 sin4
θ
2
1−
A la seccion eficaz con F = Z se le llama seccion eficaz de Mott, y es la que obtendriamos
para una particula puntual con carga Z e. Vemos pues que la funcion F (q) codifica la
estructura interna de la particula. Claro, si nos fijamos en el vertice, esta claro que F (q) es
la transformada de Fourier de la densidad de carga en la particula. Para una particula sin
spin ρ(~x) = Z δ(~x), con lo que F = Z. Asi pues, si medimos la seccion eficaz iluminando
una particula con luz poco energetica y lo dividimos por la seccion eficaz de Mott lo que
obtendremos es informacion sobre la estructura interna de la particula. A la funcion F (q)
se le llama factor de forma.
Nos gustaria usar este metodo para fotografiar hadrones –en particular protones–. El
problema es que en realidad el proton si retrocedera un poco en la colision –un nucleo
65
pesado si es suficientemente masivo como para ignorar el retroceso, pero no asi un proton,
a no ser que estudiemos energias excesivamente bajas–. Ademas, el vertice efectivo usado
arriba es un poco demasiado simplificado. Si el proton fuese una particula puntual, teniendo
en cuenta el posible retroceso, contribuiria al scattering con ūproton γ µ uproton . Podriamos
entonces copiar nuestro resultado para el scattering e− µ− → e− µ− . Recordemos que
esta corriente, asumiendo el proton una particula puntual con spin 1/2 como el muon,
ūproton γ µ uproton se puede escribir, usando la descomposicion de Gordon, como
i
1 h
(pin + pout )µ + i σ µν (pout − pin )ν uout
(304)
2M
donde M es la masa del proton.
Es decir, la interaccion es debido a la carga electrica asi como al spin –momento
magnetico–. Los factores particulares son debidos a que estamos asumiendo una particula puntual de spin 1/2. Sin embargo, si la particula tuviese estructura, dichos factores
cambiarian. Es por ello que para el proton podemos asumir una forma para la corriente
h
i
κ
µ
jproton
= ūprotonout F1 (q 2 ) γ µ +
F2 (q 2 ) i σ µν qν uprotonin
(305)
2M
Donde F1, 2 precisamente codifican esa estructura interna del proton. El factor κ es el
momento magnetico anomalo. Si tuviesemos una particula realmente puntual tendriamos
que κ F2 = 0 y F1 = 1, recuperando nuestra vieja corriente conocida.
Notese que la forma de la corriente, parametrizada con F1, 2 , es la mas general posible
µ
compatible con su conservacion –es decir, ∂µ jproton
= 0–.
Se suele definir
ūout γ µ uin = ūin
q2
κ q2
F
G
=
F
+
κ
F
τ
=
−
2
M
1
2
4 M2
4 M2
De manera que la seccion eficaz en el sistema de referencia del laboratorio es
GE = F1 +
dσ
α2
=
dΩ
4 E 2 sin4
1
θ
2
1+
2E
M
sin2
θ
2
G2 + τ G2
θ
θ
E
M
cos2 + 2 τ G2M sin2
1+τ
2
2
(306)
(307)
Resulta que, por ejemplo, se observa en el experimento que
GE (q 2 ) = 1
1−
q2
0.71 GeV 2
(308)
Demostrando explicitamente que el proton tiene una subsestructura.
7.1.1
Scattering inelastico
De cara a estudiar esta estructura interna del proton –de los hadrones en general– uno
podria pensar en subir la energia del foton que fotografia el proton. El problema es que al
66
hacer esto el proton se rompe: el scattering es inelastico –las particulas no solo rebotan,
sino que rompen–.
El “diagrama” relevante es (10).
Figure 10: Scattering inelastico
Este diagrama lleva a una amplitud de probabilidad de la forma generica
|Mup |2 = Lµν Wµν
(309)
q µ q ν W2 µ p q µ ν p q ν + 2 p − 2 q
p − 2 q
q2
M
q
q
(310)
Donde Lµν es el familiar tensor leptonico –el del electron– y Wµν es el correspondiente
tensor asociado al proton y todo en lo que se rompe. Lo unico que dicho tensor hadronico
debe cumplir es que sea simetrico y que qµ W µν = 0 maniestando la conservacion de la
corriente. Con esas restricciones el W mas general16 que podemos escribir es
W µν = W1
− η µν +
Donde p es el momento inicial del proton y q el momento del foton que lo prueba. La
normalizacion arbitraria se debe a cuestiones historicas. Las funciones W1, 2 se llaman
funciones de estructura y codifican precisamente la estructura interna del hadron.
Resulta util definir las siguientes variables adimensionales construidas con cantidades
cinematicas
x=−
q2
2M ν
y=
pq
pk
ν=
pq
M
(311)
Sorprendentemente, al subir la energia del foton que rompe el proton –es decir, a mayor
Q = −q 2 –, las funciones de estructura se parecen mas y mas a algo de la forma
2
16
En realidad hay un termino mas que podemos escribir con µνρσ , pero dejemoslo estar hasta mas
adelante.
67
W1p = A2 Q2 δ(ν − A Q2 )
W2p = δ(ν − A Q2 )
(312)
Donde A es una constante con unidades de Energia−1 . A esto se le llama escaleo de Bjorken
–James Bjorken fue quien lo descubrio–. Resulta que estas son las funciones de esctructura
que uno esperaria si el proton fuese una particula puntual de spin 1/2 y masa (2 A)−1 . Esto
es sorprendente para empezar porque sabemos que el proton no es una particula puntual
–el scattering elastico asi lo indica–, ademas de porque el valor de la masa es diferente
al de la masa del proton. La conclusion debe ser pues que el proton esta compuesto de
particulas puntuales que interactuan menos y menos a medida que la energia sube. A estas
particulas puntuales Feynman las llamo colectivamente partones. Resulta que la variable
x mide cuanto momento –que fraccion– lleva el parton en cuestion al que le esta dando el
foton del momento total del hadron. Estos partones de spin 1/2 que interactuan con el
foton se corresponden con los quarks de QCD.
Sin embargo, si miramos todo el momento que se llevan los partones que interactuan
con el foton veriamos que no suman el momento total inicial del hadron. Eso implica
que ha de haber otros constituyentes sin carga electrica. Esos otros constituyentes son los
gluones de QCD que median las fuerzas entre quarks.
La imagen que emerge es que los hadrones –el proton en particular– contiene unos
quarks de valencia que le dan los numeros cuanticos acreditandole como tal hadron en
particular, asi como un mar neutro de quarks, antiquarks y gluones, que son los partones
de Feynman.
7.1.2
Gluones
Hemos visto la necesidad de introducir partones electromagneticamente neutros para dar
cuenta del momento total del hadron. Estos partones los hemos identificado con los gluones
de QCD. Volvamos sobre esto un momento. Si QCD se comportase de manera similar a
QED si podriamos ser sensibles a estos partones neutros a traves de un proceso a orden
mas alto, como en la figura (11).
Estas desviaciones –asi como otros efectos de radiaccion de gluones–, estudiadas en
particular por Altarelli y Parisi, se observan en los experimentos y ponen de manifiesto la
“realidad” de QCD.
7.2
QCD
Hemos visto que la estructura de los hadrones se entiende asumiendo que estos estan
formados por quarks de spin 1/2 interactuando a traves de una teoria tipo QED para una
nueva fuerza que llamamos QCD y cuyos “fotones” son los gluones. Resulta ser que, al igual
que QED estaba basada en el principio de invariancia gauge bajo transformaciones U (1),
QCD esta basada en el principio de invariancia gauge bajo SU (3). Para construir QCD
podemos pues seguir nuestra hoja de ruta usual, que empieza por introducir un campo de
spin 1/2 para los quarks. Supongamos por sencillez un solo tipo de quark transformandose
bajo SU (3) en la representacion fundamental. Esto quiere decir que debemos introducir
68
Scaling: a altas energias el proton
es un saco de partones de spin 1/2
cargados (quarks)
Desviaciones de scsaling: a traves
de una contribucion a orden mas alto
podemos ser sensibles a los partones
neutros (gluones)
Figure 11: Desviaciones de scaling asociadas a ver los partones neutros (=gluones).
un campo de Dirac q que se transforme como fundamental bajo SU (3). Al igual que una
rotacion –de momento consideremosla global– U (1) transforma el electron como e → ei α e,
una rotacion SU (3) transforma q como
q → ei ϕ
a
Ta
q
Donde T a son los generadores del grupo SU (3), de manera que ei αa
grupo. Considerando transformaciones infinitesimales tenemos
q → q + i ϕa Ta q
(313)
Ta
es un elemento del
(314)
Como los generadores T a en la representacion fundamental son matrices 3 × 3 tales que
Ta = Ta† , esta claro que el elemento del grupo tambien sera una matriz 3 × 3, y por lo tanto
q ha de ser un vector columna con 3 entradas:


q1
q =  q2 
(315)
q3
69
Es decir, q, ademas de los correspondientes indices spinoriales, tendra indices de color.
Omitiendo los spinoriales, escribamos qa con a = 1, 2, 3. La teoria para un quark libre
esta descrita simplemente por
Z
S=
i q̄a (∂/ + m) qb δ ab
(316)
de manera que es invariante bajo SU (3).
Siguiendo el ejemplo de QED, queremos hacer esta transformacion local. Eso exige de
introducir un campo gauge cambiando ∂µ por Dµ tal que
Dµ q = ∂µ q + i Aaµ Ta q
(317)
siempre y cuando los 8 –SU (3) tiene 8 generadores, es decir, 8 Ta ’s– Aaµ transformen como
Aaµ → Aaµ + ∂µ ϕa + f abc Abµ ϕc
(318)
siendo f abc las constantes de estructura del algebra de SU (3). Es mas iluminador escribirlo
como matrices llamando Aµ = Aaµ Ta –y analogamente para los parametros gauge ϕ =
ϕa Ta –. Entonces
Dµ q = (∂µ + i Aµ ) q
Aµ → Aµ + ∂µ ϕ − i [Aµ , ϕ]
(319)
De esta manera Dµ q se transforma covariantemente, es decir, como q.
Notese que al tener un grupo no abeliano –SU (3)– como base para la teoria, la transformacion gauge es un poquito mas complicada. De hecho, el tensor de campo es
Fµν = ∂µ Aν − ∂ν Aµ + i [Aµ , Aν ]
(320)
Fµν → Fµν − i [Fµν , ϕ]
(321)
de manera que bajo transformacion gauge se transforma como
Si construimos
Z
Tr Fµν F µν
(322)
debido a que la traza del conmutador es 0, tendremos un invariante gauge analogo al
termino cinetico para el foton. Asi pues, todo junto –e introduciendo la constante de
acoplo g, para QCD la accion es
Z
1
/ + m) q
D µ q = ∂µ q + i g A µ q
(323)
S=
− Tr Fµν F µν + i q̄ (D
4
Notese que al tener una teoria no abeliana, basada en SU (3), F contiene terminos
cuadraticos en A sin derivadas. Estos terminos daran lugar a terminos en el lagrangiano
de la forma AA∂A y AAAA, que se corresponden con vertices con 3 y 4 gluones respectivamente: los gluones interactuan entre si!!!!. Esto es muy diferente de QED y el germen
70
Z=
electrones y fotones es
Z
DAµ D ¯ D ei
d x
4
Fµ⌫ F
+i
(@µ +i e Aµ ) +m
+J
+ J+Jµ A
(234)
1
sin embargo
mal definido,
¯
Fµ⌫ F µ⌫ + i ¯ µ (@µ +Esto
i e Aesta
(233)ya que debido a la invariancia gauge todos los Aµ
µ) + m
4
conectados por Aµ ! Aµ + @µ ' son equivalentes. Asi pues la integracion funcional sobre
Aµ ruta
“cuenta
de es
mas”
muchas
configuraciones.
Hay que eliminar esas redundancias, lo que
La teoria cuantica se obtiene siguiendo la hoja de
usual,
decir,
considerando
el
se puede
de manera precisa –aunque aqui no vamos a entrar en ello en detalle–.
funcional generador –que contiene toda la informacion
de lahacer
teoria–
Z
R 4 1
µ⌫
¯ µ (@µ +i e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ
Z = DAµ D ¯ D ei d x 4 Fµ⌫ F +i 6.2
Reglas de Feynman (234)
S=
d4 x
Siguiendo
nuestra hoja
de ruta,
Esto esta sin embargo mal definido, ya que debido
a la invariancia
gauge
todosvamos
los Aµa asumir que la constante de acoplo –en este caso
carga
pequegna,
de manera que podemos hacer teoria de perturbaconectados por Aµ ! Aµ + @µ ' son equivalentes.laAsi
puesdel
la electron–
integracionesfuncional
sobre
Para ello
conocer
las reglas de Feynman. Ya sabemos el propagador
Aµ “cuenta de mas” muchas configuraciones. Hayciones.
que eliminar
esasnecesitamos
redundancias,
lo que
delvamos
fermion:
se puede hacer de manera precisa –aunque aqui no
a entrar en ello en detalle–.
de la enorme diferencia entre QED y QCD. Aunque no vamose a hacer
i (p/ + m)ningun calculo exD = 2
Reglas
de Feynman
p –es
m2 decir,
+ i✏
plicit de6.2
QCD,
escribamos
las reglas de Feynman a modo grosero
sin fijarnos en (235)
propagador
campo–en
gauge
cuanto es el foton– se podria calcular de manera
Siguiendo
nuestra hojanumericos
de ruta, vamos etc–
a asumirpara
que El
la hacernos
constante dedelacoplo
este–cuyo
caso reglas
exceso en
los factores
una
idea
las
son como en la fig.
analoga.
Sin hacer
embargo,
como
dijimos antes, debido a la invariancia gauge el calculo es
la carga del electron– es pequegna, de manera que
podemos
teoria
de perturbaun
poco
mas
sutil.
Contentemonos
con
el
resultado
en un gauge particular –gauge de
(12). ciones. Para ello necesitamos conocer las reglas de Feynman. Ya sabemos el propagador
Feynman–, cuando
del fermion:
i ⌘ µ⌫
i (p/ + m)
D = 2
(236)
(235)
p + i✏
p2 m2 + i ✏
ultimo
el vertice
de interaccion,
El propagador del campo gauge –cuyo cuanto es elPor
foton–
se podria
calcular
de manera que se puede leer directamente del lagrangiano
¯ µ aAµlada
una regla gauge
para elelvertice
analoga. Sin embargo, como dijimos antes, debido
invariancia
calculodees2 fermiones y un foton
un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de
V = ie µ
(237)
Feynman–, cuando
De =
D =
i ⌘ µ⌫ Resumiendo
p2 + µi ✏
(236)
⇠ g2
⇠ gp
Por ultimo el vertice de interaccion, que se puede leer directamente del lagrangiano
¯ µ Aµ da una regla para el vertice de 2 fermiones y un foton
V =
ie
µ
(237)
Resumiendo
51
⇠ g
µ
51
Figure 12: Reglas
de Feynman para QCD
7.2.1
QCD con varios flavors
En realidad hay mas de un quark. Cada tipo de quark se llama flavor –sabor–. Supongamos
Nf flavors. En general tendremos pues que QCD con varios flavors se describe como
Z
1
/ + m) qi
i = 1 · · · Nf
(324)
S=
− Tr Fµν F µν + i q̄ i (D
4
con
Dµ qi = ∂µ qi + i g Aµ qi
(325)
Los quarks en realidad estan tambien cargados electricamente. Asi pues, considerando
el sector de QCD mas sus interacciones electromagneticas
S=
Z
1
1
/
− Fµν F µν − Tr Gµν F µν +i q̄ i (D+m)
qi
4
4
Dµ qi = ∂µ qi +i g AQCD
qi +i ei AQED
µ
µ
(326)
donde ei son las cargas electricas de cada flavor,
el campo gauge del gluon, que
QCD
QCD
a
matricialmente es Aµ
= [Aµ ]a T siendo Ta los generadores de SU (3), y AQED
el
µ
campo gauge del foton, que no tiene indices de color, asi que podemos escribirlo como una
identidad en espacio de SU (3), es decir, como AQED
= AQED
1l3×3 .
µ
µ
AQCD
µ
71
La existencia de varios flavors se puede “medir” directamente en el experimento e+ e− →
q q̄. Este expermiento es analogo al caso e+ e− → µ+ µ− que estudiamos en detalle: el
diagrama y el calculo es exactamente el mismo, tan solo con la excepcion de que segun el
tipo de quark saliente habra que poner la masa correspondiente en lugar de la del muon.
Dichas masas son diferentes para cada quark. Podemos medir la seccion eficaz para la
reaccion e− e+ → hadrones, que esta dominada por estos procesos e+ e− → q q̄. Como
no vamos a fijarnos en un tipo de hadron particular en el estado final, sino que vamos a
sumar cualquier hadron, todos los quarks contribuiran a esta seccion eficaz. Es decir, si nos
fijasemos en estados finales con hadrones hechos de tales o cuales quarks los procesos relevantes serian aquellos con tales o cuales q q̄ en estados finales. Como incluiremos todos los
hadrones, debemos considerar procesos mediados por cualquier tipo de quark. La seccion
eficaz total para cada flavor sera una copia, con los factores adecuadamente adaptados, de
la seccion eficaz total e+ e− → µ+ µ− que conocemos
r
2
π
α
m2i m2i e
i
1
−
1
+
(327)
σ(e+ e− → qi q̄i ) = 3
e 3 E2
E2
E2
Las masas de los leptones estan en la figura (13)
Figure 13: Masas de los leptones
Como se ve, hay una jerarquia bastante grande en las masas. Motivados por esto,
asumamos que una jerarquia similar existe en los quarks. Asi pues, existiria un rango de
energias E tal que un numero nf ≤ Nf de quarks cuayas masas mi << E para i = 1 · · · nf .
Para ellos
ei π α 2
σ(e e → qi q̄i ) =
(328)
e E2
De manera que la seccion eficaz total sera la suma de las secciones eficaces a cada tipo de
quark, es decir
+ −
+ −
σT (e e
nf
X
ei π α2
→ hadrons) =
e E2
i=1
72
(329)
Como E >> mµ , podemos normalizar por la seccion eficaz del proceso leptonico puro
e+ e− → µ+ µ− , de manera que
nf
X
σT (e+ e− → hadrons)
ei
R=
=
3
σ(e+ e− → µ+ µ− )
e
i=1
(330)
Asi pues esto es sensible de manera discreta al numero de quarks con masa menor que E.
Comparando con el experimento se ve que el factor 3 es necesario (es decir, QCD es SU (3),
ya que ese es el origen del 3) y que la estructura de masas y cargas electricas de quarks es
Figure 14: Masas de los quarks
7.2.2
La constante de acoplo de QCD
Hasta ahora solamente hemos discutido los efectos a primer orden en teoria de perturbaciones. Es decir, hemos considerado solo procesos tree level sin incluir ningun loop. A
ordenes superiores un “fenomeno” completamente crucial en teoria cuantica de campos
orcurre: los diagramas divergen y nada parece tener sentido. Consideremos el ejemplo mas
sencillo, en la teoria escalar λ φ4 en la figura (15).
Figure 15: Ejemplo de diagrama divergente
El diagrama vale
M = −i λ
Z
d4 p
i
(2π)4 p2 − m2 + i 73
(331)
Para estimarlo, pasemos al euclideo haciendo p0 = i pE
0 . En el euclideo la integracion sobre
momentos es una integracion en R4 . Como el integrando depende solo de |~pE |2 , el trozo
angular es facil. Olvidandonos de constantes numericas irrelevantes la integral va como
Z Λ
i
dp 2
M∼λ
(332)
p + m2
0
donde hemos puesto un regulador para p grande. Evidentemente, para p muy grande,
la integral diverge como λ p2 , de manera que la teoria ha de ser intrinsecamente definida
con un cu-off Λ tal que |p| < Λ. Esto simplemente refleja el hecho de que las teorias de
campos son teorias efectivas, y a partir de cierta escala Λ sencillamente dejan de capturar
los grados de libertad relevantes.
Sin embargo, a veces se pueden incluir los grados de libertad relevantes a energias
mayores que Λ en la descripcion de baja energia ajustando los parametros: estas son las
teorias cuyos acoplos son como mucho marginales. Estas teorias se dicen renormalizables,
porque podemos meter la dependencia de Λ en los parametros λ, m. El precio a pagar es
que λ y m ya no son constantes sino que dependen de la escala de energia a la que estemos
probando la teoria.
Volviendo a nuestra descripcion de QCD, lo mismo ocurre. El acoplo de la teoria –asi
como el de QED– es marginal y la teoria es renormalizable. Eso resultara en un acoplo que
en realidad depende de la energia, conocido como running coupling constant. Resulta
que para QCD –normalmente se llama αs una vez metidos los correspondientes 4π 2 en g 2 –
tiene el aspecto de la figura (16).
Como se ve. . . a baja energia QCD esta fuertemente acoplada, mientras que
a alta energia el acoplo tiende a cero. Esto es lo que se conoce como libertad
asintotica y esta en el centro del escaleo de Bjorken. Para fotones muy energeticos los
quarks se ven esencialmente libres dentro del proton.
A baja energia la constante de acoplo se vuelve enorme. Evidentemente la teoria
de perturbaciones –que ha sido la herramienta fundamental hasta ahora– no es valida.
Aunque no se sabe demostrar ni se entiende el mecanismo fundamental, esta claro que
lo que ocurre es que a baja energia las fuerzas entre quarks son enormes. De hecho es
como si los quarks en los hadrones estuviesen atados por cuerdas, de manera que si estan
separados por distancias menores que el tamagno de la cuerda se ven como libres, mientras
que si intentamos separarlos mas que la cuerda esta nos lo impide. Esta “cuerda” genera
un potencial lineal de interaccion V ∼ r. Como mucho podemos romper la cuerda, pero
al romperla en cada extremo se crea un nuevo quark, de manera que los quarks nunca se
ven libres a baja energia. Esto es el confinamiento responsable de la existencia de los
hadrones.
QED es sin embargo muy diferente en su comportamiento. La razon esta en que al ser
el grupo abeliano, el foton no interactua consigo mismo. Eso lleva a que en lugar de ser
debilmente acoplada a alta energia y fuertemente acoplada a baja energia sea al reves. Es
decir, QCD es libre en el infrarrojo. El que su constante de acoplo crezca a altas energias
querria indicar que, pese a ser renormalizable, QED no podria ser una teoria fundamental,
ya que a altas energias su definicion en terminos de electrones y fotones rompe.
74
Figure 16: La constante de acoplo de QCD
7.2.3
Hadrones y el infrarojo de QCD
Como QCD exhibe confinamiento, a baja energia solo podremos ver estados que sean
neutros bajo SU (3). Podemos leer los posibles singletes de la tabla (14), ya que las cargas
electricas fraccionarias son otra manifestacion de que los quarks a baja energia solo se ven
en singletes de color con carga electrica entera.
Consideremos las combinaciones singletes bajo SU (3) uud y ddu. Su carga electrica
es respectivamente 1 y 0. Son el proton y el neutron. Notese que la masa de sus quarks
constituyentes es respectivamente 0.02 GeV y 0.015 GeV , mientras que su masa real es de
aproximandamente 1 GeV . Esto quiere decir que la energia de ligadura es enorme, como
es de esperar en una teoria fuertemente acoplada.
7.2.4
Simetria quiral en QCD
Ya que los quarks mas ligeros son el u y el d, que tienen una masa bastante pequegna, a
bajas energias podemos considerar que son los unicos relevantes y que son basicamente de
75
masa cero. En tal caso QCD tiene simetria quiral analoga a la de QED. En realidad la
simetria es un poco mayor por tener dos especies de fermiones sin masa (u y d). El trozo
que contiene los fermiones es
Z
/ + m) qi
q̄i (D
qi = (u, d)
(333)
Esto tiene una simetria global SU (2), ya que podemos transformar
qi → Uij qj
(334)
siempre y cuando U U † = 1,
l es decir, con una rotacion U (2) en espacio de flavor.17 Al
igual que para QED, esta simetria de flavor es quiral por tener fermiones sin masa. Asi
pues la simetria global es U (2)L × U (2)R . Como U (2) = SU (2) × U (1), podemos escribir
la simetria global como SU (2)L × SU (2)R × U (1)L × U (1)R . Asi pues tendremos corrientes
conservadas para estos 4 factores para qL, R . Mezclandolas para formar las combinaciones
axial y vectorial, tenemos dos simetrias axiales
jUµ (1)A = q̄i γ µ qi
µ
µ
a
jSU
(2)A = q̄i γ qj σij
(335)
donde una es U (1) y la otra es SU (2) –de ahi que aparezcan las matrices de Pauli–.
Resulta ser que a baja energia el bilineal de quarks q̄i qi toma un VEV por efecto de la
dinamica de acoplo fuerte, no perturbativa, de QCD. Es decir
h q̄i qi i = h u†L uR + u†R uR + d†L dR + d†R dR i =
6 0
(336)
Esto implica que las rotaciones quirales no son una simetria a baja energia, ya que no
dejarian invariante este VEV. Solo las transformaciones diagonales de U (2)L × U (2)R –es
decir, las que transforman igual left y right– dejan invariante el VEV.
Como esta ruptura es espontanea, por argumentos muy generales, debido al teorema de
Goldstone (ver apendice. Lo discutiremos en mas detalle mas adelante) debemos esperar
una particula sin masa por cada generador roto –en este caso 4–. Asi pues, a baja energia
en QCD debemos esperar 4 particulas casi sin masa.
Sin embargo la corriente para U (1)A es anomala, lo que quiere decir que aunque sea una
simetria clasica, los efectos cuanticos la rompen. Asi pues uno de las 4 particulas masivas
no esta protegida –de hecho no teniamos 4 generadores conservados para empezar, sino
solo los 3 asociados a SU (2)A – y adquiere masa mayor. Debemos pues esperar 3 particulas
con masa muy pequegna –porque al final u, d tienen una masa pequegnita–: los 3 piones!!!!
Ademas de estos, u, d se combinan en proton y neutron. Por lo tanto, a baja energia,
la fisica de QCD debe estar descrita por una teoria efectiva de la forma
Z
m2
1
∂µ π ∂ µ π − π π 2 + n̄i γ µ ∂µ ni − mn n̄i ni − λ n̄i γ5 nj π
(337)
S=
2
2
17
En el caso de QED que discutimos teniamos un solo fermion, asi que la simetria de flavor era simplemente U (1).
76
que es el lagrangiano que escribimos antes y que da lugar al potencial de Yukawa.
El SU (2)A no anomalo es de hecho el isospin de las interacciones nucleares: es la
simetria SU (2) global que la teoria de arriba tiene.
8
La fuerza electrodebil
Es un hecho que el neutron se desintegra β produciendo un proton y un electron observables. Como estas dos particulas no dan para satisfacer la conservacion de la energia y
el momento, Pauli postulo la existencia de una nueva particula, el neutrino –que Cowan
y Reines descubrieron experimentalmente despues–. Asi pues, el neutron se desintegra en
un proton, un neutron y un neutrino. Sin embargo, ni las interacciones fuertes ni las electromagneticas pueden ser las responsables de esto, indicando la existencia de una nueva
fuerza: la fuerza debil.
8.1
Teorias con vertices de 4 fermiones
El proceso que describimos antes es neutron → proton + e− + ν. Como el proton es
uud mientras que el neutron es udd, esta claro que la reaccion detras del decay β es
d → u + e− + ν. Este proceso, ya que involucra una parte de QCD, es complicado. Existen
otros procesos analogos que solo involucran leptones –sin carga de color–. Un ejemplo es
µ → 2 ν + e− .18 Esto sugiere que nuestra teoria fundamental ha de contener un vertice
con 4 fermiones tal que
Z
GF
(338)
− √ (ν̄ µ) (ē ν)
2
La constante de acoplo –que tiene dimensiones de E −2 , es decir, es irrelevante– se llama
constante de Fermi, y comparando con el experimento, se puede fijar su valor.
El problema es sin embargo que la teoria de Fermi tiene una constante de acoplo
irrelevante, y es por lo tanto no renormalizable. Esto implica que ha de ser pensada como
−1/2
una teoria efectiva por debajo de la escala GF ∼ 200GeV .
8.2
Teorias para campos gauge con masa
Siguiendo el ejemplo de QED y QCD –cuyas fuerzas estaban mediadas por campos gauge–
es natural pensar que detras de la interaccion debil este tambien una teoria gauge. Sin
embargo, la fuerza debil es de corto alcance, lo que pone de manifiesto su escala caracteris−1/2
tica de GF ∼ 200GeV . Eso implica que el “potencial de interaccion” en lugar de ser 1/r
como para el foton –es decir, de alcance infinito– debe decaer mas rapido y ser mas bien
parecido al potencial de Yukawa e−M r r, donde M es la escala de masas caracteristica de
esos ∼ 200GeV . Un comportamiento asi lo tendriamos si considerasemos un campo gauge
Wµ con masa, esquematicamente
18
En realidad los 2 neutrinos son νµ + ν̄e . Esto lo discutiremos despues.
77
S=
Z
−Fµν F µν − M 2 Wµ W µ
(339)
Donde esa masa M , constantes numericas a parte, son basicamente esos 200GeV ’s.
Aqui hemos supuesto arbitrariamente un grupo U (1) por sencillez, pero el aspecto a
grandes rasgos de la teoria seria el mismo. El problema es, obviamente, que la simetria
gauge Wµ → Wµ + ∂µ ϕ esta explicitamente rota por el termino de masa: si M 6= 0, simplemente la transformacion gauge no es simetria. Aunque esto es un problema enorme –porque
entonces, aun pese a solo contener acoplos marginales, la teoria no seria renormalizable e
indicaria la existencia de nueva fisica a partir de cierta escala–, tomemos de momento una
actitud pragmatica: si dicha nueva fisica estaria suficientemente lejos en energias, a efectos
practicos seria irrelevante. Asi pues consideremos la teoria del campo vectorial masivo per
se.
Supongamos ahora que acoplamos este campo de juguete a un fermion de masa m con
carga g bajo Wµ
Z
/ + m) ψ
S=
−Fµν F µν − M 2 Wµ W µ + i ψ̄ (D
(340)
La unica diferencia con el caso con M = 0 en las reglas del Feynman es que el propagador
del campo gauge seria
i η µν
i η µν
→
q2
p2 − M 2
(341)
Consideremos ahora el diagrama 2 ψ → 2 ψ (que es como el e− e+ → µ− µ+ ). El diagrama
valdria
M ∼ g 2 (ū γ µ u)
η µν
(ū γ ν u)
q2 − M 2
(342)
Para interacciones a baja energia, cuando el momento transferido q 2 sea mucho menor que
la masa del campo gauge q 2 − M 2 ∼ −M 2 , de manera que
η µν
g2
ν
(ū
γ
u)
∼
(ū γ µ u) (ū γ ν u)
(343)
2
2
2
q −M
M
Es decir, recuperariamos la misma prediccion que la teoria de Fermi –que explica el
experimento– con
M ∼ g 2 (ū γ µ u)
g2
(344)
M2
Por lo tanto en efecto podriamos imaginar una teoria gauge –en pie de igualdad pues a
las demas fuerzas fundamentales– que reproduzca la teoria de Fermi, si bien al precio –de
momento abusivo!!!!– de que la teoria ha de ser no renormalizable. Sin embargo –ya que
este problema tendra solucion en un momento–, un problema mas fundamental es que esta
teoria de juguete en realidad no explica lo que ocurre en el experimento. En la reaccion
GF ∼
78
µ → 2 ν + e− no hay manera de, separando de dos en 2 los constituyentes para agruparlos
en los dos vertices fermion+fermion+boson mediador involucrados, de encontrar sitio al
modelo sencillo de arriba, ya que la carga electrica no se conservaria. Eso implica que el
boson gauge W ha de estar cargado bajo el campo electromagnetico!!!
La solucion a este ultimo problema esta intimamente ligada a la solucion del problema
de la no renormalizabilidad: la ruptura espontanea de la simetria (ver apendice).
8.3
Ruptura de simetria local
Supongamos que hacemos local la simetria U (1) que esta rompiendo espontaneamente en
un modelo con un potencial de sombero mejicano. Consideremos pues
S=
Z
1
1
1
d4 x − Fµν F µν + |Dµ φ|2 − m2 |φ|2 −λ |φ|4
4
2
2
Dµ φ = ∂µ −i e Aµ φ
Fµν = ∂µ Aν −∂µ Aν
(345)
Con m2 > 0, de manera que el vacio es
φ0 =
r
r
φ0 = ( −
m2 i θ 0
e
4λ
(346)
m2
+ ρ) ei(θ0 +p)
4λ
(347)
−
Para ρ, p pequegnos encontramos
Z
1
1
φ2
(348)
S ∼ d4 x − Fµν F µν + ∂ρ2 − 4 λ φ20 ρ2 + 0 (∂µ p + i e Aµ )2
4
2
2
Podemos ahora escoger un gauge en el que p = 0, teniendo
Z
1
1
e2 φ20
S ∼ d4 x − Fµν F µν + ∂ρ2 − 4 λ φ20 ρ2 +
Aµ Aµ
(349)
4
2
2
Es decir, al fijar el gauge reabsorbiendo p –que seria el boson de Goldstone de masa 0 si la
simetria fuese global– en Aµ , el campo gauge se transformo en un campo masivo de masa
M 2 ∼ e2 φ20 , mientras que la unica traza que quedo del escalar original es la fluctuacion ρ
de masa m ∼ λ φ20 , es decir
(−m2 ) e2
m2escalar masivo ∼ (−m2 )
(350)
λ
Evidentemente si hubiesemos tenido fermiones extra en la teoria todo esto seguiria
siendo valido. La moral del asunto es pues que agnadiendo un sector escalar acoplado
al campo gauge con un potencial de sombrero mejicano, al romperse espontaneamente la
simetria gauge el boson de Goldstone puede ser reabsorbido por el campo gauge, que gana
asi un grado de libertad extra y se convierte en masivo. Por lo tanto recuperariamos el
2
Mvector
masivo ∼
79
modelo que vimos antes del campo gauge masivo que, a baja energia a su vez recuperaba
la teoria de Fermi con un vertice de cuatro fermiones. Sin embargo, a traves de todo este
proceso hemos conseguido embeber la teoria de Fermi en una teoria gauge para un campo
gauge de verdad –es decir, en donde la simetria gauge si se respeta–. Asi pues, el modelo
con campo φ y potencial de sombrero mejicano si es renormalizable y, a baja energia,
recupera la interaccion de 4 fermiones necesaria para entender la interaccion debil. A este
campo φ responsable de romper la simetria gauge se le llama campo de Higgs, y deja el
ρ como traza final a baja energia.
Nos queda aun entender como producir, una vez adquieren masa los campos gauge,
campos vectoriales electromagneticamente cargados. Para ello la clave es considerar un
grupo un poco mas complicado que el modelo de juguete U (1). Consideremos SU (2)L ×
U (1)Y . Esto tiene 4 generadores: 3 en SU (2) y uno en U (1). Supongamos ahora un Higgs
cargado bajo el U (1)L ∈ SU (2)L y sobre U (1)Y con carga opuesta, es decir, cargado bajo
U (1)L − U (1)Y . Al tomar el Higgs VEV este U (1)Y − U (1)L se rompe espontaneamente,
asi como el SU (2). Sin embargo la combinacion U (1)L + U (1)Y no se rompe. Por lo tanto,
de los 4 vectores gauge originales 3 se harian masivos y uno quedaria sin masa. Este sin
masa es el foton, es decir, U (1)L + U (1)Y = U (1)QED . Entre los otros 3 masivos, como
U (1)L − U (1)Y es ortogonal a U (1)QED , tendriamos uno neutro bajo el electromagnetismo
y dos cargados. Esos serian los 2 W ± responsables de decaimientos tales como el del
muon que describimos arriba. El campo vectorial masivo daria lugar a otros procesos
parecidos a los de QED solo que de corto alcance. Es el Z 0 . Esta es de hecho la estructura
que se ve experimentalmente: este es el germen del Modelo Estandard (SM). Lo veremos
explicitamente en la subseccion siguiente.
8.4
El sector bosonico del SM: gauge+Higgs
El sector bosonico del SM contiene todos los bosones vectoriales y el Higgs de spin 0. Como
dijimos, de cara a tener bosones vectoriales cargados en una teoria gauge necesitamos un
grupo de gauge SU (2)L × U (1)Y –el Y significa hypercarga, y el L left. Veremos luego el
por que del nombre left–. El Higgs es fundamental del SU (2)L y esta cargado bajo U (1)Y .
Asi pues, introduciendo un campo por cada particula, el trozo bosonico del SM es
Z
1
1
λ2 † 2
1
2
b
− FB2 + (Dµ φ)† Dµ φ) − µ2 φ† φ −
(φ φ)
(351)
SSM = − Tr FW
4
4
2
2
Donde Wµ = Wµa σa es el campo gauge de SU (2)L y Bµ el de U (1)Y , siendo los tensores de
campo lo usual
(FW )µν = ∂µ Wν − ∂ν Wµ + i g [Wµ , Wν ]
(FB )µν = ∂µ Bν − ∂ν Bµ
Donde g, g 0 son las constantes de acoplo respectivas.
Como el Higgs es fundamental de SU (2)L lo podemos escribir como
+ φ
φ=
φ0
80
(352)
(353)
De manera que la derivada covariante es
Dµ · = ∂µ · +i g Wµ · +i
g0
Y Bµ ·
2
(354)
siendo Y la hypercarga, que para el Higgs es 1.
El minimo del potencial escalar, cuando −µ2 > 0, esta en
φ† φ = |φ+ |2 + |φ0 |2 =
−µ2
λ2
(355)
−2 µ2
λ2
(356)
Escojamos el vacio
φ0 =
0
√v
2
v2 =
Par ver la masa de los campos vectoriales simplemente debemos enchufar este vacio y sus
fluctuaciones en la accion. Escogiendo el gauge tal que fijamos la fase a 0, y congelando
las fluctuaciones del modulo, podemos fijarnos simplemente en
Z
1
1
1
2
b
− FB2 + (Dµ φ0 )† Dµ φ0 )
(357)
SSM = − Tr FW
4
4
2
Donde
Dµ φ0 =
0
i g Wµ3 + i g2 Bµ i g (Wµ1 − i Wµ2 )
0
i g (Wµ1 + i Wµ2 ) −i g Wµ3 + i g2 Bµ
0
√v
2
=
!
i g (Wµ1 − i Wµ2 ) √v2
0
−i ( g Wµ3 − g2 Bµ ) √v2
(358)
Es evidente que es util definir
1 Wµ± = √ Wµ1 ∓ i Wµ2
2
Ademas es util definir el angulo de Weinberg
(359)
g0
= tan θW
g
(360)
De manera que
Dµ φ0 =
−i cosgθW
i g v Wµ+
(cos θW Wµ3 − sin θW 12 Bµ ) √v2
(361)
Es obvio que es ademas util definir
Zµ0 = cos θW Wµ3 − sin θW
Bµ
2
Aµ = cos θW Wµ3 + sin θW
De manera que
81
Bµ
2
(362)
Dµ φ0 =
i g v Wµ+
gv
Zµ0
−i √2 cos
θ
W
Con lo que en la accion efectiva aparece un termino de masas
Z
1
2
MW
(W + )µ (W − )µ + MZ2 (Z 0 )µ (Z 0 )µ
2
Con
MZ =
gv
cos θW
MW = g v
(363)
(364)
(365)
Para estudiar el termino cinetico, podemos darnos cuenta de que F W es una matriz de
SU (2), y por lo tanto de traza cero. Asi pues, si escribimos B = Bµ 1l2×2 y hacemos
Tr
µν
FW
1 µν 2
1 2 √
2
2
√
+
= Tr FW + FB + 2 FW FB = Tr FW
+ FB2
FB
2
2
(366)
ya que en espacio de SU (2)L FB F W es proporcional a un generador de SU (2), que es de
traza cero. Ahora podemos estudiar FW + √12 FB . Eso es
h
i
h
i
1
l (FW + )µν +2 i (Wµ+ Wν3 −Wν+ Wµ3 ) σ + + (FW − )µν +2 i (Wµ− Wν3 −Wν− Wµ3 ) σ −
(FW 3 )µν σ 3 + √ (FB )µν 1+
2
(367)
σ1 ±
i σ2
i
±
√
. Fijemonos en esos
Donde FW i = ∂[µ Wν] y analogamente para B. Ademas σ =
2
±
+
terminos con σ . El coeficiente de, por ejemplo, σ es
(FW + )µν + 2 (Wµ+ Wν3 − Wν+ Wµ3 ) = (∂µ − 2 i Wµ3 ) Wν+ − (∂ν − 2 i Wν3 ) Wµ+
(368)
Es decir, el termino cinetico para W ± esta escrito en terminos de una derivada covariante
con Wµ3 como campo gauge. Como Wµ3 es una suma de Zµ0 y Aµ , en efecto vemos que
los bosones gauge W ± estan cargados electricamente, justo como necesitabamos para las
interacciones debiles que median decaimientos β o el decay del muon de antes.
Al igual que en los modelos de juguete de arriba, al expandir el lagrangiano alrededor
de φ0 , y tras reabsorver la fase en la masa de {W ± , Z 0 }, acabaremos con un escalar neutro
H debido a las fluctuaciones de φ. Dicho escalar esta asociado una particula escalar: el
boson de Higgs –descubierto recientemente con una masa de unos 125GeV –.
8.5
La materia del SM
Ademas del sector de campos gauge + Higgs, el SM contiene materia fermionica –evidentemente!!!–
. En principio uno pensaria que necesitamos un campo de Dirac por cada particula. La
realidad es mas compleja: la Naturaleza no respeta las simetrias discretas bajo conjugacion
82
de carga, paridad e inversion temporal –todas juntas si, ya que CP T debe ser una simetria
para que el H sea hermitico–.
Aqui no entraremos en mucho detalle en ello. Nos bastara con que esa violacion de
simetrias discretas implica que debemos construir la materia no con spinores de Dirac,
sino con Weyls, es decir, implica que el SM es una teoria quiral.
La materia viene organizada en 3 familias, a su vez divididas en un sector leptonico
que no tiene carga de color y un sector de quarks, que si tiene carga de color. Tanto
quarks como leptones se acoplan a las interacciones debiles y electromagneticas, esto es, a
SU (2)L × U (1)Y .
Las 3 familias son identicas la una a la otra (salvo por las masas), asi que para empezar
vamos a considerar una sola familia: la mas ligera. Fijemonos primero en el trozo leptonico.
Este se acopla a SU (2)L × U (1)Y . Como ha de ser fundamental de SU (2)L necesitamos un
doblete de campos, que, debido a la quiralidad del SM, seran left. Dichos dos campos son
el electron y el neutrino. Asi pues, formemos
νe
L=
(369)
e L
donde el subindice L nos recuerda que son spinores left, es decir, obtenidos agarrando un
Dirac e y haciendo por ejemplo
1l − γ 5
e
(370)
2
Necesitamos tambien campos right –por ejemplo para cancelar anomalias. Hablaremos de
esto despues–. Esos son singletes bajo SU (2)L . Resulta que solo el compagnero right del
electron existe. LLamaremos
eL =
R = eR
(371)
donde el subindice R nos recuerda que es un campo right
1l + γ 5
e
(372)
2
Notese que no estamos poniendo un compagnero right para el neutrino. No esta claro que
tal particula exista –aunque si es cierto que el neutrino tiene masa–.
Siguiendo el proceso usual de escribir el lagrangiano del spinor y promover las derivadas
a derivadas covariantes, esta claro que el trozo leptonico sera
eR =
f1
S =
Z
L̄ i γ µ (∂µ + i g Wµ + i
g0
g0
Y Bµ ) L + R̄ i γ µ (∂µ + i g Wµ + i Y Bµ ) R
2
2
Igualmente, para el sector de quarks tendremos un doblete left
u
QL =
d L
83
(373)
(374)
Y un par de singletes right (aqui si ponemos los dos compagneros right)
uR
dR
(375)
El trozo de quarks sera analogo al leptonico pero incluyendo en la derivada covariante
el acoplo al campo del gluon. Concentremonos en los leptones, de todos modos.
Las otras familias tienen la misma estructura
L1 =
νe
e
L2 =
L
R1 = eR
8.5.1
νµ
µ
L3 =
L
R 2 = µR
ντ
τ
L
R3 = τR
Interacciones en el SM
Fijemonos en la derivada covariante. La podemos escribir como
Dµ = ∂µ + i g Wµ+ σ + + i g Wµ− σ − + i
Vayamos trozo a trozo
g
g
σ 3 − Y Zµ0 + i
σ 3 + Y Aµ (376)
2 cos θW
2 cos θW
• Corrientes cargadas: los W ± se acoplan a la materia a traves de los operadores
escalera en SU (2)L –los σ ± . Eso quiere decir que el SM contiene vertices en los
que cambiamos un miembro de los dobletes SU (2) por otro. Como el electron tiene
electrica -1 y el neutrino 0, esta claro que el boson mediador –los W ± – ha de estar
cargado.
• Corrientes neutras: el Z 0 se acopla a traves de σ 3 − Y , que es diagonal en espacio de
SU (2). Por eso no cambia miembros del doblete. Sus interacciones son como las del
foton, tan solo que masivo.
• Corrientes electromagneticas: el acoplo al foton –diagonal en espacio de SU (2)L
3
evidentemente– es a traves de la carga electrica Q = T 3 + Y2 , donde T 3 = σ2 . El valor
numerico lo da e = g/ cos θW . Ya que el electron ha de tener carga -1 y el neutrino
0, esto fija las siguientes asignaciones de hypercarga
σ3
Y
Q
eL − 12 −1 −1
νL
1
2
−1
eR
0
−2 −1
84
0
(377)
Para los quarks la cosa es un poco mas complicada
uL
σ3
Y
Q
1
2
1
3
2
3
dL − 12 − 31
uR
0
dR
0
4
3
1
3
(378)
2
3
− 23 − 31
Un comentario esencial, aunque un poco misterioso a este nivel, es que con este contenido de materia y asignaciones de cargas todas las interacciones gauge son no anomalas
–lo que es un requisito indispensable–. Ademas, entre las simetrias globales, resulta que
hay unas anomalas y otras no anomalas. Aunque no lo vamos a discutir mas en detalle,
remarcablemente estas anomalias son tales que el proton es exactamente estable en el SM.
Notese que no hemos puesto una masa. La razon es que sencillamente no es posible,
ya que, siendo una teoria quiral, no podemos escribir un termino de masa. Por otra parte,
aun podemos escribir un termino marginal compatible con todas las simetrias
Z
yuk
S
=
−λ1 L̄ φ R + h.c
(379)
Como el Higgs es fundamental de SU (2)L y L̄ es antifundamental, L̄ φ contiene un singlete,
que multiplicado por R, que tambien es singlete, da un termino invariante gauge.
Este termino es un termino de interaccion. Es un vertice de Yukawa con 2 fermiones y
el Higgs. Al tomar este el VEV
Z
λ1 v
yuk
(380)
S
=
− √ ēL eR + h.c
2
y obtenemos un termino de masa efectivo para el electron. La masa del electron es asi pues
λ1 v
me = √
(381)
2
Es decir, es el VEV del Higgs multiplicado por el Yukawa que regula el acoplo de electron a
Higgs. Desde este punto de vista, la jerarquia de masas del SM es en realidad una jerarquia
de acoplos de Yukawa.
Evidentemente, expandiendo los Yukawas encontraremos acoplos al Higgs.
Notese que el neutrino nos sale de masa 0. En realidad tiene una masa muy pequegna
–las oscilaciones de neutrinos asi lo exigen–, pero no esta completamente claro si es debido
85
a la existencia de νR o a la llamada masa de Majorana.19
Asi pues, el trozo leptonico del SM es
S
lepton
=
8.5.2
Z
L̄i i γ µ (∂µ +i g Wµ +i
g0
g0
Y Bµ ) Li +R̄i i γ µ (∂µ +i g Wµ +i Y Bµ ) Ri −λi Li φ Ri +h.c.
2
2
(382)
Violacion de CP y CKM
Cuando introdujimos los Yukawas asumimos que eran diagonales en las generaciones. En
general podriamos haber escrito
Z
−λij L̄i φ eiR + h.c.
(383)
Donde eiR es el “electron” right de cada generacion (es decir {eR , µR , τR }). Sin embargo,
podriamos redefinir
eiR = Wij ejR
Li → Uij Lj
(384)
tal que
? ij
Uik
λ Wjp = λk δkp
(385)
Como esta transformacion conmuta con SU (2)L × U (1)Y , encontrariamos la teoria que
hemos escrito desde el principio.
Sin embargo, en el sector de quarks la cosa es muy diferente, porque existen tanto dR
como uR . Por lo tanto los Yukawas mas generales son
Z
ij
i
a b
i
−λij
(386)
u Q̄i φ uR − λd Q̄i φ ab dR + h.c.
siendo a, b los indices de SU (2)L . Notese que el efecto del segundo termino, una vez
enchufado aqui quien es el VEV de φ, es darle masa al d. Como no hay neutrino right,
escribir este segundo termino para los leptones no lleva a nada nuevo.
Intentemos ahora redefinir los campos para diagonalizar los Yukawas. Para ello es
mejor meter el VEV del Higgs aca y estudiar los terminos efectivos de masa, que son
(esquematicamente)
Z
j
ij ¯i i
i
(387)
−λij
u ūL uR − λd dL dR
Esta claro que si hacemos el mismo truco que antes
19
Como el neutrino es electricamente neutro podria ser su propia antipartcula. En tal caso es posible
escribir un termino de masa. No esta claro que el neutrino sea Majorana.
86
uiL → Uuij ujL
uiR Wuij ujR
diL → Udij djL
diR Wdij djR
(388)
(389)
(390)
conseguiremos diagonalizar los Yukawas escogiendo apropiadamente las matrices. Pero,
como en general Ud 6= Uu , esta transformacion no transformara igual las dos componentes
del doblete de SU (2)L . Como la interaccion que mezcla las dos componentes del doblete
es a traves de los W ± , lo que ocurrira es que para los quarks la derivada covariante sera
g
g
σ 3 −Y Zµ0 +i δ ij
σ 3 +Y Aµ
2 cos θW
2 cos θW
(391)
ij
†
donde esos V son las entradas de la matriz Uu Ud , y son en general numeros complejos.
Esta matriz es la matriz de Cabbibo-Kobayashi-Maskawa (CKM).
El que la matriz CKM sea en general compleja20 tiene una consecuencia dramatica: el
SM viola la simetria CP si CKM tiene entradas complejas. Resulta que si las tiene y el
SM viola CP –aunque, como todos los parametros del SM, no se entiende por que–.
En el SM hay otra fuente de violacion de CP: si agandimos el termino topologico para
el campo del gluon
Z
θ
Tr Gµν Gαβ µναβ
(392)
2
16π
introducimos nueva fuente de ruptura explicita de CP. No discutiremos aqui mas sobre
esto, solo mencionar que θ resulta ser minusculo, casi cero pero no del todo. El por que de
esto tampoco se entiende.
Dµij = δ ij ∂µ +i g V ij Wµ+ σ + +i g (V † )ij Wµ− σ − +i δ ij
8.5.3
Neutrinos
Los neutrinos formar parte del doblete de SU (2)L junto con el correspondiente lepton cargado de cada familia –eletron, muon y tau–. Asi pues han de ser de 3 tipos: νe , νµ , ντ .
Como los neutrinos interactuan solo a traves de las corrientes cargadas/neutras, y su constante de acoplo es muy pequegna, sus interacciones son muy raras. Es por eso que para
estudiarlos se deben usar fuentes que emiten muchos neutrinos, como el sol. Sin embargo,
entre 1960 y 2002 esto fue fuente de un gran misterio: la cantidad de neutrinos del electron
esperada era simplemente diferente –mucho menor– que la esperada.
La resolucion de dicho puzzle –propuesta ya por Pontecorvo et al. en 1968– es que si
los neutrinos tuviesen masa, y esta fuese muy peqeugna, podrian oscilar unos en otros. La
20
Eso requiere al menos 3 familias de quarks, ya que de lo contrario la fase compleja se puede reabsorver.
De hecho Cabbibo fue el primero en darse cuenta de esta mezcla en los quarks, lo que ocurrio cuando solo
se conocian dos quarks. Eso lleva a una matriz real. Sin emabargo mas tarde se descubrio que el SM viola
CP y en un intento de explicarlo, Kobayashi y Maskawa propusieron la existencia de una nueva familia,
de manera que la matriz V pudiese tener entradas complejas. Cabbibo se perdio el premio Nobel.
87
razon es que si los neutrinos tuviesen masa entonces habria tambien una matriz tipo CKM
–llamada ahora Pontecorvo-Maki-Nakawata-Sakata, PMNS– que haria que la interaccion
del neutrino fuese tambien del tipo
Z
ēiL W + U ij νLj
(393)
Es decir, la interaccion debil no seria diagonal en la base νLi = {νe , νµ , ντ }. Llamemos a
esta base que diagonaliza el termino cinetico –el ∂/– como νP , es decir νPi = {νe , νµ , ντ };
y a la base que diagonalizaria la interaccion νIi = {νeI , νµI , ντI }. Supongamos un neutrino
producido –por ejemplo en el sol– en t0 a traves de algun proceso electrodebil. Como la
base νI diagonaliza la interaccion, se produce como νI . La matriz de PMNS permite reescribir dicho estado en terminos de los autoestados del hamiltoniano libre, de manera que
el estado de un neutrino en t0 se escribe como
|νIi (t0 )i = U ij |νPj (t0 )i
(394)
El operador evolucion para la particula libre –el neutrino casi no interactua!– nos permite
conocer el estado en un instante t –escojamos t0 = 0 por sencillez de la notacion–
|νIi (t)i = U ij e−i Ĥ t |νPj (t0 )i
(395)
|νIi (t)i = U ij e−i Ei t |νPj (t0 )i
(396)
Como los |νPi i diagonalizan
el termino cinetico, son autoestados del hamiltoniano libre con
√
autovalor Ei = p~ + mi
Para detectar este neutrino en la tierra lo hacemos midiendo la interaccion a traves de algun
proceso debil con otro lepton, supongamoslo del tipo j. La probabilidad de interaccion sera
pues proporcional al modulo de la proyeccion de |νIi i sobre |νIj i, es decir, a |h νIj | νIi (t)i|2 .
Por hacer mas sencillas las cosas, supongamos que solo dos neutrinos estan involucrados.
Llamemos a la base de propagacion {νe , νµ y a la de interaccion ν1 , ν2 . Entonces podemos
escribir
cos θ − sin θ
U=
(397)
sin θ cos θ
De manera que θ parametriza la mezcla. Entonces
|ν 1 (t)i = e−i Ee t cos θ |νe i − e−i Eµ t sin θ |νµ i
(398)
|ν 2 (t)i = e−i Ee t sin θ |νe i + e−i Eµ t cos θ |νµ i
(399)
Entonces la probabilidad de detectar un neutrino tipo 2 si empezamos con uno tipo 1 es
88
h ν 2 | ν 1 (t)i =
sin θ hνe | + cos θ hνµ | e−i Ee t cos θ |νe i − e−i Eµ t sin θ |νµ i
que, asumiendo νe, µ ortonormales, es
2
1
−i Ee t
−i Eµ t
h ν | ν (t)i = sin θ cos θ e
−e
= sin 2θ sin(Ee − Eµ ) t
(400)
(401)
De entrada, es obvio que si mνe = mνµ el elemento de matriz es cero. Necesitamos de una
diferencia de masas en los neutrinos. Como por otra parte las masas son en cualquier caso
pequegnas, podemos asumir los neutrinos ultrarrelativistas, es decir
Ee − Eµ =
q
p~2
+
m2νe
−
q
p~2
+
m2νµ
= |~p|
s
m2
1 + 2νe −
p~
s
1+
m2νµ p~2
∆m2
∼
2 |~p|
(402)
Con ∆m2 = m2νe − m2νµ , de manera que la probabilidad es
P1→2 = sin2 2θ sin2
∆m2 t
2 |~p|
(403)
Como la particula es ultrarelativista E = |~p| c, de manera que t/|~p| = t c/E, pero t c = L,
la distancia recorrida entre la emision y la deteccion, de manera que
∆m2 L
(404)
P1→2 = sin 2θ sin
2E
Es decir, existe una probabilidad no cero de oscilacion si θ 6= 0 y si m 6= 0, lo que explica
el problema de los neutrinos solares.
Esto parece funcionar muy bien, con la salvedad de que. . . como dijimos, en el SM tal
cual, el el sector leptonico no hay νR . Eso lleva a que no se pueda construir un termino de
masa para el neutrino, con lo que no queda sitio ni para la matriz de mezcla ni para la masa
del neutrino. No esta clara la solucion del puzzle. Una posibilidad es que puede ser que el
neutrino sea una particula de Majorana –que sea su propia antiparticula–. Esto permitiria
escribir un termino de masas. Esto implicaria que ciertos procesos de decaimiento β en los
que se tuviese en el estado final un neutrino de menos deberian obervarse (neutrinoless β
decay). Otra manera natural de implementar esto es es que existiese νR , ν̄L , me manera
que podamos construir un termino de masa (de Dirac y Majorana!)
0 mD
νR
mD (ν̄L νR + ν̄R νL ) + mM ν̄L ν̄R = νL , ν̄L
(405)
mD mM
ν̄R
2
2
Si tomamos la matriz de masa y la diagonalizamos, los autovalores son
p
mM ± 4 m2D + m2M
m± =
2
89
(406)
Si mM >> mD los autovalores son
mD
mD
m− ∼ mM
(407)
mM
es decir, la nuevas componente serian muy pesadas –y por eso no las habriamos visto–
mientras que las viejas componentes tendrian una masa suprimida por mD /mM , es decir,
minuscula. Este mecanismo es el llamado seesaw mechanism: subiendo la masa de un tipo
de neutrinos a una escala muy grande, la masa del otro tipo de neutrinos se hace minuscula.
Esto implicaria la existencia de una nueva escala –mM – de nueva fisica.
En cualquier caso, la resolucion de este puzzle no esta aun clara.
m+ ∼ −
A
El grupo de Lorentz
Dejando de lado gravedad, la relatividad especial establece que culaquier fenomeno ocurre
en el espacio de Lorentz. Dicho espacio es un espacio vectorial de 4 dimensiones con metrica
ds2 = dxµ ηµν dxν
ηµν = diag(1, −1, · · · , −1)
(408)
Las transformaciones que dejan invariante ds2 forman el grupo de Poincare –en realidad
dicho “grupo” contiene el grupo de Lorentz junto con las translacciones–. El postulado
fundamental es que las leyes de la Fisica son covariantes bajo transformaciones del grupo
de Poincare.
El grupo de Poincare contiene translacciones, boosts y rotaciones. En lo que sigue nos
olvidaremos de las translacciones y solo consideraremos boosts y rotaciones, es decir, el
grupo de Lorentz.
A.1
Rotaciones en 3d
La definicion del grupo de Lorentz como aquel que deja invariante el intervalo es muy
reminiscente de algo muy familiar: el grupo de rotaciones. Consideremos un vector ~x en
R3 . La norma –longitud– de dicho vector es
|~x|2 = ~xT · ~x = xi xj δij
(409)
Por definicion, una rotacion es una transformacion xi → Uji xj tal que la norma del vector
se mantiene constante. Esto se parece mucho a la definicion del grupo de Lorentz, solo que
en lugar de usar la metrica de Minkowski usamos la metrica euclidea δ ij . Esta claro que
la matriz M debe satisfacer que
U T U = 1l
⇐⇒
M ∈ SO(3)
(410)
Supongamos una transformacion infinitesimal, es decir U = 1l + M . La matriz M satisface
pues que
90
M T = −M
(411)
ψ → ψ(xi ) + Mji xj ∂i ψ + δψ
(412)
Es decir, M es una matriz antisimetrica. Como M actua en R3 , tiene 3 entradas independientes. Es decir, podemos encontrar 3 matrices M I independientes satisfaciendo ser
antisimetricas en R3 .
Supongamos ahora la accion de una rotacion en mecanica cuantica. Supongamos una
funcion de onda ψ(~x). Bajo una rotacion xi → xi + Mji xj tenemos
Usando la forma de las matrices M escritas como combinaciones de M I ’s, esta claro que
podemos escribir esto como
ψ → ψ(xi ) − α3 [x1 ∂2 − x2 ∂1 ]ψ + α2 [x1 ∂3 − x3 ∂1 ]ψ − α1 [x2 ∂3 − x3 ∂2 ]ψ + δψ
(413)
donde αi son los parametros de la rotacion particular. Introduciendo los generadores de
rotaciones actuando sobre funciones como
Lij = −(xi ∂j − xj ∂i )
(414)
δψ = αi ijk Ljk ψ
(415)
[Lij , Lkl ] = δik Ljl − δil Ljk − δjk Lil + δlj Lik
(416)
tenemos pues que
Los generadores Lij satisfacen que
Este alegra es el algebra de SO(3). Definiendo J i = −2 i ijk Ljk es facil ver que el algebra se
convierte en [J i , J j ] = 2 i ijk J k , es decir, tenemos el isomorfismo de algebras so(3) ∼ su(2).
Ya que las representaciones de SU (2) son sencillas –es el algebra de momento angular
en mecanica cuantica!–, construir representaciones de SO(3) tambien lo es: son las mismas
reps. que las de SU (2)!.
A.2
Rotaciones en 4d
Supongamos ahora el mismo ejercicio en 4d. Evidentemente de vuelta encotraremos que
el generador de rotaciones en 4d satisface que M T = −M . En este caso hay pues 6
generadores. Colocando esos generadores en una matriz Lij –donde ahora i, j = 1, · · · , 6–,
podemos repetir exactamente el mismo calculo de arriba, y encontraremos que el algebra
que los generadores satisfacen ahora es
[Lij , Lkl ] = δik Ljl − δil Ljk − δjk Lil + δlj Lik
91
(417)
Es decir, el mismo algebra que para las rotaciones en 3d solo que en una dimension mas.
Evidentemente esto continua siendo cierto en un numero arbitrario de dimensiones. Por lo
tanto, hemos encontrado el algebra para SO(d) con d arbitrario.
En 3d, usando el simbolo de Levi-Civita ijk encontramos que so(3) ∼ su(2). En 4d
–u otras dimensiones– esto no sera cierto. Para empezar el simbolo de Levi-Civita tendra
d indices! Sin embargo si podemos hacer lo siguiente. Tomemos los generadores Lij con
i, j = 1, 2, 3 y construyamos el vector
J a = −2 i abc Lbc
a, b, c ∈ {1, 2, 3}
(418)
Evidentemente estos J a satsifaran un algebra de SU (2), ya que si eliminamos la entrada
x4 en SO(4) lo que tenemos es el caso conocido de SO(3). Por otra parte, construyamos
el vector
K a = −2 i L4a
(419)
Podemos ahora formar las combinaciones
1 a
(J + K a )
2
Con un poco de paciencia se puede ver que
N−a =
N+a =
[N+a , N+b ] = 2 i abc N+c
1 a
(J − K a )
2
[N−a , N−b ] = 2 i abc N−c
[N+a , N−b ] = 0
(420)
(421)
Es decir, encontramos dos algebras de SU (2) que conmutan. Esto quiere decir que so(4) ∼
su(2) × su(2). Debido a esto, construir representaciones de SO(4) es muy sencillo: simplemente tenemos dos copias del algebra de momento angular, por lo que las representaciones
de SO(4) seran dos copias de representaciones de SU (2).
A.3
El grupo de Lorentz
Estamos ahora preparados para pasar al grupo de Lorentz. Dada la similitud formal con
SO(d), es obvio que el algebra que los generadores satisfaran sera muy parecida a so(d).
La diferencia estriba en que los generadores satisfacen que U T η U = η, lo que contiene
signos − extras con respecto a SO(d). Repitiendo lo mismo que antes, es facil ver que el
algebra es
[Lij , Lkl ] = ηik Ljl − ηil Ljk − ηjk Lil + ηlj Lik
(422)
De vuelta, esto es independiente de la dimension, de manera que encontramos el algebra
de SO(1, d − 1) –el (1, d − 1) hace referencia a que es como un grupo SO pero con una
signatura con d − 1 direcciones con igual signo y una con el opuesto. Evidentemente esto
se puede generalizar de manera obvia y obtener SO(p, q)–.
Repitiendo las mismas manipulacies de antes podemos ahora definir
92
N+a =
1 a
(J + i K a )
2
N−a =
1 a
(J − i K a )
2
(423)
tales que
[N+a , N+b ] = 2 i abc N+c
[N−a , N−b ] = 2 i abc N−c
[N+a , N−b ] = 0
(424)
Por lo tanto, tambien el grupo de Lorenz es basicamente SU (2)L × SU (2)R (se suelen
llamar a los dos SU (2) como left y right respectivamente). Las representaciones se construyen de nuevo como productos de representaciones de SU (2). Ya que tenemos dos SU (2)
denotaremos las representaciones como (·, ·), poniendo en cada factor la correspondiente
representacion de SU (2)L, R .21
• (0, 0): esto es un campo escalar de Lorentz
• ( 12 , 0): esto es un spinor de Weyl left –transforma solo bajo SU (2) left–.
• (0, 21 ): esto es un spinor de Weyl right –transforma solo bajo SU (2) right–.
• ( 21 , 0) ⊕ (0, 21 ): esto es un spinor de Dirac.
• ( 12 , 21 ): esto es una particula vectorial –spin 1–.
Hay sin embargo una diferencia crucial: la i en la definicion de N±a hace que
N+a = (N−a )†
(425)
es decir, ambos SU (2) no son independientes, ya que conjugacion compleja nos lleva de
uno a otro. Notese que las particulas de spin entero son invariantes bajo esto, pero no
asi los spinores: los spinores Weyl left y right se intercambian. Aqui no vamos a elaborar
mucho mas en la teoria de las representaciones del grupo de Lorentz –y su parte discreta,
que aqui no hemos discutido para nada–. Para todo ello, consular la bibliografia.
B
Spinorologia
Recordemos que las matrices γ satisfacen que
{γ µ , γ ν } = 2 η µν
γ5 = i γ1 γ1 γ2 γ3
(426)
Construyendo
i µ ν
[γ , γ ]
4
es facil ver, usando las propiedades de anticonmutacion, que
Σµν =
21
Por ejemplo,
1
2
se refiere a la representacion de spin
93
1
2
de SU (2).
(427)
[Σµν , Σρσ ] = ηµρ Σνσ − ηµσ Σνρ − ηνρ Σµσ + ησν Σµρ
(428)
que es el algebra del grupo de Lorentz que vimos en el apendice anterior. Como Σµν
actua en el mismo espacio donde actuan las γ’s –es decir, sobre spinores de Dirac– esta
claro que sirven de representacion del grupo de Lorentz en dicho espacio. Asi pues, una
transformacion de Lorentz con parametro αµν actua sobre un spinor de Dirac como
µν
ψ → ei αµν Σ ψ
(429)
Hemos visto que para particulas sin masa es natural usar spinores quirales. Podemos
definirlos empezando con un Dirac ψ como
ψL =
1l − γ 5
ψ
2
ψR =
1l + γ 5
ψ
2
(430)
Notese que
[Σµν , γ 5 ] = 0
(431)
Asi pues, la condicion de ser quiral es una condicion evidentemente covariante Lorentz,
ya que la transformacion Lorentz conmuta con el proyector de quiralidad. Esto quiere
decir que lo que es quiral en un sistema de referencia lo es en cualquier otro obtenido
transformando de Lorentz.
Para el campo escalar la condicion de realidad φ = φ? es, por ser escalar, invariante
Lorentz. Para el spinor una condicion analoga no funcionaria, porque Σµν es compleja, y
por lo tanto imponiendo ψ = ψ † en un sistema de Lorentz se transformaria en cualquier
cosa en otro sistema. Para remediar esto fijemonos en la ecuacion de Dirac
(i γ µ ∂µ + m) ψ = 0
(432)
(−i (γ µ )? ∂µ + m) ψ ? = 0
(433)
ψc = C ψ ?
(434)
Tomando su complejo conjugado
Definamos
Con C un cierto operador escogido tal que
Entonces ψC satisface
C −1 (γ µ )? C = −γ µ
(435)
(i γ µ ∂µ + m) ψc = 0
(436)
Notese que si tuviesemos un campo electromagnetico todo seria analogo, salvo por el hecho
de que, al tomar la conjugacion compleja, como el campo electromagnetico aparece con
94
i e γ µ Aµ , la ecuacion que ψc satisface es la misma que la de ψ pero con la carga electrica
opuesta. De ahi que esta operacion implementada por C sea la conjugacion de carga.
Notese que bajo conjugacion compleja
Σµν → (Σµν )? = −C −1 Σµν C
(437)
ψ ? → ψ ? + i αµν C −1 Σµν C ψ ?
(438)
ψc = C ψ ? → C ψ ? + i αµν Σµν C ψ ? = ψc + i αµν Σµν ψc
(439)
Por lo tanto bajo transformacion de Lorentz ψ → ψ + i αµν Σµν ψ tenemos que
Asi pues
Es decir, la condicion de conjugacion de carga es covariante Lorentz. Por lo tanto la
podemos usar para imponer una proyeccion extra sobre los spinores de Dirac, al igual que
la condicion de realidad para campos escalares. Esto define un spinor de Majorana
ψ = C ψ?
(440)
Evidentemente, al igual que el campo escalar real es neutro bajo el electromagnetismo –es
real!!!–, el spinor de Majorana correspondera a un fermion neutro.
B.1
El SM con spinores left
Para γ 5 tenemos tambien que
C (γ 5 )? C = −i C (γ 0 )? (γ 1 )? (γ 2 )? (γ 3 )? C −1 = −γ 5
(441)
Con esto
1l ∓ γ 5 C −1 ± C −1 γ 5
1l ∓ (γ 5 )? ?
1l ± γ 5
ψc = C
C ψ? = C
ψ =C
ψ
2
2
2
2
De manera que si ψ es un spinor left
(442)
1l − γ 5 1l + γ 5
ψc = C
ψ = C ψ ? = ψc
(443)
2
2
es decir, ψc es right, y viceversa. Es decir, el spinor conjugado de carga de un spinor quiral
tiene la quiralidad opuesta.
Podemos usar esto para escribir el SM en terminos de spinores solo left. Tomemos por
sencillez solo una familia leptonica. Tenemos un doblete de SU (2)L left que llamamos LL
y un singlete de SU (2)L right que llamamos eR . Este ultimo lo podemos re-escribir en
terminos de su conjugado de carga –que tendra carga +1– y sera un spinor left. De este
modo queda todo un poquito mas simetrico –y preparado para supersimetria!–
95
C
Simetrias y corrientes conservadas
En muchos casos ocurre que un sistema descrito por una accion admite transformaciones
que dejan la accion invariante. El ejemplo mas sencillo es un escalar real libre sin masa
Z
S = d4 x ∂φ2
(444)
Esta accion es evidentemente invariante bajo φ → φ + a con a un numero real cualquiera.
En general, supongamos una transformacion
δΦi = αij Φj + βi
(445)
En general αij y βi podrian ser incluso funciones de x. Por lo tanto
δ∂µ Φi = ∂µ αij Φj + αij ∂µ Φj + ∂µ βi
(446)
Entonces
δL =
δL
δL
δΦi +
δ∂µ Φi
δΦi
δ∂µ Φi
(447)
queda
δL =
δL
δL
δL
δL
δL
αij Φj +
βi +
∂µ αij Φj +
αij ∂µ Φj +
∂µ βi
δΦi
δΦi
δ∂µ Φi
δ∂µ Φi
δ∂µ Φi
(448)
Integrando por partes y usando las ecuaciones de movimiento
δL
δL
δL = ∂µ
αij Φj +
βi
δ∂µ Φi
δ∂µ Φi
(449)
Supongamos ahora el caso global, es decir, cuando ni αij ni βi dependen de x. Entonces,
la transformacion de la accion es
Z
δL
δL
4
δS = d x αij ∂µ
Φj + βi ∂µ
(450)
δ∂µ Φi
δ∂µ Φi
Pero ya que esta transformacion es una simetria –asi empezamos suponiendo!– δS = 0, con
lo que definiendo las corrientes
jijµ =
δL
Φj
δ∂µ Φi
jSµ =
δL
δ∂µ Φi
(451)
Tenemos que son conservadas –usando las eqs. de movimiento!–, es decir
∂µ jijµ = 0
∂µ jSµ = 0
(452)
Esto suele ir bajo el nombre de Teorema de Noether, ya que fue descubierto por Emmy
Noether.
96
Para ejemplificar esto, tomemos el caso estrella de un escalar complejo con simetria
U (1)
1
1
L = ∂µ φ? ∂ µ φ − m2 φ? φ − λ (φ? φ)2
2
2
iα
Esta teoria es invariante bajo φ → e φ. La version infinitesimal es
(453)
δφ = i α φ
(454)
jµ = φ? ∂µ φ − φ ∂µ φ?
(455)
Por lo tanto la corriente conservada es
D
La particula libre en formalismo de path integral
Consideremos el ejemplo mas sencillo: una particula libre. La accion clasica es
1
m q̇ 2
(456)
2
La ecuacion de movimiento es simplemente q̈ = 0. La solucion, con condiciones iniciales
q(tI ) = qI y q(tF ) = qF es
qF − qI
t + qI
(457)
tF − tI
Escribamos una trayectoria arbitraria como q = qcl + qq , con qq tal que es cero en tI y tF .
La accion es
Z tF
Z tF
Z tF
1
1
2
dt m q̇cl +
dt m q̇cl q̇q +
dt m q̇q2
(458)
2
2
tI
tI
tI
qcl (t) =
Explicitamente
m (qF − qI )2
+
2 (tF − tI )
Z
tF
tI
Z tF
q − q 1
F
I
dt m
q̇q +
dt m q̇q2
tF − tI
2
tI
(459)
El trozo del medio es la integral de una derivada total, asi que
Z
tF
tI
q − q q − q q − q Z tF
F
I
F
I
F
I
dt m
q̇q = m
dt q̇q = m
qq (tF ) − qq (tI ) (460)
tF − tI
tF − tI
tF − tI
tI
Debido a las condiciones de contorno en qq , esto es cero. Por lo tanto la accion clasica para
una trayectoria arbitraria es
Z tF
m (qF − qI )2
1
+
dt m q̇q2
(461)
S=
2 (tF − tI )
2
tI
97
Por lo tanto
hqF | e
−i Ĥ (tF −tI )
|qI i = e
i
2
m (qF −qI )
2 (tF −tI )
Z
Dq ei
R tF
tI
dt
1
2
m q̇q2
(462)
Para hacer la integral demonos cuenta de que, como la condiciones de contorno son qI =
qF = 0, esta integral es
h0|e−i Ĥ (tF −tI ) |0i
(463)
Introduciendo unidades escritas en terminos de |pi, esto es
Z
dp
(2 π)
Z
dp0
h0|pi hp| e−i Ĥ (tF −tI ) |p0 i hp0 |0i =
(2 π)
Haciendo la integral encontramos finalmente
Z
r
Rt
i t F dt 12 m q̇q2
I
Dq e
=
Por lo tanto, todo junto
−i Ĥ (tF −tI )
hqF | e
E
|qI i =
r
Z
dp −i p2 (tF −tI )
e 2m
(2 π)
m
i 2 π (tF − tI )
m
im
e 2
i 2 π (tF − tI )
(qF −qI )2
(tF −tI )
(464)
(465)
(466)
Tiempo euclideo, path integrals y mecanica estadistica
Consideremos ahora una situacion a priori completamente diferente. Supongamos que
queremos estudiar la mecanica estadistica de un sistema a temperatura T = β −1 . Como
todo el mundo sabe, la funcion de particion canonica es
Z = Tr e−β Ĥ
Si |ni es una base del espacio de Hilbert, esto es
X
Z=
hn|, e−β Ĥ |ni
(467)
(468)
n
Supongamos ahora que definimos β = i TE . Entonces
X
Z=
hn|, e−i Ĥ TE |ni
(469)
n
Pero acabamos de ver una manera de escribir elementos de matriz genericos hF | e−i Ĥ TE |Ii
en terminos de path integrals.
98
hF |e
−i Ĥ TE
|Ii =
donde
Z
dqI
−i Ĥ TE
hqF | e
Z
dqF ψF∗ (qF ) hqF | e−i Ĥ TE |qI i ψI (qI )
|qI i =
Z
qF =q(TE )
qI =q(0)
Dq ei
R TE
0
L
(470)
(471)
Como la cantidad relevante en mecanica estadistica es cuando estados inicial y final coinciden, nos interesa en realidad
Z
Z
−i Ĥ TE
hn|e
|ni = dqI
dqF ψn∗ (qF ) hqF | e−i Ĥ TE |qI i ψn (qI )
(472)
donde
−i Ĥ TE
hqF | e
|qI i =
Z
qF =q(TE )
qI =q(0)
Dq ei
R TE
0
L
(473)
Podemos asumir ψn una base ortonormalizada del espacio de Hilbert, de manera que
X
ψn∗ (qF ) ψn (qI ) = δ(qI − qF )
(474)
n
Por lo tanto al final
Z=
Z
q(TE )=q̂
q(0)=q̂
Dq ei
R TE
0
L
(475)
Es decir, hemos encontrado que el path integral que tenemos tras hacer
t → −i tE
(476)
e imponer condiciones de contorno periodicas q(0) = q(TE ), tenemos la mecanica estadistica
del sistema.
El cambio de variables (476) se conoce como rotacion de Wick. Notese que si tenemos
el espacio de Minkowski R1, 3 , la rotacion de Wick lo convierte en el espacio euclideo R4 .
Para nuestra mecanica estadistica no solo estamos haciendo la rotacion de Wick, sino que
ademas estamos suponiendo que el tiempo euclideo (una de las coordenadas en R4 ) tiene
un tamagno finito TE e imponemos condiciones de contorno periodicas. Esto es analogo
a decir que la mecanica estadistica de un sistema es igual al path integral euclideo con el
tiempo euclideo siendo un circulo de tamagno TE = β.
Este descubrimiendo es absolutamente sorprendente e increiblemente profundo. De
alguna manera, es como decir que la mecanica cuantica es una mecanica estadistica en
tiempo complejo (aunque esto son simplemente palabras!).
99
F
Simetrias
La idea de simetria es central en fisica. Una simetria cuya aparicion es obvia es la simetria
bajo transformaciones de Poincare –es decir, invariancia relativista–. De hecho, el path
integral hace esta simetria completamente evidente, haciendolo por lo tanto el punto de
inicio mas natural para construir una teoria cuantica de campos. Pero en general podemos
tener mas simetrias. Se puede demostrar22 que la unitariedad de la matriz S solo es
compatible con la simetria de Poincare y un grupo de simetria interno que conmute con el
grupo de Poincare. Estas simetrias internas pueden ser locales o globales.
F.1
Simetrias globales
Supongamos la teoria mas sencilla del mundo: un boson escalar real sin masa. La accion
es
Z
1
(477)
S = d4 x ∂φ2
2
Esta teoria es invariante bajo la transformacion φ → φ + a, con a una constante.
Hay simetrias mas interesantes. Consideremos por ejemplo un escalar complejo
Z
1
1
(478)
S = d4 x |∂φ|2 − m2 |φ|2 − λ |φ|4
2
2
Esta teoria es invariante bajo
φ → ei α φ
(479)
Esta es una rotacion U (1), que es un grupo abeliano. Podemos tambien tener simetrias
no abelianas. Por ejemplo, consideremos un conjunto de N escalares reales con los que
~ T = (φ1 , · · · , φN ). La accion es
formaremos el vector φ
Z
1 ~T
1
~T · φ
~ − λ (φ
~ T · φ)
~ 2
S=
∂ φ · ∂φ − m2 φ
(480)
2
2
Evidentemente esta accion es invariante bajo
~→Mφ
~
φ
(481)
con M una matriz satisfaciendo M T ·M = 1,
l que es la definicion del grupo O(N ). Haciendo
los escalares complejos, el grupo de invariancia seria U (N ).
22
S.Coleman and J.Mandula, All possible symmetries of the S-matrix, Phys.Rev. 159 (1967) 1251-1256
100
F.2
Simetrias locales (gauge)
Las simetrias discutidas arriba son simetrias globales, ya que la transformacion es igual en
todos los puntos del espacio. Sin embargo un principio fundamental es la invariancia de las
leyes fisicas bajo transformaciones locales. Esto sugiere promover las simetrias anteriores
a simetrias locales (tambien llamadas simetrias gauge). Por sencillez, concentremonos en
el campo escalar complejo. Promoviendo la transformacion U (1) a simetria local, tenemos
la transformacion infinitesimal
φ → φ + i α(x) φ
(482)
Es evidente que la accion discutida arriba no es invariante bajo esta transformacion. Sin
embargo si lo es si introducimos un nuevo campo cuya transformacion compense la de del
escalar. Consideremos
Z
1
1
Dµ φ = ∂µ − i Aµ φ
(483)
S = d4 x |Dµ φ|2 − m2 |φ|2 − λ |φ|4
2
2
Esta accion es invariante bajo
φ → φ + i α(x) φ
Aµ → Aµ + ∂µ α
(484)
Esta transformacion se conoce como transformacion gauge. Guiados por el principio de
invariancia gauge hay un termino mas con dimension 4 que podemos agnadir a la accion
S=
Z
d4 x −
1
µν 1
2 1
F
F
+
|D
φ|
− m2 |φ|2 −λ |φ|4
µν
µ
4 e2
2
2
Dµ φ = ∂µ −i Aµ φ
Fµν = ∂µ Aν −∂µ Aν
(485)
Esto es una version con escalares del electromagnetismo (por eso a veces se le llama scalar
QED).
Las simetrias locales –gauge– son intrinsecamente diferentes de las simetrias globales.
Mientras que las primeras clasifican el espectro de una teoria, las segundas eliminan estados.
Esto es porque una cantidad no invariante gauge se puede poner al numero que queramos
–en particular a 0– haciendo transformaciones locales. Asi pues, las simetrias gauge en
realidad reflejan redundancias en la descripcion del sistema, y por eso sirven para eliminar
dichas redundancias. Es por eso que todas las cantidades con interpretacion fisica –es
decir, lo que se mide– deben ser invariantes gauge.
Volvamos a nuestro ejemplo de arriba. Para describir una particula sin masa de spin 1
–el Aµ de arriba– hemos usado un vector en el espacio de Minkowski. Esto son en principio
8 grados de libertad (4 campos y 4 momentos), aunque el hecho de tener una particula sin
masa lleva a que en realidad tengamos 6 grados de libertad (3 campos y 3 momentos). Sin
embargo argumentos generales sobre las representaciones del grupo de Lorentz dictan que
una particula sin masa de spin 1 debe tener 4 grados de libertad (2 campos y 2 momentos).
La manera de reconciliar estos dos numeros es a traves de la simetria gauge, que permite
eliminar uno de los 3 campos (y su momento) dejando los grados de libertad deseados.
101
Es dificil de sobreestimar la importancia de las interacciones gauge en fisica. No en
vano, el modelo estandard es un ejemplo particular de teoria gauge.
F.3
Ruptura espontanea de simetria
Consideremos de vuelta nuestro modelo con simetria global U (1). Las ecuaciones de
movimiento son
∂ 2 φ + m2 φ + 4 λ |φ|2 φ = 0
(486)
Es evidente que las soluciones de vacio son aquellas en las que ∂φ = 0. Por lo tanto tenemos
que
|φ|2 = −
m2
4λ
o
φ=0
(487)
2
2
> 0 la unica solucion es φ = 0. Sin emabargo si m
< 0 –lo que ocurre
Es evidente que si m
4λ
4λ
2
si m < 0. El signo de λ ha de ser positivo para que a gran φ el potencial sea acotado
por abajo– resulta que la q
solucion con |φ| =
6 0 no solo es valida sino que es de menor
2
energia. Escribiendo φ = − m
eiθ esta claro que cualquier θ soluciona la ecuacion. En
4λ
ese sentido es una direccion plana, ya que esta claro que el potencial es igual para cualquier
θ0 . Podemos escoger pues un θ0 a nuestro antojo y tomar como vacio
r
m2 iθ0
e
φ0 = −
(488)
4λ
A esto se le conoce como ruptura espontanea de la simetria. El modelo original tenia
la simetria global U (1) que vimos. Pero el vacio resulta que no es invariante bajo dicha
simetria (ya que hay que escoger un θ0 ), por lo que el vacio rompe la simetria de manera
espontanea. Esto es en contrasteR a una ruptura explicita, que seria por ejemplo agnadir
a la accion un termino digamos φ4 . Esta claro que agnadiendo a la accion esto, esta de
entrada no es invariante U (1).
Expandamos alrededor del vacio que rompe espontaneamente la simetria haciendo
r
m2
+ ρ) ei(θ0 +p)
(489)
φ0 = ( −
4λ
Para ρ, p pequegnos encontramos
Z
1
φ2
S ∼ d4 x ∂ρ2 − 4 λ φ20 ρ2 + 0 ∂p2
(490)
2
2
es decir, la fluctuacion a lo largo de la direccion plana no tiene masa mientras que la
fluctuacion a lo largo de la direccion no plana si tiene una masa. Este es un fenomeno
universal y exacto: cuando tenemos una simetria espontaneamente rota, por cada direccion
plana original que teniamos que resulta rota por el vacio tenemos una particula escalar con
102
masa exactamente cero. Esto se conoce como teorema de Goldstone y a la particula escalar
sin masa se le llama boson de Goldstonte. Es una “firma” universal de ruptura espontanea
de simetria.
Cuando la ruptura espontanea de la simetria ocurre en una teoria donde la simetria es
local ocurre un fenomeno enormemente interesante: podemos escoger un gauge tal que el
boson de Goldstone esta puesto a cero –en ese sentido esta “comido por el campo gauge”–
al precio de que, ya que hemos fijado el gauge, ahora los 3 grados de libertad del campo
vectorial son fisicos: el campo vectorial se ha vuelto masivo! Este es el celebrado mecanismo
de Higgs.
F.4
Simetrias anomalas
En principio, la cuantizacion de los campos fermionicos es similar a la de los campos
bosonicos: se puede escribir un path integral para la accion de Dirac e integrar sobre los
campos Grassman. Sin embargo, una distincion fundamental aparece cuando hablamos de
simetrias. Debido a la naturaleza fermionica, simetrias clasicas pueden no serlo a nivel
cuantico. Es decir, si bien clasicamente una teoria tiene una corriente conservada j µ , es
decir, tal que ∂µ j µ = 0, a nivel cuantico puede ocurrir que ∂µ j µ 6= 0. A estas simetrias
–que no lo son en realidad– se las llama simetrias anomalas.
Un ejemplo canonico son las simetrias de flavor quirales. Como es bien sabido, en 4d
fermiones sin masa se representan por spinores de Weyl. Estos satisfacen que γ 5 ψ = ±ψ,
siendo los que tienen autovalor + fermiones left y los que tienen autovalor − fermiones
right. Podemos en principio escribir una teoria con solo fermiones left. De hecho, si tenemos
mas de un fermion left, digamos Nf de ellos, podemos escribir dicha teoria con simetria
U (Nf ). Como la simetria solo afecta a spinores de una quiralidad se llama simetria quiral.
Resulta que esta simetria, a nivel cuantico, es anomala. Esto tiene una importancia capital
en QCD, ya que en particular permite decaimientos de otro modo prohibidos (en particular
π 0 en 2 γ).
G
Reglas de Feynman para el SM con una generacion
Listado de las reglas de Feynman para el SM con una sola generacion, tomado de
http://www.stfc.ac.uk/ppd/resources/pdf/standardmodel09.pdf.
103
Feynman Rules in the Unitary Gauge (for one Lepton Generation)
Propagators:
(All propagators carry momentum p.)
µ
µ
µ
W
Z
A
e
ν
H
ν
2
2
−i (gµν − pµ pν /MW
)/(p2 − MW
)
ν
−i (gµν − pµ pν /MZ2 )/(p2 − MZ2 )
ν
−i gµν /p2
i (γ · p + me )/(p2 − m2e )
i γ · p/p2
i/(p2 − m2H )
104
Feynman Rules in the Unitary Gauge (for one Lepton Generation)
Propagators:
(All propagators carry momentum p.)
µ
µ
µ
W
Z
A
e
ν
H
ν
2
2
−i (gµν − pµ pν /MW
)/(p2 − MW
)
ν
−i (gµν − pµ pν /MZ2 )/(p2 − MZ2 )
ν
−i gµν /p2
i (γ · p + me )/(p2 − m2e )
i γ · p/p2
i/(p2 − m2H )
105
Feynman Rules in the Unitary Gauge (for one Lepton Generation)
Propagators:
(All propagators carry momentum p.)
µ
µ
µ
W
Z
A
e
ν
H
ν
2
2
−i (gµν − pµ pν /MW
)/(p2 − MW
)
ν
−i (gµν − pµ pν /MZ2 )/(p2 − MZ2 )
ν
−i gµν /p2
i (γ · p + me )/(p2 − m2e )
i γ · p/p2
i/(p2 − m2H )
106
Feynman Rules in the Unitary Gauge (for one Lepton Generation)
Propagators:
(All propagators carry momentum p.)
µ
µ
µ
W
Z
A
e
ν
H
ν
2
2
−i (gµν − pµ pν /MW
)/(p2 − MW
)
ν
−i (gµν − pµ pν /MZ2 )/(p2 − MZ2 )
ν
−i gµν /p2
i (γ · p + me )/(p2 − m2e )
i γ · p/p2
i/(p2 − m2H )
107
Feynman Rules in the Unitary Gauge (for one Lepton Generation)
Propagators:
(All propagators carry momentum p.)
µ
µ
µ
W
Z
A
e
ν
H
ν
2
2
−i (gµν − pµ pν /MW
)/(p2 − MW
)
ν
−i (gµν − pµ pν /MZ2 )/(p2 − MZ2 )
ν
−i gµν /p2
i (γ · p + me )/(p2 − m2e )
i γ · p/p2
i/(p2 − m2H )
108
Descargar