Fenomenologia de las Interacciones Fundamentales - 2013 High Energy Physics Theory Group Universidad de Oviedo HEP Theory 1 Contents 1 Seccion cero: preliminares 1.1 Fuentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Convenios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 5 6 2 Introduccion 7 3 El lenguage natural de la Naturaleza: Teoria Cuantica de Campos 3.1 Mecanica cuantica en el gran canonico ↔ Teoria Cuantica de Campos . 3.2 Imagen de Schrodinger vs. imagen Heisenberg en mecanica cuantica . . 3.3 Campos en espacio-tiempo . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Causalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Las teorias de campos son teorias efectivas . . . . . . . . . . . . . . . . 4 Elementos basicos de Teoria Cuantica de Campos 4.1 Calculando amplitudes de scattering . . . . . . . . . . . . 4.1.1 La moral del asunto . . . . . . . . . . . . . . . . . 4.2 Path integrals como formalismo natural en Teoria Cuantica 4.2.1 Path integrals en mecanica cuantica . . . . . . . . . 4.2.2 Ordenados temporales y path integral . . . . . . . . 4.3 Fuentes y funciones generatrices . . . . . . . . . . . . . . . 4.4 Path integrals en Teoria Cuantica de Campos . . . . . . . 4.5 Campos libres . . . . . . . . . . . . . . . . . . . . . . . . . 4.6 Propagadores . . . . . . . . . . . . . . . . . . . . . . . . . 4.6.1 Funciones de Green . . . . . . . . . . . . . . . . . . 4.7 Campos en interaccion . . . . . . . . . . . . . . . . . . . . 4.7.1 Interacciones relevantes y el IR . . . . . . . . . . . 4.8 Calculando correladores para campos en interaccion . . . . 4.8.1 λ φ4 hasta O(λ) . . . . . . . . . . . . . . . . . . . . 4.9 La moral del asunto-parte II . . . . . . . . . . . . . . . . . 4.10 Ejemplo: interacciones nucleares . . . . . . . . . . . . . . . 5 Spin 21 5.1 Preludio historico . . . . . . . . 5.2 La ecuacion de Dirac . . . . . . 5.2.1 Soluciones de la ecuacion 5.2.2 Spin 21 . . . . . . . . . . 5.3 Masa cero y quiralidad . . . . . 5.4 El campo de spin 21 cuantizado . 5.4.1 Cuantizacion canonica . . . . . . . . . . . . . de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . de Campos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 9 12 13 14 14 . . . . . . . . . . . . . . . . 15 17 18 18 19 23 24 25 26 28 30 31 33 33 34 37 39 . . . . . . . 40 41 43 44 46 47 48 49 6 Interacciones electromagneticas: QED 6.1 Invariancia gauge . . . . . . . . . . . . . . . . . . . 6.2 Reglas de Feynman . . . . . . . . . . . . . . . . . . 6.2.1 Patas externas . . . . . . . . . . . . . . . . 6.2.2 El vertice de QED y el momento magnetico 6.3 QED en el SM . . . . . . . . . . . . . . . . . . . . . 6.3.1 e+ e− → µ+ µ− . . . . . . . . . . . . . . . . 6.3.2 Crossing y e− µ− → e− µ− . . . . . . . . . . 6.4 El limite de masa 0 y quiralidad . . . . . . . . . . . 6.4.1 Conservacion de helicidad a altas energias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 50 52 53 54 55 55 60 62 63 7 La interaccion fuerte: QCD 7.1 Fotografiando protones: la estructura de los hadrones 7.1.1 Scattering inelastico . . . . . . . . . . . . . . 7.1.2 Gluones . . . . . . . . . . . . . . . . . . . . . 7.2 QCD . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2.1 QCD con varios flavors . . . . . . . . . . . . . 7.2.2 La constante de acoplo de QCD . . . . . . . . 7.2.3 Hadrones y el infrarojo de QCD . . . . . . . . 7.2.4 Simetria quiral en QCD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 64 66 68 68 71 73 75 75 . . . . . . . . 77 77 77 79 80 82 84 86 87 A El grupo de Lorentz A.1 Rotaciones en 3d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Rotaciones en 4d . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.3 El grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 90 91 92 B Spinorologia B.1 El SM con spinores left . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 95 C Simetrias y corrientes conservadas 96 D La particula libre en formalismo de path integral 97 E Tiempo euclideo, path integrals y mecanica estadistica 98 8 La fuerza electrodebil 8.1 Teorias con vertices de 4 fermiones . . . 8.2 Teorias para campos gauge con masa . . 8.3 Ruptura de simetria local . . . . . . . . 8.4 El sector bosonico del SM: gauge+Higgs 8.5 La materia del SM . . . . . . . . . . . . 8.5.1 Interacciones en el SM . . . . . . 8.5.2 Violacion de CP y CKM . . . . . 8.5.3 Neutrinos . . . . . . . . . . . . . 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . F Simetrias F.1 Simetrias globales . . . . . . . . F.2 Simetrias locales (gauge) . . . . F.3 Ruptura espontanea de simetria F.4 Simetrias anomalas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . G Reglas de Feynman para el SM con una generacion 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 100 101 102 103 103 1 Seccion cero: preliminares La teoria cuantica de campos es el pilar fundamental de nuestra descripcion de la Naturaleza. Juega un papel clave en fisica, desde fisica de la materia condensada, mecanica estadistica hasta fisica de altas energias. En particular, es el lenguaje natural en el que formular una descripcion fundamental de la Naturaleza. Ya que la descripcion a nivel mas basico de la Naturaleza ha de ser en terminos de una teoria cuantica de campos, los libros de teoria cuantica de campos son una buenisima fuente de bibliografia. 1.1 Fuentes Hay muchos y muy buenos libros. Una lista parcial (y no ordenada) es • M.Peskin V.Schroeder, An introduction to Quantum Field Theory Es uno de los libros mas utilizados, casi un libro standard. • A.Zee, Quantum Field Theory in a nutshell Es un libro escrito de manera bastante informal, muy facil de leer y con mucha fisica. Muy recomendable. • M.Maggiore, A Modern Introduction to Quantum Field Theory Un libro conciso pero que aun asi contiene los detalles tecnicos relevantes. Escrito ademas con una perspectiva moderna. • M Srednicki, Quantum Field Theory Un libro muy muy completo, con todos los detalles tecnicos explicitos. • T.Banks, Modern Quantum Field Theory Un libro escrito con un enfoque moderno. Aunque quizas un poquito avanzado, su lectura es muy recomendable. • C.Itzykson, B.Zuber, Quantum Field Theory Uno de los clasicos. Aunque escrito en un lenguaje un poco obsoleto hoy en dia, es una fuente fundamental para los desarrollos mas clasicos. • S.Weinberg, The Quantum Theory of Fields Los 3 volumenes de Weinberg lo contienen todo, si bien un poco dificil de leer. • L.Alvarez-Gaume y M.A.Vazquez-Mozo, An invitation to Quantum Field Theory Una introduccion a la teoria cuantica de campos sencilla y concisa sin muchos engorros tecnicos. 5 • A.Altman, B.Simons, Condensed Matter Field Theory Es un libro de fisica de la materia condensada. Su introduccion a la teoria cuantica de campos –especialmente no relativista– es muy util y muy fisica. Tambien se pueden encontrar trocitos en la pagina web de Ben Simons http://www.tcm.phy.cam.ac.uk/~bds10/tp3.html Ademas de estos libros existen muy buenas notas en internet. Son particularmente utiles las notas de David Tong para los Mathematical Tripos de Cambridge. Se pueden encontrar online en http://www.damtp.cam.ac.uk/user/tong/qft/qft.pdf Tambien hay libros mas enfocados a la descripcion de la fenomenologia • F.Halzen and A. Martin, Quarks and Leptons Libro muy sencillo y muy util. • J.Donogue, E.Golowich, B.Holstein, Dynamics of the Standard Model • H.Georgi, Weak interactions and modern particle theory Por ultimo, en la pagina web del Particle Data Group se puede saber todo lo mas intimo sobre las particulas elementales • http://pdg.lbl.gov 1.2 Convenios Vamos a asumir la metrica de Minkowski en signatura mostly minus, es decir ηµν = diag(+, −, −, −). Ademas usaremos unidades tales que ~ = c = 1. Haremos transformadas de Fourier como Z Z dd p i p·x f (p) e f (p) = dd x f (x) e−i p·x (1) f (x) = (2 π)d La δ de Dirac es δ(x) = Z dd p i p·x e (2 π)d 6 (2) 2 Introduccion Todo el mundo sabe que la materia esta hecha de atomos. Los atomos son electricamente neutros: tienen una nube exterior de electrones con carga electromagnetica negativa compensada por la carga positiva del nucleo. Que esto es asi lo sabemos en particular gracias a los experimentos de Rutherford: al bombardear una lamina de metal con particulas α –que son particulas mucho mas masivas que los electrones con carga positiva– la mayoria pasan de largo. Sin emabrgo, de cuando en cuando, las particulas α son rebotadas hacia atras, como si chocasen con algo muy masivo, muy localizado y de carga positiva: el nucleo atomico. El atomo se mantiene unido debido a interacciones electromagneticas (su nombre tecnico es QED, de Quantum ElectroDynamics, Electrodinamica Cuantica). La energia necesaria para quitarle un electron a un atomo –energia de ionizacion– es del ordenden de los 10 eV –13.6 eV para el H–. Eso implica que el tamagno tipico de un atomo son1 unos 10−9 m como estimacion grosera (en realidad es mas bien del orden de 10−10 m). Mientras que el tamagno tipico del atomo es del orden de 10−10 m, el tamagno de un nucleo es del orden de 10−15 m . Sin embargo, el nucleo atomico a su vez esta formado por protones y neutrones. Dada la escala de longitud caracteristica, la energia tipica es del orden de M eV , que es mucho mayor que la energia tipica de ligadura electromagnetica. Esto, unido al hecho de que los nucleones tienen carga positiva o neutra –y todo el mundo sabe que las cargas iguales se repelen electromagneticamente– implica la existencia de una nueva fuerza mucho mas fuerte que la interaccion electromagnetica que mantiene unidos los nucelos: es la interaccion fuerte (su nombre tecnico es QCD, de Quantum ChromoDynamics, Cromodinamica Cuantica). Experimentos con protones demostraron de hecho que estos no son particulas elementales, sino que estan formados por quarks interaccionando a traves de la interaccion fuerte. Si bien los nucleones son neutros bajo esta fuerza, las interacciones residuales son las que mantienen los nucleos unidos. Por otra parte, es conocido desde principios del siglo pasado que los nucleos cambian su naturaleza al cambiar un proton en un neutron emitiendo radiacion β: es la desintegracion nuclear β. La responsable de dicho decaimiento es la interaccion debil. Ademas de estas fuerzas que actuan entre particulas microscopicas, existe la fuerza de gravedad. Sin embargo su intensidad es mucho menor que las otras tres. Por ejemplo, la atraccion gravitatoria entre dos electrones dividida por su repulsion electrostatica es del orden de 10−80 . Asi pues, en presencia de cualquier otra carga la interaccion gravitatoria es despreciable. El origen de esta enorme diferencia de escalas es un misterio. Sin embargo, a escalas astronomicas donde las galaxias, estrellas etc. son neutras, la interaccion gravitatoria es la unica interaccion, y por lo tanto crucial. Las fuerzas electromagnetica, debil y fuerte rigen las interacciones de las particulas que creemos elementales: los leptones y los quarks. Nuestra tarea es estudiar esta estructura 1 Supongamos que queremos probar un atomo con luz a una cierta frecuencia (i.e. energia). Del principio de incertidumbre de Heisenberg ∆p ∆x ∼ ~. Multiplicando por c, y como para una particula sin masa E = p c, tenemos ∆E ∆x ∼ ~ c ∼ 10−7 eV m. Esa energia ha de ser basicamente esos ∼ 10 eV , asi pues podemos despejar de aca ∆x para obtener una idea del tamagno tipico de un atomo. 7 Figure 1: Los ingredientes del SM de particulas y sus interacciones. La teoria que describe esto es el Modelo Estandard (SM). Sus ingredientes estan recogidos en (1). 3 El lenguage natural de la Naturaleza: Teoria Cuantica de Campos Es un hecho que la Naturaleza sigue las leyes de la mecanica cuantica. Esto es: una particula esta descrita por una funcion de onda que vive en un espacio de Hilbert tal que su cuadrado representa la amplitud de probabilidad de encontrarla en un cierto punto. La evolucion temporal del sistema –de la funcion de onda, ya que estamos implicitamente discutiendo la imagen de Schrodinger– la dicta la ecuacion de Schrodinger 8 Ĥ |ψ(t)i = i ∂t |ψ(t)i (3) donde Ĥ es el hamiltoniano del sistema. Ya que la probabilidad total ha de ser 1 en cualquier instante, Ĥ ha de ser un operador hermitico para asegurar la unitariedad. En nuestra discusion, completamente general, debemos especificar que hacer cuando nuestro sistema contiene mas de una particula. Es sabido que esencialmente hay dos tipos de particulas: bosones y fermiones. La diferencia es que la funcion de onda de un sistema de bosones es simetrica bajo el intercambio de las particulas dos a dos, mientras que la funcion de onda de los fermiones es antisimetrica bajo el intercambio de particulas dos a dos. COn esta informacion podemos en principio describir basicamente cualquier sistema. En esta discusion general no hemos asumido ninguna caracteristica en particular de las particulas. Asi, por ejemplo, podriamos pensar que estamos describiendo un gas de electrones en un metal. Estos electrones son basicamente libres, asi que para cada uno Ĥ = P̂ 2 /2 m. La funcion de onda total sera la antisimetrizacion de las funciones de los N electrones en el gas. En la practica sin embargo esto es un engorro, ya que N es un numero enorme. De hecho, de modo efectivo N es infinito. En tal caso esta claro que tratar el sistema como un sistema sin numero fijo de particulas es mas conveniente, es decir, es mas sencillo tratar el sistema en el gran canonico. En este ejemplo el uso del colectivo gran canonico es un poco circunstancial, en tanto que depende del sistema en particular y de que tiene muchas particulas. Sin embargo, hay una situacion en la que el uso del gran canonico nos viene impuesto por la cinematica: un sistema en el que altas energias –velocidades– esten involucradas se describira por leyes relativistas. Como, a grosso modo, E = m c2 el numero de particulas no estara fijo. Asi pues, en los casos en los que tratemos con particulas a muy alta energia la descripcion correcta sera en terminos de mecanica cuantica sin un numero fijo de particulas, ya que estas se pueden crear y destruir –algo de alguna manera implicito en E = m c2 –. Por otra parte, como sabemos que a nivel fundamental la Naturaleza sigue –insistamos en que nos estamos olvidando de la interaccion gravitatoria– las leyes de la Relatividad Especial, resulta que cualquier teoria fundamental que imaginemos debe ser una mecanica cuantica en el gran canonico, es decir, sin numero fijo de particulas. 3.1 Mecanica cuantica en el gran canonico ↔ Teoria Cuantica de Campos En mecanica cuantica un sistema se describe por un estado |ψi que es un vector en un espacio de Hilbert H . En la imagen de Schrodinger dichos vectores dependen del tiempo, asi que |ψi = |ψ(t)i. La evolucion temporal la dicta la ecuacion de Schrodinger Ĥ |ψi = i ∂t |ψi (4) En general el sistema contendra N particulas, asi que en general |ψi es una function de e.g. sus N posiciones {~x1 , · · · , ~xN }. Ademas, si las particulas son identicas, es necesario especificar que ocurre bajo el intercambio de dos particulas: la funcion de onda ha de ser 9 simetrica para bosones y antisimetrica para fermiones. Dejando de lado por un momento las propiedades de simetria de la funcion de onda, en el limite en el que la interaccion entre las particulas es muy pequegna, el espacio de Hilbert total se puede escribir como HN = H1 ⊗ · · · ⊗ HN , es decir, como el producto tensorial de los espacios de Hilbert de cada particula por separado. El estado |ψi se escribe por lo tanto |ψi = |ψ1 i ⊗ · · · ⊗ |ψN i (5) Una notacion mas util es etiquetar cada particula por sus numeros cuanticos: energia, spin. . . . Llamemoslos en general En con n = 1, · · · , N . Es decir, E1 son los numeros cuanticos de la particula 1, E2 los de la particula 2 y asi sucesivamente. En esta notacion el estado es |ψi = |E1 i ⊗ · · · ⊗ |EN i (6) En esta funcion de onda por supuesto puede ocurrir que los numeros cuanticos de la particula n y los de la m sean identicos. De hecho, otra manera de etiquetar el sistema es contando cuantas particulas tienen ciertos numeros cuanticos. Siendo mas concretos, supongamos un sistema donde solo hay un numero cuantico discreto E. Supongamos que los posibles valores de E son 1, 2, 3 · · · . Si hay N particulas en el sistema, habra n1 en el estado E1 con E = 1, n2 en el estado E2 con n = 2 y asi sucesivamente. Escogiendo un orden para los posibles estados, la funcion de onda se escribe simplemente como X |ψi = |n1 , · · · , nN i ni = N (7) Por supuesto, en realidad debemos imponer las pertinentes propiedades de simetria en la funcion de onda, que en esta base –que se llama base de numeros de ocupacion– se traducen en que ni puede ser 0 o 1 para fermiones y cualquier entero positivo para bosones. Estas funciones de onda viven en un espacio que vamos a llamar FN . En muchas situaciones es conveniente no fijar el numero de particulas. Por ejemplo, si estamos tratando electrones en metales estos se comportan como un gas con un numero de particulas enorme, de manera que es conveniente tratarlos como si el numero de electrones no fuese fijo –mas tecnicamente en el gran canonico–. El paso crucial entonces es que para considerar dichos sistemas es conveniente considerar el estado del sistema en el espacio de Fock 2 F = ∞ M FN (8) N =0 Es importante darse cuenta de que en la suma F0 –i.e. no particulas– tambien esta incluido en la suma. Este estado es un poco especial. Se llama vacio y lo denotaremos como |0i. En este espacio es natural construir unos operadores creacion/aniquilacion que nos mueven entre FN y FM : 2 Victor Fock fue el fisico ruso que lo introdujo. 10 aniquilacion âEn : FN → FN −1 creacion Estos operadores actuan como â†En (9) : FN → FN +1 âEn |n1 , · · · , nn , · · · i = âEn |n1 , · · · , nn − 1, · · · i â†En |n1 , · · · , nn , · · · i = â†En |n1 , · · · , nn + 1, · · · i (10) (11) (12) Es decir, âEn toma un estado con N particulas y lo lleva a un estado con N − 1 particulas destruyendo una particula en el estado En (y el converso para â†En . Por supuesto, âEn aniquila el vacio, es decir Estos operadores satisfacen que3 bosones fermiones âEn |0i = 0 (13) [âλ , â†γ ] = (2 π)3 δ(λ − γ) (14) (15) (16) {âλ , â†γ } = (2 π)3 δ(λ − γ) Estas relaciones de conmutacion aseguran que los estados fermionicos tengan 0 o 1 particulas por estado y arbitrarias para estados bosonicos. Supongamos ahora el sistema mas sencillo que podemos imaginar: un conjunto de bosones libres. En este caso los estados estan etiquetados simplemente por el momento p~ de la particula. 4 Las funciones de onda para cada boson son simplemente ondas planas e−i p~·~x (omitamos por sencillez el factor de normalizacion). Como cuando creamos una particula esta viene con la funcion de onda e−i p~·~x es natural considerar la cantidad âp~ ei~p·~x + âp†~ e−i~p·~x . Como el sistema contiene todos los posibles estados, es natural sumar dichas cantidades para todos los estados, construyendo asi el operador (devolvamos ahora todas las normalizaciones correctamente) Z h i d3 p~ † −i~ i~ p·~ x p·~ x p φ̂(~x) = âp~ e + âp~ e ωp~2 = p~2 + m2 (17) 3 (2 π) 2 ωp~ Esta claro –lo veremos explicitamente mas abajo– que si devolvemos este operador a funcion esto simplemente describe un campo clasico, de manera que los modos de Fourier se corresponden con las particulas. 3 El (2 π)3 es debido a como definimos la funcion δ. Si el sistema esta en R3 el momento p~ es continuo, pero mas alla de tecnicalidades, es como si los En se corresponden con los p~. 4 11 La leccion que se aprende aqui es que un sistema de particulas en donde el numero de particulas no esta fijo necesariamente se describe en terminos de campos cuanticos. Alternativamente un campo cuantico describe un sistema cuantico de particulas donde el numero no esta fijo. Notese que esto es completamente general: solo hemos asumido un sistema sin un numero fijo de particulas libres. En particular, la relacion de dispersion ωp~ puede ser cualquiera. En el caso particular en el que estemos interesados en una teoria que describa particulas moviendose a velocidades comparables a la de la luz, ωp~ = p~2 + m2 . Evidentemente este sera el caso si queremos estudiar los constituyentes mas fundamentales. Es evidente ahora por que un sistema relativista cuantico debe describirse por un campo cuantico: la ecuacion de Einstein E = m c2 implica que materia y energia son intercambiables, esto es, una teoria relativista debe permitir crear y destruir particulas (cambiar masa por energia). Por lo tanto es natural que un sistema relativista cuantico se describa por una teoria cuantica de campos. 3.2 Imagen de Schrodinger vs. imagen Heisenberg en mecanica cuantica En la representacion de Schrodinger el estado de un sistema se describe por un vector en un espacio de Hilbert |ψi que depende del tiempo, y cuya evolucion temporal esta governada por la ecuacion de Schrodinger Ĥ |ψi = i ∂t |ψi (18) Evidentemente aca el estado del sistema evoluciona con el tiempo, asi que en realidad |ψi = |ψ(t)i. Sin embargo los operadores –entre ellos el hamiltoniano Ĥ– se asumen independientes del tiempo. Esta es la imagen de Schrodinger. Supongamos un estado en un instante t0 especificado por |ψ(t0 )i. La pregunta es como evoluciona dicho estado en el tiempo. Tal evolucion ha de ser implementada por un operador evolucion Û (t, t0 ), tal que |ψ(t)i = Û (t, t0 ) |ψ(t0 )i (19) Evidentemente la evolucion ha de ser tal que la norma del estado se conserve hψ(t)|ψ(t)i = hψ(t0 )|Û † (t, t0 ) Û (t, t0 ) |ψ(t0 )i = hψ(t0 )|ψ(t0 )i ⇐⇒ Û (t, t0 )† Û (t, t0 ) = 1l (20) Enchufando esto en la ecuacion de Schrodinger Ĥ Û (t, t0 )|ψ(t0 )i = i ∂t Û (t, t0 ) |ψ(t0 )i (21) Por lo tanto el operador evolucion satisface la ecuacion de operadores Ĥ Û (t, t0 ) = i ∂t Û (t, t0 ) 12 (22) Por lo tanto, si conocemos el operador de evolucion a traves de su ecuacion de Schrodinger podemos simplemente considerar nuestros estados a un tiempo fijo dado t0 como independientes del tiempo y pasar toda la evolucion temporal a los operadores. Por ejemplo, si tenemos un operador O (por ejemplo momento angular, o spin o cualquier otro operador), el elemento de matriz en la imagen de Schrodinger se escribe como hψ(t)| Ô |ψ(t)i = hψ(t0 )| Û † (t, t0 ) Ô Û (t, t0 ) |ψ(t0 )i (23) Esto sugiere que si consideramos los estados como independientes del tiempo, los operadores contienen la dependencia temporal. Esto se conoce como imagen de Heisenberg. En vista de (23), un operador en la imagen de Schrodinger OS se escribe como un operador en la imagen de Heisenberg OH como ÔH = Û † (t, t0 ) ÔS Û (t, t0 ) ÔS = Û (t, t0 ) ÔH Û † (t, t0 ) ⇐⇒ (24) Volviendo a la ecuacion que especifica el operador evolucion, esta es una ecuacion diferencial de primer orden, asi que necesita una condicion de contorno. Dicha condicion de contorno es obvia Û (t0 , t0 ) = 1l (25) Por lo tanto la solucion de la ecuacion diferencial es sencilla Û (t, t0 ) = e−i Ĥ (t−t0 ) 3.3 (26) Campos en espacio-tiempo Apliquemos esto a nuestro operador campo. Para ello veamos que ocurre con los operadores creacion/desctruccion al pasarlos a la imagen de Heisenberg. Usando que Û (t, t0 ) = e−i Ĥ t (escojamos coordenadas tal que t0 = 0), estos e convierten en ei Ĥ t âp†~ e−i Ĥ t = ei ωp~ âp†~ ei Ĥ t âp~ e−i Ĥ t = e−i ωp~ âp~ (27) Usando esto, podemos pasarle la dependencia temporal al campo, produciendo el operador campo en la imagen de Heisenberg φ̂(~x, t) = Û † (t, t0 ) φ̂(~x) Û (t, t0 ). Explicitamente Z h i d3 p~ −i p·x † i p·x p âp e + âp e (28) φ̂(~x, t) = (2 π)3 2 ωp~ Donde la contraccion p · x esta hecha con la metrica de Minkowski, es decir, p · x = ωp~ t − p~, que es evidentemente invariante bajo transformaciones de Lorentz. Como todo viene en terminos del 4-vector p = (ωp~ , p~), hemos simplificado la notacion y etiquetando a los operadores creacion/aniquilacion por p. A la vista de la forma del campo en imagen de Heisenberg, dado que ωp~2 = p~2 + m2 , esta claro que satisface la ecuacion de Klein-Gordon (x = (t, ~x)) 13 ∂ 2 + m2 φ̂(x) = 0 ⇐⇒ ∂02 − ∂~ 2 + m2 φ̂(x) = 0 (29) Vemos de nuevo como recuperamos la cuantizacion canonica de un campo escalar que satisface la ecuacion de Klein-Gordon. Dicha ecuacion se deriva de un lagrangiano que es 1 1 ∂µ φ ∂ µ φ − m2 φ2 (30) 2 2 Es importante recalcar que nuestra expresion para el campo es bajo la asuncion de que las particulas no interactuan. Esto es explicito por ejemplo en el que el espacio sobre el que actuan los operadores creaccion/destruccion esta compuesto de productos tensoriales de espacios de Hilbert de una sola particula. Evidentemente en el mundo real las particulas interactuan. Comencemos por suponer que la interaccion es debil. En ese caso, esta aproximacion libre es correcta y podemos incorporar poco a poco la interaccion asumiendola como una perturbacion pequegna. Evidentemente, una vez el efecto de la interaccion esta tenido en cuenta, la expresion para el campo cuantico ya no sera la sencilla expansion en modos que vimos. L= 3.3.1 Causalidad En una teoria relativista debemos preocuparnos de que las segnales no se propaguen mas rapido que la luz. En teoria cuantica de campos esto se manifiesta en que el conmutador de campo en dos puntos diferentes se anula si estos dos puntos no estan uno dentro del cono de luz del otro. Esto es tanto como decir que las perturbaciones solo afectan a otros puntos dentro del cono de luz de uno dado. Aunque aqui no lo vamos a hacer explicito, se puede ver que en efecto esto es asi para el campo escalar. Es importante recalcar que el uso de conmutadores esta intimamente ligado a que el campo es de spin entero –en particular escalar–. Veremos que si el campo es de spin semientero necesitaremos cambiar [] → {}, lo que lleva incorporado el principio de exclusion de Pauli. Esa es la conexion entre spin y estadistica conocida como teorema de spin/estadistica. 3.4 Las teorias de campos son teorias efectivas Hemos particularizado nuestra discusion para campos escalares reales, pero evidentemente la podriamos haber generalizado a campos complejos, fermionicos y campos gauge. Sigamos sin embargo con nuestro ejemplo del campo escalar real. Dicho ejemplo podemos de hecho pensarlo como una situacion fisica de verdad: el π 0 es una particula escalar sin carga electrica que se describe por un campo escalar real. La teoria que hemos analizado describe pues π 0 ’s libres, y en lo que resta vamos a desarrollar la teoria del π 0 y sus interacciones. 5 En el mundo real hay otros dos compagneros cargados π ± , ademas de una torre enorme de otras particulas. Consideremos de momento el subsector que solo contiene π 0 . 5 14 Como es sabido, el π 0 no es fundamental en el sentido de que esta hecho de dos quarks. Sin embargo es obvio que a bajas energias dichos quarks son irrelevantes: el π 0 se ve como una particula fundamental. Es mas, a bajas energias, las interacciones del π 0 son despreciables, con lo que una buena aproximacion es la teoria libre de arriba. Podemos entonces agnadirle interaccion, exactamente tal y como vamos a hacer. Sin embargo la teoria que obtendremos no sera valida a energias arbitrarias. Es obvio que cuando la energia crece, la descripcion correcta no es en terminos de π 0 , sino en terminos de quarks y gluones libres, es decir, la descripcion correcta sera QCD.6 Por lo tanto, debemos pensar en la teoria que describe el π 0 como en una teoria efectiva, valida en un cierto rango de energias. Esta es la imagen moderna de las teorias de campos, basada en los trabajos seminales de Ken Wilson, que situa todas las teorias de campos como teorias efectivas: a cada escala de energia los grados de libertad relevantes seran distintos, y por lo tanto la teoria que describe de modo efectivo la fisica –de ahi el nombre de teoria efectiva– sera diferente. Para entenderlo mejor, consideremos una analogia sugerida por David Gross: consideremos un fluido, por ejemplo el agua del mar. Si uno considera un objeto muy grande –e.g. un barco–, la fisica relevante es la de las olas moviendolo, todo ello descrito por las ecuaciones de Navier-Stokes. Con especificar unos pocos parametros –densidad, numero de Reynolds–. Al ir considerando objetos mas y mas pequegnos –longitud∼ 1/energia– empieza a ser mas relevante especificar mas y mas cosas –si es agua de mar, su tension superficial. . . –. Si seguimos reduciendo el tamagno de la “sonda” de hecho en cierto momento nos encontraremos con que la descripcion en terminos de fluido en si misma es incorrecta. . . para cuando estemos usando un objeto del tamagno de la molecula de agua esta claro que la descripcion en terminos de un continuo gobernado por las ecuaciones de Navier-Stokes no tiene sentido! Esto es exactamente igual al ejemplo analogo del π 0 y QCD. En lo sucesivo deberemos pensar que estamos cosntruyendo una teoria de campos que describe los grados de libertad efectivos relevantes para la descripcion a esa energia. Por ejemplo, nuestro campo escalar real sera un π 0 y asumimos que estamos midiendo a escalas mucho mas pequegnas que ΛQCD . 4 Elementos basicos de Teoria Cuantica de Campos En el mundo real las particulas –y por ende los campos cuanticos que las describen– interaccionan. La manifestacion mas directa de esto es que dos particulas chocan y se desvian cuando se encuentran. Es por esto que uno de los intereses primarios es calcular amplitudes de scattering entre particulas. Supongamos que en un tiempo Ti tenemos un 6 QCD es el acronimo en ingles de CromoDinamica Cuantica (Quantum ChromoDynamics). Es la teoria que describe la fuerza nuclear fuerte. Es como el electromagnetismo pero con mas fotones –que se llaman de hecho gluones–. Los gluones median la interaccion entre quarks. QCD se hace fuertemente acoplada a bajas energias. Por debajo de una energia que se denota como ΛQCD los quarks y los gluones solo existen como estados ligados neutros: π 0 , π ± , proton, neutron. . . 15 cierto numero m de particulas en un cierto estado etiquetado por los momentos ~ki de cada particula (y sus espines etc.). La pregunta es cual es la probablidad de que a un tiempo final Tf el estado contenga n particulas en otro determinado estado etiquetado por los correspondientes p~i . Es decir, debemos calcular h~p1 , · · · , p~n ; Tf |~k1 , · · · , ~km ; Ti i (31) Implicitamente asumimos que Ti → −∞ y Tf → ∞, de manera que en estos estados iniciales y finales las particulas no interactuan –por ejemplo porque todas las particulas acaban sufientemente separadas como para que sus interacciones sean despreciables–. A estos estados que contienen basicamente particulas libres se les llama estados asintoticos. Al estado inicial |~k1 , · · · , ~km ; Ti i con Ti → −∞ se le llama estado in y al final |~p1 , · · · , p~n ; Ti i con Tf → ∞ se le llama estado out. Asi pues, llamando en general al estado in como |ini y al out como |outi moralmente queremos calcular lim ti →−∞, tf →∞ hout| Û (tin , tout ) |ini (32) Donde Û es el correspondiente operador de evolucion. Esto usualmente se denota asumiendo la existencia de un operador unitario Ŝ que implementa esta transicion como hout| Ŝ |ini (33) Al operador Ŝ se le llama matriz S. Normalmente se separa de la matriz S el caso trivial de no interaccion. Es decir, se escribe Ŝ = 1l + i T̂ , donde T̂ mide la probabilidad de transicion entre estados diferentes. Como solemos estar interesados en estados inicial y final diferentes, en realidad normalmente calculamos hout| T̂ |ini En un experimento de verdad se hacen chocar haces de particulas y se observa el resultado. Una manera de comparar dichos resultados de manera independiente del tamagno del haz de particulas, el numero de particulas u otros detalles dependientes del experimento en particular es calculando la seccion eficaz (cross section en ingles). A groso modo, si un haz de particulas con NA particulas choca con un haz de NB particulas en una superficie A, algunas particulas chocaran mientras que otras ni se veran entre si. El numero de scatterings # sera NA NB (34) A donde σ es la cantidad que controla la probablidad intrinseca al tipo de particulas de interaccion (es decir, σ lleva la informacion de como es la interaccion entre las particulas d A y las de B). Esta cantidad intrinseca al tipo de particulas y su dinamica es la seccion eficaz. Otra cantidad con interpretacion fisica muy directa es la probabilidad de desintegracion (decay rate en ingles). Si tenemos NA particulas no estable, que se desintegran en ciertas otras particulas, podemos contar el numero de desintegraciones por unidad de tiempo. #scatterings = σ 16 Dividiendo por el numero de particulas tenemos una medida intrinseca de la probabilidad de desintegracion. Es decir #desintegraciones = Γ NA (35) donde Γ es el decay rate. Aunque no vamos a desarrollar toda la teoria de scattering, la cuestion es que tanto σ como Γ se pueden definir de modo diferencial, es decir, contando decaimientos o scatterings por angulo solido. En realidad en un experimento de verdad nunca hay un estado puro ni se mide un estado puro. Asi pues en realidad lo que tenemos por ejemplo en una colision es que los haces de particulas tienen una distribucion de momentos centrada en un cierto valor. Por el mismo motivo, lo que medimos al final tiene tambien una cierta distribucion de momentos. Es por eso por lo que al escribir las secciones eficaces/probabilidades de desintegracion estas vienen en terminos del elemento de matriz S correspondiente a la transicion entre el estado in y el out correspondientes multiplicado por el numero de estados out que tenemos. Por lo tanto, en ambos casos se puede dar una expresion que esquematicamente es de la forma dσ = |Mi→f | dΦ dΓ = |MA→f | dΦ (36) Donde dΦ es el elemento de volumen en espacio de fases, es decir, la densidad de estados correspondiente, mientras que |Mi→f es el elemento de matriz correspondiente a la transicion. Si bien dΦ es una cantidad puramente cinematica, Mi→f es una cantidad que contiene informacion sobre la teoria en si. Esto es lo que mas nos urge calcular, lo realmente no trivial y lo que se persigue estudiar en cualquier experimento. Esta claro que este elemento de matriz es Mi→f = hout| Ŝ |ini = hout| T̂ |ini = h~p1 , · · · , p~n ; Tf |~k1 , · · · , ~km ; Ti i 4.1 (37) Calculando amplitudes de scattering Resulta que se puede dar una expresion generica para dichas amplitudes de probabilidad.7 . Para ello necesitamos introducir el ordenado temporal de campos h i T φ̂(x) φ̂(y) = θ(x0 − y 0 ) φ̂(x) φ̂(y) + θ(y 0 − x0 ) φ̂(y) φ̂(x) (38) Con esto las amplitudes de probabilidad relevantes se pueden escribir como √ √ m n Y i Z Y i Z hp~ · · · p~n |~k1 · · · ~km iout = 2 2 2 2 in 1 k − m p − m i=1 i j=1 j Z m n Z h i Y Y 4 −i ki ·xi d xi e d4 yj ei pj ·yj hT φ̂(x1 ) · · · φ̂(xm ) φ̂(y1 ) · · · φ̂(yn ) i i=1 7 j=1 Aqui no la vamos a derivar. Las demostraciones se pueden consultar en la bibliografia. 17 (39) A esta expresion, que permite escribir amplitudes de probabilidad de transicion entre estados en terminos de correladores, se le llama formula de reducion de LSZ, en honor a sus descubridores Lehmann, Symanzik y Zimmermann. En esta expresion los campos que entran son los campos de Heisenberg –i.e. en espaciotiempo– “exactos”. Cuando las particulas estan muy separadas, como vimos, tienden a los campos libres que conocemos, pero para una situacion general seran cosas complicadisimas cuya expresion no sabemos. En cualquier caso, la virtud de LSZ es permitir reducir el calculo de scatterings a calcular las funciones h i h T φ̂(x1 ) · · · φ̂(xn ) i (40) Dichas funciones a n puntos se llaman funciones de Green, o correladores –o simplemente funciones a n puntos–. Dichas funciones han de ser calculadas off shell, es decir, sin asumir que los campos φ satisfacen la ecuacion de movimiento libre. Los prefactores de ki2 − m2 y p2i − m2 sin embargo si son explicitamente on-shell –porque ki , pi son momentos de particulas que entran y salen, es decir, particulas fisicas–. Ya que estos factores son 0 –precisamente por ser particulas fisicas satisfacen que e.g. p2i = m2 –, LSZ nos instruye a seleccionar los polos de las funciones a n puntos que cancelen dichos ceros. 4.1.1 La moral del asunto Lo relevante de la discusion de arriba es que en teoria cuantica de campos las cantidades centrales son las funciones de correlacion a n puntos, que son valores de expectacion de ordenados temporales de campos de Heisenberg –i.e. en espacio-tiempo– h i h T φ̂(x1 ) · · · φ̂(xn ) i (41) Conocer estas funciones de manera exacta para cualquier n equivale a resolver la teoria, es decir, a poder calcular cualquier observable de manera exacta. Es por ello que estas cantidades son elementos absolutamente centrales en teoria cuantica de campos. Calcularlos es el objetivo central. 4.2 Path integrals como formalismo natural en Teoria Cuantica de Campos Hasta ahora una fuente comun de engorro es el hecho de que, pese a estar especialmente interesados en teorias invariantes Lorentz, hemos estado usando un formalismo manifiestamente no covariante, basado en el formalismo hamiltoniano donde t juega un papel distinguido. Para “poner remedio” a esto debemos usar el formalismo de la integral de caminos (path integral en ingles) introducido por Feynman. La ventaja agnadida es que los ordenados temporales apareceran de manera natural, de manera que el path integral esta adaptado como un guante a calcular las funciones de correlacion que, como vimos antes, son las cantidades centrales en teoria cuantica de campos. Sin embargo, antes 18 de aplicarlo a la teoria cuantica de campos, veamoslo en el contexto mas familiar de la mecanica cuantica 4.2.1 Path integrals en mecanica cuantica Es natural preguntarse por la propagacion de las particulas en mecanica cuantica. En mecanica clasica una particula se propaga entre qI y qF siguiendo una trayectoria. Eso es una funcion q(t) tal que q(tI ) = qI y q(tF ) = qF . En mecanica cuantica, debido a que posicion y momento no conmutan, este concepto no existe. Esto de hecho es lo que el experimento de la doble rendija pone de manifiesto: una particula no pasa por una rendija o por la otra, sino que la probabilidad de deteccion es la suma de las amplitudes de probabilidad para la particula pasando por cada uno de los dos agujeros. Tratemos de hacer esto explicito. Consideremos la propagacion de una particula libre entre qI y qF en un tiempo T = tF − tI . La amplitud de probabilidad asociada a dicho proceso es hqF | e−i Ĥ T |qI i (42) Donde e−i Ĥ T no es mas que el operador evolucion. Notese que estamos en la representacion de Schrodinger, donde los estados dependen del tiempo (de hecho por ejemplo |qI i = T . Entonces |q(tI )i!). Dividamos ahora el intervalo T en N subintervalos de tamagno δt = N −i Ĥ T −i Ĥ δt −i Ĥ δt e =e ···e . Tras cada δt podemos insertar una identidad escrita como Z dqi |qi i hqi | (43) donde el subindice i significa “tras i intervalos δt”. Explicitamente hqF | e−i Ĥ T |qI i = hqF | e−i Ĥ δt · · · e−i Ĥ δt |qI i (44) Z N −1 Y = dqi hqF | e−i Ĥ δt |qN −1 i hqN −1 | e−i H δt |qN −2 i · · · hq1 | e−i Ĥ δt |qI i i=1 Una vez mas, recordemos que |qi i = q(ti )i. Si llamamos qI = q0 y qF = qN esto es hqF | e −i Ĥ T |qI i = N −1 Y i=0 Z dqi hqi+1 | e−i Ĥ δt |qi i (45) Recordemos que estamos estudiando una particula libre. Como el hamiltoniano es sencil2 lamente 2P̂m , esta claro que es mas sencillo trabajar en espacio de momentos. Insertemos una identidad en espacio de momentos. Para cada ti tenemos Z dpi |pi i hpi | = 1 (46) (2 π) 19 Para ver que esto es correcto, consideremos hqi0 |qi i = δ(qi0 − qi ). Como hpi | qi i = e−i pi qi , eso es Z Z dpi i pi (qi0 −qi ) dpi 0 (47) hqi |pi i hpi |qi i = e = δ(qi0 − qi ) (2 π) (2 π) Es decir, la “asignacion” de (2 π)’s es correcta. Notese ademas que Z Z 0 0 0 hpi |pi i = dqi hpi |qi i hqi |pi i = dqi ei qi (pi −pi ) = (2 π) δ(p0i − pi ) (48) Volviendo ahora a nuestro calculo, insertemos 1 escrito en espacio de momentos de manera que −i Ĥ T hqF | e |qI i = N −1 Y i=0 Z Z dqi dpi+1 (2 π) Z dpi hqi+1 |pi+1 i hpi+1 | e−i Ĥ δt |pi i hpi |qi i (2 π) (49) Usando que hpi | qi i = e−i pi qi , esto es N −1 Y i=0 Z dqi Z dpi+1 (2 π) Z dpi i pi+1 qi+1 e hpi+1 | e−i Ĥ δt |pi i e−i pi qi (2 π) (50) p2 i Por otra parte, como |pi i son autoestados del hamiltoniano e−i Ĥ δt |pi i = e−i 2 m δt |pi i, asi que p2 i hpi+1 | e−i Ĥ δt |pi i = (2 π) e−i 2 m δt δ(pi+1 − pi ) (51) Asi que en nuestro calculo N −1 Y i=0 Z dqi Z Z dpi+1 (2 π) p2 dpi i pi+1 qi+1 −i pi qi i e e (2 π) e−i 2 m δt δ(pi+1 − pi ) (2 π) (52) Integrando en dpi+1 queda N −1 Y i=0 Esto es N −1 Y i=0 Z Z dqi Z dqi Z dpi i pi qi+1 −i pi qi −i p2i δt e e e 2m (2 π) dpi −i e (2 π) Podemos completar el cuadrado hasta tener 20 p2 i +p (qi+1 −qi ) i 2m δt δt (53) (54) N −1 Y i=0 Z dqi hZ dpi −i e (2 π) √m (qi+1 −qi ) 2 δt p √ i + 2m 2 i δt e m 2 i (qi+1 −qi ) δt 2 δt (55) La integral en dpi es facil de hacer. Como pi corre en (−∞, ∞), podemos absorver el termino lineal. Por lo tanto Z dpi −i e (2 π) √m (qi+1 −qi ) 2 δt p √ i + 2m 2 δt Z = La integral Gaussiana es facil de hacer Z ∞ dpi −i p2i δt e 2m = (2 π) 2 dx e−x = √ r 2mi 1 − δt (2 π) Z ∞ dx e−x 2 (56) −∞ π (57) −∞ Asi que todo junto Z dpi −i e (2 π) √m (qi+1 −qi ) 2 δt p √ i + 2m 2 δt r = −im 2 π δt (58) Por lo que, metiendo esto en nuestro calculo, tenemos que hqF | e−i Ĥ T |qI i = Esto lo podemos re-escribir como −i Ĥ T hqF | e |qI i = −1 Z − i m N2 NY 2 π δt i i=0 −1 Z − i m N2 NY 2 π δt = dqi e m 2 dqi i=0 −1 Z − i m N2 NY 2 π δt Y i dqi e i=0 (qi+1 −qi ) δt i e m 2 PN −1 i=0 2 δt (qi+1 −qi ) δt m 2 2 (qi+1 −qi ) δt (59) δt 2 δt (60) Tomemos ahora el limite de N → ∞. En tal caso δt → 0. De hecho (qi+1 − qi ) → q̇ δt δt i=0 Definiendo el simbolo Z Dq = lim N →∞ N −1 X → Z 21 i=0 dt (61) ti −1 Z − i m N2 NY 2 π δt tf dqi (62) Notese que aqui se asume que q0 = qI y qN = qF . Puesto todo junto, resulta al final que Z R tF 1 2 −i Ĥ (tF −tI ) hqF | e |qI i = Dq ei tI dt 2 m q̇ (63) Si hubiesemos hecho el mismo razonamiento para una particula en interaccion hubiesemos obtenido8 Z R tF 1 2 −i Ĥ (tF −tI ) hqF | e |qI i = Dq ei tI dt 2 m q̇ − V (64) Ahora bien, la cantidad 12 m q̇ 2 − V no es mas que el lagrangiano clasico de la particula, con lo que la formula en general se escribe como Z −i Ĥ (tF −tI ) hqF | e |qI i = Dq ei S (65) Notese que en el exponente del integrando ha aparecido la accion clasica de la particula. Por R otra parte, al obtener esta formula, y oculto en Dq esta el hecho de que estamos sumando a todos las posibles trayectorias. Puesto todo junto, hemos obtenido una expresion para la propagacion de la particula que es la suma de todas las posibles trayectorias clasicas pesadas con su correspondiente accion.9 Supongamos ahora que estamos interesados en la probabilidad de evolucion de un estado inicial |Ii en uno final |F i entre tI y tF . Esto esta dado por hF |e−i Ĥ (tF −tI ) |Ii. Insertando identidades escritas en terminos de autoestados en espacio de posiciones Z Z −i Ĥ (tF −tI ) hF |e |Ii = dqI dqF hF |qF i hqF | e−i Ĥ (tF −tI ) |qI i hqI |Ii (66) Pero hqI |Ii y hqF |F i no son mas que las funciones de onda asociadas a los estados incial y final en espacio de posciones. Por lo tanto Z Z −i Ĥ (tF −tI ) hF |e |Ii = dqI dqF ψF∗ (qF ) hqF | e−i Ĥ (tF −tI ) |qI i ψI (qI ) (67) Es decir, podemos escribir la evolucion de un estado en terminos del path integral hqF | e−i Ĥ (tF −tI ) |qI i. Si recuperamos los factores de c y ~ dicho path integral es Z S −i Ĥ (tF −tI ) (68) hqF | e |qI i = Dq ei ~ En el limite ~ → 0 la exponencial oscila infinitamente y esta dominada por los puntos de accion estacionaria. Es decir, en el limite ~ → 0, que es el limite clasico, el path integral 8 Notese que esto es un poco mas sutil, ya que la interaccion es V = V (q, p), con lo que |pi ya no es autoestado del hamiltoniano. Para una discusion del caso general en detalle ver la bibliografia. 9 La explicacion en el capitulo 1 del libro de Zee sobre el path integral y su significado, sobre todo en el contexto del experimento de la doble rendija con infinitas rendijas es muy recomendable! 22 localiza en las configuraciones con δS = 0, es decir, en las configuraciones clasicas. De esta manera el mundo clasico emerge. 4.2.2 Ordenados temporales y path integral Supongamos que queremos calcular la siguiente cantidad Z Dq A[q(t1 )] ei S (69) con q(tI ) = qI y q(tF ) = qF . Aqui A es un funcional de la funcion q(t1 ). Para hacer esto volvamos atras en la definicion de path integral. Recordemos que dividiendo el intervalo tF − tI in subintervalos infinitesimales Z q(tF )=qF iS Dq e q(tI )=qI N −1 Y i=0 Z dqi hqi+1 | e−i Ĥ δt |qi i = hqF | e−i Ĥ T |qI i = (70) donde hemos hecho explicitos los limites de integracion. Esta claro por lo tanto que Z iS Dq A[q(t1 )] e = N −1 Y i=0 |no I Z −i Ĥ δt dqi hqi+1 | e |qi i Z dqI hqI+1 | e−i Ĥ δt A[q(t1 )] |qI i (71) Donde I es el intervalo donde esta t1 . Es decir, A[q(t1 )] aparece en el factor que corresponde al subintervalo donde esta t1 . Ahora bien, hqI+1 | e−i Ĥ δt A[q(t1 )] |qI i es el elemento de matriz del operador de Heisenberg A[q̂(t1 )], es decir, hqF | e−i Ĥ T A[q̂(t1 )] |qI i Supongamos ahora Z Dq A[q(t1 )] B[q(t2 )] ei S (72) Por las mismas, esto es Z Dq A[q(t1 )] B[q(t2 )] ei S = N −1 Y i=0 |no I1 , I2 Z dqi hqi+1 | e −i Ĥ δt (73) |qi i Z dqI1 hqI1 +1 | e −i Ĥ δt A[q(t1 )] |qI1 i Z dqI2 hqI2 +1 | e−i Ĥ δt B[q(t2 )] |qI2 i Donde I1 es el intervalo que contiene t1 e I2 el que contiene t2 . Supongamos que t2 < t1 . Entonces al pasar a operadores esto es hqF | e−i Ĥ T A[q̂(t1 )] B[q̂(t2 )] |qI i ya que primero actua el operador que esta antes al subdividir el intervalo. 23 (74) Si por el contrario embargo, si t1 < t2 , como en el path integral A[q(t1 )] y B[q(t2 )] son funciones (numeros!10 ), podemos escribir Z Z iS Dq A[q(t1 )] B[q(t2 )] e = Dq B[q(t2 )] A[q(t1 )] ei S (76) y por el mismo motivo que antes, esto es hqF | e−i Ĥ T B[q̂(t2 )] A[q̂(t1 )] |qI i (77) Por lo tanto, si t1 > t2 el path integral calcula A[q̂(t1 )] B[q̂(t2 )], y si t2 > t1 calcula B[q̂(t2 )] A[q̂(t1 )] Esto es, de manera automatica el path integral implementa de manera natural los ordenados temporales!!! Es decir Z h i Dq A[q(t1 )] B[q(t2 )] ei S = hqF | e−i Ĥ T T A[q̂(t1 )] B[q̂(t2 )] |qI i (78) 4.3 Fuentes y funciones generatrices Volvamos a la ecuacion anterior para el caso mas sencillo, donde A[q(t)] = q Z Dq q(t1 ) ei S = hqF | e−i Ĥ T q̂(t1 ) |qI i (79) Construyamos la siguiente cantidad Z[J] = Si t1 ∈ [tI , tF ] esta claro que δ Z[J] = δJ(t1 ) R R R tF Dq ei S+ tI J(t) q(t) R Dq ei S R tF Dq q(t1 ) ei S+ tI R Dq ei S (80) J(t) q(t) Asi pues, si ahora evaluamos esta derivada funcional en J(t) = 0 tenemos que R Dq q(t1 ) ei S hqF | e−i Ĥ T q̂(t1 ) |qI i δ Z[J] |J=0 = R = δJ(t1 ) Dq ei S hqF | e−i Ĥ T |qI i (81) (82) Es por lo tanto evidente que 10 Notese que si estuviesemos discutiendo fermiones, A[q(t1 )] y B[q(t2 )] serian variables Grassman, y por lo tanto en lugar de conmutar, anticonmutarian. Esta es una manera de argumentar que el ordenado temporal para fermiones debe ser h i T ψ̄(t1 ) ψ(t2 ) = θ(t1 − t2 ) ψ̄(t1 ) ψ(t2 ) − θ(t2 − t1 ) ψ(t2 ) ψ̄(t1 ) (75) 24 n δ Z[J] |J=0 = δJ(t1 ) · · · δJ(tn ) R iS Dq q(t1 ) · · · q(tn ) e R Dq ei S = h i hqF | e−i Ĥ T T q̂(t1 ) · · · q̂(tn ) |qI i hqF | e−i Ĥ T |qI i Es decir, Z[J] lo podemos pensar como funcional generador de las funciones h i hqF | e−i Ĥ T T q̂(t1 ) · · · q̂(tn ) |qI i G(t1 , · · · , tn ) = hqF | e−i Ĥ T |qI i Volvamos a la definicion de Z[J]. En el numerador tenemos Z Z R R i S+ J(t) q(t) Dq e = Dq ei L+i J(t) q(t) (83) (84) (85) Es decir, el numerador es el path integral para una particula con una accion en la que hemos agnadido la interaccion extra i J q. Para entenderlo tomemos el ejemplo sencillo de una particula libre. En tal caso L + Jq = 12 m q̇ 2 + i J q. La ecuacion de movimiento es m q̈ = i J R (86) Es decir, J es una fuente externa. Esto es, al agnadir el termino J q es como haber agnadido una fuente externa J para q. La funcion generatriz Z[J] por lo tanto tiene en cuenta la respuesta del sistema a una fuente externa J. 4.4 Path integrals en Teoria Cuantica de Campos El path integral esta formulado de manera natural en terminos del lagrangiano, que a su vez esta adaptado a mantener explicitas todas las simetrias de una teoria invariante Lorentz. Por otra parte, el path integral incorpora de manera natural ordenados temporales. Esto sugiere que la teoria de campos se formula de manera natural en terminos de path integrals. El path integral para un campo es la generalizacion obvia del path integral en mecanica cuantica.11 −i Ĥ (tF −tI ) hφF | e |φI i = Z φ(tF )=φF φ(tI )=φI Dφ ei R tF tI dt L (87) A la vista de que al agnadir fuentes tenemos un funcional generador para ordenados temporales, y dado que, calculados en el vacio dichos ordenados temporales son los correladores a n puntos centrales en teoria de campos, esta claro que nos interesa tomar el limite tI → −∞, t → ∞ con φI = φF = vacio. En tal caso podemos definir 11 Una manera de argumentar esto es discretizando el campo, de manera que el campo es una coleccion finita de particulas en un cierto potencial. Para cada particula podemos usar la derivacion de path integral conocida. Tomando despues el limite continuo de este sistema recuperamos el path integral para campos. 25 Z[J] = De manera que R R Dφ ei S+ J φ R Dφ ei S h i hT φ̂(x1 ) · · · φ̂(xn ) i = (88) δ n Z[J] |J(x)=0 δJ(x1 ) · · · δJ(xn ) (89) Notese que el denominador en Z[J] es tal que, para la funcion a 0 puntos, que no es mas que la norma del vacio, tenemos h0|0i = 1. Es importante darse cuenta de que esta formula es obvia de generalizar a teorias con un numero arbitrario de campos, a su vez estos de un tipo arbitrario (fermionicos, bosonicos, complejos, reales, spin 1. . . incluso a priori spin 2!). De esta manera al menos en principio, podemos calcular un correlador arbitrario en una teoria arbitraria a traves de una integral. 4.5 Campos libres Fijemonos en el caso mas sencillo del campo escalar real sin interacciones. La accion es Z 1 1 (90) S = d4 x (∂φ)2 − m2 φ2 2 2 Por lo tanto el funcional generador es Z Z R R −1 i d4 x 12 (∂φ)2 − 12 m2 φ2 + d4 x J(x) φ(x) Z[J] = N Dφ e N = Dφ ei S (91) No es para nada obvio que esta integral tenga sentido (converja). Para empezar, es una integral de una funcion oscilatoria. Para darle sentido podemos hacer m2 → m2 − i y R tomar el limite → 0+ . Asi, el exponente adquiere − d4 x φ2 , que hace que la exponencial se atenue en φ → ∞, haciendo que la integral converja. Asi pues hemos de calcular Z[J] = N −1 Z i Dφ e R d4 x 1 2 R (∂φ)2 − 12 (m2 −i ) φ2 + d4 x J(x) φ(x) N = Z Dφ ei S (92) Fijemonos en el exponente. Integrando por partes podemos escribir Z Z Z −i 2 −i 1 1 2 4 d x φ [∂ +(m −i )] φ+ d x J(x) φ(x) = d4 x φ [∂ 2 +(m2 −i )] φ+ J(x) φ(x)+ φ(x) J(x) 2 2 2 2 (93) Transformando de Fourier Z d4 p φ= φ(p) ei p·x (94) (2 π)4 4 Tenemos 26 Z Z Z d4 q i 2 1 1 2 φ(q) [p − (m − i )] φ(p) + J(q) φ(p) + φ(q) J(p) ei (p+q)·x (2 π)4 2 2 2 (95) 4 La integral en d x es una δ, y por lo tanto Z d4 p 1 1 i (96) φ(−p) [p2 − (m2 − i )] φ(p) + J(−p) φ(p) + φ(−p) J(p) 4 (2 π) 2 2 2 4 dx d4 p (2 π)4 Por ahorrar notacion llamemos ∆(p) = 2i [p2 − (m2 − i )]. Evidentemente ∆(−p) = ∆(p). Asi pues Z 1 1 d4 p φ(−p) ∆(p) φ(p) + J(−p) φ(p) + φ(−p) J(p) (97) 4 (2 π) 2 2 Esto se puede escribir como Z h d4 p J(−p) i h J(p) i J(−p) J(p) ∆(p) φ(−p) + φ(p) + − (2 π)4 2 ∆(−p) 2 ∆(p) 4∆ (98) Por lo tanto Z[J] = N −1 Z R Dφ e d4 p (2 π)4 ∆(p) h J(−p) φ(−p)+ 2 ∆(−p) ih J(p) φ(p)+ 2 ∆(p) i e − R d4 p J(−p) J(p) 4∆ (2 π)4 (99) Como la integral en Dφ corre en φ ∈ [−∞, ∞], podemos reabsorver el desplazamiento finito J/2∆, de manera que Z R d4 p J(−p) J(p) R d4 p − ∆(p) φ(−p) φ(p) −1 4 4∆ (2 π) Z[J] = e N (100) Dφ e (2 π)4 Pero N Asi que −1 Z R Dφ e d4 p (2 π)4 i Z[J] = e 2 R ∆(p) φ(−p) φ(p) =1 d4 p J(−p) J(p) (2 π)4 p2 −m2 +i Transformando de Fourier de vuelta a espacio de posiciones h i 1 Z[J] = e 2 R d4 x R d4 y J(x) d4 p i ei p·(x−y) (2 π)4 p2 −m2 +i (101) (102) J(y) (103) La cantidad en el exponente es central en Teoria Cuantica de Campos, conocida como propagador de Feynman DF , asi que 1 Z[J] = e 2 R d4 x R d4 y J(x)DF (x−y) J(y) 27 (104) Por lo tanto tomando la segunda derivada con respecto a las fuentes y poniendolas luego a cero tenemos que h i hT φ̂(x) φ̂(y) i = DF (x − y) (105) Notese que dado que conocemos exactamente Z[J] podemos calcular todas las funciones de correlacion en la teoria libre. 4.6 Propagadores Hemos encontrado que el propagador de Feynman es una cantidad de imporancia central en teoria cuantica de campos, ya que es el correlador mas basico –veremos mas adelante esto hecho explicito–. Para entender el significado de DF , supongamos un campo libre, y escribamoslo como φ̂(x) = φ̂(x)+ + φ̂(x)− (106) Con + φ̂ (x) = Z d3 p~ p âp e−i p·x (2 π)3 2 ωp~ − φ̂ (x) = Recordemos ahora que DF esta definido como Z d3 p~ p â†p ei p·x (2 π)3 2 ωp~ DF (x − y) = θ(x0 − y 0 ) [φ̂+ (x), φ̂− (y)] + θ(y 0 − x0 ) [φ̂+ (y), φ̂− (x)] (107) (108) Explicitamente, usando quien es φ̂± , esto es Z d3 ~q d3 p~ p p θ(x0 − y 0 ) e−i p·x ei q·y [âp~ , â†q~] 3 3 (2 π) 2 ωp~ (2 π) 2 ωq~ Z Z d3 p~ d3 ~q p p + θ(y 0 − x0 ) e−i p·y ei q·x [âp~ , â†q~] 3 3 (2 π) 2 ωp~ (2 π) 2 ωq~ Z (109) Usando las reglas de conmutacion de los operadores creacion/destruccion Z Z d3 p~ d3 ~q p p θ(x0 − y 0 ) e−i p·x ei q·y (2 π)3 δ(~p − ~q) 3 3 (2 π) 2 ωp~ (2 π) 2 ωq~ Z Z 3 3 d p~ d ~q p p θ(y 0 − x0 ) e−i p·y ei q·x (2 π)3 δ(~p − ~q) = + 3 3 (2 π) 2 ωp~ (2 π) 2 ωq~ Z h i 3 d p~ 0 0 −i p·(x−y) 0 0 i p·(x−y) θ(x − y ) e + θ(y − x ) e (110) (2 π)3 2 ωp~ Esta integral se puede re-escribir como una integral 4-dimensional 28 = φ+ (x)φ+ (y) + φ+ (x)φ− (y) + φ− (x)φ+ (y) +φ− (x)φ− (y) = φ+ (x)φ+ (y) + φ− (y)φ+ (x) + φ− (x)φ+ (y) +φ− (x)φ− (y) + [φ+ (x), φ− (y)] = : φ(x)φ(y) : + [φ+ (x), φ− (y)] , (5.73) lons denote normal ordering. Similarly for y 0 > x0 = : φ(x)φ(y) : +[φ+ (y), φ− (x)]. Therefore x)φ(y)} = : φ(x)φ(y) : + D(x − y) , (5.74) D F (x − y) = Z d4 p i ei p·(x−y) (2 π)4 p2 − m2 + i (111) En donde se asume que va a 0+ . Demostremos esto haciendo la integral en dp0 explicita. 0 0 esφ−(llamemos )[φ+ (x), φ− (y)] +El θ(yintegrando − x0 )[φ+ (y), (x)] . (5.75)z = x − y por sencillez de notacion) Z term Z e expectation value of the normal ordered d2 p~ −i p~·~z dp0 1 0 ei p0 z (112) ecause there is always either one annihilation op- 3 e 2 2 2 π) (2 π) p0 − p~ − m + i or a creation operator acting on "0|. Instead(2the d a†p is a c-number, also D(x − Lasointegral eny) pis0 alac-number, podemos hacer p D(x − y)"0|0! = integrando D(x − y). Therefore D(x is m2 − i . 2+ estan en −p~y) pagator, usando el teorema de los residuos. Los polos del Como es pequegno podemos expandir en serie y escribir los polos aproximadamente como 0|T {φ(x)φ(y)}|0! = D(x − y) . (5.76) p− ' −ωp~ + i (113) p+ ' ωp~ − i 0 0 mutators we find 2 2 p 1 " 0 ωp~ =# + p~2 + m2 . 0 Donde −ip(x−y)como 0siempre 0 ip(x−y) θ(x − y )e . + θ(y − x )e 2Ep Notese que los polos estan ligeramente desplazados del eje real: el polo con parte real (5.77) negativa esta ligeramente subido en la parte positiva compleja mientras que el polo con can be computed explicitly, but it is more useful negativa esta un poco mas bajado (ver fig. (2). four-dimensionalparte integral, = ! i d4 p e−ip(x−y) , (2π)4 p2 − m2 + i$ p0 (5.78) ve the equivalence of eqs. (5.77) and (5.78), observe q. (5.78) can be written as ! +∞ 0 0 0 0 dp i e−ip (x −y ) , (5.79) 0 )2 − E 2 + i$ 2π (p −∞ p m2 )1/2 . The integral over p0 can be computed p0 -plane. The i$ factor displaces slightly the poles Fig. 5.1 The position of the poles in Posicion de los polos en el plano complejo p0 . the complex p0 -plane. )). Thus2:the he poles are at ±p0 % Ep (1 − i$/(2Ep2Figure ghtly displaced below the real axis and the pole at La axis, cuestion es in que usar. En particular, queremos un contorno displaced above the real as shown Fig.contorno 5.1. tal que la contribucion del semicirculo en el infinito sea nula. Supongamos z > 0. En tal caso 0 la exponencial ei p0 z decaeria para z0 → ∞ si p0 tuviese una pequegna parte imaginaria positiva. Por lo tanto vemos que para z 0 > 0 debemos cerrar el contorno por arriba, atrapando el polo p− 0 . El residuo en este polo es 0 Resp0 =p−0 h i 1 1 −i ωp~ z0 i p0 z 0 e =− e 2 2 2 p0 − p~ − m + i 2 ωp~ (114) Este es rodeado en sentido contrario a las agujas del reloj, y por lo tanto da una contribucion que es directamente el residuo de arriba, es decir, contribuye −(2 π i) 1 −i ωp~ z0 e θ(z 0 ) 2 ωp~ 29 (115) Por otra parte, cuando z 0 < 0 la exponencial se atenua si p0 tiene una pequegna parte imaginaria negativa. Debemos por lo tanto cerrar el contorno por abajo de manera que rodeamos el polo p+ 0 . En el Resp0 =p+0 h i 1 1 i ωp~ z0 i p0 z 0 e = e 2 2 2 p0 − p~ − m + i 2 ωp~ (116) Como este polo es rodeado en el sentido de las agujas del reloj contribuye como menos lo de arriba, es decir −(2 π i) 1 i ωp~ z0 e θ(−z 0 ) 2 ωp~ (117) Por lo tanto DF (x − y) = Z i 1 −i ωp~ z0 d2 p~ −i p~·~z h 1 i ωp~ z0 0 0 e e e θ(−z ) + θ(z ) (2 π)3 2 ωp~ 2 ωp~ (118) que es la expresion de partida. Asi pues, resumiendo, el propagador de Feynman DF se puede escribir en notacion covariante usando la prescripcion de +i , que nos fuerza a escoger un contorno tal que se recupera la expresion correcta de la funcion a dos puntos. 4.6.1 Funciones de Green Podemos actuar con el operador de Klein-Gordon sobre el propagador de Feynman. Esta claro que en el limite → 0 lo que obtenemos es ∂ 2 + m2 DF = i δ 4 (x) (119) siendo δ 4 (x) la δ de Dirac en espacio de Minkwoski (a veces suprimiremos el superindice) Z d4 p i p· x 4 e (120) δ (x) = (2 π)4 La ecuacion de arriba es familiar: DF es simplemente una funcion de Green para el operador de Klein-Gordon! En general, la ecuacion de Klein-Gordon con fuente δ tiene como solucion 2 ∂ +m 2 4 G = −i δ (x) ⇐⇒ G= Z i d4 p ei p·(x−y) 4 2 (2 π) p − m2 (121) Es trivial que G satisface la ecuacion de Klein-Gordon con fuente δ para cualquier p tal que p2 6= m2 . El problema es que ocurre precisamente en p2 = 0. En tal caso uno debe de dar una prescripcion para rodear los polos. Una posibilidad es la prescripcion +i , que lleva al propagador de Feynman como acabamos de ver. Pero esta claro que uno puede tomar otras prescripciones. Las mas relevantes son 30 • Propagador retardado: escogiendo el contorno cerrado por arriba, solo cuando z 0 > 0 la contribucion del semicirculo se anula. Como este propagador tiene z 0 > 0 se le conoce como propagador retardado DR (x − y). En teoria clasica, si uno conoce la configuracion del campo en un instante de tiempo es este propagador el que la hace avanzar en el tiempo. • Propagador avanzado: escogiendo el contorno cerrado por abajo, solo cuando z 0 < 0 la contribucion del semicirculo se anula. Como este propagador tiene z 0 < 0 se le conoce como propagador avanzado DA (x − y). En la teoria clasica se usara cuando uno conoce la configuracion final y pretende encontrar de donde viene esta atras en el tiempo. Volviendo al propagador de Feynman, vemos que es tal que propaga frecuencias posi0 tivas –es decir, el trozo con e−i ωp~ z – adelante en el tiempo –debido al θ(z 0 )– y frecuencias 0 negativas –el trozo con ei ωp~ z – atras en el tiempo –debido al θ(−z 0 )–. 4.7 Campos en interaccion Hasta ahora hemos asumido que el sistema no contiene interacciones, es decir, hemos cuantizado un sistema clasico con lagrangiano 1 1 ∂µ φ ∂ µ φ − m2 φ2 (122) 2 2 Esta claro que el campo no tiene por que ser libre. En general podemos considerar un lagrangiano clasico compatible con todas las simetrias. En este caso, estamos asumiendo un campo escalar, asi que la unica restriccion es invariancia Lorentz. Por lo tanto, el lagrangiano mas general sera de la forma: L= L= X 1 1 ∂µ φ ∂ µ φ − m2 φ2 − λn φn 2 2 n>2 (123) Es evidente que la ecuacion de movimiento ya no es simplemente la ecuacion de KleinGordon, sino que se convierte en X 2 2 2 ~ n λn φn−1 (124) ∂0 − ∂ + m φ(x) = − n>2 Esta claro que los coeficientes λn controlan las no-linealidades, es decir, las interacciones del campo (en este caso consigo mismo). Volviendo a la accion es Z X 1 1 S = d4 x ∂µ φ ∂ µ φ − m2 φ2 − λn φn (125) 2 2 n>2 31 Asumiendo unidades en las que [~] = [c] = 1, como la accion ha de ser adimensional, si xµ tiene unidades de E −1 , vemos que [φ] = E, de manera que [λn ] = 4 − n (126) Ya que los coeficientes λn son dimensionales, en realidad no tiene mucho sentido decir que controlan la intensidad de las interacciones. Es natural construir constantes de acoplamiento adimensionales gn usando alguna escala de energia tipica E que tenga el problema ; gn = E n−4 λn [gn ] = 0 (127) Manteniendo λn fijo, esta claro que segun n el comportamiento de gn es muy diferente al variar la escala caracteristica E. Esta escala podemos pensarla como la escala a la que estamos observando el sistema, y por lo tanto marca el rango de energias en el que estamos interesados. Como nuestro mundo es un mundo de baja energia, en realidad estamos interesados en estudiar el sistema a bajas E. En otras palabras, estamos interesados en la teoria efectiva a baja energia. Segun n cosas muy diferentes ocurren • n > 4: el exponente de E es positivo, por lo que al ir E a cero gn va a cero. Estos terminos se llaman irrelevantes. • n = 4: en este caso gn = λn y –al menos naifmente– no hay dependencia con E. Estos terminos se llaman marginales. • n < 4: el exponente de E es negativo, y por lo tanto estos gn se hacen mayores y mayores al decrecer E. Estos terminos se llaman relevantes. Esta observacion es crucial. Al final, nuestro modelo sencillo de teoria escalar podria representar el campo del π 0 . En principio parece que uno deberia tener en cuenta las infinitas interacciones del π 0 consigo mismo, lo que parece algo imposible de analizar. Sin embargo, dado que al final el π 0 es observado en un mundo de baja energia, todas las interacciones con n > 4 son basicamente despreciables. Por lo tanto es suficiente con considerar 1 1 ∂µ φ ∂ µ φ − m2 φ2 − λ3 φ3 − λ4 φ4 2 2 De hecho, imponiendo simetria bajo φ → −φ, los unicos terminos relevantes son L= (128) 1 1 ∂µ φ ∂ µ φ − m2 φ2 − λ φ4 (129) 2 2 Este es el modelo sencillo con el que trabajaremos para hacer calculos explicitos de aqui en adelante. Dado que un campo en interaccion se describe clasicamente por una ecuacion mucho mas complicada que la ecuacion de Klein-Gordon, evidentemente la cuantizacion de este sistema ya no dara algo tan sencillo como L= 32 φ̂(~x, t) 4.7.1 Z i h d3 p~ −i p·x † i p·x p e â e + â p p (2 π)3 2 ωp~ (130) Interacciones relevantes y el IR Como vimos, las interacciones irrelevantes no cambian la fisica de bajas energias (infrarojo=IR), ya que en ese regimen son despreciables. Sin embargo las interacciones relevantes son cruciales para entender el IR. Las interacciones marginales pueden, por efectos cuanticos, volverse relevantes y cambiar completamente las propiedades del IR. De hecho esto es lo que ocurre en QCD: la interaccion de QCD –como el electromagnetismo– es marginal en 4d. Sin embargo, a diferencia del electromagnetismo, QCD es una interaccion marginalmente relevante, es decir, se vuelve, por efectos cuanticos, muy fuerte en el IR. Esto es lo que genera el confinamiento de los quarks y gluones en π 0 , π ± , protones, mesones. . . Podemos ahora entender mejor algunos comentarios anteriores: en QCD naifmente tenemos una interaccion marginal que se vuelve relevante, creciendo por lo tanto al bajar la energia. A una cierta escala de energias ΛQCD la interaccion se hace tan fuerte que quarks y gluones ya no existen libres. Por debajo de esa energia, la teoria efectiva es una teoria para π 0 , π ± , protones, mesones . . . Nosotros estamos considerando el subsector de dicha teoria que solo contiene π 0 ! 4.8 Calculando correladores para campos en interaccion La definition de Z[J] nos permite a priori calcular funciones de correlacion en terminos del path integral en general, haya o no interaccion. En principio es posible calcular directamente el path integral (sea analiticamente o numericamente, en la lattice). Sin embargo en la practica, mas alla de simulacion numerica, es generalmente imposible calcular el funcional generador de manera exacta. Por eso debemos recurrir a la teoria de perturbaciones. En nuestro ejemplo de λ φ4 , tenemos que12 Z Z R 1 2 1 2 2 λ 4 i S+ J φ ∂φ − m φ − φ (131) S= Z[J] = D e 2 2 4! λ R 4 Supongamos λ pequegno. Expandiendo el trozo e−i 4! φ tenemos Z Z Z R R iλ i S0 + J φ 4 d x Dφ φ(x)4 ei S+ J φ + · · · (132) Z[J] = Dφ e − 4! donde Z 1 2 1 2 2 (133) S0 = ∂φ − m φ 2 2 Ahora bien, cada insercion de φ(x) la podemos cambiar por una derivada con respecto a J(x). Es decir, esta claro que 12 Asumamos que R ei S = 1. 33 Z R 4 i S+ J φ Dφ φ(x) e = Z Dφ R δ4 i S+ J φ e δJ(x)4 Asi pues, podemos escribir que Z Z Z R R iλ δ4 i S0 + J φ 4 i S+ J φ Z[J] = Dφ e − d x Dφ e + ··· 4! δJ(x)4 con lo que resumando la serie, al menos formalmente, podemos escribir Z R 4 4 R λ −i 4! d x δ 4 δJ(x) Z[J] = e Dφ ei S0 + J φ (134) (135) (136) Pero la integral con la accion libre la sabemos hacer, asi que podemos escribir −i Z[J] = e λ 4! R d4 x δ4 δJ(x)4 1 e2 R d4 x R d4 y J(x)DF (x−y) J(y) (137) Dado este resultado, podemos, al menos en principio, calcular las amplitudes de scattering al orden deseado. 4.8.1 λ φ4 hasta O(λ) En teoria de perturbaciones uno asume λ << 1, de manera que la exponencial de antes se puede expandir. Supongamos que nos contentamos con precision O(λ). Entonces podemos expandir la exponencial y escribir Z R 4 R 4 1 δ4 λ d x d y J(x)DF (x−y) J(y) 2 d4 x ) e (138) ZO(λ) [J] ∼ (1 − i 4! δJ(x)4 Para calcular el scattering de 2 particulas en 2 particulas necesitamos el correlador a 4 puntos, es decir, la 4 derivada de ZO(λ) [J] con respecto a J. Del termino sin λ, a orden 0 el correlador es pues simplemente el correlador a 4 puntos libre, que se puede calcular facilmente usando el resultado para la teoria libre de antes. h i hT φ̂(x1 ) φ̂(x2 ) φ̂(x3 ) φ̂(x4 ) i (139) = DF (x1 − x2 ) DF (x3 − x4 ) + DF (x1 − x3 ) DF (x2 − x4 ) + DF (x1 − x4 ) DF (x2 − x4 ) Ahora bien, esto es el producto de dos propagadores de Feynman, mientras que LSZ pone 4 factores de (p2i −m2 ). Al poner las particulas externas on shell estos dan 4 ceros mientras que los propagadores dan solo dos polos. Por lo tanto la amplitud a orden λ0 es cero. A orden λ debemos calcular Z h i 4 4 −i λ d x hT φ̂(x1 ) φ̂(x2 ) φ̂(x3 ) φ̂(x4 ) φ̂(x) i (140) Al tener 8 campos, esta cantidad sera proporcional a 4 propagadores, con lo que potencialmente algunos terminos podran cancelar los 4 ceros en la formula de LSZ. La cuestion 34 clave es que al expandir el correlador de arriba, de los muchos terminos que saldran, solo unos pocos son tales que se producen los polos deseados, es decir, muchos de los terminos en el teorema de Wick no contribuyen a la amplitud de scattering porque no contienen los polos apropiados. De hecho, los terminos que contribuyen son de la forma Z d4 x DF (x1 − x) DF (x2 − x) DF (x3 − x) DF (x4 − x) (141) Al pasar a espacio de momentos es facil ver que esto produce polos que cancelan los ceros de la formula LSZ, dejando al final simplemente −i λ. Mas explicitamente, debemos pues calcular λ −i 4! Z d4 x 1 δ4 δ4 2 e δJ(x)4 δJ(x1 ) δJ(x2 ) δJ(x3 ) δJ(x4 ) R d4 x R d4 y J(x)DF (x−y) J(y) |J=0 (142) La manera mas sencilla de hacer esto es expandiendo la exponencial 1 R e2 X d4 x R 1 n! 2n d4 y J(x)DF (x−y) J(y) Z dx1 · · · Z dxn = Z (143) dy1 · · · dyn J(x1 ) · · · J(xn ) J(y1 ) · · · J(yn ) DF (x1 − y1 ) · · · DF (xn − yn ) Ya que el termino relevante es una derivada octava, esta claro que, una vez ponemos a 0 las J el unico termino relevante de la serie es n = 4. Tomando aqui derivadas salen un monton de terminos. Pero como sabemos, LSZ nos instruye a buscar aquellos que produzcan polos al poner las particulas externas on shell. Dichos terminos son cosas de la forma −i λ DF (x1 − x) DF (x2 − x) DF (x3 − x) DF (x4 − x) (144) Volvamos por un momento al termino de orden λ0 . Si DF (x − y) es pensado como la propagacion de una particula entre x e y resulta que esto es simplemente los 3 posibles diagramas representando las maneras de unir 3 puntos (ver fig(4)). 1:⌦ ⌦:3 1:⌦ ⌦:3 1:⌦ ⌦:3 2:⌦ ⌦:4 2:⌦ ⌦:4 2:⌦ ⌦:4 Figure 3: Las 3 posibles propagaciones. En el ultimo las lineas se cruzan sin intersecarse. Por otra parte, en esta interpretacion diagramatica, el primer diagrama que contribuye, a orden λ, se corresponde con 35 ⌦:3 1:⌦ ⌦:3 1:⌦ ⌦:3 ⌦:4 2:⌦ ⌦:4 2:⌦ ⌦:4 Figure 4: Primer diagrama contribuyendo a orden λ1 . El punto gordo es la interaccion en x. Notese que, siguiendo con la interpretacion de que el propagador representa la propagacion de una particula, este primer termino que contribuye al scattering se puede entender como un diagrama en el que todos los puntos xi estan conectados a traves del punto de interaccion x. Por otra parte, a orden λ0 , ninguno de los terminos que teniamos conectaba todos los puntos y consecuentemente obvtuvimos cero. Si siguiesemos yendo a ordenes mas altos de nuevo veriamos que solo algunos terminos contribuyen, y de nuevo corresponderian a diagramas en los que todos los puntos estan conectados entre si a traves de interacciones. Es decir, de esta manera aprendemos que solo los diagramas conexos contribuyen a los scatterings. De hecho, el patron que emerge es que las contribuciones a la amplitud de scattering se pueden construir orden a orden con estos dibujos –que se llaman diagramas de Feynman–, donde solo diagramas conexos contribuyen. Las conexiones internas –“puntos gordos”– se corresponden con la interaccion y se conocen como vertices. En el caso de λ φ4 tenemos que por cada vertice 13 hemos de poner un factor −i λ. Estos vertices se unen con propagadores para formar el diagrama completo. Usualmente se trabaja en espacio de momentos, donde todo es mas sencillo. Siendo mas explicitos, en el caso que nos ocupa –λ φ4 – dichas reglas en espacio de momentos son 1. Dibujar un diagrama hecho a partir de lineas que se juntan en vertices con estrictamente 4 segmentos. 2. Asignar un momento pi a cada linea. 3. En cada vertice entran 4 momentos. Imponer conservacion del momento en cada vertice y agnadir un factor −i λ (145) 4. Por cada linea interna agnadir un propagador de Feynman con el momento correspondiente 13 Notese que en realidad hay varias combinaciones de este diagrama, que corresponden a las diferentes maneras de poner los numeros externos etiquetando los puntos. Esta claro que hay 4! dichas maneras. λ Por eso definimos la interaccion con 4! , de manera que la primera contribucion a la amplitud de scattering –vertice a secas– sea simplemente −i λ. 36 DF = p2 i − m2 + i (146) 5. Por cada lazo cerrado (el nombre tecnico es loop) agnadir una integral al momento corriendo en el loop Z d4 p (2 π)4 (147) Antes de seguir, algunos comentarios sobre estas reglas • El hecho de que en (1) tengamos vertices con 4 patas se debe a que estamos considerando una interaccion φ4 . Para una interaccion φn los vertices tendran n patas. • El que el factor del vertice sea simplemente −i λ se debe a que hemos tomado que Hint = 4!λ φ4 . Sin el 4! tendriamos un factor de 24 extra. • En esta prescripcion solo contribuyen diagramas conexos. Los no conexos simplemente dan cero debido a los ceros en LSZ. Por ejemplo, cosas como el primer diagrama en la figura (4) no deben ser incluidas. • En esta prescripcion, esto da directamente el elemento de matriz in h~p1 · · · p~n |~k1 · · · ~km iout . • Hemos basicamente olvidado las patas externas. Las patas externas son los estados in y out. Esto nos permite entender ahora mejor la formula de LSZ: debido a los factores de p2i − m2 , solo los polos del correlador contribuyen. Es decir, debido a los numeradores p2i − m2 , la amplitud debe tambien tener polos (p2i − m2 )−1 al poner on shell particulas externas. Dichos polos no son mas que las patas externas del diagrama. Podriamos haberlas tenido en cuenta, pero en tal caso deberiamos tambien tener en cuenta los factores de p2 − m2 en la formula de LSZ para calcular la amplitud (que evidentemente cancelan los propagadores externos) En resumen, siguiendo estas reglas podemos calcular en principio a un orden arbitrario en λ, ya que cada termino en la expansion de la formula de LSZ se corresponde con un diagrama, para el que tenemos reglas sencillas para proceder. 4.9 La moral del asunto-parte II El mensaje a extraer es que las cantidades centrales en Teoria Cuantica de Campos son las funciones a n puntos. En particular, las amplitudes de scattering –observables fisicos por excelencia– se escriben en terminos de correladores. De modo practico, cada tipo de particula vendra descrito por un campo relativista. Que tipo de campo –aunque hemos trabajado por sencillez con el campo escalar real, podriamos considerar campos vectoriales, spinoriales. . . –. Una accion clasica –que es un escalar de 37 Lorentz con un termino cinetico con dos derivadas– describira la fisica clasica del problema. Metiendo dicho lagrangiano en el path integral podemos cuantizar el sistema a la manera de antes: escribimos el path integral con fuentes como funcional generador, y vemos los terminos de interaccion como derivadas funcionales con respecto a las fuentes. De este modo en principio podemos calcular Z exacto en terminos del caso libre. En la practica esto nos da, igual que para el campo escalar, una manera de proceder iterativamente, asumiendo la constante de acoplo pequegna, a calcular las funciones de correlacion. Esta construccion se puede codificar en las reglas de Feynman. Las amplitudes de scattering las podemos deducir de las reglas de Feynman que vienen de dicho lagrangiano ya que son basicamente las funciones de correlacion conexas. Resumiendo de nuevo, a grosso modo 1. Por cada tipo de particula en el problema habra un campo (con las propiedades bajo transformaciones de Lorentz adecuadas: spinor, vector, escalar. . . ). Un lagrangiano clasico recogera la dinamica de estos campos. 2. El L sera de la forma Lf ree + Lint , donde Lf ree son los terminos cineticos (cuadraticos en derivadas de los campos) y el resto –las interacciones – son Lint . 3. Cada Lf ree para cada campo conduce a un propagador de Feynman para dicho campo. Para el campo escalar real, en espacio de momentos, tenemos una regla de Feynman que asigna a la linea correspondiente a cada campo DF = p2 i − m2 + i (148) Aqui esto no esta on shell, es decir, tal que p2 no es necesariamente m2 . 4. Cada termino en Lint es un polinomio en los campos (e.g. λ φ4 ) que conduce, en las reglas de Feynman, a un vertice que une las lineas de cada tipo de campo en el polinomio. Dicho vertice contribuye –factores combinatorios a parte– −i λ (149) Con estas reglas podemos calcular a cualquier orden en λ cualquier proceso: 1. por cada particula que entra/sale dibujamos una linea externa. 2. las conectamos –diagramas conexos solo, ya que los no conexos dan 0 por los ceros de LSZ– con los vertices de los que disponemos, usando tal vez mas propagadores. Cada vertice contribuye −i λ 3. si queremos calcular a orden λn debemos escribir todos los diagramas que contengan n vertices, calcular su valor usando las reglas de Feynman y sumarlos. Eso sera M. 4. conocido M, una vez tenidos en cuenta los espacios de fases correspondientes –que es solo dependiente de la cinematica–, podemos calcular secciones eficaces. 38 4.10 Ejemplo: interacciones nucleares En QCD –mas adelante lo veremos mas explicito– las excitaciones de mas baja energia (las mas ligeras) son los piones –escalares– y los nucleones –fermiones–. Como el pion es un escalar, introduzcamos un campo escalar π con masa mπ . Como cada nucleon –neutron y proton– es un fermion, introduzcamos dos campos de spin 1/2 –ver siguiente capitulo– que llamaremos ni , tal que n1 sera el proton y n2 el neutron. Como su masa es casi casi igual, supongamos que ambos tienen masa mn . El Lagrangiano mas general posible con interacciones marginales es Z 1 m2 ∂µ π ∂ µ π − π π 2 + n̄i γ µ ∂µ ni − mn n̄i ni − λ n̄i γ5 nj π (150) S= 2 2 En R realidad el prion es un pseudoescalar, por lo que el termino de interaccion deberia ser λ n̄i γ5 ni π. De momento olvidemonos de esta sutileza. Calculemos ahora el proceso ni + ni → nj + nj . Como mn >> mπ , podemos suponer que los nucleones estan en reposo. El diagrama relevante es Ya que conocemos el propagador del escalar (pion) podemos calcular el diagrama, que vale M = (−i λ)2 p2 i 1 = −i λ2 2 2 − mπ + i p − m2π + i (151) Comparando con la regla de oro de Fermi, esto debe ser esencialmente la transformada de Fourier del potencial de interaccion entre nucleones Z d3 p~ e−i p~·(~x1 −~x2 ) V = −λ (152) (2 π)3 p~2 + m2π − i La integral converge sin necesidad del i . Debemos pues calcular Z d3 p~ e−i p~·~z (2 π)3 p~2 + m2π Donde ~x1 − ~x2 = ~z. Para hacer esta integral escribamosla en coordenadas polares Z −i p z cos θ dθ dφ dp 2 e sin θ p (2 π)3 p2 + m2π 39 (153) (154) Donde usamos la notacion |~x| = x. Aqui p ∈ [0, ∞]. Integrando en φ, θ Z dp p2 (2 π)2 p~2 + m2 Z −i p z cos θ dθ e sin θ = −i Z dp ei p z − e−i p z p2 (2 π)2 p2 + m2π pz (155) La integral es i − z Z ∞ 0 p dp (ei p z − e−i p z ) 2 2 (2 π) p + m2π (156) Separemos la integral como Z ∞ Z ∞ dp i dp p p i ipz e + e−i p z − 2 2 2 2 2 z 0 (2 π) p + mπ z 0 (2 π) p + m2π En la segunda integral hagamos p → −p. Tenemos Z ∞ Z −∞ i dp p dp p i ipz e + ei p z − 2 2 2 2 2 z 0 (2 π) p + mπ z 0 (2 π) p + m2π (157) (158) Invirtiendo los limites de integracion en la segunda integral tenemos i − z Z ∞ i dp p ei p z − 2 2 2 (2 π) p + mπ z Z 0 i dp p ei p z = − 2 2 2 (2 π) p + mπ z Z ∞ dp p ei p z 2 2 2 (2 π) p + m 0 −∞ −∞ π (159) La integral a hacer ahora tiene los polos en ±i mπ . Como z > 0, podems cerrar el contorno por arriba, capturando en sentido contrahorario el polo en i mπ . Por lo tanto la integral es (2 π i) Res. Esto es Z ∞ dp i 2 π i e− m z 1 − mπ z i p ipz e = − = e (160) − z −∞ (2 π)2 p2 + m2π z (2 π)2 2 4πz Por lo tanto 1 − mπ z e (161) 4πz Esto se conoce como potencial de Yukawa. Media, de modo efectivo, la interaccion entre particulas atomicas a traves de mesones. De la formula de arriba se desprende que, para cargas iguales, el campo escalar produce una fuerza atractiva, mientras que para cargas diferentes produce una fuerza repulsiva. V = −λ2 5 Spin 1 2 Hasta ahora hemos trabajado con particulas escalares. Por eso nuestros operadores creacion/destruccion eran simplemente {â, ↠}, de manera que al combinarlos en campos lo 40 que obtenemos es un campo escalar. Sin embargo sabemos que hay particulas de spin 1/2 –i.e. fermiones. De hecho, las particulas fundamentales leptones y quarks son fermiones de spin 1/2! 5.1 Preludio historico Es interesante conocer el desarrollo historico de las ideas. Tras el descrubrimiento de la mecanica cuantica, una pregunta evidente era su generalizacion relativista. En mecanica cuantica los postulados fundamentales son la asuncion de que un sistema se describe por una funcion de onda compleja que vive en un espacio de Hilbert cuya evolucion temporal esta descrita por una ecuacion de Schrodinger Ĥ ψ = i ∂t ψ (162) El que aparezca solo la primera derivada temporal esta intimamente ligado con la conservacion de la probabilidad en la interpretacion de Copenhage. Tomemos la particula libre por sencillez –escojamos la masa para simplificar los factores numericos a 1 y asi no liarnos con numeros irrelevantes– −∂~ 2 ψ = i ∂t ψ (163) Si definimos la densidad de probabilidad como ρ = ψ ? ψ, resulta que, usando la eq. de Schrodinger ~ − i ψ ∂ψ ~ ? = ∂~~j ∂t ρ = ∂t ψ ψ ? + ψ ∂t ψ ? = i ∂~ 2 ψ ψ ? − i ψ ∂~ 2 ψ ? = ∂~ iψ ? ∂ψ (164) Donde hemos definido una corriente de probabilidad ~j. Es decir, la ecuacion de Schrodinger asegura una ley de conservacion de la probabilidad. Como las soluciones de la ecuacion de Schrodinger son ondas planas 2 ψ = ei p~ t−i p ~·~ x (165) Esta claro que ρ = 1 –es decir, recuperamos la familiar particula libre completamente localizada en espacio de momentos y deslocalizada en espacio de posiciones. Si quisiesemos estudiar una particula relativista, en principio lo natural seria tomar el hamiltoniano para una particula relativista y cuantizarlo p promoviendo {~x, p~} a operadores. Sin embargo la relacion de dispersion relativista E = p~2 + m2 , debido a la raiz cuadrada, no se deja. La solucion obvia es tomar E 2 = p~2 + m2 , lo que llevaria a una ecuacion de Schrodinger de la forma −∂t2 ψ = (−∂~ 2 + m2 ) ψ (166) Esta es la ecuacion de Klein-Gordon. Como lleva una derivada temporal segunda ahora la ley de conservacion ∂t ρ = ∂~~j exige definir 41 ρ = i ψ ? ∂t ψ − i ψ ∂ t ψ ? ~j = i ψ ? ∂~ ψ − i ψ ∂~ ψ ? (167) ωp2 = p~2 + m2 (168) En notacion covariante, podriamos definir un cuadrivector j µ = (ρ, ~j), tal que la ecuacion de continuidad es simplemente ∂µ j µ = 0. Las soluciones de la eq. de Klein-Gordon son tambien ondas planas de la forma ψ = e±i ωp t±i p~·~x Sin embargo ahora tendriamos que ρ ∼ ±ωp (169) Es decir, nada asegura que tengamos probabilidades positivas. Como esto es un desastre enorme, Dirac, intentado encontrar una teoria con probabilidades positivas trato de buscar un hamiltoniano compatible con la relacion de dispersion relativista a la vez que con primeras derivadas. Propuso ˆ ĤD = α ~ · P~ + β m (170) de manera que la dinamica de la funcion de onda venga dada de nuevo por una ecuacion con derivada primera respecto al tiempo ĤD ψ = i∂t ψ. Para que este hamiltoniano sea consistente con la relatividad especial, debe ocurrir que ˆ Ĥ 2 = P~ 2 + m2 . Eso implica que D {αi , αj } = 2 δij β2 = 1 {αi , β} = 0 (171) Evidentemente esto con numeros no se puede hacer, asi que Dirac se vio obligado a asumir que sus {αi , β} son matrices y que por lo tanto ψ es un “vector” columna en el espacio donde estas matrices actuan. Supongamos por un momento que m = 0. En tal caso las relaciones de arriba se satisfacen para αi = σi , siendo σi las matrices de Pauli. Como estas son 2 × 2, el ψ es un vector columna con dos entradas. La ecuacion de Dirac queda entonces (escojamos la particula moviendose solo en el eje x = x3 por sencillez) i ∂x − i ∂t 0 ψ1 =0 (172) 0 −i ∂x − i ∂t ψ2 Con lo que las soluciones son de la forma i p (−t−x) e ψ= ei p (t−x) (173) Y la densidad de probabilidad, que es ρ = ψ † ψ seria ρ ∼ 1 –es decir, una constante, modulo la normalizacion que no estamos discutiendo–. Esto sin embargo no tiene sentido en una teoria relativista: si ψ es una “funcion de onda”, la particula tendria una probabilidad no 42 nula de presencia en cualquier parte del espacio, en particular fuera del cono de luz. Eso es evidentemente un sinsentido en una teoria relativista. Ademas, actuando con i∂t resulta que tendriamos soluciones de energia negativa y positiva, lo que tampoco tiene ningun sentido. Dirac decidio interpretar las soluciones de energia negativa como un hueco de energia positiva. Es decir, asumio que el espacio estaba lleno de electrones hasta una energia E0 . Las excitaciones de electrones sobre esa energia son las que veriamos en la experiencia. Podemos poner ese E0 –que es analogo a la energia de Fermi en materia condensada– a 0. Excitando un electron del mar de electrones de E < 0 a E > 0 dejamos en el mar un hueco, que se comportaria como estas nuevas soluciones extragnas. Al hacer esto Dirac estaba cambiando de una mecanica cuantica a una teoria cuantica de campos. En lenguaje moderno, la clave es que ψ no es una funcion de onda, sino un campo cuantico que contiene todas las posibles excitaciones con un numero arbitrario de particulas –el mar de Dirac esta ahi contenido!–. Ademas, desde este punto de vista, interpretando ψ no como una funcion de onda, sino como un campo, la causalidad se manifiesta como la propagacion nula de las perturbaciones del campo fuera del cono de luz, es decir, en que el conmutador –en realidad anticonmutador– del campo es cero fuera del cono de luz. La interpretacion moderna es como dijimos antes: para un sistema relativista debemos permitir creacion/destruccion de particulas. El formalismo adecuado es el de la teoria cuantica de campos. Para el caso del electron lo que debemos hacer es intoducir un campo –ahora fermionico dado el spin 21 – y escribir una teoria de campos para sus interacciones. 5.2 La ecuacion de Dirac La leccion es que para el electron debemos usar un campo cuya ecuacion de movimiento es la ecuacion de Dirac ~ + m βψ i ∂t ψ = −i α ~ · ∂ψ (174) Con {αi , αj } = 2 δij β2 = 1 {αi , β} = 0 (175) Multipliquemos por β y definamos γ µ = (β, β α ~ ). Entonces la ecuacion de Dirac queda (i γ µ ∂µ − m) ψ = 0 (176) {γ µ , γ ν } = 2 η µν (177) Usando las propiedades de (β, α ~) Notese que se puede definir una quinta matriz de Dirac γ5 = i γ0 γ1 γ2 γ3 43 (178) tal que anticonmuta con todas las otras matrices {γ µ , γ 5 } = 0. Definiendo ψ̄ = ψ † γ 0 (179) es muy facil ver que ; j µ = i ψ̄ γ µ ψ ∂µ j µ = 0 Una posible solucion para {~ α, β} es la representacion de Dirac-Pauli 0 ~σ 1l 0 α ~= β= ~σ 0 0 − 1l (180) (181) Evidentemente esto implica que nuestro ψ es ahora de 4 componentes. Notese que antes era de dos componentes debido a que al tener m = 0 la matriz β simplemente no esta. Asi pues, para m = 0, la representacion minima es de dos componentes, mientras que para m 6= 0 la representacion minima es de 4 componentes. A estos “vectores” ψ se les llama spinores. 5.2.1 Soluciones de la ecuacion de Dirac El hamiltoniano de Dirac es m ~σ · p~ˆ ~σ · p~ˆ −m ĤD = ! (182) Escribiendo −i E t ψ=e uA uB (183) con uA, B dos spinores de 2 componentes, tenemos, en espacio de momentos ~σ · p~ uA = (E + m) uB ~σ · p~ uB = (E − m) uA (184) Ya que m > 0, es ahora obvio que tenemos dos soluciones en funcion de que E sea mayor o menor que 0: • E > 0: en tal caso E + m 6= 0 y podemos escribir, usando la primera ecuacion, que ~σ · p~ uA E+m Notese que si metemos esto en la segunda ecuacion uB = ~σ · p~ ~σ · p~ uA = (E − m) uA E+m 44 (185) (186) tenemos σi σj pi pj uA = (E 2 − m2 ) uA (187) Usando las propiedades de las matrices de Pauli p~2 uA = (E 2 − m2 ) uA (188) Y dado que la particula esta on shell satisface E 2 − m2 = p~2 , de manera que la segunda ecuacion se satisface automaticamente, Volviendo a la solucion que obtuvimos, como uA es un spinor de dos componentes arbitrario, podemos escoger como base entre i χ ={ 1 0 0 , } 1 (189) Asi pues, el spinor completo es i u = χi ~ σ ·~ p E+m χi (190) • E < 0: en tal caso E − m 6= 0 y podemos escribir uA = ~σ · p~ uB E−m (191) Al igual que antes, ahora la primera ecuacion se satisface automaticamente. Ahora tambien uB es un spinor de dos componentes arbitrario, podemos escoger como base de vuelta ξ i , asi pues, el spinor completo es ui+2 = ~ σ ·(−~ p) |E|−m i χ χi ! (192) Notese que podemos pensar los spinores ui+2 como de energia positiva –por eso hemos puesto |E|– y momento negativo –dependen de −~p–. Notese que u1 , u2 se corresponden con E > 0 y u3 , u4 se corresponden con E < 0. Volviendo a la notacion de Dirac, la ecuacion de Dirac en espacio de momentos es (es tradicional definir e.g. p/ = γ µ pµ ) (p/ − m) ψ = 0 Para los spinores u1,2 podemos escribir 45 (193) (p/ − m) ui = 0 i = 1, 2 (194) En espacio de posiciones estos spinores son u1, 2 = u1, 2 (~p) e−i p~·~x (195) Sin embargo, para los spinores de energia negativa, que dependen de −~p, podemos escribir u3, 4 = u3, 4 (−~p) ei p~·~x (196) Es util definir u3 (−~p) = v 2 (~p), u4 (−~p) = v 1 (~p), de manera que la ecuacion de Dirac para estos v i es (hay que mandar (E, p~) a −(E, p~)) (p/ + m) v i = 0 i = 1, 2 (197) Si tuviesemos un campo electromagnetico de fondo la diferencia entre ui , v i seria evidente: en presencia de un Aµ la ecuacion de Dirac para ui seria –esto lo veremos mas profundamente en el capitulo siguiente– / − m) ui = 0 (p/ − i e A i = 1, 2 (198) De manera que los v i satisfarian una ecuacion analoga pero cambiando −e por +e, es decir, la carga opuesta. Son las antiparticulas. Esta es la realizacion explicita de la teoria del mar de Dirac: las soluciones de energia negativa tienen carga opuesta y por lo tanto se comportan exactamente como la original pero con la carga al reves, esto es, como un hueco en el mar de electrones. A esta nueva particula de carga opuesta se le llama positron. A veces se denota como e+ por contra al electron, que seria e− . Por ultimo, los spinores ui , v i satisfacen las reglas de completitud X X ui (~p) ūi (~p) = (p/ + m) v i (~p) v̄ i (~p) = (p/ − m) (199) i=1, 2 5.2.2 Spin i=1, 2 1 2 El momento angular definido de manera usual es L̂ = ~xˆ × p~ˆ (200) ~ˆ = −i (~ [ĤD , L] α × p~ˆ) (201) Usando las reglas de conmutacion usuales [x̂i , p̂j ] = i δij , es facil ver que el hamiltoniano de Dirac satisface que Es decir, el momento angular no se conserva!. Sin embargo, si definimos ~σ 0 ˆ ~ Σ= 0 ~σ 46 (202) resulta que ~ˆ = 2 i (~ [ĤD , Σ] α × p~ˆ) (203) Asi pues esta claro que definiendo un momento angular total como ˆ ~ˆ 1 ~ˆ J~ = L + Σ 2 (204) ~ˆ = 0. si tendremos [ĤD , J] ~ˆ es el spin. Esta pues claro que el El momento angular “intrinseco” representado por Σ ~ˆ ψ 6= 0. Es util formar la cantidad escalar electron tiene spin, ya que evidentemente Σ λ= 1~ Σ · ~up 2 (205) donde up = |~pp~| es el vector unitario que apunta en la direccion de movimiento. A h se llama helicidad. Da informacion sobre la proyeccion del spin a lo largo de la direccion de movimiento. Si tomamos la base ξ i de arriba, esta claro que χ1 tiene helicidad 1/2 mientras que χ2 tiene helicidad −1/2. Esto indica que el electon –o mas generalmente aquello descrito por el campo de Dirac– tiene spin 1/2. 5.3 Masa cero y quiralidad Como vimos, si la masa es 0 en realidad no necesitamos la matriz β. A la vez, las relaciones restantes se satisfacen facilmente tomando αi = σi . La ecuacion para dicho caso es simplemente ~σ · p~ ψ = E ψ (206) Pero en el lado izquierdo de la ecuacion lo que tenemos es proporcional la helicidad: las soluciones de energia positiva tienen helicidad positiva mientras que las soluciones de energia negativa tienen helicidad negativa. Con esto en mente podemos construir otra representacion de las matrices de Dirac: 0 1l 0 σi 0 i γ = γ = (207) 1l 0 −σ i 0 En esta representacion − 1l 0 0 1l P± = 1l ± γ 5 2 5 γ = Asi pues 47 (208) (209) es un proyector a las dos componentes superiores (para P− ) o a las 2 inferiores (para P+ ). Estas dos componentes son los spinores de dos componentes con helicidades positiva – left handed – o negativa –right handed – minimales que podemos definir para particulas sin masa. 5.4 1 2 El campo de spin cuantizado Siguiendo la estrategia general, si estamos interesados en una teoria cuantica para el electron debemos empezar por asociar un campo al electron. Vimos que para el electron de masa m, como es un fermion, debemos usar el campo de Dirac. La ecuacion de Dirac se sigue de la accion Z S = d4 x i ψ̄ ∂/ψ − m ψ̄ ψ (210) Tomando la variacion de S con respecto a ψ̄ es directo que la ecuacion de movimiento para ψ es la ecuacion de Dirac. Para construir una teoria cuantica de campos de particulas de spin 12 , procediendo segun la hoja de ruta, debemos construir el funcional generador Z R 4 / ψ̄ ψ+J¯ ψ+ψ̄ J ¯ Z[J, J] = Dψ̄ Dψ ei d x i ψ̄ ∂ψ+m (211) ¯ J} son las fuentes, de manera que Z[J, ¯ J] es el funcional generador. Donde {J, Como es una teoria libre la unica regla de Feynman es el propagador. Para calcularla vamos a seguir un pequegno atajo. Ya que sabemos que el propagador de Feynman es la funcion de Green con la prescripcion +i para rodear los polos, podemos tomar la ecuacion de Dirac y ponerle una fuente tipo δ en el espacio de spinores (i ∂/ + m) G = −i δ (212) En espacio de momentos esto es (p/ − m) G = i ; G= Recuperando la prescripcion del i DF = i p/ − m i p/ − m + i (213) (214) Muchas veces es util multiplicar y dividir por p/ + m. En el denominador, usando las propiedades de las γ’s (p/ − m) (p/ + m) = p2 − m2 De manera que podemos escribir 48 (215) DF = i (p/ + m) p2 − m2 + i (216) Notese que la estructura analitica del propagador –la presencia de polos– es igual a la del caso escalar. De hecho refleja el hecho basado en la asuncion tan general como es la causalidad de que el termino cinetico tiene dos derivadas. 5.4.1 Cuantizacion canonica Aunque no lo vamos a hacer en detalle, si fuesemos a estudiar la cuantizacion canonica de un sistema de fermiones procederiamos como en el caso bosonico: introduciriamos un espacio de Fock y unos operadores creacion/destruccion actuando sobre los estados de dicho espacio. Llamemos a esos operadores {b, b† }. La clave es que, dado que la particula a crear es spinorial, en lugar de imponer unas relaciones de conmutacion [am , a†n ] = δm, n , hay que imponer relaciones de anticonmutacion tipo {bm , b†n } = δm,n R que hacen que el anticonmutador del campo ψ ∼ bp u(p) ei p x + c.c {ψ̄(t, ~x), ψ(t0 , ~y )} (217) (218) se anulen fuera del cono de luz. Es decir, la condicion de causalidad fuerza para la particula de spin 1/2 a usar anticonmutadores. Notese que los anticonmutadores hacen que el cuadrado del operador creacion sea 0: no podemos poner mas de una particula en cada estado. Esto no es mas que el principio de exclusion de Pauli, que viene forzado por la causalidad. Esta relacion entre spin y estadistica a traves de la causalidad en teoria cuantica de campos se conoce como teorema de spin estadistica. 6 Interacciones electromagneticas: QED QED es la teoria que describe las interacciones electromagneticas. Todas las particulas cargadas sienten esta fuerza. Como es una fuerza de largo alcance es –junto con la gravedad– la relevante a las escalas de nuestra experiencia cotidiana. Empecemos pues por estas familiares interacciones electromagneticas. Siguiendo nuestra estrategia general, para escribir una teoria para las interacciones electromagneticas entre materia –particulas de spin 1/2– cargada neesitaremos, para empezar, un campo asociado a cada tipo de particula con carga electromagnetica. Consideremos por sencillez uno de ellos, por ejemplo nuestro familiar electron. Como describimos, siguiendo la estrategia general, si estamos interesados en una teoria cuantica para el electron debemos empezar por asociar un campo al electron. Vimos que para el electron de masa m, como es un fermion, debemos usar el campo de Dirac. La ecuacion de Dirac se sigue de la accion 49 S= Z d4 x i ψ̄ ∂/ψ − m ψ̄ ψ (219) Tomando la variacion de S con respecto a ψ̄ es directo que la ecuacion de movimiento para ψ es la ecuacion de Dirac. Esta accion es invariante bajo ψ → ei α ψ (220) j µ = i ψ̄γ µ ψ (221) donde α es un numero –transformacion global, ya que el campo transforma igual en todos los puntos del espacio!!!–. La corriente conservada es Notese que j 0 = ρ es la densidad de probabilidad que vimos antes. Como al final esta es la corriente asociada a la carga electrica del electron, es razonable, si queremos tener en cuenta la interaccion electromagnetica, acoplarla al campo electroR µ magnetico agnadiendo un termino en la accion − e Aµ j , es decir, considerando Z S = d4 x i ψ̄ γ µ (∂µ + i e Aµ )ψ − m ψ̄ ψ (222) donde e es la carga del electron –tomemosla en valor absoluto. El signo sera el signo global del termino de interaccion–. 6.1 Invariancia gauge Todo el mundo sabe que el campo electromagnetico se obtiene a partir del potencial vector Aµ . Construyendo el tensor de campo Fµν = ∂µ Aν − ∂ν Aµ (223) tenemos que los campos electrico y magnetico son 1 ijk F jk (224) 2 ~ B} ~ se obtienen si hacemos Ahora bien, a la vista de Fµν , esta claro que los mismos {E, Ei = F0i Bi = Aµ → Aµ + ∂µ ϕ (225) donde ϕ es una funcion arbitraria. Esta transfromacion se conoce como transformacion gauge. Esta transformacion tiene un curioso efecto sobre el lagrangiano de Dirac: si hacemos una transformacion gauge tenemos que Z S → d4 x i ψ̄ γ µ (∂µ + i e Aµ + i e ∂µ ϕ)ψ + m ψ̄ ψ (226) 50 Ahora bien, si ahora hacemos una rotacion local en la fase de ψ tal que ψ → eiα ψ; y asumimos que α en lugar de ser un numero real es una funcion real α = −e ϕ, resulta que el termino con ϕ desaparece por completo: la accion es invariante gauge. Como la transformacion gauge en el campo de materia es una rotacion de fase, i.e. el grupo U (1), la invariancia gauge es bajo el grupo U (1). De hecho, podemos construir Dµ = ∂µ + i e Aµ (227) que es un operador diferencial que actua sobre un campo ψ. La clave es que bajo transformacion gauge ψ → ei e ϕ ψ Aµ → Aµ − ∂µ ϕ (228) resulta que Dµ ψ → ei ϕ Dµ ψ (229) es decir, Dµ ψ se transforma bajo rotacion gauge como ψ. Por eso al objeto Dµ se le llama derivada covariante, ya que Dµ ψ es covariante bajo la transformacion U (1). El principio de invariancia gauge es absolutamente central en fisica. Ya que debemos preservar la invariancia gauge, podemos seguir ese principio para escribir el termino cinetico para el Aµ . Como ha de ser un escalar con dos derivadas, la expresion mas general es Z S[A] = α1 ∂µ Aν ∂ µ Aν + α2 ∂µ Aν ∂ ν Aµ (230) con α1, 2 dos numeros a ajustar para que S[A] sea invariante gauge. Bajo una transformacion gauge infinitesimal δS[A] = Z α1 ∂µ Aν ∂ µ ∂ ν ϕ + α1 ∂µ ∂ν ϕ ∂ µ ∂ ν ϕ + α2 ∂µ ∂ν ϕ ∂ ν Aµ + α2 ∂µ Aν ∂ ν ∂ µ ϕ (231) asi si α2 = −α1 el S[A] es invariante gauge. Pero en tal caso resulta que S[A] ∼ R que µν Fµν F . Esto era de esperar, ya que F µν era invariante. 14 Asi pues, el lagrangiano describiendo de manera invariante gauge la interaccion entre electrones y fotones es Z 1 (232) S = d4 x − Fµν F µν + i ψ̄ γ µ (∂µ + i e Aµ )ψ + m ψ̄ ψ 4 La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando el funcional generador –que contiene toda la informacion de la teoria– 14 En realidad es covariante gauge, si bien al estar en la representacion adjunta, que es trivial para U (1), aparece como invariante. Esto sera importante para teorias no abelianas. 51 Z= Z DAµ Dψ̄ Dψ ei R d4 x − 41 Fµν F µν +i ψ̄ γ µ (∂µ +i e Aµ )ψ+m ψ̄ ψ+J¯ ψ+ψ̄ J+Jµ Aµ (233) Esto esta sin embargo mal definido, ya que debido a la invariancia gauge todos los Aµ conectados por Aµ → Aµ + ∂µ ϕ son equivalentes. Asi pues la integracion funcional sobre Aµ “cuenta de mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que se puede hacer de manera precisa –aunque aqui no vamos a entrar en ello en detalle–. 6.2 Reglas de Feynman Siguiendo nuestra hoja de ruta, vamos a asumir que la constante de acoplo –en este caso la carga del electron– es pequegna, de manera que podemos hacer teoria de perturbaciones. Para ello necesitamos conocer las reglas de Feynman. Ya sabemos el propagador del fermion: De = i (p/ + m) − m2 + i p2 (234) El propagador del campo gauge –cuyo cuanto es el foton– se podria calcular de manera analoga. Sin embargo, como dijimos antes, debido a la invariancia gauge el calculo es un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de Feynman–, cuando Dγ = i η µν p2 + i (235) Por ultimo el vertice de interaccion, que se puede leer directamente del lagrangiano ψ̄γ Aµ da una regla para el vertice de 2 fermiones y un foton µ V = −i e γ µ Resumiendo 52 (236) La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando el funcional generador –que se contiene la informacion teoria– La teoria cuantica obtienetoda siguiendo la hoja de de la ruta usual, es decir, considerando el funcional Zgenerador –que contiene toda la informacion de la teoria– R 4 1 µ⌫ µ ¯ (@µ +i e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ Z = DAZµ D ¯ D ei d x 4 FRµ⌫ F +i (232) 4x 1 F µ⌫ +i ¯ µ (@ +i e A ) +m ¯ +J¯ + ¯ J+J Aµ i d F µ⌫ µ µ µ 4 Z = DAµ D ¯ D e (232) Esto esta sin embargo mal definido, ya que debido a la invariancia gauge todos los Aµ conectados poresta Aµ ! son definido, equivalentes. Asidebido pues laa integracion funcional sobrelos Aµ Esto sin Aembargo ya que la invariancia gauge todos µ + @µ ' mal La teoria cuantica se obtiene siguiendo la hoja de ruta usual, es decir, considerando el Aµ “cuenta de mas” Hay que eliminar esas redundancias, lo que sobre conectados pormuchas Aµ ! Aconfiguraciones. Asi pues la integracion funcional µ + @µ ' son equivalentes. funcional generador –que contiene toda la informacion de la teoria– se puede hacer de manera precisa –aunque aqui no vamos a entrar en ello en detalle–. Aµ “cuenta de mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que Z R 4 aqui se puede hacer de manera precisa –aunque noµ⌫ vamos entrar en ello en detalle–. 1 ¯ µ (@aµ +i e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ Z = DAµ D ¯ D ei d x 4 Fµ⌫ F +i (232) 6.2 Reglas de Feynman 6.2 Reglas desin Feynman Esto esta Ya sabemos el propagador delembargo fermion:mal definido, ya que debido a la invariancia gauge todos los Aµ conectados por Aµ ! Aµ + @µ ' son equivalentes. Asi pues la integracion funcional sobre Ya sabemos el propagador del fermion: Aµ “cuenta de mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que i (p/ + m) De = (233) se puede hacer de manera precisa –aunque aqui no vamos a entrar en ello en detalle–. 2 i+ (p/i + p2e m ✏ m) D = 2 (233) 2 + i✏ p m El propagador del campo gauge –cuyo cuanto es el foton– se podria calcular de manera 6.2 Reglas de Feynman analoga. El Sinpropagador embargo, como dijimos antes, debido laelinvariancia gauge el calculo del campo gauge –cuyo cuantoa es foton– se podria calcular dees manera un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de analoga. Sin embargo, como dijimos antes, debido a la invariancia gauge el calculo es Ya sabemos el propagador del fermion: Feynman–, cuando un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de Feynman–, cuando i (p/ + m) µ⌫ e i ⌘D = 2 (233) D = 2 (234) pµ⌫ m2 + i ✏ i ⌘ p + i✏ D = El propagador del campo gauge –cuyo es el foton– se podria calcular(234) de manera p2 +cuanto ileer ✏ directamente Por ultimo el vertice de interaccion, que se puede del lagrangiano analoga. Sin embargo, como dijimos antes, debido a la invariancia gauge el calculo es ¯ µ Aµ daPor unaultimo regla para el vertice de 2 fermiones foton leer directamente del lagrangiano el vertice de interaccion, que yseunpuede poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de ¯ µ Aµun da una regla para el vertice de 2 fermiones y un foton Feynman–, cuando µ V = ie (235) V = i e µ i ⌘ µ⌫ (235) D = 2 (234) 6.2.1 Patas externas p + i✏ 6.2.1 Patas externas Por para ultimocalcular el vertice de interaccion, que se nos puede del lagrangiano Como vimos antes, amplitudes de scattering valeleer condirectamente considerar dia¯ µ AEntonces, da unapara regla para el amplitudes vertice de 2de fermiones gramasComo conexos. si adoptamos la prescripcion de noy un poner los con propagadores µantes, vimos calcular scattering nosfoton vale considerar dia- $ $ externos ya tendremos cuenta lossi factores de LSZ. Para el campo escalar, vimos, gramas conexos. enEntonces, adoptamos la prescripcion de no ponercomo los propagadores µ Vespacio = eso eraexternos todo. Sin embargo, sientenemos campos conde interno –por ejemplo ya tendremos cuenta los factores LSZ.i ePara el campo escalar, spin, comoovimos, (235) polarizacion un Sin foton– debemos indicar su estadocon de polarizacion. Asi–por puesejemplo spin, o eso erapara todo. embargo, si tenemos campos espacio interno 6.2.1 para Patas externas polarizacion un foton– debemos indicar su estado de polarizacion. Asi pues • Fermion in/out: u/ ū Como vimos antes, para calcular amplitudes de scattering nos vale con considerar dia• Fermion in/out: u/ ū gramas conexos. • Antifermion in/out: v̄/ v Entonces, si adoptamos la prescripcion de no poner los propagadores externos ya in/out: tendremos • Antifermion v̄/ ven cuenta los factores de LSZ. Para el campo escalar, como vimos, ? • Foton in/out: µ / ✏µ Sin embargo, si tenemos campos con espacio interno –por ejemplo spin, o eso era ✏todo. ? • Foton in/out: para ✏µ / ✏un µ foton– debemos indicar su estado de polarizacion. Asi pues polarizacion $ 6.2.1 Patas externas • Fermion in/out: u/ ū Como vimos antes, para calcular •amplitudes dev̄/scattering nos vale con considerar diaAntifermion in/out: v 49 49 gramas conexos. Entonces, si adoptamos la prescripcion de no poner los propagadores ? • Foton in/out: ✏µ / ✏µ externos ya tendremos en cuenta los factores de LSZ. Para el campo escalar, como vimos, eso era todo. Sin embargo, si tenemos campos con espacio interno –por ejemplo spin, o polarizacion para un foton– debemos indicar su estado de polarizacion. Asi pues 49 • Fermion in/out: u/ ū • Antifermion in/out: v̄/ v • Foton in/out: µ / ?µ Los {u, v} son nuestros viejos conocidos spinoriales. Recordemos que sus relaciones de completitud son X X ui (~p) ūi (~p) = (p/ + m) v i (~p) v̄ i (~p) = (p/ − m) (237) i=1, 2 i=1, 2 Por otra parte µ representa la polarizacion del foton. Fijando completamente el gauge, si el foton tiene momento q, el satisface ~q · = 0 0 = 0 Suponiendo el foton moviendose en x3 , podemos resolver estos constraints como 53 (238) ξ1 ~1 = 0 0 0 ~2 = ξ2 0 (239) Es util formar las combinaciones circularmente polarizadas L, R como 1 1 ~R = √ (~1 − i~2 ) ~L = − √ (~1 + i~2 ) 2 2 Estos tambien satisface una relacion de completitud X qi qj (λ )?i (λ )j = δij − 2 ~q λ=R, L (240) (241) Resumiendo, para las patas externas fermionicas u 6.2.2 ū v̄ v El vertice de QED y el momento magnetico Si nos fijamos en el vertice de QED, por ejemplo para un electron entrando y saliendo tenemos que este contribuye a cada diagrama como ūout γ µ uin (242) Esto se puede escribir como (descomposicion de Gordon) ūout γ µ uin = ūin donde i 1 h (pin + pout )µ + i σ µν (pout − pin )ν uout 2m i µ ν [γ , γ ] 2 Notemos que, en por ejemplo la representacion de Dirac-Pauli i −σ i 0 0i σ = 0 σi 2 σ µν = (243) (244) (245) En esta representacion 5 γ = 1l 0 0 − 1l 54 (246) Asi que podemos escribir que σ 0i γ 5 = S i , esto es, el termino con σ µν representa una interaccion asociada al spin 1/2. Debe ser por lo tanto mediada por el campo magnetico. Por lo tanto, para un electron la interaccion es debida tanto a su carga como a su momento magnetico –que es debido a su spin–. Evidentemente este vertice esta corregido por diagramas de orden superior. Dichas correcciones cambian ligeramente la razon entre el acoplo “electrico” y el “magnetico”. La magnitud de dicha correccion es muy sensible a nueva fisica –en particular para el muon: es el famoso g − 2, que es la desviacion del valor, en cierta normalizacion 2, de ese momento magnetico con respecto a QED–. 6.3 QED en el SM En nuestra discusion sobre QED hemos supuesto por sencillez que solo hay un tipo de particula cargada bajo el campo electromagnetico: el electron. En realidad hay mas particulas fundamentales con carga electromagnetica: tanto los quarks como los leptones –salvo los neutrinos– tienen carga electrica. Asi pues, podramos haber escrito todos esos campos como un “vector” Ψi = (electron, muon, . . . ) y escribir un lagrangiano general.15 Hasta ahora nos hemos centrado en el trozo que solo contiene al electron. Sin embargo, ademas de este, en realidad el foton se acopla a todas las demas particulas. Es particularmente util un tipo de proceso en el que un electron y un positron se aniquilan en un foton que produce despues un par de otro tipo de particula, por ejemplo un muon. 6.3.1 e+ e− → µ+ µ− El proceso e+ e− → µ+ µ− es de gran importancia: es un proceso clave en QED basico en un colisionador de leptones como era LEP. Ademas sirve como modelo simplificado para procesos de QCD e+ e− → q q̄. Es por eso por lo que es muy interesante calcularlo explicitamente. El diagrama relevante es (5). Usando las reglas de Feynman, este vale 0 v̄ s (p0 )(−i e γ µ ) us (p) −i ηµν r 0 ū (k)(−i e γ ν ) v r (k 0 ) 2 q (247) donde estamos exhibiendo explicitamente los indices de spin {s, s0 , r, r0 } de los fermiones. Por lo tanto –llamemos M al diagrama, ya que controla el elemento de matriz que queremos calcular– M = −i e 2 s0 0 µ s 0 v̄ (p ) γ u (p) ūr (k) γµ v r (k 0 ) 2 q (248) En realidad necesitamos |M|2 . Para ello necesitamos calcular en general (v̄ γ µ u)? . Usando las propiedades de las matrices γ y los spinores, resulta que 15 En realidad esto no tendria sentido, ya que las otras fuerzas de la naturaleza si distinguen esos otros tipos de particulas. Por eso no vamos ni siquiera a escribir dicha teoria para Ψi . 55 Figure 5: Diagrama relevante para e+ e− → µ+ µ− (v̄ γ µ u)? = ū γ µ v (249) Por lo tanto e4 s0 0 µ s r r0 0 s ν s0 0 r0 0 r |M| = 4 v̄ (p ) γ u (p) ū (k) γµ v (k ) ū (p) γ v (p ) v̄ (k ) γν u (k) q (250) e 4 s0 0 µ s s ν s0 0 r r0 0 r0 0 r v̄ (p ) γ u (p) ū (p) γ v (p ) ū (k) γ v (k )v̄ (k ) γ u (k) µ ν q4 (251) 2 Esto lo podemos reordenar como |M|2 = Como muchas veces en el experimento no hay control sobre la polarizacion vamos a tomar el promedio en spin. Para eso hay que sumar a {s, s0 , r, r0 } y dividir entre los 4 posibles estados. Es decir |Mup |2 = 1 e4 4 q4 X s, s0 , r, r0 0 0 0 0 v̄ s (p0 ) γ µ us (p) ūs (p) γ ν v s (p0 ) ūr (k) γµ v r (k 0 )v̄ r (k 0 ) γν ur (k) (252) Debido a las sumas sobre spines, podemos usar las relaciones de completitud. Trozo a trozo 56 X 0 X 0 v̄ s (p0 ) γ µ us (p) ūs (p) γ ν v s (p0 ) = s, s0 0 0 µ ν usβ (p) ūsγ (p) γγρ vρs (p0 ) v̄αs (p0 ) γαβ (253) s, s0 Donde hemos sacado explicitamente los indices spinoriales –indices griegos–. Reordenando X X 0 0 µ ν γγρ (254) usβ (p) ūsγ (p) v̄αs (p0 ) vρs (p0 ) γαβ s0 s Usando las relaciones de completitud (para los spinores del electron, por eso debemos usar la masa del electron me ) µ ν (p/ + me )βγ (p/0 − me )ρα γαβ γγρ = Tr (p/0 − me )γ µ (p/ + me ) γ ν (255) Haciendo lo mismo para el otro trozo –donde ahora aparecera la masa del muon mµ – X 0 X 0 ūr (k) γµ v r (k 0 )v̄ r (k 0 ) γν ur (k) = r, r0 r, r0 X = 0 0 ūrα (k) (γµ )αβ vβr (k 0 )v̄γr (k 0 ) (γν )γρ urρ (k) r (256) X 0 0 ūrα (k) urρ (k) vβr (k 0 )v̄γr (k 0 ) (γν )γρ (γµ )αβ r0 Usando las relaciones de completitud X r X 0 0 ūrα (k) urρ (k) vβr (k 0 )v̄γr (k 0 ) (γν )γρ (γµ )αβ = (k/ + mµ )ρα (k/0 − mµ )βγ (γν )γρ (γ(257) µ )αβ r0 = Tr (k/ + mµ ) γµ (k/0 − mµ ) γ ν Asi que todo junto |Mup |2 = e4 0 µ 0 ν / / / Tr ( p − m )γ ( p + m ) γ Tr ( k + m ) γ ( k − m ) γ / e e ν µ µ µ 4 q4 (258) Necesitamos calcular cada traza. En general tenemos que calcular / + m) γ ν Tr (P/ − m)γ µ (L / γ ν + m P/ γ µ γ ν − m γ µ L / γ ν − m2 γ µ γ ν = Tr P/ γ µ L Usando las identidades para trazas de matrices γ esto es Que es / γ ν − m2 Tr γ µ γ ν = Pα Lβ Tr γ α γ µ γ β γ ν − m2 Tr γ µ γ ν Tr P/ γ µ L 57 (259) (260) 4 Pα Lβ η αµ η βν − η αβ η µν + η αν η µβ − 4 m2 η µν = 4 P µ Lν + P ν Lµ − P L η µν − m2 η µν (261) Asi pues Tr (p/0 − me )γ µ (p/ + me ) γ ν = 4 p0µ pν + p0ν pµ − p0 p η µν − m2e η µν (262) y Tr (k/ + mµ ) γµ (k/0 − mµ ) γν = 4 kµ0 kν + kν0 kµ − k 0 k ηµν − m2µ ηµν (263) Como me << mµ , hagamos la simplificacion de me = 0. Entonces el producto de los dos trozos de arriba es 16 p0µ pν +p0ν pµ −p0 p η µν kµ0 kν +kν0 kµ −k 0 k ηµν −m2µ ηµν = 32 (p0 k 0 ) (p k)+(p0 k) (p k 0 )+m2µ p0 p (264) Asi que todo junto 8 e4 0 0 0 0 2 0 (p k ) (p k) + (p k) (p k ) + m p p (265) µ q4 Particularicemos ahora estas formulas para el sistema centro de masas, donde el 3-momento inicial total es 0. Como los electrones son de masa 0 sus 4-momentos son p = (E, 0, 0, E) y p = (E, 0, 0, −E). Analogamente, para los muones salientes k = (E, ~k) y k 0 = (E, −~k), como en la figura (6). Llamaremos θ al angulo entre ~k y el eje x3 en donde apuntan los momentos iniciales de los electrones, es decir ~k · ~xˆ3 = |~k| cos θ. Entonces |Mup |2 = p0 k 0 = p0 k 0 = E 2 −E |~k| cos θ p0 k = p k 0 = E 2 +E |~k| cos θ p0 p = 2 E 2 q 2 = (p+p0 )2 = 4 E 2 (266) Asi que m2µ m2µ 2 i |Mup | = e 1 + 2 + 1 − 2 cos θ (267) E E Para calcular la seccion eficaz necesitamos multiplicar por el elemento de volumen en el espacio de fases. En este caso, en el sistema centro de masas con dos particulas de igual masa en el estado final esta dado por (se puede ver la derivacion en la bibliografia. Aqui copiemos el resultado final solamente) 2 4 h |~k| 3 32 π 2 Ecm 58 (268) Figure 6: Cinematica en centro de masas para e+ e− → µ+ µ− Usando esto tenemos que la seccion eficaz diferencial es el elemento de volumen en el espacio de fases de arriba multiplicado por la amplitud que calculamos, es decir p e4 E 2 − m2µ h m2µ m2µ 2 i dσ = 1 + + 1 − cos θ (269) 3 dΩ 32 π 2 Ecm E2 E2 Donde hemos usado que como las particulas externas son fisicas E 2 = ~k 2 + m2µ . Ademas, dado que Ecm = 2 E, podemos escribir r m2µ h m2µ m2µ 2 i dσ e4 = 1 − 1 + + 1 − cos θ (270) dΩ 256 π 2 E 2 E2 E2 E2 La cantidad e2 /4π se define como la constante de estructura fina. Es una redefinicion de la carga del electron –al final en lo que estamos haciendo teoria de perturbaciones– que es util –porque quita 4π del medio–. En terminos de ella r m2µ h m2µ m2µ 2 i dσ α2 = 1 − 2 1 + 2 + 1 − 2 cos θ (271) dΩ 16 E 2 E E E Podemos integrar las coordenadas angulares para tener la seccion eficaz global. Como dΩ es el elemento de volumen en la 2-esfera α2 σ= 16 E 2 r m2µ 1− 2 E Z 0 π dθ sin θ Z 2π dφ 0 59 h 1+ m2µ m2µ 2 i + 1 − cos θ E2 E2 (272) s E Figure 7: Seccion eficaz e+ e− → µ+ µ− . Integrando r m2µ m2µ π α2 σ= 1 − 1 + (273) 3 E2 E2 E2 Si dibujamos esto tenemos (7) La linea punteada vertical representa el corte cinematico: necesitamos una energia de al menos mµ para poder producir los muones. Esta grafica se superpone perfecta a los resultados experimentales. 6.3.2 Crossing y e− µ− → e− µ− Supongamos que queremos calcular ahora un proceso muy parecido: e− µ− → e− µ− . El diagrama relevante es (8) Esto vale e2 −i ηµν ν 0 (ū(k) (−i e γ ) u(k ) = ū(p0 ) γ µ ) u(p) ū(k) γµ ) u(k 0 ) q2 q2 (274) Notese que este resultado se puede obtener a partir del anterior si cambiamos el muon en el estado inicial por un antimuon en el estado final y viceversa para el electron en estado final. Esto es una manifestacion de la simetria de cruce. La amplitud es M = ū(p0 ) (−i e γ µ ) u(p) |M|2 = e4 (ū(p0 ) γ µ ) u(p)) (ū(p) γ ν ) u(p0 )) (ū(k) γµ ) u(k 0 )) ((ū(k 0 ) γν ) u(k)) q4 (275) Esto lo podemos escribir en forma mas concisa: introduciendo dos tensores asociados a los vertices del electron y del muon –que no son mas que las corrientes al cuadrado– 0 µ ν 0 Lµν electron = (ū(p ) γ u(p)) (ū(p) γ u(p )) 0 0 Lµν muon = (ū(k) γµ u(k )) ((ū(k ) γν u(k)) (276) 60 Figure 8: Diagrama relevante para e− µ− → e− µ− La amplitud es simplemente e4 [Le ]µν [Lµ ]µν q4 Fijemonos en el tensor electronico. Promediando a spines |M|2 = (277) X 1 X 1 µ µ ν ν ūα (p0 ) uρ (p0 ) uβ (p) ūγ (p) γαβ γγρ = (p/ + m)ρα (p/ + m)βγ γαβ γγρ 4 s 4 s0 (278) Esto es (suprimimos la barra ya que siempre vamos a considerar cantidades promediadas a spin) L̄µν electron = Lµν electron = Asi que 1 0 Tr (p/ + m) γ µ (p/ + m) γ ν 4 0 µ ν 0 ν µ 0 2 µν Lµν electron = (p ) p + (p ) p − (p p + m ) η (279) (280) Notese que el momento del foton es q = p + p0 . Como 0 ν 2 0ν 0 2 ν pµ Lµν electron = p p p +p p −(p p+m ) p 02 ν 0 0 ν 0 2 0ν p0µ Lµν electron = p p +(p p )(p ) −(p p+m ) p (281) 61 Como p2 = (p0 )2 = m2 2 ν 0ν p0µ Lµν electron = m (p − p ) 2 0ν ν pµ Lµν electron = m (p − p ) (282) Ası́ pues qµ Lµν electron = 0 (283) Como ademas el tensor es simetrico, esta claro que contraer con p, p0 por cualquier lado da 0. Como en espacio de momentos ∂µ ∼ pµ , esto simplemente refleja la conservacion de la corriente del electron. 6.4 El limite de masa 0 y quiralidad Reconsideremos la teoria cuantica de campos para fermiones libres. El lagrangiano es Z S = d4 x i ψ̄ γ µ (∂µ + m) ψ̄ ψ (284) Recordemos que la corriente conservada asociada a rotaciones U (1) globales es –agnadamosle un subindice V cuyo significado quedara claro en breve– jVµ = ψ̄ γ µ ψ En la representacion de Weyl 0 1l 0 σi 0 i γ = γ = 1l 0 −σ i 0 (285) 5 γ = − 1l 0 0 1l (286) Ya que para las γ µ tenemos una misma estructura de bloques, podemos construir σ µ = ( 1, l ~σ ) σ̄ µ = ( 1, l −~σ ) (287) Ademas, ya que en esta representacion las quiralidades estan claramente separadas, podemos escribir ψL ψ= (288) ψR con ψL, R dos spinores de Weyl –i.e. de dos componentes quirales–. El lagrangiano es Z (289) S = d4 x i ψR† σ µ ∂µ ψR + i ψL† σ̄ µ ∂µ ψL + m ψL† ψR + m ψR† ψL El unico termino que mezcla las quiralidades left y right es el termino de masa. Ademas, la corriente conservada es jVµ = ψL† σ̄ µ ψL + ψR† σ̄ µ ψR 62 (290) Supongamos que el fermion tuviese m = 0. En tal caso Z S = d4 x i ψR† σ µ ∂µ ψR + i ψL† σ̄ µ ∂µ ψL (291) En este caso las componentes left y right son independientes, y de hecho podriamos en principio considerar simplemente la componente e.g. left por separado. Ya que left y right son independientes, tenemos dos corrientes conservadas asociadas a las rotaciones ψL, R → ei αL, R ψL, R independientes: jLµ = ψL† σ̄ µ ψL jRµ = ψR† σ µ ψR (292) Cambiando a la base suma/diferencia jVµ = jLµ + jRµ = ψL† σ̄ µ ψL + ψR† σ µ ψR jAµ = jLµ − jRµ = ψL† σ̄ µ ψL − ψR† σ µ ψR (293) (294) Donde reconocemos nuestra querida corriente jVµ que es la unica conservada si tenemos m = 0. Sin embargo, en el caso de m = 0, la corriente jAµ tambien se conserva. Volviendo a spinores de Dirac jVµ = ψ̄ γ µ ψ jAµ = ψ̄ γ 5 γ µ ψ (295) γ5 que se corresponden respectivamente a rotaciones ψ → eiαV ψ y ψ → eiαA ψ. Mientras que jVµ es una corriente vectorial, que se corresponde con rotaciones iguales para las dos quiralidades, jAµ es una corriente axial –es un pseudovector debido al γ 5 – que se corresponde a rotaciones opuestas para cada quiralidad. En el caso de m = 0 solo las rotaciones vectoriales son simetria, pero en el caso de masa 0 ambas lo son. Notese que, para un fermion de Dirac de masa 0, podriamos acoplar cualquiera de las dos jA, V al campo electromagnetico. Sin embargo, en realidad las rotaciones axiales no son una simetria de verdad, ya que los efectos cuanticos la rompen –es una simetria anomala– . Es por eso por lo que QED acopla la corriente vectorial al campo electromagnetico. Mas generalmente, las teorias quirales llevan a simetrias con quiralidad definida que son potencialmente anomalas. Sin embargo, el SM –la naturaleza– es una teoria quiral. De hecho la cancelacion de dichas anomalias es un exito espectacular del SM. Mas adelante hablaremos de esto en un poco mas de detalle. Un “corolario” es que el termino de masa, al mezclar las dos quiralidades, es incompatible con la simetria quiral. Esta observacion sera crucial mas adelante. 6.4.1 Conservacion de helicidad a altas energias Un corolario de la discusion anterior es que a altas energias, cuando E >> m, la masa de las particulas es despreciable. En tal caso el unico termino en QED que mezcla las dos quiralidades –la masa– es despreciable, con lo que la teoria se vuelve de modo efectivo 63 quiral. Es por ello por lo que –mas alla de las anomalias antes mencionadas, que son efectos no perturbativos y por lo tanto muy pequegnos en QED perturbativa– a altas energias la quiralidad se conserva. 7 La interaccion fuerte: QCD Las interacciones electromagneticas son sensibles a la carga electrica. Como el foton es una particula sin masa, el alcance de la interaccion electromagnetica es infinito, lo que explica que sea la interaccion dominante en nuestro mundo de baja energia. Por ser la interaccion mas accesible la podemos usar para ”iluminar” otras particulas, ver su posible estructura interna y estudiar otras fuerzas. 7.1 Fotografiando protones: la estructura de los hadrones Queremos iluminar con luz –fotones– particulas para ver su estructura interna. Supongamos que mandamos un foton –emitido por ejemplo por un electron– a una particula. Supongamos la luz no muy energetica (es decir, su q 2 es pequegno), y la particula suficientemente pesada como para asumir que casi no sufre retroceso. Ya que no rompemos la particula que estamos estudiando, el scattering es elastico. En general, el acoplo de la luz a dicha particula sera a traves de un vertice efectivo −i e F (q) η 0µ (296) Donde F (q) codifica toda la posible estructura interna. El que solo aparezca η 0µ es debido a que asumimos que el retroceso es nulo, esto es, que la particula que estamos iluminando esta en reposo. El diagrama relevante es (9). Figure 9: Diagrama relevante para estudiar factores de forma. Dicho diagrama vale M = ū(kf ) (−i e γ µ ) u(ki ) −i ηµ0 e2 (−i e F (q)) = i F (q) ū(kf ) γ 0 u(ki ) q2 q2 64 (297) Promediando sobre spines para los electrones (ahora es solo un 1/2 porque hay solo dos spines) X X 0 e4 2 s s s s0 0 0 |Mup | = |F | ūα (kf ) uρ (kf ) ūγ (ki ) uβ γαβ γγρ 4 2q s s0 2 (298) Usando las relaciones de completidud y las identidades de las trazas de las γ 2 e4 F 2 e4 |F |2 2 0 0 2 (kf )0 (ki )0 − kf ki + m (299) Tr (k/f + m) γ (k/i + m) γ = |Mup | = 2 q4 q4 2 Dado que la particula iluminada no retrocede, podemos escribir (ki )0 = (kf )0 = E y |~ki | = |~kf | = k, asi como ~ki · ~kf = k 2 cos θ, de manera que esto lleva a |Mup |2 = Ademas 4 e4 |F |2 2 k2 2 θ E 1 − sin q4 E2 2 (300) θ 2 (301) q 2 = (kf −ki )2 = kf2 +ki2 −2 kf ki = 2 m2 −2 E 2 +2 k 2 cos θ = −2 k 2 (1−cos θ) = −4 k 2 sin2 asi que |Mup |2 = e4 |F |2 4 k 4 sin4 θ 2 k2 θ E 2 1 − 2 sin2 E 2 (302) k2 2 θ sin |F (q)|2 E2 2 (303) En este caso, en el que bombardeamos una particula que no sufre retroceso, el volumen del espacio de fases es simplemente (16 π 2 ) –es razonable que no tenga dependencia en momento y energia: al final es como si la particula es tan pesada que pudiese absorver una cantidad arbitraria de energia/momento sin inmutarse–. Asi pues α2 E 2 dσ = dΩ 4 k 4 sin4 θ 2 1− A la seccion eficaz con F = Z se le llama seccion eficaz de Mott, y es la que obtendriamos para una particula puntual con carga Z e. Vemos pues que la funcion F (q) codifica la estructura interna de la particula. Claro, si nos fijamos en el vertice, esta claro que F (q) es la transformada de Fourier de la densidad de carga en la particula. Para una particula sin spin ρ(~x) = Z δ(~x), con lo que F = Z. Asi pues, si medimos la seccion eficaz iluminando una particula con luz poco energetica y lo dividimos por la seccion eficaz de Mott lo que obtendremos es informacion sobre la estructura interna de la particula. A la funcion F (q) se le llama factor de forma. Nos gustaria usar este metodo para fotografiar hadrones –en particular protones–. El problema es que en realidad el proton si retrocedera un poco en la colision –un nucleo 65 pesado si es suficientemente masivo como para ignorar el retroceso, pero no asi un proton, a no ser que estudiemos energias excesivamente bajas–. Ademas, el vertice efectivo usado arriba es un poco demasiado simplificado. Si el proton fuese una particula puntual, teniendo en cuenta el posible retroceso, contribuiria al scattering con ūproton γ µ uproton . Podriamos entonces copiar nuestro resultado para el scattering e− µ− → e− µ− . Recordemos que esta corriente, asumiendo el proton una particula puntual con spin 1/2 como el muon, ūproton γ µ uproton se puede escribir, usando la descomposicion de Gordon, como i 1 h (pin + pout )µ + i σ µν (pout − pin )ν uout (304) 2M donde M es la masa del proton. Es decir, la interaccion es debido a la carga electrica asi como al spin –momento magnetico–. Los factores particulares son debidos a que estamos asumiendo una particula puntual de spin 1/2. Sin embargo, si la particula tuviese estructura, dichos factores cambiarian. Es por ello que para el proton podemos asumir una forma para la corriente h i κ µ jproton = ūprotonout F1 (q 2 ) γ µ + F2 (q 2 ) i σ µν qν uprotonin (305) 2M Donde F1, 2 precisamente codifican esa estructura interna del proton. El factor κ es el momento magnetico anomalo. Si tuviesemos una particula realmente puntual tendriamos que κ F2 = 0 y F1 = 1, recuperando nuestra vieja corriente conocida. Notese que la forma de la corriente, parametrizada con F1, 2 , es la mas general posible µ compatible con su conservacion –es decir, ∂µ jproton = 0–. Se suele definir ūout γ µ uin = ūin q2 κ q2 F G = F + κ F τ = − 2 M 1 2 4 M2 4 M2 De manera que la seccion eficaz en el sistema de referencia del laboratorio es GE = F1 + dσ α2 = dΩ 4 E 2 sin4 1 θ 2 1+ 2E M sin2 θ 2 G2 + τ G2 θ θ E M cos2 + 2 τ G2M sin2 1+τ 2 2 (306) (307) Resulta que, por ejemplo, se observa en el experimento que GE (q 2 ) = 1 1− q2 0.71 GeV 2 (308) Demostrando explicitamente que el proton tiene una subsestructura. 7.1.1 Scattering inelastico De cara a estudiar esta estructura interna del proton –de los hadrones en general– uno podria pensar en subir la energia del foton que fotografia el proton. El problema es que al 66 hacer esto el proton se rompe: el scattering es inelastico –las particulas no solo rebotan, sino que rompen–. El “diagrama” relevante es (10). Figure 10: Scattering inelastico Este diagrama lleva a una amplitud de probabilidad de la forma generica |Mup |2 = Lµν Wµν (309) q µ q ν W2 µ p q µ ν p q ν + 2 p − 2 q p − 2 q q2 M q q (310) Donde Lµν es el familiar tensor leptonico –el del electron– y Wµν es el correspondiente tensor asociado al proton y todo en lo que se rompe. Lo unico que dicho tensor hadronico debe cumplir es que sea simetrico y que qµ W µν = 0 maniestando la conservacion de la corriente. Con esas restricciones el W mas general16 que podemos escribir es W µν = W1 − η µν + Donde p es el momento inicial del proton y q el momento del foton que lo prueba. La normalizacion arbitraria se debe a cuestiones historicas. Las funciones W1, 2 se llaman funciones de estructura y codifican precisamente la estructura interna del hadron. Resulta util definir las siguientes variables adimensionales construidas con cantidades cinematicas x=− q2 2M ν y= pq pk ν= pq M (311) Sorprendentemente, al subir la energia del foton que rompe el proton –es decir, a mayor Q = −q 2 –, las funciones de estructura se parecen mas y mas a algo de la forma 2 16 En realidad hay un termino mas que podemos escribir con µνρσ , pero dejemoslo estar hasta mas adelante. 67 W1p = A2 Q2 δ(ν − A Q2 ) W2p = δ(ν − A Q2 ) (312) Donde A es una constante con unidades de Energia−1 . A esto se le llama escaleo de Bjorken –James Bjorken fue quien lo descubrio–. Resulta que estas son las funciones de esctructura que uno esperaria si el proton fuese una particula puntual de spin 1/2 y masa (2 A)−1 . Esto es sorprendente para empezar porque sabemos que el proton no es una particula puntual –el scattering elastico asi lo indica–, ademas de porque el valor de la masa es diferente al de la masa del proton. La conclusion debe ser pues que el proton esta compuesto de particulas puntuales que interactuan menos y menos a medida que la energia sube. A estas particulas puntuales Feynman las llamo colectivamente partones. Resulta que la variable x mide cuanto momento –que fraccion– lleva el parton en cuestion al que le esta dando el foton del momento total del hadron. Estos partones de spin 1/2 que interactuan con el foton se corresponden con los quarks de QCD. Sin embargo, si miramos todo el momento que se llevan los partones que interactuan con el foton veriamos que no suman el momento total inicial del hadron. Eso implica que ha de haber otros constituyentes sin carga electrica. Esos otros constituyentes son los gluones de QCD que median las fuerzas entre quarks. La imagen que emerge es que los hadrones –el proton en particular– contiene unos quarks de valencia que le dan los numeros cuanticos acreditandole como tal hadron en particular, asi como un mar neutro de quarks, antiquarks y gluones, que son los partones de Feynman. 7.1.2 Gluones Hemos visto la necesidad de introducir partones electromagneticamente neutros para dar cuenta del momento total del hadron. Estos partones los hemos identificado con los gluones de QCD. Volvamos sobre esto un momento. Si QCD se comportase de manera similar a QED si podriamos ser sensibles a estos partones neutros a traves de un proceso a orden mas alto, como en la figura (11). Estas desviaciones –asi como otros efectos de radiaccion de gluones–, estudiadas en particular por Altarelli y Parisi, se observan en los experimentos y ponen de manifiesto la “realidad” de QCD. 7.2 QCD Hemos visto que la estructura de los hadrones se entiende asumiendo que estos estan formados por quarks de spin 1/2 interactuando a traves de una teoria tipo QED para una nueva fuerza que llamamos QCD y cuyos “fotones” son los gluones. Resulta ser que, al igual que QED estaba basada en el principio de invariancia gauge bajo transformaciones U (1), QCD esta basada en el principio de invariancia gauge bajo SU (3). Para construir QCD podemos pues seguir nuestra hoja de ruta usual, que empieza por introducir un campo de spin 1/2 para los quarks. Supongamos por sencillez un solo tipo de quark transformandose bajo SU (3) en la representacion fundamental. Esto quiere decir que debemos introducir 68 Scaling: a altas energias el proton es un saco de partones de spin 1/2 cargados (quarks) Desviaciones de scsaling: a traves de una contribucion a orden mas alto podemos ser sensibles a los partones neutros (gluones) Figure 11: Desviaciones de scaling asociadas a ver los partones neutros (=gluones). un campo de Dirac q que se transforme como fundamental bajo SU (3). Al igual que una rotacion –de momento consideremosla global– U (1) transforma el electron como e → ei α e, una rotacion SU (3) transforma q como q → ei ϕ a Ta q Donde T a son los generadores del grupo SU (3), de manera que ei αa grupo. Considerando transformaciones infinitesimales tenemos q → q + i ϕa Ta q (313) Ta es un elemento del (314) Como los generadores T a en la representacion fundamental son matrices 3 × 3 tales que Ta = Ta† , esta claro que el elemento del grupo tambien sera una matriz 3 × 3, y por lo tanto q ha de ser un vector columna con 3 entradas: q1 q = q2 (315) q3 69 Es decir, q, ademas de los correspondientes indices spinoriales, tendra indices de color. Omitiendo los spinoriales, escribamos qa con a = 1, 2, 3. La teoria para un quark libre esta descrita simplemente por Z S= i q̄a (∂/ + m) qb δ ab (316) de manera que es invariante bajo SU (3). Siguiendo el ejemplo de QED, queremos hacer esta transformacion local. Eso exige de introducir un campo gauge cambiando ∂µ por Dµ tal que Dµ q = ∂µ q + i Aaµ Ta q (317) siempre y cuando los 8 –SU (3) tiene 8 generadores, es decir, 8 Ta ’s– Aaµ transformen como Aaµ → Aaµ + ∂µ ϕa + f abc Abµ ϕc (318) siendo f abc las constantes de estructura del algebra de SU (3). Es mas iluminador escribirlo como matrices llamando Aµ = Aaµ Ta –y analogamente para los parametros gauge ϕ = ϕa Ta –. Entonces Dµ q = (∂µ + i Aµ ) q Aµ → Aµ + ∂µ ϕ − i [Aµ , ϕ] (319) De esta manera Dµ q se transforma covariantemente, es decir, como q. Notese que al tener un grupo no abeliano –SU (3)– como base para la teoria, la transformacion gauge es un poquito mas complicada. De hecho, el tensor de campo es Fµν = ∂µ Aν − ∂ν Aµ + i [Aµ , Aν ] (320) Fµν → Fµν − i [Fµν , ϕ] (321) de manera que bajo transformacion gauge se transforma como Si construimos Z Tr Fµν F µν (322) debido a que la traza del conmutador es 0, tendremos un invariante gauge analogo al termino cinetico para el foton. Asi pues, todo junto –e introduciendo la constante de acoplo g, para QCD la accion es Z 1 / + m) q D µ q = ∂µ q + i g A µ q (323) S= − Tr Fµν F µν + i q̄ (D 4 Notese que al tener una teoria no abeliana, basada en SU (3), F contiene terminos cuadraticos en A sin derivadas. Estos terminos daran lugar a terminos en el lagrangiano de la forma AA∂A y AAAA, que se corresponden con vertices con 3 y 4 gluones respectivamente: los gluones interactuan entre si!!!!. Esto es muy diferente de QED y el germen 70 Z= electrones y fotones es Z DAµ D ¯ D ei d x 4 Fµ⌫ F +i (@µ +i e Aµ ) +m +J + J+Jµ A (234) 1 sin embargo mal definido, ¯ Fµ⌫ F µ⌫ + i ¯ µ (@µ +Esto i e Aesta (233)ya que debido a la invariancia gauge todos los Aµ µ) + m 4 conectados por Aµ ! Aµ + @µ ' son equivalentes. Asi pues la integracion funcional sobre Aµ ruta “cuenta de es mas” muchas configuraciones. Hay que eliminar esas redundancias, lo que La teoria cuantica se obtiene siguiendo la hoja de usual, decir, considerando el se puede de manera precisa –aunque aqui no vamos a entrar en ello en detalle–. funcional generador –que contiene toda la informacion de lahacer teoria– Z R 4 1 µ⌫ ¯ µ (@µ +i e Aµ ) +m ¯ +J¯ + ¯ J+Jµ Aµ Z = DAµ D ¯ D ei d x 4 Fµ⌫ F +i 6.2 Reglas de Feynman (234) S= d4 x Siguiendo nuestra hoja de ruta, Esto esta sin embargo mal definido, ya que debido a la invariancia gauge todosvamos los Aµa asumir que la constante de acoplo –en este caso carga pequegna, de manera que podemos hacer teoria de perturbaconectados por Aµ ! Aµ + @µ ' son equivalentes.laAsi puesdel la electron– integracionesfuncional sobre Para ello conocer las reglas de Feynman. Ya sabemos el propagador Aµ “cuenta de mas” muchas configuraciones. Hayciones. que eliminar esasnecesitamos redundancias, lo que delvamos fermion: se puede hacer de manera precisa –aunque aqui no a entrar en ello en detalle–. de la enorme diferencia entre QED y QCD. Aunque no vamose a hacer i (p/ + m)ningun calculo exD = 2 Reglas de Feynman p –es m2 decir, + i✏ plicit de6.2 QCD, escribamos las reglas de Feynman a modo grosero sin fijarnos en (235) propagador campo–en gauge cuanto es el foton– se podria calcular de manera Siguiendo nuestra hojanumericos de ruta, vamos etc– a asumirpara que El la hacernos constante dedelacoplo este–cuyo caso reglas exceso en los factores una idea las son como en la fig. analoga. Sin hacer embargo, como dijimos antes, debido a la invariancia gauge el calculo es la carga del electron– es pequegna, de manera que podemos teoria de perturbaun poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de (12). ciones. Para ello necesitamos conocer las reglas de Feynman. Ya sabemos el propagador Feynman–, cuando del fermion: i ⌘ µ⌫ i (p/ + m) D = 2 (236) (235) p + i✏ p2 m2 + i ✏ ultimo el vertice de interaccion, El propagador del campo gauge –cuyo cuanto es elPor foton– se podria calcular de manera que se puede leer directamente del lagrangiano ¯ µ aAµlada una regla gauge para elelvertice analoga. Sin embargo, como dijimos antes, debido invariancia calculodees2 fermiones y un foton un poco mas sutil. Contentemonos con el resultado en un gauge particular –gauge de V = ie µ (237) Feynman–, cuando De = D = i ⌘ µ⌫ Resumiendo p2 + µi ✏ (236) ⇠ g2 ⇠ gp Por ultimo el vertice de interaccion, que se puede leer directamente del lagrangiano ¯ µ Aµ da una regla para el vertice de 2 fermiones y un foton V = ie µ (237) Resumiendo 51 ⇠ g µ 51 Figure 12: Reglas de Feynman para QCD 7.2.1 QCD con varios flavors En realidad hay mas de un quark. Cada tipo de quark se llama flavor –sabor–. Supongamos Nf flavors. En general tendremos pues que QCD con varios flavors se describe como Z 1 / + m) qi i = 1 · · · Nf (324) S= − Tr Fµν F µν + i q̄ i (D 4 con Dµ qi = ∂µ qi + i g Aµ qi (325) Los quarks en realidad estan tambien cargados electricamente. Asi pues, considerando el sector de QCD mas sus interacciones electromagneticas S= Z 1 1 / − Fµν F µν − Tr Gµν F µν +i q̄ i (D+m) qi 4 4 Dµ qi = ∂µ qi +i g AQCD qi +i ei AQED µ µ (326) donde ei son las cargas electricas de cada flavor, el campo gauge del gluon, que QCD QCD a matricialmente es Aµ = [Aµ ]a T siendo Ta los generadores de SU (3), y AQED el µ campo gauge del foton, que no tiene indices de color, asi que podemos escribirlo como una identidad en espacio de SU (3), es decir, como AQED = AQED 1l3×3 . µ µ AQCD µ 71 La existencia de varios flavors se puede “medir” directamente en el experimento e+ e− → q q̄. Este expermiento es analogo al caso e+ e− → µ+ µ− que estudiamos en detalle: el diagrama y el calculo es exactamente el mismo, tan solo con la excepcion de que segun el tipo de quark saliente habra que poner la masa correspondiente en lugar de la del muon. Dichas masas son diferentes para cada quark. Podemos medir la seccion eficaz para la reaccion e− e+ → hadrones, que esta dominada por estos procesos e+ e− → q q̄. Como no vamos a fijarnos en un tipo de hadron particular en el estado final, sino que vamos a sumar cualquier hadron, todos los quarks contribuiran a esta seccion eficaz. Es decir, si nos fijasemos en estados finales con hadrones hechos de tales o cuales quarks los procesos relevantes serian aquellos con tales o cuales q q̄ en estados finales. Como incluiremos todos los hadrones, debemos considerar procesos mediados por cualquier tipo de quark. La seccion eficaz total para cada flavor sera una copia, con los factores adecuadamente adaptados, de la seccion eficaz total e+ e− → µ+ µ− que conocemos r 2 π α m2i m2i e i 1 − 1 + (327) σ(e+ e− → qi q̄i ) = 3 e 3 E2 E2 E2 Las masas de los leptones estan en la figura (13) Figure 13: Masas de los leptones Como se ve, hay una jerarquia bastante grande en las masas. Motivados por esto, asumamos que una jerarquia similar existe en los quarks. Asi pues, existiria un rango de energias E tal que un numero nf ≤ Nf de quarks cuayas masas mi << E para i = 1 · · · nf . Para ellos ei π α 2 σ(e e → qi q̄i ) = (328) e E2 De manera que la seccion eficaz total sera la suma de las secciones eficaces a cada tipo de quark, es decir + − + − σT (e e nf X ei π α2 → hadrons) = e E2 i=1 72 (329) Como E >> mµ , podemos normalizar por la seccion eficaz del proceso leptonico puro e+ e− → µ+ µ− , de manera que nf X σT (e+ e− → hadrons) ei R= = 3 σ(e+ e− → µ+ µ− ) e i=1 (330) Asi pues esto es sensible de manera discreta al numero de quarks con masa menor que E. Comparando con el experimento se ve que el factor 3 es necesario (es decir, QCD es SU (3), ya que ese es el origen del 3) y que la estructura de masas y cargas electricas de quarks es Figure 14: Masas de los quarks 7.2.2 La constante de acoplo de QCD Hasta ahora solamente hemos discutido los efectos a primer orden en teoria de perturbaciones. Es decir, hemos considerado solo procesos tree level sin incluir ningun loop. A ordenes superiores un “fenomeno” completamente crucial en teoria cuantica de campos orcurre: los diagramas divergen y nada parece tener sentido. Consideremos el ejemplo mas sencillo, en la teoria escalar λ φ4 en la figura (15). Figure 15: Ejemplo de diagrama divergente El diagrama vale M = −i λ Z d4 p i (2π)4 p2 − m2 + i 73 (331) Para estimarlo, pasemos al euclideo haciendo p0 = i pE 0 . En el euclideo la integracion sobre momentos es una integracion en R4 . Como el integrando depende solo de |~pE |2 , el trozo angular es facil. Olvidandonos de constantes numericas irrelevantes la integral va como Z Λ i dp 2 M∼λ (332) p + m2 0 donde hemos puesto un regulador para p grande. Evidentemente, para p muy grande, la integral diverge como λ p2 , de manera que la teoria ha de ser intrinsecamente definida con un cu-off Λ tal que |p| < Λ. Esto simplemente refleja el hecho de que las teorias de campos son teorias efectivas, y a partir de cierta escala Λ sencillamente dejan de capturar los grados de libertad relevantes. Sin embargo, a veces se pueden incluir los grados de libertad relevantes a energias mayores que Λ en la descripcion de baja energia ajustando los parametros: estas son las teorias cuyos acoplos son como mucho marginales. Estas teorias se dicen renormalizables, porque podemos meter la dependencia de Λ en los parametros λ, m. El precio a pagar es que λ y m ya no son constantes sino que dependen de la escala de energia a la que estemos probando la teoria. Volviendo a nuestra descripcion de QCD, lo mismo ocurre. El acoplo de la teoria –asi como el de QED– es marginal y la teoria es renormalizable. Eso resultara en un acoplo que en realidad depende de la energia, conocido como running coupling constant. Resulta que para QCD –normalmente se llama αs una vez metidos los correspondientes 4π 2 en g 2 – tiene el aspecto de la figura (16). Como se ve. . . a baja energia QCD esta fuertemente acoplada, mientras que a alta energia el acoplo tiende a cero. Esto es lo que se conoce como libertad asintotica y esta en el centro del escaleo de Bjorken. Para fotones muy energeticos los quarks se ven esencialmente libres dentro del proton. A baja energia la constante de acoplo se vuelve enorme. Evidentemente la teoria de perturbaciones –que ha sido la herramienta fundamental hasta ahora– no es valida. Aunque no se sabe demostrar ni se entiende el mecanismo fundamental, esta claro que lo que ocurre es que a baja energia las fuerzas entre quarks son enormes. De hecho es como si los quarks en los hadrones estuviesen atados por cuerdas, de manera que si estan separados por distancias menores que el tamagno de la cuerda se ven como libres, mientras que si intentamos separarlos mas que la cuerda esta nos lo impide. Esta “cuerda” genera un potencial lineal de interaccion V ∼ r. Como mucho podemos romper la cuerda, pero al romperla en cada extremo se crea un nuevo quark, de manera que los quarks nunca se ven libres a baja energia. Esto es el confinamiento responsable de la existencia de los hadrones. QED es sin embargo muy diferente en su comportamiento. La razon esta en que al ser el grupo abeliano, el foton no interactua consigo mismo. Eso lleva a que en lugar de ser debilmente acoplada a alta energia y fuertemente acoplada a baja energia sea al reves. Es decir, QCD es libre en el infrarrojo. El que su constante de acoplo crezca a altas energias querria indicar que, pese a ser renormalizable, QED no podria ser una teoria fundamental, ya que a altas energias su definicion en terminos de electrones y fotones rompe. 74 Figure 16: La constante de acoplo de QCD 7.2.3 Hadrones y el infrarojo de QCD Como QCD exhibe confinamiento, a baja energia solo podremos ver estados que sean neutros bajo SU (3). Podemos leer los posibles singletes de la tabla (14), ya que las cargas electricas fraccionarias son otra manifestacion de que los quarks a baja energia solo se ven en singletes de color con carga electrica entera. Consideremos las combinaciones singletes bajo SU (3) uud y ddu. Su carga electrica es respectivamente 1 y 0. Son el proton y el neutron. Notese que la masa de sus quarks constituyentes es respectivamente 0.02 GeV y 0.015 GeV , mientras que su masa real es de aproximandamente 1 GeV . Esto quiere decir que la energia de ligadura es enorme, como es de esperar en una teoria fuertemente acoplada. 7.2.4 Simetria quiral en QCD Ya que los quarks mas ligeros son el u y el d, que tienen una masa bastante pequegna, a bajas energias podemos considerar que son los unicos relevantes y que son basicamente de 75 masa cero. En tal caso QCD tiene simetria quiral analoga a la de QED. En realidad la simetria es un poco mayor por tener dos especies de fermiones sin masa (u y d). El trozo que contiene los fermiones es Z / + m) qi q̄i (D qi = (u, d) (333) Esto tiene una simetria global SU (2), ya que podemos transformar qi → Uij qj (334) siempre y cuando U U † = 1, l es decir, con una rotacion U (2) en espacio de flavor.17 Al igual que para QED, esta simetria de flavor es quiral por tener fermiones sin masa. Asi pues la simetria global es U (2)L × U (2)R . Como U (2) = SU (2) × U (1), podemos escribir la simetria global como SU (2)L × SU (2)R × U (1)L × U (1)R . Asi pues tendremos corrientes conservadas para estos 4 factores para qL, R . Mezclandolas para formar las combinaciones axial y vectorial, tenemos dos simetrias axiales jUµ (1)A = q̄i γ µ qi µ µ a jSU (2)A = q̄i γ qj σij (335) donde una es U (1) y la otra es SU (2) –de ahi que aparezcan las matrices de Pauli–. Resulta ser que a baja energia el bilineal de quarks q̄i qi toma un VEV por efecto de la dinamica de acoplo fuerte, no perturbativa, de QCD. Es decir h q̄i qi i = h u†L uR + u†R uR + d†L dR + d†R dR i = 6 0 (336) Esto implica que las rotaciones quirales no son una simetria a baja energia, ya que no dejarian invariante este VEV. Solo las transformaciones diagonales de U (2)L × U (2)R –es decir, las que transforman igual left y right– dejan invariante el VEV. Como esta ruptura es espontanea, por argumentos muy generales, debido al teorema de Goldstone (ver apendice. Lo discutiremos en mas detalle mas adelante) debemos esperar una particula sin masa por cada generador roto –en este caso 4–. Asi pues, a baja energia en QCD debemos esperar 4 particulas casi sin masa. Sin embargo la corriente para U (1)A es anomala, lo que quiere decir que aunque sea una simetria clasica, los efectos cuanticos la rompen. Asi pues uno de las 4 particulas masivas no esta protegida –de hecho no teniamos 4 generadores conservados para empezar, sino solo los 3 asociados a SU (2)A – y adquiere masa mayor. Debemos pues esperar 3 particulas con masa muy pequegna –porque al final u, d tienen una masa pequegnita–: los 3 piones!!!! Ademas de estos, u, d se combinan en proton y neutron. Por lo tanto, a baja energia, la fisica de QCD debe estar descrita por una teoria efectiva de la forma Z m2 1 ∂µ π ∂ µ π − π π 2 + n̄i γ µ ∂µ ni − mn n̄i ni − λ n̄i γ5 nj π (337) S= 2 2 17 En el caso de QED que discutimos teniamos un solo fermion, asi que la simetria de flavor era simplemente U (1). 76 que es el lagrangiano que escribimos antes y que da lugar al potencial de Yukawa. El SU (2)A no anomalo es de hecho el isospin de las interacciones nucleares: es la simetria SU (2) global que la teoria de arriba tiene. 8 La fuerza electrodebil Es un hecho que el neutron se desintegra β produciendo un proton y un electron observables. Como estas dos particulas no dan para satisfacer la conservacion de la energia y el momento, Pauli postulo la existencia de una nueva particula, el neutrino –que Cowan y Reines descubrieron experimentalmente despues–. Asi pues, el neutron se desintegra en un proton, un neutron y un neutrino. Sin embargo, ni las interacciones fuertes ni las electromagneticas pueden ser las responsables de esto, indicando la existencia de una nueva fuerza: la fuerza debil. 8.1 Teorias con vertices de 4 fermiones El proceso que describimos antes es neutron → proton + e− + ν. Como el proton es uud mientras que el neutron es udd, esta claro que la reaccion detras del decay β es d → u + e− + ν. Este proceso, ya que involucra una parte de QCD, es complicado. Existen otros procesos analogos que solo involucran leptones –sin carga de color–. Un ejemplo es µ → 2 ν + e− .18 Esto sugiere que nuestra teoria fundamental ha de contener un vertice con 4 fermiones tal que Z GF (338) − √ (ν̄ µ) (ē ν) 2 La constante de acoplo –que tiene dimensiones de E −2 , es decir, es irrelevante– se llama constante de Fermi, y comparando con el experimento, se puede fijar su valor. El problema es sin embargo que la teoria de Fermi tiene una constante de acoplo irrelevante, y es por lo tanto no renormalizable. Esto implica que ha de ser pensada como −1/2 una teoria efectiva por debajo de la escala GF ∼ 200GeV . 8.2 Teorias para campos gauge con masa Siguiendo el ejemplo de QED y QCD –cuyas fuerzas estaban mediadas por campos gauge– es natural pensar que detras de la interaccion debil este tambien una teoria gauge. Sin embargo, la fuerza debil es de corto alcance, lo que pone de manifiesto su escala caracteris−1/2 tica de GF ∼ 200GeV . Eso implica que el “potencial de interaccion” en lugar de ser 1/r como para el foton –es decir, de alcance infinito– debe decaer mas rapido y ser mas bien parecido al potencial de Yukawa e−M r r, donde M es la escala de masas caracteristica de esos ∼ 200GeV . Un comportamiento asi lo tendriamos si considerasemos un campo gauge Wµ con masa, esquematicamente 18 En realidad los 2 neutrinos son νµ + ν̄e . Esto lo discutiremos despues. 77 S= Z −Fµν F µν − M 2 Wµ W µ (339) Donde esa masa M , constantes numericas a parte, son basicamente esos 200GeV ’s. Aqui hemos supuesto arbitrariamente un grupo U (1) por sencillez, pero el aspecto a grandes rasgos de la teoria seria el mismo. El problema es, obviamente, que la simetria gauge Wµ → Wµ + ∂µ ϕ esta explicitamente rota por el termino de masa: si M 6= 0, simplemente la transformacion gauge no es simetria. Aunque esto es un problema enorme –porque entonces, aun pese a solo contener acoplos marginales, la teoria no seria renormalizable e indicaria la existencia de nueva fisica a partir de cierta escala–, tomemos de momento una actitud pragmatica: si dicha nueva fisica estaria suficientemente lejos en energias, a efectos practicos seria irrelevante. Asi pues consideremos la teoria del campo vectorial masivo per se. Supongamos ahora que acoplamos este campo de juguete a un fermion de masa m con carga g bajo Wµ Z / + m) ψ S= −Fµν F µν − M 2 Wµ W µ + i ψ̄ (D (340) La unica diferencia con el caso con M = 0 en las reglas del Feynman es que el propagador del campo gauge seria i η µν i η µν → q2 p2 − M 2 (341) Consideremos ahora el diagrama 2 ψ → 2 ψ (que es como el e− e+ → µ− µ+ ). El diagrama valdria M ∼ g 2 (ū γ µ u) η µν (ū γ ν u) q2 − M 2 (342) Para interacciones a baja energia, cuando el momento transferido q 2 sea mucho menor que la masa del campo gauge q 2 − M 2 ∼ −M 2 , de manera que η µν g2 ν (ū γ u) ∼ (ū γ µ u) (ū γ ν u) (343) 2 2 2 q −M M Es decir, recuperariamos la misma prediccion que la teoria de Fermi –que explica el experimento– con M ∼ g 2 (ū γ µ u) g2 (344) M2 Por lo tanto en efecto podriamos imaginar una teoria gauge –en pie de igualdad pues a las demas fuerzas fundamentales– que reproduzca la teoria de Fermi, si bien al precio –de momento abusivo!!!!– de que la teoria ha de ser no renormalizable. Sin embargo –ya que este problema tendra solucion en un momento–, un problema mas fundamental es que esta teoria de juguete en realidad no explica lo que ocurre en el experimento. En la reaccion GF ∼ 78 µ → 2 ν + e− no hay manera de, separando de dos en 2 los constituyentes para agruparlos en los dos vertices fermion+fermion+boson mediador involucrados, de encontrar sitio al modelo sencillo de arriba, ya que la carga electrica no se conservaria. Eso implica que el boson gauge W ha de estar cargado bajo el campo electromagnetico!!! La solucion a este ultimo problema esta intimamente ligada a la solucion del problema de la no renormalizabilidad: la ruptura espontanea de la simetria (ver apendice). 8.3 Ruptura de simetria local Supongamos que hacemos local la simetria U (1) que esta rompiendo espontaneamente en un modelo con un potencial de sombero mejicano. Consideremos pues S= Z 1 1 1 d4 x − Fµν F µν + |Dµ φ|2 − m2 |φ|2 −λ |φ|4 4 2 2 Dµ φ = ∂µ −i e Aµ φ Fµν = ∂µ Aν −∂µ Aν (345) Con m2 > 0, de manera que el vacio es φ0 = r r φ0 = ( − m2 i θ 0 e 4λ (346) m2 + ρ) ei(θ0 +p) 4λ (347) − Para ρ, p pequegnos encontramos Z 1 1 φ2 (348) S ∼ d4 x − Fµν F µν + ∂ρ2 − 4 λ φ20 ρ2 + 0 (∂µ p + i e Aµ )2 4 2 2 Podemos ahora escoger un gauge en el que p = 0, teniendo Z 1 1 e2 φ20 S ∼ d4 x − Fµν F µν + ∂ρ2 − 4 λ φ20 ρ2 + Aµ Aµ (349) 4 2 2 Es decir, al fijar el gauge reabsorbiendo p –que seria el boson de Goldstone de masa 0 si la simetria fuese global– en Aµ , el campo gauge se transformo en un campo masivo de masa M 2 ∼ e2 φ20 , mientras que la unica traza que quedo del escalar original es la fluctuacion ρ de masa m ∼ λ φ20 , es decir (−m2 ) e2 m2escalar masivo ∼ (−m2 ) (350) λ Evidentemente si hubiesemos tenido fermiones extra en la teoria todo esto seguiria siendo valido. La moral del asunto es pues que agnadiendo un sector escalar acoplado al campo gauge con un potencial de sombrero mejicano, al romperse espontaneamente la simetria gauge el boson de Goldstone puede ser reabsorbido por el campo gauge, que gana asi un grado de libertad extra y se convierte en masivo. Por lo tanto recuperariamos el 2 Mvector masivo ∼ 79 modelo que vimos antes del campo gauge masivo que, a baja energia a su vez recuperaba la teoria de Fermi con un vertice de cuatro fermiones. Sin embargo, a traves de todo este proceso hemos conseguido embeber la teoria de Fermi en una teoria gauge para un campo gauge de verdad –es decir, en donde la simetria gauge si se respeta–. Asi pues, el modelo con campo φ y potencial de sombrero mejicano si es renormalizable y, a baja energia, recupera la interaccion de 4 fermiones necesaria para entender la interaccion debil. A este campo φ responsable de romper la simetria gauge se le llama campo de Higgs, y deja el ρ como traza final a baja energia. Nos queda aun entender como producir, una vez adquieren masa los campos gauge, campos vectoriales electromagneticamente cargados. Para ello la clave es considerar un grupo un poco mas complicado que el modelo de juguete U (1). Consideremos SU (2)L × U (1)Y . Esto tiene 4 generadores: 3 en SU (2) y uno en U (1). Supongamos ahora un Higgs cargado bajo el U (1)L ∈ SU (2)L y sobre U (1)Y con carga opuesta, es decir, cargado bajo U (1)L − U (1)Y . Al tomar el Higgs VEV este U (1)Y − U (1)L se rompe espontaneamente, asi como el SU (2). Sin embargo la combinacion U (1)L + U (1)Y no se rompe. Por lo tanto, de los 4 vectores gauge originales 3 se harian masivos y uno quedaria sin masa. Este sin masa es el foton, es decir, U (1)L + U (1)Y = U (1)QED . Entre los otros 3 masivos, como U (1)L − U (1)Y es ortogonal a U (1)QED , tendriamos uno neutro bajo el electromagnetismo y dos cargados. Esos serian los 2 W ± responsables de decaimientos tales como el del muon que describimos arriba. El campo vectorial masivo daria lugar a otros procesos parecidos a los de QED solo que de corto alcance. Es el Z 0 . Esta es de hecho la estructura que se ve experimentalmente: este es el germen del Modelo Estandard (SM). Lo veremos explicitamente en la subseccion siguiente. 8.4 El sector bosonico del SM: gauge+Higgs El sector bosonico del SM contiene todos los bosones vectoriales y el Higgs de spin 0. Como dijimos, de cara a tener bosones vectoriales cargados en una teoria gauge necesitamos un grupo de gauge SU (2)L × U (1)Y –el Y significa hypercarga, y el L left. Veremos luego el por que del nombre left–. El Higgs es fundamental del SU (2)L y esta cargado bajo U (1)Y . Asi pues, introduciendo un campo por cada particula, el trozo bosonico del SM es Z 1 1 λ2 † 2 1 2 b − FB2 + (Dµ φ)† Dµ φ) − µ2 φ† φ − (φ φ) (351) SSM = − Tr FW 4 4 2 2 Donde Wµ = Wµa σa es el campo gauge de SU (2)L y Bµ el de U (1)Y , siendo los tensores de campo lo usual (FW )µν = ∂µ Wν − ∂ν Wµ + i g [Wµ , Wν ] (FB )µν = ∂µ Bν − ∂ν Bµ Donde g, g 0 son las constantes de acoplo respectivas. Como el Higgs es fundamental de SU (2)L lo podemos escribir como + φ φ= φ0 80 (352) (353) De manera que la derivada covariante es Dµ · = ∂µ · +i g Wµ · +i g0 Y Bµ · 2 (354) siendo Y la hypercarga, que para el Higgs es 1. El minimo del potencial escalar, cuando −µ2 > 0, esta en φ† φ = |φ+ |2 + |φ0 |2 = −µ2 λ2 (355) −2 µ2 λ2 (356) Escojamos el vacio φ0 = 0 √v 2 v2 = Par ver la masa de los campos vectoriales simplemente debemos enchufar este vacio y sus fluctuaciones en la accion. Escogiendo el gauge tal que fijamos la fase a 0, y congelando las fluctuaciones del modulo, podemos fijarnos simplemente en Z 1 1 1 2 b − FB2 + (Dµ φ0 )† Dµ φ0 ) (357) SSM = − Tr FW 4 4 2 Donde Dµ φ0 = 0 i g Wµ3 + i g2 Bµ i g (Wµ1 − i Wµ2 ) 0 i g (Wµ1 + i Wµ2 ) −i g Wµ3 + i g2 Bµ 0 √v 2 = ! i g (Wµ1 − i Wµ2 ) √v2 0 −i ( g Wµ3 − g2 Bµ ) √v2 (358) Es evidente que es util definir 1 Wµ± = √ Wµ1 ∓ i Wµ2 2 Ademas es util definir el angulo de Weinberg (359) g0 = tan θW g (360) De manera que Dµ φ0 = −i cosgθW i g v Wµ+ (cos θW Wµ3 − sin θW 12 Bµ ) √v2 (361) Es obvio que es ademas util definir Zµ0 = cos θW Wµ3 − sin θW Bµ 2 Aµ = cos θW Wµ3 + sin θW De manera que 81 Bµ 2 (362) Dµ φ0 = i g v Wµ+ gv Zµ0 −i √2 cos θ W Con lo que en la accion efectiva aparece un termino de masas Z 1 2 MW (W + )µ (W − )µ + MZ2 (Z 0 )µ (Z 0 )µ 2 Con MZ = gv cos θW MW = g v (363) (364) (365) Para estudiar el termino cinetico, podemos darnos cuenta de que F W es una matriz de SU (2), y por lo tanto de traza cero. Asi pues, si escribimos B = Bµ 1l2×2 y hacemos Tr µν FW 1 µν 2 1 2 √ 2 2 √ + = Tr FW + FB + 2 FW FB = Tr FW + FB2 FB 2 2 (366) ya que en espacio de SU (2)L FB F W es proporcional a un generador de SU (2), que es de traza cero. Ahora podemos estudiar FW + √12 FB . Eso es h i h i 1 l (FW + )µν +2 i (Wµ+ Wν3 −Wν+ Wµ3 ) σ + + (FW − )µν +2 i (Wµ− Wν3 −Wν− Wµ3 ) σ − (FW 3 )µν σ 3 + √ (FB )µν 1+ 2 (367) σ1 ± i σ2 i ± √ . Fijemonos en esos Donde FW i = ∂[µ Wν] y analogamente para B. Ademas σ = 2 ± + terminos con σ . El coeficiente de, por ejemplo, σ es (FW + )µν + 2 (Wµ+ Wν3 − Wν+ Wµ3 ) = (∂µ − 2 i Wµ3 ) Wν+ − (∂ν − 2 i Wν3 ) Wµ+ (368) Es decir, el termino cinetico para W ± esta escrito en terminos de una derivada covariante con Wµ3 como campo gauge. Como Wµ3 es una suma de Zµ0 y Aµ , en efecto vemos que los bosones gauge W ± estan cargados electricamente, justo como necesitabamos para las interacciones debiles que median decaimientos β o el decay del muon de antes. Al igual que en los modelos de juguete de arriba, al expandir el lagrangiano alrededor de φ0 , y tras reabsorver la fase en la masa de {W ± , Z 0 }, acabaremos con un escalar neutro H debido a las fluctuaciones de φ. Dicho escalar esta asociado una particula escalar: el boson de Higgs –descubierto recientemente con una masa de unos 125GeV –. 8.5 La materia del SM Ademas del sector de campos gauge + Higgs, el SM contiene materia fermionica –evidentemente!!!– . En principio uno pensaria que necesitamos un campo de Dirac por cada particula. La realidad es mas compleja: la Naturaleza no respeta las simetrias discretas bajo conjugacion 82 de carga, paridad e inversion temporal –todas juntas si, ya que CP T debe ser una simetria para que el H sea hermitico–. Aqui no entraremos en mucho detalle en ello. Nos bastara con que esa violacion de simetrias discretas implica que debemos construir la materia no con spinores de Dirac, sino con Weyls, es decir, implica que el SM es una teoria quiral. La materia viene organizada en 3 familias, a su vez divididas en un sector leptonico que no tiene carga de color y un sector de quarks, que si tiene carga de color. Tanto quarks como leptones se acoplan a las interacciones debiles y electromagneticas, esto es, a SU (2)L × U (1)Y . Las 3 familias son identicas la una a la otra (salvo por las masas), asi que para empezar vamos a considerar una sola familia: la mas ligera. Fijemonos primero en el trozo leptonico. Este se acopla a SU (2)L × U (1)Y . Como ha de ser fundamental de SU (2)L necesitamos un doblete de campos, que, debido a la quiralidad del SM, seran left. Dichos dos campos son el electron y el neutrino. Asi pues, formemos νe L= (369) e L donde el subindice L nos recuerda que son spinores left, es decir, obtenidos agarrando un Dirac e y haciendo por ejemplo 1l − γ 5 e (370) 2 Necesitamos tambien campos right –por ejemplo para cancelar anomalias. Hablaremos de esto despues–. Esos son singletes bajo SU (2)L . Resulta que solo el compagnero right del electron existe. LLamaremos eL = R = eR (371) donde el subindice R nos recuerda que es un campo right 1l + γ 5 e (372) 2 Notese que no estamos poniendo un compagnero right para el neutrino. No esta claro que tal particula exista –aunque si es cierto que el neutrino tiene masa–. Siguiendo el proceso usual de escribir el lagrangiano del spinor y promover las derivadas a derivadas covariantes, esta claro que el trozo leptonico sera eR = f1 S = Z L̄ i γ µ (∂µ + i g Wµ + i g0 g0 Y Bµ ) L + R̄ i γ µ (∂µ + i g Wµ + i Y Bµ ) R 2 2 Igualmente, para el sector de quarks tendremos un doblete left u QL = d L 83 (373) (374) Y un par de singletes right (aqui si ponemos los dos compagneros right) uR dR (375) El trozo de quarks sera analogo al leptonico pero incluyendo en la derivada covariante el acoplo al campo del gluon. Concentremonos en los leptones, de todos modos. Las otras familias tienen la misma estructura L1 = νe e L2 = L R1 = eR 8.5.1 νµ µ L3 = L R 2 = µR ντ τ L R3 = τR Interacciones en el SM Fijemonos en la derivada covariante. La podemos escribir como Dµ = ∂µ + i g Wµ+ σ + + i g Wµ− σ − + i Vayamos trozo a trozo g g σ 3 − Y Zµ0 + i σ 3 + Y Aµ (376) 2 cos θW 2 cos θW • Corrientes cargadas: los W ± se acoplan a la materia a traves de los operadores escalera en SU (2)L –los σ ± . Eso quiere decir que el SM contiene vertices en los que cambiamos un miembro de los dobletes SU (2) por otro. Como el electron tiene electrica -1 y el neutrino 0, esta claro que el boson mediador –los W ± – ha de estar cargado. • Corrientes neutras: el Z 0 se acopla a traves de σ 3 − Y , que es diagonal en espacio de SU (2). Por eso no cambia miembros del doblete. Sus interacciones son como las del foton, tan solo que masivo. • Corrientes electromagneticas: el acoplo al foton –diagonal en espacio de SU (2)L 3 evidentemente– es a traves de la carga electrica Q = T 3 + Y2 , donde T 3 = σ2 . El valor numerico lo da e = g/ cos θW . Ya que el electron ha de tener carga -1 y el neutrino 0, esto fija las siguientes asignaciones de hypercarga σ3 Y Q eL − 12 −1 −1 νL 1 2 −1 eR 0 −2 −1 84 0 (377) Para los quarks la cosa es un poco mas complicada uL σ3 Y Q 1 2 1 3 2 3 dL − 12 − 31 uR 0 dR 0 4 3 1 3 (378) 2 3 − 23 − 31 Un comentario esencial, aunque un poco misterioso a este nivel, es que con este contenido de materia y asignaciones de cargas todas las interacciones gauge son no anomalas –lo que es un requisito indispensable–. Ademas, entre las simetrias globales, resulta que hay unas anomalas y otras no anomalas. Aunque no lo vamos a discutir mas en detalle, remarcablemente estas anomalias son tales que el proton es exactamente estable en el SM. Notese que no hemos puesto una masa. La razon es que sencillamente no es posible, ya que, siendo una teoria quiral, no podemos escribir un termino de masa. Por otra parte, aun podemos escribir un termino marginal compatible con todas las simetrias Z yuk S = −λ1 L̄ φ R + h.c (379) Como el Higgs es fundamental de SU (2)L y L̄ es antifundamental, L̄ φ contiene un singlete, que multiplicado por R, que tambien es singlete, da un termino invariante gauge. Este termino es un termino de interaccion. Es un vertice de Yukawa con 2 fermiones y el Higgs. Al tomar este el VEV Z λ1 v yuk (380) S = − √ ēL eR + h.c 2 y obtenemos un termino de masa efectivo para el electron. La masa del electron es asi pues λ1 v me = √ (381) 2 Es decir, es el VEV del Higgs multiplicado por el Yukawa que regula el acoplo de electron a Higgs. Desde este punto de vista, la jerarquia de masas del SM es en realidad una jerarquia de acoplos de Yukawa. Evidentemente, expandiendo los Yukawas encontraremos acoplos al Higgs. Notese que el neutrino nos sale de masa 0. En realidad tiene una masa muy pequegna –las oscilaciones de neutrinos asi lo exigen–, pero no esta completamente claro si es debido 85 a la existencia de νR o a la llamada masa de Majorana.19 Asi pues, el trozo leptonico del SM es S lepton = 8.5.2 Z L̄i i γ µ (∂µ +i g Wµ +i g0 g0 Y Bµ ) Li +R̄i i γ µ (∂µ +i g Wµ +i Y Bµ ) Ri −λi Li φ Ri +h.c. 2 2 (382) Violacion de CP y CKM Cuando introdujimos los Yukawas asumimos que eran diagonales en las generaciones. En general podriamos haber escrito Z −λij L̄i φ eiR + h.c. (383) Donde eiR es el “electron” right de cada generacion (es decir {eR , µR , τR }). Sin embargo, podriamos redefinir eiR = Wij ejR Li → Uij Lj (384) tal que ? ij Uik λ Wjp = λk δkp (385) Como esta transformacion conmuta con SU (2)L × U (1)Y , encontrariamos la teoria que hemos escrito desde el principio. Sin embargo, en el sector de quarks la cosa es muy diferente, porque existen tanto dR como uR . Por lo tanto los Yukawas mas generales son Z ij i a b i −λij (386) u Q̄i φ uR − λd Q̄i φ ab dR + h.c. siendo a, b los indices de SU (2)L . Notese que el efecto del segundo termino, una vez enchufado aqui quien es el VEV de φ, es darle masa al d. Como no hay neutrino right, escribir este segundo termino para los leptones no lleva a nada nuevo. Intentemos ahora redefinir los campos para diagonalizar los Yukawas. Para ello es mejor meter el VEV del Higgs aca y estudiar los terminos efectivos de masa, que son (esquematicamente) Z j ij ¯i i i (387) −λij u ūL uR − λd dL dR Esta claro que si hacemos el mismo truco que antes 19 Como el neutrino es electricamente neutro podria ser su propia antipartcula. En tal caso es posible escribir un termino de masa. No esta claro que el neutrino sea Majorana. 86 uiL → Uuij ujL uiR Wuij ujR diL → Udij djL diR Wdij djR (388) (389) (390) conseguiremos diagonalizar los Yukawas escogiendo apropiadamente las matrices. Pero, como en general Ud 6= Uu , esta transformacion no transformara igual las dos componentes del doblete de SU (2)L . Como la interaccion que mezcla las dos componentes del doblete es a traves de los W ± , lo que ocurrira es que para los quarks la derivada covariante sera g g σ 3 −Y Zµ0 +i δ ij σ 3 +Y Aµ 2 cos θW 2 cos θW (391) ij † donde esos V son las entradas de la matriz Uu Ud , y son en general numeros complejos. Esta matriz es la matriz de Cabbibo-Kobayashi-Maskawa (CKM). El que la matriz CKM sea en general compleja20 tiene una consecuencia dramatica: el SM viola la simetria CP si CKM tiene entradas complejas. Resulta que si las tiene y el SM viola CP –aunque, como todos los parametros del SM, no se entiende por que–. En el SM hay otra fuente de violacion de CP: si agandimos el termino topologico para el campo del gluon Z θ Tr Gµν Gαβ µναβ (392) 2 16π introducimos nueva fuente de ruptura explicita de CP. No discutiremos aqui mas sobre esto, solo mencionar que θ resulta ser minusculo, casi cero pero no del todo. El por que de esto tampoco se entiende. Dµij = δ ij ∂µ +i g V ij Wµ+ σ + +i g (V † )ij Wµ− σ − +i δ ij 8.5.3 Neutrinos Los neutrinos formar parte del doblete de SU (2)L junto con el correspondiente lepton cargado de cada familia –eletron, muon y tau–. Asi pues han de ser de 3 tipos: νe , νµ , ντ . Como los neutrinos interactuan solo a traves de las corrientes cargadas/neutras, y su constante de acoplo es muy pequegna, sus interacciones son muy raras. Es por eso que para estudiarlos se deben usar fuentes que emiten muchos neutrinos, como el sol. Sin embargo, entre 1960 y 2002 esto fue fuente de un gran misterio: la cantidad de neutrinos del electron esperada era simplemente diferente –mucho menor– que la esperada. La resolucion de dicho puzzle –propuesta ya por Pontecorvo et al. en 1968– es que si los neutrinos tuviesen masa, y esta fuese muy peqeugna, podrian oscilar unos en otros. La 20 Eso requiere al menos 3 familias de quarks, ya que de lo contrario la fase compleja se puede reabsorver. De hecho Cabbibo fue el primero en darse cuenta de esta mezcla en los quarks, lo que ocurrio cuando solo se conocian dos quarks. Eso lleva a una matriz real. Sin emabargo mas tarde se descubrio que el SM viola CP y en un intento de explicarlo, Kobayashi y Maskawa propusieron la existencia de una nueva familia, de manera que la matriz V pudiese tener entradas complejas. Cabbibo se perdio el premio Nobel. 87 razon es que si los neutrinos tuviesen masa entonces habria tambien una matriz tipo CKM –llamada ahora Pontecorvo-Maki-Nakawata-Sakata, PMNS– que haria que la interaccion del neutrino fuese tambien del tipo Z ēiL W + U ij νLj (393) Es decir, la interaccion debil no seria diagonal en la base νLi = {νe , νµ , ντ }. Llamemos a esta base que diagonaliza el termino cinetico –el ∂/– como νP , es decir νPi = {νe , νµ , ντ }; y a la base que diagonalizaria la interaccion νIi = {νeI , νµI , ντI }. Supongamos un neutrino producido –por ejemplo en el sol– en t0 a traves de algun proceso electrodebil. Como la base νI diagonaliza la interaccion, se produce como νI . La matriz de PMNS permite reescribir dicho estado en terminos de los autoestados del hamiltoniano libre, de manera que el estado de un neutrino en t0 se escribe como |νIi (t0 )i = U ij |νPj (t0 )i (394) El operador evolucion para la particula libre –el neutrino casi no interactua!– nos permite conocer el estado en un instante t –escojamos t0 = 0 por sencillez de la notacion– |νIi (t)i = U ij e−i Ĥ t |νPj (t0 )i (395) |νIi (t)i = U ij e−i Ei t |νPj (t0 )i (396) Como los |νPi i diagonalizan el termino cinetico, son autoestados del hamiltoniano libre con √ autovalor Ei = p~ + mi Para detectar este neutrino en la tierra lo hacemos midiendo la interaccion a traves de algun proceso debil con otro lepton, supongamoslo del tipo j. La probabilidad de interaccion sera pues proporcional al modulo de la proyeccion de |νIi i sobre |νIj i, es decir, a |h νIj | νIi (t)i|2 . Por hacer mas sencillas las cosas, supongamos que solo dos neutrinos estan involucrados. Llamemos a la base de propagacion {νe , νµ y a la de interaccion ν1 , ν2 . Entonces podemos escribir cos θ − sin θ U= (397) sin θ cos θ De manera que θ parametriza la mezcla. Entonces |ν 1 (t)i = e−i Ee t cos θ |νe i − e−i Eµ t sin θ |νµ i (398) |ν 2 (t)i = e−i Ee t sin θ |νe i + e−i Eµ t cos θ |νµ i (399) Entonces la probabilidad de detectar un neutrino tipo 2 si empezamos con uno tipo 1 es 88 h ν 2 | ν 1 (t)i = sin θ hνe | + cos θ hνµ | e−i Ee t cos θ |νe i − e−i Eµ t sin θ |νµ i que, asumiendo νe, µ ortonormales, es 2 1 −i Ee t −i Eµ t h ν | ν (t)i = sin θ cos θ e −e = sin 2θ sin(Ee − Eµ ) t (400) (401) De entrada, es obvio que si mνe = mνµ el elemento de matriz es cero. Necesitamos de una diferencia de masas en los neutrinos. Como por otra parte las masas son en cualquier caso pequegnas, podemos asumir los neutrinos ultrarrelativistas, es decir Ee − Eµ = q p~2 + m2νe − q p~2 + m2νµ = |~p| s m2 1 + 2νe − p~ s 1+ m2νµ p~2 ∆m2 ∼ 2 |~p| (402) Con ∆m2 = m2νe − m2νµ , de manera que la probabilidad es P1→2 = sin2 2θ sin2 ∆m2 t 2 |~p| (403) Como la particula es ultrarelativista E = |~p| c, de manera que t/|~p| = t c/E, pero t c = L, la distancia recorrida entre la emision y la deteccion, de manera que ∆m2 L (404) P1→2 = sin 2θ sin 2E Es decir, existe una probabilidad no cero de oscilacion si θ 6= 0 y si m 6= 0, lo que explica el problema de los neutrinos solares. Esto parece funcionar muy bien, con la salvedad de que. . . como dijimos, en el SM tal cual, el el sector leptonico no hay νR . Eso lleva a que no se pueda construir un termino de masa para el neutrino, con lo que no queda sitio ni para la matriz de mezcla ni para la masa del neutrino. No esta clara la solucion del puzzle. Una posibilidad es que puede ser que el neutrino sea una particula de Majorana –que sea su propia antiparticula–. Esto permitiria escribir un termino de masas. Esto implicaria que ciertos procesos de decaimiento β en los que se tuviese en el estado final un neutrino de menos deberian obervarse (neutrinoless β decay). Otra manera natural de implementar esto es es que existiese νR , ν̄L , me manera que podamos construir un termino de masa (de Dirac y Majorana!) 0 mD νR mD (ν̄L νR + ν̄R νL ) + mM ν̄L ν̄R = νL , ν̄L (405) mD mM ν̄R 2 2 Si tomamos la matriz de masa y la diagonalizamos, los autovalores son p mM ± 4 m2D + m2M m± = 2 89 (406) Si mM >> mD los autovalores son mD mD m− ∼ mM (407) mM es decir, la nuevas componente serian muy pesadas –y por eso no las habriamos visto– mientras que las viejas componentes tendrian una masa suprimida por mD /mM , es decir, minuscula. Este mecanismo es el llamado seesaw mechanism: subiendo la masa de un tipo de neutrinos a una escala muy grande, la masa del otro tipo de neutrinos se hace minuscula. Esto implicaria la existencia de una nueva escala –mM – de nueva fisica. En cualquier caso, la resolucion de este puzzle no esta aun clara. m+ ∼ − A El grupo de Lorentz Dejando de lado gravedad, la relatividad especial establece que culaquier fenomeno ocurre en el espacio de Lorentz. Dicho espacio es un espacio vectorial de 4 dimensiones con metrica ds2 = dxµ ηµν dxν ηµν = diag(1, −1, · · · , −1) (408) Las transformaciones que dejan invariante ds2 forman el grupo de Poincare –en realidad dicho “grupo” contiene el grupo de Lorentz junto con las translacciones–. El postulado fundamental es que las leyes de la Fisica son covariantes bajo transformaciones del grupo de Poincare. El grupo de Poincare contiene translacciones, boosts y rotaciones. En lo que sigue nos olvidaremos de las translacciones y solo consideraremos boosts y rotaciones, es decir, el grupo de Lorentz. A.1 Rotaciones en 3d La definicion del grupo de Lorentz como aquel que deja invariante el intervalo es muy reminiscente de algo muy familiar: el grupo de rotaciones. Consideremos un vector ~x en R3 . La norma –longitud– de dicho vector es |~x|2 = ~xT · ~x = xi xj δij (409) Por definicion, una rotacion es una transformacion xi → Uji xj tal que la norma del vector se mantiene constante. Esto se parece mucho a la definicion del grupo de Lorentz, solo que en lugar de usar la metrica de Minkowski usamos la metrica euclidea δ ij . Esta claro que la matriz M debe satisfacer que U T U = 1l ⇐⇒ M ∈ SO(3) (410) Supongamos una transformacion infinitesimal, es decir U = 1l + M . La matriz M satisface pues que 90 M T = −M (411) ψ → ψ(xi ) + Mji xj ∂i ψ + δψ (412) Es decir, M es una matriz antisimetrica. Como M actua en R3 , tiene 3 entradas independientes. Es decir, podemos encontrar 3 matrices M I independientes satisfaciendo ser antisimetricas en R3 . Supongamos ahora la accion de una rotacion en mecanica cuantica. Supongamos una funcion de onda ψ(~x). Bajo una rotacion xi → xi + Mji xj tenemos Usando la forma de las matrices M escritas como combinaciones de M I ’s, esta claro que podemos escribir esto como ψ → ψ(xi ) − α3 [x1 ∂2 − x2 ∂1 ]ψ + α2 [x1 ∂3 − x3 ∂1 ]ψ − α1 [x2 ∂3 − x3 ∂2 ]ψ + δψ (413) donde αi son los parametros de la rotacion particular. Introduciendo los generadores de rotaciones actuando sobre funciones como Lij = −(xi ∂j − xj ∂i ) (414) δψ = αi ijk Ljk ψ (415) [Lij , Lkl ] = δik Ljl − δil Ljk − δjk Lil + δlj Lik (416) tenemos pues que Los generadores Lij satisfacen que Este alegra es el algebra de SO(3). Definiendo J i = −2 i ijk Ljk es facil ver que el algebra se convierte en [J i , J j ] = 2 i ijk J k , es decir, tenemos el isomorfismo de algebras so(3) ∼ su(2). Ya que las representaciones de SU (2) son sencillas –es el algebra de momento angular en mecanica cuantica!–, construir representaciones de SO(3) tambien lo es: son las mismas reps. que las de SU (2)!. A.2 Rotaciones en 4d Supongamos ahora el mismo ejercicio en 4d. Evidentemente de vuelta encotraremos que el generador de rotaciones en 4d satisface que M T = −M . En este caso hay pues 6 generadores. Colocando esos generadores en una matriz Lij –donde ahora i, j = 1, · · · , 6–, podemos repetir exactamente el mismo calculo de arriba, y encontraremos que el algebra que los generadores satisfacen ahora es [Lij , Lkl ] = δik Ljl − δil Ljk − δjk Lil + δlj Lik 91 (417) Es decir, el mismo algebra que para las rotaciones en 3d solo que en una dimension mas. Evidentemente esto continua siendo cierto en un numero arbitrario de dimensiones. Por lo tanto, hemos encontrado el algebra para SO(d) con d arbitrario. En 3d, usando el simbolo de Levi-Civita ijk encontramos que so(3) ∼ su(2). En 4d –u otras dimensiones– esto no sera cierto. Para empezar el simbolo de Levi-Civita tendra d indices! Sin embargo si podemos hacer lo siguiente. Tomemos los generadores Lij con i, j = 1, 2, 3 y construyamos el vector J a = −2 i abc Lbc a, b, c ∈ {1, 2, 3} (418) Evidentemente estos J a satsifaran un algebra de SU (2), ya que si eliminamos la entrada x4 en SO(4) lo que tenemos es el caso conocido de SO(3). Por otra parte, construyamos el vector K a = −2 i L4a (419) Podemos ahora formar las combinaciones 1 a (J + K a ) 2 Con un poco de paciencia se puede ver que N−a = N+a = [N+a , N+b ] = 2 i abc N+c 1 a (J − K a ) 2 [N−a , N−b ] = 2 i abc N−c [N+a , N−b ] = 0 (420) (421) Es decir, encontramos dos algebras de SU (2) que conmutan. Esto quiere decir que so(4) ∼ su(2) × su(2). Debido a esto, construir representaciones de SO(4) es muy sencillo: simplemente tenemos dos copias del algebra de momento angular, por lo que las representaciones de SO(4) seran dos copias de representaciones de SU (2). A.3 El grupo de Lorentz Estamos ahora preparados para pasar al grupo de Lorentz. Dada la similitud formal con SO(d), es obvio que el algebra que los generadores satisfaran sera muy parecida a so(d). La diferencia estriba en que los generadores satisfacen que U T η U = η, lo que contiene signos − extras con respecto a SO(d). Repitiendo lo mismo que antes, es facil ver que el algebra es [Lij , Lkl ] = ηik Ljl − ηil Ljk − ηjk Lil + ηlj Lik (422) De vuelta, esto es independiente de la dimension, de manera que encontramos el algebra de SO(1, d − 1) –el (1, d − 1) hace referencia a que es como un grupo SO pero con una signatura con d − 1 direcciones con igual signo y una con el opuesto. Evidentemente esto se puede generalizar de manera obvia y obtener SO(p, q)–. Repitiendo las mismas manipulacies de antes podemos ahora definir 92 N+a = 1 a (J + i K a ) 2 N−a = 1 a (J − i K a ) 2 (423) tales que [N+a , N+b ] = 2 i abc N+c [N−a , N−b ] = 2 i abc N−c [N+a , N−b ] = 0 (424) Por lo tanto, tambien el grupo de Lorenz es basicamente SU (2)L × SU (2)R (se suelen llamar a los dos SU (2) como left y right respectivamente). Las representaciones se construyen de nuevo como productos de representaciones de SU (2). Ya que tenemos dos SU (2) denotaremos las representaciones como (·, ·), poniendo en cada factor la correspondiente representacion de SU (2)L, R .21 • (0, 0): esto es un campo escalar de Lorentz • ( 12 , 0): esto es un spinor de Weyl left –transforma solo bajo SU (2) left–. • (0, 21 ): esto es un spinor de Weyl right –transforma solo bajo SU (2) right–. • ( 21 , 0) ⊕ (0, 21 ): esto es un spinor de Dirac. • ( 12 , 21 ): esto es una particula vectorial –spin 1–. Hay sin embargo una diferencia crucial: la i en la definicion de N±a hace que N+a = (N−a )† (425) es decir, ambos SU (2) no son independientes, ya que conjugacion compleja nos lleva de uno a otro. Notese que las particulas de spin entero son invariantes bajo esto, pero no asi los spinores: los spinores Weyl left y right se intercambian. Aqui no vamos a elaborar mucho mas en la teoria de las representaciones del grupo de Lorentz –y su parte discreta, que aqui no hemos discutido para nada–. Para todo ello, consular la bibliografia. B Spinorologia Recordemos que las matrices γ satisfacen que {γ µ , γ ν } = 2 η µν γ5 = i γ1 γ1 γ2 γ3 (426) Construyendo i µ ν [γ , γ ] 4 es facil ver, usando las propiedades de anticonmutacion, que Σµν = 21 Por ejemplo, 1 2 se refiere a la representacion de spin 93 1 2 de SU (2). (427) [Σµν , Σρσ ] = ηµρ Σνσ − ηµσ Σνρ − ηνρ Σµσ + ησν Σµρ (428) que es el algebra del grupo de Lorentz que vimos en el apendice anterior. Como Σµν actua en el mismo espacio donde actuan las γ’s –es decir, sobre spinores de Dirac– esta claro que sirven de representacion del grupo de Lorentz en dicho espacio. Asi pues, una transformacion de Lorentz con parametro αµν actua sobre un spinor de Dirac como µν ψ → ei αµν Σ ψ (429) Hemos visto que para particulas sin masa es natural usar spinores quirales. Podemos definirlos empezando con un Dirac ψ como ψL = 1l − γ 5 ψ 2 ψR = 1l + γ 5 ψ 2 (430) Notese que [Σµν , γ 5 ] = 0 (431) Asi pues, la condicion de ser quiral es una condicion evidentemente covariante Lorentz, ya que la transformacion Lorentz conmuta con el proyector de quiralidad. Esto quiere decir que lo que es quiral en un sistema de referencia lo es en cualquier otro obtenido transformando de Lorentz. Para el campo escalar la condicion de realidad φ = φ? es, por ser escalar, invariante Lorentz. Para el spinor una condicion analoga no funcionaria, porque Σµν es compleja, y por lo tanto imponiendo ψ = ψ † en un sistema de Lorentz se transformaria en cualquier cosa en otro sistema. Para remediar esto fijemonos en la ecuacion de Dirac (i γ µ ∂µ + m) ψ = 0 (432) (−i (γ µ )? ∂µ + m) ψ ? = 0 (433) ψc = C ψ ? (434) Tomando su complejo conjugado Definamos Con C un cierto operador escogido tal que Entonces ψC satisface C −1 (γ µ )? C = −γ µ (435) (i γ µ ∂µ + m) ψc = 0 (436) Notese que si tuviesemos un campo electromagnetico todo seria analogo, salvo por el hecho de que, al tomar la conjugacion compleja, como el campo electromagnetico aparece con 94 i e γ µ Aµ , la ecuacion que ψc satisface es la misma que la de ψ pero con la carga electrica opuesta. De ahi que esta operacion implementada por C sea la conjugacion de carga. Notese que bajo conjugacion compleja Σµν → (Σµν )? = −C −1 Σµν C (437) ψ ? → ψ ? + i αµν C −1 Σµν C ψ ? (438) ψc = C ψ ? → C ψ ? + i αµν Σµν C ψ ? = ψc + i αµν Σµν ψc (439) Por lo tanto bajo transformacion de Lorentz ψ → ψ + i αµν Σµν ψ tenemos que Asi pues Es decir, la condicion de conjugacion de carga es covariante Lorentz. Por lo tanto la podemos usar para imponer una proyeccion extra sobre los spinores de Dirac, al igual que la condicion de realidad para campos escalares. Esto define un spinor de Majorana ψ = C ψ? (440) Evidentemente, al igual que el campo escalar real es neutro bajo el electromagnetismo –es real!!!–, el spinor de Majorana correspondera a un fermion neutro. B.1 El SM con spinores left Para γ 5 tenemos tambien que C (γ 5 )? C = −i C (γ 0 )? (γ 1 )? (γ 2 )? (γ 3 )? C −1 = −γ 5 (441) Con esto 1l ∓ γ 5 C −1 ± C −1 γ 5 1l ∓ (γ 5 )? ? 1l ± γ 5 ψc = C C ψ? = C ψ =C ψ 2 2 2 2 De manera que si ψ es un spinor left (442) 1l − γ 5 1l + γ 5 ψc = C ψ = C ψ ? = ψc (443) 2 2 es decir, ψc es right, y viceversa. Es decir, el spinor conjugado de carga de un spinor quiral tiene la quiralidad opuesta. Podemos usar esto para escribir el SM en terminos de spinores solo left. Tomemos por sencillez solo una familia leptonica. Tenemos un doblete de SU (2)L left que llamamos LL y un singlete de SU (2)L right que llamamos eR . Este ultimo lo podemos re-escribir en terminos de su conjugado de carga –que tendra carga +1– y sera un spinor left. De este modo queda todo un poquito mas simetrico –y preparado para supersimetria!– 95 C Simetrias y corrientes conservadas En muchos casos ocurre que un sistema descrito por una accion admite transformaciones que dejan la accion invariante. El ejemplo mas sencillo es un escalar real libre sin masa Z S = d4 x ∂φ2 (444) Esta accion es evidentemente invariante bajo φ → φ + a con a un numero real cualquiera. En general, supongamos una transformacion δΦi = αij Φj + βi (445) En general αij y βi podrian ser incluso funciones de x. Por lo tanto δ∂µ Φi = ∂µ αij Φj + αij ∂µ Φj + ∂µ βi (446) Entonces δL = δL δL δΦi + δ∂µ Φi δΦi δ∂µ Φi (447) queda δL = δL δL δL δL δL αij Φj + βi + ∂µ αij Φj + αij ∂µ Φj + ∂µ βi δΦi δΦi δ∂µ Φi δ∂µ Φi δ∂µ Φi (448) Integrando por partes y usando las ecuaciones de movimiento δL δL δL = ∂µ αij Φj + βi δ∂µ Φi δ∂µ Φi (449) Supongamos ahora el caso global, es decir, cuando ni αij ni βi dependen de x. Entonces, la transformacion de la accion es Z δL δL 4 δS = d x αij ∂µ Φj + βi ∂µ (450) δ∂µ Φi δ∂µ Φi Pero ya que esta transformacion es una simetria –asi empezamos suponiendo!– δS = 0, con lo que definiendo las corrientes jijµ = δL Φj δ∂µ Φi jSµ = δL δ∂µ Φi (451) Tenemos que son conservadas –usando las eqs. de movimiento!–, es decir ∂µ jijµ = 0 ∂µ jSµ = 0 (452) Esto suele ir bajo el nombre de Teorema de Noether, ya que fue descubierto por Emmy Noether. 96 Para ejemplificar esto, tomemos el caso estrella de un escalar complejo con simetria U (1) 1 1 L = ∂µ φ? ∂ µ φ − m2 φ? φ − λ (φ? φ)2 2 2 iα Esta teoria es invariante bajo φ → e φ. La version infinitesimal es (453) δφ = i α φ (454) jµ = φ? ∂µ φ − φ ∂µ φ? (455) Por lo tanto la corriente conservada es D La particula libre en formalismo de path integral Consideremos el ejemplo mas sencillo: una particula libre. La accion clasica es 1 m q̇ 2 (456) 2 La ecuacion de movimiento es simplemente q̈ = 0. La solucion, con condiciones iniciales q(tI ) = qI y q(tF ) = qF es qF − qI t + qI (457) tF − tI Escribamos una trayectoria arbitraria como q = qcl + qq , con qq tal que es cero en tI y tF . La accion es Z tF Z tF Z tF 1 1 2 dt m q̇cl + dt m q̇cl q̇q + dt m q̇q2 (458) 2 2 tI tI tI qcl (t) = Explicitamente m (qF − qI )2 + 2 (tF − tI ) Z tF tI Z tF q − q 1 F I dt m q̇q + dt m q̇q2 tF − tI 2 tI (459) El trozo del medio es la integral de una derivada total, asi que Z tF tI q − q q − q q − q Z tF F I F I F I dt m q̇q = m dt q̇q = m qq (tF ) − qq (tI ) (460) tF − tI tF − tI tF − tI tI Debido a las condiciones de contorno en qq , esto es cero. Por lo tanto la accion clasica para una trayectoria arbitraria es Z tF m (qF − qI )2 1 + dt m q̇q2 (461) S= 2 (tF − tI ) 2 tI 97 Por lo tanto hqF | e −i Ĥ (tF −tI ) |qI i = e i 2 m (qF −qI ) 2 (tF −tI ) Z Dq ei R tF tI dt 1 2 m q̇q2 (462) Para hacer la integral demonos cuenta de que, como la condiciones de contorno son qI = qF = 0, esta integral es h0|e−i Ĥ (tF −tI ) |0i (463) Introduciendo unidades escritas en terminos de |pi, esto es Z dp (2 π) Z dp0 h0|pi hp| e−i Ĥ (tF −tI ) |p0 i hp0 |0i = (2 π) Haciendo la integral encontramos finalmente Z r Rt i t F dt 12 m q̇q2 I Dq e = Por lo tanto, todo junto −i Ĥ (tF −tI ) hqF | e E |qI i = r Z dp −i p2 (tF −tI ) e 2m (2 π) m i 2 π (tF − tI ) m im e 2 i 2 π (tF − tI ) (qF −qI )2 (tF −tI ) (464) (465) (466) Tiempo euclideo, path integrals y mecanica estadistica Consideremos ahora una situacion a priori completamente diferente. Supongamos que queremos estudiar la mecanica estadistica de un sistema a temperatura T = β −1 . Como todo el mundo sabe, la funcion de particion canonica es Z = Tr e−β Ĥ Si |ni es una base del espacio de Hilbert, esto es X Z= hn|, e−β Ĥ |ni (467) (468) n Supongamos ahora que definimos β = i TE . Entonces X Z= hn|, e−i Ĥ TE |ni (469) n Pero acabamos de ver una manera de escribir elementos de matriz genericos hF | e−i Ĥ TE |Ii en terminos de path integrals. 98 hF |e −i Ĥ TE |Ii = donde Z dqI −i Ĥ TE hqF | e Z dqF ψF∗ (qF ) hqF | e−i Ĥ TE |qI i ψI (qI ) |qI i = Z qF =q(TE ) qI =q(0) Dq ei R TE 0 L (470) (471) Como la cantidad relevante en mecanica estadistica es cuando estados inicial y final coinciden, nos interesa en realidad Z Z −i Ĥ TE hn|e |ni = dqI dqF ψn∗ (qF ) hqF | e−i Ĥ TE |qI i ψn (qI ) (472) donde −i Ĥ TE hqF | e |qI i = Z qF =q(TE ) qI =q(0) Dq ei R TE 0 L (473) Podemos asumir ψn una base ortonormalizada del espacio de Hilbert, de manera que X ψn∗ (qF ) ψn (qI ) = δ(qI − qF ) (474) n Por lo tanto al final Z= Z q(TE )=q̂ q(0)=q̂ Dq ei R TE 0 L (475) Es decir, hemos encontrado que el path integral que tenemos tras hacer t → −i tE (476) e imponer condiciones de contorno periodicas q(0) = q(TE ), tenemos la mecanica estadistica del sistema. El cambio de variables (476) se conoce como rotacion de Wick. Notese que si tenemos el espacio de Minkowski R1, 3 , la rotacion de Wick lo convierte en el espacio euclideo R4 . Para nuestra mecanica estadistica no solo estamos haciendo la rotacion de Wick, sino que ademas estamos suponiendo que el tiempo euclideo (una de las coordenadas en R4 ) tiene un tamagno finito TE e imponemos condiciones de contorno periodicas. Esto es analogo a decir que la mecanica estadistica de un sistema es igual al path integral euclideo con el tiempo euclideo siendo un circulo de tamagno TE = β. Este descubrimiendo es absolutamente sorprendente e increiblemente profundo. De alguna manera, es como decir que la mecanica cuantica es una mecanica estadistica en tiempo complejo (aunque esto son simplemente palabras!). 99 F Simetrias La idea de simetria es central en fisica. Una simetria cuya aparicion es obvia es la simetria bajo transformaciones de Poincare –es decir, invariancia relativista–. De hecho, el path integral hace esta simetria completamente evidente, haciendolo por lo tanto el punto de inicio mas natural para construir una teoria cuantica de campos. Pero en general podemos tener mas simetrias. Se puede demostrar22 que la unitariedad de la matriz S solo es compatible con la simetria de Poincare y un grupo de simetria interno que conmute con el grupo de Poincare. Estas simetrias internas pueden ser locales o globales. F.1 Simetrias globales Supongamos la teoria mas sencilla del mundo: un boson escalar real sin masa. La accion es Z 1 (477) S = d4 x ∂φ2 2 Esta teoria es invariante bajo la transformacion φ → φ + a, con a una constante. Hay simetrias mas interesantes. Consideremos por ejemplo un escalar complejo Z 1 1 (478) S = d4 x |∂φ|2 − m2 |φ|2 − λ |φ|4 2 2 Esta teoria es invariante bajo φ → ei α φ (479) Esta es una rotacion U (1), que es un grupo abeliano. Podemos tambien tener simetrias no abelianas. Por ejemplo, consideremos un conjunto de N escalares reales con los que ~ T = (φ1 , · · · , φN ). La accion es formaremos el vector φ Z 1 ~T 1 ~T · φ ~ − λ (φ ~ T · φ) ~ 2 S= ∂ φ · ∂φ − m2 φ (480) 2 2 Evidentemente esta accion es invariante bajo ~→Mφ ~ φ (481) con M una matriz satisfaciendo M T ·M = 1, l que es la definicion del grupo O(N ). Haciendo los escalares complejos, el grupo de invariancia seria U (N ). 22 S.Coleman and J.Mandula, All possible symmetries of the S-matrix, Phys.Rev. 159 (1967) 1251-1256 100 F.2 Simetrias locales (gauge) Las simetrias discutidas arriba son simetrias globales, ya que la transformacion es igual en todos los puntos del espacio. Sin embargo un principio fundamental es la invariancia de las leyes fisicas bajo transformaciones locales. Esto sugiere promover las simetrias anteriores a simetrias locales (tambien llamadas simetrias gauge). Por sencillez, concentremonos en el campo escalar complejo. Promoviendo la transformacion U (1) a simetria local, tenemos la transformacion infinitesimal φ → φ + i α(x) φ (482) Es evidente que la accion discutida arriba no es invariante bajo esta transformacion. Sin embargo si lo es si introducimos un nuevo campo cuya transformacion compense la de del escalar. Consideremos Z 1 1 Dµ φ = ∂µ − i Aµ φ (483) S = d4 x |Dµ φ|2 − m2 |φ|2 − λ |φ|4 2 2 Esta accion es invariante bajo φ → φ + i α(x) φ Aµ → Aµ + ∂µ α (484) Esta transformacion se conoce como transformacion gauge. Guiados por el principio de invariancia gauge hay un termino mas con dimension 4 que podemos agnadir a la accion S= Z d4 x − 1 µν 1 2 1 F F + |D φ| − m2 |φ|2 −λ |φ|4 µν µ 4 e2 2 2 Dµ φ = ∂µ −i Aµ φ Fµν = ∂µ Aν −∂µ Aν (485) Esto es una version con escalares del electromagnetismo (por eso a veces se le llama scalar QED). Las simetrias locales –gauge– son intrinsecamente diferentes de las simetrias globales. Mientras que las primeras clasifican el espectro de una teoria, las segundas eliminan estados. Esto es porque una cantidad no invariante gauge se puede poner al numero que queramos –en particular a 0– haciendo transformaciones locales. Asi pues, las simetrias gauge en realidad reflejan redundancias en la descripcion del sistema, y por eso sirven para eliminar dichas redundancias. Es por eso que todas las cantidades con interpretacion fisica –es decir, lo que se mide– deben ser invariantes gauge. Volvamos a nuestro ejemplo de arriba. Para describir una particula sin masa de spin 1 –el Aµ de arriba– hemos usado un vector en el espacio de Minkowski. Esto son en principio 8 grados de libertad (4 campos y 4 momentos), aunque el hecho de tener una particula sin masa lleva a que en realidad tengamos 6 grados de libertad (3 campos y 3 momentos). Sin embargo argumentos generales sobre las representaciones del grupo de Lorentz dictan que una particula sin masa de spin 1 debe tener 4 grados de libertad (2 campos y 2 momentos). La manera de reconciliar estos dos numeros es a traves de la simetria gauge, que permite eliminar uno de los 3 campos (y su momento) dejando los grados de libertad deseados. 101 Es dificil de sobreestimar la importancia de las interacciones gauge en fisica. No en vano, el modelo estandard es un ejemplo particular de teoria gauge. F.3 Ruptura espontanea de simetria Consideremos de vuelta nuestro modelo con simetria global U (1). Las ecuaciones de movimiento son ∂ 2 φ + m2 φ + 4 λ |φ|2 φ = 0 (486) Es evidente que las soluciones de vacio son aquellas en las que ∂φ = 0. Por lo tanto tenemos que |φ|2 = − m2 4λ o φ=0 (487) 2 2 > 0 la unica solucion es φ = 0. Sin emabargo si m < 0 –lo que ocurre Es evidente que si m 4λ 4λ 2 si m < 0. El signo de λ ha de ser positivo para que a gran φ el potencial sea acotado por abajo– resulta que la q solucion con |φ| = 6 0 no solo es valida sino que es de menor 2 energia. Escribiendo φ = − m eiθ esta claro que cualquier θ soluciona la ecuacion. En 4λ ese sentido es una direccion plana, ya que esta claro que el potencial es igual para cualquier θ0 . Podemos escoger pues un θ0 a nuestro antojo y tomar como vacio r m2 iθ0 e φ0 = − (488) 4λ A esto se le conoce como ruptura espontanea de la simetria. El modelo original tenia la simetria global U (1) que vimos. Pero el vacio resulta que no es invariante bajo dicha simetria (ya que hay que escoger un θ0 ), por lo que el vacio rompe la simetria de manera espontanea. Esto es en contrasteR a una ruptura explicita, que seria por ejemplo agnadir a la accion un termino digamos φ4 . Esta claro que agnadiendo a la accion esto, esta de entrada no es invariante U (1). Expandamos alrededor del vacio que rompe espontaneamente la simetria haciendo r m2 + ρ) ei(θ0 +p) (489) φ0 = ( − 4λ Para ρ, p pequegnos encontramos Z 1 φ2 S ∼ d4 x ∂ρ2 − 4 λ φ20 ρ2 + 0 ∂p2 (490) 2 2 es decir, la fluctuacion a lo largo de la direccion plana no tiene masa mientras que la fluctuacion a lo largo de la direccion no plana si tiene una masa. Este es un fenomeno universal y exacto: cuando tenemos una simetria espontaneamente rota, por cada direccion plana original que teniamos que resulta rota por el vacio tenemos una particula escalar con 102 masa exactamente cero. Esto se conoce como teorema de Goldstone y a la particula escalar sin masa se le llama boson de Goldstonte. Es una “firma” universal de ruptura espontanea de simetria. Cuando la ruptura espontanea de la simetria ocurre en una teoria donde la simetria es local ocurre un fenomeno enormemente interesante: podemos escoger un gauge tal que el boson de Goldstone esta puesto a cero –en ese sentido esta “comido por el campo gauge”– al precio de que, ya que hemos fijado el gauge, ahora los 3 grados de libertad del campo vectorial son fisicos: el campo vectorial se ha vuelto masivo! Este es el celebrado mecanismo de Higgs. F.4 Simetrias anomalas En principio, la cuantizacion de los campos fermionicos es similar a la de los campos bosonicos: se puede escribir un path integral para la accion de Dirac e integrar sobre los campos Grassman. Sin embargo, una distincion fundamental aparece cuando hablamos de simetrias. Debido a la naturaleza fermionica, simetrias clasicas pueden no serlo a nivel cuantico. Es decir, si bien clasicamente una teoria tiene una corriente conservada j µ , es decir, tal que ∂µ j µ = 0, a nivel cuantico puede ocurrir que ∂µ j µ 6= 0. A estas simetrias –que no lo son en realidad– se las llama simetrias anomalas. Un ejemplo canonico son las simetrias de flavor quirales. Como es bien sabido, en 4d fermiones sin masa se representan por spinores de Weyl. Estos satisfacen que γ 5 ψ = ±ψ, siendo los que tienen autovalor + fermiones left y los que tienen autovalor − fermiones right. Podemos en principio escribir una teoria con solo fermiones left. De hecho, si tenemos mas de un fermion left, digamos Nf de ellos, podemos escribir dicha teoria con simetria U (Nf ). Como la simetria solo afecta a spinores de una quiralidad se llama simetria quiral. Resulta que esta simetria, a nivel cuantico, es anomala. Esto tiene una importancia capital en QCD, ya que en particular permite decaimientos de otro modo prohibidos (en particular π 0 en 2 γ). G Reglas de Feynman para el SM con una generacion Listado de las reglas de Feynman para el SM con una sola generacion, tomado de http://www.stfc.ac.uk/ppd/resources/pdf/standardmodel09.pdf. 103 Feynman Rules in the Unitary Gauge (for one Lepton Generation) Propagators: (All propagators carry momentum p.) µ µ µ W Z A e ν H ν 2 2 −i (gµν − pµ pν /MW )/(p2 − MW ) ν −i (gµν − pµ pν /MZ2 )/(p2 − MZ2 ) ν −i gµν /p2 i (γ · p + me )/(p2 − m2e ) i γ · p/p2 i/(p2 − m2H ) 104 Feynman Rules in the Unitary Gauge (for one Lepton Generation) Propagators: (All propagators carry momentum p.) µ µ µ W Z A e ν H ν 2 2 −i (gµν − pµ pν /MW )/(p2 − MW ) ν −i (gµν − pµ pν /MZ2 )/(p2 − MZ2 ) ν −i gµν /p2 i (γ · p + me )/(p2 − m2e ) i γ · p/p2 i/(p2 − m2H ) 105 Feynman Rules in the Unitary Gauge (for one Lepton Generation) Propagators: (All propagators carry momentum p.) µ µ µ W Z A e ν H ν 2 2 −i (gµν − pµ pν /MW )/(p2 − MW ) ν −i (gµν − pµ pν /MZ2 )/(p2 − MZ2 ) ν −i gµν /p2 i (γ · p + me )/(p2 − m2e ) i γ · p/p2 i/(p2 − m2H ) 106 Feynman Rules in the Unitary Gauge (for one Lepton Generation) Propagators: (All propagators carry momentum p.) µ µ µ W Z A e ν H ν 2 2 −i (gµν − pµ pν /MW )/(p2 − MW ) ν −i (gµν − pµ pν /MZ2 )/(p2 − MZ2 ) ν −i gµν /p2 i (γ · p + me )/(p2 − m2e ) i γ · p/p2 i/(p2 − m2H ) 107 Feynman Rules in the Unitary Gauge (for one Lepton Generation) Propagators: (All propagators carry momentum p.) µ µ µ W Z A e ν H ν 2 2 −i (gµν − pµ pν /MW )/(p2 − MW ) ν −i (gµν − pµ pν /MZ2 )/(p2 − MZ2 ) ν −i gµν /p2 i (γ · p + me )/(p2 − m2e ) i γ · p/p2 i/(p2 − m2H ) 108