4 TEMAS DE ÓPTICA Francisco Javier Gil Chica febrero, 2009 ii Índice general Sobre estos temas V 1. Transferencia de Radiación 1.1. Introducción . . . . . . . . . . . . . . . . 1.2. Definiciones . . . . . . . . . . . . . . . . 1.3. Absorción . . . . . . . . . . . . . . . . . 1.4. Emisión . . . . . . . . . . . . . . . . . . 1.5. Ecuación de la transferencia de radiación 1.6. Solución aproximada para atmósfera plana . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 4 6 7 . . . . . . . . . . . . 9 2. Óptica Matricial 2.1. Introducción . . . . . . . . . . . 2.2. Formulación matricial . . . . . . 2.2.1. Traslación . . . . . . . . 2.3. Refracción en superficie plana . 2.4. Refracción en superficie esférica 2.5. Matriz del sistema . . . . . . . 2.6. Interpretación . . . . . . . . . . 2.7. Conclusión . . . . . . . . . . . . 3. Polarización 3.1. Introducción . . . . . . 3.2. Formalización . . . . . 3.3. Grado de polarización 3.4. Matrices de Mueller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 13 14 14 17 19 22 . . . . 23 23 25 28 29 4. Difracción 35 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2. La difracción en 9 pasos sencillos . . . . . . . . . . . . . . . . 36 4.2.1. Paso 1. Flujo . . . . . . . . . . . . . . . . . . . . . . . 36 iii iv ÍNDICE GENERAL 4.2.2. Paso 2. Divergencia . . . . . . . . . . . . . . 4.2.3. Paso 3. Teorema de la divergencia . . . . . . 4.2.4. Paso 4. Definición de gradiente . . . . . . . 4.2.5. Paso 5. Una aplicación del resultado anterior 4.2.6. Paso 6. Identidad de Green . . . . . . . . . 4.2.7. Paso 7. Ecuación de ondas . . . . . . . . . . 4.2.8. Paso 8. Teorema integral de Kirchoff . . . . 4.2.9. Paso 9. Integral de Kirchoff-Fresnel . . . . . 4.3. Cálculo de la integral de Kirchoff-Fresnel . . . . . . 4.3.1. La pantalla . . . . . . . . . . . . . . . . . . 4.3.2. La abertura . . . . . . . . . . . . . . . . . . 4.3.3. Método de Montecarlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 38 39 39 40 40 40 43 44 44 45 45 Sobre estos temas Estos temas de Óptica tienen su origen en la asignatura Periféricos que vengo impartiendo desde hace quince años en las licenciaturas y diplomaturas de informática en la Escuela Politécnica Superior en la Universidad de Alicante. A lo largo de estos años, la asignatura ha cambiado profundamente, lo cual no es extraño dada la velocidad a la que se mueve la tecnologı́a, y dado que la creciente complejidad de los sistemas informáticos, con su acumulación de capas y el aislamiento entre la máquina y el usuario, ha ido reduciendo los contenidos relacionados con la programación del sistema e incrementando los contenidos relacionados con los fundamentos fı́sicos de los dispositivos periféricos, ası́ como el análisis matemático, en especial de los dispositivos de almacenamiento. Ası́, en un momento dado fue evidente la necesidad de dar unas nociones de Óptica. Porque si bien los sistemas informáticos están lejos de fundamentarse en la computación óptica, hay subsistemas basados en fenómenos ópticos: conexiones de fibra óptica, almacenamiento óptico y magneto-óptico, pantallas planas, lentes simples o sistemas de lentes, almacenamiento holográfico, etc. El problema que se plantea aquı́ entonces no consiste en ofrecer una asignatura de óptica aplicada a la informática, ni ofrecer una panorámica que aunque incompleta sea lógicamente consistente, ni recorrer el camino que va desde los mismos fundamentos fı́sicos al dispositivo concreto que se estudie. Más bien, hemos buscado unos pocos temas estratégicos y la formulación más compacta posible. En principio, eran tres los temas elegidos: óptica geométrica (sistemas paraxiales, fibra óptica), difracción (lectura/escritura en dispositivos ópticos, visualización) y polarización (pantallas planas, lectura en dispositivos magneto-ópticos). En cuanto a la óptica geométrica, la formulación matricial es a la vez sencilla, compacta y general. En cuanto a la difracción, hemos elegido una formulación matemática compacta que evita la distinción entre difracción de Fresnel y Fraunhoffer y propone, una vez formulada la integral v vi 0. Sobre estos temas general, un método de Montecarlo para obtener numéricamente las figuras de difracción. Por lo que respecta a la polarización, hemos adoptado la descripción a través de los parámetros de Stokes. Circunstancialmente, hemos añadido un tema sobre transferencia de radiación. Este tema es ajeno a la asignatura de Periféricos y tiene su origen en una pequeña charla sobre fenómenos ópticos atmosféricos impartida este año a alumnos de Meteorologı́a. Siendo ası́, los cuatro tiene un rasgo en común: que en ningún caso se acude a la naturaleza electromagnética de la luz, aunque sı́ a su naturaleza ondulatoria. Pero como esta naturaleza ondulatoria puede advertirse mediante experimentos sencillos, resultan una serie de temas que podrı́an denominarse ((óptica empı́rica)), ((óptica macroscópica)), o, dado que estas denominaciones no terminan de satisfacernos, ((óptica no electromagnética)). Capı́tulo 1 Transferencia de Radiación 1.1. Introducción Se presentan en este tema los fundamentos de la transferencia de radiación. Se adopta aquı́ un punto de vista fenomenológico donde la radiación es considerada como energı́a que se propaga en un medio material, sin considerar ni cual es la naturaleza de esta energı́a ni de qué forma, por qué mecanismos, es absorbida, desviada o producida por la materia. El material que sigue está tomado de Radiative Transfer, de S. Chandrasekhar y es una exposición resumida de los principios generales. 1.2. Definiciones Dada una superficie dσ, la cantidad de energı́a en forma de radiación que la atraviesa por unidad de tiempo, intervalo de frecuencia y ángulo sólido dω subtendido por la superficie dσ ′ en una dirección que forma un ángulo θ con la normal (Figura 1), se expresa como: dEν = Iν cos θ dtdσdνdω (1.1) En general, Iν depende de cada punto y de la dirección relativa a la normal expresada por los cosenos directores (l, m, n), de forma que funcionalmente es Iν (x, y, z, l, m, n, t). Cuando es Iν (x, y, z, t) se habla de medios isótropos. Cuando es Iν (l, m, n, t) se habla de medios homogéneos. Algunos casos aún más restrictivos son de interés. En un medio estratificado como puede ser una atmósfera plana es Iν (z, φ, θ, t). Si además existe simetrı́a axial será Iν (z, θ, t). En un medio estratificado esférico es Iν (r, φ, θ, t). 1 2 1. Transferencia de Radiación dω θ dσ Figura 1 El campo de radiación viene entonces determinado por la función Iν , a la que habrı́a que añadir el estado de polarización de la luz. Integrando para todas las direcciones posibles, obtendrı́amos la cantidad de energı́a total de frecuencia ν que atravesarı́a la superficie dσ por unidad de tiempo. La densidad de radiación uν en un punto es la cantidad de energı́a radiante de frecuencia ν por unidad de volumen que atraviesa un entorno pequeño alrededor del punto. Sea P este punto, contenido en un pequeño volumen V limitado por una superficie Σ. Dado un entorno de P contenido en V y limitado por una superficie σ, es claro que todo rayo que incide en σ proviene de algún punto de la superficie Σ (Figura 2). Sean los elementos de superficie dΣ y dσ. La energı́a por unidad de tiempo y frecuencia que atraviesa dΣ en el elemento de ángulo sólido dω ′ subtendido por dσ según se ve desde dΣ es dEν = Iν cos Θ dtdνdΣdω ′ (1.2) dEν = Iν cos ΘdνdΣdω ′ dt (1.3) o bien Ahora bien, dω ′ = dσ cos θ r2 (1.4) luego cos θ cos ΘdνdΣdσ dEν = Iν (1.5) dt r2 Cuando el pincel de radicación en el ángulo sólido dω ′ atraviesa V ′ , recorre una distancia l en un tiempo l/c, de forma que 3 1.2. Definiciones dΣ Θ θ dσ Figura 2 dEν = Iν cos θ cos ΘdνdΣdσ l r2 c (1.6) Pero dΣ cos Θ (1.7) r2 es el ángulo sólido subtendido por dΣ según se ve desde dσ, luego dω = dEν = Iν cos θdωdνdσ l c (1.8) Teniendo ahora en cuenta que dv ′ = l cos θdσ (1.9) es el volumen diferencial interceptado por el pincel de radiación que procede de dΣ y atraviesa dσ, tenemos que dEν 1 = Iν dωdν (1.10) ′ dv c Si integramos para todo el volumen y todas las frecuencias y consideramos los rayos provenientes de todas las direcciones, tenemos la energı́a total contenida en el entorno de P , y de ahı́ la densidad buscada: Z 1Z Z E Iν dνdω = uν dν u= ′ = V c ω ν ν (1.11) 4 1. Transferencia de Radiación donde hemos introducido 1Z Iν dω c ω Definiendo la intensidad media como uν = Jν = (1.12) 1 Z Iν dω 4π ω (1.13) 4π Jν c (1.14) es claro que uν = 1.3. Absorción Cuando un pincel de radicación se propaga en un medio, sufre una atenuación cuyo valor relativo es proporcional a la densidad de ese medio y a la distancia recorrida: dIν = −kν ρds Iν (1.15) A kν se le llama ((coeficiente de absorción)), ds es esa distancia recorrida y ρ la densidad del medio. Esta atenuación puede deberse a varias causas. En primer lugar, puede que parte de la energı́a simplemente cambie de dirección. No disminuye entonces el total de energı́a radiante en el medio sino que se modifica su distribución. En ese caso se habla de dispersión 1 . O puede suceder que la energı́a sea efectivamente absorbida por la materia y transformada en otras formas de energı́a, lo que incluye su re-emisión con una frecuencia distinta y en general en una dirección distinta. Se habla entonces de verdadera absorción. Consideremos el proceso de dispersión (Figura 3). La energı́a dispersada en todas direcciones cuando el pincel atraviesa una distancia ds en el medio es kν ρdsIν cos θdνdσdω (1.16) Como el diferencial de masa atravesado cuando la radiación recorre un ds es dm = ρdσ cos θds 1 (1.17) Traducimos el término scattering, usado de forma tan general como innecesaria 5 1.3. Absorción ds θ dσ Figura 3 dω’ θ Θ ds dσ Figura 4 se puede escribir kν Iν dmdνdω (1.18) Ahora bien, la descripción completa exige conocer qué fracción de esa radiación dispersada lo hace en cada dirección dada por cada elemento de ángulo sólido dω ′ (Figura 4). Esta fracción puede escribirse como dω ′ (1.19) 4π A la función p(cos Θ) se le llama función de fase. La energı́a dispersada en todas direcciones es p(cos Θ) kν Iν dmdνdω Z ω′ p(cos Θ) ′ dω 4π (1.20) que comparada con kν Iν dmdνdω (1.21) muestra que ha de ser p(cos Θ) ′ dω 4π ω′ Ahora bien, cuando hay verdadera absorción 1= Z (1.22) 6 1. Transferencia de Radiación Z ω′ p(cos Θ) ′ dω = ω0 <= 1 4π (1.23) En el caso más simple posible p(cos Θ) = ω0 . Otras formas de interés son la llamada función de fase de Rayleigh p(cos Θ) = 34 (1+cos2 Θ) y una función usada en estudios sobre iluminación planetaria: p(cos Θ) = ω0 (1 + x cos Θ), con −1 <= x <= 1. En general, podemos suponer que la función de fase se puede desarrollar como una serie de polinomios de Legendre: p(cos Θ) = X ωl P (cos Θ) (1.24) l 1.4. Emisión Un campo de radiación no sólo puede ser modificado mediante absorción y dispersión por la materia, sino que ésta puede contribuir al campo total emitiendo a su vez, como es obvio en, por ejemplo, las atmósferas estelares. La cantidad de energı́a emitida en el conjunto de direcciones contenidas en dω en un tiempo dt por un elemento de masa dm en el intervalo de frecuencias dν es: jν dmdtdνdω (1.25) donde jν es el coeficiente de emisión. Ahora bien, esta radiación puede ser emitida efectivamente por dm o puede haber sido dispersada en la dirección dω desde otras direcciones. Ası́, un pincel de radiación que incide sobre dm desde la dirección (φ′ , θ′ ) contribuye a la radiación emitida desde dm en la dirección (φ, θ) con una energı́a por unidad de tiempo: kν dmdνdωIν (φ′ , θ′ )p(φ′ , θ′ , φ, θ) dω ′ 4π (1.26) siendo dω ′ = sen θ′ dθ′ dφ′ (1.27) y donde p(φ′ , θ′ , φ, θ) es función del ángulo formado por las direcciones (φ′ , θ′ ) y (φ, θ). Ası́ pues, la radiación emitida puede provenir de dm o haber sido dispersada desde otra dirección por dm. Entonces, el ritmo al que se emite la energı́a radiante se puede escribir: jν dmdνdω = (jν(d) + jν(e) )dmdνdω (1.28) 1.5. Ecuación de la transferencia de radiación 7 Comparando esta expresión con que nos da el ritmo de emisión de radiación según la dirección de dω proveniente de la dispersión desde la dirección dω ′ , es claro que kν Z π Z 2π Iν (φ′ , θ′ )p(φ′ , θ′ , φ, θ) sen θ′ dθ′ dφ′ (1.29) 4π 0 0 Un medio es puramente dispersivo cuando jν = jν(d) . Nótese que un medio puramente dispersivo no equivale a un medio donde la dispersión sea completa (ω0 = 1). En otras palabras, que toda la radiación emitida por dm provenga de la dispersión desde todas las direcciones no implica que toda la radiación que alcanza a dm sea dispersada: parte puede ser absorbida. En un medio en equilibrio termodinámico, donde en cada punto se puede definir una temperatura T , se cumple la Ley de Kirchoff: jν(d) = jν = kν Bν (T ) (1.30) donde Bν (T ) es la función de Planck: 1 2hν 3 2 hν/kT c e −1 Se define la ((función fuente)), Fν como Bν (T ) = jν kν En el caso de un medio puramente dispersivo: Fν = 1 Z π Z 2π Fν = p(φ, θ, φ′ , θ′ )Iν (φ′ , θ′ ) sen θ′ dθ′ dφ′ 4π 0 0 En un medio en equilibrio termodinámico Fν = Bν (T ) 1.5. (1.31) (1.32) (1.33) (1.34) Ecuación de la transferencia de radiación Consideremos (Figura 5) un cilindro de sección normal dσ y longitud ds y la radiación que atraviesa normalmente sus dos caras. De la definición de intensidad, la cantidad de energı́a radiante que atraviesa una de las caras que tomamos como origen es dEν(0) = Iν dtdνdσdω mientras que en la cara opuesta (1.35) 8 1. Transferencia de Radiación dω dω dσ ds Figura 5 dEν(ds) = (Iν + dIν ds)dtdνdσdω ds (1.36) de manera que dIν dsdtdνdσdω (1.37) ds Esta diferencia provendrá de la existente entre emisión y absorción. La cantidad de radiación absorbida es dEν(ds) − dEν(0) = kν Iν dmdνdtdω = kν Iν ρdσdsdνdtdω (1.38) La cantidad emitida es jν dmdνdtdω = jν ρdσdsdνdtdω (1.39) 1 dIν = Fν − Iν kν ρ ds (1.40) De manera que En el segundo miembro, el primer término es la función fuente, que incluye la dispersión desde todas las direcciones en la dirección de dω, y que depende de Iν . El segundo da cuenta de la absorción. Tenemos por tanto una ecuación integro-diferencial. En coordenadas cartesianas esta ecuación se escribe ! ∂ ∂ ∂ 1 l +l +l I(x, y, z, l, m, n) = I(x, y, z, l, m, n) − − kν ρ ∂x ∂y ∂z F(x, y, z, l, m, n) (1.41) Es de especial interés el de un medio estratificado plano, como ocurre en las atmósferas planetarias y estelares. En ese caso la intensidad es función de z y θ, suponiendo como es lógico simetrı́a axial en torno al eje z. La ecuación fundamental se reduce entonces a 1.6. Solución aproximada para atmósfera plana 9 d 1 Z 2π Z π 1 cos θ I(z, θ) = I(z, θ) − p(cos Θ)I(z, θ) sen θ′ dθ′ dφ′ kν ρ dz 4π 0 −π (1.42) En el caso más sencillo, p(cos Θ) = 1. Con los cambios de variable µ = cos θ y − τ= Z ∞ z kν ρdz (1.43) transformamos la ecuación en la forma en que se acostumbra a trabajar con ella: dI(τ, µ) 1Z 1 µ = I(τ, µ) − I(τ, µ′ )dµ′ dz 2 −1 1.6. (1.44) Solución aproximada para atmósfera plana Existe un método aproximado de resolución propuesto por Schuster (1905) y Schwarszchild (1906) que se inspira en la teorı́a cinética de los gases y que puede ser generalizado fácilmente. En efecto, es común en el contexto de la teorı́a cinética considerar un número de moléculas encerradas en un cubo y chocando elásticamente contra sus paredes. Se recurre al artificio de considerar que un tercio de ese número se mueve según la dirección de cada uno de los ejes, en los dos sentidos. Inspirado en esta idea, el método supone que la intensidad está limitada a un flujo dirigido hacia arriba (µ = 1) y un flujo dirigido hacia abajo (µ = −1). De esta forma, I(τ, µ) = I+ (τ ) + I− (τ ) y la función fuente es 1 F= 2 Z 0 −1 ′ I− (τ )dµ + Z 1 0 1 I+ (τ )dµ = [I+ (τ ) + I− (τ )] 2 ′ (1.45) Schuster y Schwarszchild sustituyeron la ecuación original por el par de ecuaciones 1 dI+ = I+ − 2 dτ 1 dI− − = I− − 2 dτ 1 [I+ + I− ] 2 1 [I+ + I− ] 2 (1.46) 10 1. Transferencia de Radiación donde el factor ± 21 de la izquierda da cuenta de la inclinación media de los rayos salientes y entrantes. Éste es un sistema lineal homogéneo de solución inmediata. La generalización de la idea anterior supone que en lugar de sólo una dirección existen n direcciones y que la radiación fluye sólo en esas direcciones, en un sentido o en otro. Si µi son los cosenos directores de esas direcciones, con i = ±1, ±2, ..., ±n e Ii las intensidades correspondientes, la ecuación fundamental se sustituye por el sistema lineal: µi X dIi = Ii − aj I j dτ j (1.47) donde las aj son los pesos de la integración gaussiana de F, de tal forma que Z 1 −1 I(τ, µ′ )dµ′ ≃ X aj Ij (τ, µj ) (1.48) j Los valores de los aj se encuentran tabulados en los textos de análisis numérico. Una revisión de la construcción de fórmulas gaussianas de cuadratura se encuentra en la obra citada Radiative Transfer, ası́ como tablas de coeficientes aj . Capı́tulo 2 Óptica Matricial 2.1. Introducción Este capı́tulo está dedicado a la teorı́a elemental de los sistemas ópticos. Un sistema óptico, en el contexto de la presente explicación, es un conjunto de superficies que separan medios de propiedades ópticas diferentes. Aquı́, haremos una interpretación muy restrictiva, pues la única propiedad óptica que va a determinar cada medio es el ı́ndice de refracción n, que se define como la razón entre la velocidad de la luz en el vacı́o y la velocidad de la luz en el medio. Ası́ pues, es siempre n >= 1. Respecto a la luz, experimentos sencillos nos convencerán de que se propaga en lı́nea recta en los medios homogéneos, es decir, en aquellos en los que el ı́ndice de refracción es una constante. El principio básico que permite formalizar matemáticamente nuestra experiencia empı́rica con la propagación de la luz es éste: la luz se propaga de tal modo que para ir de un punto a otro lo hace siempre en el tiempo mı́nimo posible. Es decir, que si un elemento de camino es ds, la luz invierte un tiempo ds/v en recorrerlo, y si v = c/n, entonces la trayectoria de la luz es tal que la integral entre el punto de partida y el de llegada: 1Z nds c (2.1) es mı́nima. El cálculo de variaciones permite calcular las trayectorias que sigue la luz, tanto en medios homogéneos como en medio no homogéneos. No entraremos en este formalismo. Indicaremos sólo que permite demostrar (entre otras muchas cosas) que: a) en los medios homogéneos la luz se propaga en lı́nea recta y b) cuando la luz cambia de un medio de ı́ndice de refracción n1 a un medio de ı́ndice n2 , se cumple la relación 11 12 2. Óptica Matricial θ1 n 1 n2 θ2 Figura 1 n1 sen θ1 = n2 sen θ2 (2.2) donde θ1 es el ángulo que forma el rayo con la normal a la superficie de separación en el punto de ésta donde incide y θ2 el ángulo que forma el rayo refractado con la misma normal, de acuerdo con la Figura 1. Todavı́a, dado el carácter elemental de esta exposición, hemos de introducir más restricciones: a) cuando un rayo toca una superficie que es la separación entre dos medios, el ángulo que forma con la normal a la superficie en el punto de contacto es tan pequeño que siempre se puede tomar sen θ ≃ θ; b) Nos limitamos a superficies de separación o bien planas o bien esféricas. Los centros de todas las superficies esféricas se encuentran sobre una lı́nea recta. Las normales a las superficies planas coinciden con la misma recta. A estos sistemas se les llama ((sistemas ópticos centrados)). A la lı́nea que contiene a los centros de las superficies se le llama ((eje óptico)). En lo que sigue, consideraremos que la luz se propaga de izquierda a derecha, formando ángulos pequeños con el eje óptico. 2.2. Formulación matricial Puesto que las superficies en los sistemas que estamos considerando separan medios homogéneos, en los cuales la luz se propaga en lı́nea recta, la acción de un sistema óptico sobre un rayo entrante consistirá en alterar su dirección en cada superficie, de forma que la trayectoria total del rayo será una lı́nea quebrada. El conocimiento completo de la trayectoria incluye entonces, para cada coordenada x del eje ópitco, la altura y del rayo y el ángulo θ que forma con el eje (Figura 2). 13 2.2. Formulación matricial y θ y x Figura 2 π1 π2 θ1 y1 θ2 y2 d Figura 3 El rayo entonces experimenta dos tipos de transformaciones: desplazarse de una superficie a la siguiente y cambiar de dirección en cada superficie. Consideremos a continuación las distintas formas en que el rayo se ve afectado. 2.2.1. Traslación Consideremos la traslación de un rayo en un medio homogéneo entre dos planos de referencia π1 y π2 separados entre sı́ una distancia d. En π1 el rayo viene especificado por valores (y1 , θ1 ) y en π2 por valores (y2 , θ2 ) (Figura 3). Es claro que θ2 = θ1 (2.3) y2 − y1 = tan θ1 ≃ θ1 d (2.4) y2 − y1 = dθ1 (2.5) mientras que o 14 2. Óptica Matricial n1 n 2 θ1 θ2 y1 = y2 Figura 4 Combinando ambas condiciones podemos escribir, en formato matricial: " 2.3. y2 θ2 # = " 1 d 0 1 #" y1 θ1 # (2.6) Refracción en superficie plana Consideremos ahora un rayo que toca una superficie plana que es la separación de dos medios de ı́ndice n1 y n2 (Figura 4). Estamos interesados en los valores de y2 y θ2 tras sufrir la refracción. Es evidente que y2 = y1 . En cuanto a los ángulos, n1 θ1 = n2 θ2 , o θ2 = n1 θ1 n2 (2.7) es decir: " y2 θ2 # = " 1 0 0 n1 n2 #" y1 θ1 # (2.8) Si asignamos convencionalmente signo positivo a los ángulos de los rayos que se alejan del eje en el sentido de las y > 0, vemos que, siendo n1 /n2 > 0, θ2 y θ1 tienen el mismo signo. Por contra, si indicamos con el signo negativo el ángulo de los rayos que desde y > 0 se acercan al eje, vemos que si θ1 < 0 también θ2 < 0. Por tanto, la expresión matricial anterior es general, válida tanto para ángulos positivos como para negativos. 2.4. Refracción en superficie esférica En relación con la Figura 5, se representa una superficie esférica de centro O y radio R que separa dos medios de ı́ndices n1 y n2 . Sobre esta superfi- 15 2.4. Refracción en superficie esférica N i1 y θ1 θ2 i2 α O R n1 n2 Figura 5 cie incide un rayo (y1 , θ1 ) en un punto cuya normal es ON con ángulo de incidencia i1 y ángulo de refracción i2 . En la aproximación de ángulos pequeños: n1 i 1 = n2 i 2 (2.9) Ahora bien, se ve que i1 = α + θ1 y que i2 = α + θ2 . Al mismo tiempo, el ángulo α puede aproximarse por su tangente, que es y/R (y = y1 = y2 ), con lo que n1 ( y1 y2 + θ1 ) = n2 ( + θ2 ) R R (2.10) de donde n2 − n1 y 1 n1 + θ1 n2 R n2 que junto con y2 = y1 permiten escribir: θ2 = − " y2 θ2 # = " 1 0 1 − nn2 −n 2R n1 n2 #" y1 θ1 (2.11) # (2.12) Podemos, y debemos, preguntarnos por la generalidad de la expresión anterior. Al fin y al cabo, hemos elegido una geometrı́a en la que θ1 > 0 y θ2 > 0 (¿y si no es ası́) y hemos supuesto que n2 > n1 (¿y si no es ası́?). Además, suponemos que la superficie es convexa (¿y si fuese cóncava?). Es preciso entonces asegurarse de que la expresión encontrada tiene la generalidad necesaria, y para eso es preciso analizar exhaustivamente todos los casos posibles. No es difı́cil hacer tal análisis pero, en lugar de omitirlo, como hace la mayorı́a de los textos, o de presentarlo completo, como no hace ninguno 16 2. Óptica Matricial N θ1 i1 y R n1 n 2 α i2 O θ2 Figura 6 de ellos, lo haremos parcialmente (el análisis completo queda a la voluntad del lector). En primer lugar, consideremos el caso en que los rayos incidente y refractado tienen ángulos negativos, tal y como se muestra en la Figura 6. Razonando sobre los valores absolutos de los ángulos, n1 i 1 = n2 i 2 (2.13) con i1 = α − |θ1 | e i2 = α − |θ2 |, de donde n1 n1 − n2 y1 (2.14) |θ1 | − n2 n2 R y como θ1 = −|θ1 | y θ2 = −|θ2 |, vemos que la expresión que habı́amos encontrado es más general del caso que consideramos en primer lugar, pues también es válida cuando los dos ángulos son negativos. Consideremos a continuación qué ocurre cuando la superficie de separación es cóncava, de acuerdo con la Figura 7. De n1 i1 = n2 i2 , ahora con i1 = α − θ1 e i2 = α − θ2 se sigue |θ2 | = n1 n2 − n1 y 1 + θ1 (2.15) n2 R n2 Vemos que esta ecuación difiere de (2.11) en el signo del primer término del segundo miembro. Podrı́amos pues tener dos expresiones distintas, según que la luz incida sobre una superficie cóncava o sobre una superficie convexa. En lugar de ello se introduce la siguiente regla: El radio de una superficie se toma como positivo si la superficie es convexa, y como negativo si la superficie es cóncava. La ecuación (2.11) junto con esta regla es consistente con la recién obtenida (2.15). Podrı́amos continuar examinando casos particulares, θ2 = 17 2.5. Matriz del sistema N i2 n2 θ1 θ2 y i1 n1 α O R Figura 7 pero, como dijimos anteriormente, queda del cuidado del lector interesado y nosotros damos por generalmente válida la citada expresión (2.11). 2.5. Matriz del sistema Recapitulemos brevemente las matrices encontradas hasta ahora. Para la traslación de un rayo una distancia d: T= " 1 d 0 1 # (2.16) Para su refracción en una superficie plana: R= " 1 0 0 n1 n2 # (2.17) Y para la refracción en una superficie esférica: S= " 1 0 1 − nn2 −n 2R n1 n2 # (2.18) Consideremos ahora un sistema óptico que contenga los dos tipos de superficies y una traslación. Este sistema puede ser una lente convexo-plana. La luz incide en la superficie convexa, donde se refracta. Después, el rayo recorre una distancia en lı́nea recta igual al grosor de la lente. Finalmente, se refracta en la superficie plana posterior de la lente, Figura 8. 18 2. Óptica Matricial 34 12 d Figura 8 Denotemos por ū el rayo ū = " y θ # (2.19) y usemos los subı́ndice 1 y 2 para indicar los valores inmediatamente antes y después de la refracción en la superficie esférica. Con los subı́ndices 3 y 4 indicamos los valores inmediatamente anterior y posterior a la refracción en la superficie plana posterior. Es claro que ū4 = Rū3 (2.20) ū3 = Tū2 (2.21) ū2 = Sū1 (2.22) ū4 = (RTS)ū1 = Mū1 (2.23) pero y a su vez Es decir: La acción total de la lente viene dada por la matriz M, que obtenemos multiplicando de atrás adelante las distintas transformaciones que sufre el rayo. Es también evidente que si las matrices elementales son matrices 2 × 2 la matriz resultante será también una matriz 2 × 2. De la misma forma se ve que si en lugar de las tres transformaciones que introduce la lente convexo-plana tuviésemos un número arbitrario de transformaciones n cada una de las cuales viniese representada por su matriz Mn , 19 2.6. Interpretación y denotando mediante el subı́ndice i el valor del rayo tras su transformación i, entonces serı́a: ūn = ūn−1 = ūn−2 = ··· = ū1 = Mn ūn−1 Mn−1 ūn−2 Mn−2 ūn−3 ··· M1 ū0 (2.24) de donde ūn = (Mn Mn−1 Mn−2 · · · M2 M1 )ū0 (2.25) M = Mn Mn−1 Mn−2 · · · M2 M1 (2.26) El sistema completo entonces se puede representar mediante una única matriz 2 × 2: En el caso concreto de la lente con que abrı́amos esta sección, si su ı́ndice de refracción es n y se encuentra rodeada de aire, cuyo ı́ndice podemos tomar como n = 1, su grosor es d y el radio de la superficie convexa es R, tenemos que M̄ = 2.6. " 1 0 0 n #" 1 d 0 1 #" 1 0 1−n nR 1 n # = " d(1−n) nR 1−n R 1+ d n 1 # (2.27) Interpretación Supongamos que, conocidas las superficies que forman un sistema óptico y todos los datos pertinentes, como la separación entre ellas, los ı́ndices de refracción y los radios de curvatura, hemos calculado la matriz total del sistema por simple multiplicación de las matrices individuales, obteniendo: M= " A B C D # (2.28) ¿Cual es el significado de cada uno de los elementos? Para responder a esta pregunta, hagamos cero cada uno de ellos sucesivamente. Representaremos al sistema, que puede contener un número arbitrario de elementos, mediante dos lı́neas verticales gruesas. Con los subı́ndices e y s indicamos los rayos de entrada y de salida al sistema. 20 2. Óptica Matricial A=0 Figura 9 B=0 Figura 10 Cuando A = 0, ys = Bθe . ys depende sólo de θe , no de ye . Por tanto, todos los rayos que entran con el mismo ángulo al sistema salen con el mismo ys , tal y como se refleja en la Figura 9. La condición A = 0 determina por tanto un foco. Si B = 0, ys = Aye . Es decir, ys no depende del ángulo de entrada y depende sólo de ye . La condición B = 0 determina una correspondencia entre los planos focales. Los puntos ye e ys son respectivamente objeto e imagen y A = ys /ye es el ((aumento)) del sistema. Figura 10. Si C = 0, θs = Dθe , es decir, el ángulo de salida depende sólo del ángulo de entrada: todo haz de rayos paralelos que entra al sistema emerge de él como haz paralelo, Figura 11. A este tipo de sistemas se les llama ((telescópicos)) y a la razón D = θs /θe ((aumento angular)) del sistema. Finalmente, si D = 0, θs = Cye , es decir, el ángulo de salida no depende del ángulo de entrada, como se muestra en la Figura 12 21 2.6. Interpretación C=0 Figura 11 D=0 Figura 12 22 2. Óptica Matricial 2.7. Conclusión Hemos dado una idea general de los sistemas ópticos centrados paraxiales. No entraremos en su ampliación a sistemas donde pueden encontrarse superficies reflectantes, ni entraremos en la discusión de los llamados ((puntos cardinales)) de los sistemas, que por otra parte pueden extraerse fácilmente a partir de la matriz M del sistema. El lector interesado puede encontrar la teorı́a complementaria, junto a una buena colección de ejercicios resueltos, en Matrix methods in optics, de A. Gerrard y J.M. Burch 1 . 1 Dover, New York. ISBN 0.486-68044-4 Capı́tulo 3 Polarización 3.1. Introducción En el siglo XVII, un monje llamado Erasmus Bartholinus descubrió una propiedad relativa a un mineral llamado ((espato de Islandia)). El espato de Islandia es una variedad de calcita fácilmente exfoliable en láminas transparentes. Lo que descubrió Bartholinus fue que una lámina de calcita daba imágenes dobles cuando se miraba a través de ella, es decir, que la luz se refractaba de dos formas distintas simultáneamente. La explicación del fenómeno la dio Christian Huygens poco después, al tiempo que descubrió el fenómeno de la polarización. Consiste éste en que si se miran ciertas fuentes de luz a través de una lámina de espato de Islandia, al girar la lámina en un plano perpendicular a la lı́nea de visión la intensidad de la imagen varı́a, pasando por un par de máximos y mı́nimos. Esto ocurre con algunas fuentes de luz, mientras que no ocurre con otras, y es independiente el fenómeno tanto de la intensidad de la fuente como de su color. Por consiguiente, la luz, aparte de intensidad y color tiene otra propiedad que se llamó ((polarización)). Se pueden hacer algunos experimentos adicionales. Si a través de un segundo cristal de espato se observa la luz emergente de un primero, se observa que la luz de este primero está polarizada siempre. De ahı́ se deduce que el cristal de espato polariza la luz, que en principio puede provenir de una fuente no polarizada. La polarización se hace evidente al observar el primer cristal a través del segundo. A partir de ahı́, hay un experimento obvio, que consiste en observar la luz polarizada por el primer cristal a través del segundo. Al girar este segundo cristal en su plano se observan los máximos y mı́nimos de intensidad y puede construirse una gráfica polar representando la intensidad emergente del se23 24 3. Polarización gundo cristal en función del ángulo girado respecto a un eje fijo arbitrario. La figura resultante es una elipse. Lo siguiente que se descubrió fue que si se repite el experimento introduciendo algunas sustancias entre los dos espatos, a veces se obtiene una elipse girada respecto a la elipse original. Por ejemplo, el agua azucarada tiene esta propiedad. También se descubrió que algunas sustancias giran la elipse en un sentido y algunas otras en sentido contrario. A esta propiedad de algunas sustancias se le llama ((actividad óptica)) y a las sustancias ((ópticamente activas)). Puesto que sencillos experimentos de difracción muestran que la luz tiene naturaleza ondulatoria, queda por discernir si se trata de una onda transversal o longitudinal. La polarización se explica aceptando que es una onda transversal. Cual sea la naturaleza de esa onda (qué cosa sea la que vibra) queda por averiguar. Admitiendo pues que la luz es una onda transversal y que su plano de vibración forma un ángulo θ con el eje horizontal x, mientras se propaga en la dirección z, sea Ex = A cos θ cos(ωt + ϕ) Ey = A sen θ cos(ωt + ϕ) (3.1) (Insistimos: ignoramos qué cosa sean Ex y Ey ). Si volvemos a nuestros experimentos con el espato de Islandia y recordamos que presenta el fenómeno de la birrefringencia, hemos de interpretar esto como que hay dos ı́ndices de refracción según dos direcciones distintas. Pero el ı́ndice de refracción está relacionado con la velocidad de propagación de la luz en el medio. Experimentos más cuidadosos revelan que hay una dirección especial en el cristal llamada ((eje óptico)). La vibración paralela al eje óptico se llama ((extraordinaria)) y la vibración perpendicular a dicho eje ((ordinaria)). Pues bien, el espato de Islandia introduce una diferencia de fase entre las vibraciones ordinaria y extraordinaria, ∆, de manera que la luz emergente se puede representar como: Ex = A cos θ cos ωt Ey = A sen θ cos(ωt + ∆) (3.2) eliminando el cos ωt: Ex 2 Ey 2 2Ex Ey + − 2 cos ∆ = sen2 ∆ 2 2 2 2 A cos θ A sen θ A sen θ cos θ (3.3) 25 3.2. Formalización Llamando a las amplitudes en los ejes x e y H = A cos θ y K = A sen θ: Ex 2 Ey 2 2Ex Ey cos ∆ = sen2 ∆ + 2 − H2 K HK (3.4) con A2 = H 2 + K 2 . Algunos casos especiales deben ser señalados. Cuando ∆ = 0: Ex 2 Ey 2 2Ex Ey + 2 − =0 H2 K HK (3.5) o o Ex Ey − H K 2 H Ex = Ey K =0 (3.6) (3.7) Cuando ∆ = π/2: Ex 2 Ey 2 + 2 =1 (3.8) H2 K que es la ecuación de una elipse. Como la energı́a de una onda transversal depende del cuadrado de la amplitud, tenemos aquı́ la conexión entre la elipse que observamos al representar la intensidad de la luz respecto al ángulo girado por el cristal y el hecho de que esa luz es una onda transversal de amplitudes H y K en los ejes x e y. Finalmente, cuando ∆ = π: Ex H =− Ey K 3.2. (3.9) Formalización Para describir la elipse de polarización podrı́amos dar uno de sus semiejes, la excentricidad y el ángulo que forma uno de los semiejes de la elipse con uno de los ejes de nuestro sistema de referencia. Esta es una forma, pero no la única. Y tiene un inconveniente, y es que mientras que la elipse la construimos midiendo intensidades, que tienen dimensiones de energı́a por unidad de superficie y tiempo, parámetros como excentricidad y ángulo son adimensionales. Serı́a preferible hacer una descripción mediante cantidades de la misma clase. Y esta descripción la dió Stokes introduciendo los parámetros: 26 3. Polarización I Q U V = = = = H 2 + K 2 = A2 H 2 − K 2 = A2 cos2 θ − A2 sen2 θ = I cos 2θ 2HK cos ∆ = 2A2 sen θ cos θ cos ∆ = I sen 2θ cos ∆ 2HK sen ∆ = 2A2 sen θ cos θ sen ∆ = I sen 2θ sen ∆ (3.10) Se comprueba que I 2 = Q2 + U 2 + V 2 1 H2 = (I + Q) 2 1 (I − Q) K2 = 2 V 2 = 4H 2 K 2 sen2 ∆ (3.11) o sen2 ∆ = V2 I 2 − Q2 (3.12) Dado que la ecuación general de la elipse de semiejes H y K en coordenadas cartesianas es x2 y2 2xy cos δ + − = sen2 δ (3.13) 2 2 H K HK donde δ es el ángulo que forma el semieje mayor de la elipse con el eje x, vemos que la introducción del desfase ∆ entre las vibraciones ordinaria y extraordinaria es la causa de la rotación de la elipse. Simplifiquemos la notación escribiendo x en lugar de Ex e y en lugar de Ey , y tenemos que 2x2 (I − Q) 4U xy 2y 2 (I + Q) − + =1 V2 V2 V2 (3.14) P x2 − 2Gxy + F y 2 = 1 (3.15) o con P = 2(I − Q) V2 27 3.2. Formalización 2U V2 2(I + Q) F = V2 G = (3.16) Hemos visto que, en efecto, los parámetros de Stokes definen la elipse de polarización de forma matemáticamente conveniente. Hubiésemos podido convencernos cualitativamente observando que I, Q determinan los semiejes H, K y que U, V determinan sin ambigüedad la orientación ∆, pues incluyen sen ∆ y cos ∆. Un razonamiento adicional que enlaza la geometrı́a de la elipse con los parámetros de Stokes es el siguiente. Para un punto de la elipse, en coordenadas polares: x = r cos ϕ y = r sen ϕ (3.17) y la ecuación de la elipse se escribe P r2 cos2 ϕ − 2Gr2 sen ϕ cos ϕ + F r2 sen2 ϕ = 1 (3.18) o bien 1 2 1 P r (1 + cos(2ϕ)) − Gr2 sen(2ϕ) + F r2 (1 − cos(2ϕ)) = 1 2 2 (3.19) llamando β = 2ϕ y W = 2/r2 : W = (P + F ) − 2G sen β + (P − F ) cos β (3.20) En los ejes mayor y menos, r(ϕ) alcanza un máximo o un mı́nimo, luego W (β) un mı́nimo o un máximo, dado por la condición dW = 0 = −2G cos β − (P − F ) sen β dβ (3.21) Ası́ que si β ⋆ es el valor que toma β en los semiejes: tan β ⋆ = sen β ⋆ 2G = ⋆ cos β F −P (3.22) y dado que tan α = tan(α + π), hay dos valores de β ⋆ , α1 y α2 , que satisfacen la condición de extremo y que se diferencian en π (como definimos 28 3. Polarización β = 2ϕ, es claro que los dos valores de ϕ difieren en π/2, como era de esperar). Si llamamos W1 y W2 a los valores de 2/r2 para α1 y α2 : r22 W1 (P + F ) − 2G sen α1 + (P − F ) cos α1 = = (3.23) 2 r1 W2 (P + F ) − 2G sen α2 + (P − F ) cos α2 Ahora, sustituyendo hacia atrás P, F y G en función de los parámetros de Stokes vemos que es U Q y que la razón entre los cuadrados de los ejes es √ I − Q2 + U 2 √ I + Q2 + U 2 (3.24) tan δ = 3.3. (3.25) Grado de polarización Por otro lado, se sigue de las definiciones de los parámetros de Stokes que I 2 = Q2 + U 2 + V 2 . Ahora bien, si volvemos al experimento original que ha dado origen al descubrimiento de la elipse de polarización, es claro que las relaciones descubiertas hasta ahora son válidas para luz polarizada, mientras que existen fuentes de luz no polarizada para las cuales Q = U = V = 0, ya que si la luz no está polarizada la única cantidad empı́ricamente constatable es la intensidad, y el giro de la lámina de espato de Islandia no reveları́a variación alguna con la dirección. Ahora bien, ocurre con frecuencia que una fuente de luz no está ni totalmente polarizada ni carece en absoluto de polarización, sino que se encuentra polarizada parcialmente. Si introducimos el llamado ((grado de polarización)) P , como Q2 + U 2 + V 2 (3.26) I2 es claro que P = 0 para luz sin polarizar y P = 1 para luz totalmente polarizada. Y ası́ podrı́amos separar la luz en dos vectores de Stokes, uno para la parte polarizada y otro para la parte sin polarizar: P2 = I Q U V = PI Q U V + es más, si P 6= 0 podemos escribir que (1 − P )I 0 0 0 (3.27) 29 3.4. Matrices de Mueller I Q U V 1+P = 2P PI Q U V 1−P + 2P PI −Q −U −V (3.28) y ası́ considerar que un haz parcialmente polarizado está compuesto por dos polarizados y de polarización opuesta. Como P I = √ 2haces2 totalmente 2 Q + U + V , si normalizamos P I a la unidad, las ((coordenadas)) (Q, U, V ) indican un punto sobre una esfera de radio unidad llamada ((esfera de Poincaré)) y entonces (Q, U, V ) y (−Q, −U, −V ) son puntos diametralmente opuestos sobre la esfera de Poincaré. 3.4. Matrices de Mueller Denominaremos por S̄ al vector formado por los cuatro parámetros de Stokes: I Q U V (3.29) S̄2 = MS̄1 (3.30) S̄ = Al pasar un haz de luz polarizada a través de un dispositivo ópticamente activo, cambiará su estado de polarización. Llamemos S̄1 al estado del haz antes de entrar en el dispositivo, y S̄2 al estado después de salir del mismo. Lo que mostraremos ahora es que S̄1 y S̄2 están relacionados linealmente de forma que existe una matriz M que hace Los elementos Mij son propios de cada dispositivo y de su orientación. A la matriz M se le llama ((matriz de Mueller)). Es posible deducir su forma conocidos distintos tipos de haces de entrada y salida. Consideremos un polarizador ideal, que no introduce retardo de fase: ∆ = 0. Z= X E J N B F K P T D G H L M R S Tendremos en cuenta las cuatro situaciones siguientes: (3.31) 30 3. Polarización 1. Un polarizador lineal deja pasar la mitad de la intensidad de un haz de luz no polarizada de intensidad I. Llamemos I = 2W . La luz no polarizada es 2W 0 0 0 (3.32) W W c2 W s2 0 (3.33) S̄1 = y la luz emergente S̄2 = donde s1 = sen θ, c1 = cos θ, s2 = sen 2θ y c2 = cos 2θ. Relacionando ambos estados: W W c2 W s2 0 = X E J N B F K P 2W T D G H 0 L M 0 0 R S (3.34) de donde se siguen las ecuaciones: 1 c2 s2 0 = = = = 2X 2E 2J 2N (3.35) es decir 1 2 1 c 2 2 1 s 2 2 0 B F K P T D G H L M R S (3.36) 31 3.4. Matrices de Mueller 2. Un polarizador que deja inalterado el haz de entrada, previamente polarizado, actúa de la forma: W W c2 W s2 0 1 2 B F K P 1 c 2 2 1 s 2 2 = 0 W T D G H W c2 L M W s2 0 R S (3.37) de donde se siguen las ecuaciones: 1 + Bc2 + T s2 2 1 c2 + F c2 + Gs2 c2 = 2 1 s2 = s2 + Kc2 + Ls2 2 0 = P c2 + Rs2 1 = (3.38) La última de estas ecuaciones es válida para todo c2 y s2 . Luego si c2 = 0, R = 0 y si s2 = 0, P = 0. Por tanto P = R = 0. 3. El dispositivo tranforma luz de amplitud A según el eje x en luz de amplitud A cos θ en el eje que forma un ángulo θ con el eje x. Para la luz original, H 2 = A2 ; K = 0, luego I = Q = A2 y U = V = 0. El haz de salida tiene de componentes, en el eje x, Ac21 y en el eje y Ac1 s1 . Luego H 2 = A2 c41 , K 2 = A2 c21 s21 , y como ∆ = 0, I = A2 c21 , Q = A2 c21 c2 , U = A2 c21 s2 y V = 0. En resumen: c21 c21 c2 c21 s2 0 = 1 2 1 c 2 2 1 s 2 2 0 1 B T D 1 F G H K L M 0 0 0 0 S (3.39) que proporciona 1 +B 2 1 = c2 + F 2 1 s2 + K = 2 c21 = c21 c2 c21 s2 (3.40) 32 3. Polarización De la primera B = c21 − 1 1 = c2 2 2 (3.41) De la segunda 1 F = c22 2 (3.42) 1 K = s2 c2 2 (3.43) y de la tercera Recordando que Bc2 + T s2 = 1 2 (3.44) tenemos 1 T = s2 2 (3.45) 4. Consideremos luz circular de amplitud A. La amplitud en ambos ejes es A, de donde I = 2A2 , Q = U = 0 y V = 2A2 . Aquı́ es ∆ = ± π2 , lo que hace V 6= 0. En caso contrario, no tendrı́amos luz polarizada circular, sino luz no polarizada. Si el dispositivo convierte esta luz en luz polarizada lineal de amplitud A según el eje que forma un ángulo θ con el x, tenemos que H = Ac1 , K = As1 y con ∆ = 0 a la salida, I = A2 , Q = A2 (c21 − s21 ) = A2 c2 , U = A2 s2 y V = 0. En resumen: 1 c2 s2 0 = 1 2 1 c 2 2 1 s 2 2 0 1 c 2 2 1 2 c 2 2 1 cs 2 2 2 0 1 s 2 2 G L 0 D H M S 2 0 0 2 (3.46) de donde D = H = M = S = 0 y 1 c2 s2 2 1 2 L = s 2 2 G = (3.47) 33 3.4. Matrices de Mueller En definitiva, hemos encontrado la Matriz de Mueller para el polarizador ideal: Z= 1 2 1 c2 s2 2 c2 c2 c2 s2 s2 c2 s2 s22 0 0 0 0 0 0 0 (3.48) Con una secuencia de razonamientos similar podemos encontrar la matriz de Mueller para otros dispositivos. Por ejemplo, para dispositivos que introducen un desfase ∆ 6= 0. En definitiva, cuando un haz de luz S̄i atraviesa una serie de dispositivos representados por matrices M1 , M2 , ... la luz resultante es S̄f = Mn · · · M3 M2 M1 S̄i (3.49) 34 3. Polarización Capı́tulo 4 Difracción 4.1. Introducción Imaginemos dos láminas opacas, paralelas. Practicamos un pequeño orificio en una de ellas y disponemos una fuente de luz de modo que ilumine la lámina agujereada. La luz traspasa el orificio y se proyecta sobre la segunda lámina. Podemos advertir que la forma iluminada en la segunda lámina se corresponde con la forma del orificio en la primera. Ası́, un orificio rectangular produce un rectángulo iluminado. Un orificio circular, un orificio circular, y ası́ sucesivamente. Si observamos más cuidadosamente, podemos advertir que la lı́nea que separa la figura luminosa de la zona sombreada no es perfectamente nı́tida. Esto puede deberse a que nuestra fuente de luz no es puntual sino extensa, de manera que entre la zona de luz y la zona de oscuridad existe una zona intermedia de penumbra. Pero si refinamos el experimento acercándonos más y más a una fuente puntual esta indefinición persiste. Más aún, si reducimos progresivamente el tamaño del orificio, el fenómeno se agudiza. Finalmente, podemos comprobar como, reduciendo el orificio prácticamente a un punto, su imagen en la pantalla no es un punto luminoso, sino una mancha difusa cuyo tamaño es mayor que el del orificio que se ilumina. En un experimento más cuidadoso, por ejemplo, sustituyendo la lámina de proyección por una pelı́cula fotográfica, vemos que esta mancha difusa se compone en realidad de una serie de anillos claros y oscuros concéntricos. El experimento puede repetirse para otro tipo de aberturas, como por ejemplo rendijas. Y puede verse la figura que proyecta no sólo un orificio en particular sino varios de ellos, como por ejemplo una serie de orificios pequeños espaciados regularmente a lo largo de una lı́nea recta o una serie de rendijas estrechas paralelas espaciadas regularmente. De todos estos experimentos toma fuerza la hipótesis de que la luz es una 35 36 4. Difracción perturbación ondulatoria, ya que las figuras que aparecen en la pantalla de proyección son similares a las que pueden obtenerse perturbando por ejemplo ondas superficiales en el agua. Por consiguiente, es precisa una teorı́a de la formación de las imágenes que vaya más allá de la teorı́a geométrica de los rayos de luz que se propagan en lı́nea recta. 4.2. La difracción en 9 pasos sencillos 4.2.1. Paso 1. Flujo Dado un campo vectorial, que es una aplicación que a cada punto del espacio le hace corresponder un vector, y dado un elemento de superficie en ese espacio (Figura 1), tan pequeño como sea preciso para que pueda atribuirse un único valor del campo vectorial a todos los puntos de esta superficie, se define el flujo elemental del vector F̄ a través de la superficie ¯ como el producto escalar dσ ¯ dΦ = F̄ • dσ (4.1) ¯ es tal que su módulo es el donde el ’•’ indica producto escalar. El vector dσ valor de la superficie elemental y su dirección normal a ésta. Si este elemento de superficie es parte de una superficie mayor que encierra un volumen, el ¯ es hacia el exterior del volumen. sentido del vector dσ 4.2.2. Paso 2. Divergencia Dada una superficie que encierra un pequeño volumen, si existe el lı́mite para la razón entre el flujo a través de esa superficie y el volumen encerrado por la superficie cuando el volumen se hace más y más pequeño, a ese lı́mite se le llama ((divergencia)) del campo vectorial. En el lı́mite, el volumen queda reducido a un punto y entonces se puede hablar de la divergencia del campo en ese punto. dσ Figura 1 F 37 4.2. La difracción en 9 pasos sencillos Para buscar una expresión analı́tica para la divergencia, consideremos un pequeño cubo de lados dx, dy, dz cuyas caras sean paralelas a los planos que definen los ejes coordenados. En relación con la Figura 2, consideremos que las caras a y b son perpendiculares al eje x y que las coordenadas x toman valores crecientes al movernos de a hacia b; consideremos el flujo total a través de ambas caras. El flujo a través de la cara a es ¯ a = −Fx dydz dΦa = F̄ • dσ (4.2) ¯ a = (−dydz, 0, 0). El flujo a través de la cara b es ya que dσ ! ! ∂ F̄ ¯ = Fx + ∂Fx dx dydz dΦb = F̄ + dx dσ ∂x ∂x (4.3) ¯ b = (dydz, 0, 0) y ya que dσ ∂ F̄ = ∂x ∂Fx ∂Fy ∂Fz , , ∂x ∂x ∂x ! (4.4) Por tanto, el flujo total a través de las caras a y b es ∂Fx dxdydz (4.5) ∂x De la misma forma, podemos calcular el flujo a través de los dos pares de caras paralelas restantes, las que son perpendiculares a los ejes y y z, y tendrı́amos para el flujo total a través de las caras del cubo elemental: dΦ = dΦ = ! ∂Fx ∂Fy ∂Fz dxdydz + + ∂x ∂y ∂z (4.6) La divergencia, que es la razón entre este flujo y el volumen elemental dxdydz es pues div F̄ = ∂Fx ∂Fy ∂Fz + + ∂x ∂y ∂z b a Figura 2 (4.7) 38 4. Difracción ¯ definiéndolo como Es común en este punto introducir el operador ∇, ¯ = ∇ ∂ ∂ ∂ , , ∂x ∂y ∂z ! (4.8) ¯ con lo cual la divergencia se puede poner como el producto escalar de ∇ por F̄ : ¯ • F̄ div F̄ = ∇ 4.2.3. (4.9) Paso 3. Teorema de la divergencia Sea un volumen finito V limitado por una superficie S. Dividamos el volumen en pequeños cubos elementales. Fijemos la atención sobre uno de esos pequeños cubos, uno de los que se encuentran en el interior de V . Al igual que hemos hecho en el paso anterior, podemos calcular el flujo a través de las caras de ese pequeño cubo, y calcular la divergencia en el punto lı́mite al que se reduce el cubo a medida que su arista tiende a cero. Luego, podrı́amos sumar la divergencia para todos los pequeños cubos del volumen. Ahora bien, como los cubos son adyacentes, cada cara es compartida por dos de ellos. El valor del campo F̄ en una cara es el mismo tanto si consideramos que esa cara pertenece a un cubo como si consideramos que pertenece al cubo de al lado. Pero las normales son opuestas, según que la cara se considere perteneciente a un cubo o a otro. En consecuencia, los flujos se compensan. Si sumamos las divergencias de todos los cubos interiores a V , esa suma será nula. Sólo quedan por considerar los cubos una de cuyas caras es de hecho un elemento de la superficie exterior S, tal como se muestra en la Figura 3. El flujo a través de todas las caras está compensado, excepto el flujo a través de la cara que es un elemento de la superficie S. Por tanto, el flujo total a través de todas las caras de todos los cubos en que se divide el volumen queda reducido al flujo a través de la superficie S. En otras palabras: Φ= Z V ¯ • F̄ )dV = (∇ dS Figura 3 Z S ¯ F̄ • dS (4.10) 39 4.2. La difracción en 9 pasos sencillos 4.2.4. Paso 4. Definición de gradiente Dada una función escalar que asigna un valor f (x, y, z) a cada punto del espacio (x, y, z), se define el gradiente de f en el punto (x, y, z) como el vector de componentes: ¯ = ∇f ∂f ∂f ∂f , , ∂x ∂y ∂z ! (4.11) La divergencia es un escalar. El gradiente es un vector. Consideremos el caso particular en que el campo vectorial F̄ se escribe como el producto de una función escalar ϕ por un campo Ū y calculemos su divergencia: ¯ • F̄ = ∇ ¯ • (ϕŪ ) ∇ ∂ ∂ ∂ = (ϕUx ) + (ϕUy ) + (ϕUz ) ∂x ∂y ∂z ∂Ux ∂ϕ Ux + ϕ = ∂x ∂x ∂Uy ∂ϕ + Uy + ϕ ∂y ∂y ∂ϕ ∂Uz + Uz + ϕ ∂z ∂z ¯ ¯ • Ū ) = (∇ϕ) • Ū + ϕ(∇ 4.2.5. (4.12) Paso 5. Una aplicación del resultado anterior Respecto al resultado obtenido en el paso anterior, veamos qué ocurre ¯ cuando Ū = ∇ψ, es decir, cuando el campo vectorial Ū es el gradiente de cierta función escalar ψ, puesto que sabemos que el gradiente de ψ en cada punto es un vector. ¯ • (ϕ∇ψ) ¯ ¯ • (∇ψ) ¯ + ϕ(∇ ¯ • (∇ψ)) ¯ ∇ = (∇ϕ) (4.13) ¯ ∇ ¯ se le llama ((laplaciano)), se representa como ∇ ¯ 2 y como Al operador ∇• es fácil ver ¯2 ∇ = ∂2 ∂2 ∂2 , , ∂x2 ∂y 2 ∂z 2 ! (4.14) 40 4. Difracción 4.2.6. Paso 6. Identidad de Green ¯ y ψ ∇ϕ. ¯ Aplicando a ambos el Consideremos los campos vectoriales ϕ∇ψ teorema de la divergencia y restando uno del otro queda la que se conoce como ((identidad de Green)): Z 4.2.7. V ¯ 2ψ − ψ∇ ¯ 2 ϕ]dV = [ϕ∇ Z S ¯ − ψ(∇ϕ)]dS ¯ [ϕ(∇ψ) (4.15) Paso 7. Ecuación de ondas Hasta ahora, nos hemos limitado a introducir algunas definiciones y deducir algunos resultados. El contenido de estos resultados es matemático, no fı́sico. En este momento, introducimos por primera vez una hipótesis de naturaleza fı́sica. A partir de los experimentos con que comenzamos el capı́tulo, vimos la plausibilidad de que la luz constituya una perturbación ondulatoria. Si la luz es una onda, satisfará la ecuación de ondas. Ignoramos cual es la naturaleza de esa perturbación, pero como al observar la imagen en la pantalla apreciamos distintos valores de intensidad en cada punto (es decir, un valor escalar), supondremos que esa perturbación es de naturaleza escalar 1 . Si imponemos sobre las funciones escalares ϕ y ψ el que satisfagan la ecuación de ondas: 2 ¯ 2ψ = 1 ∂ ψ ∇ c2 ∂t2 (4.16) 2 ¯ 2ϕ = 1 ∂ ϕ ∇ (4.17) c2 ∂t2 comprobamos cómo el primer término de la identidad de Green se hace nulo. En efecto, si ϕ y ψ tienen una dependencia temporal de la forma cos ωt, por sustitución y cálculo directo se comprueba que esto es ası́. Por tanto, la integral de superficie es nula: Z 4.2.8. S ¯ =0 ¯ − ψ(∇ϕ)] ¯ dS [ϕ(∇ψ) (4.18) Paso 8. Teorema integral de Kirchoff Una fuente luminosa, como la llama de una vela, esparce su luz en todas direcciones, salvo por los obstáculos que pudiese haber. Es natural entonces 1 Por este motivo, a la teorı́a que estamos exponiendo se la llama teorı́a escalar. En realidad, sı́ sabemos que la luz es una onda electromagnética, pero como este dato no es necesario para el desarrollo de la presente teorı́a, podemos fingir que lo desconocemos. 41 4.2. La difracción en 9 pasos sencillos pensar que la perturbación luminosa tiene forma de onda esférica. Escribamos: ϕ= ϕ0 cos(kr − ωt) r (4.19) y calculemos la integral de superficie sobre una superficie tal que contiene al origen P . Pero, puesto que en P ϕ no está definida, tomaremos como volumen aquel delimitado por una superficie exterior S1 y una superficie interior S2 de radio ρ que contiene al punto P , como se ve en la Figura 4. Además, obsérvese que la normal a S1 está dirigida en el sentido de los r crecientes, mientras que la normal a S2 está dirigida hacia el punto r = 0. S 1 ρ .P S 2 Figura 4 Ahora bien, si recordamos los experimentos citados al principio de este capı́tulo, hablábamos de la formación de patrones luminosos sobre la pantalla cuando la luz atraviesa orificios pequeños. Hemos de resaltar ahora que estos patrones son estáticos: ni cambia su figura ni ésta muestra variación alguna con el tiempo. Pero hemos usado ya en el paso 7 la ecuación de ondas, que supone una dependencia temporal. Por tanto, se requiere una explicación. Y ésta es que la frecuencia temporal de la perturbación es tan grande que lo que percibimos por el ojo o mediante una placa fotográfica es algún tipo de promedio, y ese promedio podemos incluirlo en la constante ϕ0 . Recordemos que tratamos de explicar aquello que vemos, no aquello que en realidad sucede, pues, de hecho, aunque hemos postulado que la luz es algún tipo de perturbación ondulatoria no necesitamos conocer de qué naturaleza es esta perturbación. Podrı́amos sumar a este otros argumentos, tanto fı́sicos (calculamos la integral de superficie en un instante dado que podemos tomar como t = 0) como matemáticos (podemos escribir la onda usando notación 42 4. Difracción exponencial como producto de dos factores: uno dependiente y otro independiente del tiempo) para despreocuparnos de la parte temporal y efectuar los cálculos siguientes sólo sobre la parte espacial: ϕ= ϕ0 cos kr r (4.20) Consideremos la integral sobre S2 . Un elemento de superficie se representa mediante un vector de módulo dS2 y dirección y sentido determinados por la ¯ 2 = dS2 n̂. En cuando al módulo, si dΩ es el elemento de ángulo normal n̂: dS sólido subtendido por dS2 según se ve desde P , tenemos que dS2 = ρ2 dΩ (4.21) En cuanto a la normal, en el punto (x, y, z) perteneciente a la superficie de la esfera es x y z n̂ = − , − , − ρ ρ ρ ! (4.22) En cuanto al gradiente que aparece en el integrando, siendo el gradiente de una función escalar que depende del módulo r, es claro que, para cualquier función f (r) que depende sólo de r será ∂f ∂r ∂f = ∂x ∂r ∂x (4.23) ∂r x = ∂x r (4.24) al tiempo que con análogas relaciones para y y z. Efectuando las operaciones y tomando el lı́mite cuando ρ → 0, sobrevive sólo ψ(P ), y la integración a toda la esfera da un factor 4π, de manera que, finalmente: ψ(P ) = 1 1 Z ¯ 1 ¯ − ψ∇ ¯ 1 cos kr dS cos kr∇ψ 4π S1 r r (4.25) Esta es la expresión del conocido como ((teorema integral de Kirchoff)), que viene a decirnos que el valor de ψ en el punto P se puede obtener a través de una integral sobre una superficie que encierre al punto P . 43 4.2. La difracción en 9 pasos sencillos n^ r’ S r P F Figura 5 4.2.9. Paso 9. Integral de Kirchoff-Fresnel Llegados a este punto, podemos conjugar los resultados matemáticos con los experimentales. En relación a la Figura 5, si F es una fuente de luz y P un punto de la pantalla donde deseamos calcular la perturbación luminosa, sabemos, del paso anterior, que el valor de dicha perturbación en P se puede encontrar a través de una superficie que encierre a ese punto. Elijamos esa superficie de tal manera que el orificio S sea parte de ella, y de forma también que la perturbación en cualquier otro punto de la superficie que encierra a P y que no pertenece al orificio, es nula. Puesto que esta superficie es arbitraria, siempre podemos hacerla tan alejada del punto P como sea preciso para que se cumplan estas condiciones. Por lo tanto, la integral que aparece en el ((teorema integral de Kirchoff)) se limita a la superficie de la abertura S. Lo que haremos ahora no será más que escribir dicha integral en el caso particular cuya geometrı́a hemos reflejado en la Figura 5. Como hemos visto, dada una función escalar f (r), su gradiente es ¯ = ∂f r̂ ∇f ∂r (4.26) ası́ que " # cos kr sen kr′ cos kr cos kr′ ′ cos kr ¯ r̂ − ∇ψ = −k r r r′ r r′ 2 y (4.27) 44 4. Difracción ¯ cos kr ψ∇ r ! " # sen kr cos kr′ cos kr′ cos kr = −k r̂ − r r′ r′ r2 (4.28) Ahora bien, k = 2π/λ, y como la longitud de onda es mucho menor que r y r′ , se tiene que λrr′ << r′ r2 y que λrr′ << rr′ 2 . Por tanto, el segundo término de cada corchete puede despreciarse al compararlo con el primero. La integral queda entonces # " kψ0 Z sen kr cos kr′ cos kr sen kr′ ′ ¯ ψP = r̂ − r̂ dS 4π S rr′ rr′ (4.29) ¯ = n̂dS, finalmente y como dS # " kψ0 Z sen kr cos kr′ cos kr sen kr′ ψP = cos(n̂, r̂) − cos(n̂, r̂′ ) dS (4.30) 4π S rr′ rr′ 4.3. Cálculo de la integral de Kirchoff-Fresnel La integral de Kirchoff-Fresnel puede calcularse analı́ticamente en una serie de casos sencillos, pero ilustrativos. En general sin embargo hay que acudir a simplificaciones adicionales. Por ejemplo, si la fuente se encuentra a una distancia muy grande de la abertura en comparación con las dimensiones de ésta, es posible tomar como constante esta distancia para todo punto de dicha abertura. Nuestro planteamiento aquı́ no es el cálculo analı́tico que como decimos es factible sólo en un número reducido de casos, si bien son casos significativos. Lo que pretendemos es desarrollar un programa que proporcione directamente la imagen que aparece sobre la pantalla. Tendremos en cuenta los siguientes elementos: 4.3.1. La pantalla Representaremos la pantalla como una matriz de puntos. Para cada punto, calcularemos la integral de Kirchoff-Fresnel. Normalizaremos los valores obtenidos al intervalo [0,255] y guardaremos estos valores en un formato gráfico. Cada punto vendrá representado pues por un valor (que truncaremos o aproximaremos al entero de 8 bits más próximo) y el conjunto de todos los puntos, la matriz que representa la imagen, la almacenaremos en un formato gráfico que pueda después visualizarse con ayuda de una computadora. Una matriz de 300×300 puntos parece suficiente. En cuanto a las unidades, puesto 4.3. Cálculo de la integral de Kirchoff-Fresnel 45 que en un experimento tı́pico la abertura tiene dimensiones del orden de la fracción de milı́metro, la figura de difracción es del orden de milı́metros y las distancias entre la fuente y la abertura y entre ésta y la pantalla está entre milı́metros y centı́metros (1 metro ya puede considerarse el infinito), parece sensato tomar el milı́metro como unidad de medida. Ası́ pues, por lo que respecta a la pantalla, será preciso especificar sus dimensiones y la distancia a la abertura. En cuanto a su forma, lo más simple es que sea cuadrada y que su centro coincida con el origen. El programa deberá tomar sus dimensiones y calcular, para cada punto de la matriz imagen de 300 × 300 las coordenadas correspondientes dentro del cuadrado de las dimensiones que se especifiquen. 4.3.2. La abertura El cáculo de la integral sobre la abertura es obviamente dependiente de la forma concreta de dicha abertura. Por este motivo todos los detalles al respecto quedan relegados al código fuente. La geometrı́a del problema se representa en la Figura 6. 4.3.3. Método de Montecarlo El nombre ((Método de Montecarlo)) se usa para denominar una familia de métodos. Nosotros nos referiremos a él en el contexto del cálculo de integrales de superficie. En general, los métodos de Montecarlo para integrales múltiples no son ventajosos para integración en una dimensión, y van tornándose más y más apropiados cuando el número de dimensiones se eleva. Todos estos métodos tienen en común que están basados en la generación de números aleatorios. Cómo pueden ser los números aleatorios útiles en el cálculo de integrales es algo que puede verse de forma sencilla tomando como ejemplo la integración de una función f (x) en un intervalo [a, b]. Si f˜ es el valor medio de la función en ese intervalo, es claro que el área encerrada bajo la curva en el intervalo es igual a (b − a)f˜. Por tanto, sólo es preciso calcular esta media, que se puede aproximar generando N números aleatorios xi en el intervalo [a, b] y tomando 1 X f˜ = f (xi ) N i (4.31) La generalización a dos dimensiones es obvia. Si f (x, y) es una función cuya integral quiere calcularse en el rectángulo a <= x <= b y c <= y <= d, el volumen bajo la superficie f (x, y) en el rectángulo dado es 46 4. Difracción y Pantalla x Abertura Fuente luminosa z Figura 6 V = Z b a Z d c f (x, y)dxdy = (b − a)(d − c)f˜ (4.32) donde f˜ es la ((altura media)) de f (x, y) en el rectángulo que puede estimarse generando un número grande de parejas (xi , yi ) y calculando 1 X f˜ = f (xi , yi ) N i (4.33) En la Figura 7 se representan algunos de los puntos de la abertura y uno de los puntos de la imagen. El cálculo numérico con un computador consta esencialmente de un bucle que recorre todos los puntos de la matriz imagen. Calcula las coordenadas de pantalla y genera un número grande de puntos pertenecientes a la abertura, efectuando la suma. Puesto que no nos interesan más que las intensidades relativas en la imagen, podemos prescindir de las constantes que aparecen fuera de la integral. En la Figura 8 se representan los vectores auxiliares Ū , V̄ y W̄ . El primero indica un punto sobre la pantalla. El 47 4.3. Cálculo de la integral de Kirchoff-Fresnel y ri x ri’ rj’ rj rk rk’ z Figura 7 segundo, un punto sobre la abertura. El tercero, la fuente de luz. De acuerdo con la figura, r̄ = V̄ − Ū y r̄′ = V̄ − W̄ Este marco teórico y la geometrı́a para el cáculo permite evitar los engorrosos detalles analı́ticos de la integral de Kirchoff-Frenel que aparecen al tratar con aberturas incluso sencillas, y allana el camino para calcular dicha integral numéricamente. No llevaremos más lejos la discusión sino que, en lugar de pasar efectivamente al cálculo o a la resolución numérica según el marco expuesto, terminamos este tema con las imágenes de difracción de algunas aberturas tı́picas. La Figura 9 es la difracción por una abertura circular. La Figura 10, por una abertura cuadrada. 48 4. Difracción y r’ V r W z Figura 8 Figura 9 U x 4.3. Cálculo de la integral de Kirchoff-Fresnel Figura 10 49