Cuatro temas de Óptica - Universidad de Alicante

4 TEMAS DE ÓPTICA Francisco Javier Gil Chica febrero, 2009 ii Índice general Sobre estos temas V 1. Transferencia de Radiación 1.1. Introducción . . . . . . . . . . . . . . . . 1.2. Definiciones . . . . . . . . . . . . . . . . 1.3. Absorción . . . . . . . . . . . . . . . . . 1.4. Emisión . . . . . . . . . . . . . . . . . . 1.5. Ecuación de la transferencia de radiación 1.6. Solución aproximada para atmósfera plana . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 4 6 7 . . . . . . . . . . . . 9 2. Óptica Matricial 2.1. Introducción . . . . . . . . . . . 2.2. Formulación matricial . . . . . . 2.2.1. Traslación . . . . . . . . 2.3. Refracción en superficie plana . 2.4. Refracción en superficie esférica 2.5. Matriz del sistema . . . . . . . 2.6. Interpretación . . . . . . . . . . 2.7. Conclusión . . . . . . . . . . . . 3. Polarización 3.1. Introducción . . . . . . 3.2. Formalización . . . . . 3.3. Grado de polarización 3.4. Matrices de Mueller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 12 13 14 14 17 19 22 . . . . 23 23 25 28 29 4. Difracción 35 4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2. La difracción en 9 pasos sencillos . . . . . . . . . . . . . . . . 36 4.2.1. Paso 1. Flujo . . . . . . . . . . . . . . . . . . . . . . . 36 iii iv ÍNDICE GENERAL 4.2.2. Paso 2. Divergencia . . . . . . . . . . . . . . 4.2.3. Paso 3. Teorema de la divergencia . . . . . . 4.2.4. Paso 4. Definición de gradiente . . . . . . . 4.2.5. Paso 5. Una aplicación del resultado anterior 4.2.6. Paso 6. Identidad de Green . . . . . . . . . 4.2.7. Paso 7. Ecuación de ondas . . . . . . . . . . 4.2.8. Paso 8. Teorema integral de Kirchoff . . . . 4.2.9. Paso 9. Integral de Kirchoff-Fresnel . . . . . 4.3. Cálculo de la integral de Kirchoff-Fresnel . . . . . . 4.3.1. La pantalla . . . . . . . . . . . . . . . . . . 4.3.2. La abertura . . . . . . . . . . . . . . . . . . 4.3.3. Método de Montecarlo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 38 39 39 40 40 40 43 44 44 45 45 Sobre estos temas Estos temas de Óptica tienen su origen en la asignatura Periféricos que vengo impartiendo desde hace quince años en las licenciaturas y diplomaturas de informática en la Escuela Politécnica Superior en la Universidad de Alicante. A lo largo de estos años, la asignatura ha cambiado profundamente, lo cual no es extraño dada la velocidad a la que se mueve la tecnologı́a, y dado que la creciente complejidad de los sistemas informáticos, con su acumulación de capas y el aislamiento entre la máquina y el usuario, ha ido reduciendo los contenidos relacionados con la programación del sistema e incrementando los contenidos relacionados con los fundamentos fı́sicos de los dispositivos periféricos, ası́ como el análisis matemático, en especial de los dispositivos de almacenamiento. Ası́, en un momento dado fue evidente la necesidad de dar unas nociones de Óptica. Porque si bien los sistemas informáticos están lejos de fundamentarse en la computación óptica, hay subsistemas basados en fenómenos ópticos: conexiones de fibra óptica, almacenamiento óptico y magneto-óptico, pantallas planas, lentes simples o sistemas de lentes, almacenamiento holográfico, etc. El problema que se plantea aquı́ entonces no consiste en ofrecer una asignatura de óptica aplicada a la informática, ni ofrecer una panorámica que aunque incompleta sea lógicamente consistente, ni recorrer el camino que va desde los mismos fundamentos fı́sicos al dispositivo concreto que se estudie. Más bien, hemos buscado unos pocos temas estratégicos y la formulación más compacta posible. En principio, eran tres los temas elegidos: óptica geométrica (sistemas paraxiales, fibra óptica), difracción (lectura/escritura en dispositivos ópticos, visualización) y polarización (pantallas planas, lectura en dispositivos magneto-ópticos). En cuanto a la óptica geométrica, la formulación matricial es a la vez sencilla, compacta y general. En cuanto a la difracción, hemos elegido una formulación matemática compacta que evita la distinción entre difracción de Fresnel y Fraunhoffer y propone, una vez formulada la integral v vi 0. Sobre estos temas general, un método de Montecarlo para obtener numéricamente las figuras de difracción. Por lo que respecta a la polarización, hemos adoptado la descripción a través de los parámetros de Stokes. Circunstancialmente, hemos añadido un tema sobre transferencia de radiación. Este tema es ajeno a la asignatura de Periféricos y tiene su origen en una pequeña charla sobre fenómenos ópticos atmosféricos impartida este año a alumnos de Meteorologı́a. Siendo ası́, los cuatro tiene un rasgo en común: que en ningún caso se acude a la naturaleza electromagnética de la luz, aunque sı́ a su naturaleza ondulatoria. Pero como esta naturaleza ondulatoria puede advertirse mediante experimentos sencillos, resultan una serie de temas que podrı́an denominarse ((óptica empı́rica)), ((óptica macroscópica)), o, dado que estas denominaciones no terminan de satisfacernos, ((óptica no electromagnética)). Capı́tulo 1 Transferencia de Radiación 1.1. Introducción Se presentan en este tema los fundamentos de la transferencia de radiación. Se adopta aquı́ un punto de vista fenomenológico donde la radiación es considerada como energı́a que se propaga en un medio material, sin considerar ni cual es la naturaleza de esta energı́a ni de qué forma, por qué mecanismos, es absorbida, desviada o producida por la materia. El material que sigue está tomado de Radiative Transfer, de S. Chandrasekhar y es una exposición resumida de los principios generales. 1.2. Definiciones Dada una superficie dσ, la cantidad de energı́a en forma de radiación que la atraviesa por unidad de tiempo, intervalo de frecuencia y ángulo sólido dω subtendido por la superficie dσ ′ en una dirección que forma un ángulo θ con la normal (Figura 1), se expresa como: dEν = Iν cos θ dtdσdνdω (1.1) En general, Iν depende de cada punto y de la dirección relativa a la normal expresada por los cosenos directores (l, m, n), de forma que funcionalmente es Iν (x, y, z, l, m, n, t). Cuando es Iν (x, y, z, t) se habla de medios isótropos. Cuando es Iν (l, m, n, t) se habla de medios homogéneos. Algunos casos aún más restrictivos son de interés. En un medio estratificado como puede ser una atmósfera plana es Iν (z, φ, θ, t). Si además existe simetrı́a axial será Iν (z, θ, t). En un medio estratificado esférico es Iν (r, φ, θ, t). 1 2 1. Transferencia de Radiación dω θ dσ Figura 1 El campo de radiación viene entonces determinado por la función Iν , a la que habrı́a que añadir el estado de polarización de la luz. Integrando para todas las direcciones posibles, obtendrı́amos la cantidad de energı́a total de frecuencia ν que atravesarı́a la superficie dσ por unidad de tiempo. La densidad de radiación uν en un punto es la cantidad de energı́a radiante de frecuencia ν por unidad de volumen que atraviesa un entorno pequeño alrededor del punto. Sea P este punto, contenido en un pequeño volumen V limitado por una superficie Σ. Dado un entorno de P contenido en V y limitado por una superficie σ, es claro que todo rayo que incide en σ proviene de algún punto de la superficie Σ (Figura 2). Sean los elementos de superficie dΣ y dσ. La energı́a por unidad de tiempo y frecuencia que atraviesa dΣ en el elemento de ángulo sólido dω ′ subtendido por dσ según se ve desde dΣ es dEν = Iν cos Θ dtdνdΣdω ′ (1.2) dEν = Iν cos ΘdνdΣdω ′ dt (1.3) o bien Ahora bien, dω ′ = dσ cos θ r2 (1.4) luego cos θ cos ΘdνdΣdσ dEν = Iν (1.5) dt r2 Cuando el pincel de radicación en el ángulo sólido dω ′ atraviesa V ′ , recorre una distancia l en un tiempo l/c, de forma que 3 1.2. Definiciones dΣ Θ θ dσ Figura 2 dEν = Iν cos θ cos ΘdνdΣdσ l r2 c (1.6) Pero dΣ cos Θ (1.7) r2 es el ángulo sólido subtendido por dΣ según se ve desde dσ, luego dω = dEν = Iν cos θdωdνdσ l c (1.8) Teniendo ahora en cuenta que dv ′ = l cos θdσ (1.9) es el volumen diferencial interceptado por el pincel de radiación que procede de dΣ y atraviesa dσ, tenemos que dEν 1 = Iν dωdν (1.10) ′ dv c Si integramos para todo el volumen y todas las frecuencias y consideramos los rayos provenientes de todas las direcciones, tenemos la energı́a total contenida en el entorno de P , y de ahı́ la densidad buscada: Z 1Z Z E Iν dνdω = uν dν u= ′ = V c ω ν ν (1.11) 4 1. Transferencia de Radiación donde hemos introducido 1Z Iν dω c ω Definiendo la intensidad media como uν = Jν = (1.12) 1 Z Iν dω 4π ω (1.13) 4π Jν c (1.14) es claro que uν = 1.3. Absorción Cuando un pincel de radicación se propaga en un medio, sufre una atenuación cuyo valor relativo es proporcional a la densidad de ese medio y a la distancia recorrida: dIν = −kν ρds Iν (1.15) A kν se le llama ((coeficiente de absorción)), ds es esa distancia recorrida y ρ la densidad del medio. Esta atenuación puede deberse a varias causas. En primer lugar, puede que parte de la energı́a simplemente cambie de dirección. No disminuye entonces el total de energı́a radiante en el medio sino que se modifica su distribución. En ese caso se habla de dispersión 1 . O puede suceder que la energı́a sea efectivamente absorbida por la materia y transformada en otras formas de energı́a, lo que incluye su re-emisión con una frecuencia distinta y en general en una dirección distinta. Se habla entonces de verdadera absorción. Consideremos el proceso de dispersión (Figura 3). La energı́a dispersada en todas direcciones cuando el pincel atraviesa una distancia ds en el medio es kν ρdsIν cos θdνdσdω (1.16) Como el diferencial de masa atravesado cuando la radiación recorre un ds es dm = ρdσ cos θds 1 (1.17) Traducimos el término scattering, usado de forma tan general como innecesaria 5 1.3. Absorción ds θ dσ Figura 3 dω’ θ Θ ds dσ Figura 4 se puede escribir kν Iν dmdνdω (1.18) Ahora bien, la descripción completa exige conocer qué fracción de esa radiación dispersada lo hace en cada dirección dada por cada elemento de ángulo sólido dω ′ (Figura 4). Esta fracción puede escribirse como dω ′ (1.19) 4π A la función p(cos Θ) se le llama función de fase. La energı́a dispersada en todas direcciones es p(cos Θ) kν Iν dmdνdω Z ω′ p(cos Θ) ′ dω 4π (1.20) que comparada con kν Iν dmdνdω (1.21) muestra que ha de ser p(cos Θ) ′ dω 4π ω′ Ahora bien, cuando hay verdadera absorción 1= Z (1.22) 6 1. Transferencia de Radiación Z ω′ p(cos Θ) ′ dω = ω0 <= 1 4π (1.23) En el caso más simple posible p(cos Θ) = ω0 . Otras formas de interés son la llamada función de fase de Rayleigh p(cos Θ) = 34 (1+cos2 Θ) y una función usada en estudios sobre iluminación planetaria: p(cos Θ) = ω0 (1 + x cos Θ), con −1 <= x <= 1. En general, podemos suponer que la función de fase se puede desarrollar como una serie de polinomios de Legendre: p(cos Θ) = X ωl P (cos Θ) (1.24) l 1.4. Emisión Un campo de radiación no sólo puede ser modificado mediante absorción y dispersión por la materia, sino que ésta puede contribuir al campo total emitiendo a su vez, como es obvio en, por ejemplo, las atmósferas estelares. La cantidad de energı́a emitida en el conjunto de direcciones contenidas en dω en un tiempo dt por un elemento de masa dm en el intervalo de frecuencias dν es: jν dmdtdνdω (1.25) donde jν es el coeficiente de emisión. Ahora bien, esta radiación puede ser emitida efectivamente por dm o puede haber sido dispersada en la dirección dω desde otras direcciones. Ası́, un pincel de radiación que incide sobre dm desde la dirección (φ′ , θ′ ) contribuye a la radiación emitida desde dm en la dirección (φ, θ) con una energı́a por unidad de tiempo: kν dmdνdωIν (φ′ , θ′ )p(φ′ , θ′ , φ, θ) dω ′ 4π (1.26) siendo dω ′ = sen θ′ dθ′ dφ′ (1.27) y donde p(φ′ , θ′ , φ, θ) es función del ángulo formado por las direcciones (φ′ , θ′ ) y (φ, θ). Ası́ pues, la radiación emitida puede provenir de dm o haber sido dispersada desde otra dirección por dm. Entonces, el ritmo al que se emite la energı́a radiante se puede escribir: jν dmdνdω = (jν(d) + jν(e) )dmdνdω (1.28) 1.5. Ecuación de la transferencia de radiación 7 Comparando esta expresión con que nos da el ritmo de emisión de radiación según la dirección de dω proveniente de la dispersión desde la dirección dω ′ , es claro que kν Z π Z 2π Iν (φ′ , θ′ )p(φ′ , θ′ , φ, θ) sen θ′ dθ′ dφ′ (1.29) 4π 0 0 Un medio es puramente dispersivo cuando jν = jν(d) . Nótese que un medio puramente dispersivo no equivale a un medio donde la dispersión sea completa (ω0 = 1). En otras palabras, que toda la radiación emitida por dm provenga de la dispersión desde todas las direcciones no implica que toda la radiación que alcanza a dm sea dispersada: parte puede ser absorbida. En un medio en equilibrio termodinámico, donde en cada punto se puede definir una temperatura T , se cumple la Ley de Kirchoff: jν(d) = jν = kν Bν (T ) (1.30) donde Bν (T ) es la función de Planck: 1 2hν 3 2 hν/kT c e −1 Se define la ((función fuente)), Fν como Bν (T ) = jν kν En el caso de un medio puramente dispersivo: Fν = 1 Z π Z 2π Fν = p(φ, θ, φ′ , θ′ )Iν (φ′ , θ′ ) sen θ′ dθ′ dφ′ 4π 0 0 En un medio en equilibrio termodinámico Fν = Bν (T ) 1.5. (1.31) (1.32) (1.33) (1.34) Ecuación de la transferencia de radiación Consideremos (Figura 5) un cilindro de sección normal dσ y longitud ds y la radiación que atraviesa normalmente sus dos caras. De la definición de intensidad, la cantidad de energı́a radiante que atraviesa una de las caras que tomamos como origen es dEν(0) = Iν dtdνdσdω mientras que en la cara opuesta (1.35) 8 1. Transferencia de Radiación dω dω dσ ds Figura 5 dEν(ds) = (Iν + dIν ds)dtdνdσdω ds (1.36) de manera que dIν dsdtdνdσdω (1.37) ds Esta diferencia provendrá de la existente entre emisión y absorción. La cantidad de radiación absorbida es dEν(ds) − dEν(0) = kν Iν dmdνdtdω = kν Iν ρdσdsdνdtdω (1.38) La cantidad emitida es jν dmdνdtdω = jν ρdσdsdνdtdω (1.39) 1 dIν = Fν − Iν kν ρ ds (1.40) De manera que En el segundo miembro, el primer término es la función fuente, que incluye la dispersión desde todas las direcciones en la dirección de dω, y que depende de Iν . El segundo da cuenta de la absorción. Tenemos por tanto una ecuación integro-diferencial. En coordenadas cartesianas esta ecuación se escribe ! ∂ ∂ ∂ 1 l +l +l I(x, y, z, l, m, n) = I(x, y, z, l, m, n) − − kν ρ ∂x ∂y ∂z F(x, y, z, l, m, n) (1.41) Es de especial interés el de un medio estratificado plano, como ocurre en las atmósferas planetarias y estelares. En ese caso la intensidad es función de z y θ, suponiendo como es lógico simetrı́a axial en torno al eje z. La ecuación fundamental se reduce entonces a 1.6. Solución aproximada para atmósfera plana 9 d 1 Z 2π Z π 1 cos θ I(z, θ) = I(z, θ) − p(cos Θ)I(z, θ) sen θ′ dθ′ dφ′ kν ρ dz 4π 0 −π (1.42) En el caso más sencillo, p(cos Θ) = 1. Con los cambios de variable µ = cos θ y − τ= Z ∞ z kν ρdz (1.43) transformamos la ecuación en la forma en que se acostumbra a trabajar con ella: dI(τ, µ) 1Z 1 µ = I(τ, µ) − I(τ, µ′ )dµ′ dz 2 −1 1.6. (1.44) Solución aproximada para atmósfera plana Existe un método aproximado de resolución propuesto por Schuster (1905) y Schwarszchild (1906) que se inspira en la teorı́a cinética de los gases y que puede ser generalizado fácilmente. En efecto, es común en el contexto de la teorı́a cinética considerar un número de moléculas encerradas en un cubo y chocando elásticamente contra sus paredes. Se recurre al artificio de considerar que un tercio de ese número se mueve según la dirección de cada uno de los ejes, en los dos sentidos. Inspirado en esta idea, el método supone que la intensidad está limitada a un flujo dirigido hacia arriba (µ = 1) y un flujo dirigido hacia abajo (µ = −1). De esta forma, I(τ, µ) = I+ (τ ) + I− (τ ) y la función fuente es 1 F= 2 Z 0 −1 ′ I− (τ )dµ + Z 1 0 1 I+ (τ )dµ = [I+ (τ ) + I− (τ )] 2 ′ (1.45) Schuster y Schwarszchild sustituyeron la ecuación original por el par de ecuaciones 1 dI+ = I+ − 2 dτ 1 dI− − = I− − 2 dτ 1 [I+ + I− ] 2 1 [I+ + I− ] 2 (1.46) 10 1. Transferencia de Radiación donde el factor ± 21 de la izquierda da cuenta de la inclinación media de los rayos salientes y entrantes. Éste es un sistema lineal homogéneo de solución inmediata. La generalización de la idea anterior supone que en lugar de sólo una dirección existen n direcciones y que la radiación fluye sólo en esas direcciones, en un sentido o en otro. Si µi son los cosenos directores de esas direcciones, con i = ±1, ±2, ..., ±n e Ii las intensidades correspondientes, la ecuación fundamental se sustituye por el sistema lineal: µi X dIi = Ii − aj I j dτ j (1.47) donde las aj son los pesos de la integración gaussiana de F, de tal forma que Z 1 −1 I(τ, µ′ )dµ′ ≃ X aj Ij (τ, µj ) (1.48) j Los valores de los aj se encuentran tabulados en los textos de análisis numérico. Una revisión de la construcción de fórmulas gaussianas de cuadratura se encuentra en la obra citada Radiative Transfer, ası́ como tablas de coeficientes aj . Capı́tulo 2 Óptica Matricial 2.1. Introducción Este capı́tulo está dedicado a la teorı́a elemental de los sistemas ópticos. Un sistema óptico, en el contexto de la presente explicación, es un conjunto de superficies que separan medios de propiedades ópticas diferentes. Aquı́, haremos una interpretación muy restrictiva, pues la única propiedad óptica que va a determinar cada medio es el ı́ndice de refracción n, que se define como la razón entre la velocidad de la luz en el vacı́o y la velocidad de la luz en el medio. Ası́ pues, es siempre n >= 1. Respecto a la luz, experimentos sencillos nos convencerán de que se propaga en lı́nea recta en los medios homogéneos, es decir, en aquellos en los que el ı́ndice de refracción es una constante. El principio básico que permite formalizar matemáticamente nuestra experiencia empı́rica con la propagación de la luz es éste: la luz se propaga de tal modo que para ir de un punto a otro lo hace siempre en el tiempo mı́nimo posible. Es decir, que si un elemento de camino es ds, la luz invierte un tiempo ds/v en recorrerlo, y si v = c/n, entonces la trayectoria de la luz es tal que la integral entre el punto de partida y el de llegada: 1Z nds c (2.1) es mı́nima. El cálculo de variaciones permite calcular las trayectorias que sigue la luz, tanto en medios homogéneos como en medio no homogéneos. No entraremos en este formalismo. Indicaremos sólo que permite demostrar (entre otras muchas cosas) que: a) en los medios homogéneos la luz se propaga en lı́nea recta y b) cuando la luz cambia de un medio de ı́ndice de refracción n1 a un medio de ı́ndice n2 , se cumple la relación 11 12 2. Óptica Matricial θ1 n 1 n2 θ2 Figura 1 n1 sen θ1 = n2 sen θ2 (2.2) donde θ1 es el ángulo que forma el rayo con la normal a la superficie de separación en el punto de ésta donde incide y θ2 el ángulo que forma el rayo refractado con la misma normal, de acuerdo con la Figura 1. Todavı́a, dado el carácter elemental de esta exposición, hemos de introducir más restricciones: a) cuando un rayo toca una superficie que es la separación entre dos medios, el ángulo que forma con la normal a la superficie en el punto de contacto es tan pequeño que siempre se puede tomar sen θ ≃ θ; b) Nos limitamos a superficies de separación o bien planas o bien esféricas. Los centros de todas las superficies esféricas se encuentran sobre una lı́nea recta. Las normales a las superficies planas coinciden con la misma recta. A estos sistemas se les llama ((sistemas ópticos centrados)). A la lı́nea que contiene a los centros de las superficies se le llama ((eje óptico)). En lo que sigue, consideraremos que la luz se propaga de izquierda a derecha, formando ángulos pequeños con el eje óptico. 2.2. Formulación matricial Puesto que las superficies en los sistemas que estamos considerando separan medios homogéneos, en los cuales la luz se propaga en lı́nea recta, la acción de un sistema óptico sobre un rayo entrante consistirá en alterar su dirección en cada superficie, de forma que la trayectoria total del rayo será una lı́nea quebrada. El conocimiento completo de la trayectoria incluye entonces, para cada coordenada x del eje ópitco, la altura y del rayo y el ángulo θ que forma con el eje (Figura 2). 13 2.2. Formulación matricial y θ y x Figura 2 π1 π2 θ1 y1 θ2 y2 d Figura 3 El rayo entonces experimenta dos tipos de transformaciones: desplazarse de una superficie a la siguiente y cambiar de dirección en cada superficie. Consideremos a continuación las distintas formas en que el rayo se ve afectado. 2.2.1. Traslación Consideremos la traslación de un rayo en un medio homogéneo entre dos planos de referencia π1 y π2 separados entre sı́ una distancia d. En π1 el rayo viene especificado por valores (y1 , θ1 ) y en π2 por valores (y2 , θ2 ) (Figura 3). Es claro que θ2 = θ1 (2.3) y2 − y1 = tan θ1 ≃ θ1 d (2.4) y2 − y1 = dθ1 (2.5) mientras que o 14 2. Óptica Matricial n1 n 2 θ1 θ2 y1 = y2 Figura 4 Combinando ambas condiciones podemos escribir, en formato matricial: " 2.3. y2 θ2 # = " 1 d 0 1 #" y1 θ1 # (2.6) Refracción en superficie plana Consideremos ahora un rayo que toca una superficie plana que es la separación de dos medios de ı́ndice n1 y n2 (Figura 4). Estamos interesados en los valores de y2 y θ2 tras sufrir la refracción. Es evidente que y2 = y1 . En cuanto a los ángulos, n1 θ1 = n2 θ2 , o θ2 = n1 θ1 n2 (2.7) es decir: " y2 θ2 # = " 1 0 0 n1 n2 #" y1 θ1 # (2.8) Si asignamos convencionalmente signo positivo a los ángulos de los rayos que se alejan del eje en el sentido de las y > 0, vemos que, siendo n1 /n2 > 0, θ2 y θ1 tienen el mismo signo. Por contra, si indicamos con el signo negativo el ángulo de los rayos que desde y > 0 se acercan al eje, vemos que si θ1 < 0 también θ2 < 0. Por tanto, la expresión matricial anterior es general, válida tanto para ángulos positivos como para negativos. 2.4. Refracción en superficie esférica En relación con la Figura 5, se representa una superficie esférica de centro O y radio R que separa dos medios de ı́ndices n1 y n2 . Sobre esta superfi- 15 2.4. Refracción en superficie esférica N i1 y θ1 θ2 i2 α O R n1 n2 Figura 5 cie incide un rayo (y1 , θ1 ) en un punto cuya normal es ON con ángulo de incidencia i1 y ángulo de refracción i2 . En la aproximación de ángulos pequeños: n1 i 1 = n2 i 2 (2.9) Ahora bien, se ve que i1 = α + θ1 y que i2 = α + θ2 . Al mismo tiempo, el ángulo α puede aproximarse por su tangente, que es y/R (y = y1 = y2 ), con lo que n1 ( y1 y2 + θ1 ) = n2 ( + θ2 ) R R (2.10) de donde n2 − n1 y 1 n1 + θ1 n2 R n2 que junto con y2 = y1 permiten escribir: θ2 = − " y2 θ2 # = " 1 0 1 − nn2 −n 2R n1 n2 #" y1 θ1 (2.11) # (2.12) Podemos, y debemos, preguntarnos por la generalidad de la expresión anterior. Al fin y al cabo, hemos elegido una geometrı́a en la que θ1 > 0 y θ2 > 0 (¿y si no es ası́) y hemos supuesto que n2 > n1 (¿y si no es ası́?). Además, suponemos que la superficie es convexa (¿y si fuese cóncava?). Es preciso entonces asegurarse de que la expresión encontrada tiene la generalidad necesaria, y para eso es preciso analizar exhaustivamente todos los casos posibles. No es difı́cil hacer tal análisis pero, en lugar de omitirlo, como hace la mayorı́a de los textos, o de presentarlo completo, como no hace ninguno 16 2. Óptica Matricial N θ1 i1 y R n1 n 2 α i2 O θ2 Figura 6 de ellos, lo haremos parcialmente (el análisis completo queda a la voluntad del lector). En primer lugar, consideremos el caso en que los rayos incidente y refractado tienen ángulos negativos, tal y como se muestra en la Figura 6. Razonando sobre los valores absolutos de los ángulos, n1 i 1 = n2 i 2 (2.13) con i1 = α − |θ1 | e i2 = α − |θ2 |, de donde n1 n1 − n2 y1 (2.14) |θ1 | − n2 n2 R y como θ1 = −|θ1 | y θ2 = −|θ2 |, vemos que la expresión que habı́amos encontrado es más general del caso que consideramos en primer lugar, pues también es válida cuando los dos ángulos son negativos. Consideremos a continuación qué ocurre cuando la superficie de separación es cóncava, de acuerdo con la Figura 7. De n1 i1 = n2 i2 , ahora con i1 = α − θ1 e i2 = α − θ2 se sigue |θ2 | = n1 n2 − n1 y 1 + θ1 (2.15) n2 R n2 Vemos que esta ecuación difiere de (2.11) en el signo del primer término del segundo miembro. Podrı́amos pues tener dos expresiones distintas, según que la luz incida sobre una superficie cóncava o sobre una superficie convexa. En lugar de ello se introduce la siguiente regla: El radio de una superficie se toma como positivo si la superficie es convexa, y como negativo si la superficie es cóncava. La ecuación (2.11) junto con esta regla es consistente con la recién obtenida (2.15). Podrı́amos continuar examinando casos particulares, θ2 = 17 2.5. Matriz del sistema N i2 n2 θ1 θ2 y i1 n1 α O R Figura 7 pero, como dijimos anteriormente, queda del cuidado del lector interesado y nosotros damos por generalmente válida la citada expresión (2.11). 2.5. Matriz del sistema Recapitulemos brevemente las matrices encontradas hasta ahora. Para la traslación de un rayo una distancia d: T= " 1 d 0 1 # (2.16) Para su refracción en una superficie plana: R= " 1 0 0 n1 n2 # (2.17) Y para la refracción en una superficie esférica: S= " 1 0 1 − nn2 −n 2R n1 n2 # (2.18) Consideremos ahora un sistema óptico que contenga los dos tipos de superficies y una traslación. Este sistema puede ser una lente convexo-plana. La luz incide en la superficie convexa, donde se refracta. Después, el rayo recorre una distancia en lı́nea recta igual al grosor de la lente. Finalmente, se refracta en la superficie plana posterior de la lente, Figura 8. 18 2. Óptica Matricial 34 12 d Figura 8 Denotemos por ū el rayo ū = " y θ # (2.19) y usemos los subı́ndice 1 y 2 para indicar los valores inmediatamente antes y después de la refracción en la superficie esférica. Con los subı́ndices 3 y 4 indicamos los valores inmediatamente anterior y posterior a la refracción en la superficie plana posterior. Es claro que ū4 = Rū3 (2.20) ū3 = Tū2 (2.21) ū2 = Sū1 (2.22) ū4 = (RTS)ū1 = Mū1 (2.23) pero y a su vez Es decir: La acción total de la lente viene dada por la matriz M, que obtenemos multiplicando de atrás adelante las distintas transformaciones que sufre el rayo. Es también evidente que si las matrices elementales son matrices 2 × 2 la matriz resultante será también una matriz 2 × 2. De la misma forma se ve que si en lugar de las tres transformaciones que introduce la lente convexo-plana tuviésemos un número arbitrario de transformaciones n cada una de las cuales viniese representada por su matriz Mn , 19 2.6. Interpretación y denotando mediante el subı́ndice i el valor del rayo tras su transformación i, entonces serı́a: ūn = ūn−1 = ūn−2 = ··· = ū1 = Mn ūn−1 Mn−1 ūn−2 Mn−2 ūn−3 ··· M1 ū0 (2.24) de donde ūn = (Mn Mn−1 Mn−2 · · · M2 M1 )ū0 (2.25) M = Mn Mn−1 Mn−2 · · · M2 M1 (2.26) El sistema completo entonces se puede representar mediante una única matriz 2 × 2: En el caso concreto de la lente con que abrı́amos esta sección, si su ı́ndice de refracción es n y se encuentra rodeada de aire, cuyo ı́ndice podemos tomar como n = 1, su grosor es d y el radio de la superficie convexa es R, tenemos que M̄ = 2.6. " 1 0 0 n #" 1 d 0 1 #" 1 0 1−n nR 1 n # = " d(1−n) nR 1−n R 1+ d n 1 # (2.27) Interpretación Supongamos que, conocidas las superficies que forman un sistema óptico y todos los datos pertinentes, como la separación entre ellas, los ı́ndices de refracción y los radios de curvatura, hemos calculado la matriz total del sistema por simple multiplicación de las matrices individuales, obteniendo: M= " A B C D # (2.28) ¿Cual es el significado de cada uno de los elementos? Para responder a esta pregunta, hagamos cero cada uno de ellos sucesivamente. Representaremos al sistema, que puede contener un número arbitrario de elementos, mediante dos lı́neas verticales gruesas. Con los subı́ndices e y s indicamos los rayos de entrada y de salida al sistema. 20 2. Óptica Matricial A=0 Figura 9 B=0 Figura 10 Cuando A = 0, ys = Bθe . ys depende sólo de θe , no de ye . Por tanto, todos los rayos que entran con el mismo ángulo al sistema salen con el mismo ys , tal y como se refleja en la Figura 9. La condición A = 0 determina por tanto un foco. Si B = 0, ys = Aye . Es decir, ys no depende del ángulo de entrada y depende sólo de ye . La condición B = 0 determina una correspondencia entre los planos focales. Los puntos ye e ys son respectivamente objeto e imagen y A = ys /ye es el ((aumento)) del sistema. Figura 10. Si C = 0, θs = Dθe , es decir, el ángulo de salida depende sólo del ángulo de entrada: todo haz de rayos paralelos que entra al sistema emerge de él como haz paralelo, Figura 11. A este tipo de sistemas se les llama ((telescópicos)) y a la razón D = θs /θe ((aumento angular)) del sistema. Finalmente, si D = 0, θs = Cye , es decir, el ángulo de salida no depende del ángulo de entrada, como se muestra en la Figura 12 21 2.6. Interpretación C=0 Figura 11 D=0 Figura 12 22 2. Óptica Matricial 2.7. Conclusión Hemos dado una idea general de los sistemas ópticos centrados paraxiales. No entraremos en su ampliación a sistemas donde pueden encontrarse superficies reflectantes, ni entraremos en la discusión de los llamados ((puntos cardinales)) de los sistemas, que por otra parte pueden extraerse fácilmente a partir de la matriz M del sistema. El lector interesado puede encontrar la teorı́a complementaria, junto a una buena colección de ejercicios resueltos, en Matrix methods in optics, de A. Gerrard y J.M. Burch 1 . 1 Dover, New York. ISBN 0.486-68044-4 Capı́tulo 3 Polarización 3.1. Introducción En el siglo XVII, un monje llamado Erasmus Bartholinus descubrió una propiedad relativa a un mineral llamado ((espato de Islandia)). El espato de Islandia es una variedad de calcita fácilmente exfoliable en láminas transparentes. Lo que descubrió Bartholinus fue que una lámina de calcita daba imágenes dobles cuando se miraba a través de ella, es decir, que la luz se refractaba de dos formas distintas simultáneamente. La explicación del fenómeno la dio Christian Huygens poco después, al tiempo que descubrió el fenómeno de la polarización. Consiste éste en que si se miran ciertas fuentes de luz a través de una lámina de espato de Islandia, al girar la lámina en un plano perpendicular a la lı́nea de visión la intensidad de la imagen varı́a, pasando por un par de máximos y mı́nimos. Esto ocurre con algunas fuentes de luz, mientras que no ocurre con otras, y es independiente el fenómeno tanto de la intensidad de la fuente como de su color. Por consiguiente, la luz, aparte de intensidad y color tiene otra propiedad que se llamó ((polarización)). Se pueden hacer algunos experimentos adicionales. Si a través de un segundo cristal de espato se observa la luz emergente de un primero, se observa que la luz de este primero está polarizada siempre. De ahı́ se deduce que el cristal de espato polariza la luz, que en principio puede provenir de una fuente no polarizada. La polarización se hace evidente al observar el primer cristal a través del segundo. A partir de ahı́, hay un experimento obvio, que consiste en observar la luz polarizada por el primer cristal a través del segundo. Al girar este segundo cristal en su plano se observan los máximos y mı́nimos de intensidad y puede construirse una gráfica polar representando la intensidad emergente del se23 24 3. Polarización gundo cristal en función del ángulo girado respecto a un eje fijo arbitrario. La figura resultante es una elipse. Lo siguiente que se descubrió fue que si se repite el experimento introduciendo algunas sustancias entre los dos espatos, a veces se obtiene una elipse girada respecto a la elipse original. Por ejemplo, el agua azucarada tiene esta propiedad. También se descubrió que algunas sustancias giran la elipse en un sentido y algunas otras en sentido contrario. A esta propiedad de algunas sustancias se le llama ((actividad óptica)) y a las sustancias ((ópticamente activas)). Puesto que sencillos experimentos de difracción muestran que la luz tiene naturaleza ondulatoria, queda por discernir si se trata de una onda transversal o longitudinal. La polarización se explica aceptando que es una onda transversal. Cual sea la naturaleza de esa onda (qué cosa sea la que vibra) queda por averiguar. Admitiendo pues que la luz es una onda transversal y que su plano de vibración forma un ángulo θ con el eje horizontal x, mientras se propaga en la dirección z, sea Ex = A cos θ cos(ωt + ϕ) Ey = A sen θ cos(ωt + ϕ) (3.1) (Insistimos: ignoramos qué cosa sean Ex y Ey ). Si volvemos a nuestros experimentos con el espato de Islandia y recordamos que presenta el fenómeno de la birrefringencia, hemos de interpretar esto como que hay dos ı́ndices de refracción según dos direcciones distintas. Pero el ı́ndice de refracción está relacionado con la velocidad de propagación de la luz en el medio. Experimentos más cuidadosos revelan que hay una dirección especial en el cristal llamada ((eje óptico)). La vibración paralela al eje óptico se llama ((extraordinaria)) y la vibración perpendicular a dicho eje ((ordinaria)). Pues bien, el espato de Islandia introduce una diferencia de fase entre las vibraciones ordinaria y extraordinaria, ∆, de manera que la luz emergente se puede representar como: Ex = A cos θ cos ωt Ey = A sen θ cos(ωt + ∆) (3.2) eliminando el cos ωt: Ex 2 Ey 2 2Ex Ey + − 2 cos ∆ = sen2 ∆ 2 2 2 2 A cos θ A sen θ A sen θ cos θ (3.3) 25 3.2. Formalización Llamando a las amplitudes en los ejes x e y H = A cos θ y K = A sen θ: Ex 2 Ey 2 2Ex Ey cos ∆ = sen2 ∆ + 2 − H2 K HK (3.4) con A2 = H 2 + K 2 . Algunos casos especiales deben ser señalados. Cuando ∆ = 0: Ex 2 Ey 2 2Ex Ey + 2 − =0 H2 K HK (3.5) o o Ex Ey − H K 2 H Ex = Ey K =0 (3.6) (3.7) Cuando ∆ = π/2: Ex 2 Ey 2 + 2 =1 (3.8) H2 K que es la ecuación de una elipse. Como la energı́a de una onda transversal depende del cuadrado de la amplitud, tenemos aquı́ la conexión entre la elipse que observamos al representar la intensidad de la luz respecto al ángulo girado por el cristal y el hecho de que esa luz es una onda transversal de amplitudes H y K en los ejes x e y. Finalmente, cuando ∆ = π: Ex H =− Ey K 3.2. (3.9) Formalización Para describir la elipse de polarización podrı́amos dar uno de sus semiejes, la excentricidad y el ángulo que forma uno de los semiejes de la elipse con uno de los ejes de nuestro sistema de referencia. Esta es una forma, pero no la única. Y tiene un inconveniente, y es que mientras que la elipse la construimos midiendo intensidades, que tienen dimensiones de energı́a por unidad de superficie y tiempo, parámetros como excentricidad y ángulo son adimensionales. Serı́a preferible hacer una descripción mediante cantidades de la misma clase. Y esta descripción la dió Stokes introduciendo los parámetros: 26 3. Polarización I Q U V = = = = H 2 + K 2 = A2 H 2 − K 2 = A2 cos2 θ − A2 sen2 θ = I cos 2θ 2HK cos ∆ = 2A2 sen θ cos θ cos ∆ = I sen 2θ cos ∆ 2HK sen ∆ = 2A2 sen θ cos θ sen ∆ = I sen 2θ sen ∆ (3.10) Se comprueba que I 2 = Q2 + U 2 + V 2 1 H2 = (I + Q) 2 1 (I − Q) K2 = 2 V 2 = 4H 2 K 2 sen2 ∆ (3.11) o sen2 ∆ = V2 I 2 − Q2 (3.12) Dado que la ecuación general de la elipse de semiejes H y K en coordenadas cartesianas es x2 y2 2xy cos δ + − = sen2 δ (3.13) 2 2 H K HK donde δ es el ángulo que forma el semieje mayor de la elipse con el eje x, vemos que la introducción del desfase ∆ entre las vibraciones ordinaria y extraordinaria es la causa de la rotación de la elipse. Simplifiquemos la notación escribiendo x en lugar de Ex e y en lugar de Ey , y tenemos que 2x2 (I − Q) 4U xy 2y 2 (I + Q) − + =1 V2 V2 V2 (3.14) P x2 − 2Gxy + F y 2 = 1 (3.15) o con P = 2(I − Q) V2 27 3.2. Formalización 2U V2 2(I + Q) F = V2 G = (3.16) Hemos visto que, en efecto, los parámetros de Stokes definen la elipse de polarización de forma matemáticamente conveniente. Hubiésemos podido convencernos cualitativamente observando que I, Q determinan los semiejes H, K y que U, V determinan sin ambigüedad la orientación ∆, pues incluyen sen ∆ y cos ∆. Un razonamiento adicional que enlaza la geometrı́a de la elipse con los parámetros de Stokes es el siguiente. Para un punto de la elipse, en coordenadas polares: x = r cos ϕ y = r sen ϕ (3.17) y la ecuación de la elipse se escribe P r2 cos2 ϕ − 2Gr2 sen ϕ cos ϕ + F r2 sen2 ϕ = 1 (3.18) o bien 1 2 1 P r (1 + cos(2ϕ)) − Gr2 sen(2ϕ) + F r2 (1 − cos(2ϕ)) = 1 2 2 (3.19) llamando β = 2ϕ y W = 2/r2 : W = (P + F ) − 2G sen β + (P − F ) cos β (3.20) En los ejes mayor y menos, r(ϕ) alcanza un máximo o un mı́nimo, luego W (β) un mı́nimo o un máximo, dado por la condición dW = 0 = −2G cos β − (P − F ) sen β dβ (3.21) Ası́ que si β ⋆ es el valor que toma β en los semiejes: tan β ⋆ = sen β ⋆ 2G = ⋆ cos β F −P (3.22) y dado que tan α = tan(α + π), hay dos valores de β ⋆ , α1 y α2 , que satisfacen la condición de extremo y que se diferencian en π (como definimos 28 3. Polarización β = 2ϕ, es claro que los dos valores de ϕ difieren en π/2, como era de esperar). Si llamamos W1 y W2 a los valores de 2/r2 para α1 y α2 : r22 W1 (P + F ) − 2G sen α1 + (P − F ) cos α1 = = (3.23) 2 r1 W2 (P + F ) − 2G sen α2 + (P − F ) cos α2 Ahora, sustituyendo hacia atrás P, F y G en función de los parámetros de Stokes vemos que es U Q y que la razón entre los cuadrados de los ejes es √ I − Q2 + U 2 √ I + Q2 + U 2 (3.24) tan δ = 3.3. (3.25) Grado de polarización Por otro lado, se sigue de las definiciones de los parámetros de Stokes que I 2 = Q2 + U 2 + V 2 . Ahora bien, si volvemos al experimento original que ha dado origen al descubrimiento de la elipse de polarización, es claro que las relaciones descubiertas hasta ahora son válidas para luz polarizada, mientras que existen fuentes de luz no polarizada para las cuales Q = U = V = 0, ya que si la luz no está polarizada la única cantidad empı́ricamente constatable es la intensidad, y el giro de la lámina de espato de Islandia no reveları́a variación alguna con la dirección. Ahora bien, ocurre con frecuencia que una fuente de luz no está ni totalmente polarizada ni carece en absoluto de polarización, sino que se encuentra polarizada parcialmente. Si introducimos el llamado ((grado de polarización)) P , como Q2 + U 2 + V 2 (3.26) I2 es claro que P = 0 para luz sin polarizar y P = 1 para luz totalmente polarizada. Y ası́ podrı́amos separar la luz en dos vectores de Stokes, uno para la parte polarizada y otro para la parte sin polarizar: P2 =      I Q U V       =   PI Q U V       +   es más, si P 6= 0 podemos escribir que (1 − P )I 0 0 0      (3.27) 29 3.4. Matrices de Mueller      I Q U V   1+P  =  2P      PI Q U V   1−P  +  2P      PI −Q −U −V      (3.28) y ası́ considerar que un haz parcialmente polarizado está compuesto por dos polarizados y de polarización opuesta. Como P I = √ 2haces2 totalmente 2 Q + U + V , si normalizamos P I a la unidad, las ((coordenadas)) (Q, U, V ) indican un punto sobre una esfera de radio unidad llamada ((esfera de Poincaré)) y entonces (Q, U, V ) y (−Q, −U, −V ) son puntos diametralmente opuestos sobre la esfera de Poincaré. 3.4. Matrices de Mueller Denominaremos por S̄ al vector formado por los cuatro parámetros de Stokes:  I Q U V      (3.29) S̄2 = MS̄1 (3.30)   S̄ =   Al pasar un haz de luz polarizada a través de un dispositivo ópticamente activo, cambiará su estado de polarización. Llamemos S̄1 al estado del haz antes de entrar en el dispositivo, y S̄2 al estado después de salir del mismo. Lo que mostraremos ahora es que S̄1 y S̄2 están relacionados linealmente de forma que existe una matriz M que hace Los elementos Mij son propios de cada dispositivo y de su orientación. A la matriz M se le llama ((matriz de Mueller)). Es posible deducir su forma conocidos distintos tipos de haces de entrada y salida. Consideremos un polarizador ideal, que no introduce retardo de fase: ∆ = 0.   Z=   X E J N B F K P T D G H    L M  R S  Tendremos en cuenta las cuatro situaciones siguientes: (3.31) 30 3. Polarización 1. Un polarizador lineal deja pasar la mitad de la intensidad de un haz de luz no polarizada de intensidad I. Llamemos I = 2W . La luz no polarizada es  2W 0 0 0  (3.32)  W W c2 W s2 0  (3.33)    S̄1 =      y la luz emergente   S̄2 =       donde s1 = sen θ, c1 = cos θ, s2 = sen 2θ y c2 = cos 2θ. Relacionando ambos estados:      W W c2 W s2 0       =   X E J N B F K P 2W T D   G H  0  L M  0 0 R S       (3.34) de donde se siguen las ecuaciones: 1 c2 s2 0 = = = = 2X 2E 2J 2N (3.35) es decir      1 2 1 c 2 2 1 s 2 2 0 B F K P T D G H    L M  R S  (3.36) 31 3.4. Matrices de Mueller 2. Un polarizador que deja inalterado el haz de entrada, previamente polarizado, actúa de la forma:      W W c2 W s2 0 1 2   B F K P 1 c 2 2 1 s 2 2     =   0 W T D   G H   W c2  L M   W s2 0 R S       (3.37) de donde se siguen las ecuaciones: 1 + Bc2 + T s2 2 1 c2 + F c2 + Gs2 c2 = 2 1 s2 = s2 + Kc2 + Ls2 2 0 = P c2 + Rs2 1 = (3.38) La última de estas ecuaciones es válida para todo c2 y s2 . Luego si c2 = 0, R = 0 y si s2 = 0, P = 0. Por tanto P = R = 0. 3. El dispositivo tranforma luz de amplitud A según el eje x en luz de amplitud A cos θ en el eje que forma un ángulo θ con el eje x. Para la luz original, H 2 = A2 ; K = 0, luego I = Q = A2 y U = V = 0. El haz de salida tiene de componentes, en el eje x, Ac21 y en el eje y Ac1 s1 . Luego H 2 = A2 c41 , K 2 = A2 c21 s21 , y como ∆ = 0, I = A2 c21 , Q = A2 c21 c2 , U = A2 c21 s2 y V = 0. En resumen:      c21 c21 c2 c21 s2 0       =   1 2 1 c 2 2 1 s 2 2 0 1 B T D  1 F G H    K L M  0 0 0 0 S       (3.39) que proporciona 1 +B 2 1 = c2 + F 2 1 s2 + K = 2 c21 = c21 c2 c21 s2 (3.40) 32 3. Polarización De la primera B = c21 − 1 1 = c2 2 2 (3.41) De la segunda 1 F = c22 2 (3.42) 1 K = s2 c2 2 (3.43) y de la tercera Recordando que Bc2 + T s2 = 1 2 (3.44) tenemos 1 T = s2 2 (3.45) 4. Consideremos luz circular de amplitud A. La amplitud en ambos ejes es A, de donde I = 2A2 , Q = U = 0 y V = 2A2 . Aquı́ es ∆ = ± π2 , lo que hace V 6= 0. En caso contrario, no tendrı́amos luz polarizada circular, sino luz no polarizada. Si el dispositivo convierte esta luz en luz polarizada lineal de amplitud A según el eje que forma un ángulo θ con el x, tenemos que H = Ac1 , K = As1 y con ∆ = 0 a la salida, I = A2 , Q = A2 (c21 − s21 ) = A2 c2 , U = A2 s2 y V = 0. En resumen:      1 c2 s2 0       =   1 2 1 c 2 2 1 s 2 2 0 1 c 2 2 1 2 c 2 2 1 cs 2 2 2 0 1 s 2 2 G L 0 D H M S      2 0 0 2      (3.46) de donde D = H = M = S = 0 y 1 c2 s2 2 1 2 L = s 2 2 G = (3.47) 33 3.4. Matrices de Mueller En definitiva, hemos encontrado la Matriz de Mueller para el polarizador ideal: Z=  1   2 1 c2 s2 2 c2 c2 c2 s2 s2 c2 s2 s22 0 0 0 0 0 0 0      (3.48) Con una secuencia de razonamientos similar podemos encontrar la matriz de Mueller para otros dispositivos. Por ejemplo, para dispositivos que introducen un desfase ∆ 6= 0. En definitiva, cuando un haz de luz S̄i atraviesa una serie de dispositivos representados por matrices M1 , M2 , ... la luz resultante es S̄f = Mn · · · M3 M2 M1 S̄i (3.49) 34 3. Polarización Capı́tulo 4 Difracción 4.1. Introducción Imaginemos dos láminas opacas, paralelas. Practicamos un pequeño orificio en una de ellas y disponemos una fuente de luz de modo que ilumine la lámina agujereada. La luz traspasa el orificio y se proyecta sobre la segunda lámina. Podemos advertir que la forma iluminada en la segunda lámina se corresponde con la forma del orificio en la primera. Ası́, un orificio rectangular produce un rectángulo iluminado. Un orificio circular, un orificio circular, y ası́ sucesivamente. Si observamos más cuidadosamente, podemos advertir que la lı́nea que separa la figura luminosa de la zona sombreada no es perfectamente nı́tida. Esto puede deberse a que nuestra fuente de luz no es puntual sino extensa, de manera que entre la zona de luz y la zona de oscuridad existe una zona intermedia de penumbra. Pero si refinamos el experimento acercándonos más y más a una fuente puntual esta indefinición persiste. Más aún, si reducimos progresivamente el tamaño del orificio, el fenómeno se agudiza. Finalmente, podemos comprobar como, reduciendo el orificio prácticamente a un punto, su imagen en la pantalla no es un punto luminoso, sino una mancha difusa cuyo tamaño es mayor que el del orificio que se ilumina. En un experimento más cuidadoso, por ejemplo, sustituyendo la lámina de proyección por una pelı́cula fotográfica, vemos que esta mancha difusa se compone en realidad de una serie de anillos claros y oscuros concéntricos. El experimento puede repetirse para otro tipo de aberturas, como por ejemplo rendijas. Y puede verse la figura que proyecta no sólo un orificio en particular sino varios de ellos, como por ejemplo una serie de orificios pequeños espaciados regularmente a lo largo de una lı́nea recta o una serie de rendijas estrechas paralelas espaciadas regularmente. De todos estos experimentos toma fuerza la hipótesis de que la luz es una 35 36 4. Difracción perturbación ondulatoria, ya que las figuras que aparecen en la pantalla de proyección son similares a las que pueden obtenerse perturbando por ejemplo ondas superficiales en el agua. Por consiguiente, es precisa una teorı́a de la formación de las imágenes que vaya más allá de la teorı́a geométrica de los rayos de luz que se propagan en lı́nea recta. 4.2. La difracción en 9 pasos sencillos 4.2.1. Paso 1. Flujo Dado un campo vectorial, que es una aplicación que a cada punto del espacio le hace corresponder un vector, y dado un elemento de superficie en ese espacio (Figura 1), tan pequeño como sea preciso para que pueda atribuirse un único valor del campo vectorial a todos los puntos de esta superficie, se define el flujo elemental del vector F̄ a través de la superficie ¯ como el producto escalar dσ ¯ dΦ = F̄ • dσ (4.1) ¯ es tal que su módulo es el donde el ’•’ indica producto escalar. El vector dσ valor de la superficie elemental y su dirección normal a ésta. Si este elemento de superficie es parte de una superficie mayor que encierra un volumen, el ¯ es hacia el exterior del volumen. sentido del vector dσ 4.2.2. Paso 2. Divergencia Dada una superficie que encierra un pequeño volumen, si existe el lı́mite para la razón entre el flujo a través de esa superficie y el volumen encerrado por la superficie cuando el volumen se hace más y más pequeño, a ese lı́mite se le llama ((divergencia)) del campo vectorial. En el lı́mite, el volumen queda reducido a un punto y entonces se puede hablar de la divergencia del campo en ese punto. dσ Figura 1 F 37 4.2. La difracción en 9 pasos sencillos Para buscar una expresión analı́tica para la divergencia, consideremos un pequeño cubo de lados dx, dy, dz cuyas caras sean paralelas a los planos que definen los ejes coordenados. En relación con la Figura 2, consideremos que las caras a y b son perpendiculares al eje x y que las coordenadas x toman valores crecientes al movernos de a hacia b; consideremos el flujo total a través de ambas caras. El flujo a través de la cara a es ¯ a = −Fx dydz dΦa = F̄ • dσ (4.2) ¯ a = (−dydz, 0, 0). El flujo a través de la cara b es ya que dσ ! ! ∂ F̄ ¯ = Fx + ∂Fx dx dydz dΦb = F̄ + dx dσ ∂x ∂x (4.3) ¯ b = (dydz, 0, 0) y ya que dσ ∂ F̄ = ∂x ∂Fx ∂Fy ∂Fz , , ∂x ∂x ∂x ! (4.4) Por tanto, el flujo total a través de las caras a y b es ∂Fx dxdydz (4.5) ∂x De la misma forma, podemos calcular el flujo a través de los dos pares de caras paralelas restantes, las que son perpendiculares a los ejes y y z, y tendrı́amos para el flujo total a través de las caras del cubo elemental: dΦ = dΦ = ! ∂Fx ∂Fy ∂Fz dxdydz + + ∂x ∂y ∂z (4.6) La divergencia, que es la razón entre este flujo y el volumen elemental dxdydz es pues div F̄ = ∂Fx ∂Fy ∂Fz + + ∂x ∂y ∂z b a Figura 2 (4.7) 38 4. Difracción ¯ definiéndolo como Es común en este punto introducir el operador ∇, ¯ = ∇ ∂ ∂ ∂ , , ∂x ∂y ∂z ! (4.8) ¯ con lo cual la divergencia se puede poner como el producto escalar de ∇ por F̄ : ¯ • F̄ div F̄ = ∇ 4.2.3. (4.9) Paso 3. Teorema de la divergencia Sea un volumen finito V limitado por una superficie S. Dividamos el volumen en pequeños cubos elementales. Fijemos la atención sobre uno de esos pequeños cubos, uno de los que se encuentran en el interior de V . Al igual que hemos hecho en el paso anterior, podemos calcular el flujo a través de las caras de ese pequeño cubo, y calcular la divergencia en el punto lı́mite al que se reduce el cubo a medida que su arista tiende a cero. Luego, podrı́amos sumar la divergencia para todos los pequeños cubos del volumen. Ahora bien, como los cubos son adyacentes, cada cara es compartida por dos de ellos. El valor del campo F̄ en una cara es el mismo tanto si consideramos que esa cara pertenece a un cubo como si consideramos que pertenece al cubo de al lado. Pero las normales son opuestas, según que la cara se considere perteneciente a un cubo o a otro. En consecuencia, los flujos se compensan. Si sumamos las divergencias de todos los cubos interiores a V , esa suma será nula. Sólo quedan por considerar los cubos una de cuyas caras es de hecho un elemento de la superficie exterior S, tal como se muestra en la Figura 3. El flujo a través de todas las caras está compensado, excepto el flujo a través de la cara que es un elemento de la superficie S. Por tanto, el flujo total a través de todas las caras de todos los cubos en que se divide el volumen queda reducido al flujo a través de la superficie S. En otras palabras: Φ= Z V ¯ • F̄ )dV = (∇ dS Figura 3 Z S ¯ F̄ • dS (4.10) 39 4.2. La difracción en 9 pasos sencillos 4.2.4. Paso 4. Definición de gradiente Dada una función escalar que asigna un valor f (x, y, z) a cada punto del espacio (x, y, z), se define el gradiente de f en el punto (x, y, z) como el vector de componentes: ¯ = ∇f ∂f ∂f ∂f , , ∂x ∂y ∂z ! (4.11) La divergencia es un escalar. El gradiente es un vector. Consideremos el caso particular en que el campo vectorial F̄ se escribe como el producto de una función escalar ϕ por un campo Ū y calculemos su divergencia: ¯ • F̄ = ∇ ¯ • (ϕŪ ) ∇ ∂ ∂ ∂ = (ϕUx ) + (ϕUy ) + (ϕUz ) ∂x ∂y ∂z ∂Ux ∂ϕ Ux + ϕ = ∂x ∂x ∂Uy ∂ϕ + Uy + ϕ ∂y ∂y ∂ϕ ∂Uz + Uz + ϕ ∂z ∂z ¯ ¯ • Ū ) = (∇ϕ) • Ū + ϕ(∇ 4.2.5. (4.12) Paso 5. Una aplicación del resultado anterior Respecto al resultado obtenido en el paso anterior, veamos qué ocurre ¯ cuando Ū = ∇ψ, es decir, cuando el campo vectorial Ū es el gradiente de cierta función escalar ψ, puesto que sabemos que el gradiente de ψ en cada punto es un vector. ¯ • (ϕ∇ψ) ¯ ¯ • (∇ψ) ¯ + ϕ(∇ ¯ • (∇ψ)) ¯ ∇ = (∇ϕ) (4.13) ¯ ∇ ¯ se le llama ((laplaciano)), se representa como ∇ ¯ 2 y como Al operador ∇• es fácil ver ¯2 ∇ = ∂2 ∂2 ∂2 , , ∂x2 ∂y 2 ∂z 2 ! (4.14) 40 4. Difracción 4.2.6. Paso 6. Identidad de Green ¯ y ψ ∇ϕ. ¯ Aplicando a ambos el Consideremos los campos vectoriales ϕ∇ψ teorema de la divergencia y restando uno del otro queda la que se conoce como ((identidad de Green)): Z 4.2.7. V ¯ 2ψ − ψ∇ ¯ 2 ϕ]dV = [ϕ∇ Z S ¯ − ψ(∇ϕ)]dS ¯ [ϕ(∇ψ) (4.15) Paso 7. Ecuación de ondas Hasta ahora, nos hemos limitado a introducir algunas definiciones y deducir algunos resultados. El contenido de estos resultados es matemático, no fı́sico. En este momento, introducimos por primera vez una hipótesis de naturaleza fı́sica. A partir de los experimentos con que comenzamos el capı́tulo, vimos la plausibilidad de que la luz constituya una perturbación ondulatoria. Si la luz es una onda, satisfará la ecuación de ondas. Ignoramos cual es la naturaleza de esa perturbación, pero como al observar la imagen en la pantalla apreciamos distintos valores de intensidad en cada punto (es decir, un valor escalar), supondremos que esa perturbación es de naturaleza escalar 1 . Si imponemos sobre las funciones escalares ϕ y ψ el que satisfagan la ecuación de ondas: 2 ¯ 2ψ = 1 ∂ ψ ∇ c2 ∂t2 (4.16) 2 ¯ 2ϕ = 1 ∂ ϕ ∇ (4.17) c2 ∂t2 comprobamos cómo el primer término de la identidad de Green se hace nulo. En efecto, si ϕ y ψ tienen una dependencia temporal de la forma cos ωt, por sustitución y cálculo directo se comprueba que esto es ası́. Por tanto, la integral de superficie es nula: Z 4.2.8. S ¯ =0 ¯ − ψ(∇ϕ)] ¯ dS [ϕ(∇ψ) (4.18) Paso 8. Teorema integral de Kirchoff Una fuente luminosa, como la llama de una vela, esparce su luz en todas direcciones, salvo por los obstáculos que pudiese haber. Es natural entonces 1 Por este motivo, a la teorı́a que estamos exponiendo se la llama teorı́a escalar. En realidad, sı́ sabemos que la luz es una onda electromagnética, pero como este dato no es necesario para el desarrollo de la presente teorı́a, podemos fingir que lo desconocemos. 41 4.2. La difracción en 9 pasos sencillos pensar que la perturbación luminosa tiene forma de onda esférica. Escribamos: ϕ= ϕ0 cos(kr − ωt) r (4.19) y calculemos la integral de superficie sobre una superficie tal que contiene al origen P . Pero, puesto que en P ϕ no está definida, tomaremos como volumen aquel delimitado por una superficie exterior S1 y una superficie interior S2 de radio ρ que contiene al punto P , como se ve en la Figura 4. Además, obsérvese que la normal a S1 está dirigida en el sentido de los r crecientes, mientras que la normal a S2 está dirigida hacia el punto r = 0. S 1 ρ .P S 2 Figura 4 Ahora bien, si recordamos los experimentos citados al principio de este capı́tulo, hablábamos de la formación de patrones luminosos sobre la pantalla cuando la luz atraviesa orificios pequeños. Hemos de resaltar ahora que estos patrones son estáticos: ni cambia su figura ni ésta muestra variación alguna con el tiempo. Pero hemos usado ya en el paso 7 la ecuación de ondas, que supone una dependencia temporal. Por tanto, se requiere una explicación. Y ésta es que la frecuencia temporal de la perturbación es tan grande que lo que percibimos por el ojo o mediante una placa fotográfica es algún tipo de promedio, y ese promedio podemos incluirlo en la constante ϕ0 . Recordemos que tratamos de explicar aquello que vemos, no aquello que en realidad sucede, pues, de hecho, aunque hemos postulado que la luz es algún tipo de perturbación ondulatoria no necesitamos conocer de qué naturaleza es esta perturbación. Podrı́amos sumar a este otros argumentos, tanto fı́sicos (calculamos la integral de superficie en un instante dado que podemos tomar como t = 0) como matemáticos (podemos escribir la onda usando notación 42 4. Difracción exponencial como producto de dos factores: uno dependiente y otro independiente del tiempo) para despreocuparnos de la parte temporal y efectuar los cálculos siguientes sólo sobre la parte espacial: ϕ= ϕ0 cos kr r (4.20) Consideremos la integral sobre S2 . Un elemento de superficie se representa mediante un vector de módulo dS2 y dirección y sentido determinados por la ¯ 2 = dS2 n̂. En cuando al módulo, si dΩ es el elemento de ángulo normal n̂: dS sólido subtendido por dS2 según se ve desde P , tenemos que dS2 = ρ2 dΩ (4.21) En cuanto a la normal, en el punto (x, y, z) perteneciente a la superficie de la esfera es x y z n̂ = − , − , − ρ ρ ρ ! (4.22) En cuanto al gradiente que aparece en el integrando, siendo el gradiente de una función escalar que depende del módulo r, es claro que, para cualquier función f (r) que depende sólo de r será ∂f ∂r ∂f = ∂x ∂r ∂x (4.23) ∂r x = ∂x r (4.24) al tiempo que con análogas relaciones para y y z. Efectuando las operaciones y tomando el lı́mite cuando ρ → 0, sobrevive sólo ψ(P ), y la integración a toda la esfera da un factor 4π, de manera que, finalmente: ψ(P ) = 1 1 Z ¯ 1 ¯ − ψ∇ ¯ 1 cos kr dS cos kr∇ψ 4π S1 r r (4.25) Esta es la expresión del conocido como ((teorema integral de Kirchoff)), que viene a decirnos que el valor de ψ en el punto P se puede obtener a través de una integral sobre una superficie que encierre al punto P . 43 4.2. La difracción en 9 pasos sencillos n^ r’ S r P F Figura 5 4.2.9. Paso 9. Integral de Kirchoff-Fresnel Llegados a este punto, podemos conjugar los resultados matemáticos con los experimentales. En relación a la Figura 5, si F es una fuente de luz y P un punto de la pantalla donde deseamos calcular la perturbación luminosa, sabemos, del paso anterior, que el valor de dicha perturbación en P se puede encontrar a través de una superficie que encierre a ese punto. Elijamos esa superficie de tal manera que el orificio S sea parte de ella, y de forma también que la perturbación en cualquier otro punto de la superficie que encierra a P y que no pertenece al orificio, es nula. Puesto que esta superficie es arbitraria, siempre podemos hacerla tan alejada del punto P como sea preciso para que se cumplan estas condiciones. Por lo tanto, la integral que aparece en el ((teorema integral de Kirchoff)) se limita a la superficie de la abertura S. Lo que haremos ahora no será más que escribir dicha integral en el caso particular cuya geometrı́a hemos reflejado en la Figura 5. Como hemos visto, dada una función escalar f (r), su gradiente es ¯ = ∂f r̂ ∇f ∂r (4.26) ası́ que " # cos kr sen kr′ cos kr cos kr′ ′ cos kr ¯ r̂ − ∇ψ = −k r r r′ r r′ 2 y (4.27) 44 4. Difracción ¯ cos kr ψ∇ r ! " # sen kr cos kr′ cos kr′ cos kr = −k r̂ − r r′ r′ r2 (4.28) Ahora bien, k = 2π/λ, y como la longitud de onda es mucho menor que r y r′ , se tiene que λrr′ << r′ r2 y que λrr′ << rr′ 2 . Por tanto, el segundo término de cada corchete puede despreciarse al compararlo con el primero. La integral queda entonces # " kψ0 Z sen kr cos kr′ cos kr sen kr′ ′ ¯ ψP = r̂ − r̂ dS 4π S rr′ rr′ (4.29) ¯ = n̂dS, finalmente y como dS # " kψ0 Z sen kr cos kr′ cos kr sen kr′ ψP = cos(n̂, r̂) − cos(n̂, r̂′ ) dS (4.30) 4π S rr′ rr′ 4.3. Cálculo de la integral de Kirchoff-Fresnel La integral de Kirchoff-Fresnel puede calcularse analı́ticamente en una serie de casos sencillos, pero ilustrativos. En general sin embargo hay que acudir a simplificaciones adicionales. Por ejemplo, si la fuente se encuentra a una distancia muy grande de la abertura en comparación con las dimensiones de ésta, es posible tomar como constante esta distancia para todo punto de dicha abertura. Nuestro planteamiento aquı́ no es el cálculo analı́tico que como decimos es factible sólo en un número reducido de casos, si bien son casos significativos. Lo que pretendemos es desarrollar un programa que proporcione directamente la imagen que aparece sobre la pantalla. Tendremos en cuenta los siguientes elementos: 4.3.1. La pantalla Representaremos la pantalla como una matriz de puntos. Para cada punto, calcularemos la integral de Kirchoff-Fresnel. Normalizaremos los valores obtenidos al intervalo [0,255] y guardaremos estos valores en un formato gráfico. Cada punto vendrá representado pues por un valor (que truncaremos o aproximaremos al entero de 8 bits más próximo) y el conjunto de todos los puntos, la matriz que representa la imagen, la almacenaremos en un formato gráfico que pueda después visualizarse con ayuda de una computadora. Una matriz de 300×300 puntos parece suficiente. En cuanto a las unidades, puesto 4.3. Cálculo de la integral de Kirchoff-Fresnel 45 que en un experimento tı́pico la abertura tiene dimensiones del orden de la fracción de milı́metro, la figura de difracción es del orden de milı́metros y las distancias entre la fuente y la abertura y entre ésta y la pantalla está entre milı́metros y centı́metros (1 metro ya puede considerarse el infinito), parece sensato tomar el milı́metro como unidad de medida. Ası́ pues, por lo que respecta a la pantalla, será preciso especificar sus dimensiones y la distancia a la abertura. En cuanto a su forma, lo más simple es que sea cuadrada y que su centro coincida con el origen. El programa deberá tomar sus dimensiones y calcular, para cada punto de la matriz imagen de 300 × 300 las coordenadas correspondientes dentro del cuadrado de las dimensiones que se especifiquen. 4.3.2. La abertura El cáculo de la integral sobre la abertura es obviamente dependiente de la forma concreta de dicha abertura. Por este motivo todos los detalles al respecto quedan relegados al código fuente. La geometrı́a del problema se representa en la Figura 6. 4.3.3. Método de Montecarlo El nombre ((Método de Montecarlo)) se usa para denominar una familia de métodos. Nosotros nos referiremos a él en el contexto del cálculo de integrales de superficie. En general, los métodos de Montecarlo para integrales múltiples no son ventajosos para integración en una dimensión, y van tornándose más y más apropiados cuando el número de dimensiones se eleva. Todos estos métodos tienen en común que están basados en la generación de números aleatorios. Cómo pueden ser los números aleatorios útiles en el cálculo de integrales es algo que puede verse de forma sencilla tomando como ejemplo la integración de una función f (x) en un intervalo [a, b]. Si f˜ es el valor medio de la función en ese intervalo, es claro que el área encerrada bajo la curva en el intervalo es igual a (b − a)f˜. Por tanto, sólo es preciso calcular esta media, que se puede aproximar generando N números aleatorios xi en el intervalo [a, b] y tomando 1 X f˜ = f (xi ) N i (4.31) La generalización a dos dimensiones es obvia. Si f (x, y) es una función cuya integral quiere calcularse en el rectángulo a <= x <= b y c <= y <= d, el volumen bajo la superficie f (x, y) en el rectángulo dado es 46 4. Difracción y Pantalla x Abertura Fuente luminosa z Figura 6 V = Z b a Z d c f (x, y)dxdy = (b − a)(d − c)f˜ (4.32) donde f˜ es la ((altura media)) de f (x, y) en el rectángulo que puede estimarse generando un número grande de parejas (xi , yi ) y calculando 1 X f˜ = f (xi , yi ) N i (4.33) En la Figura 7 se representan algunos de los puntos de la abertura y uno de los puntos de la imagen. El cálculo numérico con un computador consta esencialmente de un bucle que recorre todos los puntos de la matriz imagen. Calcula las coordenadas de pantalla y genera un número grande de puntos pertenecientes a la abertura, efectuando la suma. Puesto que no nos interesan más que las intensidades relativas en la imagen, podemos prescindir de las constantes que aparecen fuera de la integral. En la Figura 8 se representan los vectores auxiliares Ū , V̄ y W̄ . El primero indica un punto sobre la pantalla. El 47 4.3. Cálculo de la integral de Kirchoff-Fresnel y ri x ri’ rj’ rj rk rk’ z Figura 7 segundo, un punto sobre la abertura. El tercero, la fuente de luz. De acuerdo con la figura, r̄ = V̄ − Ū y r̄′ = V̄ − W̄ Este marco teórico y la geometrı́a para el cáculo permite evitar los engorrosos detalles analı́ticos de la integral de Kirchoff-Frenel que aparecen al tratar con aberturas incluso sencillas, y allana el camino para calcular dicha integral numéricamente. No llevaremos más lejos la discusión sino que, en lugar de pasar efectivamente al cálculo o a la resolución numérica según el marco expuesto, terminamos este tema con las imágenes de difracción de algunas aberturas tı́picas. La Figura 9 es la difracción por una abertura circular. La Figura 10, por una abertura cuadrada. 48 4. Difracción y r’ V r W z Figura 8 Figura 9 U x 4.3. Cálculo de la integral de Kirchoff-Fresnel Figura 10 49

Cuatro temas de Óptica - Universidad de Alicante

Documentos relacionados

Productos

Apoyo

Cuatro temas de Óptica - Universidad de Alicante

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib