Subido por Alejandro Romo

Fundamentos de Optica, Curso introductorio

Anuncio
Fundamentos
de óptica
Curso
introductorio
Yobani Mejía Barbosa
Facultad de Ciencias
Sede Bogotá
Fundamentos de
óptica
Curso introductorio
Fundamentos de
óptica
Curso introductorio
Yobani Mejía Barbosa
Bogotá, D. C., Colombia, 2020
© Universidad Nacional de Colombia
Facultad de Ciencias
© Yobani Mejía Barbosa
Primera edición, diciembre de 2020
ISBN 978-958-794-412-9 (papel)
ISBN 978-958-794-415-0 (digital)
Edición
Angélica María Olaya Murillo
[email protected]
Coordinación de publicaciones - Facultad de Ciencias
Corrección de estilo
Juliana Monroy
Diseño de la colección
Leonardo Fernández Suárez
Maqueta LaTex
Camilo Cubides
Salvo las figuras 1.1, 1.58, 1.76, 1.80, 1.84, 1.85 y C.1,
todas las demás fueron elaboradas por el autor.
Prohibida la reproducción total o parcial por cualquier
medio sin la autorización escrita del titular de los derechos
patrimoniales
Impreso y hecho en Bogotá, D. C., Colombia
Este libro está dedicado a mi esposa, Janneth, y a mis hijos,
Ana Catalina, María Isabel y Daniel.
Contenido
Prefacio
Introducción
XI
XIII
Capítulo uno
Óptica geométrica
1.1. Rayos u ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1. La cámara oscura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2. La teoría corpuscular de Newton . . . . . . . . . . . . . . . . . . . .
1.1.3. La teoría ondulatoria de Huygens . . . . . . . . . . . . . . . . . . . .
1.1.4. Trazo gráfico de rayos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Principio de Fermat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1. Formulación moderna del principio de Fermat . . . . . . . .
1.2.2. Rayos y frente de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3. Imagen de una fuente puntual . . . . . . . . . . . . . . . . . . . . . .
1.3. Superficies refractoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1. Modelo de la córnea del ojo humano . . . . . . . . . . . . . . . . .
1.3.2. Refracción con superficies esféricas . . . . . . . . . . . . . . . . . .
1.3.3. Puntos y distancias focales . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.4. Planos focales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.5. La imagen paraxial de objetos extendidos . . . . . . . . . . . . .
1.3.6. Potencia y vergencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4. Superficies reflectoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1. Trazo de rayos en espejos esféricos . . . . . . . . . . . . . . . . . . .
1.4.2. El espejo parabólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5. Lentes: aproximación lentes delgadas . . . . . . . . . . . . . . . . . . . . .
1.5.1. Trazo de rayos en lentes delgadas . . . . . . . . . . . . . . . . . . . .
1.5.2. Ecuación de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.5.3. Dominio de las imágenes real y virtual . . . . . . . . . . . . . . .
1.5.4. Planos focales en lentes delgadas . . . . . . . . . . . . . . . . . . . .
1.5.5. Trazo de rayos oblicuos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.6. Lentes: planos principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
4
4
6
7
10
13
16
17
19
21
23
25
28
30
32
34
36
37
39
42
44
46
47
48
49
52
viii
·
Contenido
1.6.1. Sistema de lentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
1.7. Diafragmas y pupilas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
1.7.1. Diafragma de apertura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
1.7.2. Pupilas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
1.7.3. Rayos principal y marginal . . . . . . . . . . . . . . . . . . . . . . . . . 68
1.7.4. Diafragma de campo, campo de visión y tamaño angular 69
1.8. Algunos instrumentos ópticos . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
1.8.1. El ojo humano (ojo esquemático) . . . . . . . . . . . . . . . . . . . . 74
1.8.2. La lupa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
1.8.3. El telescopio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
1.8.4. El microscopio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
1.9. Aberraciones ópticas monocromáticas . . . . . . . . . . . . . . . . . . . . 95
1.9.1. Curvatura de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
1.9.2. Esférica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
1.9.3. Distorsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
1.9.4. Astigmatismo y coma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Capítulo dos
Polarización
113
2.1. Ondas planas y luz polarizada . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
2.1.1. Ecuaciones de Maxwell con ondas planas . . . . . . . . . . . . . 118
2.1.2. Irradiancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
2.1.3. Luz natural y luz polarizada . . . . . . . . . . . . . . . . . . . . . . . . 121
2.1.4. Polarización elíptica, circular y lineal . . . . . . . . . . . . . . . . . 122
2.1.5. Polarización: caso general . . . . . . . . . . . . . . . . . . . . . . . . . . 124
2.2. Polarización por dicroísmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
2.2.1. Polarizador lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
2.2.2. Ley de Malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
2.3. Polarización por reflexión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
2.3.1. Leyes de la reflexión y la refracción . . . . . . . . . . . . . . . . . . 133
2.3.2. Ecuaciones de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
2.3.3. Reflectancia y transmitancia . . . . . . . . . . . . . . . . . . . . . . . . 142
2.4. Polarización por reflexión total interna . . . . . . . . . . . . . . . . . . . . 146
2.4.1. Reflexión total interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
2.4.2. Reflectancia y transmitancia . . . . . . . . . . . . . . . . . . . . . . . . 152
2.5. Polarización con materiales birrefringentes . . . . . . . . . . . . . . . . 153
2.5.1. Láminas retardadoras de fase . . . . . . . . . . . . . . . . . . . . . . . 154
2.5.2. Cristales birrefringentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
2.5.3. Refracción en cristales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
2.5.4. Prismas polarizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
Contenido
·
ix
2.6. Vectores y matrices de Jones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
Capítulo tres
Interferencia
175
3.1. Interferencia y coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
3.1.1. Grado de coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
3.1.2. Interferencia y coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . 181
3.1.3. Longitud de coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
3.2. Interferencia de dos ondas planas . . . . . . . . . . . . . . . . . . . . . . . . 189
3.2.1. Interferencia con ondas planas inclinadas . . . . . . . . . . . . . 191
3.2.2. Desplazamiento de las franjas . . . . . . . . . . . . . . . . . . . . . . . 193
3.2.3. Visibilidad del interferograma . . . . . . . . . . . . . . . . . . . . . . . 194
3.3. Interferencia de dos ondas esféricas . . . . . . . . . . . . . . . . . . . . . . 196
3.3.1. Franjas circulares con el interferómetro de Michelson . . . 200
3.3.2. Aproximación de franjas paralelas con el interferómetro de Michelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
3.4. Aspectos prácticos en el interferómetro de Michelson . . . . . . . 210
3.4.1. Interferómetro de laboratorio . . . . . . . . . . . . . . . . . . . . . . . 215
3.5. Interferencia en una lámina de caras paralelas . . . . . . . . . . . . . . 218
3.5.1. Relaciones de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
3.5.2. Interferencia de múltiples ondas . . . . . . . . . . . . . . . . . . . . . 220
3.5.3. Interferencia de dos ondas . . . . . . . . . . . . . . . . . . . . . . . . . . 234
3.6. Interferencia con N fuentes puntuales . . . . . . . . . . . . . . . . . . . . 238
3.6.1. Aproximación con ondas planas . . . . . . . . . . . . . . . . . . . . . 241
3.7. Interferencia con fuentes de luz extendidas . . . . . . . . . . . . . . . . 244
3.7.1. Fuentes extendidas artificiales . . . . . . . . . . . . . . . . . . . . . . . 248
3.8. Interferómetro de Young I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
3.8.1. División de frente de onda y división de amplitud . . . . . . 254
3.9. Otros interferómetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
3.9.1. Interferómetro de Fabry-Perot . . . . . . . . . . . . . . . . . . . . . . 256
3.9.2. Película delgada antirreflectiva . . . . . . . . . . . . . . . . . . . . . . 258
3.9.3. Interferómetro de Newton y Fizeau . . . . . . . . . . . . . . . . . . 259
Capítulo cuatro
Difracción
263
4.1. Principio de Huygens-Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
4.1.1. Zonas de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
4.1.2. Resultados del tratamiento de Fresnel . . . . . . . . . . . . . . . . 272
4.2. Integral de difracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
x
·
Contenido
4.2.1. Teorema integral de Kirchhoff . . . . . . . . . . . . . . . . . . . . . . 278
4.2.2. Difracción de Fresnel-Kirchhoff . . . . . . . . . . . . . . . . . . . . . 280
4.2.3. Difracción de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . 283
4.3. Difracción de Fresnel y Fraunhofer . . . . . . . . . . . . . . . . . . . . . . 285
4.3.1. Difracción de Fraunhofer . . . . . . . . . . . . . . . . . . . . . . . . . . 288
4.3.2. Difracción de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
4.3.3. Algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
4.4. Interferómetro de Young II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
4.4.1. Efecto del tamaño de las aberturas difractantes . . . . . . . . . 295
4.4.2. Efecto del tamaño de la fuente luminosa . . . . . . . . . . . . . . 297
4.5. Formación de imagen con difracción . . . . . . . . . . . . . . . . . . . . . 301
4.5.1. Imagen de un objeto (fuente) puntual . . . . . . . . . . . . . . . . 301
4.5.2. Resolución en la imagen (dos puntos) . . . . . . . . . . . . . . . . 305
4.5.3. Imagen de un objeto extendido . . . . . . . . . . . . . . . . . . . . . . 307
4.6. Rejillas de difracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
Apéndice A
Trazo de rayos
315
Apéndice B
Índice de refracción
323
Apéndice C
Vidrios ópticos
331
Apéndice D
Aberraciones cromáticas
335
Apéndice E
Prismas
345
Apéndice F
Elipse de polarización
355
Bibliografía
Índice
359
363
Prefacio
Este libro presenta los temas en óptica clásica del curso Fundamentos de óptica que durante 12 años he impartido como profesor del Departamento de
Física de la Universidad Nacional de Colombia, sede Bogotá. Inicialmente di el curso como una materia electiva1 y a partir del segundo semestre
de 2009, hasta el segundo semestre de 2017, lo di en forma ininterrumpida como un curso optativo de la carrera de Física.2 El programa del curso
lo propuse teniendo en cuenta mi experiencia como investigador en óptica
aplicada desde mi doctorado en Ciencias-Óptica (1998-2001, Centro de
Investigaciones en Óptica, México). El libro está conformado por 4 capítulos: óptica geométrica, polarización, interferencia y difracción, distribuidos
en 30 unidades (y 6 apéndices), que se dan en 28 clases de 2 horas.
El objetivo de este libro es que sirva de guía para los estudiantes del curso
Fundamentos de óptica y también para aquellos estudiantes de otras carreras que deseen tener un primer acercamiento a la óptica. Para ampliar la formación básica en óptica el estudiante puede consultar textos clásicos de óptica como Fundamentals of Optics de Jenkins and White (editorial McGrawHill, 2001), Optics de Hecht (editorial Pearson, 2017) o Principles of Optics
de Born and Wolf (editorial Pergamon Press, 1980).
Agradezco a la Universidad Nacional de Colombia por permitirme disfrutar de un año sabático (febrero 2018 - febrero 2019), durante el cual
pude escribir la mayor parte de este libro.
Bogotá, D. C., Colombia, marzo de 2020.
1 Curso
que no forma parte del plan obligatorio de estudios, ofrecido voluntariamente
por un profesor para estudiantes que deseen tomarlo.
2 Curso que forma parte del plan de estudios pero que no es obligatorio.
Introducción
En términos actuales, se puede definir la óptica como la ciencia que estudia la naturaleza de la luz (rango visible del espectro electromagnético),
su propagación y su interacción con la materia. Los orígenes de la óptica
están estrechamente relacionados con los estudios de la visión y de la propagación de la luz. Alhazen (965-1040) compara la formación de la imagen
en el ojo humano con la formación de la imagen en la cámara oscura (caja cerrada con un pequeño orificio en una de sus paredes), que él mismo
construyó por primera vez. La cámara oscura también permite observar la
propagación rectilínea de la luz (rayos de luz). La descripción geométrica de
la propagación de la luz la había hecho Euclides (325-265 AC) siglos atrás
en su tratado sobre la óptica. Siguiendo uno de los postulados geométricos
de Euclides (dados dos puntos se puede trazar una línea recta que los une), la luz,
en un medio homogéneo, para ir de un punto a otro sigue la línea recta que
los une, es decir, sigue el camino geométrico más corto. Esto es una versión preliminar del principio de Fermat sobre la propagación de la luz, el
cual permite deducir las leyes de la reflexión y la refracción de la luz. En
el siglo XVII, Huygens propone una nueva descripción para la propagación
de la luz, una versión preliminar de la teoría ondulatoria. Huygens deduce
que la luz disminuye su velocidad al entrar en medios más densos y explica
la reflexión y la refracción con su teoría ondulatoria. En el siglo posterior,
Fresnel añade la interferencia de ondas a la teoría de Huygens y con esto
puede explicar el fenómeno de la difracción. Actualmente, se acepta estas
dos versiones para la propagación de la luz. Si se trata del diseño de instrumentos ópticos, la versión de rayos es más apropiada. Si se trata de estudiar
la calidad de la imagen, la versión ondulatoria será la más apropiada.1
1 En
el libro A History of Optics, from Greek Antiquity to the Nineteenth Centutry de Oliver
Darrigol (Oxford, University Press, 2012) se encuentra una mirada de los orígenes de la
óptica hasta el siglo XIX.
Capítulo
uno
Óptica geométrica
Óptica geométrica
·
3
Figura 1.1. Formación de imagen mediante una lente positiva. La imagen que
genera la lente es real y se convierte en el objeto para la cámara del dispositivo móvil con el que tomó la fotografía. Este proceso de formación de imagen lo podemos entender desde la óptica geométrica. Fuente: imagen cedida por Felix Ernesto
Charry Pastrana.
Cuando ciertos fenómenos ópticos se pueden explicar mediante conceptos
geométricos, estamos en el dominio de lo que se llama óptica geométrica.
Partiendo de la idea de que la luz se propaga como rayos geométricos y de
que esa propagación está gobernada por el principio de Fermat, podemos
estudiar la propagación de la luz en medios de índice de refracción constante
o variable, la formación de imagen en sistemas ópticos formados por lentes,
prismas y espejos, las aberraciones ópticas que deterioran la calidad de la
imagen, el diseño de instrumentos ópticos, etc. Así que aunque con la óptica
geométrica no se puede explicar los fenómenos que obedecen a la naturaleza
ondulatoria de la luz, sí se tiene un campo muy amplio de aplicaciones, por
lo que iniciar el estudio de la óptica desde el punto de vista geométrico está
justificado plenamente.
En este capítulo, a partir del principio de Fermat, se deducen las propiedades geométricas de los sistemas ópticos formados por superficies esféricas refractoras, espejos esféricos y lentes. La mayor parte del capítulo
se desarrolla dentro de la aproximación paraxial, pero al final se hace una
introducción al tema de aberraciones ópticas monocromáticas. Los temas
de aberración cromática y prismas se tratan brevemente en los apéndices D
y E.
4
·
Óptica geométrica
1.1. Rayos u ondas
1.1.1. La cámara oscura
La cámara oscura es básicamente una caja cerrada con un pequeño agujero
de forma circular en una de sus caras. La función del agujero es dejar pasar
luz contenida en un cono cuyo vértice es un punto luminoso en el objeto
(punto objeto) y cuya base es el agujero. El tamaño del agujero determina
el ángulo del cono.
Objeto
Imagen
d
L
Figura 1.2. Formación de imagen con una cámara oscura.
Supongamos que tenemos una caja cuadrada de lado L con un agujero
circular de radio ra y un objeto a la distancia d de la caja (fig. 1.2). La luz que
emerge de un punto del objeto se proyecta en la cara posterior de la caja como una mancha luminosa aproximadamente circular de radio ra (L + d)/d.1
Si definimos un objeto como la unión de puntos luminosos, en la cara posterior de la caja se verá la superposición de las manchas luminosas correspondientes a cada punto del objeto. Si el agujero es relativamente grande,
en la cara posterior veremos algo como una imagen muy desenfocada del
objeto. Pero si se achica gradualmente el agujero, la imagen pasará de desenfocada a nítida. Será completamente nítida si el radio del agujero tiende
a cero (el ángulo del cono de iluminación tiende a cero). En este caso el
cono de iluminación se transforma en lo que se denomina un rayo luminoso.
Por supuesto, si el radio del agujero es cero, el rayo luminoso será una línea
recta (que no transportará energía). En este caso límite (no real), diremos
que la imagen es una copia idéntica del objeto, salvo por un factor de escala. Siguiendo la geometría de la fig. 1.2, también es evidente que la imagen
estará invertida.
1 Para
el punto del objeto en el eje óptico será circular y para un punto del objeto fuera
del eje óptico será, más bien, una elipse.
Óptica geométrica
·
5
Figura 1.3. Imágenes con una cámara oscura. (a) Objeto. (b) Cámara oscura: cámara digital a la que se le retiró el sistema óptico formador de imagen (objetivo de
la cámara) para reemplazarlo por un iris. (c), (d), (e) y (f) Imágenes tomadas con la
cámara oscura cuando el diámetro del iris es, aproximadamente, 0.5 mm, 1.0 mm,
2.0 mm, y 3.0 mm, respectivamente. En todos los casos, el tiempo de exposición
fue el mismo (menor a 1 s). Con el agujero de menor diámetro en (c), se observa el
objeto con menor iluminación y un poco desenfocado. En (d), al abrir el iris hasta 1.0 mm, aumenta la iluminación, pero el desenfoque se hace mayor. En (e), al
aumentar aún más el iris, hasta 2.0 mm, se mejora notablemente la iluminación,
pero la imagen está muy desenfocada. Finalmente, en (f), el iris se aumenta hasta
3.0 mm, y en este caso se tiene una imagen muy iluminada, pero se ha perdido
casi toda la información sobre la forma del objeto.
En la fig. 1.3, se muestra un ejemplo de 4 imágenes de un mismo objeto
(en (a)), tomadas con una cámara oscura (en (b)), con el mismo tiempo de
exposición menor a 1 s, para diferentes diámetros del agujero (iris de tamaño variable): (c) ≈ 0.5 mm, (d) ≈ 1.0 mm, (e) ≈ 2.0 mm y (f) ≈ 3.0 mm.
6
·
Óptica geométrica
La cámara oscura en este ejemplo es una cámara digital a la que se le ha
retirado el sistema óptico formador de imagen (objetivo de la cámara) y se
le ha reemplazado por un iris de diámetro variable.
Alhazen2 (945-1040) usa la cámara oscura (que él mismo construyó)
para mostrar que la luz de los objetos llega al ojo humano viajando en línea
recta [1].
En la práctica, con un agujero muy pequeño, el aspecto ondulatorio de la
luz se hace evidente mediante la difracción, lo que da una mancha luminosa
de mayor tamaño que la que se tendría con la proyección geométrica. Trataremos el fenómeno de la difracción al final del curso. Por ahora, vamos a
aceptar que con la cámara oscura se puede observar que la luz se propaga
como rayos, que siguen una línea recta en medios homogéneos (índice de
refracción constante).
1.1.2. La teoría corpuscular de Newton
u ix
u iy
-u iy
q
q
u ix
Superficie
reflectora
Figura 1.4. Ley de la reflexión según Newton.
Newton (1642-1727) comparte la idea de que la luz se propaga en línea
recta y también afirma que la luz está compuesta de pequeñas partículas
de luz que siguen las leyes de la mecánica newtoniana [2]. De esta manera Newton da una explicación a las leyes de la reflexión y refracción de la
luz. En un medio homogéneo se propagan en línea recta y con velocidad
constante. Cuando las partículas de luz inciden en una superficie reflectora experimentan un choque elástico manteniendo la velocidad tangencial
y cambiando la dirección de la velocidad ortogonal a la superficie. Esto se
esquematiza en la fig. 1.4, en la que se muestra que después de la colisión
solo cambia la dirección de la componente y, el módulo de la velocidad se
2 Alhazen
es el nombre en su versión latina de Ibn al-Haytham, nacido en lo que hoy es
Basora (Iraq), en 965. Alhazen vivió en el período en el que el mundo musulmán fue la sede
de grandes avances científicos.
Óptica geométrica
·
7
mantiene y el ángulo con que se refleja el rayo luminoso es igual al ángulo
con el que incide el rayo luminoso.
u ix
u iy
qi
ni
Superficie
refractora
nt
nt
qt
>
ni
ut x = u i x
ut y > u i y
Figura 1.5. Ley de la refracción según Newton.
Por otra parte, en el caso de la refracción, Newton sostiene que la interfase que separa dos medios de distinto índice de refracción (con el índice de
refracción del medio incidente menor al índice del medio de transmisión)
ejerce una atracción sobre las partículas de luz, aumentando así la componente normal de la velocidad, mientras que la componente tangencial permanece invariable, como se muestra en la fig. 1.5. Lo anterior implica que el
módulo de la velocidad aumenta cuando la luz pasa de un medio de menor
índice a un medio de mayor índice, contrario a lo que realmente ocurre.
1.1.3. La teoría ondulatoria de Huygens
La teoría corpuscular de Newton no solo se equivoca en cuanto al cambio de la velocidad cuando la luz se refracta, sino que no puede explicar
los fenómenos de interferencia. Una propuesta diferente a la de Newton es
presentada por Huygens conocida como el principio de Huygens.
Antes de enunciar dicho principio vamos a definir cualitativamente lo
que es un frente de onda a partir de ondas mecánicas en la superficie del
agua. Cuando una gota cae sobre la superficie de un estanque de agua que
está en reposo, podemos observar una serie de ondulaciones (crestas y valles)
en la superficie que se propagan alejándose del lugar donde cayó la gota. La
forma de las crestas (valles) son círculos (fig 1.6(a)). Idealmente, los puntos
que están en la parte más alta de una de las crestas estarán a la misma altura.
8
·
Óptica geométrica
Diremos que todos los puntos de una cresta (valle) que están a la misma
altura describen un perfil que se denomina frente de onda.
(a)
(b)
Figura 1.6. Ondas en una cubeta con agua: (a) ondas circulares, (b) ondas circulares
secundarias en una abertura (difracción).
Entonces, en el ejemplo de la fig. 1.6(a), la gota equivale a la fuente que
origina las ondas circulares (esféricas en el caso 3D). En un medio homogéneo, los frentes de onda circulares se propagan con la misma velocidad.
A medida que el frente de onda se aleja de la fuente, incrementa su radio, y
para grandes distancias el frente de onda en la vecindad de un punto se verá
como un frente de onda plano.
Supongamos que se obstruye un frente de onda dejando pasar solamente
una porción pequeña, como se muestra en la fig. 1.6(b), lo que ocurre es que
al atravesar la abertura se generan frentes de onda nuevamente circulares
que se propagan con la misma velocidad del frente de onda original. Este
hecho, que se debe a la difracción de las ondas, es la idea central del principio
de Huygens, que se puede enunciar como sigue [3]:
cada punto en un frente de onda se puede considerar como una
fuente de ondas esféricas secundarias que se propagan con la
misma velocidad que el frente de onda. Al cabo de un tiempo, el frente de onda propagado será la envolvente de las ondas
esféricas secundarias.
Lo anterior se ilustra en la fig. 1.7, en la que se recrea la propagación de un
frente de onda a partir de las ondas secundarias de Huygens. Esta idea de
Huygens es aplicable a la propagación de la luz y permite deducir correctamente las leyes de la reflexión y la refracción. En la refracción, como en
la fig. 1.5, la velocidad de la luz en el medio de mayor índice es menor a la
que tiene en el medio de menor índice (contrario al supuesto de Newton).
Óptica geométrica
Ondas
secundarias
Frente de
onda
·
9
Nuevo frente
de onda
Figura 1.7. Construcción de un frente de onda en propagación con el principio
de Huygens.
Finalmente, veamos cómo se deduce la ley de la refracción a partir del
principio de Huygens. En la fig. 1.8(a), se muestra un frente de onda S − S 0
que incide con una inclinación 𝜃 en una interfase que separa dos medios
homogéneos de índices de refracción n (medio incidente) y n 0 (medio de
refracción). Cuando el frente de onda llega al punto a, se generan ondas
secundarias que se propagan con velocidades 𝜐 (en el medio incidente) y 𝜐 0
(medio de refracción). En un tiempo t posterior, el frente de onda llega al
punto b, por lo que las ondas secundarias emitidas en a tendrán los radios
ae = 𝜐t y ad = 𝜐 0t, respectivamente. La velocidad de propagación en un
medio de índice n se define como 𝜐 = c/n, donde c es la velocidad de la luz
en el vacío. Por lo tanto, si n < n 0, entonces 𝜐 > 𝜐 0, y la situación se verá
como se ilustra en la fig. 1.8(a).
c
e
S'
n sinq = n' sinq '
q
n
n'
n
q
S
a
q'
d
(a)
b
n'
q'
(b)
Figura 1.8. Ley de la refracción según el principio de Huygens.
10
·
Óptica geométrica
De acuerdo con el principio de Huygens, en el tiempo t la envolvente
para la onda reflejada será el frente de onda plano be y la envolvente para la
onda refractada será el frente de onda plano bd. Para la refracción, tenemos
que sin 𝜃 0 = ad/ab y sin 𝜃 = cb/ab. Como cb = ae, se llega a
sin 𝜃 0 𝜐 0t
=
.
sin 𝜃
𝜐t
(1.1)
Usando la definición de índice de refracción,3 finalmente, llegamos a la ley
de la refracción, también conocida como la ley de Snell4
n sin 𝜃 = n 0 sin 𝜃 0 ,
(1.2)
que nos índica la manera como cambia la inclinación del frente de onda
refractado (ángulo 𝜃 0).
Si en lugar de observar la inclinación de los frentes de onda nos fijamos
en las direcciones de propagación de los frentes de onda, entonces la ley
de Snell también se puede esquematizar como en la fig. 1.8(b). De hecho, si
volvemos a la interpretación de rayos de luz, la ley de Snell también se puede
enunciar diciendo que si un rayo luminoso en el medio de índice n incide
en una interfase con un ángulo 𝜃 (medido con respecto a la normal de la
interfase en el punto donde incide el rayo), el rayo refractado en el medio de
índice n 0 formará un ángulo 𝜃 0 con respecto a la normal. Entonces, tenemos
dos conceptos: el rayo luminoso y el frente de onda. Geométricamente,
ambos se relacionan, los rayos son ortogonales a los frentes de onda. Así que
usar una u otra representación resulta equivalente mientras consideremos
la propagación de la luz como un asunto geométrico.
En 1678, Huygens (en Traité de la Lumière) muestra que con sus ideas de
ondas secundarias se cumple la ley de Snell, que él ya conocía de los trabajos
de Snell. Como veremos más adelante, esta ley también puede ser derivada
a partir de otros principios físicos.
1.1.4. Trazo gráfico de rayos
La ley de Snell tiene una interpretación gráfica que permite hacer de manera
sencilla (y exacta) el trazo de los rayos en cualquier superficie refractora.
En la fig. 1.9(a), tenemos la refracción de un rayo incidente. Supongamos que construimos un triángulo, como se muestra en la fig. 1.9(b), de la
3 En el apéndice B se trata el índice de refracción en materiales dieléctricos, en particular
el vidrio óptico.
4 La ley de la refracción también se denomina ley de Snell en memoria de Willebrord
Snellius (1580-1626), quien fue profesor de matemáticas en la Universidad de Leiden.
Óptica geométrica
·
11
siguiente manera: un lado de longitud igual al índice n en la prolongación
del rayo incidente con origen en el punto de incidencia A. El extremo de
este lado será B. Un lado de longitud igual al índice n 0 con la misma orientación del rayo refractado con origen en el punto de incidencia A. El extremo
de este lado será C. El tercer lado será la línea que une los extremos B y
C. Este triángulo tiene la propiedad que el lado BC es paralelo a la línea
normal N.
N
N
N
q
n
n
n
A
n'
n
n'
q'
q
q'
(a)
B
n'
n'
C
(c)
(b)
Figura 1.9. Trazo gráfico de rayos según la ley de Snell.
El triángulo ABC de la fig. 1.9(b) cumple la ley de Snell. Lo anterior
resulta directamente de la ley de los senos para el triángulo, así
AB
AC
=
,
0
sin 𝜃
sin(𝜋 − 𝜃)
(1.3)
n0
n
=
,
sin 𝜃 0 sin 𝜃
(1.4)
lo que es igual a
que es la ley de Snell.
n < n'
n
n > n'
n'
N
N
n
n'
n
n'
(a)
n
n'
(b)
Figura 1.10. Trazo gráfico de rayos en superficies curvas.
12
·
Óptica geométrica
Lo anterior permite desarrollar una técnica para hacer el trazo gráfico de
rayos en la refracción, como se ilustra en la fig. 1.9(c), que dice:
consideremos un rayo que incide en una superficie que separa
dos medios: medio de incidencia con índice n y medio de refracción con índice n 0. El rayo refractado se obtiene así: en el
punto de incidencia se determina la normal a la superficie y se
dibuja dos círculos de radios n y n 0 centrados en ese punto. El
rayo incidente se prolonga hasta el círculo de radio n y en la
intersección se tiene un punto desde el que se traza una línea
paralela a la normal en el punto de incidencia. Esta nueva línea
corta al círculo de radio n 0 en otro punto que índica la dirección en que debe ser trazado el rayo refractado desde el punto
de incidencia.
Esta técnica funciona en superficies planas y curvas, ya que la ley de Snell
se aplica localmente. Por ejemplo, en la fig. 1.10 se muestra dos ejemplos
con superficies curvas; en (a), n < n 0, y en (b), n > n 0. Note el cambio en
la prolongación del rayo incidente en (b), donde ahora va hasta el círculo
de mayor radio. En este último caso, se presenta una situación relevante
cuando la línea paralela a la normal N toca tangencialmente al círculo de
menor radio. El rayo refractado forma un ángulo de 𝜋/2, es decir, el rayo
es tangente a la interfase. En la fig. 1.11, se ilustra este hecho particular.
N
n
qc
A
n'
C
B
Figura 1.11. Cuando la paralela a la normal N toca tangencialmente al círculo de
radio n 0 se tiene reflexión total interna.
El ángulo del rayo incidente para el cual ocurre esto se denota por 𝜃 c y se
denomina ángulo crítico. Para 𝜃 > 𝜃 c , se produce el fenómeno de reflexión
total interna, el cual veremos en detalle en la sección 2.4.1. Del triángulo
ABC de la fig.1.11, se tiene que
sin 𝜃 c =
n0
.
n
(1.5)
Óptica geométrica
·
13
1.2. Principio de Fermat
Euclides (325-265 AC), en sus tratados de geometría, postuló que “dados
dos puntos se puede trazar una línea recta que los une”, y en el espacio
Euclidiano la distancia más corta entre dos puntos es la longitud de la línea
recta que los une. Siguiendo este postulado, Hero de Alejandría (10-70 AC)
establece que la luz para ir de un punto a otro sigue el camino geométrico más
corto. Otra manera de decir que la luz se propaga como rayos geométricos.
Teniendo en cuenta que en un medio homogéneo la luz se propaga con
velocidad constante, también se puede decir que la luz para ir de un punto
a otro sigue el camino para el cual se emplea el menor tiempo. Para un mismo
medio homogéneo los dos enunciados resultan equivalentes. Sin embargo,
si los dos puntos están en diferentes medios (ambos homogéneos), lo que
resulta es que la luz ya no sigue el camino geométrico más corto.
P
P
h
n
T1
T2
q
n
T
T3
n'
n'
b
Q
q'
Q
x
a
(a)
(b)
Figura 1.12. Ley de Snell con el principio de Fermat. (a) Tres posibles trayectorias
para ir de P a Q. (b) Geometría para calcular la trayectoria real.
En la fig. 1.12(a), se ilustra la situación con tres posibles trayectorias para la luz. La interfase plana separa los medios de índice de refracción n y
n 0. La trayectoria geométrica más corta es la línea recta PT2 Q, pero no corresponde con la trayectoria que sigue la luz si n 0 ≠ n. La trayectoria que
sigue la luz se asemeja a las líneas PT1 Q cuando n 0 < n y a las líneas PT3 Q
cuando n 0 > n. Entonces, ¿cómo se puede obtener la trayectoria real de la
luz cuando n 0 ≠ n? La respuesta a esta pregunta se obtiene al usar el segundo enunciado para el menor tiempo. Este enunciado fue formulado por
Fermat (1601-1665) y se conoce como el principio de Fermat.
14
·
Óptica geométrica
Para aplicar el principio de Fermat al problema ilustrado en la fig. 1.12(a),
vamos a considerar la geometría de la fig. 1.12(b). La interfase se localiza
en y = 0 y el punto T en x. Las coordenadas del punto P son (0, h) y del
punto Q son (a, −b). El tiempo para que la luz vaya de P a Q pasando por
T será
n
n0
t = PT + TQ,
(1.6)
c
c
es decir,
q
n0 2
np 2
h + x2 +
b + (a − x) 2 .
(1.7)
t=
c
c
El principio de Fermat establece que t debe ser el menor posible, lo cual
equivale a encontrar el valor de x para el cual el lado derecho de la ecuación es el menor. En otras palabras, debemos derivar el lado derecho con
respecto a x e igualar a cero. Esto es,
0=
x
(a − x)
n
n0
− p
√
c h2 + x 2
c b 2 + (a − x) 2
(1.8)
de donde resulta la ley de Snell n 0 sin 𝜃 0 = n sin 𝜃 (eq. (1.2)).
P
P
Q
h
q
b
Q
q
q
q'
n
n
T
T
x
a
P'
(a )
(b )
Figura 1.13. Ley de la reflexión con el principio de Fermat. (a) Geometría para
calcular la trayectoria de P a Q pasando por T. (b) T está en la intersección de la
recta que une P0 con Q. La distancia de P0 al espejo es igual a la distancia de P al
espejo.
Para el caso de la reflexión, como en un espejo plano, la geometría del
problema, se muestra en la fig. 1.13(a). El ángulo del rayo incidente con
la normal en T es 𝜃 y el ángulo del rayo reflejado con la normal en T es
𝜃 0. Al aplicar el principio de Fermat a la fig. 1.13(a), obtenemos ecuaciones
iguales a las que tuvimos en el caso de la refracción, pero ahora n 0 = n, de
modo que la eq. (1.8) queda 0 = sin 𝜃 0 − sin 𝜃, por lo tanto, el rayo reflejado
tiene un ángulo de inclinación igual al ángulo del rayo incidente, es decir,
Óptica geométrica
·
15
𝜃 0 = 𝜃. En la fig. 1.13(b), se incluye la imagen virtual P0 de P. La distancia
de P0 al espejo es igual a la distancia de P al espejo. Un observador en Q
verá la luz llegar desde P0 y no desde P. Entonces, en efecto, el punto T está
en la intersección de la línea recta P0Q, de modo que para la fuente virtual
también se satisface el principio de Fermat.
Observador
T
Figura 1.14. Un espejismo. El observador ve algo que realmente no está en el
punto T. Lo que ve es la luz proveniente del cielo.
Un ejemplo interesante que se explica con el principio de Fermat es el
espejismo, fig. 1.14. Supongamos que estamos parados en una carretera
recta en una llanura con cielo despejado. Debido al calor, el aire que está
más cerca de la superficie de la carretera tendrá una menor densidad que el
que está a mayor altura. En consecuencia, el índice de refracción varía con
la altura y es menor cerca de la superficie de la carretera. Si ahora dirigimos
nuestra mirada hacia un punto T en la carretera, ocurre que la luz que llega
en esa dirección no es la que sale del punto T, sino luz proveniente del cielo.
Entonces, vemos como si la carretera delante de nosotros estuviera mojada
o como si fuera un espejo. Lo que ha ocurrido es que la luz evita las zonas
de mayor índice de refracción buscando la trayectoria del tiempo mínimo
y algunos de los rayos provenientes del cielo terminan llegando a nuestros
ojos cuando miramos en la dirección índicada.
Una situación en que se tiene infinitas trayectorias con el mismo tiempo
la tenemos en un espejo elipsoidal de revolución, el cual tiene la propiedad
de formar la imagen de una fuente puntual localizada en uno de los focos en
el otro foco. Consideremos una sección transversal del elipsoide que contiene al eje de revolución, como se muestra en la fig. 1.15. Supongamos
que dentro del espejo tenemos aire (n = 1) y que en el foco P se localiza
una fuente puntual de la que divergen rayos en dirección radial. Cualquier
rayo seguirá una trayectoria recta hasta llegar al espejo en un punto T y se
reflejará siguiendo nuevamente una trayectoria recta pasando por el punto
Q, que está en el otro foco de la elipse. Al cambiar la posición de T, el rayo
luminoso reflejado pasará nuevamente por Q. En ambos casos, el tiempo
es el mismo, y esto ocurre para cualquier otro punto T en la superficie del
16
·
Óptica geométrica
espejo. Así que ninguna de las trayectorias es un mínimo. Lo anterior índica
que la formulación original del principio de Fermat no contempla todos los
casos.
T
P
Q
Figura 1.15. Espejo elíptico. La luz que emite una fuente puntal en P llegará
después de reflejarse en el espejo al punto Q siguiendo cualquiera de las infinitas
trayectorias que cumplen la ecuación de la elipse.
1.2.1. Formulación moderna del principio de Fermat
Si en la eq. (1.6) pasamos a multiplicar el tiempo por la velocidad de la luz,
ct = nPT + n 0TQ, tenemos una igualdad de dos cantidades de naturaleza
distinta. Al lado izquierdo, tenemos la distancia que recorre la luz en el vacío
en el tiempo mínimo; al lado derecho, una distancia diferente a la distancia geométrica, esto es, la distancia geométrica multiplicada por el índice
de refracción. A esta última distancia se le denomina longitud de camino
óptico (LCO). Teniendo en cuenta este concepto, el principio de Fermat en
su forma moderna establece que:
un rayo de luz va de un punto a otro siguiendo una trayectoria
cuya longitud de camino óptico es estacionaria con respecto a
las variaciones de dicho camino.
En este enunciado, “estacionaria” significa que puede ser un valor mínimo,
máximo o un punto de inflexión con pendiente horizontal. De esta manera, se incluyen todos los casos posibles para la trayectoria de la luz. Por
ejemplo, en el espejo elipsoidal de la fig. 1.15, las trayectorias de los rayos
corresponden con el punto de inflexión en el principio de Fermat.
·
Óptica geométrica
Trayectoria para el camino
óptico más corto
17
P2
s
n (x,y,z)
P1
ds
Trayectoria geométrica más corta
Figura 1.16. Longitud de camino óptico en un medio inhomogéneo.
Entonces, de manera general, supongamos que tenemos un camino C
de longitud s que une dos puntos P1 y P2 que se encuentran en un medio
inhomogéneo, como se muestra en la fig. 1.16. El índice de refracción será
una función de las coordenadas espaciales, n = n(x, y, z), y la longitud de
camino óptico estará dada por
∫
LCO =
n(s)ds,
(1.9)
C
p
donde ds = dx 2 + dy 2 + dz 2 . Si LCO satisface
𝜕
(LCO) = 0,
𝜕s
(1.10)
entonces C es el camino que seguirá la luz. En la fig. 1.16, aunque la longitud
de la trayectoria para el camino óptico más corto resulta ser mayor que la
longitud de la trayectoria geométrica más corta (segmento P1 P2 ), se tiene
que la longitud del camino óptico a lo largo de C es menor que la longitud
de camino óptico a lo largo de P1 P2 .
1.2.2. Rayos y frente de onda
Teniendo en cuenta lo anterior, desde el punto de vista geométrico, un rayo de luz es la curva que satisface el principio de Fermat. Si el medio es
homogéneo, n = n0 (constante), entonces
∫
LCO = n0
ds = n0 P1 P2 ,
C
ya que le camino más corto entre dos puntos (en el espacio euclidiano) es
una línea recta. Por lo tanto, los rayos en un medio homogéneo son líneas
rectas, mientras que en un medio inhomogéneo serán curvas.
18
·
Óptica geométrica
Por ejemplo, en la fig. 1.17(a) se muestra en un plano una posible configuración para algunos rayos emitidos por una fuente puntual sumergida en
un medio de índice de refracción variable. Ahora consideremos una curva
ortogonal a los rayos. Si la distancia a la que está cada punto de esta curva
a lo largo de los rayos con respecto a la fuente puntual es tal que el camino
óptico es el mismo, esta curva se denomina frente de onda geométrico. Por
supuesto para otra longitud de camino óptico tendremos otro frente de onda, así que lo que tenemos es una familia de rayos y una familia de frentes
de onda ortogonales entre sí. En la situación tridimensional, los rayos no
estarán limitados a un plano y los frentes de onda serán superficies ortogonales a los rayos. En el caso cuando el índice de refracción es constante, los
rayos serán líneas radiales y los frentes de onda serán esferas, fig. 1.17(b).
Si observamos los frentes de onda a una distancia que tiende a infinito de
la fuente, el frente de onda será un plano y los rayos correspondientes serán líneas paralelas entre sí, fig. 1.17(c). A estos rayos se les denomina rayos
colimados.
Rayos
radiales
Rayos
curvos
S
Rayos
colimados
S
n = n(x,y,z)
Frente de onda
n = n0
n = n0
Frente de onda
esférico
(a )
Frente de onda
plano
(b )
(c )
Figura 1.17. Los rayos y los frentes de onda son ortogonales entre sí. (a) Fuente
puntual en un medio inhomogéneo. Los rayos son curvas y el frente de onda es una
superficie distorsionada; (b) fuente puntual en un medio homogéneo. Los rayos
son líneas radiales y el frente de onda es una esfera; (c) a una distancia infinita de la
fuente puntual en un medio homogéneo los rayos son líneas paralelas (colimadas)
y el frente de onda es un plano
Desde el punto de vista matemático, si Φ(x, y, z) representa el frente de
onda, entonces ∇Φ representa los rayos y
t̂ =
∇Φ
k∇Φk
(1.11)
da la dirección del rayo. Por lo tanto, para referirnos a la propagación de
la luz lo podemos hacer con cualquiera de las dos representaciones: rayos o
frentes de onda. Dada una de las representaciones podemos pasar a la otra
con la eq. (1.11).
Óptica geométrica
·
19
En la sección 1.1.3, definimos cualitativamente el frente de onda a partir
del movimiento ondulatorio de las crestas y valles en la superficie del agua.
Formalmente, en ondas, el frente de onda se define como la superficie en
que cada punto tiene el mismo valor de fase. Por otro lado, en el principio
de Fermat, el frente de onda se define como la superficie en que cada punto
tiene el mismo valor de longitud de camino óptico. Las dos definiciones son
equivalentes. Como veremos más adelante, la fase se puede obtener a partir
de la longitud de camino óptico.
1.2.3. Imagen de una fuente puntual
Supongamos que tenemos una fuente puntual S sumergida en un medio
homogéneo de la que divergen rayos, como en la fig. 1.17(b). Teniendo en
cuenta que la refracción de la luz en una interfase implica que los rayos
luminosos cambian su dirección de acuerdo con la ley de Snell, entonces
es posible diseñar una superficie o un conjunto de superficies refractoras
(sistema óptico) con las que se puedan volver a juntar los rayos en un punto
S0 (también en un medio homogéneo).
Si la longitud de camino óptico es igual para todos los rayos que
salen del punto S, refractándose en el sistema óptico y llegando
al punto S0, entonces diremos que S0 es la imagen de S.
Lo anterior implica que el frente de onda que converge en S0 también debe
ser esférico, como se muestra en la fig. 1.18.
S
Objeto
Sistema
óptico
S'
Imagen
Figura 1.18. Formación de la imagen de una fuente puntual.
La fig. 1.18 describe la formación de la imagen de un objeto puntual S en
una imagen también puntual S0. Pero también se puede hacer la descripción
en el sentido inverso, es decir, si S0 es el objeto, entonces S será la imagen.
Se dice entonces que S y S0 son puntos conjugados.
Si el sistema óptico es tal que los rayos que salen de S no llegan a S0
con la misma longitud de camino óptico, entonces no tendremos la imagen
20
·
Óptica geométrica
de un punto, sino una mancha de cierta extensión. Lo anterior se explica
teniendo en cuenta que una imagen puntual implica un frente de onda esférico convergente, y si los rayos llegando o acercándose a la posición ideal
de S0 no tienen el mismo camino óptico, el frente de onda convergente no
será esférico, por lo que no se puede tener una imagen puntual. En este caso se dice que el sistema óptico introduce aberraciones que distorsionan la
imagen. Este tema lo abordaremos de manera general al final del capítulo.
La cuestión que nos interesa ahora es determinar la forma que las superficies refractoras deben tener para generar una imagen puntual de un objeto
puntual.
Óptica geométrica
·
21
1.3. Superficies refractoras
En la fig. 1.18, el sistema óptico recibe a la entrada un manojo de rayos
divergentes generados por un objeto puntual (fuente puntual) y entrega a
la salida un manojo de rayos convergentes hacia un punto imagen. ¿Cómo
debe ser el sistema óptico para realizar esta tarea? Para responder esta pregunta comenzaremos por el caso más simple: la formación de imagen por
una superficie refractora. La forma de la superficie se determina a partir del
principio de Fermat.
l
l'
P
P'
n
n'
Figura 1.19. La forma de la superficie refractora que permite obtener la imagen
puntual P0 de un objeto puntual P se denomina ovoide cartesiano.
En la fig. 1.19, se muestra la formación de imagen de un objeto puntual
P empleando una superficie refractora que separa dos medios de índice de
refracción n y n 0, (n 0 > n). La longitud de cualquier rayo incidente se denota
por l y la longitud del correspondiente rayo refractado se denota por l 0. La
longitud de camino óptico para cualquier rayo debe ser la misma, por lo
tanto
LCO = nl + n 0l 0 = constante.
(1.12)
La superficie que se obtiene al resolver la eq. (1.12) es una superficie de
revolución denominada ovoide cartesiano. El eje de revolución coincide con
la línea recta PP0. La intersección del eje con la superficie define el vértice
de la superficie. El centro de curvatura de la superficie en el vértice estará
en el eje.
Entonces, con el ovoide cartesiano formamos la imagen de P en P0, como se muestra en la fig. 1.19. En otros casos podemos necesitar más de
una superficie, por ejemplo, si lo que queremos es que la imagen esté en
el mismo medio del objeto. En cualquier caso, en lo que sigue en este capítulo, nos vamos a limitar a sistemas ópticos cuyas superficies refractoras
tengan simetría de revolución. Además, todos los ejes de revolución serán
coincidentes, en otras palabras, tendremos un solo eje de revolución que se
22
·
Óptica geométrica
denominará eje óptico del sistema. Por lo tanto, el eje óptico debe contener
todos los vértices y centros de curvatura (correspondientes a los vértices) de
las superficies refractoras.
Un ejemplo sencillo de ovoide cartesiano se obtiene cuando queremos
formar una imagen puntual a una distancia b del vértice V de la superficie
refractora cuando el punto objeto está a una distancia infinita del vértice.
Ahora los rayos incidentes serán colimados y paralelos al eje óptico, como
se muestra en la fig. 1.20.
n < n'
Q
P
A
n
V
a
S
r
q
n'
P'
b
Figura 1.20. La forma de la superficie que genera una imagen puntal de un objeto
puntual que está en el infinito es un elipsoide de revolución cuando n < n 0.
Consideremos un plano ortogonal al eje óptico que pasa por A. Los rayos
incidentes en ese plano tendrán la misma longitud de camino óptico desde
el objeto puntual. Por lo tanto, podemos tomar ese plano como referencia
para medir las longitudes de camino óptico desde P, pasando por Q en la
superficie refractora Σ, hasta el punto imagen P0. Luego, si P0 es la imagen
del punto que está en infinito, todos los rayos desde el plano en A hasta P0
deben tener la misma longitud de camino óptico. En particular, para el rayo
que sale de P, tenemos
LCO = nPQ + n 0 𝜌 = na + n 0b,
(1.13)
donde a es la distancia desde A hasta V. Note que el lado derecho de la
eq. (1.13) es la longitud de camino óptico a lo largo del eje óptico. Ya que
PQ = a + b − 𝜌 cos 𝜃, entonces
n
n 0 𝜌 1 − 0 cos 𝜃 = b(n 0 − n).
(1.14)
n
Definiendo una nueva constante p = b (n 0 − n) /n 0 se llega a
𝜌 (1 − e cos 𝜃) = p,
(1.15)
Óptica geométrica
·
23
lo que describe una superficie cónica con excentricidad e = n/n 0. Ya que
n 0 > n, entonces e < 1, lo que corresponde con una elipse. Por lo tanto, la
superficie refractora Σ, que enfoca los rayos colimados paralelos al eje óptico
en un punto imagen, es un elipsoide de revolución.
1.3.1. Modelo de la córnea del ojo humano
Un ejemplo en que la superficie refractora se asemeja a un elipsoide de revolución es la cara anterior de la córnea del ojo humano. El ojo humano es
un sistema biológico-óptico que enfoca los rayos luminosos en la superficie
cóncava de la retina. Anatómicamente, el globo ocular de un ojo normal en
un adulto es un ovoide aproximadamente esférico de unos 23 mm de diámetro. La luz entra al ojo primero por la córnea, un tejido transparente que
sobresale del globo, fig. 1.21. El índice de refracción promedio de la córnea
es 1.376. En un ojo emétrope, la córnea tiene una superficie anterior con un
radio medio de 7.8 mm en la zona central (alrededor del vértice) y a medida
que se aleja del centro el radio aumenta ya que la córnea se empalma con la
esclerótica (la capa más externa que recubre el globo ocular). Esto hace que
la forma de la cara anterior de la córnea se asemeje a un elipsoide. Varios
estudios experimentales [4] han demostrado que la mayor parte de las córneas normales se pueden caracterizar mediante un modelo elipsoidal con
una excentricidad 0.5 y con el vértice descentrado hacia la zona temporal
con respecto al eje óptico en 0.4 mm aproximadamente.
Esclerótica
Cristalino
Córnea
Humor acuoso
Iris
Retina
Mácula
Humor
vítreo
Eje visual
Eje óptico
Punto
ciego
Figura 1.21. Esquema del ojo humano. La superficie anterior de la córnea en los
ojos emétropes se asemeja a un elipsoide de revolución.
La superficie posterior de la córnea, con un radio medio de 6.5 mm, está
separada de la superficie anterior en 0.6 mm, aproximadamente. Inmediatamente detrás de la córnea, está la cámara anterior, que contiene al humor
24
·
Óptica geométrica
acuoso con un índice de refracción 1.336. Luego, se encuentra el iris, que
controla la cantidad de luz que entra al ojo, variando su diámetro interno
desde 2 mm (objetos con alta iluminación) hasta 8 mm (objetos con baja
iluminación). Detrás del iris está la lente del cristalino, con forma de lente
biconvexa de 9 mm de diámetro y 4 mm de espesor, aproximadamente.
El índice de refracción del cristalino varía, alrededor de 1.406 en el núcleo
interior hasta aproximadamente 1.386 en las zonas externas. El cristalino
puede variar su forma para realizar un enfoque fino, de modo que la luz que
provenga de cualquier objeto exterior sea enfocada en la superficie de la retina. Detrás del cristalino hay otra cámara con una sustancia transparente,
denominada humor vítreo, con un índice de refracción 1.337. Finalmente, la luz es enfocada en la retina, una superficie cóncava que contiene dos
clases de células foto-receptoras, los conos y los bastones. Una descripción
detallada sobre la anatomía del ojo y su funcionamiento se puede consultar
en las obras de Gullstrand [5], Le Grand [6], Davson [7], Smith [8].
V
P'
neq
Figura 1.22. Modelo simplificado del ojo humano. El ojo se modela con una superficie refractora elipsoidal y con un índice de refracción equivalente neq .
Debido a la complejidad del ojo humano (por ejemplo, el eje visual no
coincide con el eje óptico, fig. 1.21), en optometría y oftalmología se suele
trabajar con modelos simplificados del ojo humano que permiten analizar
la formación de imagen en la retina. Varias propuestas de esto se han hecho
y algunas incluyen un elipsoide para modelar la córnea [9]. Por ejemplo, se
podría pensar el ojo humano como un sistema óptico de una sola superficie
refractora (córnea), con un índice de refracción equivalente neq , como se
muestra en la fig. 1.22. Los rayos que vienen de puntos objeto muy distantes
se enfocan en un mismo punto en la retina si la forma de la córnea simulada
es elipsoidal, de acuerdo con la eq. (1.15). Algunos modelos simplificados
usan en lugar de un elipsoide una esfera para la córnea. Este cambio es
adecuado si el manojo de rayos que viene de infinito está limitado a una
región muy cercana al eje óptico (en la que podemos modelar una esfera
Óptica geométrica
·
25
por una superficie de segundo orden). Si el manojo de rayos no se limita a
una región pequeña, no se cumplirá el principio de Fermat para todos los
rayos y la imagen ya no será un punto, será una mancha borrosa.
1.3.2. Refracción con superficies esféricas
Aunque con los ovoides cartesianos tenemos sistemas ópticos para formar
imágenes ideales (imágenes puntuales de objetos puntuales), en la mayoría
de sistemas formadores de imagen son poco prácticos, ya que la imagen
ideal se obtiene para una posición fija del objeto. Si cambiamos la posición
del objeto (a lo largo del eje óptico), ya no se formará una imagen puntual.
Por otro lado, las superficies esféricas son fáciles de fabricar y se puede obtener imágenes de gran calidad para diferentes posiciones del objeto mediante la combinación de varias superficies esféricas refractoras y/o limitando la
extensión transversal del manojo de rayos a la región cercana al eje óptico.
Para ver cómo se comportan los rayos en una superficie esférica refractora vamos a calcular la refracción de los rayos de acuerdo al principio de
Fermat con base en la fig. 1.23.
f
q
Q
V
-s
q'
-a
R
P
-l
N
n
l'
C
s'
- f'
P'
n'
Figura 1.23. Geometría para calcular la refracción en una superficie esférica.
En la fig. 1.23, algunas cantidades aparecen con signo negativo. Lo anterior obedece a que la convención de signos que usaremos de aquí en adelante
sigue la convención cartesiana, es decir:
- Las distancias a la izquierda (del vértice o del punto Q) son negativas.
- Las distancias a la derecha (del vértice o del punto Q) son positivas.
- Los ángulos (con respecto al eje óptico o a la normal N) son negativos
si van en la dirección de las manecillas de reloj.
- Los ángulos (con respecto al eje óptico o a la normal N) son positivos
si van en contra de la dirección de las manecillas de reloj.
26
·
Óptica geométrica
- El radio de curvatura de la superficie refractora es negativo si el centro
de curvatura está a la izquierda del vértice.
- El radio de curvatura de la superficie refractora es positivo si el centro
de curvatura está a la derecha del vértice.
- La altura de un punto objeto fuera del eje óptico (distancia desde el
eje óptico) es negativa si el punto está por debajo del eje óptico.
- La altura de un punto objeto fuera del eje óptico (distancia desde el
eje óptico) es positiva si el punto está por encima del eje óptico.
Adicionalmente, se supone que la luz viaja de izquierda a derecha y que
todos los rayos están contenidos en el mismo plano (definido por los puntos
P, Q y P0).
La convención de signos en los sistemas ópticos varía según el autor. En
nuestro caso, la que hemos seleccionado se suele usar en diseño óptico. La
consecuencia de tener diferentes convenciones de signo se manifiesta en el
cambio de algunos signos en las ecuaciones que relacionan las distancias del
objeto y la imagen.
De acuerdo con lo anterior, en la fig. 1.23 todas las distancias y los ángulos se dibujan como positivas. Por ejemplo, P está a la izquierda de V, por
lo tanto s < 0, y en el dibujo ponemos −s. Entonces, la longitud de camino
óptico para el rayo PQP0 será:
LCO = −nl + n 0l 0 .
(1.16)
De los triángulos PQC y P0QC, se tiene que
q
−l = R 2 + (−s + R) 2 − 2R(−s + R) cos(−𝛼)
(1.17)
q
R 2 + (s 0 − R) 2 − 2R(s 0 − R) cos(𝜋 + 𝛼).
(1.18)
y
l0 =
Ya que 𝛼 la única variable en el lado derecho de las eqs. (1.17) y (1.18),
el principio de Fermat para el rayo PQP0 implica que d(LCO)/d𝛼 = 0. Lo
anterior nos lleva a
0=n
de donde
(−s + R)
(s 0 − R)
− n0
,
−l
l0
(1.19)
Óptica geométrica
n 0 n 1 n 0 s 0 ns
− =
−
.
l0
l
R l0
l
·
27
(1.20)
Esta ecuación nos dice a qué distancia de V se encuentra P0 para el rayo
PQP0. Esta es una ecuación con dos incógnitas, s 0 y l 0. Por lo que, para
encontrar la posición de P0, podemos optar por algún método numérico.
Sin embargo, para ver cómo se refracta un manojo de rayos saliendo del
punto P, en lugar de usar la eq. (1.20), vamos a usar el trazo gráfico de rayos
descrito en la sección 1.1.4. Por ejemplo, en la fig. 1.24 se muestra el trazo
de 5 rayos en una superficie esférica Σ de radio R = 41 mm, con n = 1.0 y
n 0 = 1.8. Los rayos emergen de un punto P localizado en s = −149 mm y
llegan a la superficie Σ con incrementos de altura iguales.
C
P
n
n'
S
Figura 1.24. Trazo gráfico de rayos en una superficie esférica. Los rayos refractados no convergen en un mismo punto.
De la fig. 1.24, se observa que los rayos refractados no convergen en
un único punto en el eje óptico. Ya que este defecto aparece al usar una
superficie esférica en lugar de un ovoide cartesiano, se dice que la imagen
está afectada por aberración esférica. También se observa que los rayos que
viajan más cerca del eje óptico se separan menos entre sí al llegar al eje
óptico que los rayos que viajan más lejos. Lo anterior sugiere que se puede
tener imágenes aceptables si limitamos la región en la que inciden los rayos
a una zona circular muy próxima al eje óptico. Esto significa que para un
punto objeto en el eje óptico los rayos incidentes que vamos a considerar
serán aquellos que viajen casi paralelos al eje óptico, tal y como se muestra
en la fig. 1.25.
A lo anterior se le llama aproximación paraxial y, en consecuencia, en la
eq. (1.20), se tiene que l ≈ s y l 0 ≈ s 0, por lo tanto,
n 0 n (n 0 − n)
− =
s0
s
R
(1.21)
28
·
Óptica geométrica
es la ecuación que describe la formación de imagen por una superficie esférica en la aproximación paraxial. Esta ecuación se denomina ecuación de
Gauss.
C
P
n
P'
n'
S
Figura 1.25. En la aproximación paraxial los rayos incidentes que emergen de P
están muy cercanos al eje óptico. Los rayos refractados convergen en un punto, P0.
1.3.3. Puntos y distancias focales
Una superficie esférica refractora se dice convexa si el radio de curvatura es
positivo y se dice cóncava si el radio de curvatura es negativo. Para ambas
superficies, vamos a ver lo que ocurre para un manojo de rayos paralelos
incidentes o refractados con n 0 > n. Supongamos que un manojo de rayos
paralelos y paraxiales inciden en una superficie esférica convexa, es decir,
el objeto puntual está localizado en s = −∞. Por lo tanto, de la eq. (1.21),
se tiene que s 0 es una constante que depende solo de los parámetros de la
superficie refractora. Esta distancia se denomina distancia focal secundaria
f 0 y está dada por
1
(n 0 − n) 1
.
(1.22)
=
f0
n0 R
Entonces, s 0 = f 0 es la distancia (a la derecha del vértice) en la que todos
los rayos convergen. El punto donde convergen se denomina punto focal
secundario F0. Esto se ilustra en la fig. 1.26(a).
Ahora, ¿dónde se debe colocar un objeto puntual para que los rayos refractados emerjan paralelos? Lo anterior implica que s 0 = ∞. Por lo tanto,
en la eq. (1.21) se tiene que s también es una constante que depende solo de los parámetros de la superficie refractora. Esta distancia se denomina
distancia focal primaria f y está dada por
1 (n 0 − n) 1
=
.
f
n
R
.
(1.23)
Óptica geométrica
·
29
Entonces, s = − f es la distancia (a la izquierda del vértice) en la que se
debe colocar un objeto puntual de manera que su imagen esté en el infinito. El punto en el que se coloca el objeto puntual se denomina punto focal
primario F. Esto se ilustra en la fig. 1.26(b).
n
n'
R
C
F'
f'
(a)
n
n'
R
C
F
f
(b)
Figura 1.26. Distancias y puntos focales en una superficie esférica refractora convexa para n 0 > n. (a) F0: punto focal secundario; (b) F: punto focal primario.
En las figs. 1.26(a) y 1.26(b), se incluye una línea ortogonal (segmentada) que pasa por el vértice de la superficie refractora. Note que los rayos
incidentes se refractan en esta línea y no en la superficie (como debería ser).
Lo anterior resulta de la aproximación paraxial y nos recuerda que en la
práctica los rayos viajan muy cerca del eje óptico. Sin embargo, con el fin
de ilustrar el trazo de rayos para localizar la imagen, se dibujan rayos lejos
del eje óptico.
En el caso de una superficie cóncava, las distancias focales y puntos focales se muestran en la fig. 1.27. Las distancias focales están dadas por las
eqs. (1.22) y (1.23), pero ahora R < 0 y, por lo tanto, f 0 < 0 y f < 0.
Cuando s = −∞, los rayos refractados divergen como si provinieran de un
punto F0 localizado en s 0 = − | f 0 |, como se muestra en la fig. 1.27(a). En este
caso, diremos que se tiene una imagen virtual en F0 (punto focal secundario).
Cuando s 0 = ∞, los rayos incidentes deben converger en un punto F localizado en s = | f |, como se muestra en la fig. 1.27(b). En este caso diremos
que se tiene un objeto virtual en F (punto focal primario).
30
·
Óptica geométrica
n
n'
R
C
F'
f'
(a)
n
n'
R
C
F
f
(b)
Figura 1.27. Distancias y puntos focales en una superficie esférica refractora cóncava para n 0 > n. (a) F0: punto focal secundario; (b) F: punto focal primario.
1.3.4. Planos focales
En la fig. 1.26(a), tenemos que rayos paralelos al eje óptico, limitados a la
región paraxial, se enfocan en el punto focal secundario. Estos rayos provienen de un objeto puntual (en infinito) que está en el eje óptico. Si ahora
consideramos otro objeto puntal fuera de este eje óptico (también en el infinito), tendremos rayos paralelos que llegan a la superficie refractora con
cierta inclinación. Estos rayos convergen en un punto que está a la distancia
focal f 0 de la superficie a lo largo de la línea inclinada que pasa por el centro de curvatura. Esto se muestra en la fig.1.28. La refracción de los rayos
paralelos inclinados se puede entender fácilmente si desde el objeto puntual
fuera de eje se traza un eje óptico auxiliar. Con respecto a este eje óptico la
situación resulta equivalente al objeto puntual en eje.
El resultado de considerar la refracción de manojos de rayos paralelos
con diferentes inclinaciones es una superficie (esférica) en la que se enfocan
los rayos. Esta superficie se denomina superficie focal. La consideración paraxial implica que las inclinaciones de los manojos también sea para ángulos
pequeños. En ese caso, los manojos de rayos se enfocarán en una región de
la superficie focal que se puede aproximar por un plano. Este será el plano
focal (fig. 1.28).
Óptica geométrica
·
31
De acuerdo con lo anterior, podemos decir que en la aproximación paraxial los planos focales se definen como planos perpendiculares al eje óptico
y contienen los puntos focales. En consecuencia, tendremos planos focales
primarios y secundarios para cada una de las superficies refractoras.
Superficie
focal
Plano
focal
R
C
n
n'
f'
Figura 1.28. Superficie focal. En la aproximación paraxial, la superficie se puede
describir por un plano en el que convergen los manojos de rayos inclinados.
Generalizando, en la aproximación paraxial para n < n 0, se tiene que:
- Un manojo de rayos paralelos inclinados que incide en una superficie esférica refractora convexa converge en un punto localizado en el
plano focal secundario. Y para un objeto puntual localizado en cualquier lugar en el plano focal primario, los rayos se refractan en un
manojo de rayos paralelos inclinados.
- Un manojo de rayos paralelos inclinados que incide en una superficie esférica refractora cóncava diverge de un punto localizado en el
plano focal secundario. Y para un objeto puntual virtual localizado en
cualquier lugar en el plano focal primario, los rayos se refractan en un
manojo de rayos paralelos inclinados.
En ambos casos, la inclinación del manojo de rayos paralelos está dada por
el rayo que no se desvía y que pasa por el centro de curvatura C. Este rayo
se localiza en el eje óptico auxiliar (Fig. 1.28).
Ejemplo: la esfera refractora
Como una aplicación de un sistema que contiene dos superficies esféricas:
convexa y cóncava, vamos a considerar la imagen que genera una esfera de
radio R0 e índice n 0 = 3/2 de un objeto puntual en el infinito. La refracción
de los rayos tendrá lugar en dos superficies, denotadas 1 y 2 en la fig. 1.29.
La primera superficie de radio R = R0 y la segunda de radio R = −R0 , separada una distancia 2R0 de la primera. Con respecto a la primera superficie
32
·
Óptica geométrica
tenemos s1 = −∞. Por lo tanto, s10 = f10 = 3R0 . Con respecto a la segunda
superficie, se tiene un objeto virtual en s2 = 3R0 − 2R0 = R0 y, por lo tanto,
la imagen estará en s20 = R0 /2. Entonces, el objeto virtual para la segunda
superficie es generado por la primera superficie.
n' = 3/ 2
n=1
1
2
R0
n=1
F'1
C
s'2 = R 0 / 2
s'1 = f '1= 3R 0
s2 = R 0
Figura 1.29. La esfera refractora de índice n 0 = 3/2 genera la imagen de un objeto
en s = −∞ a la distancia R0 /2 desde la segunda cara.
Note que si lo que se quiere es que la imagen esté justo en el vértice de la
segunda superficie, es decir, en s10 = 2R0 , cuando s1 = −∞, de la eq. (1.21),
se tiene que el índice de refracción de la esfera debería ser n 0 = 2. En cierto
modo, esto explica por qué el ojo humano no es completamente esférico,
pues con un índice de refracción equivalente neq = 4/3 todos seríamos hipermétropes. En lugar de esto, la cara anterior de la córnea tiene un radio
menor que el globo ocular, de modo que refracta la luz para que llegue justo a la retina (vértice de la segunda superficie), tal y como se ilustra en el
modelo de ojo reducido de la fig. 1.22.
1.3.5. La imagen paraxial de objetos extendidos
Hasta ahora solo hemos considerado objetos puntuales. Si el objeto no es
puntual, diremos que es un objeto extendido y su tamaño lo describiremos
mediante una flecha de cierta altura medida desde el eje óptico. Todos los
rayos que salen del objeto estarán contenidos en un plano que incluye al
eje óptico. Este plano se denomina plano meridional. Con ayuda de los rayos
paralelos trazados en la sección 1.3.3, podemos encontrar gráficamente la
posición y el tamaño de la imagen. Para esto, consideremos la fig. 1.30,
en la que se muestra la refracción en los casos: (a) superficie convexa y (b)
superficie cóncava. En ambos casos, vamos a colocar un objeto de altura h a
una distancia −s del vértice.
Óptica geométrica
·
33
En el primer caso, se traza un rayo que sale del extremo del objeto y
viaja paralelo al eje óptico. Este rayo se refracta dirigiéndose al punto focal
secundario. Luego, se traza otro rayo que sale del extremo del objeto pasando por el punto focal primario y se refracta viajando paralelo al eje óptico.
Los dos rayos refractados se intersecan en un punto que define el extremo
de la imagen. Por lo tanto, se tiene el tamaño de la imagen y la proyección
de este punto en el eje óptico ubica la imagen, es decir, −h 0 y s 0, respectivamente. Un tercer rayo que se puede trazar del extremo del objeto es el rayo
que pasa por el centro de curvatura de la superficie. Este rayo no se desvía
al atravesar la superficie refractora, ya que el ángulo de incidencia es cero.
Por supuesto, este rayo también llegará al punto en que se intersecan los dos
primeros rayos.
-s
s'
h
F'
C
O
I
- h'
F
n
n'
(a)
-s
- s'
h
O
F'
I
C
F
h'
n
n'
(b)
Figura 1.30. Trazo de rayos para localizar y determinar el tamaño de la imagen
en superficies esféricas refractoras con n 0 > n: (a) convexa, R > 0; (b) cóncava,
R < 0.
En el segundo caso, se traza un rayo que sale del extremo del objeto y
viaja paralelo al eje óptico. Este rayo se refracta divergiendo del punto focal secundario. Luego, se traza otro rayo que sale del extremo del objeto
pasando por el centro de curvatura de la superficie refractora. Al igual que
en el caso anterior, este rayo no se desvía al atravesar la superficie refractora, ya que el ángulo de incidencia es cero. Los dos rayos refractados son
divergentes, por lo que no se intersecan (no se tiene una imagen real). Sin
embargo, los dos rayos refractados parecen emerger de un punto común
detrás de la superficie refractora. Este punto es el extremo de la imagen virtual y su proyección en el eje óptico ubica la imagen. Nuevamente, tenemos
34
·
Óptica geométrica
el tamaño y la posición de la imagen, es decir, h 0 y −s 0, respectivamente. Un
tercer rayo que se puede trazar sale del extremo del objeto dirigido al punto
focal primario (que está a la derecha de la superficie) y al llegar a la superficie se refracta en dirección paralela al eje óptico. Este rayo también parece
emerger del extremo de la imagen virtual.
El aumento de la imagen es la relación entre el tamaño de la imagen y
el tamaño del objeto, es decir, m = h 0/h. Si es negativo la imagen estará
invertida, como en el caso (a); si es positivo, la imagen estará derecha, como
en el caso (b). Por otro lado, si |m| > 1, la imagen será de mayor tamaño;
si |m| < 1 la imagen será de menor tamaño, en comparación con el tamaño
del objeto. Teniendo en cuenta la geometría de la fig. 1.30(a), se tiene que
el aumento está dado por
R − s0
m=
.
(1.24)
R−s
Esta relación también es válida para el caso de la fig. 1.30(b) teniendo en
cuenta que ahora R < 0.
1.3.6. Potencia y vergencias
Otra manera útil de interpretar la eq. (1.21) es analizando el cambio de
curvatura del frente de onda refractado con respecto al frente de onda incidente por medio de la potencia refractiva de la superficie esférica refractora,
la cual se define como
(n 0 − n)
P=
.
(1.25)
R
La unidad de la potencia es la dioptría (D) y se define como 1 D = 1/m. Ya
que estamos en la aproximación paraxial, los frentes de onda que emergen
del objeto puntual y que convergen en la imagen puntual son esféricos. En
particular, la curvatura del frente de onda incidente en el vértice de la superficie será 1/s y la curvatura del frente de onda refractado desde el vértice
será 1/s 0. Estas curvaturas multiplicadas por los índices de refracción correspondientes se denominan vergencias, U y V , respectivamente. La unidad de
las vergencias también es la dioptría. En términos de estas cantidades, la eq.
(1.21) se transforma en
V − U = P.
(1.26)
Esta relación de vergencias y potencia es muy útil en optometría, y se suele
usar como
U +P =V.
(1.27)
Así, la curvatura U /n del frente de onda del objeto es modificada por la
potencia P de la superficie refractora, dando como resultado la curvatura
Óptica geométrica
·
35
V /n 0 del frente de onda de la imagen. Por otro lado, teniendo en cuenta
la convención de signos, un frente de onda divergente tiene una curvatura
negativa, mientras que un frente de onda convergente tendrá una curvatura
positiva. También se tiene que un frente de onda esférico divergente corresponde a un objeto real o a una imagen virtual, mientras que un frente
de onda esférico convergente corresponde a una imagen real o a un objeto
virtual.
En un sistema de varias superficies refractoras, la potencia de la j-ésima
superficie es
n 0j − n j
Pj =
,
(1.28)
Rj
donde n 0j , n j y R j son el índice de refracción a la derecha, el índice de refracción a la izquierda y el radio de curvatura de la j-ésima superficie, respectivamente.
36
·
Óptica geométrica
1.4. Superficies reflectoras
Una interfase que separa dos medios además de refractar la luz también
puede reflejarla. Si la superficie es lisa (un espejo), la reflexión será especular;
si es rugosa, la reflexión será difusa. En esta unidad nos ocuparemos de
la reflexión especular, la cual también se puede describir mediante rayos
luminosos y, por supuesto, cumple con el principio de Fermat, como ya
lo mencionamos en la unidad 1.2. En la fig. 1.13, describimos la reflexión
en un espejo plano y concluimos que al aplicar el principio de Fermat a la
Fig 1.13(a) se obtenía una ecuación igual a la eq. (1.8) si n 0 = n. Teniendo
en cuenta la convención de signos introducida en la sección 1.3.2, se tiene
que la reflexión en espejos planos y esféricos se puede describir a partir de
las ecuaciones que hemos obtenido para la refracción en interfases planas y
esféricas reemplazando n 0 = −n. Aún más, vamos a limitar el tratamiento
a espejos sumergidos en aire, es decir, n = 1 y, por lo tanto, n 0 = −1. Con
esto en mente, la eq. (1.2) se transforman en
𝜃 0 = −𝜃 .
(1.29)
En la fig. 1.31, se ilustra la reflexión de un rayo en: (a) una superficie plana
y (b) una superficie curva. En cualquier caso, el ángulo del rayo incidente
se mide con respecto a la línea normal N de la superficie en el punto donde
incide el rayo. Con respecto a esta normal también se mide el ángulo de
reflexión. El rayo incidente, el rayo reflejado y la normal están contenidos
en un plano denominado plano de incidencia.
N
q
N
q'. = - q
q
q' .= - q
n=1
n=1
n' = -1
n' = -1
( a)
(b)
Figura 1.31. Reflexión en una superficie lisa. (a) Espejo plano y (b) superficie
curva. El ángulo de reflexión es igual a menos el ángulo de incidencia.
Entonces, la ley de la reflexión se puede enunciar como sigue:
el haz reflejado forma un ángulo con la normal de igual valor
que el ángulo del rayo incidente con la normal. Los dos rayos y
la normal están contenidos en un mismo plano.
Óptica geométrica
·
37
Por otro lado, la eq. (1.21) se transforma en
1 1 2
+ =
s0 s R
(1.30)
para los espejos esféricos. De acuerdo a la convención de signos de la sección
1.3.2, aquí tenemos que R > 0 si el centro de curvatura está a la derecha
del vértice del espejo y R < 0 si el centro de curvatura está a la izquierda del
vértice del espejo. En el primer caso, diremos que el espejo es convexo; en
el segundo, cóncavo. Las distancias s y s 0 se miden con respecto al vértice
del espejo.
1.4.1. Trazo de rayos en espejos esféricos
En los espejos esféricos se suele trazar dos rayos incidentes: un rayo paralelo
al eje óptico y un rayo dirigido al vértice del espejo, como se muestra en la
fig. 1.32.
C
F
V
C
F
V
(a) R < 0
V
F
C
V
F
C
(b) R > 0
Figura 1.32. Rayos en espejos esféricos en la aproximación paraxial: (a) espejo
cóncavo, (b) espejo convexo.
Para el primer rayo, se tiene que s = −∞, es decir, s 0 = R/2. Por lo tanto,
si R < 0, un manojo de rayos paralelos al eje óptico se refleja convergiendo
en un punto localizado a la izquierda del vértice V a la distancia s 0 = f =
− |R| /2. Este punto se denomina punto focal F del espejo y será la imagen
de un objeto puntual localizado en el infinito. Si R > 0, un manojo de
rayos paralelos al eje óptico se refleja divergiendo de un punto localizado a
la derecha del vértice a la distancia s 0 = f = R/2. Ahora el punto focal F es
38
·
Óptica geométrica
virtual y la imagen de un objeto puntual localizado en el infinito será una
imagen puntual virtual en F. En superficies esféricas, la normal en el punto
de incidencia es una línea radial con origen en el centro de curvatura C.
Para el segundo rayo, la situación es muy sencilla. En el vértice la normal de la superficie coincide con el eje óptico, así que para ambos espejos
(cóncavo y convexo) el rayo se refleja hacia la izquierda y hacia abajo.
El trazo de estos dos rayos se muestra en la fig. 1.32(a) para el espejo
cóncavo y en la fig. 1.32(b) para el espejo convexo.
Con estos dos rayos, podemos localizar la imagen generada por los espejos. En la fig. 1.33, se muestra la formación de imagen en 4 situaciones para
un espejo cóncavo. En (a), (b) y (c), la imagen es real e invertida, pasando de
menor a mayor tamaño que el objeto. En particular, en (b), s = R y s 0 = R,
y la imagen es del mismo tamaño. En (d) la imagen es virtual, derecha y de
mayor tamaño.
O
O
h
O
h
C
F
h'
V
h
C
h'
I
F
V
C
F
V
h'
I
(a)
(b)
I
(c)
I
O
h'
h
C
F
V
(d)
Figura 1.33. Formación de la imagen en espejos esféricos cóncavos: (a) imagen
real, invertida y de menor tamaño que el objeto; (b) imagen real, invertida y de
igual tamaño que el objeto; (c) imagen real, invertida y de mayor tamaño que el
objeto; (b) imagen virtual, derecha y de igual tamaño que el objeto.
El aumento de la imagen m = h 0/h se puede obtener considerando el rayo
que va al vértice del espejo. Con respecto a este rayo tenemos dos triángulos
semejantes que satisfacen la relación h/(−s) = (−h 0)/(−s 0). Por lo tanto, el
aumento será
s0
m=− .
(1.31)
s
Óptica geométrica
·
39
Así, en el caso (b), el aumento resulta ser m = −1. El signo (−) indica que la
imagen está invertida.
O
h
I
V
h'
F
C
Figura 1.34. Formación de imagen en un espejo convexo. Siempre es virtual,
derecha y de menor tamaño, y su posición aparente es entre el vértice y el punto
focal F.
En la fig. 1.34, se muestra la formación de imagen en un espejo convexo.
Para cualquier posición del objeto, la imagen es virtual, derecha y de menor
tamaño que el objeto. La imagen parece estar detrás del espejo. El aumento
de la imagen también se calcula con la eq. (1.31).
1.4.2. El espejo parabólico
El trazo de rayos que hemos hecho para los espejos esféricos está limitado a la región paraxial. Para el caso general (no paraxial), consideremos la
formación de la imagen mediante un espejo esférico cóncavo de un objeto
puntual en el eje óptico localizado en el infinito. Lo anterior implica que
al espejo llega un manojo de rayos paralelos. En la aproximación paraxial,
el manojo converge al punto focal, fig. 1.32(a). Sin embargo, si aplicamos
la ley de Snell para cada uno de los rayos del manojo, la reflexión de los
rayos ocurre como se muestra en la fig. 1.35. Al igual que en las superficies
esféricas refractoras, a esto se le llama aberración esférica.
Lo anterior se puede verificar fácilmente con ayuda de la fig. 1.36. Un
rayo paralelo al eje óptico incide en Q, luego se refleja pasando por el punto
X en el eje óptico. El triángulo CXQ es isósceles, de modo que se establece
la siguiente relación
CX + QX > R,
(1.32)
siempre y cuando Q no coincida con V. Además, CX = QX, por lo tanto,
CX >
R
,
2
(1.33)
40
·
Óptica geométrica
mientras que el punto focal F está a R/2 de C. Esto implica que los rayos que
inciden paralelos al eje óptico no convergen en F. A medida que aumenta
el ángulo 𝜃 más cerca del vértice cruza el rayo reflejado.
Figura 1.35. Los rayos paralelos en un espejo esférico cóncavo no convergen en
un mismo punto.
q
R
C
q
F
q
Q
X
V
Figura 1.36. En un espejo esférico cóncavo los rayos no paraxiales cruzan el eje
óptico en un punto distinto al punto focal. A medida que aumenta el ángulo 𝜃 más
cerca del vértice cruza el rayo reflejado.
Entonces, ¿qué forma debe tener el espejo cóncavo para enfocar los rayos
paralelos al eje óptico en un solo punto? La respuesta nuevamente la da el
principio de Fermat. En la fig. 1.37, se muestra la geometría para aplicar el
principio de Fermat, que en este caso es
LCO = a + 𝜌 cos 𝜃 + 𝜌.
(1.34)
Todos los rayos desde la línea ortogonal que pasa por P deben tener la misma LCO para llegar a F. Definiendo una nueva constante p = LCO − a, se
tiene que
𝜌(1 + cos 𝜃) = p.
(1.35)
Óptica geométrica
·
41
a
P
Q
r
F
q
V
n=1
Figura 1.37. Un espejo parabólico enfoca los rayos paralelos que vienen del infinto
en el punto focal.
Esta es la ecuación de una parábola. Entonces, la forma del espejo que
buscamos es un paraboloide de revolución. Note que la eq. (1.35) también
se puede obtener si cambiamos n 0 = −n = −1 en la eq. (1.15).
En coordenadas cartesianas, el perfil del paraboloide se puede escribir
como
y2
z=
,
(1.36)
2Rv
donde z es la coordenada a lo largo del eje óptico, y es la coordenada meridional y Rv es el radio de curvatura de la parábola en el vértice. Entonces, el
punto focal del espejo se localiza a la distancia Rv /2 del vértice V (fig. 1.37).
·
42
Óptica geométrica
1.5. Lentes: aproximación lentes delgadas
Cuando se quiere formar la imagen en un medio diferente al de la superficie esférica refractora discutida en la sección 1.3.2, se debe incluir otra
superficie refractora. En esta unidad trataremos con elementos refractores
limitados por dos superficies esféricas con un eje óptico en común. Este tipo
de elementos de denominan lentes.
Para obtener la posición de la imagen de un objeto puntual, se debe emplear la eq. (1.21) para cada una de las caras. La ecuación de Gauss para la
superficie 1 será
n10 − n1
n1
−
=
s10
s1
R1
n10
(1.37)
y para la superficie 2 será
n20
s20
−
n2
=
s2
n20 − n2
R2
.
(1.38)
Limitándonos a una lente de índice nl sumergida en un solo medio de
índice n, como en la fig. 1.38, entonces n1 = n20 = n y n10 = n2 = nl . Al
sumar las eqs. (1.37) y (1.38) se llega a
(nl − n) 1
1
1
1
n
n
− =
−
+ l − 0l
(1.39)
0
s2 s1
n
R1 R2
s2 s1
- s1
1
O
n
s'2
2
nl
t
s'1
n
O'
I
s2
Figura 1.38. Localización de la imagen en una lente positiva.
El espesor de la lente t es la distancia entre los vértices y está relacionado
con las distancias s10 y s2 mediante t = s10 −s2 . Si t s10 y t s2 tal que s10 ≈ s2 ,
entonces el segundo sumando de la derecha en la eq. (1.39) se aproxima a
cero. Esta aproximación implica que se desprecia el espesor de la lente en
comparación con los radios de curvatura de las dos superficies, y se conoce
Óptica geométrica
·
43
como aproximación de lente delgada. Definiendo la distancia objeto como
so = s1 y la distancia imagen como si = s20 , la eq. (1.39) se reduce a
1 1 (nl − n) 1
1
− =
,
(1.40)
−
si so
n
R1 R2
que se conoce como ecuación de la lente delgada.
El lado derecho de la eq. (1.40) es una constante que solo depende de
los parámetros de la lente. Esta distancia se denomina distancia focal f de la
lente y está dada por
1 (nl − n) 1
1
=
−
.
(1.41)
f
n
R1 R2
Con la definición de la distancia focal, llegamos a la ecuación de Gauss para
las lentes
1 1 1
− = .
(1.42)
si so
f
f >0
f <0
Figura 1.39. Lentes positivas y negativas sumergidas en aire (n = 1).
La distancia focal es un parámetro que identifica la lente. El signo de la
distancia focal depende de los valores de los índices de refracción n y nl y
de los radios de curvatura R1 y R2 . Ya que en la práctica la mayoría de las
lentes se usan en el aire, en lo que sigue tomaremos n = 1, y la distancia
focal de la lente delgada estará definida por
1
1
1
= (nl − 1)
−
.
(1.43)
f
R1 R2
Teniendo en cuenta lo anterior, en la fig. 1.39 se muestra las formas generales de las lentes positivas y negativas. Note que como regla se puede
decir que una lente es positiva si el borde es menor que el espesor y que es
negativa si el borde es mayor que el espesor.
44
·
Óptica geométrica
1.5.1. Trazo de rayos en lentes delgadas
En la sección 1.3.3, definimos los puntos focales para las superficies esféricas refractoras como los puntos localizados a las distancias f 0 y f del vértice
de la superficie. Para las lentes delgadas, las superficies 1 y 2 de la fig. 1.38
se juntan en un plano ortogonal al eje óptico. Desde ese plano se miden las
distancias. Así, para una lente positiva, un manojo de rayos provenientes de
un objeto puntual en el infinito, so = −∞, se refracta convergiendo en una
imagen puntual a la distancia si = f . El punto donde convergen los rayos se
denomina punto focal secundario. Por otro lado, si ubicamos un objeto puntual en so = −f , los rayos refractados son paralelos al eje óptico. El punto
donde se coloca el objeto es el punto focal primario. Para una lente negativa, la situación es análoga, un manojo de rayos provenientes de un objeto
puntual en el infinito se refracta como si los rayos divergieran de un punto
localizado en si = − | f | (foco secundario). Y, para un objeto virtual localizado en so = | f | (foco primario), los rayos refractados son paralelos al eje
óptico. En la fig. 1.40, se muestra la distancia focal y los puntos focales en
las lentes delgadas. Las lentes positivas se representan con una línea y un
par de flechas apuntando hacia afuera. Las lentes negativas se representan
con una línea y un par de flechas apuntando hacia adentro.
f
f >0
F'
-f
f <0
f
F'
F
-f
F
Figura 1.40. Puntos focales y distancias focales en las lentes delgadas.
A partir del trazo de los rayos mostrados en la fig. 1.40, podemos obtener
la posición y el tamaño de la imagen de un objeto extendido. Consideremos
un objeto de altura ho a la distancia −so como se muestra en la fig. 1.41. Entonces, para encontrar la imagen trazamos desde el extremo del objeto un
rayo paralelo al eje óptico y un rayo que pasa por el punto focal primario. Al
Óptica geométrica
·
45
refractarse en la lente delgada, el primer rayo pasa por el punto focal secundario y el segundo rayo viaja paralelo al eje óptico. La intersección de los
dos rayos refractados determina el tamaño de la imagen −hi y la proyección
de la intersección sobre el eje óptico determina la distancia imagen si .
- so
si
ho
O
F'
F
- xo
f
f
I
- hi
xi
Figura 1.41. Trazo de rayos para localizar la imagen en la lente delgada positiva.
- so
ho
O
si
F'
I
h'
xi
-f
-f
F
- xo
Figura 1.42. Trazo de rayos para localizar la imagen en la lente delgada negativa.
En general, cualquier rayo que sale del extremo del objeto y que pase
por la lente se refractará de tal forma que llegue al extremo de la imagen.
En particular, en la fig. 1.41, se tiene un tercer rayo que va del extremo
del objeto al extremo de la imagen pasando por el centro de la lente sin
desviarse. Teniendo en cuenta este rayo, de la geometría de la figura se tiene
que el aumento de la imagen está dado por
m=
hi
si
= .
ho so
(1.44)
46
·
Óptica geométrica
Para una lente delgada negativa, el trazo de rayos se muestra en la fig.
1.42. El aumento de la imagen está dado nuevamente por la eq. (1.44).
1.5.2. Ecuación de Newton
En las figs. 1.41 y 1.42, se ha incluido dos cantidades nuevas, xo y xi . Estas cantidades se definen de la siguiente manera: xo es la distancia medida
desde el punto focal primario al objeto y xi es la distancia medida desde el
punto focal secundario a la imagen. Para estas cantidades también aplica la
convención de signos definida en la sección 1.3.2. Así, xo < 0 si el objeto
está a la izquierda de F y xo > 0 si el objeto está a la derecha de F. Y xi < 0
si la imagen está a la izquierda de F0 y xi > 0 si la imagen está a la derecha
de F0.
Siguiendo la geometría de la fig. 1.41, se tiene que
ho
−hi
=
−xo
f
(1.45)
y
−hi ho
= .
xi
f
Igualando hi /ho en ambas ecuaciones, se llega a
xo xi = −f 2 .
(1.46)
(1.47)
Esta es la ecuación de Newton para las lentes delgadas, tanto positivas como
negativas. Por otro lado, el cociente hi /ho es el aumento de la imagen. Entonces tenemos otras dos expresiones para el aumento dadas por
m=
f
xo
y
(1.48)
xi
.
(1.49)
f
Las distancias en la formulación de Gauss se relacionan con las distancias
en la formulación de Newton como so = xo − f y si = xi + f . La ecuación de
Newton resulta ventajosa en algunos casos en comparación con la de Gauss.
Por ejemplo, supongamos que se nos plantea la siguiente situación: dada
una lente positiva de distancia focal f , ¿dónde se debe colocar el objeto para
que la imagen tenga un aumento m = −2? De acuerdo con la formulación de
Gauss el aumento es m = si /so . Pero no se conoce ninguna de las distancias,
por lo que también tendríamos que usar la eq. 1.42, es decir, es un problema
de dos ecuaciones con dos incógnitas. Por otro lado, con la formulación de
Newton el aumento es m = f /xo , de donde se obtiene directamente que la
posición del objeto debe ser xo = −f /2 (so = −3f /2).
m=−
Óptica geométrica
·
47
1.5.3. Dominio de las imágenes real y virtual
Vamos a explorar los rangos para los cuales se tienen imágenes reales y virtuales en las lentes positivas y negativas.
a
b
c
d
f
-
- 3f
- 2f
2f
3f
a'
-f
b'
c'
e'
d'
e
f
-
- 3f
- 2f
2f
3f
-f
Figura 1.43. Rangos en los que se obtienen imágenes reales y virtuales con una
lente positiva. En la figura de arriba, para el objeto en el rango {−∞, −2f } a la
izquierda, la lente forma una imagen invertida, real y de menor tamaño que el
objeto en el rango { f , 2f } a la derecha; para el objeto en el rango {−2f , − f } a
la izquierda, la lente forma una imagen invertida, real y de mayor tamaño que
el objeto en el rango {2f , ∞} a la derecha. En la figura de abajo, para el objeto
en el rango {−f , 0} a la izquierda, la lente forma una imagen derecha, virtual y
de mayor tamaño que el objeto en el rango {−∞, 0} a la izquierda. Aquí la lente
funciona como lupa.
Para la lente positiva, en la fig. 1.43, se han seleccionado 5 posiciones
para el objeto, etiquetadas como a, b, c, d y e.
- La posición a corresponde con el objeto en el infinito (xo = −∞), por
lo que su imagen a0 estará en el punto focal secundario (xi = 0), y el
aumento será m = 0.
- La posición c corresponde con xo = −f , por lo que la imagen c0 está
en xi = f con aumento m = −1. Esta es la configuración en que la
imagen tiene el mismo tamaño que el objeto.
- Para la posición intermedia b entre a y c, con xo = −3f /2, la imagen
b0 estará en xi = 2f /3 con aumento = −2/3. Aquí la imagen es de
menor tamaño que el objeto.
- El objeto en d está a la distancia xo = −f /2, por lo que su imagen d 0
está en xi = 2f con aumento m = −2.
- Si se mueve el objeto acercándolo al punto focal primario, la imagen
se aleja aún más, aumentando su tamaño. Cuando el objeto se localiza
48
·
Óptica geométrica
en xo = 0 (punto focal primario), la imagen estará en xi = ∞ con
aumento m = −∞.
- Por último, en e el objeto está en una posición intermedia entre el
punto focal primario y la lente, xo = f /2. Los rayos refractados divergen, por lo que se tendrá una imagen e0 virtual en xi = −2f (si = −f )
con aumento m = 2. La imagen virtual es derecha, del doble del tamaño de objeto y está detrás del objeto.
Resumiendo, para objetos localizados en el rango −∞ ≤ so ≤ −2f , la
imagen estará localizada en el rango f ≤ si ≤ 2f , de menor tamaño que el
objeto, real e invertida; para objetos en el rango −2f ≤ so ≤ − f , la imagen
estará localizada en el rango 2f ≤ si ≤ ∞, de mayor tamaño que el objeto,
real e invertida; para objetos en el rango −f ≤ so ≤ 0, la imagen estará
localizada en el rango −∞ < si ≤ 0, de mayor tamaño que el objeto, virtual y
derecha. Esta última configuración corresponde con el uso de la lente como
una lupa.
o
o'
-
-3 f
-2 f
f
2f
3f
-f
Figura 1.44. Una lente negativa forma imágenes virtuales, derechas y de menor
tamaño que el objeto, entre el objeto y la lente.
En el caso de la lente negativa (f < 0) solo se tiene una configuración
para un objeto real. El rango en el que está el objeto es −∞ ≤ xo ≤ − | f | , lo
que equivale a −∞ ≤ so ≤ 0, ya que xo se mide desde el punto focal primario,
que en la lente negativa está a la derecha. Entonces, para cualquier distancia
xo = −𝛼 | f |, donde 𝛼 > 1, la imagen siempre estará a la derecha del punto
focal secundario en xi = | f | /𝛼 y a la izquierda de la lente, es decir, el rango
de la imagen es − | f | ≤ si ≤ 0 con aumento m = 1/𝛼. En la fig. 1.44, se
muestra el rango del objeto y el rango de la imagen. La imagen siempre es
de menor tamaño que el objeto.
1.5.4. Planos focales en lentes delgadas
De manera similar a como se hizo en la sección 1.3.4, definiremos los planos focales en las lentes delgadas como planos perpendiculares al eje óptico
que contienen a los puntos focales. Un manojo de rayos paralelos incidente
Óptica geométrica
·
49
con cualquier inclinación (dentro de la aproximación paraxial) se refracta
en las lentes positivas convergiendo en un punto localizado en el plano focal secundario, y se refracta en las lentes negativas divergiendo desde un
punto localizado en plano focal secundario. En otro caso, tendremos en la
refracción un manojo de rayos paralelos e inclinados: para la lente positiva,
cuando se coloque un objeto puntual en el plano focal primario; para la lente negativa, cuando se coloque un objeto virtual en el plano focal primario,
tal y como se muestra en la fig. 1.45. En cualquier caso, el rayo que pasa
por el centro de la lente no se desvía al refractarse.
Plano
focal
f
Plano
focal
f
Plano
focal
Plano
focal
-f
-f
Figura 1.45. Planos focales en las lentes positivas y negativas.
1.5.5. Trazo de rayos oblicuos
Denominamos rayos oblicuos a aquellos rayos que salen del extremo del
objeto y no viajan en dirección paralela al eje óptico. En particular, vamos
a tratar con los rayos oblicuos que se mantienen en el plano meridional.
Ya hemos tratado con algunos de ellos, por ejemplo, el rayo que se dirige
al centro de la lente y el rayo que se dirige al punto focal primario. Sin
embargo, en esta sección nos interesa tratar con los rayos oblicuos que se
dirigen en cualquier otra dirección. Lo anterior puede ocurrir en el trazo
de rayos en una combinación de dos a más lentes.
Por ejemplo, en la fig. 1.46 el rayo refractado por la lente L1 se dirige
al punto focal secundario de L1 . Al llegar a la lente L2 , ¿cómo se refracta
50
·
Óptica geométrica
el rayo? Con el trazo de rayos de la fig. 1.40 no tenemos la solución. Sin
embargo, el trazo de rayos de la fig. 1.45 sí nos da la pista de cómo determinar gráficamente la refracción generada por la lente L2 . Si suponemos
que el rayo oblicuo que llega a la lente L2 hace parte de un manojo de rayos
paralelos, como se ilustra en la fig. 1.47(a), de acuerdo con la fig. 1.45, estos
se refractarán divergiendo de un punto localizado en el plano focal secundario. Este punto está determinado por la intersección del rayo que va por
el centro de la lente (rayo auxiliar) y el plano focal secundario. Con esto en
mente, podemos determinar la dirección de la refracción del rayo oblicuo
en la lente 2, como se muestra en la fig. 1.47(a). La prolongación hacia atrás
del rayo refractado se une en el plano focal con el rayo que pasa por el centro de la lente. Un procedimiento similar se tiene para una lente positiva,
como se ilustra en la fig. 1.47(b).
O
F1
F'2
F'1
L1
F2
L2
Figura 1.46. Trazo del rayo paralelo que sale del extremo del objeto. El rayo
refractado en la lente 1 se convierte en un rayo oblicuo para la lente 2.
Rayo oblicuo
Rayo oblicuo
F
F'
Rayo auxiliar
Plano Focal
Secundario
F
F'
Rayo auxiliar
(a)
(b)
Plano Focal
Secundario
Figura 1.47. Rayos oblicuos en lentes (a) negativa y (b) positiva. Para refractar un
rayo oblicuo se construye un rayo auxiliar paralelo al rayo oblicuo que pase por el
centro de la lente. El rayo oblicuo se refracta desde o hacia el punto en que el rayo
auxiliar interseca el plano focal secundario de la lente.
En resumen, para determinar la dirección de la refracción de un rayo
oblicuo construimos un rayo auxiliar paralelo al rayo oblicuo que pase por
el centro de la lente. El rayo oblicuo se refracta de modo que el rayo o su
Óptica geométrica
·
51
prolongación pase por el punto en que el rayo auxiliar interseca el plano
focal secundario de la lente.
Ejemplo: dos lentes positivas
Considere un sistema óptico con dos lentes delgadas de distancias focales
f1 = 50 mm y f2 = 35 mm separadas 20 mm. Encuentre la posición y
tamaño de la imagen si el objeto está a la distancia so1 = −70 mm y con
un tamaño ho = 11.80 mm. Realice el trazo gráfico de los rayos y verifique
analíticamente el resultado.
70
28,56
20
O
F1
F '1 F '2
F2
I
f 1 = 50
f 2 = 35
Figura 1.48. Trazo de rayos en un sistema de dos lentes positivas.
La solución gráfica se muestra en la fig. 1.48, en la que se ha trazado
del extremo de objeto dos rayos: un rayo paralelo al eje óptico y un rayo
dirigido al centro de la primera lente. Los dos rayos refractados en la lente
1 llegan a la lente 2 como rayos oblicuos. Con el método del trazo del rayo
oblicuo se obtiene la refracción final de los dos rayos. En el punto donde se
intersecan, se tiene el extremo de la imagen.
La verificación analítica se puede hacer con la ecuación de Newton. Para
la primera lente, tenemos xo1 = −20, por lo tanto, xi1 = (502 /20) = 125.
Para la segunda lente se tiene que so2 = (125 + 50 − 20) = 155, de donde
xo2 = (155 + 35) = 190, por lo tanto xi2 = (−352 /190) = −6.44. De este
modo, llegamos a que si2 = (35 − 6.44) = 28.56, como en la fig. 1.48.
Todas las distancias están dadas en milímetros.
El aumento de la imagen resulta del producto de los aumentos generados
por cada lente. Con la primera lente m1 = −125/50 = −2.5 y con la segunda
m2 = 6.44/35 = 0.18, de donde resulta que el aumento del sistema óptico
es m = m1 m2 = 0.46. Finalmente, el tamaño de la imagen será hi = mho =
5.43 mm.
52
·
Óptica geométrica
1.6. Lentes: planos principales
En la unidad 1.5, se analizó la formación de imagen en la aproximación de
lentes delgadas en el rango paraxial. La lente delgada es una simplificación
de la lente real en la que las dos superficies refractoras se juntan en un plano
(ortogonal al eje óptico), y partir de la cual se miden las distancias del objeto y la imagen. La ecuación de Gauss (eq. (1.42)) es la ecuación que nos
relaciona estas distancias a través de un parámetro de la lente, que es la distancia focal, la cual depende de los radios de curvatura de las dos superficies
refractoras y del índice de refracción de la lente y del medio que rodea la
lente. A partir de la distancia focal se definen los puntos focales, y con relación a estos se determina la ecuación de Newton, que también permite
determinar la posición y el tamaño de la imagen.
Con la aproximación de lente delgada, podemos diseñar y analizar en
primera instancia un sistema óptico, es decir, podemos definir los parámetros iniciales del sistema, por ejemplo, el número de lentes, sus distancias
focales, separación entre lentes, el tamaño angular de la imagen, la cantidad
de energía que puede colectar el sistema, etc. Sin embargo, en el análisis de
la calidad de la imagen (que tan parecida es la imagen al objeto) se requiere
considerar las aberraciones ópticas del sistema y la difracción de la luz. Lo
anterior implica conocer de forma precisa la geometría de las lentes, por lo
que se debe tener en cuenta el espesor de las lentes.
1
2
F'
n
nl
n
Figura 1.49. Punto focal secundario en una lente.
La distancia focal es el primer parámetro con el que identificamos una
lente. Para obtener su valor, se hace incidir en la lente (a lo largo del eje óptico) un manojo de rayos paralelos y se determina el punto donde convergen
los rayos refractados, si es una lente positiva, o el punto de donde divergen
los rayos, si es una lente negativa. Este punto de convergencia o divergencia es el punto focal secundario F0. En la aproximación de lente delgada,
la distancia focal corresponde con la distancia que hay entre el plano que
Óptica geométrica
·
53
representa la lente y el punto focal secundario. En el caso de la lente real
(denominada comúnmente como lente gruesa), tenemos el punto focal secundario, como se muestra en la fig. 1.49, pero ¿cuál es la distancia focal? y
¿desde dónde se mide?
En la lente delgada, el rayo paralelo al eje óptico y el rayo refractado se
intersecan en el plano que representa la lente. Si en la fig. 1.49 prolongamos el rayo paralelo (hacia adelante) y el rayo refractado (hacia atrás) hasta
el punto donde se intersecan, se puede definir un plano ortogonal al eje óptico que contiene el punto de intersección. En este plano se puede colocar
una lente delgada (omitiendo la lente real), cuya distancia focal iguale a la
distancia entre el plano y el punto focal secundario. Con esto, la refracción
del rayo paralelo hacia el punto focal secundario en la lente real y en la
lente delgada es equivalente. El plano en que se coloca la lente delgada se
denomina plano principal secundario y se denota por H0 en la fig. 1.50. La
distancia focal de la lente delgada equivalente en H0 será la distancia focal f
de la lente real y está dada por5
(n − 1) 2 t
1
1
1
= (nl − 1)
−
+ l
f
R1 R2
R1 R2 nl
(1.50)
donde t es el espesor de la lente. En forma análoga, se puede obtener el
punto focal primario F si enviamos un rayo paralelo de derecha a izquierda
hacia la lente. La distancia focal medida en esta dirección es igual a la eq.
(1.50) y se mide desde el plano principal primario, denotado por H en la
fig. 1.50.
1
H
H'
2
F'
F
n
f
nl
n
f
Figura 1.50. Definición de puntos focales y distancia focal en una lente real. La
distancia focal se mide desde los planos principales H y H0.
5 En
el apéndice A se deduce esta expresión de la distancia focal de una lente sumergida
en aire. El procedimiento se basa en las ecuaciones de propagación de los rayos paraxiales.
54
·
Óptica geométrica
A partir de los planos principales, podemos representar la lente real y,
con respecto a ellos, medir las distancias del objeto y la imagen, como se
muestra en la fig. 1.51. Al comparar la geometría de las figs. 1.41 y 1.51,
podemos establecer que las ecuaciones de Gauss (eq. (1.42)) y de Newton
(eq. (1.47)) también son válidas en las lentes reales, pero ahora las distancias
objeto e imagen se deben medir desde los planos principales y la distancia
focal de la lente está dada por la eq. (1.50).
H
F
O
- so
f
nl
I
F'
P' V'
V P
n
- xo
H'
n
f
si
xi
Figura 1.51. Distancias objeto e imagen en una lente real con respecto a los planos
principales.
En la lente delgada, se tiene el rayo que va al centro de la lente y no se
desvía. En la lente real, se tiene un rayo equivalente, pero discontinuo en la
lente. Este rayo sale del extremo del objeto y se dirige al punto donde el eje
óptico interseca al plano principal primario. El punto de intersección se denota por P y se denomina punto principal primario. El rayo se refracta con
la misma inclinación del rayo incidente saliendo del punto donde el eje óptico interseca el plano principal secundario y llega al extremo de la imagen.
El punto de intersección se denota por P0 y se denomina punto principal secundario, como se muestra en la fig. 1.51. Por su puesto, la trayectoria del
rayo dentro de la lente será desde el punto donde el rayo incidente interseca la primera superficie hasta el punto donde el rayo refractado interseca la
segunda superficie.
Cuando la lente está sumergida en dos medios de diferente índice de refracción, es decir, el objeto se encuentra en un medio y la imagen en otro
(ambos con índice de refracción diferente al de la lente), el rayo oblicuo que
no cambia la inclinación al refractarse ya no pasa por los puntos principales. Sin embargo, se pueden definir otro par de puntos en el eje óptico que
permiten saber la dirección que tiene este rayo oblicuo. Estos puntos se de-
Óptica geométrica
·
55
nominan puntos nodales y el rayo se denomina rayo nodal. Un ejemplo de
lentes sumergidas en diferentes medios lo tenemos en las cámaras submarinas (agua - vidrio - aire). En casos como estos, las eqs. (1.42)) y (1.47) ya
no son válidas. Este tipo de casos no los vamos a considerar en este libro.
Nos ocuparemos de lentes sumergidas en un mismo medio, de modo que
los puntos nodales y los puntos principales coinciden.
La posición de los planos principales se suele dar mediante la distancia
entre el vértice de la superficie refractora y el plano principal, fig. 1.51 (ver
apéndice A). Para el plano H, se tiene
VP = −f
(nl − 1) t
,
R2 nl
(1.51)
y para H0, se tiene
V0P0 = −f
(nl − 1) t
.
R1 nl
(1.52)
En la fig. 1.52, se muestra la ubicación de los planos principales para algunas configuraciones de lentes positivas y negativas. En lentes simétricas, los
planos principales también son simétricos; en lentes con una superficie plana uno de los planos principales se ubica en el vértice de la otra superficie; y
en lentes tipo menisco, los planos principales pueden estar fuera de la lente.
H H'
H H'
H H'
H H'
H H'
HH'
f >0
f <0
Figura 1.52. Planos principales en algunas lentes positivas y negativas.
Ejemplo: de una lente delgada a una lente real
Supongamos que se dispone de una cámara de video CMOS (por sus siglas
en inglés) con un sensor que tiene una región para el registro de la imagen
de (4.5 × 2.8) mm (formato 1/3”, 752 × 480 pixeles). Se quiere utilizar esta
56
·
Óptica geométrica
cámara para registrar imágenes de objetos cuyo tamaño 2h0 es alrededor de
11 mm. La distancia de trabajo entre el sensor de la cámara y el objeto debe
ser cercana a 200 mm, pero no mayor. ¿Qué lente simple se puede utilizar
de modo que se registre la imagen en la mayor región posible del sensor?
Una solución al problema puede darse comenzando con un diseño de
lente delgada y luego reemplazarla por una lente real que se encuentre en
el comercio.
Lo primero es establecer el aumento del sistema, lo cual se deduce al
relacionar la menor dimensión del sensor con el mayor tamaño del objeto,
es decir, 2.8/11 = 0.254. Con este resultado, vamos a tomar un aumento
m = −1/4. Luego, deducimos las distancias del objeto y de la imagen a la
lente delgada. La distancia objeto será xo = f /m = −4f y la distancia imagen
será xi = f /4. Por lo tanto, so = −5f y si = 5f /4.
La suma de estas distancias debe ser tal que si − so = 6.25 f ≤ 200 mm.
Con la igualdad, se tiene que la distancia focal debería ser 32 mm.
187.50
- so = 150
si = 37.5
F'
O
I
F
f = 30
(a)
190.53
- s o = 150
si = 37.5
H H'
F'
O
I
F
f = 30
(b )
Figura 1.53. Formación de imagen con una lente simple que genera un aumento
m = −1/4. En (a), la solución en la aproximación de lente delgada. En (b), cambio
de la lente delgada por una lente convexa-plana real (comercial) de índice 1.7847,
R1 = 23.54 mm y espesor t = 6.90 mm.
Óptica geométrica
·
57
En el catálogo de una compañía fabricante de lentes encontramos que
la lente simple más cercana a la que buscamos es una lente de 30 mm de
distancia focal. Por lo tanto, seleccionamos f = 30 mm, y la distancia de
trabajo será 187.5 mm, lo cual es adecuado.
Entonces, la solución en la aproximación de la lente delgada es: lente de
distancia focal f = 30 mm, con el objeto a la distancia so = −150 mm y
el sensor a la distancia si = 37.5 mm. Con esto, se obtiene un aumento
m = si /so = −1/4 y un objeto de tamaño 11 mm quedará registrado con un
tamaño 2.75 mm. En la fig. 1.53(a,) se muestra la solución en la aproximación de lente delgada.
Para pasar a la solución práctica, debemos reemplazar la lente delgada
por la lente real de distancia focal 30 mm. La lente seleccionada del catálogo
de la compañía es una lente convexa-plana (30 mm de diámetro) de espesor
t = 6.90 mm. El radio de la superficie convexa es R1 = 23.54 mm. El
material de la lente es el vidrio N-SF11 de la compañía Schott. Para la
longitud de onda 𝜆 = 587.56 nm, el índice de refracción es 1.7847. Los
planos principales se localizan en VP = 0 y V0P0 = −3.8662 mm. Por lo
tanto, si se hace coincidir el plano principal H con la posición de la lente
delgada, se tiene que la distancia entre el objeto y el vértice de la primera
superficie es 150 mm. Ya que el plano principal H0 está a 3.03 mm de H,
en esta distancia se desplazará el plano en que se forma la imagen (donde
se debe poner el sensor), como se muestra en la fig. 1.53(b). Con esto, la
distancia total de trabajo entre el objeto y el sensor aumenta en 3.03 mm.
Note que el incremento de la distancia no es igual al espesor de la lente.
Finalmente, se ha obtenido una solución práctica, logrando un aumento de
−1/4 en una distancia de trabajo (objeto-sensor) de 190.53 mm con una
lente de 30 mm de distancia focal.
1.6.1. Sistema de lentes
En la sección anterior, se definieron los planos principales de una lente simple. La gran ventaja de introducir los planos principales es que para determinar la posición y el tamaño de la imagen podemos utilizar las ecuaciones
de Gauss y Newton deducidas para la lente delgada. El concepto de planos
principales se puede generalizar a un sistema de lentes y se definen de la
misma forma como se hizo para las lentes simples. Nuevamente, las ecuaciones de Gauss y Newton son válidas, pero ahora la distancia focal será
la del sistema de lentes. Las posiciones de los planos principales ya no se
calculan con las eqs. (1.51) y (1.52).
58
·
Óptica geométrica
Ejemplo: sistema de tres lentes
Para ilustrar los planos principales en un sistema de varias lentes, vamos a
considerar el ejemplo dado en la tabla 1.1. En esta se enumeran las superficies, incluyendo el objeto (plano objeto) y la imagen (plano imagen). Frente
a la superficie se da el radio de curvatura de la misma, y en medio de las
superficies se da el espesor o separación y el índice de refracción. El radio y
el espesor se dan en milímetros (como es costumbre en diseño óptico). La
distancia entre el plano objeto y la primera superficie refractora se denota
por lo y la distancia entre la última superficie refractora y el plano imagen se
denota por li . Note que no hemos usado las notaciones so y si , ya estas son
las distancias a los planos principales y en la tabla 1.1 lo que se muestra son
las distancias entre superficies.
Tabla 1.1. Sistema óptico de tres lentes. Las unidades para el radio y el espesor
se dan en mm.
Superficie
0 (Obj)
1
2
3
4
Radio
Índice
lo
1.0000
4.5
1.6700
12.0
1.0000
2.0
1.7847
7.0
1.0000
8.0
1.6727
li
1.0000
∞
20.10
∞
−31.82
31.82
5
31.94
6
-31.94
7 (Imag)
Espesor
∞
De acuerdo a la tabla 1.1, la primera lente (superficies 1 y 2) es convexaplana de distancia focal f1 = 30 mm y espesor t = 4.5 mm. La segunda lente
(superficies 3 y 4) es bicóncava de distancia focal f2 = −20 mm y espesor
t = 2.0 mm, y la tercera lente (superficies 5 y 6) es una lente biconvexa de
distancia focal f3 = 25 mm y espesor t = 8 mm. La distancia focal de este
sistema de lentes es f = 40.17 mm.
·
Óptica geométrica
59
En la fig. 1.54, se muestra el sistema óptico cuando se forma la imagen
de un objeto que está a la distancia lo = −70 mm. En este caso la imagen
estará en li = 44.60 mm. Note que en este ejemplo los planos principales
tienen un orden diferente al que se tiene en las lentes simples (fig. 1.52).
Teniendo esto en cuenta, se encuentra que las distancias objeto e imagen
para la ecuación de Gauss son so = −92.39 mm y si = 71.07 mm.
s i = 71,07
- so = 92,39
H'
H
F'
O
F
I
1
2
3
4
5
6
f = 40,17
Figura 1.54. Localización de los planos principales en un sistema de tres lentes.
Mediante este ejemplo queda claro que un sistema óptico en general se
puede representar por los planos objeto e imagen, los planos focales primario y secundario, y los planos principales primario y secundario.
La distancia focal en un sistema de lentes se determina del mismo modo
que se hace para una sola lente: se hace incidir (a lo largo del eje óptico)
un manojo de rayos paralelos y se determina: el punto donde convergen los
rayos refractados si es una lente positiva, o el punto de donde divergen los
rayos si es una lente negativa. Este punto de convergencia o divergencia es el
punto focal secundario F0. La distancia entre el plano principal secundario
H0 y F0 es la distancia focal del sistema. En particular, para un sistema de
dos lentes delgadas, separadas una distancia d, se tiene que6
1 1 1
1 1
=
+ −
d.
f
f1 f2 f1 f2
(1.53)
La potencia de la j-ésima lente delgada se define como
P̃k =
1
.
fk
(1.54)
Con esta definición, la potencia de la combinación de lentes dada por la
eq. (1.53) se puede escribir como
P = P̃1 + P̃2 − P̃1 P̃2 d.
6 En
(1.55)
el apéndice A se deduce la expresión de la distancia focal para un sistema de dos
lentes delgadas. El procedimiento se basa en las ecuaciones de propagación de los rayos
paraxiales.
60
·
Óptica geométrica
Esta ecuación resulta análoga a la potencia de una lente real de espesor t
e índice de refracción nl , definida también como 1/f . Teniendo en cuenta
la definición de potencia de una superficie refractora dada por la eq. (1.28),
la eq. (1.50) se puede escribir como
P = P1 + P2 − P1 P2 (t/nl ).
(1.56)
En efecto, las eqs. (1.55) y (1.56) son análogas y muy útiles en la práctica.
Basta con conocer la eq. (1.56) y de ahí se pasa fácilmente a las dos lentes
delgadas, donde t = d y nl = 1.
Óptica geométrica
·
61
1.7. Diafragmas y pupilas
Hasta ahora nos hemos ocupado solamente del aspecto geométrico en la
formación de la imagen. Con esto, la imagen ideal de un objeto extendido será una copia del objeto, salvo por un factor de escala. Sin embargo,
para una descripción completa de la formación de la imagen, también se
debe analizar la distribución de la energía en la imagen en términos de la
distribución de la energía del objeto. Ya que un objeto extendido se puede
modelar como un conjunto de objetos puntuales, vamos a limitar el análisis
del flujo de energía dentro del sistema óptico formador de imagen a objetos
puntuales e imágenes puntuales en el eje óptico en la aproximación paraxial.
Un objeto puntual, por definición, es un radiador isotrópico de energía, que
emite energía radialmente y es igual en cualquier dirección. Entonces, desde el punto de vista de la energía luminosa, la imagen de un objeto puntual
será una fiel copia del objeto si es posible colectar toda la energía emitida
por el objeto en la imagen. Por ejemplo, un objeto puntual localizado en uno
de los focos de un espejo elipsoidal tendrá su imagen (también puntual) en
el otro foco del elipsoide (fig. 1.15). Omitiendo la absorción de energía en
el espejo, podemos decir que aquí tenemos una imagen perfecta del objeto.
Pero en el caso de la formación de imagen con una lente, el borde de la lente
determinará la cantidad de energía que puede ser colectada para formar la
imagen. En este sentido, no podemos tener una fiel copia del objeto.
La intensidad luminosa para una fuente puntual se define como el flujo de
energía dF (en vatios, W) en una dirección dada contenida en cierto ángulo
sólido dΩ (en esterorradian, sr), es decir,
dF
I˜ =
.
dΩ
(1.57)
˜
Para una fuente puntal que emite un flujo constante, se tiene que F = 4𝜋 I,
˜
por lo tanto, I (en W/sr) también es una constante.
En la fig. 1.55, se muestra la formación de imagen de un objeto puntual
con una lente simple. La energía que fluye del objeto está contenida en el
cono cuyo vértice es el objeto y cuya base es el borde de la lente. Y la energía
que llega a la imagen está contenida en el cono cuyo vértice es la imagen
y cuya base también es el borde de la lente. Si el área de la lente es dA, el
ángulo sólido que subtiende la lente con respecto al objeto será dΩo = dA/so2 ,
mientras que el ángulo sólido que subtiende la lente con respecto a la imagen
será dΩi = dA/si2 . Suponiendo que la intensidad del objeto puntual es I˜o , la
62
·
Óptica geométrica
energía que puede colectar la lente será
dA
dF = I˜o 2 .
so
(1.58)
Si no hay absorción de energía en la lente, a la imagen puntual llegará la
misma cantidad de energía dF . Si I˜i es la intensidad del punto imagen, entonces dF = I˜i dA/si2 . Así, la intensidad en la imagen puntual será [10]
I˜i = I˜o
si2
(1.59)
so2
- so
si
O
I
dA
Figura 1.55. La cantidad de energía luminosa colectada por una lente está determinada por el borde de la lente.
1.7.1. Diafragma de apertura
Si se quiere disminuir el flujo de energía que llega a la imagen se debe reducir el área de la lente a través de la cual fluye la energía. Lo anterior se
puede lograr introduciendo en el sistema óptico una pantalla opaca con una
abertura DA (circular, centrada en el eje óptico) delante o detrás de la lente,
como se muestra en la fig.1.56
DA
O
I
dA'
Figura 1.56. Control del flujo de energía en la imagen mediante la abertura DA.
Ahora, el flujo de energía que llega a la imagen será
0
dA
dF 0 = I˜i 2 ,
si
(1.60)
Óptica geométrica
·
63
donde dA0 es el área que proyecta la abertura (vista desde el objeto) en la
lente. A este tipo de aberturas se les denomina diafragma de apertura. Si el
radio del diafragma es variable (iris), se puede controlar la cantidad de energía que entra al sistema formador de imagen. Si el radio del diafragma está
fijo, también estará fija la cantidad de energía que entra al sistema formador
de imagen.
Supongamos que la región circular definida por dA0 en la lente tiene un
diámetro D, es decir, dA0 = 𝜋D2 /4, entonces el flujo de energía en la imagen
se puede escribir como
2
𝜋 I˜i D
dF 0 =
.
(1.61)
4 si
Ya que I˜i está fijo, se tiene que el flujo de energía es proporcional al cuadrado
de la cantidad (D/si ). Una situación de particular interés se tiene cuando el
objeto puntual está en el infinito, fig. 1.57. En este caso, el flujo de energía
será proporcional al cuadrado de la cantidad (D/f ), donde f es la distancia
focal de la lente. A la cantidad ( f /D) se le denomina el número-f y se denota
por
f
f /# = .
(1.62)
D
Esta cantidad es de uso común en astronomía para caracterizar las lentes (o
espejos) objetivo de los telescopios y en fotografía es un indicador para fijar
el tiempo de exposición. En términos del f /#, el flujo de energía resulta
dF 0 ∝
DA
1
( f /#) 2
(1.63)
f
F'
D
(Diámetro efectivo de la lente)
Figura 1.57. La cantidad f /D es un parámetro que se suele utilizar en la caracterización de las lentes (o espejos) en relación con la cantidad de energía que puede
colectar el sistema.
Usualmente, los objetivos de las cámaras fotográficas manuales tienen
un anillo con marcas que denotan el f /# como f /1.4, f /2, f /2.8, f /4,
64
·
Óptica geométrica
f /5.6, f /8, ... Para una distancia focal fija, al pasar consecutivamente de
un f /# a otro (girando el anillo), se está aumentando o disminuyendo en
un factor de 2 el área efectiva en la lente. Por ejemplo, si paso de f /1.4 a
f /2, disminuyo a la mitad el flujo de energía que llega a la imagen. Ya que el
flujo de energía es energía en la unidad de tiempo, llegará la misma cantidad
de energía luminosa a la imagen se si realiza el registro de la imagen, por
ejemplo, con f /1.4 a 1/500 de segundo o con f /2 a 1/250 de segundo. Los
números del f /# corresponden con la raíz cuadrada de 2, 4, 8, 16, 32, 64,
... En otras palabras, el número del f /# índica el factor en el que se reduce
el radio (o diámetro) del diafragma. En la fig. 1.58, se muestra un objetivo
de cámara fotográfica de la compañía Nikon de distancia focal f = 28 mm
con un f /# que varía desde f /2.8 hasta f /22.
Anillo para seleccionar el
f/#
Figura 1.58. Objetivo de una cámara fotográfica manual de distancia focal 28
mm de la compañía Nikon. El f /# varía desde f /2.8 hasta f /22. Fuente: imagen tomada de https://matthewdurrphotography.com/2012/07/20/nikons-seriese-primes-compared/.
Cuando el objeto puntual está fuera de eje, por ejemplo, el punto del
extremo de un objeto extendido, el cono de energía no es simétrico y el área
de la sección transversal (al eje del cono) proyectada en la lente (dA00 en la
fig.1.59) será menor que el área dA0 que se tiene cuando el objeto puntual
está en eje (fig. 1.56, suponiendo el mismo diafragma DA). Por lo tanto, si
todos los puntos de un objeto extendido tienen la misma intensidad, en la
imagen los puntos no tendrán la misma intensidad, disminuyendo a medida
que nos alejamos del eje óptico. Este fenómeno recibe el nombre de viñeta.
En la aproximación paraxial, suponemos que los rayos que salen del objeto hacia la lente viajan con inclinaciones muy pequeñas, esto es, prácticamente paralelos al eje óptico. Lo anterior implica que la extensión de los
objetos debe ser mucho menor a la distancia so . Con esto en mente, podemos aproximar los conos de energía de los objetos puntuales fuera de eje
·
Óptica geométrica
65
(que conforman el objeto extendido) por el cono de energía del objeto puntual en eje.
DA
I
O
dA''
Figura 1.59. Para un objeto puntual fuera de eje, el cono de energía no es simétrico, pero dentro de la aproximación paraxial los conos de cualquier punto objeto
(de un objeto extendido) se toman iguales al cono del objeto puntual en eje. El rayo
segmentado pasa por el centro del diafragma.
La cantidad
I=
dF
I˜
= 2
dA s
(1.64)
(en W/m2 ) se denomina irradiancia y es una medida de la distribución de
energía en una región plana de área dA. Por lo tanto, con la irradiancia se
puede caracterizar la imagen de objetos extendidos. Esta ecuación también
describe la ley del inverso del cuadrado de la distancia para la irradiancia,
donde s es la distancia desde la fuente puntual.
1.7.2. Pupilas
En la eq. (1.61), se tiene el flujo de energía que llega a la imagen en términos del diámetro efectivo de la lente, el cual resulta de la proyección del
diafragma de apertura. Este diámetro efectivo es la base de los conos de
energía objeto e imagen. Otra forma de definir los conos de energía, más
conveniente, es a partir de las imágenes del diafragma de apertura vistas a
través de las lentes que están antes del diafragma y a través de las lentes que
están después del diafragma. Estas imágenes reciben el nombre de pupilas
de entrada y de salida, respectivamente. La pupila de entrada define la base
del cono de energía del objeto y la pupila de salida define la base del cono de
energía de la imagen.
En la fig. 1.60, se ilustra el concepto de pupilas de entrada (Pen ) y salida (Pex ) en un sistema óptico de dos lentes positivas con el diafragma de
apertura en medio de las lentes. La pupila de entrada es la imagen que forma la lente 1. La pupila de salida es la imagen que forma la lente 2. Note
66
·
Óptica geométrica
que estas imágenes son virtuales, ya que el diafragma de apertura, en ambos casos, está entre la lente y el punto focal. Denotando por Den y Dex los
diámetros de las pupilas de entrada y salida, respectivamente, y por −len y
lex las distancias de las pupilas de entrada al objeto y de salida a la imagen,
respectivamente, el flujo de energía estará dado por
2
2
𝜋 I˜o Den
𝜋 I˜i Dex
0
dF =
=
.
(1.65)
4
len
4 lex
Y el f /# efectivo del sistema se define como
f /# =
lex
.
Dex
(1.66)
- l en
Pen
Pex DA
O
F1
I
F2
1
2
F'1 F'2
lex
Figura 1.60. Las pupilas de entrada Pen y salida Pex determinan la base de los
conos efectivos de iluminación para el objeto y para la imagen.
Entonces, el tamaño del diafragma de apertura determina la cantidad
de energía que entra al sistema óptico. Por otra parte, la posición del diafragma ( junto con el tamaño) juega un papel muy importante en el control
de las aberraciones ópticas del sistema. Así que la ubicación del diafragma
de apertura debe obedecer a criterios de optimización de la calidad de la
imagen.
Ejemplo: identificación del diafragma en un sistema óptico
En la tabla 1.1 (sección 1.6.1), que describe el sistema óptico de la fig. 1.54,
no es evidente el diafragma de apertura. Sin embargo, aunque no esté explícito, el diafragma de apertura será el borde de una de las lentes. Para
determinar ese borde, se debe formar la imagen de cada uno de los bordes por los elementos ópticos que lo preceden. La imagen que subtiende
·
Óptica geométrica
67
el menor ángulo sólido con respecto al objeto puntual define al borde que
corresponde al diafragma de apertura. En el caso la tabla 1.1, el borde de
la superficie 1 (primera lente) es el diafragma de apertura, como se muestra
en la fig. 1.61. Lo anterior, aunque posible, es poco práctico, ya que no se
puede controlar la cantidad de iluminación que llega a la imagen. Por otra
parte, se tendrá una abertura relativamente grande, lo que puede afectar la
calidad de la imagen con las aberraciones ópticas.
DA
O
F'
F
I
Figura 1.61. El borde cuya imagen subtiende el menor ángulo solido con respecto
al objeto puntual en eje es el diafragma de apertura.
Una mejora del sistema óptico de la fig. 1.61 se tiene introduciendo una
abertura en medio de las lentes, como se muestra en la fig. 1.62.
P ex
P en
I
O
1
2
34 5 6
DA
7
Figura 1.62. El diafragma de apertura separado de las lentes se cuenta como otra
superficie del sistema óptico.
Al introducir el diafragma de apertura como un elemento separado de
las lentes, el diafragma se cuenta como una superficie adicional del sistema
óptico. Por lo tanto, la tabla 1.1 se transforma en la tabla 1.2 (que se muestra
abajo), donde la superficie 5 es el DA a 3 mm de la cuarta superficie. El radio
y el espesor se dan en milímetros.
68
·
Óptica geométrica
Tabla 1.2. Sistema óptico de tres lentes con diafragma de apertura. El radio y el
espesor se dan en mm.
Superficie
0 (Obj)
Radio
20.10
2
∞
4
5 (DA)
6
7
8 (Imag)
Índice
lo
1.0000
4.5
1.6700
12.0
1.0000
2.0
1.7847
3.0
1.0000
4.0
1.0000
8.0
1.6727
li
1.0000
∞
1
3
Espesor
−31.82
31.82
∞
31.94
-31.94
∞
1.7.3. Rayos principal y marginal
Supongamos que tenemos un objeto extendido y formamos la imagen con
el sistema óptico de la fig. 1.60. Esta situación se ilustra en la fig. 1.63.
A partir de las pupilas de entrada y salida, se definen dos nuevos rayos: el
rayo marginal, que pasa por el borde del diafragma de apertura y permite
localizar la imagen, y el rayo principal, que pasa por el centro del diafragma
de apertura y determina el tamaño de la imagen. Para trazar estos dos rayos,
seguimos el siguiente procedimiento:
Rayo marginal. Rayo que sale de la base del objeto dirigido hacia el
borde de la pupila de entrada, se refracta en el sistema óptico, pasando
por el borde del diafragma, y sale del sistema óptico como si viniera
del borde de la pupila de salida. La intersección del rayo refractado
con el eje óptico da la base de la imagen.
Rayo principal. Rayo que sale del extremo del objeto dirigido al centro de la pupila de entrada, se refracta en el sistema óptico, pasando
Óptica geométrica
·
69
por el centro del diafragma, y sale del sistema óptico como si viniera
del centro de la pupila de salida. La intersección del rayo refractado
con la normal del eje óptico en la base de la imagen da la altura de la
imagen.
Pen
Pex DA
ginal
Rayo mar
O
F'1 F'2
F1
cipal
Rayo prin
F2
I
1
2
Figura 1.63. Definición de los rayos principal y marginal.
Estos dos rayos también se pueden trazar para un objeto puntual. Por
ejemplo, para el objeto puntual de la fig. 1.60, el rayo principal coincide
con el eje óptico, y para el punto del extremo del objeto en la fig. 1.59,
tenemos un rayo marginal que va al borde superior del diafragma y un rayo
marginal que va al borde inferior del diafragma. Así, para un objeto puntual,
el rayo marginal delimita la extensión del cono de iluminación que entra al
sistema óptico, mientras que el rayo principal determina el eje del cono de
iluminación.
1.7.4. Diafragma de campo, campo de visión y
tamaño angular
En los sistemas ópticos también se puede encontrar otro tipo de diafragma
cuya tarea es determinar la región dentro de la cual se observa la imagen. Este tipo de diafragma se denomina diafragma de campo. Este diafragma puede
estar en el plano objeto (no muy común), en el plano imagen (como en una
cámara fotográfica), en un plano intermedio, donde se tenga una primera
imagen (como en un microscopio, telescopio), o incluso puede ser el borde
de una lente.
Consideremos un sistema óptico como una cámara fotográfica con distancia focal fija. En la fig. 1.64, se muestra un esquema simplificado de la
óptica y el sensor de la cámara. Ya que la cámara está pensada para tomar
fotografías de objetos a distancias mucho mayores que la distancia focal de
70
·
Óptica geométrica
la lente, el plano imagen coincide con el plano focal secundario. La imagen
se registra con un sensor de irradiancia (película fotográfica, dispositivo de
estado sólido CMOS (del inglés Complementary Metal Oxide-Semiconductor)
o CCD (del inglés Charge-Coupled Device)) dentro de la región definida por
el borde del sensor (usualmente de geometría rectangular). Este borde es el
diafragma de campo DC del sistema óptico y fija el tamaño angular de la
imagen 𝛼 0, que se define como el ángulo entre el rayo principal refractado
y eje óptico, es decir
0
tan 𝛼 0 = hmáx
/lex ,
(1.67)
0
donde hmáx
es la altura máxima que puede tener la imagen (medida desde
el eje óptico). Ya que 𝛼 0 es ángulo máximo que subtiende la imagen (con
respecto al centro de la pupila de salida), el ángulo 2𝛼 0 se denomina campo
de visión, y se suele denotar por las siglas FOV (del inglés field of view) en los
instrumentos ópticos y se da en grados.
l ex
a'
a
Pex
DA
F'
h'max
DC
Borde del sensor
Figura 1.64. El diafragma de campo determina la región dentro de la cual se
puede observar la imagen.
Del lado del objeto, también se define el campo objeto como el ángulo 2𝛼,
donde 𝛼 es el ángulo que forma el rayo principal incidente y el eje óptico.
En otras palabras, 𝛼 es el ángulo que subtiende el objeto con respecto al
centro de la pupila de entrada.
Hemos visto que el diafragma de apertura determina (mediante las pupilas) los conos de iluminación y el rayo marginal delimita estos conos. En
forma análoga, el diafragma de campo determina conos de visión y el rayo
principal delimita los conos. Entonces, si definimos el cono del campo objeto
como la región correspondiente al campo objeto y el cono del campo imagen
como la región correspondiente al campo de visión, se tiene que el cono del
campo objeto tiene su vértice en el centro de la pupila de entrada y su base
en el diafragma de campo, y el cono del campo de visión tiene su vértice en
el centro de la pupila de salida y su base en el diafragma de campo.
·
Óptica geométrica
71
1.7.4.1. Ejemplo: conos de energía y de visión
Consideremos un objetivo de cámara fotográfica formado por una lente negativa f1 = −40 mm y una positiva f2 = 40 mm, separadas 40 mm. Ambas
lentes tienen un diámetro de 40 mm. La imagen se registra en una película
de 35 mm (horizontal) × 24 mm (vertical). La máxima altura de la imagen
será la mitad de la dimensión vertical de la película, es decir, 12 mm, como
se ilustra en la fig.1.65.
12 mm
F'1
F2
F1
f 1 = - 40
F'2
f 2 = 40
Película fotográfica
(35 mm ´ 24 mm)
Figura 1.65. Sistema óptico de dos lentes para formar imagen en una película
fotográfica de 35 mm × 24 mm.
Suponiendo que los objetos que se quieren registrar están a distancias
mucho mayores que la distancia focal efectiva de las dos lentes, es decir,
so → −∞, el plano imagen se debe localizar en el punto focal secundario.
Para determinar el punto focal secundario y la distancia focal observamos la
refracción en las lentes de un rayo incidente de izquierda a derecha paralelo
al eje óptico. Después de refractarse en las lentes interseca al eje óptico en
el punto que determina el punto focal secundario F0. Por otro lado, la instersección de la prolongación del rayo incidente y el rayo refractado (en el
espacio imagen) localiza el plano principal H0. La distancia de H0 al punto
focal resulta ser f = 40 mm. El punto focal F y el plano principal H se localizan de manera similar, observando la refracción de otro rayo incidente
de derecha a izquierda, como se muestra en la fig. 1.66.
H
F '1
F
F2
F1
H'
F'
F2'
f = 40
Figura 1.66. Planos principales y distancia focal del sistema óptico de la figura
anterior.
72
·
Óptica geométrica
El diafragma de campo es el borde de la película fotográfica y la altura
0
de la imagen es hm
áx = 12 mm. ¿Cuál es el diafragma de apertura? Como el objeto está en infinito, si primero trazamos el rayo marginal al borde
de la primera lente, el rayo se refracta en forma divergente y no pasa por
la segunda lente. Por lo tanto, la segunda lente es la que limita el cono de
energía, lo que se puede ver con el rayo paralelo de izquierda a derecha que
se trazó en la fig. 1.66. Luego, el borde de la segunda lente es el diafragma
de apertura. La imagen de este borde desde el lado del objeto es la pupila
de entrada, la cual es virtual y de menor tamaño que el diafragma de apertura (la mitad), y como no hay más lentes entre la segunda lente y el plano
imagen, el borde de la segunda lente también es la pupila de salida, imagen
real y del mismo tamaño que el diafragma de apertura, como se muestra en
la fig. 1.67(a). La distancia de la pupila de salida resulta lex = 80 mm.
Pen
F'1
Pex
F2
F1
DA
F'2
DC
(a )
Pen
Pex
2a = 33,3°
2a' = 17,0°
DA
DC
(b )
Figura 1.67. Conos de energía y de visión del sistema de la fig. 1.65. (a) Trazo
de los rayos marginal y principal. (b) El borde del cono de energía está definido
por el rayo marginal, mientras que el borde del cono de visión objeto-imagen está
definido por el rayo principal.
Por otro lado, el rayo principal determina la altura de la imagen; en este
0 . Por lo tanto, ya podemos determinar el campo de visión, 2𝛼 0 =
caso, es hmáx
−1
2 tan (12/80) = 17.06◦ . Como ya se conoce la altura de la imagen, para
trazar el rayo principal en el sistema óptico, se hace de derecha a izquierda.
El resultado se muestra en la fig. 1.67(a). El campo objeto resulta ser 2𝛼 =
33.3◦ .
Por último, en la fig. 1.67(b) se trazan los conos de iluminación y de
visión. La energía que esté dentro de los conos de iluminación llegará a la
Óptica geométrica
·
73
imagen. Los objetos que se localicen dentro del cono del campo objeto tendrán su imagen dentro del cono del campo imagen. Al cambiar el tamaño de
DA, modificamos la energía, pero no se tiene ningún efecto en la extensión
de la imagen, ya que el rayo principal pasa por el centro de DA. Al cambiar
el tamaño de DC, modificamos la extensión que vemos de la imagen, pero
no se tiene ningún efecto en la cantidad de energía que llega a cada punto
de la imagen, ya que el rayo marginal pasa por el centro de DC.
Note que en los sistemas formadores de imagen con el objeto en infinito,
el tamaño de la imagen no se puede obtener como h 0 = mh, donde m = si /so .
Para estos sistemas, el aumento se define en forma angular, es decir,
m𝛼 =
tan 𝛼 0
,
tan 𝛼
(1.68)
y, en el rango paraxial, simplemente m𝛼 = 𝛼 0/𝛼. En otras palabras, el aumento angular es el cociente entre el tamaño angular de la imagen (con
respecto a la pupila de salida) y el tamaño angular del objeto (con respecto
a la pupila de entrada). Para el ejemplo que estamos tratando, se tiene que
m𝛼 = 0.5.
74
·
Óptica geométrica
1.8. Algunos instrumentos ópticos
En esta unidad, veremos la configuración básica de algunos instrumentos
ópticos y describiremos su funcionamiento en términos de los temas vistos en las secciones anteriores. Primero, veremos al ojo humano como un
sistema con simetría de revolución con superficies esféricas y simplificaremos el ojo como una lente delgada y un plano imagen. Luego, veremos la
lupa acoplada al ojo (modelo de lente delgada). Finalmente, veremos el telescopio y el microscopio como una extensión de la lupa, esto es, cuando se
añade otra lente para formar la imagen de objetos muy distantes u objetos
muy próximos pero pequeños.
1.8.1. El ojo humano (ojo esquemático)
En la sección 1.3.1, se hizo una descripción general del ojo como un sistema óptico de varias superficies refractoras. Debido a la variación de los
parámetros del ojo de una otra persona, con el propósito de estudiar la formación de imagen en el ojo, se proponen modelos del ojo a partir de los
valores medios de la población. Esto se puede hacer con diferentes grados
de exactitud. Si se supone que las superficies refractoras del ojo son esféricas
y centradas con un mismo eje (eje óptico), se obtiene una familia de modelos llamados ojos esquemáticos [9]. En particular, se emplean en la región
paraxial para obtener información como la potencia refractiva, el aumento,
la iluminación en la retina, las imágenes de Purkinje (reflexiones en las superficies refractoras del ojo), localización de las pupilas, localización de los
puntos focales (F, F0), los puntos principales (P, P0) y los puntos nodales (N,
N0), y efectos de los errores refractivos (miopía e hipermetropía). Cuando
se requiere información sobre la formación de imagen más allá de la región paraxial, se usan modelos más refinados llamados ojos esquemáticos
gran angulares, que incluyen superficies refractoras no esféricas, superficies
refractoras descentradas y modelos Grin (Gradient Index) para el índice de
refracción del cristalino [9].
Aquí vamos a considerar el ojo esquemático de Gullstrand-Emsley en las
configuraciones de ojo relajado y de ojo en completa acomodación, suponiendo que el ojo no tiene defectos refractivos (ojo emétrope). Se entiende
por ojo relajado la configuración que tiene el ojo cuando se está observando
un objeto localizado en el infinito. En esta situación, el cristalino tiene la
mayor distancia focal que puede tener. Cuando el objeto se acerca al ojo,
el cristalino cambia su geometría para disminuir la distancia focal de modo
que la imagen siga enfocada en la retina. Este proceso se llama acomodación.
Óptica geométrica
·
75
La acomodación tiene un límite, de modo que se tiene una distancia a partir de la cual, para distancias menores, ya no se puede mantener enfocada la
imagen en la retina. La distancia donde se tiene el límite de acomodación se
denomina distancia de punto cercano (dpc). La distancia más lejana, en donde
el ojo puede ver sin acomodación, se denomina distancia de punto lejano (dpl).
En un ojo emétrope, se tiene que dpl = ∞. El rango en dioptrías entre la dpc
y la dpl se denomina rango de acomodación. La dpc varia con la edad y es menor en los niños. Por ejemplo, un niño de 10 años tiene una dpc ' 70 mm
y su rango de acomodaci ón será (1000/(70 mm) − 1000/∞) = 14.29 D,
mientras que un adulto de 50 años tiene una dpc ' 400 mm y su rango de
acomodación será (1000/(400 mm) − 1000/∞) = 2.5 D.
23,9
V P P'
1
2
F
N N'
3
4
R'
F'
Pen Pex
f = 16,53
#
f ' = 22,05
R
d
0 (Obj)
1 Córnea
7.8
2 Iris (DA)
2 ----------Cristalino
3 ----------4 Retina
10.0
-6.0
Potencia
equivalente
n
1.000
3.6
4/3
0
4/3
3.6
16.69
1.416
4/3
Superficie
Componente
42.74
42.74
0
8.27
13.78
Total en el ojo
60.48
21.75
Figura 1.68. Ojo esquemático de Gullstrand-Emsley relajado (dpl = ∞). R y d
están dadas en mm, la potencia en D.
En la fig. 1.68, se muestra el ojo esquemático de Gullstrand-Emsley en la
configuración de ojo relajado. R y d están dadas en milímetros y la potencia
está dada en dioptrías. El sistema óptico se representa mediante 4 superficies: (1) córnea, (2) iris (diafragma de apertura) y superficie anterior del
cristalino, (3) superficie posterior del cristalino y (4) la retina. Las distancias
de los puntos cardinales (focales F-F0, principales P-P0 y nodales N-N0) con
76
·
Óptica geométrica
respecto a la superficie 1 son: VF = −14.983, VF0 = 23.896, VP = 1.550,
VP0 = 1.851, VN = 7.062 y VN0 = 7.363. El punto focal secundario F0
coincide con la retina R0. Las distancias focales son f = 16.53 y f 0 = 22.05.
Por otra parte, con respecto a la superficie 1 las pupilas se localizan según
VPen = 3.052 y VPex = 3.687. Al examinar la potencia refractiva de cada
elemento (P = (n 0 − n)/R), se nota que la córnea contribuye con cerca de
las 2/3 partes de la refracción total del ojo. Todas las distancias están dadas
en milímetros.
23,9
V P P'
F
1
R'
N N'
2
F'
3
4
Pen Pex
f = 14,34
#
f ' = 19,12
R
0 (Obj)
1 Córnea
7.8
2 Iris (DA)
2 ----------Cristalino
3 ----------4 Retina
5.0
-5.0
d
116.3
Potencia
equivalente
n
1.000
3.2
4/3
0
4/3
4.0
16.69
1.416
4/3
Superficie
Componente
42.74
42.74
0
16.53
16.53
Total en el ojo
69.72
32.30
Figura 1.69. Ojo esquemático de Gullstrand-Emsley en completa acomodación
para una dpc = 116.3mm. R y d están dadas en mm, la potencia en D.
En la fig. 1.69, se muestra el ojo esquemático de Gullstrand-Emsley en
configuración de completa acomodación para la distancia dpc = 116.3 mm.
Ahora el punto focal secundario F0 no cae en la retina R0, sin embargo, el
tamaño del ojo se mantiene igual que en el ojo relajado. Es notable el cambio en la geometría del cristalino, donde los radios son 5 mm y -5 mm, y
el espesor aumenta a 4 mm, lo que se traduce en un aumento de la potencia. La potencia total del ojo en completa acomodación resulta ser 69.72 D,
es decir, un cambio de 8.59 D con respecto al ojo relajado. Las distancias
de los puntos cardinales con respecto a la superficie 1 son: VF = −12.561,
VF0 = 21.252, VP = 1.782, VP0 = 2.128, VN = 6.562 y VN0 = 6.909.
Óptica geométrica
·
77
La distancia entre F0 y R0 es F0R0 = 2.644. Las distancias focales son
f = 14.343 y f 0 = 19.124. Por otra parte, con respecto a la superficie 1
las pupilas se localizan según VPen = 2.674 y VPex = 3.249. Todas las
distancias están dadas en milímetros.
Ejemplo: tamaño de la imagen de la luna
Como ejemplo del uso del ojo esquemático, vamos a calcular el tamaño de
la imagen en la retina a partir del rayo nodal. Supongamos que un objeto
muy distante subtiende un ángulo 𝜃 con respecto al punto nodal N, como
se ilustra en la figura 1.70. Considerando el punto nodal N0, se tiene que
h 0 = 𝜃N0F0. Por ejemplo, la luna llena subtiende un ángulo de 0.52◦ (0.0091
radianes) con respecto a un observador en la tierra, por lo tanto, el tamaño de la imagen en la retina del ojo relajado será 0.0091 × (VR0−VN0) =
0.155 mm. Si consideramos el ojo en completa acomodación, el mismo
ángulo se obtiene con un objeto de altura −h = 1.12 mm a la distancia de
dpc+VN = (116.3 + 6.562) mm = 122.86 mm. Entonces, para determinar
el tamaño de la imagen en la retina se debe conocer la distancia del punto
nodal secundario a la retina y el ángulo que subtiende el objeto con respecto
al punto nodal primario. Note que como estamos en la aproximación paraxial la imagen no se dibuja en la superficie curva de la retina, sino en el
plano ortogonal que pasa por el vértice de la retina (R0).
-h
q
P P'
N
N'
q
h'
R'
Pen Pex
Figura 1.70. A partir del rayo nodal, se puede medir la imagen en la retina del
ojo esquemático. Para esto es necesario conocer la distancia N0R0.
El ojo como lente delgada
Para hacer más simple el análisis en lo que sigue, usaremos un modelo simplificado del ojo: sistema óptico conformado por una lente delgada positiva
sumergida en aire, cuyo borde es el diafragma de apertura (iris) y un plano
imagen (retina) a la distancia lo jo de la lente. Cuando el ojo está relajado,
fo jo = lo jo , cuando está en acomodación fo jo < lo jo . Para el diseño de lentes
oftálmicas e instrumentos visuales, se tiene una norma que establece que en
78
·
Óptica geométrica
un ojo emétrope la dpc = 250 mm (10 in). En la fig. 1.71, se ilustra esta
situación: ojo relajado (arriba) y el ojo con máxima acomodación (abajo),
según la norma. El rango de acomodación en este caso será 4 D.
dpl =
dpc = 250
Retina
l ojo
f ojo = l ojo
Pupila
Retina
l ojo
f ojo < l ojo
Pupila
Figura 1.71. Una representación simple del ojo consiste en una lente delgada
positiva sumergida en aire. La distancia entre la lente y el plano imagen es fija y se
denota por lo jo .
Miopía. Cuando en un ojo la dpl < ∞, se dice que el ojo es miope. El
punto focal secundario está antes de la retina y la imagen de un objeto en el
infinito se verá borrosa en la retina. Esto también implica que el rango de
acomodación disminuye. Entonces, el ojo miope puede enfocar en la retina
imágenes de objetos que estén a una distancia finita entre la dpl y la dpc.
Ya que el ojo miope en estado relajado enfoca los rayos paralelos antes de la
retina, podemos decir que el ojo tiene una potencia mayor de la requerida al
observar objetos en el infinito. Por lo tanto, podemos disminuir la potencia
con la ayuda de una lente negativa.
Hipermetropía. Un ojo se dice hipermétrope si el punto focal secundario está después de la retina. Nuevamente, un objeto en el infinito se verá
borroso en la retina. Ya que el ojo hipermétrope en estado relajado enfoca
los rayos paralelos después de la retina, podemos decir que el ojo tiene una
potencia menor de la requerida al observar objetos en infinito. Por lo tanto,
podemos aumentar la potencia con la ayuda de una lente positiva.
Óptica geométrica
·
79
En la fig. 1.72, se muestra en (a) el ojo miope y su corrección, y en (b)
el ojo hipermétrope y su corrección. La distancia focal de la lente oftálmica
negativa o positiva se denota por fo f t . De la geometría de la fig. 1.72, se
puede determinar fo f t siempre y cuando se conozca la distancia d entre la
lente oftálmica y el ojo. Esta distancia debe garantizar que la potencia del ojo
no cambie cuando se adiciona la lente oftálmica. Esta condición obedece al
hecho que la imagen de un objeto vista con los dos ojos debe tener el mismo
tamaño aun cuando el defecto refractivo en cada ojo sea diferente. De otro
modo tendríamos una situación compleja para el cerebro, que tendría que
procesar dos imágenes de diferente tamaño del mismo objeto.
R
F'
dpl
R'
dpc
- foft
R'
d
( a)
R'
F'
R'
dpc
d
R
R
dpl
f oft
(b)
Figura 1.72. Defectos refractivos. (a) Miopía: el punto lejano R está a una distancia
dpl < ∞. Con una lente negativa se puede corregir el defecto. (b) Hipermetropía:
el punto lejano R está detrás del ojo. Con una lente positiva se puede corregir el
defecto.
Para determinar la distancia d consideremos la ecuación (eq. (1.53)) de
la distancia focal de dos lentes delgadas 1/f = 1/f1 + 1/f2 − d/( f1 f2 ). Sea
f1 = fo f t y f2 = fo jo . Si d = fo jo , entonces la distancia focal de la combinación
ojo-lente oftálmica será f = fo jo . Resultado notable, que en cierto modo es
garantizado por la fisionomía de nuestro rostro, donde la nariz no solo sirve
de apoyo a las gafas, sino que nos sirve para garantizar que la distancia entre
las gafas y el ojo sea cercana a la distancia focal del ojo (≈ 20 mm).
En la práctica, una persona con dpl < 0.167 m (6 D) se considera altamente miope. En el rango (0 − 6.0) D, se puede omitir la distancia
d en el cálculo de la potencia de la lente oftálmica, P = 1/fo f t , de modo
que la distancia focal de la lente oftálmica se puede igualar por −dpl. Por
ejemplo, una persona con una miopía de −2 D tendrá su punto lejano en
dpl = 0.5 m, por lo que la lente oftálmica que requiere para mejorar su
visión será una lente negativa de distancia focal fo f t = −500 mm (ya que
80
·
Óptica geométrica
500 mm >> fo jo = 22 mm). En el caso de la hipermetropía, se tiene una
situación análoga.
1.8.2. La lupa
En la sección 1.5.3, se mencionó que para una lente positiva la imagen de un
objeto colocado entre el punto focal primario y la lente es virtual, derecha,
de mayor tamaño que el objeto y se localiza a la izquierda del objeto. Esta
es la cofiguración de la lupa (o microscopio simple).
Antes de ver en detalle el funcionamiento de la lupa, vamos a revisar la
configuración de los campos de visión y objeto para una lente L formadora
de imagen colocada delante del ojo. En la fig. 1.73, se muestra el sistema
lente-ojo. Suponemos que el ojo es emétrope y lo modelamos como en la
fig. 1.71. Si el diámetro de la lente es mucho mayor que el iris, entonces
el iris será el diafragma de apertura, por lo que el borde de la lente será el
diafragma de campo, ya que determina la región que puede ver el ojo.
En este caso, la pupila de entrada es una imagen real, invertida y de mayor tamaño que el iris y se ubica a la izquierda del punto focal primario
de L. Por otro lado, el iris es la pupila de salida. Aunque en la fig. 1.73 no
hemos incluido un objeto, se puede trazar el rayo principal del sistema a
partir de las pupilas y el diafragma de campo, tal y como se mencionó en
la sección 1.7.4. Con esto se determina los conos del campo de visión y del
campo objeto. El ángulo 𝛼 0 determina la altura máxima de la imagen que
se puede observar en el ojo.
L
P en
Campo
objeto
FL
Cam
2a
2a'
Ojo
po
de v
isió
n
P ex
F'ojo
F'L
DA
DC
Figura 1.73. Campos de visión y objeto de una lente acoplada al ojo.
Un objeto colocado dentro del campo objeto tendrá su conjugado dentro
del campo de visión. Teniendo esto en mente, consideremos cuatro posiciones para un objeto de altura h como se muestra en la fig. 1.74. Para la
posición a, la imagen del objeto estará contenida completamente en el cono
del campo de visión. Para la posición b, solo una parte de la imagen se podrá observar, la parte superior será cortada. Para la posición c, el objeto está
Óptica geométrica
·
81
completamente por fuera del cono del campo objeto, por lo que no se tiene
la imagen en ningún lugar del cono del campo de visión. Para la posición d
nuevamente se puede observar la imagen completa del objeto, pero ahora
se verá invertida en comparación con la posición a. Lo anterior se puede
verificar fácilmente con una lente simple. Fijando la distancia entre la lente
y el ojo (mayor que la distancia focal de la lente, pero no más de dos veces), nos movemos alejándonos y acercándonos a un objeto. Se podrá ver
que en una posición la imagen desaparece y al seguir avanzando cambiará
la orientación de la imagen.
d
c
b
L
a
Ojo
P ex
FL
F'ojo
F'L
DA
P en
DC
Figura 1.74. La extensión del objeto que se puede observar en la imagen depende
de la ubicación del objeto dentro del campo objeto.
Cuando el objeto se ubica entre el punto focal primario y la lente, en el
ojo se observa una imagen de mayor tamaño y con la misma orientación que
la del objeto (el procesamiento de la imagen en el cerebro implica invertir la
orientación de la imagen física en la retina). En esta configuración, la lente
funciona como una lupa. En la fig. 1.75(a), se localiza la imagen utilizando
el rayo principal y dos rayos marginales que salen del extremo del objeto.
Note que la imagen aún sigue dentro del cono del campo de visión, el cual
se proyecta en el espacio del objeto. La imagen se verá enfocada en la retina
si la distancia de la imagen virtual al ojo es mayor o igual a la dpc del ojo.
Para calcular el aumento nominal de la lupa, se toma dpc = 250 mm, de
acuerdo con la norma. Entonces, la distancia más corta a la que podemos
acercar un objeto con el fin de verlo con el ojo (sin ayuda de la lupa) del
mayor tamaño angular posible es la dpc. Con la lupa podemos acercar aún
más el objeto y ahora la imagen que vemos es la imagen virtual que genera
la lupa, y nuevamente la podríamos ver del mayor tamaño angular posible
si esta imagen se localiza en la dpc. El cociente entre los dos ángulos, con y
sin lupa, es el aumento nominal de la lupa.
·
82
Óptica geométrica
Cam
po
de v
i
sión
L
Ojo
h'
P ex
h
FL
F'ojo
F'L
DA
P en
DC
(a)
h'
q'
h
L
Ojo
h
q
F'ojo
fL
- s = dpc= 250
(b)
L
q'
h
q
h
- s = dpc= 250
fL
Ojo
F'ojo
(c)
Figura 1.75. La lupa: (a) trazo del rayo principal y de dos rayos marginales que
salen del extremo del objeto. La imagen es virtual y de mayor tamaño; (b) el aumento de la lupa es el cociente entre el ángulo que subtiende la imagen virtual y el
ángulo que subtiende el objeto, ambos a la distancia de punto cercano; (c) al acercar
el ojo a la lupa se aumenta el campo de visión del sistema sin cambiar el tamaño
de la imagen en la retina.
Óptica geométrica
·
83
Una manera de determinar el aumento angular de la lupa se ilustra en
el fig. 1.75(b). Suponemos que estamos en el rango paraxial. Sin la lupa,
cuando ubicamos el objeto de altura h a la dpc del ojo, este subtiende el ángulo 𝜃 = h/dpc. Con la lupa, se ubica el objeto de tal manera que la imagen
virtual de altura h 0 quede a la dpc del ojo. El ángulo que subtiende la imagen virtual es 𝜃 0 = h 0/dpc. Si la lente del ojo se localiza en el punto focal
secundario de la lupa, el rayo principal es paralelo al eje óptico. Con esto en
mente, se tiene que h 0/dpc = h/fL . Por lo tanto, el aumento nominal angular
m𝛼 = 𝜃 0/𝜃 estará dado por
m𝛼 =
dpc 250 mm
=
,
fL
fL
(1.69)
con fL en mm. Note que por el hecho de colocar la lente del ojo en el punto
focal secundario de la lupa, el objeto se puede desplazar entre el punto focal
primario de la lupa y la lupa sin que cambie el tamaño angular del objeto.
Ya que fisiológicamente el ojo está relajado cuando observamos un objeto
que está en el infinito, entonces conviene colocar el objeto en el punto focal
primario de la lupa para observar su imagen virtual en el infinito sin cambiar
el aumento angular.
¿Qué ocurre si acercamos el ojo a la lupa manteniendo el objeto en el
punto focal primario de la lupa? Esta situación se ilustra en la fig. 1.75(c).
Ya que los rayos que salen de cualquier punto del objeto, en particular del
extremo del objeto, se refractan como un manojo de rayos paralelos e inclinados 𝜃 0, entonces el rayo que cruza por el centro de la lente del ojo llegará
a la retina al mismo punto que se tiene en la fig. 1.75(b). Por lo tanto, no
cambia el tamaño de la imagen en la retina. Sin embargo, sí aumenta el
campo de visión, ya que el iris del ojo es la pupila de salida, de manera que
al estar más cerca de la lupa, el ángulo 𝛼 0 que subtiende la lupa es mayor.
Así que si ponemos nuestro ojo muy cerca de la lupa (como lo hacen los
relojeros), tendremos una imagen aumentada dentro del mayor campo de
visión que se puede lograr.
El aumento nominal de las lupas se denota por m×, por ejemplo, una
lupa de 10× es una lupa de distancia focal 25 mm (eq. (1.69)). Las lupas
comerciales varían desde unos pocos aumentos hasta unos 30 aumentos.
En la fig. 1.76, se muestra 2 lupas. En (a), la lupa está conformada por una
lente simple y una base a la distancia focal de la lente, lo que garantiza que
el objeto siempre esté a la distancia apropiada. En (b), una lupa de 20 aumentos. Entre mayor sea el aumento, más compleja es la lupa, ya que para
garantizar una imagen de buena calidad se deben corregir las aberraciones
que se hacen más evidentes en lupas de gran aumento. En (b), la lupa está
84
·
Óptica geométrica
conformada por 3 lentes de diámetro 15 mm. Las tres lentes están unidas.
Esta lupa se denota como “Achromatic” 20×. La palabra Achromatic indica
que el sistema está diseñado para corregir la aberración cromática, y el 20×
indica que la distancia focal del sistema es 12.5 mm.
(a)
(b)
Figura 1.76. Algunas lupas comerciales. (a) Lupa de 10x con base en el plano focal
de la lente. Fuente: imagen tomada de https://eurogrow.es/microscopios/2450lupa-cuenta-hilos-10x.html. (b) Lupa de 20x de tres lentes unidas para corregir aberración cromática. Fuente: imagen tomada de http://www.mingaservice.
com/web/index.php/producto/item/lupas-iwamoto-20x.
1.8.3. El telescopio
DA
s'ex
f ob+ f oc
a
F'ob
F oc
Lob
DC
Loc
a'
P ex
P en
Figura 1.77. Configuración básica del telescopio refractor kepleriano. El punto
focal secundario del objetivo coincide con el punto focal primario del ocular.
Telescopio refractor kepleriano
Una lente positiva forma la imagen de un objeto que está en el infinito en
su plano focal secundario (sección 1.5.3). La imagen es real, invertida y
pequeña. Si esta imagen se coloca en el plano focal primario de una lupa,
Óptica geométrica
·
85
entonces tendremos una imagen aumentada de un objeto que está en el
infinito. Esta combinación de lente positiva formadora de imagen (Lob ) y
lupa (Loc ) definen la estructura básica de un telescopio refractor kepleriano,
como se muestra en la fig. 1.77.
La lente Lob se denomina objetivo (por estar del lado del objeto) y la
lente Loc se denomina ocular (por estar del lado del ojo). Los puntos focales,
secundario del objetivo y primario del ocular, coinciden. El rayo marginal
pasa por el borde del objetivo, luego este es el diafragma de apertura, y el
borde del ocular será el diafragma de campo, por lo que el rayo principal
debe pasar por este borde y por el centro de las pupilas de entrada y salida,
definiendo el campo objeto 𝛼 y el campo de visión 𝛼 0 del telescopio, como
se ilustra en la fig. 1.77. La pupila de entrada es el borde del objetivo y la
pupila de salida es la imagen real que forma el ocular del borde del objetivo.
De la geometría de la fig. 1.77 (y la eq. (1.42)), se tiene que la pupila de
salida se localiza a la distancia
fob + foc
0
sex = foc
(1.70)
fob
del ocular.
El telescopio como sistema óptico es afocal, es decir, no posee puntos
focales. Lo anterior resulta claro al examinar el rayo marginal. Este rayo
incide paralelo al eje óptico y se refractada paralelo al eje óptico. Lo anterior
también implica que el objeto está en −∞ y la imagen está en +∞. Por lo
tanto, en el telescopio el aumento también se debe definir en forma angular,
es decir, m𝛼 = 𝛼 0/𝛼. De la geometría de la fig. 1.77, se tiene que los ángulos
0 , donde r es el radio del
están dados por 𝛼 = −roc /( fob + foc ) y 𝛼 0 = roc /sex
oc
ocular. Así, el aumento será
m𝛼 = −
fob
.
foc
(1.71)
Finalmente, para observar la imagen con el telescopio colocamos el ojo
después del ocular. Supongamos que el diámetro de la pupila del ojo es
mayor que el diámetro de la pupila de salida del telescopio. Entonces, el
proceso de la formación de la imagen es el siguiente: el objetivo del te0 ) una imagen intermedia
lescopio forma en el plano focal secundario (Fob
del objeto que está en el infinito. El máximo tamaño de esta imagen será
h 0 = 𝛼 fob . Luego, el ocular, que funciona como una lupa, envía manojos de
rayos paralelos al ojo, y la lente del ojo los enfoca en la retina, formando
una imagen final de tamaño h 00 = 𝛼 0lo jo . Como ya vimos en la fig. 1.75(c),
el ojo se puede desplazar acercándose o alejándose del ocular sin variar el
86
·
Óptica geométrica
aumento de la imagen. Sin embargo, hay una posición óptima para el ojo.
Como la pupila de salida del telescopio está fija, también lo estará el campo
de visión. Por lo tanto, si la pupila del ojo está a la izquierda o a la derecha de la pupila de salida del telescopio, puede ocurrir que la pupila del ojo
disminuya el campo de visión en el ojo. Si la pupila del ojo se coloca en la
misma posición de la pupila del telescopio, el campo de visión no se verá
alterado. Esta última configuración del telescopio-ojo es la ideal y se dice
que las pupilas están acopladas. En otras palabras, el ojo se debe colocar a
0 del ocular. En la fig. 1.78, se ilustra la formación de imagen
la distancia sex
en la retina y el acoplamiento de pupilas. También se muestran los conos
de energía (delimitados por el rayo marginal) y de visión (delimitados por
el rayo principal).
DA
Lob
2a
Ojo
s'ex
DC
h'
h''
Loc
F'ojo
P ex
P en
Figura 1.78. Conos de los campos objeto y visión en el telescopio refractor definidos por el rayo principal. La pupila del ojo se acopla a la pupila de salida del
telescopio. La posición óptima del diafragma de campo se da en el plano focal
secundario del objetivo. El cono de energía está definido por el rayo marginal.
En la fig. 1.78, se ha introducido una abertura (circular) en el plano focal
secundario del objetivo, de modo que sea el diafragma de campo. Si la abertura es de diámetro variable, entonces se puede graduar la extensión de la
imagen que se desea observar sin afectar el flujo de energía. Más importante es el hecho que en este plano se puede introducir una transparencia con
información que se quiera observar en la imagen, por ejemplo, una escala
métrica. Entonces, como regla podemos establecer que el lugar apropiado
para colocar un diafragma de campo en un sistema óptico debe ser donde
el rayo marginal corte al eje óptico. En la práctica, los oculares se componen de varias lentes y de un diafragma de campo separado de las lentes.
Por ejemplo, se pueden consultar los siguientes tipos de oculares: Ramsden, Kellner, ortoscópico, simétrico, Erfle [3]. En la fig. 1.79, se muestran
los elementos ópticos que componen un ocular tipo Kellner.
2a'
Óptica geométrica
·
87
Ocular Kellner
h'
P ex
DC
Figura 1.79. Esquema de los elementos ópticos que componen un ocular tipo
Kellner.
Ejemplo: telescopio de 36 aumentos
Consideremos un telescopio refractor comercial que tiene una lente objetivo de distancia focal fob = 900 mm y diámetro 2rob = 80 mm, y un ocular
10× y diámetro 2roc = 10 mm.
Objetivo
Buscador
Ocular
Prisma
recto
Figura 1.80. Telescopio astronómico refractor comercial (Refractor Bresser
80/900 mm EQ Quasar). Incluye un buscador (telescopio de menor aumento y
mayor campo objeto) para ubicar fácilmente los objetos. Fuente: imagen tomada
de https://www.astrocity.es.
A partir de estos parámetros, se encuentra que el ocular tiene una distancia focal foc = 25 mm (eq. (1.69)), por lo que el aumento del telescopio será
m𝛼 = −36. Con este ocular, el campo objeto será 2𝛼 = −10/925 = −0.0108
0 = 0.3892 = 22.3◦ (el
rad = −0.62◦ , y el campo de visión será 2𝛼 0 = 10/sex
◦
valor correcto es 22.02 ). Con este ejemplo, se puede advertir el valor tan
pequeño del campo objeto (0.62◦ ). Por esta razón, algunos telescopios astronómicos suelen tener acoplado un pequeño telescopio (llamado buscador),
de menor aumento y, mayor campo objeto, que permita ubicar rápidamente
88
·
Óptica geométrica
lo que se quiere observar. El buscador debe estar alineado con el telescopio.
El tamaño de la pupila de salida del telescopio es Dex = 2rob ( foc /fob ) = 2.5
mm. El número f del telescopio es f /# = 10.
En la fig. 1.80, se muestra el telescopio comercial con los anteriores parámetros. Note que el ocular no está a lo largo del eje óptico que pasa por el
objetivo, sino a 90◦ , esto con el fin de que sea más cómoda la observación.
Para cambiar la dirección del ocular se usa un prisma recto.
El telescopio refractor galileano
En el museo de historia de la ciencia en la ciudad de Florencia-Italia se exhiben dos de los telescopios (y una lente objetivo) construidos por Galileo
alrededor del año 1610. A diferencia del telescopio refractor kepleriano visto anteriormente, los telescopios de Galileo en lugar de una lente positiva
como ocular usan una lente negativa, pero manteniendo la configuración
afocal, es decir el punto focal secundario del objetivo coincide con el punto
focal primario del ocular. En el plano focal primario del ocular, se tendrá
un objeto virtual (que corresponde con la imagen real, invertida y de menor
tamaño, que forma el objetivo en ausencia del ocular) y su imagen estará en
el infinito. Un análisis de la geometría de este telescopio nos lleva otra vez
a las eqs. (1.70) y (1.71), pero ahora foc < 0. De acuerdo con la fig. 1.81(a),
0 .
el campo objeto es 𝛼 = −roc /( fob − | foc |) y el campo de visión es 𝛼 0 = roc /sex
El tamaño de la pupila de salida Dex = 2rob (| foc | /fob ).
Al usar una lente negativa como ocular, la pupila de salida se localiza entre el objetivo y el ocular, y es una imagen virtual, derecha y de menor tamaño que el diafragma de apertura. En consecuencia, no es posible acoplar
la pupila del ojo con la pupila de salida del telescopio. Entonces, ¿dónde
se debe colocar el ojo para tener una visión óptima? En la fig. 1.81(b), se
muestra el ojo cerca del ocular. Suponemos que el diámetro de la pupila del
ojo es mayor que el diámetro de la pupila de salida del telescopio. La pupila
del ojo recorta el campo de visión, teniendo entonces un nuevo campo de
visión con ángulo 2 𝛽 0 < 2𝛼 0. Entre más lejos se coloque el ojo, menor será
el campo de visión (y el campo objeto) efectivo del telescopio. Como el rayo principal ya no pasa por el centro de la lente del ojo, el tamaño máximo
que puede tener la imagen en la retina dependerá de la posición del ojo. En
otras palabras, en el sistema telescopio galileano-ojo el diafragma de campo
será la pupila del ojo. Por lo tanto, la mejor forma de usar este telescopio es
colocando el ojo lo más cerca posible del ocular.
Uno de los telescopios de Galileo que se exhibe en el museo consiste
en un tubo de madera cubierto en cuero. En los dos extremos del tubo se
Óptica geométrica
·
89
alojan el objetivo y el ocular. El objetivo de distancia focal fob = 980 mm
y diámetro 2rob = 37 mm; el ocular de distancia focal foc = −47.5 mm y
diámetro 2roc = 22 mm [11]. El aumento del telescopio será m𝛼 = 20.63
y el campo objeto del telescopio será 2𝛼 = −0.0236 rad = −1.35◦ . Sin
embargo, el campo objeto efectivo será menor al colocar el ojo. Suponiendo
que el ojo se coloca muy cerca del ocular y el diámetro de la pupila del ojo
es 4 mm (media del rango de apertura de iris), entonces el campo objeto
será 2 𝛽 = 4/(980 − 47.5) = 0.0043 rad = 0.25◦ (15 minutos de arco).
f ob
f oc
L ob
L oc
F'oc
2a
2a'
F'ob
DC
P ex
s'ex
P en
(a)
F'ojo
2b
F'oc
h''
2b'
F'ob
P ex
P en
(b)
Ojo
Figura 1.81. Telescopio galileano. No se puede realizar el acople de las pupilas
del telescopio y del ojo. El campo de visión efectivo lo determina la pupila del ojo.
Telescopio reflector newtoniano
En los telescopios refractores, el objetivo es una lente positiva que forma la
imagen de un objeto (que está en el infinito) en el plano focal secundario
y luego con el ocular (lupa) se observa la imagen aumentada en tamaño.
La imagen de los objetos distantes también se puede traer al plano focal
primario del ocular empleando en lugar de una lente positiva un espejo
cóncavo. En la sección 1.4.2, vimos que un espejo cóncavo, cuya superficie
reflectora es un paraboloide de revolución, enfoca los rayos paralelos al eje
óptico en el punto focal. Este punto se localiza a Rv /2 del vértice del espejo,
donde Rv es el radio de curvatura del paraboloide en el vértice (fig. 1.37).
En el telescopio refractor la luz siempre viaja en el mismo sentido hasta
llegar al ojo. Pero al cambiar el objetivo, pasando de una lente positiva a
un espejo cóncavo, la luz cambia de sentido al reflejarse en el espejo. Por
90
·
Óptica geométrica
lo que se requiere de otro elemento óptico para volver a cambiar el sentido
de propagación de la luz. Una configuración que resuelve este problema fue
propuesta por Newton en 1668. La solución consistía en colocar un espejo
plano (espejo secundario) cerca del punto focal del espejo cóncavo (espejo
primario) con una orientación diagonal (45◦ ) respecto al eje óptico. El tamaño del espejo secundario es varias veces menor que el tamaño del espejo
primario y debe recibir todos los rayos reflejados en el espejo primario. En la
fig. 1.82, se ilustra la configuación básica del telescopio newtoniano. El aumento nominal del telescopio está dado por la eq. (1.71), donde fob = Rv /2.
2a'
Pex
f oc
2a
Pen
DC
F
V
f ob
Figura 1.82. El telescopio newtoniano usa un espejo cóncavo con forma de parabolide de revolución (espejo primario) y un espejo plano diagonal (espejo secundario) para enfocar la luz que viene del infinito en el plano primario del ocular.
Hay otras configuraciones de telescopios reflectores que, en lugar de usar
un espejo secundario plano, usan un espejo hiperbólico (Cassegrain) o un
espejo elíptico (Gregoriano), manteniendo como espejo primario uno de
forma parabólica.7
Una ventaja de los telescopios reflectores sobre los telescopios refractores
está en evitar que el objetivo del telescopio sufra de aberración cromática
(la dependencia del índice de refracción con la longitud de onda de la luz),
propia de los elementos refractores. Aunque se puede construir sistemas
refractores acromáticos (que corrigen la aberración cromática) combinando
lentes, se tiene una limitación práctica cuando se quiere construir objeti7 En el libro Optical Imaging and Aberrations de Virendra N. Mahajan, se puede consultar
en el capítulo 6 (Calculation of Primary Aberrations: Reflecting and Catadioptric Systems)
los detalles ópticos y matemáticos de los tipos de telescopios reflectores más comunes y sus
variantes. Libro editado por SPIE Optical Engineering Press, 1998.
Óptica geométrica
·
91
vos de gran diámetro (de algunos metros). De hecho, el telescopio refractor más grande construido se encuentra en el observatorio de Yerkes, en la
Universidad de Chicago. El objetivo del telescopio consiste en dos lentes
de diámetro 1.016 m (40 in) separadas 218 mm; la distancia focal resulta
ser 18.897 m (744 in).8 A partir de estos datos, se tiene que este telescopio tiene un f /# = 18.6. La dificultad para construir grandes telescopios
refractores está en obtener bloques de vidrio sin imperfecciones y con un
índice de refracción homogéneo, y lograr la curvatura deseada en las dos
caras de la lente. Esto no es una limitante para los espejos primarios de los
telescopios reflectores, donde el cuidado se debe tener en la calidad de la
superficie reflectora. Es así como varios observatorios astronómicos cuentan con grandes telescopios reflectores con espejos primarios que llegan a
medir hasta 10 m de diámetro.
El tamaño del espejo primario juega un papel fundamental en la resolución del telescopio. Esta se puede dar como la mínima distancia angular entre
dos objetos puntuales con la cual se puede distinguir los dos puntos en la
imagen (límite de resolución angular), o como la mínima distancia transversal entre las imágenes de los dos puntos que permite identificar los puntos
(límite de resolución). De acuerdo con el criterio de Airy [3], el límite de
resolución está dado por9
(Δl) mı́n = 1.22𝜆 ( f /#) .
(1.72)
1.8.4. El microscopio
En la actualidad hay muchos tipos de microscopios que se pueden consultar en la literatura especializada. Aquí solo trataremos la configuración tradicional del microscopio óptico que enfoca la imagen en la retina del ojo.
Básicamente, el microscopio óptico añade una lente positiva (objetivo, Lob )
a una lupa (ocular, Loc ) para lograr imágenes aumentadas de objetos cercanos y muy pequeños, como se muestra en la fig. 1.83. La distancia entre
el punto focal secundario del objetivo y el punto focal primario del ocular,
denotada por lt , se denomina longitud del tubo. Esta longitud la fijan los
fabricantes de microscopios y se busca que al cambiar la potencia refractiva
del objetivo no se modifiquen las distancias entre las lentes, por lo que se
8 Los
datos del telescopio se han obtenido de la página del observatorio de Yerkes.
http://astro.uchicago.edu/yerkes/plates/plates3.html.
9 Este criterio será discutido en el capítulo 4.
92
·
Óptica geométrica
debe mover el objeto hasta que quede enfocado. Distancias comunes para
la longitud del tubo son 160 mm (norma DIN) o 170 mm (norma JIS).10
f ob
a
DA
foc
lt
P en
P ex
F oc
F'ob
O
O'
Lob
DC
Ojo
s'ex
I
F'ojo
Loc
Figura 1.83. El microscopio. La longitud del tubo lt se fija en 160 mm. Con esto,
la distancia entre el objetivo y el ocular se mantiene fija y, al cambiar la potencia
del objetivo, se debe acercar o alejar el objeto hasta que quede enfocado.
El aumento del microscopio se da como el producto del aumento que
produce el objetivo y el aumento que produce el ocular. El objetivo forma
la imagen del objeto O en O0 a la distancia lt del punto focal secundario
del objetivo, por lo que el aumento de esta imagen será mob = −lt /fob . Por
otra parte, el aumento del ocular es moc = 250/foc . Así, el aumento del
microscopio es
lt 250
m=−
,
(1.73)
fob foc
con las distancias focales dadas en milímetros. Los objetivos de microscopio cuando se usan en aire varían desde unos 4 aumentos hasta unos 40 aumentos. También se encuentran objetivos de mayor aumento, pero se usan
sumergiendo el objeto en aceite para microscopía óptica. Estos objetivos se
llaman objetivos de inmersión.
El diafragma de apertura está definido por el borde del objetivo, por lo
que allí estará la pupila de entrada. La pupila de salida estará a la derecha del
ocular y es una imagen real y de menor tamaño que el DA. Por lo general,
la pupila de salida es de menor diámetro que la pupila del ojo. Al igual que
en el telescopio refractor, se logra un acople de pupilas colocando la pupila
del ojo en la pupila de salida del microscopio.
En los objetivos de telescopios, el f /# (eq. (1.62)) es el parámetro que se
usa para establecer la cantidad de energía colectada por el objetivo y medir
el límite de resolución. En los microscopios, se usa una cantidad un poco
diferente, denominada apertura numérica N A, definida como
N A = n sin 𝜑,
(1.74)
10 La norma DIN es establecida en Alemania: Deutsche Industrie Norm. La norma JIS es
establecida en Japón: Japanese Industry Standard.
a'
Óptica geométrica
·
93
con n el índice de refracción del medio que rodea al objeto y 2𝜑 el ángulo
que subtiende la pupila de entrada (de diámetro 2rP en ) con respecto al punto
axial objeto, es decir, tan 𝜑 = −rP en /len , donde len es la distancia del objeto
a la pupila de entrada. En la fig. 1.84, se muestra un objetivo de microscopio comercial identificado con el aumento, la longitud del tubo, la apertura
numérica (en aire) y el espesor del cubre objetos que se debe usar. En este
ejemplo, la distancia focal del objetivo es fob = (160/10) mm = 16 mm.
Aumento
Longitud
del tubo
Apertura
Numérica (NA)
Espesor de la lámina
cubre objetos
Figura 1.84. Parámetros en un objetivo de microscopio (DIN 45 mm acromático). Fuente: imagen tomada de https://www.amaina.com/97-objetivos-y-oculares.
La resolución del microscopio se da mediante una cantidad análoga a la
del telescopio. Esta cantidad se denomina poder de resolución (límite de
resolución) y está dada por
1
(Δl) mı́n = 1.22𝜆
.
(1.75)
2N A
El campo objeto en un microscopio es mayor que en un telescopio. El
ángulo 𝛼 se puede calcular como 𝛼 = rDC /(lt + fob ), donde rDC es el radio
del diafragma de campo. Con 2𝛼, se estima la región del objeto que se puede
observar con el microscopio.
En la fig. 1.85, se muestra las partes básicas de un microscopio monocular (también son muy comunes los microscopios que usan dos oculares, uno
para cada ojo, y se denominan microscopios binoculares). Este microscopio
ilumina la muestra desde abajo, de modo que lo que se observa es la luz
transmitida por el objeto (microscopio de transmisión). El objeto se coloca
en la platina, la cual se puede desplazar verticalmente mediante los tornillos
macrométrico (gran desplazamiento) y micrométrico (pequeños desplazamientos) para lograr el enfoque del objeto. El revolver aloja varios objetivos
de diferente aumento y al rotarlo se selecciona el objetivo deseado. Al final
del tubo, se encuentra el ocular, en el que se coloca el ojo para observar la
94
·
Óptica geométrica
imagen final. También se puede iluminar el objeto desde arriba (por ejemplo, con un espejo cóncavo), en cuyo caso lo que se verá es la luz reflejada
por el objeto (microscopio de reflexión).
Ocular
Tubo
Revolver
Objetivo
Platina
Sistema de
iluminación
Tornillos
(macrométrico y
micrométrico)
Figura 1.85. Partes de un microscopio monocular de transmisión. Fuente: imagen tomada de https://www.euromex.com/es/productos/productos/microscopiosverticales/educacin-microscopios-verticales/microblue/.
Óptica geométrica
·
95
1.9. Aberraciones ópticas monocromáticas
En la unidad 1.3, se definió el ovoide cartesiano como la superficie de revolución que forma una imagen puntual de un objeto puntual, ambas en
el eje óptico. La forma de la superficie se encuentra a partir del principio
de Fermat y depende de las distancias del objeto y la imagen con respecto al vértice, y de los índices de refracción. Por lo tanto, para diferentes
distancias del objeto, se tendrán diferentes ovoides cartesianos. Lo anterior
impone una limitación práctica a la hora de diseñar sistemas ópticos formadores de imagen; la imagen está bien enfocada solo para una posición
del objeto. Una solución práctica es usar superficies refractoras o reflectoras
esféricas y limitar la región óptica que atravesará el flujo de energía a una
región muy pequeña alrededor del eje óptico, lo que se puede hacer con
un diafragma (de apertura) de diámetro pequeño. Esta condición se conoce
como aproximación paraxial y da lugar a la ecuación de Gauss (eq. (1.21)),
que implica que la imagen de un objeto puntual será una imagen puntual,
de manera que la imagen de un objeto extendido será una copia del objeto
salvo por un factor de escala y orientación.
Cuando el sistema óptico no se limita a la región paraxial, la imagen
ya no será una réplica del objeto. Las diferencias entre la imagen real y
la imagen paraxial (ideal) se denominan aberraciones ópticas. Un análisis
detallado de las aberraciones ópticas está fuera del alcance de este libro. El
lector interesado en ampliar este tema puede consultar el libro de Malacara
[12], entre otros. En esta unidad haremos una descripción cualitativa, muy
general, que nos permita entender conceptulamente las aberraciones ópticas
primarias monocromáticas (que no depende de la longitud de onda). La
exposición se hace para una superficie esférica refractora, pero los resultados
se extienden a sistemas de lentes. Las principales aberraciones debidas al
color de la luz (aberraciones cromáticas) se presentan en el apéndice D.
1.9.1. Curvatura de campo
En la aproximación paraxial, los rayos que salen de un objeto puntual deben ser casi paralelos al eje óptico y viajar muy cerca de este. Esto quiere
decir que la extensión del objeto (y la imagen) también debe ser pequeña en
comparación con la distancia objeto (e imagen). ¿Qué ocurre si la extensión
del objeto es comparable con la distancia objeto aun cuando el tamaño del
diafragma se mantenga pequeño? En la fig. 1.86, se representa un sistema
óptico conformado por una superficie esférica refractora y un diafragma
de apertura localizado en el centro de curvatura de la superficie. Un obje-
96
·
Óptica geométrica
to de altura h = −OP, de acuerdo con la óptica paraxial, tendrá su imagen
en un plano (plano imagen gaussiano) localizado en O0 y tendrá la altura
h 0 = O0P00. Sin embargo, debido a la extensión del objeto, la imagen de P
no está en P00, sino un poco antes. Para ver esto, consideremos los manojos de rayos que salen de O y P. El rayo principal de O será el eje óptico
OVO0 y el rayo principal de P será el eje auxiliar PV0P00. Tanto los rayos
que salen de O como los que salen de P se mantienen casi paralelos al rayo principal correspondiente, pero el rayo principal del punto P ya no es
paraxial. La distancia objeto PV0 es mayor que la distancia objeto OV, y de
la eq. (1.21) resulta, entonces, que la distancia imagen V0P0 es menor que
la distancia imagen VO0. La imagen P0 estará en el eje auxiliar, pero a la
izquierda de la esfera de radio CO0 centrada en C. En conclusión, la imagen de un plano localizado en O es una superficie de revolución con vértice
en O0. Esta superficie se denomina superficie de Petzval. En primera aproximación, la superficie de Petzval (Ptz) es un paraboloide de revolución con
vértice en O0, es decir
h 02
Ptz =
,
(1.76)
2rPtz
donde rPtz es el radio de curvatura en el vértice del paraboloide. En un sistema óptico de varias superficies refractoras, el inverso del radio de curvatura
depende de la suma de la potencia refractiva de las superficies. En la aproximación de lentes delgadas, el radio de la Petzval para N lentes está dado
por
N
Õ
1
P̃k
=−
,
(1.77)
rPtz
nk
k=1
con P̃k dado por la eq. (1.54) y nk el índice de refracción de la lente k. Así
que combinando lentes positivas y negativas se logra aumentar el radio de
curvatura, es decir, aplanar la superficie imagen.
Plano imagen gaussiano
Esfera centrada en C
Superficie de Petzval
R
O
V
DA
C
P'
P''
O'
V'
P
n
n'
Figura 1.86. Curvatura de campo. La imagen de un plano es una superficie denominada superficie de Petzval.
Óptica geométrica
·
97
Usualmente, la imagen se registra en un sensor plano (película fotográfica, cámara CCD o CMOS). Supongamos que el sensor se ubica en el plano
imagen gaussiano. Teniendo en cuenta que la imagen de un punto es también un punto en la superficie de Petzval, entonces la imagen de un objeto
extendido en el plano imagen gaussiano está enfocada en el eje óptico y a
medida que nos alejamos del eje se irá desenfocando cada vez más, como se
muestra en la fig. 1.87. Este defecto se conoce como aberración curvatura de
campo. Si el diámetro del diafragma se reduce también se reduce el defecto.
En el límite, un diafragma de radio que tiende a cero solo dejaría pasar el
rayo principal y la imagen de cualquier punto del objeto se vería como una
imagen puntual. En otras palabras, el efecto de la curvatura de campo sobre
la imagen también se puede disminuir reduciendo el tamaño del diafragma
de apertura (a costa de dejar pasar menos energía luminosa).
Plano imagen gaussiano
Superficie de Petzval
O'
Imagen de puntos del objeto a
diferente altura
Figura 1.87. Imagen de puntos del objeto a diferentes alturas afectados por la
curvatura de campo.
1.9.2. Esférica
Esta aberración ya se mencionó en la unidad 1.3 para la refracción en una
superficie esférica y en la unidad 1.4 para la reflexión en una superficie esférica. En las figs. 1.24 y 1.35, se muestra la refracción y la reflexión, respectivamente, de un manojo de rayos limitados por un diafragma de apertura
efectivo de gran diámetro. Los rayos marginales, al refractarse, en el primer
caso, y al reflejarse, en el segundo, no convergen al punto donde convergen
los rayos paraxiales correspondientes. Este defecto se denomina aberración
esférica y se puede disminuir su efecto reduciendo el tamaño del diafragma
de apertura.
98
·
Óptica geométrica
DA
R
y
O
Rayo margin
al
Rayo paraxial
V
C
-s
O'
S'
s'
n
n'
Figura 1.88. Aberración esférica. Los rayos marginales no paraxiales no convergen en un mismo punto en el eje óptico.
En la fig. 1.88, se muestra la refracción en una superficie esférica del rayo
marginal y de un rayo paraxial. El diafragma de apertura se ha colocado a
la izquierda del vértice de la superficie. Cuantitativamente, la aberración
esférica se puede medir como
SphL = S 0 − s 0 ,
(1.78)
es decir, la diferencia longitudinal entre el punto de intersección del rayo
marginal y el punto de intersección del rayo paraxial en el eje óptico. En
primera aproximación esta aberración depende cuadráticamente de la altura
del rayo marginal, de modo que
SphL = as y 2 ,
(1.79)
donde el coeficiente as depende de los parámetros del sistema (distancia
objeto, radios de curvatura de las superficies, índices de refracción), pero no
depende de la altura del objeto (imagen). La aberración esférica es positiva
si S 0 > s 0 (as > 0) y negativa si S 0 < s 0 (as < 0).
En al fig. 1.89, se muestra la refracción de un manojo de rayos que divergen del punto O afectado por aberración esférica. En el plano imagen
gaussiano la intersección de los rayos determina el tamaño de la imagen del
punto, como se muestra en la figura. La curva tangente a la intersección
de los rayos refractados se denomina la cáustica y es una curva de máxima
energía. Se observa que la cáustica tiene una sección transversal mínima,
denominada cintura. En esta sección los rayos refractados tienen la menor
dispersión radial. Por lo que allí se tendrá la mejor imagen del punto O,
esto es, el menor desenfoque posible para el tamaño del diafragma dado.
La aberración esférica afecta de la misma manera a puntos del objeto fuera
de eje.
Óptica geométrica
·
99
Tamaño de la imagen del punto P
Cáustica
C
O
Cintura
n
Plano imagen
gaussiano
n'
Figura 1.89. Cáustica de los rayos afectados por aberración esférica. En la cintura
de la cáustica se logra la mejor imagen para P.
1.9.3. Distorsión
Supongamos que el diafragma de la fig. 1.89 se cierra de manera que se
puede despreciar el efecto de la aberración esférica para los rayos que salen
del punto axial O; nuevamente, tenemos que la imagen de O es un punto
en O0, como se muestra en la fig. 1.90. Por otro lado, del punto P, que está
fuera de eje, también sale un manojo de rayos con los rayos viajando muy
cerca del rayo principal que incide en el punto Q de la superficie. Por lo
tanto, para los rayos que salen de P también se puede despreciar el efecto
de la aberración esférica con respecto al rayo principal. Sin embargo, la
distancia del punto Q con respecto al eje auxiliar PV0P00 es mayor que el
tamaño del diafragma, de modo que el rayo principal que sale de P sí está
afectado por aberración esférica y la imagen P0 de P estará a la distancia
2
SphL ≈ as QV0 de la superficie de Petzval.
Plano imagen gaussiano
Superficie de Petzval
DA
R
Q
O
V
P'
C
P''
P'''
Dist
O'
V'
P
n
n'
Figura 1.90. La distorsión deforma la imagen pero mantiene el enfoque de cada
punto. Esta aberración depende de la posición del diafragma de apertura.
Como la imagen se observa en el plano imagen gaussiano, lo que veremos es la proyección de rayos que divergen de P0. Ya que el diafragma
es pequeño y en la práctica VO0 SphL, entonces la intersección de estos rayos en el plano imagen gaussiano se verá aproximadamente como un
punto, que se denota por P000 en la fig. 1.90. Así, P000 será la imagen de P
100
·
Óptica geométrica
en el plano imagen gaussiano. La diferencia entre la altura de P000, h̄ 0, y la
altura de la imagen Gaussiana P00, h 0, se denomina aberración de distorsión
o simplemente distorsión (Dist).
En la fig. 1.86, el diafragma está localizado en el centro de curvatura de
la superficie. Note que la proyección de los rayos que divergen de P0 llega a
P00, por lo tanto, no hay distorsión. La distorsión depende de la posición del
diafragma. En la fig. 1.90, el diafragma está a la izquierda de C y la altura
de la imagen P000 es menor que la altura de la imagen Gaussiana P00; en este
caso, se dice que se tiene distorsión de barril. Si el diafragma se coloca a la
derecha de C, se tendrá lo contrario: la altura de la imagen P000 será mayor
que la altura de la imagen Gaussiana P00; en este caso, se dice que se tiene
distorsión de cojín.
DA
DA
DA
O
P
Objeto
P
P
P
O
O
O
Imagen con
distorsión de barril
Imagen ideal
Imagen con
distorsión de cojín
Figura 1.91. Ejemplos de distorsión. El DA está a la izquierda de la lente y se
tiene la imagen con distorsión de cojín. El DA está justo al lado de la lente de la
lente y se tiene la imagen (prácticamente) sin distorsión. El DA está a la derecha de
la lente y se tiene la imagen con distorsión de barril.
En primera aproximación la distorsión también depende del cubo de h 0
Dist = at h 03 = h̄ 0 − h 0 ,
(1.80)
donde at es el coeficiente de distorsión que depende de los parámetros del
sistema y de la posición del diafragma de apertura. En la fig. 1.91, se muestran las posibles configuraciones para la imagen afectada por distorsión en
un sistema óptico de aumento m = −1 formado por una lente delgada biconvexa. Cuando el diafragma está justo al lado de la lente la distorsión, es
aproximadamente cero. Estrictamente, la distorsión es cero cuando el diafragma está en el centro (dentro) de la lente. En un sistema de varias lentes,
el diafragma se localizará entre las lentes buscando la mayor simetría posible
para tener la mínima distorsión.
Óptica geométrica
·
101
1.9.4. Astigmatismo y coma
Para ver estas dos aberraciones, primero vamos a definir el plano tangencial
y el plano sagital. En la sección 1.3.5, se definió el plano meridional como
el plano que contiene al eje óptico. Los objetos extendidos los representamos como flechas de una altura dada contenidos en el plano meridional y
los rayos que salen de un punto cualquiera del objeto también quedaron limitados al plano meridional. En particular, en un sistema óptico el plano
que contiene al eje óptico y al rayo principal, se denomina plano tangencial, y el plano que contiene al rayo principal y, además, es ortortogonal al
plano tangencial, se denomina plano sagital. El plano tangencial es un plano
meridional, pero el plano sagital no lo es. El plano tangencial mantiene su
orientación espacial a lo largo del sistema óptico, en cambio, el plano sagital
cambia su inclinación de la misma forma como lo hace el rayo principal. En
la fig. 1.92, se ilustran estos planos en un sistema conformado por un diafragma y una superficie refractora convexa. La altura del objeto es h = −OP
y la altura de la imagen es h 0 = O0P0. Los rayos que salen de P y que están
en el plano tangencial se denominan rayos tangenciales (en azul); los rayos
que salen de P y que están contenidos en el plano sagital se denominan rayos sagitales (en rojo). En fig. 1.92, se muestra la proyección del diafragma
en la superficie y se marcan cuatro puntos: T1 y T2 corresponden con la
intersecciones de los rayos tangenciales marginales en la superficie; S1 y S2
corresponden con las intersecciones de los rayos sagitales marginales en la
superficie.
Superficie
refractora
P'
T1
DA
O'
S2
Plano
tangencial
S1
T2
O
P
Plano
sagital
Figura 1.92. Definición de los planos tangencial (azul) y sagital (rojo).
En la fig. 1.93, se muestra el plano meridional que contiene los rayos
tangenciales marginales que pasan por T1 y T2 . Los puntos sagitales S1 y
·
102
Óptica geométrica
S2 se proyectan en este plano meridional en un solo punto. Teniendo en
cuenta el efecto de la aberración esférica sobre los rayos marginales, se tiene que los rayos sagitales marginales después de refractarse en los puntos
S1 y S2 (rayos en rojo) se intersecan en el eje óptico auxiliar, debido a la
simetría de S1 y S2 con respecto al vértice V0. Por otra parte, los rayos tangenciales marginales después de refractarse en los puntos T1 y T2 (rayos
en azul) no se intersecan en el eje óptico auxiliar, ya que T1 y T2 no se
encuentran a la misma distancia del vértice V0, como se puede apreciar en
la parte superior izquierda de la figura. Esta asimetría da lugar a las aberraciones de astigmatismo y coma, que se definen a partir de las siguientes
intersecciones: T10 , intersección del rayo tangencial marginal superior con
el eje auxiliar; T20 , intersección del rayo tangencial marginal inferior con el
eje auxiliar; T0, intersección entre los rayos tangenciales marginal superior e
inferior; S0, intersección entre los rayos sagitales marginales, que se localiza
en el eje auxiliar. La distancia longitudinal entre las proyecciones transversales de S0 y T0 sobre el rayo principal define la aberración de astigmatismo
(longitudinal), AstL. La distancia transversal entre T0 y rayo principal define
la aberración de coma tangencial, ComaT ; la distancia transversal entre S0 y
rayo principal define la aberración de coma sagital, ComaS .
T1
S2
A
T2
V
V'
O
S1
DA
T'
T1
S1
P'
T'1 S'
T'2
P''
P'''
S2
T2
C
V
O''
O'
V'
P
n
n'
Figura 1.93. Definición de las aberraciones astigmatismo y coma para los rayos
marginales tangenciales (en azul) y sagitales (en rojo). La distancia S0T0 a lo largo
del rayo principal es el astigmatismo (longitudinal). La distancia entre T0 y rayo
principal es la coma tangencial (transversal), y la distancia entre S0 y el rayo principal es la coma sagital (transversal). El rayo principal interseca la superficie en A y
al eje auxiliar en P0.
Astigmatismo
A medida que disminuye la altura del objeto, la aberración esférica que experimentan los rayos marginales (medida desde el eje auxiliar) también disminuye, por lo que las intersecciones T0 y S0 se acercan a la superficie de
Petzval. En el eje óptico, T0 y S0 coinciden (el astigmatismo es igual a cero)
Óptica geométrica
·
103
en el punto O00 que está de O0 a la distancia SphL ≈ as (T1 V) 2 = as (T2 V) 2
(fig. 1.93). En primera aproximación, para un objeto plano, T0 y S0 describen dos paraboloides de revolución con vértice en O00, denominados superficies astigmáticas. A medida que se cierra el diafragma, O00 se acerca a O0
y las superficies astigmáticas también se desplazan hacia O0. Para una altura fija del objeto el AstL no cambia, en otras palabras, el AstL no depende
del tamaño del diafragma. En la fig. 1.94, se muestra las secciones de las
superficies astigmáticas en el plano tangencial, denotadas por T y S, suponiendo que el diámetro de DA tiende a cero11 (O00 coincide con O0). En T
se enfocan los rayos tangenciales marginales, mientras que los rayos sagitales marginales aún no se intersecan. En un plano transversal, pasando por
T, los rayos marginales describen una línea (horizontal), denominada línea
focal tangencial, como se muestra en (b). En S, se enfocan los rayos sagitales
marginales, mientras que los rayos tangenciales marginales divergen de T0.
En un plano transversal, pasando por S, los rayos marginales describen una
línea (vertical), denominada línea focal sagital, como se muestra en (d). La
longitud de las líneas focales es igual y depende del tamaño del diafragma
de apertura. En medio de las superficies astigmáticas, se encuentra la superficie M con la característica que allí los rayos marginales describen una
circunferencia cuyo diámetro es la mitad de la longitud de las líneas focales, como se muestra en (c). En la vertical, se tienen las intersecciones de los
rayos tangenciales marginales T1 y T2 , y en la horizontal, se tienen las intersecciones de los rayos sagitales marginales S1 y S2 . En particular, los rayos
tangenciales marginales han invertido sus posiciones. Al círculo en M se le
denomina círculo de menor confusión. Para un plano localizado antes de
T, los rayos marginales describen una elipse con el eje mayor definido por
los rayos sagitales, como se muestra en (a). Finalmente, en el plano imagen
gaussiano, los rayos marginales también describen una elipse, pero ahora el
eje mayor lo definen los rayos tangenciales. También se incluye la superficie
de Petzval, en la que se formaría la imagen en ausencia de astigmatismo.
De acuerdo con lo dicho anteriormente, la imagen de un objeto puntual
fuera de eje cambiará su geometría dependiendo del plano que se utilice para observar la imagen. Los rayos marginales describen el borde de la imagen
correspondiente al punto. Los demás rayos, que van dentro del diafragma,
llenarán la figura descrita por los rayos marginales. Reduciendo el tamaño
del diafragma disminuye la longitud de las líneas focales, es decir, en general el tamaño de las elipses disminuye, por lo que se optimiza la imagen
del punto. En la superficie M, se tendrá la mejor imagen para el punto (una
11 Esta
condición implica que la coma también tiende a cero.
104
·
Óptica geométrica
mancha simétrica). Sin embargo, las curvas astigmáticas no cambian su forma con la variación del tamaño del diafragma de apertura.
(a)
(b)
T1
S2
S1
S2
T2
(c)
T1
T2
S1
P
S2
S1
T1
(e)
T2
T2
T2
DA
O
(d)
T1
M
n'
S Ptz P''
P'''
O'
C
V
S2
T1
T
n
S1
S2 S1
AstL
Figura 1.94. Curvas astigmáticas T y S e intersección de los rayos marginales en
diferentes planos en ausencia de la aberración de coma. La proyección de los rayos
marginales en el plano imagen gaussiano es una elipse. En M, se obtiene el círculo
de menor confusión.
Las distancias de T y S con respecto a Ptz satisfacen PtzT = 3PtzS.
Al igual que la superficie de Petzval, las superficies astigmáticas se pueden
caracterizar por los radios de curvatura en el vértice O0, los cuales dependen de los parámetros del sistema óptico y de la posición del diafragma.
Entonces
h 02
T=
(1.81)
2rT
y
h 02
S=
.
(1.82)
2rS
Coma
Ahora vamos a suponer que se tiene la aberración de coma y que no hay
astigmatismo. Así, los puntos T0 y S0 estarán en un mismo plano ortogonal
al eje óptico y se tiene la relación ComaT = 3ComaS . La ComaS depende
linealmente de la altura h 0, luego,
ComaS = ac h 0 ,
(1.83)
Óptica geométrica
·
105
donde el coeficiente de coma depende de los parámetros del sistema óptico
y la posición y tamaño del diafragma de apertura. La figura que describen
los rayos marginales es una circunferencia (círculo comático) de radio igual a
ComaS y con su centro a la distancia 2ComaS del rayo principal. Al disminuir
el radio del diafragma de apertura disminuye el valor de ComaS , por lo que
disminuye el radio del círculo comático y se acerca al rayo principal, como
se muestra en la fig. 1.95. La figura que se tiene se asemeja a un cometa, de
ahí el nombre para esta aberración. Al ir de T1 a S1 en la fig. 1.92 siguiendo
la proyección del diafragma en la superficie refractora, en la figura comática
se va desde T0 hasta S0 en el círculo correspondiente, es decir, mientras se
da una vuelta en el borde del diafragma se dan dos vueltas en el círculo
comático correspondiente.
P'
Coma S
S'
S'
Coma S
T'
ComaT
T'
Figura 1.95. Geometría de la aberración de coma. Cada círculo corresponde a un
diámetro del diafragma de apertura.
Ejemplo: la PSF geométrica
DA
H H'
_
h' = 9.28
h = - 10
f = 49.5
Figura 1.96. Sistema óptico para ver la PSF en diferentes planos para la imagen.
Hasta aquí hemos hecho una descripción cualitativa de las aberraciones ópticas primarias por separado con el propósito de entender las principales
características de cada una de ellas. Sin embargo, en la práctica en la imagen se tiene la mezcla de las aberraciones. En el plano imagen gaussiano
106
·
Óptica geométrica
tendremos entonces que la imagen de un punto fuera del eje óptico será,
en general, una mancha asimétrica denominada PSF geométrica (del inglés
Point Spread Function).
Para ver esto, vamos a considerar el sistema óptico de la fig. 1.96, cuyos
datos están dados en la tabla 1.3. En particular, vamos a considerar la formación de la imagen de dos puntos en el plano objeto: el punto en eje, con h = 0
y el punto fuera de eje, con h = −10 mm. La distancia focal de esta lente es
f = 49.55 mm, la altura imagen Gaussiana es h 0 = 9.3844 mm y la altura
del rayo principal en el plano imagen gaussiano es h̄ 0 = 9.2817 mm, por lo
que la distorsión del rayo principal resulta ser Dist(h = −10) = −0.1027
mm.
Tabla 1.3. Sistema óptico de una lente biconvexa con diafragma de apertura. El
radio y el espesor se dan en mm.
Superficie
0 (Obj)
1 (DA)
2
3
4 (Imag)
Radio
Espesor
Índice
80
1.0000
20
1.0000
7
1.5168
93.7
1.0000
∞
∞
50
-50
∞
Convención de colores (figs. 1.97-1.101). La PSF será dibujada mediante
un diagrama de puntos (pequeños círculos) correspondientes a las intersecciones de los rayos que emergen de un objeto puntual con el plano imagen.
Este tipo de diagrama se denomina diagrama de manchas (spot diagram). El
diagrama de manchas en el plano imagen lo presentaremos de dos formas:
la primera, para rayos tangenciales y sagitales distribuidos uniformemente
en el diafragma de apertura (ambos en color negro, a lo largo de las direcciones x 0 y y 0); la segunda, para rayos marginales distribuidos uniformemente
en el perímetro de tres círculos concéntricos con el diafragma de apertura,
con diámetros D1 = DDA (en color negro), D2 = 2DDA /3 (en color verde), y
D3 = DDA /3 (en color magenta). Los puntos T1 y T2 en los rayos tangenciales marginales se pintan de azul y los puntos S1 y S2 en los rayos sagitales
marginales se pintan de rojo.
Óptica geométrica
·
107
Los cálculos para obtener los diagramas de manchas se realizan con las
ecuaciones para trazo exacto de rayos presentadas por Kingslake.12 En todos
los casos, el origen de coordenadas corresponde con la intersección del rayo
principal con el plano imagen.
30
30
T2
20
DA = 5 mm
10
10
Plano imagen, Ds' = 0
(Plano imagen gaussiano)
0
S1
S2
y' (mm)
20
y' (mm)
h=0
-10
-10
-20
(a)
-30
-30
0
-20
T1
-20
-10
0
x' (mm)
10
20
-30
-30
30
30
h=0
20
20
DA = 5 mm
10
(b)
0
S1
S2
T1
-20
-10
0
10
20
30
0
10
20
30
x' (mm)
0
-10
-10
-20
-20
-30
-30
-10
10
T2
y' (mm)
Plano imagen, Ds' = - 0.63 mm
(Círculo de menor confusión)
y' (mm)
30
-20
-20
-10
0
x' (mm)
10
20
30
-30
-30
x' (mm)
Figura 1.97. Aberración esférica con un diafragma de 5 mm de diámetro. (a) En
el plano imagen gaussiano la imagen es un mancha circular de unos 60 𝜇m. (b) Al
desplazar el plano imagen una distancia -0.63 mm del plano imagen gaussiano se
obtiene la mancha circular de menor tamaño (círculo de menor confusión) con un
tamaño aproximado de 12 𝜇m. Ver convención de colores en la página 106.
En la fig. 1.97, se muestra los diagramas de manchas para el objeto puntual en eje cuando el diafragma de apertura tiene un diámetro de 5 mm.
En (a), se observa la imagen en el plano imagen gaussiano. El tamaño de
la imagen resulta ser una mancha circular de 55 𝜇m de diámetro aproximadamente. Note que aunque los rayos marginales se distribuyen en el
diafragma en tres círculos cuyos radios varían uniformemente, no ocurre lo
mismo con los radios de los círculos en la imagen. Debido a la dependencia
cuadrática de la aberración esférica longitudinal con el tamaño del diafrag12 En el libro Lens Design Fundamentals de Rudolf Kinslake, se encuentra una versión de la
ecuaciones para realizar trazo exacto de rayos en sistemas ópticos con simetría de revolución.
Los cálculos mostrados en este ejemplo se realizaron con un programa desarrollado por el
autor (Yobani Mejía).
108
·
Óptica geométrica
ma, se puede mostrar que el tamaño de los círculos en la imagen varía con el
cubo del tamaño del diafragma. Así, mientras que para un diafragma 5 mm
de diámetro se obtiene una mancha de unos 55 𝜇m de diámetro, para un
diafragma de 1.67 mm de diámetro se obtiene una mancha de 2 𝜇m de diámetro aproximadamente, lo cual representa una gran mejora en la imagen.
En (b), se reduce el tamaño de la imagen cuando el plano imagen se desplaza Δs 0 = −0.63 mm con respecto al plano imagen gaussiano. Esta situación
corresponde con la cintura de la cáustica (fig. 1.89), en la que se obtiene la
mancha circular del menor diámetro. En este caso, la imagen ahora tiene
un diámetro de 12 𝜇m aproximadamente.
Las otras aberraciones se manifiestan en la imagen cuando el objeto puntual se desplaza del eje óptico. Para ver inicialmente el astigmatismo, consideremos el objeto puntual fuera de eje (h = −10 mm), con un diafragma de
1 mm de diámetro. En la fig. 1.98(a), se muestra el diagrama de manchas
correspondiente, el cual se asemeja a una elipse. La asimetría de la elipse se
debe a la presencia de coma. En la dirección del plano tangencial, el tamaño
es 70 𝜇m aproximadamente. Note que para el diafragma de 1 mm el diámetro de la mancha circular, debido a la aberración esférica será 60/125 mm
aproximadamente, lo cual es mucho menor que el tamaño del eje mayor
de la elipse astigmática. Por lo que el aumento de la PSF se debe principalmente al astigmatismo. En la fig. 1.98(b), el plano imagen se desplazó
Δs 0 = −2.0 mm con respecto al plano imagen gaussiano para encontrar la
línea focal sagital. En efecto, se observa que los puntos S1 y S2 coinciden.
En la fig. 1.98(c), el plano imagen se desplazó Δs 0 = −4.5 mm con respecto
al plano imagen gaussiano para encontrar la línea focal tangencial. Ahora los
puntos T1 y T2 coinciden y los puntos S1 y S2 se separan intercambiando
sus posiciones con respecto a las posiciones que tienen en la fig. 1.98(a). Lo
anterior nos dice que AstL = 2.5 mm aproximadamente.13
Al cambiar el tamaño del diafragma a 5 mm de diámetro, el efecto de la
aberración de coma se hace notable. En la fig. 1.99(a), el diagrama de manchas es más asimétrico y ahora se asemeja a la figura comática (fig. 1.95).
También aumentó considerablemente el tamaño de la imagen, que mide a
lo largo del plano tangencial 370 𝜇m aproximadamente, en comparación
con el tamaño de la imagen afectada solo por aberración esférica (60 𝜇m),
como se muestra en la fig. 1.97(a). Al desplazar el plano imagen a las posiciones en que se encontró las líneas focales mostradas en la fig. 1.98, se llega
a que ahora el diagrama de manchas difiere mucho de un par de líneas (vertical y horizontal). Lo anterior es consecuencia del aumento de la coma al
13 En
el programa de trazo de rayos, para el astigmatismo y la coma, el plano imagen se
desplaza en pasos de 0.1 mm. Por lo tanto, el valor del AstL es aproximado.
Óptica geométrica
·
109
aumentar el diámetro del diafragma. Note que, al aumentar el diámetro del
diafragma, los rayos sagitales marginales S1 y S2 y tangenciales marginales
T1 y T2 experimentan mayor aberración esférica longitudinal, por lo que
se enfocaran antes con respecto a las posiciones para un diafragma de 1 mm
de diámetro. Esto explica por qué en las figs. 1.99(b) y (c) los rayos sagitales
marginales y los tangenciales marginales no coinciden, como sí ocurre en
las figs. 1.98 (b) y (c).
Para que los rayos sagitales marginales y tangenciales marginales coincidan, se debe desplazar aún más el plano imagen. En la fig. 1.100(a), el plano
imagen se ha desplazado Δs 0 = −2.7 mm, donde S1 y S2 coinciden, es decir,
donde se tendría la línea focal sagital. En la fig. 1.100(b), el plano imagen se
ha desplazado Δs 0 = −5.3 mm, donde T1 y T2 coinciden, es decir, donde se
tendría la línea focal tangencial. Aunque los diagramas de manchas en (a) y
en (b) distan de ser una línea vertical (en (a)) y horizontal (en (b)), el tamaño
en general es menor en un factor aproximado de 2. Note que la diferencia
entre las dos posiciones de los planos imagen es AstL = 2.6 mm aproximadamente. Esto muestra que, en efecto, el AstL no depende del tamaño del
diafragma.
Para terminar, consideremos nuevamente la fig. 1.98. Aquí tenemos tres
posiciones para el plano imagen. ¿Cuál replica mejor al objeto puntual?
Idealmente, la imagen de un objeto puntual es un punto, así que esperaríamos que la imagen se parezca a una mancha circular. En la fig. 1.94, se
mencionó que en medio de las superficies astigmáticas se tiene el círculo de
menor confusión. Esto sería la mejor imagen que se puede tener en presencia de astigmatismo. Para nuestro ejemplo, con el diafragma de diámetro
1 mm, el plano imagen se debe desplazar Δs 0 = −3.3 mm con respecto
al plano imagen, lo que resulta ser AstL/2 = 1.3 mm a la izquierda de la
superficie S. En la fig. 1.101, se muestra el diagrama de manchas correspondiente. Aunque el diafragma es pequeño, se nota el efecto de la coma
en la asimetría de la PSF. Esta es la mejor imagen para el objeto puntual
h = −10 mm. El punto central de la imagen está en h̄ 0 = 9.28 mm. Si se
cambia la altura del objeto puntual, el círculo de menor confusión se encontrará en otra posición para el plano imagen. Por lo tanto, en un objeto
extendido la imagen estará bien enfocada en unas regiones y desenfocada
en otras. Con la combinación de lentes en un sistema óptico se busca disminuir las aberraciones ópticas, de modo que el enfoque global de la imagen
sea óptimo.
Cuando la iluminación del objeto es policromática resulta otro tipo de
aberraciones: aberración cromática axial y aberración cromática transversal.
110
·
Óptica geométrica
En el apéndice D se definen estas aberraciones y se hace una breve descripción de ellas.
30
Plano imagen, Ds' = 0
y' (mm)
DA = 1 mm
(Plano imagen gaussiano)
(a)
30
T2
20
20
10
10
y' (mm)
h = - 10 mm
0
S1
S2
-10
-20
-20
-30
-30
T1
-30
-20
-10
0
x' (mm)
10
20
30
30
h = - 10 mm
DA = 1 mm
y' (mm)
y' (mm)
0
S2 S1
-10
0
x' (mm)
10
20
-30
-20
-10
30
0
10
20
30
0
10
20
30
0
30
x' (mm)
30
20
20
10
10
0
T2 T1
S2
y' (mm)
y' (mm)
-10
20
-30
-20
30
(c)
-20
10
-20
T1
-30
-30
Plano imagen, Ds' = - 4.5 mm
(Plano imagen línea focal tangencial)
-30
0
x' (mm)
-10
-20
DA = 1 mm
-10
10
-10
h = - 10 mm
-20
20
T2
10
(b)
-30
30
20
Plano imagen, Ds' = - 2.0 mm
(Plano imagen línea focal sagital)
0
-10
S1
0
-10
-10
-20
-20
-30
-30
-30
-20
-10
0
x' (mm)
10
20
30
x' (mm)
Figura 1.98. Aberración de astigmatismo. (a) En el plano imagen gaussiano el
diagrama de manchas se asemeja a una elipse, como en 1.94(e). Aquí la elipse es
ligeramente asimétrica debido a la presencia de coma. En (b) y (c), se muestran
las líneas focales sagital y tangencial, respectivamente. El efecto de la aberración
de coma, pequeño, por lo que se pueden apreciar muy bien las líneas focales. Ver
convención de colores en la página 106.
Óptica geométrica
300
h = -10 mm
200
200
DA = 5 mm
100
T2
0
S1
S2
-100
0
-100
-200
(a)
-200
T1
-300
-300
-200
-100
0
x' (mm)
100
200
-300
-300
300
300
h = -10 mm
200
200
DA = 5 mm
100
0
S1
S2
-100
-300
-300
T1
-200
-100
0
x' (mm)
100
200
-300
-300
300
200
DA = 5 mm
100
100
0
S2
T2
y' (mm)
200
y' (mm)
h = -10 mm
S1
T1
-100
-200
-100
200
300
0
100
200
300
0
100
200
300
x' (mm)
0
-100
-200
-300
-300
-100
100
-200
300
(c)
-200
0
x' (mm)
0
300
Plano imagen, Ds' = - 4.5 mm
-100
-100
-200
(b)
-200
100
T2
y' (mm)
y' (mm)
300
Plano imagen, Ds' = - 2 mm
111
100
y' (mm)
Plano imagen, Ds' = 0
(Plano imagen gaussiano)
y' (mm)
300
·
-200
-200
-100
0
x' (mm)
100
200
300
-300
-300
x' (mm)
Figura 1.99. La aberración de coma se hace más relevante al aumentar el diámetro
del diafragma de apertura. (a) En el plano imagen gaussiano se hace evidente la
forma comática. En (b) y (c), se desplaza el plano imagen para encontrar las líneas
astigmáticas, las cuales están muy afectadas por coma. Ver convención de colores
en la página 106.
112
·
Óptica geométrica
180
h = -10 mm
120
120
DA = 5 mm
60
60
y' (mm)
Plano imagen, Ds' = - 2.7 mm
(Plano imagen línea focal sagital)
y' (mm)
180
T2
0
S2
S1
-60
-60
-120
(a)
-180
-180
0
-120
T1
-120
-60
0
60
120
-180
-180
180
-120
-60
x' (mm)
h = -10 mm
120
120
DA = 5 mm
60
60
y' (mm)
180
y' (mm)
180
Plano imagen, Ds' = - 5.3 mm
(Plano imagen línea focal tangencial)
0
S2
S1
-60
-180
-180
60
120
180
60
120
180
0
-60
T2 T1
-120
(b)
0
x' (mm)
-120
-120
-60
0
60
120
-180
-180
180
-120
-60
x' (mm)
0
x' (mm)
Figura 1.100. Diagrama de manchas en que los rayos sagitales marginales (a) y los
tangenciales marginales coinciden. Esto corresponde con las líneas focales cuando
el diafragma tiene un diámetro de 5 mm. Ver convención de colores en la página
106.
30
h = - 10 mm
20
DA = 1 mm
(Plano imagen mancha de
menor confusión)
y' (mm)
Plano imagen, Ds' = - 3.3 mm
10
T2
0
S2
S1
-10
T1
-20
-30
-30
-20
-10
0
10
20
30
x' (mm)
Figura 1.101. Diagrama de manchas correspondiente al círculo de menor confusión para las superficies astigmáticas cuando el diámetro del diafragma de apertura
es 1 mm. La asimetría se debe a la presencia de coma. Ver convención de colores
en la página 106.
Capítulo
dos
Polarización
Polarización
(a) Imagen con luz no polarizada
·
115
(b) Imagen con luz polarizada
Figura 2.1. Polarización por reflexión. La luz que viene de la ventana no está
polarizada. Al reflejarse en una lámina de vidrio (superficie lisa), como en (a), se
observa parte de la ventana junto con el texto que está debajo de la lámina. Si
se observa la reflexión formando un ángulo con la normal de la lámina cercano
al ángulo de Brewster, la luz estará linealmente polarizada, lo que se comprueba
colocando un polarizador lineal entre la lámina y la cámara que forma la imagen.
Con esto elimina la luz reflejada y se puede ver claramente el texto que está debajo
de la lámina, como se muestra en (b).
De acuerdo con la física clásica, la luz es una onda electromagnética y sus
propiedades se obtienen de las ecuaciones de Maxwell. Una de estas propiedades es que la luz es una onda transversal, es decir, los vectores eléctrico y
magnético (campo óptico) vibran ortogonalmente a la dirección de propagación de la onda. Si suponemos que la fuente de luz está compuesta por
osciladores que emiten energía electromagnética, en general las direcciones
de los vectores eléctrico y magnético son aleatorias. Sin embargo, mediante ciertos mecanismos es posible mantener la vibración del vector eléctrico
(magnético) resultante en un plano fijo o siguiendo una curva elíptica o circular. Entonces, se dice que la onda está polarizada. En este capítulo, se
define polarización y se muestran algunas aplicaciones.
Teniendo en cuenta la linealidad de las ecuaciones de Maxwell, limitaremos el estudio de la polarización a las ondas planas armónicas. Aunque el
campo óptico emitido o reflejado puede tener cualquier forma, del análisis
de Fourier se tiene que la forma compleja del frente de onda del campo óptico se puede sintetizar mediante la suma de ondas planas armónicas. Así,
los resultados para las ondas planas se hacen extensivos para formas más
complejas del campo óptico.
En este capítulo, primero se desarrolla el álgebra para describir la polarización lineal, elíptica y circular, y se usa el formalismo de Jones para
describir los estados de polarización y los elementos polarizadores. Entre
116
·
Polarización
los mecanismos de polarización, se discute en cierto detalle el dicroísmo, la
polarización por reflexión externa y total interna, y la birrefringencia, limitando este último al caso en que las direcciones principales para los índices
de refracción coinciden con los ejes del cristal. Los medios refractivos que
vamos a considerar son dieléctricos sin absorción.
Polarización
·
117
2.1. Ondas planas y luz polarizada
En el vacío, para un punto r = (x, y, z) y el tiempo t, el campo óptico se
describe mediante el vector eléctrico E y el vector magnético H, los cuales
se relacionan entre sí de acuerdo con las ecuaciones de Maxwell, dadas por
𝜕H
,
𝜕t
(2.1)
𝜕E
,
𝜕t
(2.2)
∇ × E = − 𝜇0
∇ × H = 𝜖0
∇ · E = 0,
(2.3)
∇ · H = 0.
(2.4)
La ecuación de onda para el campo eléctrico, a partir de las eqs. (2.1),
(2.2) y (2.3), queda1
1 𝜕2E
(2.5)
∇2 E = 2 2 ,
c 𝜕t
con c 2 = 1/ 𝜇 0 𝜖 0 . Para el campo magnético, se obtiene una ecuación análoga
a la eq. (2.5).
Ya que E(x, y, z) = {Ex (x, y, z), Ey (x, y, z), Ez (x, y, z)}, para un tiempo t, la eq. (2.5) representa un conjunto de tres ecuaciones, una para cada
componente del campo E. Si representamos cualquiera de estas componentes por V = V (x, y, z), se tiene una ecuación escalar de la forma
𝜕 2V 𝜕 2V 𝜕 2V
1 𝜕 2V
+
+
=
.
𝜕x 2
𝜕y 2
𝜕z2
c 2 𝜕t 2
(2.6)
Sea ŝ = (sx , sy , sz ) un vector unitario en una dirección fija del espacio, la
solución de la eq. (2.6) de la forma V (r, t) = g (r · ŝ, t) representa una onda
plana homogénea que se propaga en la dirección ŝ, ya que en un tiempo
dado g es constante para los planos r · ŝ = a (con a constante).
En particular, una onda plana armónica se puede escribir como
V (r, t) = A0 cos(kr · ŝ − 𝜔t + 𝛿),
(2.7)
donde A0 es la amplitud de la onda. k = 2𝜋/𝜆 , con 𝜆 la longitud de onda
en el vacío, se denomina número de onda angular, 𝜔 = 2𝜋 𝜈, con 𝜈 la frecuencia de la onda, se denomina frecuencia angular y 𝛿 es el desfase inicial.
1 La
∇2 (
).
ecuación de onda se obtiene mediante la identidad vectorial ∇ × (∇× ) = ∇(∇· ) −
118
·
Polarización
Entonces, la fase de la onda se compone de tres sumandos: una fase espacial dada por la superficie 𝜑(x, y, z) = kr · ŝ, una fase temporal 𝜔t y una fase
constante 𝛿 que permite ajustar el valor en el origen (espacial y/o temporal). Las superficies de fase espacial constante se denominan frentes de onda
y corresponden con los frentes de onda geométricos definidos a partir del
principio de Fermat en el capítulo 1.
2.1.1. Ecuaciones de Maxwell con ondas planas
Si en las ecuaciones de Maxwell los campos E y H describen ondas planas,
estas ecuaciones diferenciales se simplifican a ecuaciones algebraicas. Para
ver esto, escribamos E y H en forma compleja, es decir,
E(r, t) = E0 e i (k·r−𝜔t) ,
(2.8)
H(r, t) = H0 e i (k·r−𝜔t) ,
(2.9)
donde k es el vector de onda cuyo módulo es el número de onda angular y
la dirección es la del vector unitario ŝ, es decir, k = kŝ. El término de fase
inicial se ha omitido para simplificar el tratamiento, pero cuando se requiera
se volverá a incluir. Entonces, el resultado de los operadores ∇ y 𝜕/𝜕t sobre
las ondas planas es
∇ × E = i (k × E),
(2.10)
∇ · E = i (k · E),
(2.11)
𝜕E
= −i𝜔E,
(2.12)
𝜕t
para el campo E. Para el campo H, se obtienen relaciones similares. Por lo
tanto, las ecuaciones de Maxwell se reducen a
k × E = 𝜇 0 𝜔H,
(2.13)
k × H = −𝜖 0 𝜔E,
(2.14)
k · E = 0,
(2.15)
k · H = 0.
(2.16)
De estas ecuaciones, se tiene que
E=−
1
k × H,
𝜖 0𝜔
(2.17)
lo que implica junto con la eq. (2.16) que E, H y k forman un sistema ortogonal de vectores, como se ilustra en la fig. 2.2.
·
Polarización
H
119
H
E
k
k
-E
Figura 2.2. Orientación de los campos E, H y el vector de onda k.
Sea H = |H| (el módulo de H) y E = |E| (el módulo de E). Teniendo en
cuenta la ortogonalidad mutua entre E , H y k, de la eq. (2.14), se tiene que
H = 𝜖 0 cE,
(2.18)
donde c = 𝜔/k.
Entonces, los campos E y H vibran en fase (eqs. (2.8) y (2.9)) en un plano
ortogonal a k y se propagan del modo en que se ilustra en la fig. 2.3.
H
E
k
Figura 2.3. Ilustración de la propagación de los campos armónicos E y H.
2.1.2. Irradiancia
Experimentalmente, en el rango visible, no se mide el campo E debido a
la falta de detectores que logren una respuesta tan rápida como el periodo
temporal de las vibraciones de E. En lugar de medir la amplitud del campo,
se puede medir un promedio temporal del cuadrado del campo, es decir, la
energía media por unidad de tiempo por unidad de área. El tiempo empleado para hacer el promedio está determinado por la respuesta del detector.
120
·
Polarización
Los tiempos de respuesta de los detectores son de varios órdenes de magnitud del periodo temporal.
Formalmente, el valor medio de la energía se calcula a partir del vector
de Poynting
S = E × H.
(2.19)
De la ortogonalidad mutua entre E , H y k, teniendo en cuenta la eq. (2.13),
el vector de Poynting se puede escribir como
1
(E · E)k,
𝜇0𝜔
(2.20)
1
(E · E)ŝ = 𝜖 0 c(E · E)ŝ.
𝜇0c
(2.21)
S=
y, ya que 𝜔/k = c, se tiene que
S=
Esta ecuación indica que la dirección en la que fluye la energía es normal al
frente de onda, ya que ŝ es el vector unitario que define la normal del frente
de onda. Este resultado también es válido en medios dieléctricos (isotrópicos).
La irradiancia se define entonces como
I = hSiŤ ,
(2.22)
donde S = |S|. hi denota el valor medio de la función2 y Ť el tiempo de
integración (detección). Reemplazando la eq. (2.21) en la eq. (2.22), la irradiancia será
∫Ť /2
𝜖 0c
I=
(E · E)dt.
(2.23)
Ť
−Ť /2
En particular, para una función periódica, el valor promedio se toma con
respecto al periodo de la señal. De modo que para la onda plana armónica
la irradiancia será
∫T /2
𝜖 0c
(E · E)dt,
(2.24)
I=
T
−T /2
donde T = 1/𝜈 es el periodo de la onda.
Si la onda plana armónica está dada por
E = E0 cos(kr · ŝ − 𝜔t),
2 El
valor medio de la función f durante el tiempo 𝜏 se define como h f i = 1𝜏
(2.25)
𝜏/2
∫
−𝜏/2
f dt.
Polarización
·
121
la irradiancia será
1
I = 𝜖 0 c(E0 · E0 )
T
∫T /2
cos2 (kr · ŝ − 𝜔t)dt.
(2.26)
−T /2
El valor medio de la función coseno cuadrado en un periodo es igual a 1/2,
por lo tanto
𝜖 0c 2
𝜖 0c
(E0 · E0 ) =
E0 .
I=
(2.27)
2
2
Otra forma muy común para representar la onda plana armónica, que
también emplearemos en el libro, es mediante la función exponencial compleja. Supongamos que la onda está dada por
E = E0 e i (kr·ŝ−𝜔t) ,
(2.28)
donde la amplitud E0 también es compleja y kE0 k = E0 . En este caso, la
irradiancia se debe definir como
𝜖 0c
I=
2T
∫T /2
(E · E∗ )dt,
(2.29)
−T /2
donde E∗ es el conjugado de E. De esta manera, se garantiza que el valor
de la irradiancia sea igual al que se obtiene si la onda se representa como
una función coseno (o seno). Reemplazando la eq. (2.28) en la eq. (2.29), la
irradiancia será
𝜖 0c
I=
(E0 · E∗0 ).
(2.30)
2
2.1.3. Luz natural y luz polarizada
Ya que E y H están en fase y se relacionan según la eq. (2.17), en lo que
sigue, para referirnos a la propagación del campo óptico, solo tomaremos
en cuenta el vector E.
Supongamos que el campo E es el resultado de ondas planas monocromáticas emitidas por los osciladores que componen una fuente luminosa.
Simplificando el modelo, vamos a suponer también que las ondas se propagan en la dirección z, por lo que en un instante dado de tiempo en un plano
(x, y) a la distancia z tenemos que el campo E se puede escribir como
n
o
E(x, y, z; t) = |Eox | e i𝛿x e i (kz−𝜔t) , Eoy e i𝛿y e i (kz−𝜔t) .
(2.31)
La amplitud de cada una de las componentes del campo tiene un término
de fase (𝛿 x y 𝛿 y ), de modo que su diferencia permite medir el retraso de
122
·
Polarización
una componente con respecto a la otra. Si fijamos el plano z = z0 para observar el vector resultante a medida que transcurre el tiempo, el resultado
estará determinado por la manera como evoluciona la diferencia de las fases Δ𝛿 = 𝛿 y − 𝛿 x . Lo anterior depende de la naturaleza de la fuente. Por lo
general, las oscilaciones en las fuentes son tales que Δ𝛿 es una variable aleatoria. En consecuencia, no podemos predecir cómo evoluciona el vector E
en el tiempo (qué amplitud y dirección tiene en un tiempo dado). Decimos
que este tipo de fuentes, muy comunes en la naturaleza, emite luz natural o no-polarizada. Pero si Δ𝛿 se mantiene estable en el tiempo, es decir
Δ𝛿 = constante, entonces es posible determinar cómo evoluciona el vector
E. En este último caso, diremos que la luz está polarizada.
2.1.4. Polarización elíptica, circular y lineal
La luz polarizada implica que, dadas dos componentes para el campo E,
la diferencia de fase de las amplitudes de las componentes es una constante. Dependiendo del valor de esta diferencia, el vector eléctrico evoluciona
confinado en un plano o siguiendo una elipse (círculo). En el primer caso,
se tiene polarización lineal, en el segundo, polarización elíptica (circular) a
izquierda o derecha. Para ver esto, vamos a considerar un ejemplo. Supongamos que
E(x, y, z; t) = Eox , Eoy e i (kz−𝜔t) ,
(2.32)
con
Eox = |Eox | e i0 y Eoy = Eoy ei 𝜋/2 .
(2.33)
Es decir, 𝛿 x = 0 y 𝛿 y = 𝜋/2. Por lo tanto, Δ𝛿 = 𝜋/2. Primero, vamos a ver
cómo se observa el extremo del vector eléctrico proyectado en un plano,
digamos z = 0. Entonces, las componentes de E toman la forma
Ex = |Eox | e −i2𝜋t/T ,
(2.34)
Ey = Eoy e −i (2𝜋t/T −𝜋/2) .
(2.35)
Si consideramos cada componente como un fasor, es decir, un vector
rotatorio de radio |Eox | ( Eoy ) y fase 𝛿 x (𝛿 y ), gráficamente cada componente
se verá como se ilustra en la fig. 2.4(a). La componente y (en la parte superior izquierda), en t = 0, inicia con un desfase de 𝜋/2, esto es en el punto
1. Por su parte, la componente x (en la parte de abajo), en t = 0, inicia con
un desfase de 0, lo que también se indica con el punto 1. Al aumentar el
tiempo, en particular para t = T /4, T /2, 3T /4 y 2T , los fasores para x y
y tendrán las posiciones indicadas por los puntos 2, 3, 4 y 5, respectivamente. Las proyecciones de los puntos 1, 2, 3, 4 y 5 en dirección vertical
Polarización
·
123
para el fasor en x y en dirección horizontal para el fasor en y se intersecan
en la región rectangular sombreada de lados 2 |Eox | y 2 Eoy . El lugar geométrico de las intersecciones describe la evolución del vector eléctrico en el
tiempo, como se muestra en la parte superior derecha de la fig. 2.4(a). En
el ejemplo, la trayectoria es una elipse, ya que |Eox | > Eoy , y se va construyendo siguiendo la dirección contraria a las manecillas del reloj. En este
caso, se dice que se tiene polarización elíptica a izquierda. El sentido contrario de la trayectoria (en la dirección de las manecillas del reloj) se obtiene
si Δ𝛿 = −𝜋/2, entonces se dice que se tiene polarización elíptica a derecha.
En particular, si |Eox | = Eoy , la trayectoria es un círculo, tendremos, pues,
polarización circular a izquierda o derecha.
y
y
2
1
5
2
90°
5
1
3
E oy
3
4
x
y
x
4
1
4
d y = 90°
l0
4
t1= 0
t 2= T/ 4
E ox
3
3
5
1
2l 0
2
3l 0
4l 0
Z
x
t 3= T/ 2
t 4= 3T/ 4
2
t 5= T
d x= 0
(a)
(b)
Figura 2.4. Polarización elíptica a izquierda. (a) Extremo del vector eléctrico proyectado en un plano fijo (z = 0). Se observa que el extremo del vector gira en la
dirección contraria a las manecillas del reloj. (b) Evolución espacial (t = 0) del vector eléctrico. Se observa que el extremo del vector describe una hélice que avanza
en la dirección de z en la dirección de las manecillas del reloj.
Si ahora observamos cómo evoluciona en el espacio el vector eléctrico, se
ve algo diferente. Fijando el tiempo en t = 0, las componentes de E toman
la forma
Ex = |Eox | e i2𝜋z/𝜆 ,
(2.36)
Ey = Eoy e i (2𝜋z/𝜆 +𝜋/2) .
(2.37)
Para la parte real, en z = 0, E = {|Eox | , 0}; en z = 𝜆 /4, E = 0, − Eoy ;
en z = 𝜆 /2, E = {− |Eox | , 0}; en z = 3𝜆 /4, E = 0, Eoy ; y finalmente, en
z = 𝜆 , E = {|Eox | , 0}. Lo anterior se ilustra en la Fig 2.4(b) con las flechas.
En este caso, la trayectoria que sigue el extremo del vector eléctrico es una
·
124
Polarización
hélice que avanza en la dirección de las manecillas del reloj. Por supuesto,
las dos imágenes son equivalentes. En efecto, si en (b) nos fijamos cómo
van llegando los extremos del vector eléctrico al plano z = 0, tendremos la
trayectoria dada en (a).
Cuando Δ𝛿 = 0, la trayectoria que se observa del extremo del vector
eléctrico en un plano fijo (z = 0) es una línea recta inclinada un ángulo
arctan( Eoy /|Eox |), como se muestra en la fig. 2.5(a). La extensión de la
línea está limitada por el rectángulo de lados 2 |Eox | y 2 Eoy . Este es el caso
de polarización lineal.
y
y
1
5 1
5
E oy
4
2
3
x
4
2
E
x
3
d y = 0°
l0
4
t1= 0
t 2= T/ 4
y
E ox
3
5
1
2l 0
3l 0
4l 0
Z
x
t 3= T/ 2
t 4= 3T/ 4
2
t 5= T
d x= 0
(a )
(b)
Figura 2.5. Polarización lineal, cuando las dos componentes están en fase. (a) La
trayectoria del extremo del vector eléctrico es una línea recta limitada por la región
rectángular de lados 2 |Eox | y 2 Eoy , inclinada un ángulo tan−1 ( Eoy /|Eox |). (b)
El campo E está confinado en un plano inclinado un ángulo tan−1 ( Eoy /|Eox |) y
avanza armónicamente.
Si se observa la evolución espacial del vector eléctrico, se tendrá que el
campo E vibra armónicamente confinado en un plano inclinado el ángulo
arctan( Eoy /|Eox |), como se ilustra en la fig. 2.5(b).
2.1.5. Polarización: caso general
En la sección anterior, se mostró el caso de la polarización elíptica a izquierda y polarización lineal, que resultan de las diferencias de fase Δ𝛿 = 𝜋/2 y
Δ𝛿 = 0. Sin embargo, el valor de Δ𝛿 puede ser cualquiera (pero constante). En general, el estado de polarización de una onda electromagnética está
Polarización
·
125
dado por una elipse rotada
Ex2
|Eox | 2
−2
Ey2
E x Ey
cos(Δ𝛿) +
= sin2 (Δ𝛿),
2
|Eox | Eoy
Eoy
como se muestra en la fig. 2.6.
(2.38)
y
y
2 E oy
x
2 E ox
Figura 2.6. Elipse de polarización en el caso general.
La elipse sigue confinada en el rectángulo de lados 2 |Eox | y 2 Eoy y el
ángulo de rotación 𝜓 de la elipse se determina a partir de
tan(2𝜓) = tan(2𝛼) cos(Δ𝛿),
(2.39)
donde
tan 𝛼 =
Eoy
.
|Eox |
(2.40)
El signo de sin(Δ𝛿) indica el sentido de la polarización. Si sin(Δ𝛿) > 0, la
polarización es a izquierda; si sin(Δ𝛿) < 0, la polarización es a derecha. En
el apéndice F se muestra el desarrollo completo para obtener las eqs. (2.38),
(2.39) y (2.40).
Caso 1. Δ𝛿 = m𝜋; m = 0, ±1, ±2,...,
La eq. (2.38) queda
Ex2
|Eox | 2
− 2(−1) m
Ey2
E x Ey
+
= 0,
2
|Eox | Eoy
Eoy
(2.41)
que es igual a
Ey
Ex
− (−1) m
|Eox |
Eoy
!2
= 0.
(2.42)
126
·
Polarización
Lo que representa la línea recta
Ey = (−1) m (tan 𝛼)Ex ,
(2.43)
es decir, polarización lineal con el plano de vibración inclinado el ángulo
±𝛼.
Caso 2. Δ𝛿 = (2m − 1)𝜋/2; m = 0, ±1, ±2,...,
La eq. (2.38) queda
Ex2
|Eox | 2
+
Ey2
Eoy
2
= 1.
(2.44)
Lo que representa una elipse con sus ejes mayor y menor orientados con
los ejes x (Ex ) y y (Ey ). Entonces, se tiene polarización elíptica a izquierda
o derecha. En particular, si |Eox | = Eoy se tiene polarización circular a
izquierda o derecha.
Caso 3. Δ𝛿 ≠ m𝜋 , (2m − 1)𝜋/2.
Para desfases diferentes a los tratados en los casos 1 y 2, se tiene polarización
elíptica, cuya elipse está rotada de acuerdo con las eqs. (2.39) y (2.40).
Dd = 0
Dd = p/4
Dd = p/2
Dd = 3p/4
Dd = p
E+45
EL
EL
EL
E-45
Eox = Eoy
Dd = 5p/4
Dd = 3p/2
Dd = 7p/4
Dd = 2p
ER
ER
ER
E+45
2 E oy
2 E ox
Figura 2.7. Estados de polarización para varios desfases con |Eox | = Eoy .
Ejemplo. Para ilustrar las situaciones mencionadas en los tres casos, supongamos que tenemos un campo óptico con |Eox | = Eoy y Δ𝛿 = 0,
𝜋/4, 𝜋/2, 3𝜋/4, 𝜋 , 5𝜋/4, 3𝜋/2, 7𝜋/4 y 2𝜋. En este ejemplo, ya
que tan 2𝛼 = ∞, el ángulo de rotación de la elipse general estará dado por
Polarización
·
127
tan 2𝜓 = ±∞, donde el signo lo determina el signo de cos(Δ𝛿). En otras
palabras, el ángulo de rotación de la elipse será 𝜓 = 45◦ , si (0 ≤ Δ𝛿 <
𝜋/2) ∪ (3𝜋/2 < Δ𝛿 ≤ 2𝜋) y 𝜓 = −45◦ , si 𝜋/2 < Δ𝛿 < 3𝜋/2.
En la fig. 2.7, se muestra los estados de polarización para los desfases
mencionados. E+45 denota polarización lineal con el plano de vibración a
45◦ ; E−45 denota polarización lineal con el plano de vibración a −45◦ ; EL
denota polarización elíptica o circular a izquierda; ER denota polarización
elíptica o circular a derecha.
Por otra parte, 𝛼 = 0 define un estado de polarización lineal horizontal
(EH ) y 𝛼 = 90◦ define un estado de polarización lineal vertical (EV ).
128
·
Polarización
2.2. Polarización por dicroísmo
Una manera de eliminar una de las componentes del campo E es mediante
absorción de esa componente. Esto se puede lograr mediante el diseño de
un dispositivo que realice esta tarea o mediante un material natural que
tenga esta propiedad [13]. En cualquier caso, a la absorción selectiva de una
de las componentes del campo E se le denomina Dicroísmo. El efecto final
sobre el campo será obtener luz linealmente polarizada.
2.2.1. Polarizador lineal
Para ver cómo funciona un polarizador lineal basado en dicroísmo, supongamos que se construye una malla de alambres conductores, como se muestra en la fig. 2.8, y un campo E no-polarizado (luz natural) incide en dirección ortogonal al plano de la malla. Ya que en la dirección horizontal (a lo
largo de los alambres) las cargas eléctricas tienen la posibilidad de un mayor
desplazamiento en comparación con la dirección vertical (sección transversal de los alambres), se tendrá mayor absorción de energía eléctrica en la
dirección de los alambres, por lo que la componente neta Ex experimenta
una mayor atenuación que la componente neta Ey . Si, idealmente, se atenua completamente la componente Ex , tendremos un polarizador lineal y el
campo transmitido tendrá un estado de polarización lineal vertical, EV . A la
dirección en la que no se atenúa el campo, se le denomina eje de transmisión
del polarizador lineal.
Ey
Ex
y
x
Luz
natural
EV
Figura 2.8. Polarizador lineal hecho con una rejilla de alambres conductores.
Polarización
·
129
Polarizadores basados en una malla de alambres conductores para el espectro visible se fabrican por métodos litográficos, logrando arreglos con
una separación de 100 nm entre alambres. Los microalambres de aluminio
se depositan sobre sustratos de vidrio.
Los polarizadores lineales dicroicos más comunes se fabrican en láminas
de un plástico especial (alcohol polivinílico) transparente. Estas láminas se
han estirado en una dirección para alinear sus largas moléculas que luego se
recubren con yodo. De esta manera, se obtiene algo semejante al arreglo de
alambres de la fig. 2.8, pero a nivel microscópico (polarizadores tipo H).
Coeficiente de extinción y grado de polarización.
En la práctica, no se logra atenuar completamente la componente ortogonal
al eje de transmisión del polarizador y tampoco se logra transmitir completamente la componente paralela al eje de transmisión del polarizador. Si
representamos el polarizador lineal, como en la fig. 2.9, y descomponemos
el campo resultante que incide en el polarizador en una componente paralela al eje de transmisión, Eq , y en una componente ortogonal al eje de
transmisión, E⊥ , entonces el campo incidente será
E = {Eq , E⊥ } e i (kz−𝜔t) .
E
(2.45)
E
y
E'
Luz
natural
Eje de
transmisión
E'
x
PL
Figura 2.9. En un polarizador real, no se transmite el 100 % de la componente paralela al eje de transmisión y no se anula completamente la componente ortogonal
al eje de transmisión.
130
·
Polarización
Para caracterizar el polarizador lineal teniendo en cuenta la absorción de
las componentes Eq y E⊥ , se definen dos cantidades: el coeficiente de extinción
tq
t⊥
(2.46)
tq − t⊥
,
tq + t⊥
(2.47)
𝜌P =
y el grado de polarización
PP =
donde tq = Eq0 /|Eq | es la fracción transmitida de la componente paralela al
eje de transmisión y t⊥ = E⊥0 /|E⊥ | es la fracción transmitida de la componente ortogonal al eje de transmisión. Usualmente, la extinción se da como
𝜌 P : 1. También se emplea la transmitancia del polarizador, definida como la fracción de la intensidad de luz linealmente polarizada paralela al eje
de transmisión que es transmitida por el polarizador, T = tq2 . Por ejempo,
en las características técnicas de los polarizadores lineales dicroicos de una
empresa se dice:
Tabla 2.1. Especificaciones técnicas.
Ancho de banda (nm)
Extinción
Transmisión ( %)
Calidad óptica
100 - 1000
102 - 106
> 50 , < 90
𝜆 /5 - 𝜆 /2
El ancho de banda nos dice el rango espectral para el cual el coeficiente
de extinción y la transmisión se mantienen de acuerdo al valor nominal.
Una extinción de 100:1 corresponde con un polarizador de baja calidad,
mientras que un polarizador de extinción 1000000:1 es de alta calidad. Por
otro lado, una transmisión cercana al 100 % se refiere a un polarizador de alta
calidad. Finalmente, la calidad óptica de la lámina polarizadora se refiere a
la máxima distorsión que la lámina genera en un frente de onda plano una
vez que pasa por el polarizador.
2.2.2. Ley de Malus
La combinación de varios polarizadores lineales permite controlar no solo
el estado de polarización resultante sino la irradiancia. Supongamos que
disponemos de varios polarizadores lineales ideales, es decir, con 𝜌 P = ∞ y
PP = 1. En la fig. 2.10, se muestra una configuración con dos polarizadores
donde sus ejes de transmisión forman un ángulo 𝜃. El primer polarizador
Polarización
·
131
recibe luz natural. El segundo recibe luz linealmente polarizada vibrando
en planos paralelos al eje de transmisión del primer polarizador y transmite
luz linealmente polarizada, pero cambiando la orientación de los planos de
vibración paralelos al eje de transmisión del segundo polarizador.
E
E
E'
E''
I0
I' =
I0
2
q
I'' = I' cos2q
Figura 2.10. Ley de Malus.
Para determinar la irradiancia que se obtiene al final del segundo polarizador, supongamos que la irradiancia de la luz natural es I0 . Esta irradiancia
es el valor medio del flujo de energía por unidad de área, que emiten los osciladores que forman la fuente luminosa. Los osciladores están orientados
de manera aleatoria y emiten trenes de ondas electromagnéticas de corta
duración (10−8 s). Observando las ondas planas (a gran distancia del oscilador), cada tren de ondas estará linealmente polarizado. Por lo tanto, se
tendrá una superposición de trenes de onda con diferentes fases iniciales
(origen temporal) y con diferentes planos de vibración aleatorios. Ya que
el tiempo de integración es mucho mayor que la duración de los trenes de
onda, no es posible predecir el estado de polarización. En un tiempo dado, tendremos un vector resultante para el campo E, tiempo después, habrá
cambiado de orientación y amplitud aleatoriamente. Sin embargo, podemos definir un vector promedio en una dirección dada. Ya que el proceso es
aleatorio, tendremos que, para otra dirección, se tendrá un vector promedio
con la misma amplitud del primero. En consecuencia, si descomponemos
el vector E resultante que incide en el primer polarizador, en una componente paralela al eje de transmisión y otra ortogonal al eje de transmisión
(eq. (2.45)), se tiene que
𝜖 0c
{Eq , E⊥ } · {Eq , E⊥ }∗ ,
I0 =
(2.48)
2
132
·
Polarización
que es igual a
𝜖 0c |Eq | 2 + |E⊥ | 2 .
(2.49)
2
Y, de acuerdo con lo mencionado antes para la luz natural, |Eq | = |E⊥ |,
entonces
𝜖 0c I0 =
(2.50)
2 |Eq | 2 .
2
Después del primer polarizador se tiene que Eq0 = Eq por lo tanto la
irradiancia transmitida será
I0 =
I0 =
𝜖 0 c 0 2 I0
Eq = .
2
2
(2.51)
Finalmente, después del segundo polarizador tenemos que Eq00 = Eq0 cos 𝜃,
la irradiancia transmitida será
I 00 =
𝜖 0 c 00 2 𝜖 0 c 0 2
Eq =
Eq cos2 𝜃 ,
2
2
(2.52)
es decir,
I 00 = I 0 cos2 𝜃 .
(2.53)
Esta expresión, conocida como ley de Malus, nos dice que cuando colocamos
dos polarizadores lineales, uno detrás del otro, con sus ejes de transmisión
paralelos entre sí, el segundo polarizador transmite el 100 % de la luz linealmente polarizada que emerge del primer polarizador (I 00 = I0 /2); y cuando
colocamos dos polarizadores lineales, uno detrás del otro, con sus ejes de
transmisión ortogonales entre sí, el segundo polarizador transmite el 0 % de
la luz linealmente polarizada que emerge del primer polarizador (I 00 = 0).
Para otras orientaciones de los ejes de transmisión, la transmitancia tendrá
un valor en el rango 0 < I 00 < I 0, de acuerdo con la eq. (2.53). En otras
palabras, el sistema de dos polarizadores de la fig. 2.10 es un dispositivo atenuador de la irradiancia (que también gira el plano de vibración del campo
E transmitido).
Polarización
·
133
2.3. Polarización por reflexión
Otra manera de generar luz linealmente polarizada a partir de luz natural es
mediante la reflexión en una superficie lisa (espejo) en un ángulo apropiado
(ángulo de Brewster). Para determinar este ángulo, se observa cómo cambia la amplitud de la onda reflejada en función del ángulo de incidencia. Lo
anterior depende de las condiciones de frontera para las ondas incidente,
reflejada y transmitida en la superficie. Las condiciones de frontera se deben satisfacer tanto para las fases como para las amplitudes de las ondas. De
las condiciones de frontera para las fases, se obtienen las leyes de la reflexión y de la refracción (ley de Snell), y de las condiciones de frontera para
las amplitudes de las ondas se obtienen las ecuaciones de Fresnel. A partir
de estas ecuaciones, se establece la condición para obtener luz linealmente
polarizada.
2.3.1. Leyes de la reflexión y la refracción
Consideremos primero la vibración con frecuencia 𝜈 del campo E en un
punto de espacio, dada por la expresión
E(t) = E0 e −i2𝜋 𝜈t .
(2.54)
Supongamos que el punto de observación está sumergido en un medio dieléctrico homogéneo de índice de refracción n, entonces la velocidad (de fase)
con que se propaga la onda progresiva será 𝜐 = c/n, donde c es la velocidad de la luz. La expresión para la onda progresiva plana y armónica en la
dirección del vector unitario ŝ resulta
ŝ · r
E(r, t) = E0 exp −i2𝜋 𝜈 t −
,
(2.55)
𝜐
que se puede reescribir como
ŝ · r
E(r, t) = E0 exp i2𝜋 𝜈 n
−t
c
o
ŝ · r
E(r, t) = E0 exp i 2𝜋n
− 2𝜋 𝜈t .
𝜆
(2.56)
(2.57)
Definiendo el vector de onda en un medio de índice de refracción n
como
2𝜋
k=
nŝ,
(2.58)
𝜆
134
·
Polarización
la onda plana queda
E(r, t) = E0 e i (k·r−𝜔t) ,
(2.59)
con k dado por la eq. (2.58).
En un medio dieléctrico homogéneo, las ecuaciones de Maxwell se escriben como están en la sección 2.1.1, pero cambiando 𝜖 0 por 𝜖 , 𝜇 0 por 𝜇
y el vector de onda k de acuerdo con la eq. (2.58). Con estos cambios, la
ecuación de onda resulta ser
∇2 E =
1 𝜕2E
,
𝜐 2 𝜕t 2
(2.60)
√
con 𝜐 = 1/ 𝜖 𝜇 (ver apéndice B).
Si ahora suponemos que tenemos una interfase (superficie plana) que
separa dos medios de índices de refracción ni y nt , y una onda plana viajando
en el medio de índice ni e incidiendo en la interfase, tendremos entonces
una onda plana reflejada y una onda plana transmitida (o refractada). Sea
ŝi , ŝr y ŝt los vectores unitarios que indican la dirección de propagación de
las ondas planas incidente, reflejada y transmitida, respectivamente, en un
punto de la interfase localizado con el vector r, tendremos que las ondas
incidente, reflejada y transmitida estarán dadas por
Ei (r, t) = E0i e i (ki ·r−𝜔t) ,
(2.61)
Er (r, t) = E0r e i (kr ·r−𝜔t+𝜀r ) ,
(2.62)
Et (r, t) = E0t e i (kt ·r−𝜔t+𝜀t ) ,
(2.63)
con ki = (2𝜋/𝜆 )ni ŝi , kr = (2𝜋/𝜆 )nr ŝr y kt = (2𝜋/𝜆 )nt ŝt . Usualmente, las
ondas reflejada e incidente están en el mismo medio de la onda incidente,
entonces, nr = ni . Los términos de fase constante 𝜀 r y 𝜀 t dan cuenta de los
desfases de las ondas reflejada y transmitida con respecto a la onda incidente
en el punto r de la interfase. Igualando las variaciones de la fase para las tres
ondas se tiene
ki · r = kr · r + 𝜀 r = kt · r + 𝜀 t .
(2.64)
Esta doble igualdad implica que los vectores ki , kr y kt son coplanares. En
la fig. 2.11, se muestra los vectores unitarios ŝi , ŝr y ŝt , junto con el vector
normal unitario ûn de la interfase en el punto de incidencia. La interfase
corresponde con el plano xz y el plano que contiene los vectores ŝi , ŝr y ŝt
corresponde con el plano xy y se denomina plano de incidencia. Los ángulos
de incidencia 𝜃 i , reflexión 𝜃 r y transmisión 𝜃 t , se miden con respecto a la
normal de la interfase en el punto de incidencia.
Polarización
·
135
y
ni
nt
si
qi
un
qr
sr
st
x
qt
Figura 2.11. Vectores unitarios correspondientes a las direcciones de propagación
de las ondas planas incidente, reflejada y transmitida.
Ley de la reflexión
De la eq. (2.64), se tiene para la onda reflejada
(ki − kr ) · r = 𝜀 r ,
(2.65)
es decir, (kr − ki ) es paralelo al vector normal unitario de la interfase. Así,
(ki − kr ) k ûn .
(2.66)
2𝜋
ni (ŝi − ŝr ) × ûn = 0,
𝜆
(2.67)
ŝr × ûn = ŝi × ûn ,
(2.68)
sin 𝜃 r = − sin 𝜃 i ,
(2.69)
Por lo tanto,
y
de donde se obtiene
que es la ley de la reflexión, 𝜃 r = −𝜃 i .
2.3.1.1. Ley de la refracción
De la eq. (2.64), se tiene para la onda transmitida
(ki − kt ) · r = 𝜀 t ,
(2.70)
por lo que el vector (kt − ki ) también es paralelo al vector normal unitario
de la interfase. Así,
(ki − kt ) k ûn .
(2.71)
136
·
Polarización
Por lo tanto,
2𝜋
(ni ŝi − nt ŝt ) × ûn = 0,
𝜆
(2.72)
nt ŝt × ûn = ni ŝi × ûn ,
(2.73)
nt sin 𝜃 t = ni sin 𝜃 i ,
(2.74)
y
de donde se obtiene
que es la ley de la refracción o ley de Snell.
Note que la eq. (2.71) implica que
ni ŝi − nt ŝt = Γûn ,
(2.75)
lo que resulta ser la forma vectorial de la construcción geométrica mostrada
en la fig. 1.9(b), donde Γ es la longitud del lado BC.
2.3.2. Ecuaciones de Fresnel
Consideremos ahora las condiciones de frontera para las amplitudes de las
ondas incidente, reflejada y transmitida. Ya que estamos tratando con medios dieléctricos (sin absorción), se satisface que en la interfase la componente tangencial de los campos E y H son continuas. Conviene, entonces,
descomponer los vectores E y H en una componente ortogonal al plano de
incidencia y en una componente paralela al plano de incidencia, como se
muestra en la fig. 2.12.
y
y
Hi
Ei
Hr
Ei
si
sr
un
Er
qi q r
Er
Hi
si
ni
sr
un
Hr
qi qr
ni
x
qt
Ht
Et
(a)
nt
x
nt
qt
Et
Ht
st
st
(b)
Figura 2.12. Componentes paralela y ortogonal de los campos E y H con respecto
al plano de incidencia.
E⊥
En la fig. 2.12(a), se toma la componente ortogonal del campo eléctrico
y su correspondiente campo magnético Hq , y en la fig. 2.12(b), se toma
Polarización
·
137
la componente paralela del campo eléctrico Eq y su correspondiente campo
magnético H⊥ . Teniendo en cuenta la orientación a derecha de los campos
E y H mostrados en la fig. 2.2, la representación gráfica de las componentes
normales en dirección positiva se hace mediante un círculo con una cruz
para indicar que el vector se dirige entrando al plano del papel (alejándose del lector) y la representación gráfica de las componentes normales en
dirección negativa se hace mediante un círculo con un punto central para
indicar que el vector sale del plano del papel (hacia el lector). Para las componentes paralelas, se tienen a su vez componentes en la dirección x y en la
dirección y. Los vectores deben tener su origen en el punto de incidencia,
pero en aras de la claridad de los diagramas se han dibujado a cierta distancia del punto de incidencia. Las orientaciones de los vectores reflejado
y transmitido pueden cambiar de acuerdo con los corrimientos de fase que
experimenten estas componentes en la interfase (como veremos más adelante). El estado de polarización del campo E⊥ se suele llamar polarización
“TE” (campo eléctrico transversal) o polarización “s”y el estado de polarización del campo Eq se suele llamar polarización “TM” (campo magnético
transversal) o polarización “p”. Con estas componentes, las amplitudes de
los campos eléctricos se escriben
E0i = Ei⊥ , Eiq ,
(2.76)
E0r = Er⊥ , Erq ,
(2.77)
⊥ q
E0t = Et , Et ,
(2.78)
y los campos magnéticos se escriben
H0i = Hi⊥ , Hiq ,
H0r = Hr⊥ , Hrq ,
H0t = Ht⊥ , Htq .
(2.79)
(2.80)
(2.81)
Teniendo en cuenta la eq. (2.18) para un medio dieléctrico homogéneo, en
cada caso se satisface que
H q = 𝜖 𝜐E ⊥
(2.82)
y
H ⊥ = 𝜖 𝜐E q .
(2.83)
Aplicando las condiciones de frontera para las componentes de los campos, tenemos que para el estado de polarización TE (fig. 2.12(a))
Ei⊥ + Er⊥ = Et⊥ ,
(2.84)
138
·
Polarización
Hiq cos 𝜃 i − Hrq cos 𝜃 r = Htq cos 𝜃 t .
(2.85)
Y la eq. (2.85) se puede reescribir como
𝜖 i 𝜐i Ei⊥ cos 𝜃 i − 𝜖 i 𝜐i Er⊥ cos 𝜃 i = 𝜖 t 𝜐t Et⊥ cos 𝜃 t
(2.86)
empleando la eq. (2.82) y la ley de la reflexión. Usando el hecho que en un
material dieléctrico (no magnético) la permeabilidad magnética se puede
aproximar por la del vacío, si multiplicamos la eq. (2.86) por 𝜇 0 c, luego, en
el lado izquierdo de la igualdad, se cambia 𝜇 0 por 𝜇 i y, en el lado derecho
de la igualdad, se cambia 𝜇 0 por 𝜇 t , se llega a
ni Ei⊥ cos 𝜃 i − ni Er⊥ cos 𝜃 i = nt Et⊥ cos 𝜃 t .
(2.87)
Dado el campo incidente, las eqs. (2.84) y (2.87) constituyen un sistema
de dos ecuaciones con dos incógnitas, a saber: Er⊥ y Et⊥ . Resolviendo este
sistema de ecuaciones para cada una de las incógnitas, se llega a
Er⊥ =
ni cos 𝜃 i − nt cos 𝜃 t ⊥
E
ni cos 𝜃 i + nt cos 𝜃 t i
(2.88)
Et⊥ =
2ni cos 𝜃 i
E⊥ .
ni cos 𝜃 i + nt cos 𝜃 t i
(2.89)
y
Si ahora aplicamos las condiciones de frontera para las componentes en
el estado de polarización TM (fig. 2.12(b)), tenemos
−Hi⊥ − Hr⊥ = −Ht⊥ ,
(2.90)
Eiq cos 𝜃 i − Erq cos 𝜃 r = Etq cos 𝜃 t .
(2.91)
Usando la eq. (2.83) para escribir la eq. (2.90) en términos de las componentes paralelas de E, siguiendo un procedimiento análogo al empleado en
el caso de polarización TE para resolver el sistema de ecuaciones, se llega a
Erq =
nt cos 𝜃 i − ni cos 𝜃 t q
E
nt cos 𝜃 i + ni cos 𝜃 t i
(2.92)
Etq =
2ni cos 𝜃 i
Eq .
nt cos 𝜃 i + ni cos 𝜃 t i
(2.93)
y
Las eqs. (2.88), (2.89), (2.92) y (2.93) son las ecuaciones de Fresnel. Los
coeficientes que multiplican a Ei⊥ y Eiq en el lado derecho de estas ecuaciones determinan la fracción de la amplitud de las componentes del campo
eléctrico que se refleja y se transmite en la interfase. Estos coeficientes son
Polarización
r⊥ (= rs ) =
Er
Ei
Et
Ei
Et
tq (= tp ) =
Ei
t⊥ (= ts ) =
,
⊥
para el estado de polarización TE, y
Er
rq (= rp ) =
,
Ei q
,
·
139
(2.94)
⊥
,
(2.95)
q
para el estado de polarización TM.
Entonces para la onda reflejada en la interfase, las amplitudes de cada
componente son Er⊥ = r⊥ Ei⊥ y Erq = rq Eiq , donde
r⊥ =
ni cos 𝜃 i − nt cos 𝜃 t
,
ni cos 𝜃 i + nt cos 𝜃 t
(2.96)
nt cos 𝜃 i − ni cos 𝜃 t
.
(2.97)
nt cos 𝜃 i + ni cos 𝜃 t
Para la onda transmitida en la interfase, las amplitudes de cada componente
son Et⊥ = t⊥ Ei⊥ y Etq = tq Eiq , donde
rq =
t⊥ =
2ni cos 𝜃 i
,
ni cos 𝜃 i + nt cos 𝜃 t
(2.98)
2ni cos 𝜃 i
.
(2.99)
nt cos 𝜃 i + ni cos 𝜃 t
En la fig. 2.13, se muestra el comportamiento de los coeficientes de reflexión r⊥ y rq y de transmisión t⊥ y tq en función del ángulo de incidencia
𝜃 i cuando los índices de refracción son ni = 1.0 (aire) y nt = 1.5 (vidrio).
tq =
1.0
0.8
t
Coeficientes de Fresnel
0.6
0.4
r
0.2
qp
0
-0.2
r
-0.4
-0.6
56.3°
-0.8
-1.0
t
0
10
20
30
40
50
60
Ángulo de incidencia, q i (°)
70
80
90
Figura 2.13. Coeficientes de Fresnel para la reflexión y transmisión en una interfase aire (ni = 1.0) - vidrio (nt = 1.5). El ángulo de polarización es 𝜃 p .
140
·
Polarización
De la fig. 2.13, se puede establecer los siguientes hechos:
- En incidencia normal, 𝜃 i = 0, se tiene la mayor transmisión con
t⊥ = 0.8 y tq = 0.8. Para la reflexión, se tiene que rq = 0.2, mientras que para r⊥ = −0.2. El signo negativo en r⊥ indica que en la
interfase mientras que el vector incidente apunta entrando al papel,
el vector reflejado apunta saliendo del papel. Decimos entonces que
la componente ortogonal experimenta un cambio de fase de ±𝜋, así,
Er⊥ = 0.2e i±𝜋 Ei⊥ en 𝜃 i = 0.
- En incidencia rasante, 𝜃 i → 90◦ , la transmisión tiende cero para las
dos componentes. Para la reflexi ón, las dos componentes tienden a
−1, es decir, se refleja completamente el campo incidente y cada una
de las componentes experimenta un cambio de fase de ±𝜋.
- En la reflexión, la componente paralela está en fase en 0 < 𝜃 i < 𝜃 p
y experimenta un cambio de fase de ±𝜋 en 𝜃 p < 𝜃 i < 𝜋/2. Para el
ángulo 𝜃 i = 𝜃 p , la componente paralela se anula (rq = 0). Lo anterior significa que si hacemos incidir una onda plana electromagnética
no-polarizada en una superficie reflectora formando un ángulo de incidencia igual a 𝜃 p , obtendremos en la reflexión una onda linealmente
polarizada en el estado de polarización TE.
Para encontrar explícitamente el ángulo de polarización 𝜃 p , igualamos a
cero el numerador de la eq. (2.97), con 𝜃 i = 𝜃 p . Entonces,
nt cos 𝜃 p = ni cos 𝜃 t .
(2.100)
Cambiando las funciones coseno por funciones seno y empleando la ley de
Snell, tenemos
q
q
nt 1 − sin2 𝜃 p = ni 1 − ni2 sin2 𝜃 p /nt2 .
(2.101)
Elevando al cuadrado y multiplicando por nt2
nt4 − nt4 sin2 𝜃 p = ni2 nt2 − ni4 sin2 𝜃 p ,
(2.102)
sin2 𝜃 p (ni4 − nt4 ) = nt2 (ni2 − nt2 ),
(2.103)
factorizando,
de donde
sin 𝜃 p = q
nt
nt2
+
,
ni2
(2.104)
Polarización
·
141
que equivale a
nt
𝜃 p = arctan
.
ni
(2.105)
Este ángulo también es conocido como ángulo de Brewster.3
En la fig. 2.14, se ilustra la manera de obtener luz linealmente polarizada
a partir de luz natural cuando se refleja en una interfase lisa. Cuando el
ángulo de incidencia de la luz natural es igual al ángulo de Brewster dado
por la eq. (2.105), la componente del campo incidente paralela al plano
de incidencia se anula en la reflexión. En consecuencia, solo se refleja la
componente ortogonal al plano de incidencia (con un cambio de fase de 𝜋),
es decir, se tiene luz linealmente polarizada en el estado de polarización TE.
Para el ejemplo de la fig. 2.13, r⊥ = −0.3846.
La luz transmitida sigue siendo natural. Las dos componentes del campo
incidente son transmitidas con una amplitud similar. Para el ejemplo de la
fig. 2.13, tq = 0.6667 y t⊥ = 0.6145.
Ei
Ei
Luz
natural
normal
Et
qp
qp
Er
ni
nt
Interfase
Et
Luz
natural
Luz
polarizada
Figura 2.14. Polarización por reflexión. La componente del campo incidente que
es paralela al plano de incidencia se anula en la reflexión cuando el ángulo de incidencia es igual al ángulo de Brewster 𝜃 p .
Por supuesto, el ángulo de Brewster depende de la longitud de onda. Por
ejemplo, supongamos que la interfase es la cara de una lámina de vidrio
3 David
Brewster (1781-1868) fue un científico escocés que realizó investigaciones en la
polarización de la luz. En 1815, formuló la ley que lleva su nombre y que permite encontrar
el ángulo de polarización.
142
·
Polarización
BK7 (apéndice C). Los índices de refracción para las longitudes de onda
empleadas para caracterizar los vidrios ópticos son nF (𝜆 = 486.13nm) =
1.5223, nd (𝜆 = 587.56nm) = 1.5168 y nC (𝜆 = 656.27nm) = 1.5143.
Con estos valores, los ángulos de incidencia para tener la polarización lineal
en cada caso son: 𝜃 pF = 56.6991◦ , 𝜃 pd = 56.6038◦ y 𝜃 pC = 56.5604◦ . Estos
valores son cercanos entre sí, por lo que en la práctica, con luz blanca, si
estamos cerca del ángulo de polarización correspondiente a la longitud de
onda central del espectro visible, se podrá observar muy bien el efecto de la
polarización por reflexión. Note que incluso el efecto se observa bien si el
ángulo de incidencia se aleja unos pocos grados del ángulo de Brewster, ya
que el valor de rq se mantiene cerca de cero, como se muestra en la fig. 2.1.
2.3.3. Reflectancia y transmitancia
Los coeficientes de reflexión y transmisión miden el cambio en la amplitud
de la onda incidente. Para medir la cantidad de energía reflejada y transmitida, empleamos la intensidad e
I (eq. (1.64)), es decir, el flujo de energía
promedio. En una superficie plana, la intensidad se puede calcular como
e
I = I (Área).
(2.106)
Supongamos que la región donde incide el haz luminoso (onda plana) es
circular, de área 𝜎. Los haces incidente, reflejado y transmitido estarán contenidos en tubos de sección transversal 𝜎 cos 𝜃 i , 𝜎 cos 𝜃 r y 𝜎 cos 𝜃 t , como
se ilustra en la fig. 2.15.
~
Ii
ni
nt
Interfase
scosq i
scosq r
~
Ir
s
scosq t
~
It
Figura 2.15. Intensidades reflejada y transmitida en una interfase.
La reflectancia es el cociente entre la intensidad reflejada y la intensidad
incidente, y la transmitancia es el cociente entre la intensidad transmitida y
Polarización
·
143
la intensidad incidente. Para la reflectancia tenemos
R=
e
(𝜖 r 𝜐r /2) |Er | 2 𝜎 cos 𝜃 r
Ir Ir 𝜎 cos 𝜃 r
.
=
=
e
Ii 𝜎 cos 𝜃 i
(𝜖 i 𝜐i /2) |Ei | 2 𝜎 cos 𝜃 i
Ii
(2.107)
Ya que la reflexión ocurre en el mismo medio del haz incidente, y teniendo
en cuenta la ley de la reflexión, entonces
R = r2,
(2.108)
donde r = Er /Ei es el coeficiente de reflexión.
Para la transmitancia, se tiene que
e
It It 𝜎 cos 𝜃 t
(𝜖 t 𝜐t /2) |Et | 2 𝜎 cos 𝜃 t
T= =
=
e
(𝜖 i 𝜐i /2) |Ei | 2 𝜎 cos 𝜃 i
Ii Ii 𝜎 cos 𝜃 i
(2.109)
y, suponiendo que en los materiales dieléctricos que estamos considerando
𝜇 i = 𝜇 0 , 𝜇 t = 𝜇 0 , al multiplicar y dividir por 𝜇 0 c la eq. (2.109) se tiene
T=
nt cos 𝜃 t 2
t ,
ni cos 𝜃 i
(2.110)
donde t = Et /Ei es el coeficiente de transmisión.
La conservación de la energía implica
R +T = 1
(2.111)
si los medios dieléctricos no absorben energía. En el caso de absorción de
energía, R + T < 1, y se debe sumar un término de absorción para hacer el
balance de energía.
Para los estados de polarización TE y TM, las eqs. (2.107) y (2.110) se
aplican para cada componente, ortogonal y paralela. Por lo tanto, el balance
de energía (suponiendo que no hay absorción) en cada caso será
R⊥ + T⊥ = 1,
(2.112)
para el estado de polarización TE, y
Rq + Tq = 1,
para el estado de polarización TM.
(2.113)
144
·
Polarización
Reflectancia y transmitancia
1.0
T
0.9
0.8
T
0.7
0.6
0.5
56.3°
0.4
R
0.3
0.2
0.1
0
R
qp
0
10
20
30
40
50
60
Ángulo de incidencia, q i (°)
70
80
90
Figura 2.16. Reflectancia y transmitancia para cada una de las componentes, paralela y ortogonal.
En la fig. 2.16, se muestra R⊥ , Rq , T⊥ y Tq en función del ángulo de incidencia cuando los índices de refracción son ni = 1.0 (aire) y nt = 1.5
(vidrio). Para cualquier ángulo, se puede verificar que la suma de la reflectancia y la transmitancia es igual a 1. Por ejemplo, si la incidencia se da
en el ángulo de Brewster, se tiene que 𝜃 i = 56.3◦ y 𝜃 t = 33.7◦ ; rq = 0,
r⊥ = −0.3846, tq = 0.6667 y t⊥ = 0.6145. Note que la suma rq + tq ≠ 1, sin
embargo, Rq + Tq = Tq = (1.5 cos(33.7◦ )/cos(56.3◦ )) (0.66672 ) = 1. Otro
ejemplo, cuando la incidencia se da con un ángulo 𝜃 i = 0 (incidencia normal
a la interfase), los coeficientes son rq = 0.2, r⊥ = −0.2, tq = 0.8 y t⊥ = 0.8.
Por lo tanto, la reflectancia y transmitancia resultan Rq = R⊥ = 0.04 y
Tq = T⊥ = 1.5(0.8) 2 = 0.96 y nuevamente se cumplen las eqs. (2.112) y
(2.113). Es común dar la reflectancia y la transmitancia en porcentaje, multiplicando por 100 %. Por ejemplo, para 𝜃 i = 0 la reflectancia resulta ser el
4 % y la transmitancia el 96 %.
Para una superficie óptica de vidrio (ni = 1.0 y nt = 1.5) la energía
reflejada con 𝜃 i = 0 es pequeña. Sin embargo, en un sistema de varias lentes la luz transmitida puede reducirse considerablemente. Por ejemplo, en
un sistema con tres lentes, la luz debe atravesar 6 interfases, por lo que en
primera aproximación la transmitancia total será T 6 = 78, 3 %.4 Por esta
4 Note
que en este ejemplo se tienen 3 interfases aire-vidrio y tres interfases vidrio-aire.
Denotando con n a el índice del aire y con nv el índice del vidrio, para el primer tipo de
interfase la transmitancia es T = (nv /n a )(2n a /(n a + nv )) 2 y para el segundo tipo de interfase
la transmitancia es T 0 = (n a /nv )(2nv /(nv + n a )) 2 . Ya que T = T 0 = 4n a nv /(n a + nv ) 2 ,
entonces la transmitancia total T 3T 03 es igual a T 6 . Este resultado es aproximado, ya que
se están omitiendo reflexiones y transmisiones sucesivas en las caras. Sin embargo, estas son
contribuciones menores y el resultado final está muy cerca del aproximado.
Polarización
·
145
razón, los recubrimientos de películas delgadas dieléctricas antirreflectivas
son muy comunes en las lentes.
Finalmente, vale la pena comentar cómo la reflectancia se acerca a 1
cuando el ángulo de incidencia se acerca a 90◦ . Cualquier superficie lisa se
comporta como un espejo a incidencia rasante (a la interfase). Incluso esto
también ocurre para superficies planas opacas. Por ejemplo, si observamos
una hoja de papel en forma rasante, podremos ver muy bien la reflexión
especular de la luz.
146
·
Polarización
2.4. Polarización por reflexión total interna
En la unidad anterior, vimos que las componentes ortogonal y paralela del
campo reflejado pueden experimentar un cambio de fase con respecto a las
componentes del campo incidente. La componente paralela se refleja en
fase, cuando 0 < 𝜃 i < 𝜃 p , y con desfase de ±𝜋, cuando 𝜃 p < 𝜃 i < 𝜋/2.
Por otra parte, la componente ortogonal siempre se refleja con un desfase
de ±𝜋. Lo anterior, junto con el cambio de amplitud de las componentes
reflejadas, implica que una onda linealmente polarizada al reflejarse sigue
siendo linealmente polarizada, pero con una rotación en el plano de vibración. Cuando ocurre reflexión total interna, las componentes del campo reflejado tienen desfases que varían entre 0 y ±𝜋, y la diferencia de fase entre
las componentes ya no está limitada a 0 o ±𝜋. Por lo tanto, la onda reflejada
puede tener un estado de polarización elíptico.
2.4.1. Reflexión total interna
Si la onda incidente va de un medio de mayor índice a uno de menor índice, a partir de cierto ángulo, denominado ángulo crítico, los coeficientes de
reflexión y transmisión obtienen los valores |rq | = |r⊥ | = 1 y tq = t⊥ = 0. En
otras palabras, la energía de la onda reflejada es igual a la energía de la onda
incidente.
En la unidad 1.1, en la fig. 1.11, se ilustra la condición en la que el rayo
transmitido es tangencial a la interfase. El ángulo de incidencia para el cual
esto ocurre es (eq. (1.5))
nt
𝜃 c = arcsin
,
ni
(2.114)
con ni > nt . A partir de este ángulo ocurre el fenómeno de reflexión total
interna.
Las ecuaciones de Fresnel para ni > nt y 𝜃 i < 𝜃 c se aplican de la misma
manera que en el caso de la reflexión externa (ni < nt ) y los únicos cambios de fase de las componentes reflejadas con respecto a las componentes
incidentes son 0 ó ±𝜋, como se muestra en la fig. 2.17 para ni = 1.5 y
nt = 1.0. Contrario a la reflexión externa (fig. 2.13), la componente ortogonal no experimenta cambio de fase. En cambio, la componente paralela tiene un cambio de fase de ±𝜋 para 0 < 𝜃 i < 𝜃 p0 , y está en fase para
𝜃 p0 < 𝜃 i < 𝜃 c . El ángulo 𝜃 p0 es el ángulo en el que ocurre la polarización por
reflexión y se determina mediante tan 𝜃 p0 = (nt /ni ). Este ángulo junto con
Polarización
·
147
el ángulo de polarización externa satisfacen la relación
𝜃 p + 𝜃 p0 = 𝜋/2.
(2.115)
1.0
0.8
Coeficientes de Fresnel
0.6
r
0.4
0.2
0
r
-0.2
qc
q 'p
-0.4
-0.6
33.7°
-0.8
-1.0
0
10
20
30
41.8°
40
50
60
Ángulo de incidencia, q i (°)
70
80
90
Figura 2.17. Coeficientes de reflexión para las componentes paralela y ortogonal
en la reflexión interna (0 < 𝜃 i < 𝜃 c ) y total interna (𝜃 c < 𝜃 i < 𝜋/2).
Pero cuando ni > nt y 𝜃 i > 𝜃 c , los coeficientes de reflexión son cantidades de variable compleja. Parapver esto, notemos quepa partir de la ley de
Snell se puede escribir cos 𝜃 t = 1 − (ni /nt ) 2 sin2 𝜃 i = 1 − (sin 𝜃 i /sin 𝜃 c ) 2 ,
y para 𝜃 i > 𝜃 c , el término dentro de la raíz cuadrada es negativo. Entonces,
conviene escribir
q
i
cos 𝜃 t =
sin2 𝜃 i − n 2 ,
(2.116)
n
√
con i = −1 y n = nt /ni < 1. Así, los coeficientes de reflexión se pueden
reescribir como
p
n 2 cos 𝜃 i − i sin2 𝜃 i − n 2
(2.117)
rq =
p
n 2 cos 𝜃 i + i sin2 𝜃 i − n 2
y
p
cos 𝜃 i − i sin2 𝜃 i − n 2
r⊥ =
.
(2.118)
p
cos 𝜃 i + i sin2 𝜃 i − n 2
En los dos coeficientes, el numerador es el conjugado del denominador, por
lo tanto
|rq | = |r⊥ | = 1.
(2.119)
Esto se muestra en la fig. 2.17 para 𝜃 c < 𝜃 i < 𝜋/2.
148
·
Polarización
Entonces, los coeficientes de reflexión los podemos escribir como
rq = |rq | e i𝛿q = e i𝛿q = e −i2𝜙q ,
(2.120)
r⊥ = |r⊥ | e i𝛿⊥ = e i𝛿⊥ = e −i2𝜙⊥ ,
(2.121)
donde
p
sin2 𝜃 i − n 2
tan 𝜙q =
,
n 2 cos 𝜃 i
p
sin2 𝜃 i − n 2
tan 𝜙⊥ =
.
cos 𝜃 i
(2.122)
(2.123)
En la fig. 2.18, se muestra el comportamiento de los desplazamientos
de fase 𝛿q = −2𝜙q y 𝛿⊥ = −2𝜙⊥ de los coeficientes de reflexión paralelo y
ortogonal en la reflexión interna 0 < 𝜃 i < 𝜃 c y total interna 𝜃 c < 𝜃 i < 𝜋/2,
cuando ni = 1.5 y nt = 1.0.
Desplazamientos de fase
0
-p/4
-p/2
d
-3p/4
-p
0
10
20
30
q 'p
40
qc
50
d
60
Ángulo de incidencia, q i (°)
70
80
90
Figura 2.18. Desplazamientos de fase de las componentes paralela y ortogonal en
la reflexión interna (0 < 𝜃 i < 𝜃 c ) y total interna (𝜃 c < 𝜃 i < 𝜋/2).
El estado de polarización de la onda reflejada estará determinado por
Δ𝛿 = 𝛿q − 𝛿⊥ . Para el rango 0 < 𝜃 i < 𝜃 c , una onda incidente linealmente
polarizada se refleja linealmente polarizada (salvo un cambio en la orientación del plano de vibración). Para el rango 𝜃 c < 𝜃 i < 𝜋/2, la diferencia de
las fases se puede determinar a partir de
𝛿q 𝛿⊥
tan
−
= tan(𝜙⊥ − 𝜙q ),
(2.124)
2
2
Polarización
·
149
es decir,
p
p 2
sin 𝜃 i − n 2 /cos 𝜃 i − sin2 𝜃 i − n 2 / n 2 cos 𝜃 i
𝛿q 𝛿⊥
−
=
tan
.
2
2
1 + sin2 𝜃 i − n 2 / n 2 cos2 𝜃 i
(2.125)
Simplificando,
p
cos 𝜃 i sin2 𝜃 i − n 2
𝛿q 𝛿⊥
=−
−
.
tan
2
2
sin2 𝜃 i
(2.126)
Por lo tanto, la diferencia de las fases será,
!
p
cos 𝜃 i sin2 𝜃 i − n 2
.
Δ𝛿 = 𝛿q − 𝛿⊥ = −2 arctan
sin2 𝜃 i
(2.127)
En la fig. 2.19, se muestra la diferencia de los desplazamientos de fase
en la reflexión interna 0 < 𝜃 i < 𝜃 c y total interna 𝜃 c < 𝜃 i < 𝜋/2, cuando
ni = 1.5 y nt = 1.0. En la figura se puede ver como para la reflexión total
interna, la diferencia de fases varía entre 0 y un valor cercano a −𝜋/4. En
consecuencia, una onda reflejada en el dominio de la reflexión total interna
tendrá un estado de polarización elíptico.
q 'p
0
q c q i1 q i2
Dd = d - d
-p/4
Dd min = -45.24° (q i = 51.67°)
-p/2
q 'p = 33.69°
q c = 41.81°
q i1 = 50.23°
-3p/4
-p
q i2 = 53.26°
0
10
20
30
40
50
60
Ángulo de incidencia, q i (°)
70
80
90
Figura 2.19. Diferencia de los desplazamientos de fase de las componentes reflejadas paralela y ortogonal, cuando ni = 1.5 y nt = 1.0.
Para determinar el valor mínimo de la diferencia de fases en la reflexión
total interna, basta con resolver d(Δ𝛿)/d𝜃 i = 0 para 𝜃 i . El resultado que se
150
·
Polarización
obtiene para el ángulo de incidencia es
sin2 𝜃 i =
2n 2
1 + n2
y el valor mínimo de la diferencia de fases resulta ser
2
n −1
Δ𝛿mı́n = 2 arctan
.
2n
(2.128)
(2.129)
Para la fig. 2.19, el mínimo de la diferencia de fases y el ángulo de incidencia correspondiente son Δ𝛿mı́n = −45.24◦ y 𝜃 i = 51.67◦ . Lo anterior
nos indica que con una reflexión, en el dominio de la reflexión total interna,
cuando ni = 1.5 y nt = 1.0, no es posible obtener una onda con un estado
de polarización circular. Una opción para lograr Δ𝛿mı́n = −𝜋/2 es tener un
material cuyo índice ni sea√tal que n 2 − 1 = −2n. La solución positiva de
esta ecuación es n = −1 + 2 = 0.4142. Suponiendo que nt = 1, entonces
ni = 2.4142. Este es un índice muy elevado para un vidrio óptico. Otra opción consiste en mantener un vidrio óptico común y lograr dos reflexiones
sucesivas, siempre y cuando la suma de las dos diferencias de fase dé como resultado −𝜋/2. La opción más usada es la que se tiene cuando en cada
reflexión se tiene una diferencia de fase de −𝜋/4. En la fig. 2.19, se ilustra
con las líneas segmentadas los valores de los ángulos de incidencia para los
cuales se obtienen las diferencias de fase de −𝜋/4, estos son: 𝜃 i1 = 50.23◦
y 𝜃 i2 = 53.26◦ .
Un elemento óptico que cambia la polarización lineal en circular, basado en la ideas mencionadas anteriormente, es el rombo de Fresnel, como el de la fig. 2.20, con vidrio de índice de refracción 1.5 para el ángulo
𝜃 i2 = 53.26◦ . Supongamos que un haz de luz (que viaja de izquierda a derecha) linealmente polarizado con el plano de vibración a −45◦ con respecto
al plano de incidencia (45◦ con respecto a la dirección positiva de la componente ortogonal) incide normalmente en la primera cara. Omitiendo los
términos de fase espacial y temporal, el campo en:
- (1) se puede escribir como
E(1) = e i0 , e i0 E0 .
- (2) será
n
o
E(2) = t⊥(2) e i0 , tq(2) e i0 E0 = e i0 , e i0 0.8E0 . Es decir, sigue siendo
linealmente polarizado, pero la amplitud de las componentes es 0.8
veces la inicial.
Polarización
·
151
- (3) será
o
n
E(3) = r⊥(3) t⊥(2) e i0 , rq(3) tq(2) e i0 E0 = e −i (1.2785) , e −i (2.0639) 0.8E0 ,
es decir, e i0 , e −i 𝜋/4 0.8e −i (1.2785) E0 , lo cual representa un estado de
polarización elíptica a derecha.
- (4) será
o
n
E(4) = r⊥(4) r⊥(3) t⊥(2) e i0 , rq(4) rq(3) tq(2) ei0 E0 = e −i (2.5570) , e −i (4.1277) 0.8
×E0 , es decir, e i0 , e −i 𝜋/2 0.8e −i (2.5570) E0 , lo cual representa un estado de polarización circular a derecha. El radio del círculo es 0.8E0 .
- (5) será
o
n
E(5) = t⊥(5) r⊥(4) r⊥(3) t⊥(2) ei0 , tq(5) rq(4) rq(3) tq(2) e i0 E0
= e −i (2.5570) , e −i (4.1277) 0.96E0 ,
es decir, e i0 , e −i 𝜋/2 0.96e−i (2.5570) E0 , lo cual representa un estado
de polarización circular a derecha. El radio del círculo es 0.96E0 .
1
2
3
q i2
q i2
1
q i2
4
5
4
5
3
2
Figura 2.20. Rombo de Fresnel en aire (nt = 1.0) para un vidrio de índice
ni = 1.5. El ángulo de incidencia en las caras diagonales es 𝜃 i = 53.26◦ . Luz que
incide linealmente polarizada a −45◦ (con respecto al plano de incidencia) emerge
circularmente polarizada a derecha.
152
·
Polarización
Si el haz incidente es linealmente polarizado pero con el plano de vibración diferente a ±45◦ , el resultado será un estado de polarización diferente
al circular. En particular, si el ángulo del plano de vibración es 0 o 90◦ tendremos que el estado de polarización lineal no cambia, manteniéndose en
un plano perpendicular o paralelo al plano de incidencia. Note que el plano
de incidencia se define con la normal de la segunda superficie, ya que con la
primera superficie no está definido el plano de incidencia (el vector de onda
incidente es colineal con la normal de la interfase).
2.4.2. Reflectancia y transmitancia
Reflectancia y Transmitancia
1.0
T
0.9
T
0.8
0.7
0.6
0.5
 'p
0.4
0.3
0.2
R
0.1
0
R
0
10
20
30
c
40
50
60
70
80
90
Ángulo de incidencia,  i (°)
Figura 2.21. Reflectancia y transmitancia para la reflexión interna (0 < 𝜃 i < 𝜃 c )
y total interna (𝜃 c < 𝜃 i < 𝜋/2).
En la fig. 2.21, se muestran las curvas para la reflectancia y la transmitancia.
La reflectancia es el cuadrado de las curvas mostradas en la fig. 2.17 (eq.
(2.108)). Para la transmitancia también tenemos dos intervalos. En el primero, 0 < 𝜃 i < 𝜃 c , los coeficientes de transmisión se calculan de acuerdo
con las eqs. (2.98) y (2.99). En el segundo intervalo, 𝜃 c < 𝜃 i < 𝜋/2, el ángulo de transmisión 𝜃 t = 90◦ , por lo que, de acuerdo con la eq. (2.110), la
transmitancia tanto para la componente paralela como para la componente ortogonal se hace igual a 0.5 Por supuesto, nuevamente se verifica que
R + T = 1 para las dos componentes de los campos.
5 En la reflexión total interna, la energía incidente se refleja completamente. Sin embargo,
aún existe una onda electromagnética más allá de la interfase que se atenúa rápidamente.
Esta onda se conoce como evanescente.
Polarización
·
153
2.5. Polarización con materiales
birrefringentes
El vector de polarización eléctrico en materiales dieléctricos se relaciona con
el campo eléctrico mediante la susceptibilidad eléctrica según la eq. (B.9)
P = 𝜖 0 𝜒 E.
Cuando el material es isotrópico, la susceptibilidad se describe mediante
una cantidad escalar y la ecuación deponda (eq. (B.14)) se reduce a ∇2 E =
𝜇 0 𝜖 0 (1 + 𝜒 )𝜕 2 E/𝜕t 2 , donde 𝜐 = c/ 1 + 𝜒 es la velocidad de la luz en el
material. Cuando el material es anisotrópico, la susceptibilidad se describe
mediante un tensor (matriz de 3 × 3) y la ecuación de onda es un poco más
compleja.
En general, la susceptibilidad eléctrica se puede describir como
© 𝜒 11
𝜒 = ­­ 𝜒 21
« 𝜒 31
𝜒 12
𝜒 22
𝜒 32
𝜒 13
𝜒 23
𝜒 33
𝜒 12
𝜒 22
𝜒 32
𝜒 13
𝜒 23
𝜒 33
ª
®
®
¬
(2.130)
y el vector de polarización eléctrico
© Px ª
© 𝜒 11
­ Py ® = 𝜖 0 ­ 𝜒 21
­
­
®
P
« z ¬
« 𝜒 31
ª © Ex ª
® ­ Ey ®
®­
®
E
¬« z ¬
(2.131)
no necesariamente es paralelo al vector eléctrico.
En el caso particular (de interés en este libro) de materiales dieléctricos
anisotrópicos no absorbentes, 𝜒 es simétrica y se puede reducir en un sistema de ejes principales a [14]
© 𝜒1
𝜒 = ­­ 0
« 0
0
𝜒2
0
0
0
𝜒3
ª
®.
®
¬
(2.132)
Las cantidades 𝜒 1 , 𝜒 2 y 𝜒 3 se denominan susceptibilidades principales.
En general, los cristales son materiales anisotrópicos cuyos elementos
(átomos, moléculas, iones) están localizados en arreglos geométricos regulares: cúbico, trigonal, tetragonal, hexagonal, triclínico, monoclínico y ortorrómbico. Para cristales dieléctricos no absorbentes, las susceptibilidades
principales se relacionan de la siguiente manera: (a) cúbico, 𝜒 1 = 𝜒 2 = 𝜒 3 ,
154
·
Polarización
es decir, se comporta como un material isotrópico; (b) trigonal, tetragonal,
hexagonal, 𝜒 1 = 𝜒 2 ≠ 𝜒 3 , y (c) triclínico, monoclínico y ortorrómbico,
𝜒1 ≠ 𝜒2 ≠ 𝜒3.
Al escribir la ecuación de onda (B.14)) como
∇ × (∇ × E) +
1 𝜕2E
1 𝜕2E
=
−
𝜒
c 2 𝜕t 2
c 2 𝜕t 2
(2.133)
y proponiendo una solución de ondas planas E(r, t) = E0 e i (k·r−𝜔t) , pasamos a un conjunto de ecuaciones algebraicas de las cuales podemos analizar el comportamiento de las componentes del campo eléctrico dentro
del material anisotrópico. De acuerdo con las eqs. (2.10) y (2.12), para las
ondas planas armónicas podemos hacer los siguientes cambios ∇ → ik y
𝜕/𝜕t → −i𝜔. Con esto en mente, la eq. (2.133) se transforma en
k × (k × E) +
𝜔2
𝜔2
E
=
−
𝜒 E.
c2
c2
En términos de las componentes de k y de E,6 se llega a
𝜔2
𝜔2
2
2
−ky − kz + 2 Ex + kx ky Ey + kx kz Ez = − 2 𝜒 1 Ex ,
c
c
𝜔2
𝜔2
2
2
kx ky Ex + −kx − kz + 2 Ey + ky kz Ez = − 2 𝜒 2 Ey ,
c
c
𝜔2
𝜔2
kx kz Ex + ky kz Ey + −kx2 − ky2 + 2 Ez = − 2 𝜒 3 Ez .
c
c
(2.134)
(2.135)
(2.136)
(2.137)
2.5.1. Láminas retardadoras de fase
Un primer resultado de las eqs. (2.135), (2.136) y (2.137) se obtiene directamente si suponemos que dentro del material se propaga una onda en
una de las direcciones, por ejemplo, k = {kx , 0, 0}, donde la magnitud de
k, k = kx . En este caso, las ecuaciones se reducen a
𝜔2
𝜔2
E
=
−
𝜒 1 Ex ,
x
c2
c2
𝜔2
𝜔2
2
−kx + 2 Ey = − 2 𝜒 2 Ey ,
c
c
6 Para
(2.138)
(2.139)
obtener cada una de las componentes, se puede utilizar la identidad vectorial
[x × (y × z)] i = yi x j z j − zi x j y j , donde x j y j (x j z j ) indica el producto punto x · y (x · z).
Con esta ecuación obtenemos la i-ésima componente del doble producto cruz.
Polarización
−kx2
𝜔2
𝜔2
+ 2 Ez = − 2 𝜒 3 Ez .
c
c
·
155
(2.140)
Ya que en el material dieléctrico 𝜖 ≠ 𝜖 0 , entonces 𝜒 1 (y 𝜒 2 , 𝜒 3 ) ≠ 0. Por
lo tanto, en la eq. (2.138), se tiene que Ex = 0, es decir, E es transversal a la
dirección de propagación, o sea, E = {0, Ey , Ez }.
En la eq. (2.139), si Ey ≠ 0, se tiene que
𝜔2
(1 + 𝜒 2 ) .
(2.141)
c2
p
Como el índice de refracción se define n = 1 + 𝜒 (eq. (B.18)), entonces
el número de onda de la componente del campo que vibra en el plano yx y
que se propaga en la dirección x está dado por
k2 =
k=
2𝜋
n2 .
𝜆
(2.142)
En otras palabras,
p la componente Ey se propaga en un material de índice de
refracción n2 = 1 + 𝜒 2 .
En forma análoga, en la eq. (2.140), si Ez ≠ 0, se tiene que
k2 =
𝜔2
(1 + 𝜒 3 ) ,
c2
(2.143)
por lo tanto, el número de onda de la componente del campo que vibra en
el plano zx y que se propaga en la dirección x está dado por
k=
2𝜋
n3 .
𝜆
(2.144)
Ahora la componente
Ez del campo se propaga en un material de índice de
p
refracción n3 = 1 + 𝜒 3 . Así que para la onda propagándose en la dirección
x, el material presenta dos índices de refracción, uno para cada componente
del campo. Este tipo de materiales se denominan materiales birrefringentes (de
doble índice).
En resumen, la onda electromagnética que se propaga en dirección x
tendrá la forma
E = {0, E0y e i (2𝜋xn2 /𝜆 −𝜔t) , E0z e i (2𝜋xn3 /𝜆 −𝜔t) }.
(2.145)
Lo anterior tiene como consecuencia que las componentes Ey y Ez se desfasan continuamente. Para la distancia x, el desfase entre las componentes
será
2𝜋 (n3 − n2 )
Δ𝛿 =
x.
(2.146)
𝜆
156
·
Polarización
Resultados similares se obtienen si la dirección de propagación es en y o en
z. Así que los índices de refracción principales n1 , n2 y n3 están asociados a
las direcciones x, y y z, respectivamente.
Con base en los anteriores resultados, se fabrican láminas birrefringentes
para generar retrasos de fase entre las componentes controlando el espesor
de la lámina. Supongamos que tenemos una lámina birrefringente de espesor d, como se muestra en la fig. 2.22, cuyas aristas coinciden con las
direcciones principales y n3 > n2 . Una onda vibrando en el plano zx se
propaga con la velocidad 𝜐3 = c/n3 y una onda vibrando en el plano yx se
propaga con velocidad 𝜐2 = c/n2 . Ya que n3 > n2 , entonces 𝜐3 < 𝜐2 . En
otras palabras, para la eq. (2.145), la componente Ez viaja más lento que la
componente Ey . Se dice entonces que en z se tiene un eje lento y en y un eje
rápido. Con esto, queda claro que la componente Ey se adelanta a la componente Ez cuando emergen de la lámina y la diferencia de fase entre ellas
será 2𝜋 (n3 − n2 )d/𝜆 .
d
z
E'z
n3 > n2
E'y
y
x
Ez
Ey
Eje
rápido
a
Eje
lento
Figura 2.22. Lámina retardadora de fase.
Lámina de 𝜆 /4
Supongamos que se quiere generar una diferencia de fase igual 𝜋/2, es decir,
2𝜋 (n3 − n2 )d/𝜆 = 𝜋/2. El espesor de la lámina debe ser
𝜆 1
d=
,
4 Δn
con Δn = |n3 − n2 |. A este tipo de láminas se les denomina láminas de 𝜆 /4
y se suelen usar para generar luz circularmente polarizada. Por ejemplo, si
una onda plana linealmente polarizada con el plano de vibración en un ángulo 𝛼 = 45◦ incide en la cara anterior de la lámina con 𝜃 i = 0 (indicencia
Polarización
·
157
normal), la luz que sale de la lámina tendrá un estado de polarización circular a izquierda, como se muestra en la fig. 2.22 Note que si se gira la lámina
90◦ alrededor del eje x (ahora el eje rápido estará vertical y el eje lento estará
horizontal) manteniendo la polarización del haz incidente, el resultado será
luz con un estado de polarización circular a derecha.
Lámina de 𝜆 /2
Si se quiere generar una diferencia de fase de 𝜋, se debe duplicar el espesor
de la lámina, es decir,
𝜆 1
.
d=
2 Δn
A este tipo de láminas se les denomina láminas de 𝜆 /2 y se suelen usar para
rotar el plano de vibración de una onda linealmente polarizada. En particular, si la onda incidente es como la del caso anterior, con 𝛼 = 45◦ , la onda
que emerge de la lámina de 𝜆 /2 será linealmente polarizada con 𝛼 = −45◦ .
Una ventaja notable de usar una lámina de 𝜆 /2 parta rotar el plano de
vibración de una onda linealmente polarizada está en que el giro se hace sin
atenuar la amplitud de la onda, lo que sí ocurre cuando se utilizan polarizadores dicroicos de acuerdo con la ley de Malus (eq. (2.53)).
Para estimar el espesor de las láminas retardadoras de fase, supongamos que se desea construir una lámina de 𝜆 /4 hecha de calcita (estructura
cristalina trigonal). Los índices de refracción principales de la calcita son:
n1 = n2 = 1.658 y n3 = 1.486,7 es decir, Δn = 0.172. Con esto, el espesor
para la línea “d” del helio (𝜆 = 587.56 nm) será d = 0.8540 𝜇m. Esto es un
espesor muy pequeño para un dispositivo práctico. Así que a nivel comercial las láminas se fabrican con cristales birrefringentes cuyo espesor sea un
múltiplo impar de 𝜆 /4 (o par de 𝜆 /2).
2.5.2. Cristales birrefringentes
En la sección anterior, se vio cómo se comporta un cristal suponiendo que la
onda se propaga a lo largo de una de las direcciones principales. Un caso más
general supone cualquier dirección de propagación. En este caso, debemos
volver a las eqs. (2.135), (2.136) y (2.137). Estas ecuaciones constituyen un
sistema de ecuaciones lineales homogéneo. La solución distinta a la trivial
(Ex = Ey = Ez = 0) supone que el determinante de los coeficientes sea igual
7 Estos
son los índices ordinario y extraordinario. Estas definiciones las veremos en la
siguiente sección.
158
·
Polarización
a 0, es decir,
(n1 𝜔/c) 2 − ky2 − kz2
kx ky
kx kz
kx ky
(n2 𝜔/c) 2 − kx2 − kz2
ky kz
kx kz
ky kz
(n3 𝜔/c) 2 − kx2 − ky2
= 0.
(2.147)
En un sistema de coordenadas kx , ky y kz , la ecuación anterior representa
una superficie de doble hoja. Para ver de manera sencilla estas superficies
vamos a examinar los cortes de las superficies con los planos kx ky (kz = 0),
kx kz (ky = 0) y ky kz (kx = 0), suponiendo que n1 < n2 < n3 . Comenzando
con el plano kz = 0, la eq. (2.147) se reduce a
(n1 𝜔/c) 2 − ky2
kx ky
0
kx ky
(n2 𝜔/c) 2 − kx2
0
0
0
(n3 𝜔/c) 2 − kx2 − ky2
= 0,
(2.148)
de donde
o
n
o nh
ih
i
(n3 𝜔/c) 2 − kx2 − ky2
(n1 𝜔/c) 2 − ky2 (n2 𝜔/c) 2 − kx2 − kx2 ky2 = 0.
(2.149)
Esto es el producto de dos factores (los que están entre las llaves), y cada
uno de ellos debe ser igual a 0. Del primer factor
kx2 + ky2 = (n3 𝜔/c) 2 ,
(2.150)
es decir, un círculo de radio n3 𝜔/c. Del segundo factor,
kx2
(n2 𝜔/c) 2
+
ky2
(n1 𝜔/c) 2
= 1,
(2.151)
es decir, una elipse con semiejes n2 𝜔/c y n1 𝜔/c en kx y ky , respectivamente.
ky
n3w
c
n1 w
c
n2w
c
n3 w
c
kx
kz
Figura 2.23. Curvas de vectores de onda en un cristal en el plano kz = 0.
Polarización
·
159
En la fig. 2.23, se muestra las dos curvas que resultan de la intersección
de la superficie de dos hojas con el plano kz = 0: el círculo de radio n3 𝜔/c y
la elipse con semiejes n1 𝜔/c y n2 𝜔/c.
Haciendo un análisis análogo para los planos kx = 0 y kz = 0, se tiene
entonces que en cada plano las intersecciones de las dos superficies son un
círculo y una elipse, como se muestra en la fig. 2.24 . Así que, en general,
para cualquier dirección k tendremos dos valores para el número de onda
k, es decir, dos índices de refracción. En particular, para la propagación en
la dirección x, tendremos dos velocidades de fase, 𝜐2 = c/n2 , para la componente Ey , y 𝜐3 = c/n3 , para la componente Ez ; para la propagación en la
dirección y, tendremos dos velocidades de fase, 𝜐1 = c/n1 , para la componente Ex , y 𝜐3 = c/n3 , para la componente Ez ; y para la propagación en la
dirección z, tendremos dos velocidades de fase, 𝜐1 = c/n1 , para la componente Ex y 𝜐2 = c/n2 , para la componente Ey . Lo anterior significa que para
cada dirección de propagación hay dos velocidades de fase correspondientes a dos componentes del campo eléctrico mutuamente ortogonales. Para
cualquier otra dirección de propagación ocurre igual, se tienen dos velocidades de fase que siempre corresponden con dos direcciones mutuamente
ortogonales de polarización. Esto se ilustra en la fig. 2.24, con el vector de
onda k en el plano kz = 0. Los valores de los índices de refracción para cada dirección de polarización son la medida de la distancia desde el origen
del sistema de coordenadas hasta las dos intersecciones del vector k, divida
entre 𝜔/c.
ky
n3 w
c
n1 w
c
k
O
n2 w
c
kz
n2 w
c
n3 w
c
n1 w
c
kx
Eje
óptico
Figura 2.24. Superficies del vector de onda en un cristal con n1 < n2 < n3 .
En la dirección del eje óptico, las velocidades de fase asociadas a cada una de las
direcciones de polarización son iguales.
160
·
Polarización
Una situación particular para las velocidades de fase se tiene cuando las
dos superficies del vector de onda se intersecan en un punto, como se muestra en la fig. 2.24 para el plano ky = 0. Allí, el número de onda k es igual
para las dos direcciones de polarización, por lo tanto, los índices de refracción son iguales y, en consecuencia, las velocidades de fase también serán
iguales. La dirección de k para la cual ocurre esto se denomina eje óptico del
cristal. Entonces, una onda que se propaga en un cristal anisotrópico a lo
largo del eje óptico del cristal lo hace de la misma manera que en un material isotrópico. Las dos componentes ortogonales del campo no se desfasan
entre sí. En los cristales en que los tres índices de refracción principales son
diferentes entre sí, se tienen dos ejes ópticos; a estos cristales se les denomina
cristales biaxiales. En los cristales en que dos de los tres índices de refracción
principales son iguales entre sí se tiene un solo eje óptico; a estos cristales
se les denomina cristales uniaxiales. Las dos superficies del vector de onda en
los cristales uniaxiales consisten en una esfera y un elipsoide de revolución.
Dependiendo de qué superficie contiene a la otra, los cristales uniaxiales se
clasifican en positivos o negativos. Es positivo si el elipsoide circunscribe a
la esfera, es negativo si la esfera circunscribe al elipsoide. En el caso de los
cristales biaxiales, estas superficies son elipsoides de revolución que se cruzan. En la fig. 2.25, se muestra la clasificación de los cristales a partir de
las secciones de la esfera y los elipsoides en el plano que contiene a los ejes
ópticos.
eje
óptico
eje
óptico
O
O
(a)
(b)
eje
óptico
eje
óptico
O
(c)
Figura 2.25. Clasificación de los cristales según el eje óptico del cristal: (a) uniaxial
positivo, (b) uniaxial negativo, (c) biaxial.
En los cristales uniaxiales 𝜒 1 = 𝜒 2 , al índice de refracción correspondiente se le llama índice ordinario, no . Al índice correspondiente a 𝜒 3 se le
llama índice extraordinario, ne . Así, en un cristal uniaxial positivo, no < ne , y
en un cristal uniaxial negativo, no > ne . Por otra parte, a la componente del
campo que vibra con el número de onda correspondiente a no se denomina
Polarización
·
161
onda ordinaria (rayo ordinario) y a la componente del campo que vibra con
el número de onda correspondiente a ne se le denomina onda extraordinaria
(rayo extraordinario).
En la tabla 2.2, se dan algunos ejemplos de cristales uniaxiales positivos
(+) y negativos (−) y de cristales biaxiales [14]. En particular se ve que la
calcita tiene un Δn relativamente grande, lo que explica que sea un material
muy usado para fabricar elementos ópticos (retardadores de fase y prismas).
Tabla 2.2. Algunos cristales. En los cristales uniaxiales, a los índices que son iguales
se les llama índice ordinario y al que es diferente índice extraordinario.
Estructura
Isotrópico
cubico
Susceptibilidad
a
0
0
c= 0
a
0
0
0
a
a
0
0
Uniaxial
trigonal
tetragonal
c= 0
a
0
hexagonal
0
0
b
a
0
0
monoclínico
c= 0
b
0
ortorrómbico
0
0
c
Cristal
n1
n2
n3
Cloruro de sodio
1.544 1.544 1.544
Diamante
2.417 2.417 2.417
+ Cuarzo
1.544 1.544 1.553
+ Hielo
1.309 1.309 1.310
- Calcita
1.658 1.658 1.486
- Nitrato de sodio
1.587 1.587 1.336
Biaxial
triclínico
Topacio
1.619 1.620 1.627
Mica
1.552 1.582 1.588
2.5.3. Refracción en cristales
Ya que en general un cristal birrefringente muestra dos índices de refracción para una dirección de propagación, en la refracción en una interfase
que separa dos medios, uno isotrópico y el otro anisotrópico, un haz incidente con 𝜃 i ≠ 0 (desde el medio isotrópico) será separado en dos haces
refractados. En particular, para la refracción vamos a considerar interfases
que sean paralelas u ortogonales al eje óptico del cristal.
En la fig. 2.24, en el plano ky = 0, se puede observar que la onda ordinaria vibra ortogonalmente al eje óptico del cristal. Esto es un hecho en todos
los cristales y nos permite determinar la dirección que siguen las ondas ordinaria y extraordinaria en la refracción. Para ver la refracción, vamos a
considerar un cristal uniaxial negativo sumergido en aire. Supongamos que
la interfase es una cara plana del cristal que contiene al eje óptico y que el
162
·
Polarización
plano de incidencia es ortogonal al eje óptico. De la fig. 2.25(b), se establece que la incidencia y refracción de los rayos ocurren como se muestra en
la fig. 2.26. Las curvas de índice (número de onda dividido entre 𝜔/c) son
círculos. Ya que el eje óptico indica una dirección, en la figura el eje óptico
se muestra con puntos (líneas ortogonales al plano del papel). Si descomponemos el haz incidente en un vector paralelo al plano de incidencia (plano
del papel), Eqi , y en un vector ortogonal al plano de incidencia, E⊥
i , entonces la componente paralela será ortogonal al eje óptico; esta será la onda
ordinaria.
Ei
Ei
no
ne
ni
n i si
n o so
n e se
Et
Et
Figura 2.26. Refracción en un cristal uniaxial negativo (no > ne ). En la refracción
se tienen dos haces separados: la onda ordinaria, Etq , y la onda extraordinaria Et⊥ .
Para obtener las direcciones de propagación de las ondas ordinaria y extraordinaria en la refracción, podemos hacer uso del trazo gráfico de rayos
de la fig. 1.9, como se muestra en la fig. 2.26. Por supuesto, ambos rayos
cumplen con la ley vectorial de la ley de Snell (eq. (2.75)). Para el rayo ordinario, nt = no , y para el rayo extraordinario, nt = ne . Por lo tanto, para el
rayo ordinario,
no sin 𝜃 to = ni sin 𝜃 i ,
(2.152)
y para el rayo extraordinario,
ne sin 𝜃 te = ni sin 𝜃 i .
(2.153)
El resultado final es la separación de las dos componentes de la onda
incidente: Eqt vibra propagándose en la dirección del rayo ordinario y E⊥
t
vibra propagándose en la dirección del rayo extraordinario. La separación
de los haces debido a la doble refracción explica la doble imagen que puede
verse con los cristales de calcita, como se muestra en la fig. 2.27.
·
Polarización
163
Figura 2.27. Doble imagen generada con un cristal de calcita.
uniaxial negativo
Si se cambia la orientación del eje óptico con respecto a la interfase,
también se cambian las curvas de índice y, por lo tanto, la manera como
se refractan los rayos ordinario y extraordinario. En la fig. 2.28, se muestra algunas configuraciones básicas de las curvas de índice para los cristales
uniaxiales positivo y negativo. El eje óptico se representa con las líneas paralelas en gris o con puntos (líneas ortogonales al plano del papel). Además
de la separación de los rayos ordinario (o) y extraordinaro (e), en los cristales uniaxiales negativos el rayo ordinario se retrasa con respecto al rayo
extraordinario, en los cristales uniaxiales positivos sucede lo contrario.
i
i
i
ni
ni
ne
ne
no
ne
no
no
e
o
(a)
o
(b)
i
uniaxial positivo
ni
e
i
ni
i
ni
ni
no
ne
no
ne
e
o
e
o
(c)
ne
e
no
o
e
o
Figura 2.28. Algunas configuraciones de la interfase y el plano de incidencia en
cristales uniaxiales cuyo eje óptico es paralelo u ortogonal a la interfase.
2.5.4. Prismas polarizadores
A partir de las configuraciones mostradas en la fig. 2.28, se pueden construir
elementos ópticos para obtener luz linealmente polarizada a partir de luz
164
·
Polarización
natural. Ya que las dos componentes del campo refractadas tienen estados
de polarización lineal mutuamente ortogonales, se puede bloquear una de
ellas para obtener luz linealmente polarizada. Sin embargo, el haz obtenido
tendrá una dirección de propagación diferente a la del haz incidente.
Et
n
q te
(n o , n e )
(c)
Ei
qo
qi
Ei
qi
(c)
qe
Er
Er
Figura 2.29. Reflexión total interna en la calcita para el rayo ordinario, n < no y
n < ne .
Para obtener luz linealmente polarizada en la misma dirección del haz de
luz natural incidente, se puede usar un par de prismas birrefringentes con
sus caras diagonales unidas por un medio óptico o por una película de aire.
En el primer prisma, los haces con polarizaciones mutuamente ortogonales
mantienen la dirección del haz incidente (ortogonal a la primera cara), en
la cara diagonal, uno de los haces se refleja totalmente mientras que el otro
se refleja y se transmite ingresando al segundo prisma para mantener la
dirección del haz incidente. Lo notable aquí es la reflexión total interna de
uno de los haces.
Para ver el principio de funcionamiento, consideremos la reflexión interna de un haz en la calcita, como se muestra en la fig. 2.29. Ya que tenemos
dos índices de refracción en la calcita, no = 1.658 y ne = 1.486, el primero para la onda que vibra paralela al plano de incidencia (rayo ordinario)
y el segundo para la onda que vibra ortogonal al plano de incidencia (rayo extraordinario), entonces también tendremos dos ángulos críticos para
la reflexión total interna. Si n = 1 (aire), para el rayo ordinario
n
(c)
𝜃 o = arcsin
= 37.09◦ ,
no
para el extraordinario
𝜃 e(c)
n
= arcsin
= 42.29◦ .
ne
Polarización
·
165
Con base en estos dos ángulos, si el rayo incidente llega a la interfase con un
ángulo 𝜃 o(c) < 𝜃 i < 𝜃 e(c) , entonces el rayo ordinario se refleja con reflexión
total interna, mientras que el rayo extraordinario se refleja y se transmite, de
modo que en el segundo medio (aire) se tiene un haz linealmente polarizado
vibrando ortogonalmente al plano de incidencia.
En la fig. 2.30, se muestra un posible sistema con un par de prismas de
calcita con el que se logra que el haz a la salida sea linealmente polarizado
en el estado “s” y con la misma dirección del haz incidente (luz natural).
La normal de la cara diagonal (del primer prisma) y el haz incidente determinan el plano de incidencia. Por otro lado, la inclinación de la diagonal
es tal que los haces transmitidos en el primer prisma llegan con un ángulo
𝜃 i = 40◦ a la diagonal. En la reflexión en esta diagonal, se tiene la reflexión
total interna del rayo ordinario y la reflexión interna de rayo extraordinario.
En la transmisión solo se tiene el rayo extraordinario que se desvía (según
la ley de Snell) y al llegar a la segunda diagonal vuelve a tomar la dirección
que tenía en el primer prisma, gracias a que las dos diagonales son caras
paralelas entre sí.
40°
e
40°
Figura 2.30. Sistema de dos prismas de calcita con el eje óptico ortogonal al plano
de incidencia para generar luz linealmente polarizada en el estado “s”. Las dos diagonales son paralelas y el medio entre ellas es aire ( n = 1.000).
Comercialmente, hay una gran variedad de prismas polarizadores. Usualmente las caras diagonales se unen con un medio óptico diferente al aire,
por ejemplo, con bálsamo de Canadá,8 el cual tiene un índice de refracción
que varía entre 1.54 y 1.55. Este índice está en medio de los dos índices
de la calcita, por lo que solo tendremos el ángulo crítico para el rayo ordinario, esto es, 𝜃 o(c) = 68.25◦ . En la fig. 2.31, se muestra un prisma de
8 El
bálsamo de Canadá es una resina de un árbol que, debido a su transparencia y a su
índice de refracción cercano al del vidrio (después de ser sometido a un proceso de evaporación de aceites), se usa para pegar lentes en los instrumentos ópticos.
166
·
Polarización
Glan-Thompson hecho de calcita con el eje óptico ortogonal al plano de
incidencia. La geometría de los prismas es tal que el ángulo de incidencia
en la primera cara diagonal es mayor que 𝜃 o(c) .
Aire
Calcita
Aire
e
Calcita
Bálsamo de
Canadá
Figura 2.31. Prisma Glan-Thompson hecho con dos prismas de calcita unidos
con bálsamo de Canadá.
Wollaston
Rochon
Senarmont
Figura 2.32. Algunos tipos de prismas polarizadores que separan las componentes
del campo óptico en los estados “s” y “p”. En todos los casos, los prismas son de
cuarzo.
En la fig. 2.32, se muestra otro tipo de prismas hechos de cuarzo en los
que los ejes ópticos de cada uno de los prismas cambian de dirección y las
diagonales están inclinadas 45◦ . En los prismas de Wollaston, E⊥
i en el primer prisma es el rayo ordinario y al pasar al segundo prisma cambia a rayo
extraordinario, por lo que en la diagonal se refracta acercándose a la normal, y Eqi en el primer prisma es el rayo extraordinario y al pasar al segundo
prisma cambia a rayo ordinario, por lo que en la diagonal se refracta aleq
jándose de la normal. En los prismas de Rochon, E⊥
i y Ei entran al primer
prisma a lo largo del eje óptico, por lo que ambos rayos veran el índice ordinario; luego en el segundo prisma E⊥
i cambia a rayo extraordinario y se
q
refracta acercándose a la normal, y Ei sigue como rayo ordinario, por lo
que no cambia su dirección de propagación. Por último, en los prismas de
q
Senarmont, E⊥
i y Ei también entran al primer prisma a lo largo del eje óptico, por lo que ambos rayos verán el índice ordinario; luego, en el segundo
prisma E⊥
i sigue como rayo ordinario, por lo que no cambia su dirección de
propagación, y Eqi cambia a rayo extraordinario y se refracta acercándose a
la normal.
Polarización
·
167
También se puede tener prismas polarizadores hechos de vidrio óptico
isotrópico. Estos son cubos divisores de haz con una película dieléctrica en
medio de las diagonales que unen los prismas, lo que permite la trasmisión del estado de polarización p y la reflexión en la diagonal del estado de
polarización s. En el apéndice E se hace una breve mención al respecto.
168
·
Polarización
2.6. Vectores y matrices de Jones
Para describir el estado de polarización de una onda plana, hemos empleado
en la unidad 2.1 el vector (eq. (2.32))
E(x, y, z; t) = ı̂Eox + ̂Eoy e i (kz−𝜔t) ,
donde Eox = |Eox | e i𝛿x y Eoy = Eoy e i𝛿y . Ya que los términos de fase temporal y espacial son comunes a las amplitudes complejas de las dos componentes de la onda, una manera conveniente de escribir el estado de polarización
es mediante un vector columna en el que sus elementos determinan la relación entre las componentes de la onda. Esta representación es conocida
como vector de Jones:
|Eox | e i𝛿x
Eox
=
.
(2.154)
Eoy
Eoy e i𝛿y
Por ejemplo, para algunos de los estados de polarización más comunes
la representación explicita se ve como sigue:
- Polarización lineal. El desfase entre las componentes ha de ser Δ𝛿 =
m𝜋 (m = 0, ±1, ±2, ...). Por lo tanto,
|Eox |
.
(2.155)
± Eoy
En los casos más comunes de la polarización lineal, el vector de Jones
se puede reducir de acuerdo con la orientación del plano de vibración.
Para la polarización horizontal (EH ), Eoy = 0,
|Eox |
1
0
(2.156)
para la polarización vertical (EV ), |Eox | = 0,
± Eoy
0
1
,
(2.157)
y para la polarización diagonal a ±45◦ (E±45 ), |Eox | = Eoy ,
|Eox |
1
±1
.
(2.158)
Polarización
·
169
- Polarización circular. El desfase entre las componentes ha de ser
Δ𝛿 = (2m − 1)𝜋/2; (m = 0, ±1, ±2, ...) y |Eox | = Eoy . Por lo
tanto, el vector de Jones queda
1
|Eox |
.
(2.159)
±i
El signo (+) para la polarización circular izquierda (EL ) y el signo (−)
para la polarización circular derecha (ER ).
- Polarización elíptica. Cuando el desfase entre las componentes es
Δ𝛿 = (2m − 1)𝜋/2; (m = 0, ±1, ±2, ...) con |Eox | ≠ Eoy , tenemos una elipse no rotada. El vector de Jones será
1
|Eox |
(2.160)
±ib
con b = Eoy /|Eox |. El signo (+) para la polarización elíptica izquierda
(EL ) y el signo (−) para la polarización elíptica derecha (ER ).
Tabla 2.3. Algunos estados de polarización en la notación de vectores de Jones.
Vector de Jones
1
0
0
1
1
±1
Estado polarización
EH , (Lineal horizontal)
EV , (Linea vertical)
1
i
1
−i
E±45 , (Lineal diagonal ±45◦ )
EL , (Circular izquierda)
ER , (Circular derecha)
Cualquier otro estado de polarización quedará descrito por la eq. ( 2.154).
Los estados de polarización más usados en la práctica se representan en la
170
·
Polarización
tabla 2.3. Note que se omite el factor que multiplica al vector columna, ya
que es común a ambos elementos. Entonces, para representar un estado
de polarización solamente emplearemos la forma más simple del vector de
Jones.
Con los vectores de Jones, podemos hacer operaciones entre estados de
polarización, por ejemplo:
- la suma de dos estados de polarización lineales mutuamente ortogonales
1
1
1
+
=
0
0
1
resulta en un estado de polarización diagonal;
- la suma de un estado de polarización lineal y uno circular
1
1
1
=2
+
0.5i
i
0
resulta en un estado de polarización elíptico;
- la suma de dos estados de polarización circular, uno a izquierda y otro
a derecha
1
1
1
=2
+
0
−i
i
resulta en un estado de polarización lineal.
Por otra parte, los elementos polarizadores también se pueden representar convenientemente como matrices 2 × 2, de modo que el efecto de un
elemento polarizador sobre un estado de polarización se describe mendiante una transformación lineal. Así, si
a b
(2.161)
c d
describe
el elemento polarizador, el resultado sobre un estado de polarizaA
ción
será
B
0 A
a b
A
=
.
(2.162)
B0
c d
B
Por ejemplo, consideremos un polarizador lineal con su eje de transmisión
horizontal. Sabemos que el resultado sobre EH es nuevamente EH y, el
resultado sobre EV es 0, esto es,
1
a b
1
=
(2.163)
0
c d
0
Polarización
·
171
y
0
0
a b
c d
=
0
1
.
(2.164)
Inmediatamente, se ve que de eq. (2.163) a = 1 y c = 0, y de eq. (2.164)
b = 0 y d = 0. Por lo tanto, la matriz
1 0
(2.165)
0 0
representa un polarizador lineal con se eje de transmisión horizontal.
Tabla 2.4. Algunos polarizadores representados como matrices de Jones.
Elemento
Matriz de Jones
horizontal
Polarizador
lineal
Lámina
de l/4
Lámina
de l/2
1
0
0
0
0
0
0
1
eje rápido
horizontal
eje rápido
vertical
1
0
1
0
0
i
0
i
eje rápido
horizontal
1
0
0 -1
Polarizador
circular
vertical
derecho
1
i
1
2 -i
1
diagonal
1 +-1
1
2 +1 1
eje rápido
+
- 45°
+
1 1 -i
2 +-i 1
eje rápido
vertical
1
0
0 -1
izquierdo
1 -i
1
2 i
1
En la tabla 2.4, se muestra algunas matrices que representan elementos
polarizadores.
Algunas de las matrices están acompañadas de los factores
√
1/2 y 1/ 2, que son necesarios cuando se requiere hacer el balance de la
energía, pero para el análisis de los cambios de la polarización se pueden
omitir. También se puede tener varias representaciones para un mismo elemento. Por ejemplo,
un polarizador circular a izquierda en la tabla 2.4 se
1 −i
representa con
. Pero también lo podemos hacer con la matriz
i 1
172
·
Polarización
que resulta al combinar un polarizador lineal diagonal con una lámina de
𝜆 /4, esto es,
1 1
1 1
1 0
.
=
i i
1 1
0 i
Con cualquiera de las dos matrices, transformamos un estado de polarización lineal (EH , EV , E±45 ) en un estado de polarización circular EL . Lo que
se verifica fácilmente:
1 −i
A
1
= (A − iB)
i 1
B
i
y
1 1
i i
A
B
= (A + B)
1
i
.
Como ejemplo consideremos el sistema de la fig. 2.33. Tenemos tres
elementos ópticos alineados con el eje z: un polarizador lineal con su eje de
trasmisión rotado 45◦ , una lámina de 𝜆 /4 con su eje rápido ( f ) vertical y
una lámina de vidrio que refleja rq = 0.2 y r⊥ = −0.2.
y
y
x
Luz
natural
PL
f
s
l/4
x
z
Lámina
de vidrio
Figura 2.33. Sistema óptico que anula la luz reflejada después de pasar de regreso
por la lámina de 𝜆 /4.
Si (desde la izquierda) incide luz natural en el polarizador lineal, se tendrá
que la luz reflejada se anula cuando incide de regreso en el polarizador lineal.
Cualitativamente (observando desde el lado positivo del eje z), se tiene que
después del polarizador lineal la luz está linealmente polarizada a 45◦ , al
pasar por la lámina de 𝜆 /4 se transforma en circular derecha, al reflejarse
en la lámina de vidrio cambia a circular izquierda y, al llegar de regreso a
Polarización
·
173
la lámina de 𝜆 /4 queda con polarización lineal a −45◦ , por lo que no se
transmite luz después del polarizador. Matemáticamente, con los vectores
y matrices de Jones, se tendrá:
0
1 −1
1 0
−1 0
1 0
1 1
A
=
.
0
−1 1
0 −i
0 1
0 −i
1 1
B
Note que las matrices se escriben en el orden contrario al de los elementos ópticos (que van de izquierda a derecha). El producto de las matrices en
efecto es 0. La matriz del medio representa
la superficie
reflectora
a incir⊥ 0
−1 0
dencia normal, que se escribe como
= 0.2
. Por otro
0 rq
0 1
lado, al reflejarse la luz el sentido positivo del eje x cambia. Esto no tiene
ningún efecto en la lámina de 𝜆 /4, ya que sus ejes rápido ( f ) y lento ( s )
siguen orientados vertical y horizontalmente, pero en el polarizador lineal
no ocurre igual, pues ahora su eje de transmisión estará a −45◦ . Lo anterior
explica el cambio de signo en la matriz que representa al polarizador lineal
(primera matriz, después del signo =) en el regreso de la luz.
Además de los vectores y matrices de Jones, también se tienen otras representaciones matemáticas posibles, como los parámetros de Stokes, la esfera de Poincaré y las matrices de Muller.
Capítulo
tres
Interferencia
Interferencia
·
177
Figura 3.1. Interferencia de dos ondas y de múltiples ondas.
La interferencia de las ondas luminosas se observa como una modulación
de la irradiancia, generalmente franjas brillantes y franjas oscuras en una
pantalla de observación. La geometría de las franjas depende de la forma
de los frentes de onda y de la diferencia en el camino óptico que recorren
las ondas. Diferencias del orden de la longitud de onda de la luz generan
cambios en la irradiancia de una franja brillante a una oscura, lo que hace
de la interferencia una herramienta de gran precisión para medir: índice de
refracción, frente de onda, forma de superficies ópticas, espesores, etc. El
parámetro físico que determina la calidad de la interferencia (la posibilidad
de generar franjas) es la coherencia entre las ondas. La coherencia tiene
su origen en las fluctuaciones del campo óptico emitido por las fuentes.
Fuentes naturales, como el sol, emiten de manera espontánea (aleatoria),
pero en fuentes artificiales, como el láser, la emisión tiene un alto grado de
correlación.
En la fig. 3.1, se muestra dos patrones de interferencia generados con un
láser de He-Ne (𝜆 = 632.8 nm). El haz láser se enfoca con una lente positiva
en un agujero pequeño en una pantalla opaca, lo que se ve como un punto
luminoso en la figura (fuente puntual). La lente está detrás de la pantalla,
por lo que no se ve en la imagen. El frente de onda (esférico) divergente
se hace pasar por varios elementos ópticos. Primero, pasa por una lámina
de vidrio portaobjeto de microscopio de 1 mm de espesor (lámina). Allí,
178
·
Interferencia
en cada cara se refleja luz y se produce la interferencia entre las dos señales
reflejadas, la cual se observa sobre la pantalla opaca (patrón de interferencia inferior izquierdo-2 fuentes). Este patrón de interferencia consiste en
franjas aproximadamente circulares, en las que el espesor de las franjas brillantes es similar al espesor de las franjas oscuras. Este es el resultado típico
de la interferencia de dos fuentes que emiten ondas esféricas. Luego, se deja
seguir el haz transmitido por la lámina portaobjeto de microscopio y entra
a un interferómetro de Fabry-Perot, el cual consiste en dos láminas gruesas
de vidrio de alta reflectancia paralelas entre sí. La separación entre las láminas es menor a un milímetro y las caras que están enfrentadas tienen un
recubrimiento de película delgada de aluminio que aumenta la reflectancia.
Lo anterior genera múltiples reflexiones, con coeficientes de amplitud similares, por lo que ahora se tiene la interferencia de más de dos ondas. El
efecto en el patrón de interferencia reflejado es un adelgazamiento de las
franjas oscuras, como se puede ver en la pantalla opaca (patrón de interferencia superior derecho-N fuentes)
En este capítulo, veremos algunos de los interferómetros más comunes,
comenzando por el interferómetro de Michelson, ya que resulta muy ilustrativo para estudiar la interferencia de ondas planas y ondas esféricas. Luego discutiremos la interferencia de múltiples haces en una lámina de caras paralelas, lo que también explica el funcionamiento del interferómetro
de Fabry-Perot. En todos los casos, supondremos que las superficies de los
elementos ópticos que componen los interferómetros son ideales, es decir,
concuerdan con su descripción matemática. En la práctica, el proceso de
fabricación de estos elementos limita la calidad óptica de las superficies. En
la unidad 3.4 se comenta algunos aspectos prácticos en el interferómetro de
Michelson, los cuales también pueden estar presentes en otros interferómetros.
Interferencia
·
179
3.1. Interferencia y coherencia
Consideremos la suma de dos ondas planas armónicas dadas por E1 (r, t) =
E01 e i (k1 ·r−𝜔t+𝜙1 ) y E2 (r, t) = E02 e i (k2 ·r−𝜔t+𝜙2 ) en un punto r del espacio vacío (aire). Las fases 𝜙1 y 𝜙2 son funciones del tiempo que dependen del
proceso de emisión de luz y dan cuenta de las fluctuaciones de los campos
en r. Las amplitudes E01 y E02 se suponen constantes en el tiempo. La onda
resultante será:
E(r, t) = E1 (r, t) + E2 (r, t).
(3.1)
La irradiancia en r, de acuerdo con la eq. (2.29), está dada por
I (r) =
𝜖 0c
hE1 · E∗1 + E2 · E∗2 + 2 Re{E1 · E∗2 }i,
2
(3.2)
I (r) =
𝜖 0c 2
𝜖 0c
𝜖 0c 2
hE1 i +
hE2 i + 2
RehE1 · E∗2 i.
2
2
2
(3.3)
es decir,
Definiendo como plano de referencia al plano que contiene los vectores de
onda k1 = 2𝜋ŝ1 /𝜆 y k2 = 2𝜋ŝ2 /𝜆 , con respecto a este plano se definen las
componentes paralelas y ortogonales de E1 y E2 , es decir, E01 = E⊥
+ Eq01
01
y E02 = E⊥
+ Eq02 . Entonces,
02
⊥
E1 · E∗2 = E⊥
01 · E02
∗
e −i (Δk·r+Δ𝜙) + Eq01 · Eq02
∗
e −i (Δk·r+Δ𝜙) ,
(3.4)
donde Δk = k2 − k1 y Δ𝜙 = 𝜙2 − 𝜙1 . En la eq. (3.4), no se incluyen los
) ∗ y E⊥
· (Eq02 ) ∗ , ya que al ser mutuamente ortogonales
términos Eq01 · (E⊥
02
01
las componentes su resultado es 0. Esto último nos dice que las ondas con
polarizaciones ortogonales entre sí no interfieren.
y E⊥
son paralelos, mientras que los vectores Eq01 y
Los vectores E⊥
01
02
Eq02 forman un ángulo igual al ángulo entre s1 y s2 , así,
𝜖 0c
𝜖 0c 2 𝜖 0c 2
⊥ ⊥
q
q
hE1 i+
hE2 i+2
Reh E02
E01 + E02
E01
cos(2𝛼) e −i (Δk·r+Δ𝜙) i,
2
2
2
(3.5)
con 2𝛼 el ángulo entre ŝ1 y ŝ2 . De la eq. (3.5), tenemos que la interferencia
debida a ondas cuyos estados de polarización son paralelos al plano de referencia depende del ángulo 2𝛼. Así, si 2𝛼 = 𝜋/2, las ondas no interfieren
y la irradiancia será simplemente la suma de las irradiancias debidas a las
componentes paralelas, Iq = (I1 + I2 )q . Por otro lado, la interferencia debida
a ondas cuyos estados de polarización son ortogonales al plano de referencia
no depende del ángulo formado entre ŝ1 y ŝ2 .
I (r) =
180
·
Interferencia
En lo que sigue, vamos a suponer que las ondas que interfieren están en
el estado de polarización que es ortogonal al plano de referencia, de manera
que la expresión para la interferencia de dos ondas quedará
p
I (r) = I1 + I2 + 2 I1 I2 Rehe −i (Δk·r+Δ𝜙) i,
(3.6)
⊥ ) 2 y I = (𝜖 c/2)hE 2 i = (𝜖 c/2) (E ⊥ ) 2
donde I1 = (𝜖 0 c/2)hE12 i = (𝜖 0 c/2) (E01
2
0
0
2
02
las irradiancias en r generadas por cada una de las ondas.
En el término he −i (Δk·r+Δ𝜙) i, la diferencia de fases Δ𝜙 depende del tiempo. Para obtener el valor promedio, debemos conocer de manera explícita
la variación de 𝜙1 y 𝜙2 con el tiempo.
3.1.1. Grado de coherencia
Para llegar a la eq. (3.6), hemos supuesto que no hay retraso temporal entre
las ondas, el cual puede ocurrir si el origen de una de las fuentes se desplaza
o si una de las ondas viaja por un medio que produce un cambio en la velocidad de propagación. Si existe un retraso temporal 𝜏, entonces la suma de
las ondas en general será
E(r, t) = E1 (r, t) + E2 (r, t − 𝜏).
Ahora, la irradiancia estará dada por
p
I (r) = I1 + I2 + 2 I1 I2 Rehe −i (Δk·r+𝜔𝜏+Δ𝜙 (𝜏)) i
p
= I1 + I2 + 2 I1 I2 Re{e −iΔk·r he −i𝜔𝜏 e−i (Δ𝜙(𝜏)) i} ,
(3.7)
(3.8)
con Δ𝜙(𝜏) = 𝜙2 (t − 𝜏) − 𝜙1 (t). Definiendo el grado complejo de coherencia
𝛾 (𝜏) =
=
he −i𝜔𝜏 e −i (Δ𝜙 (𝜏)) i
|𝛾 (𝜏)| e
−i (𝛼 (𝜏)+𝜔𝜏)
(3.9)
,
donde 𝛼 (𝜏) + 𝜔𝜏 es la fase del grado de coherencia. Entonces
p
I (r) = I1 + I2 + 2 I1 I2 |𝛾 (𝜏)| cos(Δk · r+𝜔𝜏 + 𝛼 (𝜏)).
(3.10)
El módulo del grado de coherencia satisface 0 ≤ |𝛾 (𝜏)| ≤ 1. En los
límites, obtiene el valor de 0 si Δ𝜙 es una función aleatoria y el valor de 1 si
Δ𝜙 es constante en el tiempo. Se dice que la superposición de las ondas es
incoherente, parcialmente coherente o coherente si para el módulo de 𝛾(𝜏)
se tiene que


 0 , incoherente

|𝛾 (𝜏)| = {0, 1} , parcialmente coherente

 1 , coherente.

(3.11)
Interferencia
·
181
Aunque la expresión de la interferencia dada por la eq. (3.10) se ha obtenido en particular para ondas planas homogéneas (la amplitud de la onda
en un frente de onda es constante), el resultado es válido para la suma de
dos ondas en general. En este último caso el grado de coherencia es la versión normalizada de la correlación de los campos en el punto r. En libro
Principles of Optics de Born & Wolf, se puede ver el formalismo general de
la interferencia con ondas parcialmente coherentes [15].
3.1.2. Interferencia y coherencia
Para ver el efecto que 𝛾 (𝜏) tiene en la interferencia, vamos a considerar un
ejemplo muy simple, pero ilustrativo. Siguiendo a Fowles [14], supongamos
que la fuente luminosa que tenemos consiste en un sistema de dos niveles
electrónicos, que emite espontáneamente un pulso dado por
E(t) = E0 rect(t/𝜏0 )e −i (2𝜋 𝜈0 t−𝜙 (t))
(3.12)
donde la función rect(t/𝜏0 ) describe una señal rectangular de la siguiente
forma
t
1, si |t| ≤ 𝜏0 /2
rect
=
.
(3.13)
0, otro caso.
𝜏0
Entonces, el pulso es de forma cosenoidal de frecuencia 𝜈0 y duraci ón 𝜏0 ,
tal que 𝜏0 > T , donde el periodo T = 1/𝜈0 . La fase inicial 𝜙(t) es aleatoria
dentro del rango −𝜋 < 𝜙 < 𝜋. El carácter espontáneo de la emisión se describe mediante la fase inicial aleatoria del pulso. Si imaginamos una emisión
continua de pulsos pero con fases aleatorias, la representación gráfica de la
fase en el proceso de emisión la podemos describir como se muestra en la
fig. 3.2.
p
f (t)
0
t0
2t 0
3t 0
4t 0
5t 0
6t 0
7t 0
t
-p
Figura 3.2. Fases iniciales de los pulsos emitidos aleatoriamente uno tras otro por
una fuente de dos niveles de transición electrónica.
182
·
Interferencia
Ahora, supongamos que usamos la luz generada de esta manera en un
sistema óptico con el que podemos producir interferencia de dos ondas, esto
es un interferómetro. Por ejemplo, en la fig. 3.3, se muestra el diagrama de
un interferómetro de Michelson. A la onda (plana) que sale de la fuente S
la denominaremos onda primaria (0). La primera tarea del interferómetro
es generar dos ondas (secundarias) a partir de la onda primaria. Para esto
podemos emplear un semiespejo plano, que refleja el 50 % de la amplitud de
la onda primaria, y deja pasar el otro 50 % de la amplitud. El elemento que
hace esta tarea se denomina divisor de haz (BS). De esta manera, obtenemos
las ondas secundarias (1). La segunda tarea del interferómetro es sumar la
dos ondas secundarias. Lo anterior se logra mediante los dos espejos M1
y M2, con los cuales se cambia la dirección de propagación de las ondas
secundarias (2) dirigiéndolas nuevamente hacia el divisor de haz, de modo
que las ondas reflejada y transmitida (3) se superpongan. En particular, si los
espejos son ortogonales a los vectores de onda de las ondas secundarias (con
el divisor de haz a 45◦ ) en la región de interferencia los vectores unitarios
de propagación ŝ1 y ŝ2 serán paralelos, es decir, k2 − k1 = 0.
M2
1
M1
2
0
1
O
S
2
BS
3
3 y
x
Pantalla de
observación
Figura 3.3. Diagrama de un interferómetro de Michelson.
El resultado final es la suma de dos ondas planas ( 3 ) con Δk = 0 y con
un retraso temporal 𝜏 que resulta de la diferencia de camino óptico que
han recorrido las dos ondas secundarias ( 1, 2, 3 ) desde el punto O en el
divisor de haz. Si la distancia entre O y M1 es d1 y la distancia entre O y
M2 es d2 , la diferencia de camino óptico (en aire n = 1) entre las ondas (
3 ) en la región de interferencia es 2(d2 − d1 ). En consecuencia, el retraso
Interferencia
·
183
temporal será 𝜏 = 2(d2 − d1 )/c. Para d2 > d1 , 𝜏 > 0. Entonces, desplazando
axialmente el espejo 2 (o el espejo 1), se logra el retraso temporal deseado.
f (t)
f (t-t )
p
t
-p
t
f (t-t )- f (t)
p
0
t 0- t
t0
2t 0
3t 0
4t 0
5t 0
6t 0
7t 0
t
-p
Figura 3.4. Diferencia de las fases 𝜙(t − 𝜏) y 𝜙(t)) para el retraso temporal 𝜏.
Supongamos que el retraso temporal entre las dos ondas es menor a la
duraci ón del pulso que genera la fuente luminosa, 𝜏 < 𝜏0 . El grado de
coherencia entre las dos ondas depende de la diferencia de las fases iniciales
de las dos ondas. Ya que con el interferómetro hacemos una copia de una
onda, la diferencia de la fase dada en la fig. 3.2 se verá como se muestra en la
fig. 3.4. En la parte de arriba de la fig. 3.4, se muestra la fase 𝜙(t) de una de
las ondas junto con la fase de la otra onda incluyendo el retraso temporal.
El resultado de la resta se muestra en la parte de abajo de la fig. 3.4. En
los intervalos de duración (𝜏0 − 𝜏), las fases coinciden y, por lo tanto, el
resultado es 0. En los otros intervalos, el resultado no es nulo, pero se sigue
teniendo una distribución aleatoria de fases.
Entonces, a partir de la eq. (3.9), se llega a
𝛾 (𝜏) =
e −i𝜔𝜏
Ť
∫Ť
0
e −i ( 𝜙(t−𝜏)−𝜙 (t)) dt.
(3.14)
184
·
Interferencia
Esta integral se puede resolver mediante la suma de las M integrales en cada
intervalo de duración 𝜏0 , suponiendo que Ť = M 𝜏0 . Así,

∫𝜏0
∫M 𝜏0

e −i𝜔𝜏 

e −i (𝜙 (t−𝜏)−𝜙 (t)) dt  ,
𝛾 (𝜏) =
 e −i (𝜙(t−𝜏)−𝜙 (t)) dt + ... +

Ť 

(M−1) 𝜏0

0
(3.15)
y cada una de estas integrales, a su vez, se puede resolver en dos intervalos: el
intervalo de duración (𝜏0 − 𝜏), donde la diferencia de fase es 0; y el intervalo
de duración 𝜏, donde la diferencia de fase toma cualquier valor, digamos Δ j
para el j-ésimo intervalo. Por lo tanto, agrupando las integrales para las
cuales la diferencia de fase es 0 y poniendo en otro grupo las integrales con
diferencias de fase Δ j , tenemos
 ∫𝜏0 −𝜏
2𝜏
M
∫0 −𝜏
∫𝜏0 −𝜏 
e −i𝜔𝜏 

𝛾 (𝜏) =
dt +
dt + ... +
dt 
(3.16)


Ť 

𝜏0
(M−1) 𝜏0
0

 ∫𝜏0

2𝜏
0
∫M 𝜏0
∫

e −i𝜔𝜏 

e iΔ2 dt + ... +
e iΔM dt  ,
+
e iΔ1 dt +



Ť 

M 𝜏0 −𝜏
2𝜏0 −𝜏
𝜏0 −𝜏

que es igual a
𝛾 (𝜏) =
e −i𝜔𝜏
Ť
[M (𝜏0 − 𝜏)] +
e −i𝜔𝜏
Ť
[0] .
(3.17)
El resultado del segundo grupo de integrales es 0, ya que las fases Δ j son
aleatorias, por lo que la suma (para Ť 𝜏0 ) será 0. Entonces, el resultado
final es
𝛾 (𝜏) =
=
e −i𝜔𝜏
𝜏0 − 𝜏
;
𝜏0
0;
𝜏 < 𝜏0
(3.18)
𝜏 ≥ 𝜏0 .
El módulo del grado de coherencia es
|𝛾 (𝜏)| = 1 −
𝜏
,
𝜏0
(3.19)
y la fase 𝛼 (𝜏) = 0. La representación gráfica se muestra en la fig. 3.5. Cuando 𝜏 = 0, la correlación de las ondas es máxima y el grado de coherencia
Interferencia
·
185
vale 1. Para valores 𝜏 > 𝜏0 , la correlación entre las ondas es nula, por lo tanto no hay interferencia y la irradiancia se reduce a la suma de las irradiancias
individuales de las ondas, es decir, I = I1 + I2 .
g (t)
1
t0
t
Figura 3.5. Módulo del grado de coherencia para la fuente que emite pulsos aleatorios y consecutivos de duración 𝜏0 .
Para ver en detalle el efecto de 𝛾 (𝜏) sobre la irradiancia en la pantalla
de observación del interferómetro representado en la fig. 3.3, vamos a considerar la irradiancia en el punto {x = 0, y = 0}. Ya que el divisor de haz
divide la amplitud de la onda en dos partes iguales, entonces I1 = I2 = I0 .
Por lo tanto, la irradiancia en r = {0, 0} será
2𝜋𝜏
𝜏
I (0, 0) = 2I0 1 + 1 −
cos
, 𝜏 > 0.
(3.20)
𝜏0
T
La condición de 𝜏 > 0 se da porque hemos supuesto que d2 > d1 . Si
embargo, el espejo 2 también se puede desplazar axialmente de manera
que d2 < d1 , y ahora 𝜏 < 0. Con esto en mente
2𝜋𝜏
𝜏
cos
,
(3.21)
I (0, 0) = 2I0 1 + 1 ±
𝜏0
T
con el signo + para −𝜏0 < 𝜏 < 0 y con el signo − para 0 < 𝜏 < 𝜏0 .
En la fig. 3.6, se muestra la irradiancia en función del retraso temporal
(eq. (3.21)) en el rango −12T < 𝜏 < 12T , suponiendo que la fuente emite
pulsos de duración 𝜏0 = 10T . Cuando los espejos están a la misma distancia
del divisor de haz (punto O, fig. 3.3), d2 = d1 , entonces 𝜏 = 0 y se tiene el
máximo valor de la irradiancia. Al desplazar axialmente uno de los espejos,
la irradiancia oscila disminuyendo (aumentando) progresivamente el máximo (mínimo) de la irradiancia. Esta variación de la irradiancia ocurre de
acuerdo con el módulo del grado de coherencia que se muestra en la fig. 3.5.
Cuando el retraso temporal alcanza el valor de 𝜏0 , se anulan las oscilaciones
186
·
Interferencia
Irradiancia, I
de la irradiancia, y para |𝜏 | > 𝜏0 la irradiancia se mantiene constante, esto
es, I = 2I0 . Note que la envolvente de la gráfica de la irradiancia corresponde con el módulo del grado de coherencia. Así que tenemos una manera
experimental (con un interferómetro de Michelson) para medir el grado de
coherencia de una fuente luminosa.
4I 0
4I 0
2I 0
2I 0
envolvente
0
-10T
-8T
-6T
-4T
-2T
0
2T
Retraso temporal, t
4T
6T
8T
10T
0
Figura 3.6. Irradiancia en función del retraso temporal 𝜏.
Una oscilación completa de la irradiancia ocurre cada vez que la diferencia de camino óptico entre las ondas cambia en 𝜆 . En otras palabras, cada
vez que el argumento de la función coseno cambia en 2𝜋 se obtiene un máximo (mínimo). Igualando el argumento de la función coseno a 2𝜋 en la
siguiente forma: 2𝜋Δ𝜏/T = 2𝜋 (2Δd)/(cT ) = 2𝜋, se tiene que
Δd =
𝜆
2
(3.22)
es el incremento espacial en la separación de los espejos correspondiente a
dos máximos o mínimos consecutivos.
3.1.3. Longitud de coherencia
De lo dicho anteriormente, tendremos interferencia (modulación de la irradiancia) si el retraso temporal es menor a 𝜏0 . También es equivalente decir
que se tendrá interferencia si la diferencia de camino óptico entre las ondas
en la región de interferencia es menor a lc = c𝜏0 . A esta longitud se le llama
longitud de coherencia y se suele usar para caracterizar la coherencia (temporal) de una fuente luminosa. Entonces, con el interferómetro de Michelson
tenemos una forma de medir la longitud de coherencia. También se puede
hacer por otro camino, que depende del ancho espectral (ancho de banda)
de la fuente luminosa. Para ver esto, volvamos al pulso que hemos escogido
como ejemplo, de acuerdo con la eq. (3.12). Aunque la vibración cosenoidal dentro de la función rect (eq. (3.13)) tiene una frecuencia definida, 𝜈0 ,
·
Interferencia
187
el espectro del pulso no es un delta de Dirac localizado 𝜈0 , sino una distribución de frecuencias centradas en 𝜈0 debido a la duración finita del pulso.
Una señal es estrictamente monocromática si está descrita por una función
cosenoidal de duración infinita.
Para evaluar el contenido espectral del pulso, hacemos uso del análisis
de Fourier. Para un pulso en particular, la función 𝜙(t), que mide la fase
inicial, tendrá un valor fijo. Omitiendo este término, la transformada de
Fourier Ẽ(𝜈) = z [E(t)] será
∫∞
Ẽ(𝜈) = E0
rect(t/𝜏0 )e −i (2𝜋 𝜈0 t) e i2𝜋 𝜈t dt
(3.23)
−∞
∫
∞
= E0
rect(t/𝜏0 )e
i2𝜋 𝜈t
∫
∞
dt ∗
−∞
e
−i (2𝜋 𝜈0 t) i2𝜋 𝜈t
e
dt ,
−∞
donde el símbolo ∗ denota la operación de convolución. Resolviendo las dos
integrales se tiene que
Ẽ(𝜈) = E0 [𝜏0 sin c (𝜋 𝜈 𝜏0 )] ∗ [𝛿 (𝜈 − 𝜈0 )] ,
(3.24)
donde la función sinc(x) = sin(x)/x. La función delta centra a la función
sinc(𝜋 𝜈 𝜏0 ) en 𝜈 = 𝜈0 . La gráfica de la eq. (3.24) se muestra en la fig. 3.7.
El ancho espectral de la función sinc(𝜋 𝜈 𝜏0 ) se puede definir como la mitad
de la separación espectral entre sus primeros ceros alrededor de 𝜈0 . Sea Δ𝜈
el ancho espectral, las posiciones espectrales de los primeros ceros se tienen
en 𝜋 (𝜈0 + Δ𝜈)𝜏0 = 𝜋 y 𝜋 (𝜈0 − Δ𝜈)𝜏0 = −𝜋. Restando se llega a
~
Amplitud espectral, E(n )
Δ𝜈 =
1
.
𝜏0
(3.25)
E 0t 0
Dn ~ 1/t 0
0
0
n 0 - 1/t 0
n0
Frecuencia, n
n 0 +1/t 0
Figura 3.7. Espectro del pulso dado por la eq. (3.12). El ancho espectral Δ𝜈 se
aproxima por la mitad de la separación espectral de los primeros ceros de la funcion
sinc(𝜋 𝜈 𝜏0 ).
188
·
Interferencia
Entonces, el inverso del ancho espectral es una medida del tiempo de
duración del pulso, el cual, a su vez, determina la longitud de coherencia.
Por lo tanto, la longitud de coherencia de una fuente luminosa que tiene un
ancho espectral Δ𝜈 está dada por
lc =
c
.
Δ𝜈
(3.26)
Ya que 𝜈 = c/𝜆 , tomando las diferenciales para 𝜈 y 𝜆 , Δ𝜈 = −𝜈Δ𝜆 /𝜆 , se
llega a una forma alternativa para la longitud de coherencia dada por
2
𝜆
lc =
,
|Δ𝜆 |
(3.27)
donde 𝜆 es el valor central de la longitud de onda en el rango espectral de
ancho Δ𝜆 .
Considerando el modelo clásico para una fuente de iluminación, el ancho espectral de la línea (para los osciladores electrónicos) es una constante
universal [16]
(3.28)
Δ𝜆 = 1.2 × 10−4 Å.
Con este valor, la longitud de coherencia para una línea del espectro visible,
varía como 1.3 m < lc < 4.1 m (para 400 nm < 𝜆 0 < 700 nm). Por
otro lado, para la luz blanca (también en el rango espectral entre 400 nm
(violeta) y 700 nm (rojo)), la longitud de coherencia será aproximadamente
lc = 1 𝜇m, con 𝜆 = 550 nm y Δ𝜆 = 300 nm. Otras fuentes, como lámparas
de arco de mercurio, tienen longitudes de coherencia del orden de 3 cm y,
lámparas de descarga de Kr, tienen longitudes de coherencia del orden de
30 cm. Por su parte, los láseres tienen grandes longitudes de coherencia.
Por ejemplo, un láser de He-Ne estabilizado puede tener una longitud de
coherencia de 300 m.
Interferencia
·
189
3.2. Interferencia de dos ondas planas
M2
M1
O
S
LC
BS
y
x
Pantalla de
observación
Figura 3.8. Interferencia de ondas planas con un interferómetro de Michelson.
Cuando los espejos son ortogonales a los vectores de onda, en la pantalla de observación se tiene una región iluminada uniformemente que cambia el nivel de
irradiancia al desplazar axialmente uno de los espejos.
En la anterior unidad, encontramos que la expresión para la interferencia
de dos ondas planas de frecuencia angular 𝜔 = 2𝜋 𝜈0 está dada por
p
I (r) = I1 + I2 + 2 I1 I2 |𝛾 (𝜏)| cos(Δk · r+𝜔𝜏 + 𝛼 (𝜏)),
donde |𝛾 (𝜏)| es el módulo del grado de coherencia, Δk = k2 − k1 la diferencia de los vectores de onda en el punto de observación r, 𝜏 el retraso
temporal de las ondas con respecto a un punto o plano de referencia (punto
O en el divisor de haz) y 𝛼 (𝜏) la fase ( junto con 𝜔𝜏) del grado de coherencia. Al tomar las dos ondas de la misma fuente, encontramos que 𝛼 (𝜏) = 0.
En la práctica para observar la interferencia de dos ondas planas se suele
expandir el haz (ampliar su sección transversal) que llega al divisor de haz.
Lo anterior se puede hacer enfocando la luz en un punto S, el cual se hace
coincidir con el punto focal primario de una lente corregida de aberraciones. A esta lente se le denomina lente colimadora, LC, como se muestra en
la fig. 3.8. Después de la lente, tendremos frentes de onda planos ortogonales al eje óptico de la lente, que también tomaremos como eje óptico del
interferómetro. Cualquiera de estos frentes de onda se puede tomar como
plano de referencia, en particular, tomaremos el frente de onda que llega
al punto O del divisor de haz. Una vez que se dividen los haces, desde O
podremos medir las diferencias de camino óptico.
·
190
Interferencia
Supongamos que iluminamos con una fuente cuyo grado de coherencia
se mantiene constante para los desplazamientos de los espejos que vamos a
considerar, |𝛾 (𝜏)| = |𝛾 |. Dejando los espejos planos M1 y M2 ortogonales
a los vectores de onda de los haces transmitido y reflejado por el divisor de
haz, tenemos que la interferencia en el plano de observación estará dada por
p
I (x, y) = I1 + I2 + 2 |𝛾 | I1 I2 cos(𝜔𝜏).
(3.29)
Para 𝜏 fijo, I (x, y) no depende de x ni de y, por lo tanto en el plano de
observación tendremos una distribución de irradiancia uniforme, como se
muestra en la fig. 3.8. Al desplazar axialmente uno de los espejos, cambia
el nivel de irradiancia en la pantalla de observación obteniendo valores máximos en (d2 − d1 ) = m𝜆 /2 (con m entero). En la fig. 3.9, se muestra tres
ejemplos de la variación del nivel de irradiancia (con I1 = I2 = I0 ) en el
plano de observación en función del desplazamiento axial relativo entre los
espejos M1 y M2 , para tres grados de coherencia: |𝛾 | = 1, 1/2, 0.
g (t )=1
Irradiancia, I
4I 0
2I 0
0
g (t )=1/2
4I 0
2I 0
- 2l
l
0
(d 2 - d1 )
l
2l
0
g (t )=0
4I 0
2I 0
- 2l
l
0
(d 2 - d1 )
l
2l
0
- 2l
l
0
(d 2 - d1 )
l
2l
Figura 3.9. Modulación de la irradiancia para diferentes grados de coherencia en
el interferómetro de la fig. 3.8 en función de la diferencia de la posición de los
espejos con respecto al punto O en el divisor de haz.
Observando la variación de la irradiancia en función de (d2 − d1 ), podemos medir directamente |𝛾 |. En particular, se mide el máximo y el mínimo
de irradiancia, que a su vez están dados por
p
Imáx = I1 + I2 + 2 |𝛾 | I1 I2 ,
(3.30)
p
Imı́n = I1 + I2 − 2 |𝛾 | I1 I2 ,
(3.31)
de acuerdo con la eq. (3.29). Definiendo la visibilidad o contraste de la modulación de la irradiancia como
C=
Imáx − Imı́n
,
Imáx + Imı́n
(3.32)
se obtiene el módulo del grado de coherencia reemplazando las eqs. (3.30)
y (3.31) en la eq. (3.32), es decir
|𝛾 | =
(I1 + I2 )
C.
√
2 I1 I2
(3.33)
Interferencia
·
191
Entonces, a partir de medidas de irradiancia se determina el módulo del
grado de coherencia. Medimos las irradiancias individuales de cada onda y
el contraste. En particular, si el divisor de haz refleja el 50 % y transmite el
50 %, entonces I1 = I2 y |𝛾 | = C. En este caso, el contraste es la medida del
módulo del grado de coherencia.
3.2.1. Interferencia con ondas planas inclinadas
En lo que sigue, vamos a suponer que |𝛾 (𝜏)| = 1. Por ejemplo, iluminando
con un láser cuya longitud de coherencia es mucho mayor que los desplazamientos axiales de los espejos. Si giramos los espejos M1 y M2 un ángulo
𝛼/2, como se muestra en la fig. 3.10, cada haz en la región de interferencia
estará inclinado un ángulo 𝛼 con respecto al eje óptico (vertical). En cada
espejo, el giro se hace con respecto al punto de intersección del espejo con el
eje óptico, esto es, O1 en el espejo M1 y O2 en el espejo M2 . Así, el ángulo
entre los dos haces en la región de interferencia es 2𝛼. En el lugar de la superposición, se tendrá un patrón de franjas rectas (patrón de interferencia)
cuya separación dependerá del ángulo de inclinación.
O2
M2
a /2
M1
O
S
LC
BS
k1
O1
a /2
k2
y
x
Patrón de
interferencia
Figura 3.10. Interferencia con ondas planas inclinadas. En la pantalla de observación se tendrá un patrón de franjas. La separación de las franjas depende del ángulo
de inclinación de los espejos.
Para determinar la geometría de las franjas, primero vamos a suponer
que las distancias de los espejos d1 = OO1 y d2 = OO2 son iguales. Lo
anterior implica que no tendremos un retraso temporal entre las ondas a
lo largo del eje óptico. La intersección del eje óptico con la pantalla de ob-
192
·
Interferencia
servación se toma como el origen de coordenadas para el interferograma
(x = 0, y = 0). Ahora la expresión para la interferencia será
p
(3.34)
I (r) = I1 + I2 + 2 I1 I2 cos(Δk · r).
Si suponemos que la pantalla de observación está en el plano z = 0, de
acuerdo con la geometría de la fig. 3.10, tendremos k1 = (2𝜋/𝜆 ){s1x , 0, s1z }
y k2 = (2𝜋/𝜆 ){s2x , 0, s2z } con s1z = s2z , s1x = −s2x . Por otro lado, r =
{x, y, 0}. Entonces, Δk · r = (2𝜋/𝜆 ) (s2x − s1x )x, y ya que s2x = sin 𝛼, se
tiene que
2𝜋
Δk · r = (2x sin 𝛼).
(3.35)
𝜆
Lo anterior indica que en la pantalla de observación se tendrá una modulación de la irradiancia en la dirección x, de acuerdo con
p
4𝜋
I (x) = I1 + I2 + 2 I1 I2 cos
x sin 𝛼 .
(3.36)
𝜆
En la fig. 3.11, se muestra el patrón de interferencia simulado para dos
ondas planas cuando 𝛼 = 0.01◦ , 𝜆 = 632.8 nm y I1 = I2 . La región donde
se observa el patrón corresponde con (−5 < x < 5) mm y (−5 < y <
5) mm.
La separación Δx entre dos máximos o mínimos consecutivos de irradiancia ocurre cada vez que (4𝜋/𝜆 )x sin 𝛼 cambia en 2𝜋, es decir,
𝜆
Δx =
.
(3.37)
2 sin 𝛼
Note que en el ejemplo de la fig. 3.11 para tener una separación entre franjas
igual a 1.81 mm el ángulo de giro de los espejos es muy pequeño, 𝛼/2 =
0.005◦ .
y
-5 -4 -3 -2 -1
5
0
1
2
3
4
5
4
3
2
1
x
0
-1
-2
-3
-4
-5
Dx =
l
2sina
Dx = 1.81
Figura 3.11. Simulación del patrón de interferencia generado por dos ondas planas inclinadas cuando |𝛾 (𝜏)| = 1. El ángulo 𝛼 = 0.01◦ y 𝜆 = 632.8nm. La escala
de los ejes está dada en mm.
·
Interferencia
193
3.2.2. Desplazamiento de las franjas
Cuando en el interferómetro de la fig. 3.8, se desplaza axialmente uno de los
espejos ocurre un cambio en el nivel de irradiancia que se tiene en la pantalla de observación. No se tiene una modulación espacial de la irradiancia
(a lo largo de la pantalla de observación); la modulación es axial, es decir,
temporal. Si en el interferómetro de la fig. 3.10 desplazamos axialmente
uno de los espejos (d2 − d1 ≠ 0), en cada punto de la pantalla de observación
también ocurre un cambio en el nivel de la irradiancia, pero el efecto neto
que se observa es un desplazamiento transversal de las franjas en la dirección x. El desplazamiento axial de uno de los espejos introduce un retraso
temporal 𝜏 = 2(d2 − d1 )/c entre las ondas (con respecto al punto O), y la
irradiancia estará dada por
p
4𝜋
4𝜋
I (x) = I1 + I2 + 2 I1 I2 cos
x sin 𝛼 +
(d2 − d1 ) .
𝜆
𝜆
d 2 - d1 = l
8
d 2 - d1 = 0
-5 -4 -3 -2 -1
5
0
1
2
3
4
5
-5 -4 -3 -2 -1
5
0
1
(3.38)
d 2 - d1 = l
4
2
3
4
5
-5 -4 -3 -2 -1
5
4
4
4
3
3
3
2
2
2
1
1
1
0
0
0
-1
-1
-1
-2
-2
-2
-3
-3
-3
-4
-4
-4
-5
-5
0
1
2
3
4
5
x
-5
x = - 0.45
x = - 0.90
Figura 3.12. Desplazamiento transversal de las franjas de interferencia en función
del desplazamiento axial del espejo M1 acercándose al divisor de haz. La diferencia
de camino óptico en las imágenes es d2 − d1 = 0, 𝜆 /8, 𝜆 /4. La escala de los ejes
está dada en mm.
Si acercamos el espejo M1 al punto O, tal que d2 − d1 > 0, se incrementa
el valor del argumento de la función coseno y, para mantener el valor inicial,
x debe tomar un valor negativo, por lo que las franjas se desplazan hacia la
izquierda. En la fig. 3.12, se simulan tres interferogramas con 𝛼 = 0.01◦ ,
𝜆 = 632.8 nm y I1 = I2 , cuando el corrimiento axial del espejo M1 da
lugar a d2 − d1 = 0, 𝜆 /8, 𝜆 /4. Si alejamos el espejo M1 del punto O, tal
que d2 − d1 < 0, el desplazamiento de las franjas será hacia la derecha.
194
·
Interferencia
3.2.3. Visibilidad del interferograma
Con la eq. (3.32), se definió el contraste de la modulación de la irradiancia
en la dirección axial. Esta cantidad, basada en las irradiancias, permite medir
el grado de coherencia. La eq. (3.32) también se puede usar para medir la
visibilidad de las franjas de los patrones de interferencia, donde Imáx y Imı́n
son los valores máximo y mínimo de la irradiancia de las franjas.
El cambio en la visibilidad depende del grado de coherencia y de la relación entre las intensidades de las dos ondas. Por ejemplo, si |𝛾 | = 1, entonces
la visibilidad
√
2 I1 I2
C=
(3.39)
(I1 + I2 )
solo depende de la relación entre I1 y I2 . En la fig. 3.13, se muestra tres interferogramas junto con sus perfiles en la dirección x cuando las amplitudes
de las ondas son E1 = E0 y E2 = E0 , E1 = E0 y E2 = 0.4E0 , E1 = E0 y
E2 = 0.1E0 . En el primer caso, se tiene que Imáx = 4I0 , Imı́n = 0 y C = 1;
en el segundo, se tiene que Imáx = 1.96I0 , Imı́n = 0.36I0 y C = 0.69; y en
el tercero, se tiene que Imáx = 1.21I0 , Imı́n = 0.81I0 y C = 0.20. Note que
la irradiancia oscila espacialmente alrededor del valor promedio I1 + I2 , que
en el primer caso es 2I0 , en el segundo caso es 1.16I0 y en el tercer caso es
1.01I0 .
5 4 3 2 1

0
1
2
3
4
5
5 4 3 2 1

0
1
2
3
4
5
5 4 3 2 1
















1
1
1
2
2
2
3
3
3
4
4
4
5
5
E


E


0
1
2
3
4
5
x
5
E


E


E


E


Irradiancia, I
4I
2I
1.16I 
0
5 4 3 2 1
0
C
1
2
3
4
5
1.01I
5 4 3 2 1
0
1
C
2
3
4
5
5 4 3 2 1
0
1
2
3
4
5
C
Figura 3.13. Interferogramas cuando la visibilidad de las franjas depende de la
relación de las amplitudes de las ondas: C = 1, 0 (E1 = E0 y E1 = E0 ), C = 0.69
(E1 = E0 y E1 = 0.4E0 ), C = 0.20, (E1 = E0 y E1 = 0.1E0 ). El módulo del grado
de coherencia está fijo en |𝛾 | = 1 . La escala de los ejes está dada en mm.
Interferencia
Entonces, cuando I1 = I2 = I0 y |𝛾 | = 1 se tiene que
2 4𝜋
I = 4I0 cos
x sin 𝛼 ,
𝜆
·
195
(3.40)
de donde Imáx = 4I0 y Imı́n = 0, y la visibilidad es C = 1. Si I1 ≠ I2 , la
visibilidad disminuye, y se hace cero si I1 = 0 o si I2 = 0.
Si además se tiene que |𝛾 | < 1, entonces ocurre una disminución adicional de la amplitud de la oscilación espacial de las franjas (manteniendo
el valor promedio). En otras palabras, la amplitud de los perfiles mostrados
en la fig. 3.13 disminuye.
En la práctica, uno de los espejos del interferómetro está fijo y alineado,
mientras que el otro se puede desplazar e inclinar mediante tornillos de
precisión. El análisis que hemos realizado para la formación de las franjas
sigue siendo válido, obteniéndose los mismos resultados.
196
·
Interferencia
3.3. Interferencia de dos ondas esféricas
Una fuente luminosa se dice puntual si su tamaño aparente es despreciable
con respecto a la distancia a la que se detecta la señal. El frente de onda
detectado se verá como un frente de onda esférico cuyo radio es igual a la
distancia entre la fuente y el punto de observación. En la unidad anterior,
se mostró la generación de dos ondas planas mediante el interferómetro de
Michelson. Esto gracias a que la fuente puntual se ubica en el punto focal
primario de la lente LC (fig. 3.8). Si la fuente puntual se desplaza axialmente con respecto al punto focal primario de la lente LC, el frente de
onda refractado por la lente será esférico y el radio de curvatura será igual
a la distancia entre el conjugado de la fuente puntual y el punto en que se
mide el frente de onda. Una vez que la onda esférica se divide en el divisor de haz, los espejos M1 y M2 generan dos imágenes virtuales (fuentes
secundarias puntuales) del conjugado de la fuente puntual, y en la región
de interferencia tendremos la superposición de dos ondas esféricas. En esta
unidad, también mostraremos la interferencia cuando los espejos son ortogonales al eje óptico del interferómetro y cuando los espejos se inclinan un
ángulo pequeño.
P
s2
S2
-a
2
r
r
s1
O
S1
a
2
z
Figura 3.14. Geometría para describir la interferencia de dos ondas esféricas emitidas por las fuentes puntuales S1 y S2 .
Antes de ver los dos casos, vamos a describir la geometría del problema
de acuerdo con la fig. 3.14. Supongamos que tenemos dos fuentes puntuales
en un medio isotrópico y homogéneo (aire, n = 1) separadas una distancia
a, localizadas en z = −a/2 y z = a/2, y se quiere determinar la irradiancia
en un punto P localizado en r = {x, y, z}. Si las dos fuentes son imágenes
de una fuente primaria, que emite ondas esféricas de frecuencia angular
𝜔 = 2𝜋 𝜈0 , las fases iniciales serán iguales y podremos escribir los campos
de las ondas esféricas emitidas por S1 y S2 en el punto P como1
E1 (s1 , t) =
1 E†
0
†
E01
s1
e i (ks1 −𝜔t)
(3.41)
es la amplitud del campo multiplicada por la unidad de longitud. Así, la amplitud
del campo óptico en un frente de onda esférico de radio r será E0 = E0† /r.
·
Interferencia
197
y
E2 (s2 , t) =
†
E02
s2
e i (ks2 −𝜔t) ,
(3.42)
1/2
1/2
, donde, a su
y s2 = 𝜌2 + (a/2 + z) 2
donde s1 = 𝜌2 + (a/2 − z) 2
2
1/2
es la coordenada radial de la proyección del punto
vez, 𝜌 = x + y 2
P en el plano xy. La forma escalar de las ecuaciones implica que en P los
campos tienen el mismo estado de polarización.
Si dejamos |𝛾 (𝜏)| = 1, la irradiancia en P debido a la superposición de
las dos ondas será
𝜖 0c
(E1 + E2 ) E1∗ + E2∗ .
(3.43)
I (r) =
2
†
Las irradiancias individuales en P serán I1 = 𝜖 0 c(E01
/s1 ) 2 /2 y I2 =
†
𝜖 0 c(E02 /s2 ) 2 /2. Con esto en mente, la eq. (3.43) queda
p
2𝜋
(s2 − s1 ) .
(3.44)
I (r) = I1 + I2 + 2 I1 I2 cos
𝜆
Note que en esta situación (s2 − s1 )/c mide el retraso temporal de las
ondas al llegar a P. Cuando el argumento de la función coseno toma un
valor constante q, entonces 2𝜋 (s2 − s1 ) /𝜆 = q describe superficies en que
la irradiancia es constante. En particular, si 2𝜋 (s2 − s1 ) /𝜆 = 2𝜋m (m =
0, ±1, ±2, ... ), tendremos superficies de máxima irradiancia. Estas superficies son hiperboloides de revolución definidos por
(s2 − s1 ) = m𝜆 ,
(3.45)
donde las fuentes puntuales son los puntos focales de las hipérbolas.
0
2
50
250
r (mm)
1
450
650
0
750
780
787
790
-1
-2
-5
-4
-3
-2
-1
0
z (mm)
1
2
3
4
5
Figura 3.15. Algunas curvas de máxima irradiancia generadas por fuentes puntuales localizadas en z = −0.25 mm y z = 0.25 mm, para m = 0, 50, 250, 450,
650, 750, 780, 787 y 790, con 𝜆 = 632.8 nm.
·
198
Interferencia
En la fig. 3.15, se muestra algunas de las hipérbolas que resultan de la
intersección de un plano meridional con el eje z cuando las dos fuentes
puntuales están separadas a = 0.5 mm y 𝜆 = 632.8 nm, para m = 0,
50, 250, 450, 650, 750, 780, 787 y 790. A lo largo de estas curvas, la
irradiancia tiene un valor máximo. El número de curvas a lo largo de las
cuales se obtiene el máximo de irradiancia está determinado por el entero
inferior más próximo al cociente a/𝜆 , es decir, mmáx ≡ a/𝜆 , que en nuestro
ejemplo es 790. La superficie para m = 0 es el plano z = 0 (que está en
medio de las dos fuentes). En este caso, la diferencia de camino óptico es
cero para cualquier punto de coordenadas {x, y, 0}.
En particular, vamos a ver en detalle la interferencia en planos paralelos
al plano z = 0 y al plano y = 0. En el primer caso, debido a la simetría de
revolución alrededor del eje z, las curvas de máxima irradiancia en planos
paralelos a z = 0 son círculos. Para determinar los radios de estos círculos
escribimos en forma explícita la eq. (3.45) y despejamos s2 ,
q
𝜌2 + (a/2 + z) 2 = m𝜆 +
q
𝜌2 + (a/2 − z) 2 .
(3.46)
Elevando al cuadrado y simplificando, tenemos que el radio del círculo para
un m dado en el plano z = z0 está dado por
s
𝜌m =
2az0 − m 2 𝜆 2
2m𝜆
2
−
a
2
2
− z0 .
(3.47)
y
16
14
 (mm)
12
10
8
6
4
2
0
780
x
782
784
786
788
790
792
m
Figura 3.16. Franjas circulares de interferencia en el plano z = 100 mm centradas
en {x, y} = {0, 0}, generadas por dos fuentes puntuales separadas a = 0.5 mm y
localizadas en z = −a/2 y z = a/2, de longitud de onda 𝜆 = 632.8 nm.
Interferencia
·
199
En la fig. 3.16, se muestra las franjas circulares de interferencia y la variación del radio de las franjas para el ejemplo de dos fuentes puntuales
separadas a = 0.5 mm (localizadas en z = −a/2 y z = a/2 y 𝜆 = 632.8 nm)
en el plano z = 100 mm. A medida que nos alejamos del centro, las franjas
se acercan entre sí.
En el segundo caso, para un plano paralelo al plano y = 0, las intersecciones de los hiperboloides son curvas abiertas (hipérbolas). La posición de
las curvas de máxima irradiancia a lo largo de la dirección z en función de
m se obtiene dejando x = 0 y y = y0 en la eq. (3.46), esto es,
s
zm =
-40 -30 -20 -10
40
0
10
20
30
m𝜆
2
4y02
a2 − m2 𝜆 2
+ 1.
(3.48)
x
40
30
20
10
z
0
-10
-20
-30
-40
a=l
; y0 = 10mm
a = 8l
; y0 = 10mm
a = 8l
; y0 = 50mm
a = 8l ; y0 = 100mm
a = 32l ; y0 = 200mm
Figura 3.17. Franjas de interferencia en planos paralelos al plano y = 0 localizados
en y0 = 10, 50, 100 y 200 mm, generadas por dos fuentes puntuales separadas
a = 𝜆 , 8𝜆 y 32𝜆 , con 𝜆 = 632.8 nm. La escala de los ejes está dada en mm.
En la fig. 3.17, se muestra algunos interferogramas obtenidos en diferentes planos paralelos al plano y = 0 y para diferentes separaciones entre
las fuentes, en una región de observación de 80 mm ×80 mm centrada en
z = 0 y x = 0. El primer interferograma, en el plano y = 10 mm, tiene
mmáx = 1, por lo que z1 → ∞. En otras palabras, solo se tiene una franja
de interferencia, la franja central (m = 0), lo demás es una distribución de
irradiancia que se extiende hasta infinito en cada lado. El segundo interferograma, también en el plano y = 10 mm, tiene mmáx = 8 y se observan todas
las franjas de interferencia que se pueden tener en esta situación, 7 franjas
de interferencia a cada lado de la franja central (m = ±1, ±2, ±3, ±4, ±5,
±6, ±7, a medida que se alejan de la franja central). La forma de las franjas
es hiperbólica. En el tercer interferograma, se aleja el plano de observación
a y = 50 mm, por lo que ahora vemos menos franjas de interferencia. El
cuarto interferograma, se aleja aún más, a y = 100 mm, disminuyendo nuevamente el número de franjas. Ahora las franjas parecen rectas e igualmente
espaciadas. Y el último interferograma, con y = 200 mm, tiene mmáx = 32.
200
·
Interferencia
Las franjas de interferencia en la región de observación son rectas e igualmente espaciadas. Esta última afirmación se puede soportar en el hecho que
cuando el máximo número de franjas m en la región de observación satisface
2 , entonces a 2 m 2 𝜆 2 y la eq. (3.48) se puede aprola relación m 2 mmáx
ximar por zm = m𝜆 y0 /a. Así, las franjas en esa región están uniformemente
espaciadas con una separación igual a
Δz =
𝜆 y0
.
a
(3.49)
Volviendo al último interferograma, el máximo número de franjas laterales es 5 y, en efecto, se satisface que 25 1024.
Las dos situaciones correspondientes a las figs. 3.16 y 3.17 se tienen en el
interferómetro de Michelson cuando iluminamos con una onda esférica. La
primera con la configuración de la fig. 3.8 y la segunda con la configuración
de la fig. 3.10. En lo que sigue, veremos estos dos casos.
3.3.1. Franjas circulares con el interferómetro de
Michelson
Si en el interferómetro mostrado en la fig. 3.8 desplazamos axialmente la
lente colimadora o simplemente retiramos la lente, al divisor de haz llega
un frente de onda esférico, como se muestra en la fig. 3.18. Los espejos M1
y M2 formarán imágenes virtuales de la fuente puntual de la cual diverge el
frente de onda. Estas imágenes virtuales constituyen dos fuentes puntuales
secundarias S1 y S2 . Al mirar desde la pantalla de observación hacia el divisor de haz, veremos las dos fuentes puntuales secundarias, una detrás de
otra, a lo largo del eje óptico del interferómetro,2 separadas una distancia
a = 2(d2 − d1 ), siendo d2 = OO2 y d1 = OO1 . Los radios de curvatura de
los frentes de onda emitidos por S2 y S1 , en la pantalla de observación, son:
R2 = 2d2 + OS + OOP y R1 = 2d1 + OS + OOP . OP es la intersección del
eje óptico del interferómetro con la pantalla de observación (x = 0 y y = 0).
Manteniendo el origen de coordenadas en medio de las dos fuentes secundarias (como en la fig. 3.14) se tiene que z0 = (R1 +R2 )/2. En consecuencia,
R1 = z0 − a/2 y R2 = z0 + a/2, y ΔR = R2 − R1 = a. En lo que sigue, vamos
a suponer que R2 > R1 .
2 Note que S es la imagen virtual de S generada por el espejo M , pero S es la reflexión
2
2
1
en el divisor de haz de la imagen virtual que genera el espejo M1 de S. Esta imagen virtual
está a la derecha del espejo M1 , pero para un observador en la pantalla de observación las
dos fuentes secundarias están alineadas.
Interferencia
S2
·
201
a
S1
M2
O2
M1
S
O1
O
BS
y
OP
x
Pantalla de
Observación
Figura 3.18. Interferómetro de Michelson iluminado por una onda esférica. En
la pantalla de observación, a lo largo del eje óptico del interferómetro, se tiene un
patrón de franjas circulares cuando la separación entre las fuentes secundarias S1
y S2 es a ≠ 0.
202
·
Interferencia
La interferencia de las dos ondas esféricas en la pantalla de observación
se verá como se muestra en la fig. 3.16. Consideremos ahora qué ocurre con
las franjas de interferencia si desplazamos axialmente uno de los espejos, por
ejemplo, el espejo M2 . Para ver esto, supongamos que desplazamos el espejo M2 de modo que la separación entre las fuentes secundarias es a = 500𝜆 ,
400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 y 0 (con 𝜆 = 632.8 nm). Mantenemos la pantalla
de observación en z0 = 100 mm y la región de observación centrada en
el eje z tiene las dimensiones 33 mm × 33 mm. Los radios de los círculos
de máxima irradiancia se muestran en la fig. 3.19. El valor máximo de m,
mmáx = a/𝜆 , se toma como punto de referencia y en cada caso nos dice que
en el interferograma tenemos un máximo de irradiancia en {0, 0, z0 }. El
primer anillo de irradiancia (franja circular) ocurre para mmáx − 1, y cada
curva nos dice cuál es el radio del círculo de máxima irradiancia correspondiente (que en adelante tomaremos como el radio del anillo). El segundo
anillo de irradiancia ocurre para mmáx − 2, y así sucesivamente. En la fig.
3.20, se muestra los patrones de interferencia para a = 500𝜆 , 400𝜆 , 300𝜆 ,
200𝜆 , 100𝜆 . Para a = 0, la región estará completamente iluminada; es decir, no se tienen anillos de interferencia, lo que se ilustra en la fig. 3.19 con
la línea vertical etiquetada con 0.
16
14
500l
300
l
20
0
l
100
r (mm)
400
l
l
12
10
0
8
6
4
2
0
mmax -6
m max -5
m max -4
m max -3
mmax -2
m max -1
mmax
m
Figura 3.19. Radios de los círculos de máxima irradiancia en función del número
m con respecto a mmáx para diferentes valores de la separación (a = 500𝜆 , 400𝜆 ,
300𝜆 , 200𝜆 , 100𝜆 y 0) de las fuentes puntuales secundarias en el interferómetro
de la fig. 3.18.
Consideremos la posición del primer anillo en cada interferograma. Si
inicialmente la posición del espejo M2 con respecto al espejo M1 da una
separación a = 300𝜆 , el radio del primer anillo es 𝜌 mmáx −1 = 8.18 mm.
Desplazando el espejo M2 , acercándose al divisor de haz, tal que a = 200𝜆 ,
el radio del primer anillo aumenta a 𝜌 mmáx −1 = 10.04 mm. Y cuando se des-
Interferencia
·
203
plaza el espejo M2 , alejándose del divisor de haz, tal que a = 400𝜆 , el radio
del primer anillo disminuye a 𝜌 mmáx −1 = 7.08 mm. Luego, si R2 > R1 , al
desplazar el espejo M2 disminuyendo la separación a, veremos un aumento en el radio de los anillos y, por lo tanto, menos anillos en la región de
observación. Y al contrario, al desplazar el espejo M2 aumentando la separación a, veremos una disminución en el radio de los anillos y, por lo tanto,
más anillos en la región de observación. Cuando se sigue el desplazamiento
lentamente, en fracciones de longitud de onda, el efecto cuando a aumenta
es que desde el centro emergen anillos y el efecto cuando a disminuye es
que hacia el centro convergen anillos, como se muestra en la fig. 3.21 para a = 300𝜆 , a = (300 + 1/4)𝜆 , a = (300 + 1/2)𝜆 , a = (300 + 3/4)𝜆 y
a = 301𝜆 . Una situación análoga se tiene si R2 < R1 .
-16 -12 -8
16
-4
0
4
8
12
y
16
12
8
4
x
0
-4
-8
-12
-16
a = 500l
a = 400l
a = 300l
a = 200l
a = 100l
Figura 3.20. Patrones de interferencia para diferentes separaciones a = 500𝜆 ,
400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 (𝜆 = 632.8 nm) en el interferómetro de la fig. 3.18
cuando la pantalla de observación está en z0 = 100 mm. La escala de los ejes está
dada en mm.
-16 -12 -8
16
-4
0
4
8
12
y
16
12
8
4
x
0
-4
-8
-12
-16
a = 300l
a = 300.25l
a = 300.50l
a = 300.75l
a = 301l
Figura 3.21. Patrones de interferencia para diferentes separaciones a = 300𝜆 ,
300.25𝜆 , 300.50𝜆 , 300.75𝜆 y 301𝜆 (𝜆 = 632.8 nm) en el interferómetro de la
fig. 3.18 cuando la pantalla de observación está en z0 = 100 mm. La escala de los
ejes está dada en mm.
Aproximación para calcular el radio de los anillos
La eq. (3.47) nos da los radios de las franjas en que se tiene la máxima
irradiancia. En muchas situaciones prácticas en interferometría, se tiene que
la separación de las fuentes secundarias es mucho menor que los radios de
204
·
Interferencia
curvatura R1 y R2 , es decir, ΔR {R1 , R2 }, y el tamaño de la región en
que se observa el patrón de interferencia también es mucho menor que los
radios de curvatura R1 y R2 . En este caso, podemos aproximar la distancia
de las fuentes virtuales S1 y S2 a un punto en la pantalla de observación
como
s1 = R1 + Δ1
(3.50)
y
s2 = R2 + Δ2 ,
con
(3.51)
Δ1 =
𝜌2
2R1
(3.52)
Δ2 =
𝜌2
,
2R2
(3.53)
y
donde 𝜌 es la distancia radial del punto en la pantalla de observación con
respecto a x = 0 y y = 0. Δ1 y Δ2 son las distancias de los frentes de onda
de radios R1 y R2 al punto en la pantalla de observación en la aproximación
de segundo orden.
Así, la diferencia (s2 − s1 ) en la eq. (3.44) para un punto en la pantalla de
observación será
𝜌2 1
1
s2 − s1 = R2 − R1 +
−
.
(3.54)
2 R2 R1
Por lo tanto, los círculos de máxima irradiancia en la pantalla de observación
se obtienen cuando
𝜌2
= m𝜆 .
(3.55)
ΔR 1 −
2R1 R2
Y el radio de los círculos en función de m será
r
R1 R2
𝜌 m = 2 (ΔR − m𝜆 )
.
ΔR
(3.56)
Nuevamente tenemos que el valor máximo de m (franja circular más cerca
del centro) está dado por m = ΔR/𝜆 = a/𝜆 .
Con la eq. (3.47), obtenemos el valor exacto de los radios de los círculos
de máxima irradiancia, mientras que con la eq. (3.56) obtenemos los valores
de los radios de los círculos en la aproximación de segundo orden. Para
comparar los resultados dados por las dos ecuaciones, recordamos que R1 =
z0 −a/2 y R2 = z0 +a/2. En la fig. 3.22, se comparan los resultados obtenidos
Interferencia
·
205
con las eqs. (3.47) y (3.56) para las primeras franjas circulares cuando a =
0.5 mm, z0 = 100 mm y 𝜆 = 632.8 nm.
16
exacta
14
aproximada
r (mm)
12
10
8
6
4
2
0
780
782
784
786
m
788
790
792
Figura 3.22. Comparación de los radios de los círculos de irradiancia constante
calculados con la forma exacta (la eq. (3.47)) y la forma aproximada (eq. (3.56))
para las primeras 11 franjas circulares, cuando a = 0.5 mm y z0 = 100 mm, con
𝜆 = 632.8 nm.
La separación entre dos franjas consecutivas, tomada como la diferencia
de los radios de los círculos de máxima irradiancia, se puede evaluar restando 𝜌 m − 𝜌 m+1 . Primero, hacemos la resta de los cuadrados, de donde se
obtiene
R1 R2
𝜌2m − 𝜌2m+1 = 2𝜆
.
(3.57)
ΔR
Reescribiendo el lado izquierdo como ( 𝜌 m − 𝜌 m+1 ) ( 𝜌 m + 𝜌 m+1 ) y definiendo
la separación entre dos franjas consecutivas como Δ 𝜌 = ( 𝜌 m − 𝜌 m+1 ) y el
valor medio de los radios como 𝜌 = ( 𝜌 m + 𝜌 m+1 )/2, entonces
Δ𝜌 =
𝜆 R1 R2
.
𝜌 ΔR
(3.58)
Note que hemos omitido el subíndice m en Δ 𝜌 y 𝜌, ya que el lado derecho
de la eq. (3.57) no depende de m. La eq. (3.58) muestra cómo la separación
entre franjas disminuye inversamente proporcional a la posición (radios) de
las franjas a medida que nos alejamos del centro del interferograma. Por
último, si ΔR {R1 , R2 }, entonces R1 R2 ≈ z02 , y la eq. (3.58) también se
puede escribir como
2
𝜆 z0
Δ𝜌 =
.
(3.59)
𝜌 a
206
·
Interferencia
En la práctica, 𝜌 puede ser tomado como el radio del anillo oscuro entre
las dos franjas brillantes para las cuales se quiere medir la separación, a es el
doble de la diferencia de la separación de los espejos (con respecto al divisior
de haz) y z0 es la media geométrica de los radios de curvatura de los frentes
de onda que interfieren.
3.3.2. Aproximación de franjas paralelas con el
interferómetro de Michelson
Cuando el interferómetro de la fig. 3.10 se ilumina con ondas esféricas,
manteniendo la separación de los espejos igual, es decir, (d2 − d1 ) = 0, las
fuentes puntuales secundarias S1 y S2 se verán como se ilustra en la fig.
3.23. Las fuentes S1 y S2 están a la misma distancia axial de la pantalla
de observación, pero tienen una separación transversal a 0 que depende del
ángulo de giro 𝛼/2 de los espejos.
El patrón de interferencia en la pantalla de observación consiste en franjas cuya irradiancia máxima sigue curvas que resultan de la intersección de
hiperboloides de revolución con el plano en la pantalla de observación, semejantes a las que se muestran en el ejemplo de la fig. 3.17 (salvo por el
nombre los ejes). En la fig. 3.23, si z0 es la distancia axial entre las fuentes
{S1 , S2 } y la pantalla de observación, y a 0 la separación entre S1 y S2 , la separación de las franjas a lo largo de la dirección x en la pantalla de observación
estará dada por la eq. (3.48), pero cambiando el nombre de los parámetros
y0 → z0 y a → a 0, y cambiando el nombre de la variable zm → xm . Así, para
la geometría del interferómetro de la fig. 3.23, la posición de las franjas de
interferencia en la dirección x será
s
xm =
m𝜆
2
4z02
a 02 − m2 𝜆 2
+ 1,
(3.60)
donde a 0 depende del ángulo de giro de acuerdo con
a 0 = 2 O2 O + OS sin 𝛼.
(3.61)
La distancia entre el punto O2 y el punto medio de las fuentes S1 y S2
es (a 0/2)/tan 𝛼, por lo tanto, z0 es
z0 =
a0
+ O2 O + OOP .
2 tan 𝛼
(3.62)
Interferencia
·
207
a'
S2
S1
O2
a /2
M2
M1
S
O1
O
BS
a /2
y
OP
x
Pantalla de
Observación
Figura 3.23. Interferómetro de Michelson con los espejos M1 y M2 inclinados un
pequeño ángulo. Los espejos se encuentran a igual distancia del divisor de haz.
208
·
Interferencia
Si nos limitamos a la situación en que a 0 O2 O + OS y, a su vez,
a 0 {R1 , R2 }, podemos aproximar tan 𝛼 por sin 𝛼. En la región de observación donde el cuadrado del máximo número de franjas laterales es mucho menor que el cuadrado de mmáx ≡ a 0/𝜆 , la eq. 3.60 se aproxima por
xm = m𝜆 z0 /a 0, lo que corresponde con un patrón de franjas rectas paralelas uniformemente espaciadas. De acuerdo con la eq. (3.62), la separación
entre franjas será
𝜆
𝜆 Δx =
(3.63)
+ 0 O2 O + OOP .
2 sin 𝛼 a
Esta ecuación es similar a la eq. (3.37) que se obtuvo para la interferencia de ondas planas. La diferencia está en que si en el interferómetro
de la fig. 3.10 desplazamos axialmente la pantalla de observación, no cambia la separación de las franjas; mientras que si en el interferómetro de la
fig. 3.23 desplazamos axialmente la pantalla de observación (cambiando
OO
de las franjas sí cambia. Podemos decir que el sumando
P ), la separación
𝜆 O2 O + OOP /a 0 actúa como un factor de escala en la separación de las
franjas. El primer sumando de la eq. (3.63) es idéntico a la eq. ((3.37).
y
  











x




Figura 3.24. Patrón de interferencia generado por ondas esféricas en el interferómetro de Michelson cuando uno de los espejos está inclinado. La separación axial
de las fuentes S1 y S2 es a = 400𝜆 y el desplazamiento lateral de fuente S2 es
x0 (= a 0/2) = 0.03 mm. La escala de los ejes está dada en mm .
En conclusión, los frentes de onda que llegan a la pantalla de observación
en el interferómetro de la fig. 3.23 se asemejan a frentes de onda planos,
cuando a 0 {R1 , R2 } y la región de observación tiene unas dimensiones
2 , donde m es el número de franjas laterales.
tales que m2 mmáx
Por último, si en el interferómetro de la fig. 3.18 se gira solamente uno
de los espejos, lo que se observa es un desplazamiento lateral del centro de
Interferencia
·
209
los anillos, como se muestra en la fig. 3.24, donde la separación axial de las
fuentes S1 y S2 es a = 400𝜆 y el giro del espejo M2 se da en un ángulo que
desplaza lateralmente la fuente S2 en x0 (= a 0/2) = 0.03 mm. Si el ángulo
de giro se incrementa el centro de los anillos sale de la región de observación
y nos acercamos a patrones de franjas semejantes a los patrones de franjas
rectas paralelas.
210
·
Interferencia
3.4. Aspectos prácticos en el interferómetro
de Michelson
En las anteriores unidades de este capítulo, se empleó el interferómetro de
Michelson como herramienta óptica para estudiar, con cierto detalle, los
patrones de interferencia generados por la superposición de ondas planas u
ondas esféricas. El interferómetro de Michelson es uno entre muchos interferómetros que se puede utilizar para este propósito. En cualquier caso,
se busca generar dos ondas secundarias a partir de una onda primaria, de
modo que se garantice la interferencia (siempre y cuando la diferencia de
camino óptico entre los haces no sea mayor que la longitud de coherencia).
El uso de los interferómetros va más allá que la explicación de los patrones de interferencia de ondas planas o esféricas. Su potencial se aplica en la
evaluación de superficies o frentes de onda, ya sea para caracterizar las mismas superficies o medir algún otro parámetro como el índice de refracción
o aberraciones ópticas. Para este tipo de aplicaciones, uno de los haces se
toma como un haz de referencia, mientras que el otro haz se usa para analizar el elemento óptico que se desea medir. Lo más común es que el haz
de referencia sea plano o esférico. En la práctica, surgen algunos inconvenientes con la generación del haz de referencia debido a la calidad óptica de
las componentes del interferómetro y a la configuración misma del interferómetro. En esta unidad, vamos ver algunos aspectos prácticos en el caso
del interferómetro de Michelson: la fuente puntual, la lente colimadora, los
espejos, el error pico-valle (como medida de la calidad de las superficies
ópticas) y un ejemplo de un interferómetro de Michelson.
Fuente puntual
Supongamos que queremos iluminar el interferómetro con una onda plana,
como en la fig. 3.8. Para esto, debemos tener una fuente puntual S. Esto ya
es un primer asunto de cuidado, pues físicamente podemos construir fuentes pequeñas, pero no puntuales (matemáticamente hablando), y de banda
espectral muy estrecha (láser), pero no un delta de Dirac. Ahora no nos vamos a detener en este punto y vamos a suponer que tenemos una fuente
cuasi-monocromática3 lo suficientemente pequeña para considerarla como
fuente puntual.
3 Se dice que una fuente es cuasimonocromática si su ancho de banda Δ𝜆
es mucho menor
que el valor de la longitud de onda centrada en el ancho de banda, es decir, Δ𝜆 /𝜆 1.
Interferencia
·
211
Lente colimadora
Lo que sigue es seleccionar una lente colimadora para generar una onda
plana. Una primera opción podría ser una lente simple (positiva o negativa) de caras esféricas alineada y con su punto focal primario coincidiendo
con la fuente puntual. Al estar la fuente puntual en eje, la única aberración
presente será la esférica. Aunque se puede disminuir la aberración dando
la forma óptima a la lente (escogiendo apropiadamente los radios de curvatura de las caras de la lente), no se logra eliminar esta aberración. Una
mejor opción consiste en usar un doblete acromático. Este tipo de lente,
además de corregir la aberración cromática para dos colores (las líneas espectrales F y C, apéndice C), disminuye considerablemente la aberración
esférica. Esta ya puede ser una buena solución. Pero si se aspira a una corrección total de la aberración esférica, se puede diseñar una lente asférica
para los conjugados finito (punto focal primario) e infinito. Esta solución no
siempre es posible por su elevado costo. Finalmente, tenemos un aspecto
que no hemos mencionado antes, que tiene que ver con la extensión finita
del frente de onda. En el tratamiento realizado en las unidades anteriores,
hemos supuesto que tenemos un borde circular (como suele ocurrir, ya sea
por el borde de la lente colimadora o por un diafragma que se coloca antes
o después de la lente para determinar el tamaño de la sección transversal de
los haces). Esta limitación física en la extensión del frente de onda genera
difracción en el borde, así que el frente de onda no es estrictamente plano
en toda su extensión.
Divisor de haz
Este elemento lo hemos representado con una línea diagonal, lo que por
supuesto es otra idealización. En la práctica, este elemento suele ser una lámina de caras paralelas de vidrio u otro material. Cuando un rayo inclinado
incide en la lámina, el rayo refractado al otro lado de la lámina sale con un
ángulo igual al del rayo incidente, pero con un desplazamiento lateral, como se muestra en la fig. 3.25. Lo anterior no es un inconveniente cuando
se ilumina el interferómetro con luz colimada (fig. 3.8), pues cualquier rayo
asociado al frente de onda se desvía la misma cantidad, por lo que el frente
de onda a la salida sigue siendo plano. Sin embargo, cuando se ilumina con
una onda esférica (fig. 3.18), los rayos se refractan dependiendo del ángulo
de incidencia, dando lugar a un frente de onda con aberración.
Para calcular la traslación del rayo refractado, supongamos que tenemos
una lámina de caras paralelas separadas una distancia d y de índice de refracción nt , y coloquemos una fuente puntual S a cierta distancia de la lámina.
212
·
Interferencia
La línea ortogonal a las caras que pasa por S define el eje z. Ahora consideremos un rayo que diverge de S con un ángulo de inclinación 𝜃 i , como
se muestra en la fig. 3.25. La proyección (hacia atrás) del rayo refractado
después de la segunda cara pasa por el punto S0. Por lo tanto, un observador después de la lámina verá el rayo refractado como si viniera del punto
S0 y no de S. La separación entre S y S0 es la medida de la desviación en el
eje z del rayo refractado, 𝛿z = S0S. En el punto de incidencia de la primera
cara de la lámina, los vectores ni ŝi y nt ŝt asociados con los rayos incidente
y refractado satisfacen la forma vectorial de la ley de Snell (eq. (2.75)), de
donde Γ = nt cos 𝜃 t − ni cos 𝜃 i . Teniendo en cuenta la relación de semejanza
Γ
𝛿z
=
nt d/cos 𝜃 t
(3.64)
se llega a que
ni cos 𝜃 i
𝛿z = d 1 −
.
nt cos 𝜃 t
(3.65)
d
qi
ni s i
dz
dz
S
Gun
nt s t
qt
qi
z
S'
ni
nt
ni
Figura 3.25. Desviación del rayo en una lámina paralela.
0.14
d z- d(1-n i /n t ), (mm)
0.12
0.10
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
qi ( °)
30
35
40
45
Figura 3.26. Desviación del rayo refractado en una lámina de caras paralelas de
espesor igual a 1 mm.
Interferencia
·
213
En la fig. 3.26, se muestra la desviación con respecto a 𝛿z| 𝜃i=0 = d(1 −
ni /nt ) en función del ángulo de incidencia 𝜃 i , para d = 1 mm, ni = 1 y
nt = 1.5168 (vidrio BK7), con 𝜆 = 587.56 nm. La curva muestra que
a medida que el ángulo de incidencia aumenta el punto S0 se aleja de S
acercándose a la lámina.
(a)
(b)
(c)
Figura 3.27. Divisores de haz de la compañía ThorLabs. (a) Pellicle, (b) lámina y
(c) cubo.
En los interferómetros, las láminas divisoras de haz pueden ser: a) membranas de nitrocelulosa (pellicles), b) láminas delgadas (de unos pocos milímetros de espesor) y c) cubos formados por dos prismas rectos. En las tres
opciones, una de las caras tendrá un recubrimiento de película delgada para
aumentar la reflexión y lograr divisores de haz, por ejemplo, de 50 % en la
reflexión y 50 % en la transmisión. Las pellicles son muy delgadas (∼ 2 𝜇m),
por lo que se puede despreciar la desviación de los rayos refractados. Este
elemento se aproxima muy bien a la idealización que hemos hecho del divisor de haz. La desventaja es que son elementos que se deben manipular
con cuidado para no romper la membrana y deben protegerse del polvo.
En sistemas cerrados y libres de vibraciones mecánicas son una buena solución. Las láminas delgadas son muy comunes en los interferómetros. Uno
de los haces pasará una vez a través de la lámina, mientras que el otro debe
hacerlo tres veces, lo que se debe tener en cuenta al utilizar fuentes de baja
coherencia. Los divisores de cubo se forman con dos prismas rectos unidos
por sus caras diagonales, apéndice E. Una de estas caras está recubierta con
una película delgada para aumentar la reflexión. A diferencia de las láminas delgadas, los dos haces atraviesan el cubo el mismo número de veces.
En la fig. 3.27, se muestra los tres divisores mencionados fabricados por la
compañía ThorLabs (www.thorlabs.com).
Resumiendo, si empleamos luz colimada para iluminar el interferómetro, podemos usar cualquiera de los divisores de haz mencionados. Pero si
empleamos luz que diverge de una fuente puntual, la mejor opción será la
pellicle. Sin embargo, lo usual es una lámina delgada. El cubo divisor no
214
·
Interferencia
será una buena opción si el radio de curvatura del frente de onda llegando
al cubo es comparable al lado del cubo. Ya que la desviación de los rayos
en una lámina es función del ángulo, este efecto es similar a la aberración
esférica que afecta a los rayos que convergen para formar la imagen en una
superficie esférica refractora, como se muestra en la fig. 1.88. Entonces, en
una lámina gruesa, como el cubo divisor, el resultado final es que un frente
de onda esférico incidente al refractarse adquiere una forma diferente a la
forma esférica, esto es, un frente de onda con aberración (frente de onda
asférico). Para una fuente puntual en el eje óptico del interferómetro de la
fig. 3.18, el frente de onda asférico tendrá simetría de revolución, por lo que
los patrones de interferencia generados en la pantalla de observación serán
anillos de interferencia, pero su distribución espacial será diferente a la que
se tiene con la interferencia de ondas esféricas.
Espejos
Después de pasar por el divisor de haz se llega a los espejos M1 y M2 . Estos
son espejos planos, es decir, láminas de vidrio con una cara plana recubierta
con una película metálica, usualmente de aluminio, pero también se encuentran de plata y de oro. Para proteger la cara metalizada de la oxidación,
del polvo o mugre (huellas digitales), también se suele depositar una película delgada (media longitud de onda) de material dieléctrico, como óxido de
silicio. Esta es una capa que permite la limpieza de la superficie.
Error Pico-Valle
Ahora consideremos un aspecto que afecta a todos los elementos ópticos
que hemos mencionado. En la práctica, ¿qué se entiende por una superficie
óptica esférica o plana? En el proceso de fabricación, se obtienen superficies
pulidas (tipo espejo) que están muy próximas a la superficie matemática del
diseño. La desviación entre la superficie real y la superficie matemática da
una medida de la calidad óptica de la superficie. Por ejemplo, un plano óptico de precisión 𝜆 /4 se refiere a una superficie pulida cuyas desviaciones en
comparación con un plano de referencia no son mayores que un cuarto de
la longitud de onda nominal. Aunque 𝜆 /4 puede parecer una cantidad pequeña, implica un cambio considerable en la distribución de irradiancia. Un
cambio en 𝜆 /2 implica pasar de una zona brillante a una oscura. Entonces,
supongamos que construimos el interferómetro de la fig. 3.8 con elementos ópticos de calidad 𝜆 /4 (igual para el espejo M1 ). Ajustando la distancia
de los espejos al divisor de haz para tener una diferencia de camino óptico
igual a 2(d2 − d1 ) = m𝜆 , esperamos ver una región completamente ilumina-
Interferencia
·
215
da en la pantalla de observación. Sin embargo, no ocurre así, sino, más bien,
una región iluminada con algunas zonas menos brillantes e incluso oscuras.
Para tener mejores resultados, se debe cambiar la calidad de los elementos
ópticos, por ejemplo de 𝜆 /10, 𝜆 /20 o 𝜆 /100.
3.4.1. Interferómetro de laboratorio
Figura 3.28. Interferómetro de Michelson. El espejo M1 está montado sobre un
carro axial.
En la fig. 3.28, se muestra un interferómetro de Michelson construido en
un laboratorio con elementos ópticos de precisión 𝜆 /4. La fuente puntual
S es un haz láser (He-Ne, 𝜆 = 632.8 nm) enfocado en un pequeño agujero
(pinhole) de alrededor de 15 𝜇m. El propósito de enfocarlo en el agujero es
eliminar frecuencias espaciales altas presentes en el haz, con lo que se obtiene una iluminación aproximadamente homogénea. Esto lo discutiremos
más adelante en el capítulo 4. Luego, se coloca un diafragma circular para
fijar en unos 25 mm de diámetro la extensión del interferograma cuando la
luz está colimada. Enseguida, se encuentra la lente colimadora, que en este
caso es un doblete acromático de 300 mm de distancia focal. Esta lente está
montada sobre un carro axial para facilitar la colimación del haz que se logra
·
216
Interferencia
cuando el punto focal primario de la lente coincide con la fuente S. El carro
axial también nos sirve para cambiar la colimación del haz y obtener frentes
de onda esféricos. A 225 ± 1 mm de la lente, se ubica el centro de un cubo
divisor de haz (punto O en la fig. 3.8) de 50 mm de lado de vidrio BK7.
Luego, se colocan los espejos planos de aluminio, como se ve en la figura, a
125±1 mm del centro del cubo. El espejo M1 está montado sobre otro carro
axial con lo que se puede cambiar la diferencia de camino óptico entre los
haces en la región de interferencia. Cada uno de los espejos está soportado
por una montura que dispone de dos tornillos de rosca fina, con lo cual se
puede inclinar el espejo. Finalmente, se tiene la pantalla de observación, P,
a 125 ± 1 mm del centro del cubo. La pantalla de observación es un vidrio
esmerilado (traslúcido). Los interferogramas en la pantalla de observación
se registran con una cámara fotográfica (no se muestra en la figura).
12
12
15
8
8
10
4
4
5
0
0
0
-4
-4
-5
-8
-8
-10
-12
-12
-12 -8
-4
0
(a )
4
8
12
-15
-12 -8
-4
0
(b)
4
8
12
-15 -10 -5
0
5
10
15
(c)
Figura 3.29. Patrones de interferencia experimentales. En (a) y (b) los haces están
colimados y en (c) los haces son esféricos divergentes. En (a) la diferencia de camino
óptico es aproximadamente cero y los espejos están alineados; en (b) la diferencia de
camino óptico es aproximadamente cero y uno de los espejos se inclina un pequeño
ángulo; en (c) manteniendo los espejos alineados se desplaza la lente colimadora
alejándola del cubo divisor de haz (40 mm) y también se aleja el espejo M1 en unos
60 mm. La escala de los ejes está dada en mm.
Con este interferómetro, se generan los patrones de interferencia mostrados en la fig. 3.29. En (a), los dos espejos están aproximadamente a la
misma distancia del centro del cubo divisor de haz y, además, están colimados y alineados (la diferencia de camino óptico entre los haces colimados es
aproximadamente cero). Sin embargo, se nota que la región no tiene una
iluminación homogénea o simétrica. Esto es un ejemplo de cómo afecta la
calidad del interferograma la precisión de las superficies de los elementos
ópticos empleados en el interferograma (de 𝜆 /4). Para obtener este interferograma se ajustó el espejo M1 hasta obtener la región iluminada sin franjas
de interferencia. En (b), se tiene un patrón de franjas rectas paralelas al in-
Interferencia
·
217
clinar el espejo M1 un pequeño ángulo. En realidad, las franjas están algo
distorsionadas, lo que se nota más en la parte inferior izquierda. Esto también es el resultado de la calidad de las superficies ópticas del interferómetro
y muestra que los dos frentes de onda que interfieren no son estrictamente
planos. En (c), se desplaza axialmente el espejo M1 , unos 60 mm, alejándolo del cubo divisor y también se desplaza la lente colimadora, unos 40
mm, alejándose del cubo divisor. Al desplazar la lente colimadora, el frente
de onda que sale de la lente es esférico divergente y su centro de curvatura
estará a 1950 mm de la lente. Ahora, la lente está a unos 265 mm del centro
del cubo.
Teniendo en cuenta las distancias mencionadas en el párrafo anterior:
la distancia de los espejos, la distancia de la pantalla de observación y el
camino óptico adicional debido al cubo divisor de haz, se encuentra que
R2 = 2640 mm, R2 = 2720 mm. Por lo tanto, ΔR = 120 mm, de donde
se tiene que mmáx = ΔR/𝜆 = 189633 es el valor de m correspondiente a
la zona central en la fig. 3.29(c). En la figura en (c), se cuentan tres franjas
circulares y se estima el radio de la tercera en unos 15 mm. Lo anterior
se puede corroborar a partir de la eq. (3.56). Colocando ΔR = mmáx 𝜆 y
m = mmáx − 3 para la tercera franja en la eq. (3.56), se tiene que
r
6𝜆 R1 R2
𝜌 m3 =
= 15.07 mm,
ΔR
lo cual concuerda muy bien con la estimación experimental.
En conclusión, un haz de referencia plano real será un frente de onda
distorsionado en una cantidad similar a las deformaciones de las superficies
ópticas del divisor de haz y del espejo plano que envía el haz de referencia
a la región de observación. Para un haz de referencia esférico, además se
debe tener en cuenta el efecto del espesor del divisor de haz. El otro haz del
interferómetro, también afectado inicialmente por el divisor de haz, se puede usar para evaluar la calidad óptica de algún elemento, por ejemplo, un
espejo plano o uno esférico. La calidad óptica del haz de referencia determinará la precisión con la que podemos medir las superficies bajo prueba.
En el ejemplo de la fig. 3.29(c), el efecto del cubo es despreciable, ya que el
ángulo del rayo marginal resulta ser 0.37◦ , lo que da una desviación axial
del rayo de 0.34 𝜇m.
218
·
Interferencia
3.5. Interferencia en una lámina de caras
paralelas
0
tr' 5
t'E
tr' 3
t'E
tr't'
E0
rE
E0
0
0
En el interferómetro de la fig. 3.8, lo que un observador ve desde la pantalla
de observación es un par de superficies planas reflectoras paralelas separadas
una distancia 2(d2 − d1 ). La luz reflejada en las dos superficies genera un patrón de interferencia en el plano de observación. Un sistema que se asemeja
al anterior es una lámina de caras paralelas. Ahora en las caras de la lámina
tendremos luz reflejada y transmitida, y es posible observar interferencia en
ambos lados de la lámina: si es del mismo lado de la fuente de iluminación,
diremos que es interferencia por reflexión, pero si es del lado donde no está
la fuente de iluminación, diremos que es interferencia por transmisión. Para ver esto consideremos la fig. 3.30, en la que se muestra la incidencia de
un rayo con un ángulo 𝜃 i en una lámina de índice de refracción nl y espesor
d, sumergida en un medio de índice ni .
ni
qi
d
qt
nl
ni
tr'
tr'
4 t'E 0
2 t'E 0
tt'E 0
Figura 3.30. Reflexión y transmisión en una lámina de caras paralelas.
En cada una de las interfases, tendremos múltiples rayos reflejados y
transmitidos. Las amplitudes de las ondas asociadas con los rayos están dadas por las ecuaciones de Fresnel, eqs. (2.96), (2.97), (2.98) y (2.99). En la
fig. 3.30, los coeficientes r y t denotan los coeficientes de reflexión (r⊥ o rq )
y transmisión (t⊥ o tq ) cuando la luz va del medio de índice ni al medio
de índice nl , y los coeficientes r 0 y t 0 denotan los coeficientes de reflexión y
transmisión cuando la luz va del medio de índice nl al medio de índice ni .
Interferencia
·
219
3.5.1. Relaciones de Stokes
Las relaciones entre r y r 0 y entre t y t 0 se obtienen de las relaciones de
Stokes, las cuales se deducen a partir de las ilustraciones de la fig. 3.31. En
(a), se muestra la reflexión y la transmisión de un rayo de amplitud E0 que
incide con un ángulo 𝜃 i en una interfase que separa dos medios de índices
ni y nt . La amplitud de la onda reflejada será rE0 y la amplitud de la onda
transmitida será tE0 . Teniendo en cuenta el principio de reversibilidad (o
reciprocidad), si se envía dos rayos en las direcciones opuestas a los rayos
reflejado y transmitido en (a) con amplitudes rE0 y tE0 , respectivamente,
deberíamos obtener nuevamente el haz incidente (pero en sentido opuesto)
con amplitud E0 . En (b), el rayo incidente es opuesto al rayo reflejado en
(a), pero con la misma amplitud. Este rayo tendrá una reflexión y una transmisión con amplitudes r 2 E0 y trE0 , respectivamente. Por otro lado, en (c),
el rayo incidente es opuesto al rayo transmitido en (a), pero con la misma
amplitud. Este rayo también tendrá una reflexión y una transmisión, pero
con amplitudes r 0tE0 y tt 0 E0 , respectivamente. Si se cumple el principio de
reversibilidad, entonces
r 2 + tt 0 = 1
(3.66)
y
tr + r 0t = 0.
E0
ni
rE0
r 2E0
rE0
qi
qi
qt
nt
tE0
(a)
(3.67)
t'tE 0
qi
qt
qt
trE0
r'tE0
(b)
tE0
(c)
Figura 3.31. Coeficientes de Stokes. Reflexión y transmisión de: (a) una onda de
amplitud E0 , (b) una onda de amplitud rE0 y (c) una onda de amplitud tE0 .
Por lo tanto,
tt 0 = 1 − r 2
(3.68)
r 0 = −r.
(3.69)
y
220
·
Interferencia
Estas últimas dos ecuaciones se denominan relaciones de Stokes y son particularmente útiles al sumar las amplitudes de las múltiples ondas reflejadas y
transmitidas de la fig. 3.30. La irradiancia reflejada/transmitida será el módulo al cuadrado de la suma de las ondas reflejadas/transmitidas incluyendo
la diferencia de camino óptico entre ondas consecutivas.
3.5.2. Interferencia de múltiples ondas
En esta unidad vamos a considerar la superposición de las múltiples ondas
(rayos) reflejadas y transmitidas en la fig. 3.30.
Interferencia por reflexión
Para la irradiancia reflejada, tendremos
Ir =
𝜖 0c
Er Er∗ ,
2
(3.70)
con
Er = rE0 + tr 0t 0 E0 e i𝛿 + tr 03 t 0 E0 e i2𝛿 + tr 05 t 0 E0 e i3𝛿 + · · ·+,
(3.71)
y Er∗ el conjugado de Er . La fase 𝛿 depende de la diferencia de camino óptico
Λ entre dos rayos reflejados consecutivos, esto es, 𝛿 = 2𝜋Λ/𝜆 . La eq. (3.71)
se puede reescribir como
2
3
0 0
i𝛿
2 i𝛿
2
i2𝛿
2
i3𝛿
e + r
e + · · ·+ . (3.72)
Er = rE0 + tt r E0 e 1 + r e + r
Y en una forma más compacta,
0 0
Er = rE0 + tt r E0 e
i𝛿
Q Õ
r 2 e i𝛿
q
,
(3.73)
q=0
donde q = 0, 1, 2, ... define la reflexión q + 2, y Q + 2 es el número total de
reflexiones. La sumatoria en la eq. (3.73) representa una serie geométrica
cuya razón es r 2 e i𝛿 y de módulo ≤ 1. La suma de esta serie está dada por
Q+1
1 − r 2 e i𝛿
.
1 − r 2 e i𝛿
(3.74)
Si el número de reflexiones es mucho mayor a 1 (se tendrán infinitas
reflexiones si 𝜃 i = 0 ó si lámina tiene una extensión infinita), la suma se
Interferencia
·
221
reduce a 1/(1−r 2 e i𝛿 ). Con esto en mente y teniendo en cuenta las relaciones
de Stokes, el campo reflejado será
Er = rE0
1 − e i𝛿
.
1 − r 2 e i𝛿
(3.75)
Finalmente, la irradiancia de las múltiples ondas reflejadas (eq. (3.70)) está
dada por
4R sin2 (𝛿/2)
Ir = I0
,
(3.76)
(1 − R) 2 + 4R sin2 (𝛿/2)
donde I0 = 𝜖 0 c(E0 ) 2 /2 y la reflectancia R = r 2 .
Para calcular la fase 𝛿, consideremos la fig. 3.32. La diferencia de camino
óptico entre los dos haces reflejados será
Λ = nl AB + BC − ni AD.
qi
D
A
C
qt
d
(3.77)
ni
nl
B
ni
Figura 3.32. Geometría para la calcular la diferencia de camino óptico entre dos
reflexiones consecutivas.
De los triángulos, se tiene que AB = BC = d/cos 𝜃 t y AD = (2d tan 𝜃 t )
× sin 𝜃 i . Entonces, la fase 𝛿 = 2𝜋Λ/𝜆 está dada por
2𝜋 2nl d
𝛿=
− (2d tan 𝜃 t )ni sin 𝜃 i .
𝜆 cos 𝜃 t
(3.78)
Usando la ley de Snell y simplificando, se tiene que
𝛿=
2𝜋
(2nl d cos 𝜃 t ) .
𝜆
(3.79)
222
·
Interferencia
Interferencia por transmisión
Para el caso de las ondas transmitidas (fig. 3.30), tenemos que la suma resultante será
Et = tt 0 E0 + tr 02 t 0 E0 e i𝛿 + tr 04 t 0 E0 ei2𝛿 + · · ·+,
(3.80)
es decir,
0
Et = tt E0
2
2
i2𝛿
1+r e + r
e + · · ·+ .
2 i𝛿
(3.81)
En forma análoga a la deducción de la irradiancia de las múltiples ondas
reflejadas, la irradiancia de las múltiples ondas transmitidas está dada por
It = I0
(1 − R) 2
.
(1 − R) 2 + 4R sin2 (𝛿/2)
(3.82)
Las ecuaciones (3.76) y (3.82) son complementarias cuando no hay absorción.
Caso 1. Interferencia de ondas planas. Un primer resultado que podemos observar se tiene cuando la lámina se ilumina con ondas planas monocromáticas (coherentes) en dirección ortogonal a la lámina, es decir, cuando
𝜃 i = 0 y, por lo tanto, 𝜃 t = 0. En la fig. 3.33(a), se muestra la situación donde una onda plana limitada por un diafragma D incide ortogonalmente en
una lámina de espesor d. Si la interferencia después de la lámina se observa
en un plano (paralelo a la lámina), tendremos una situación similar a la del
interferómetro de Michelson en la fig. 3.8 y se verá una región iluminada
homogéneamente. Pero si colocamos una lente L y movemos la pantalla de
observación al plano focal secundario de la lente, observaremos un punto
luminoso. En ambos casos, la irradiancia estará dada por la eq. (3.82) y depende del espesor de la lámina. En la fig. 3.33(b), se muestra una variante
del sistema de la fig. 3.33(a), con el fin de observar la interferencia de las
múltiples ondas reflejadas por las caras de la lámina. Con ayuda del divisor
de haz, las ondas reflejadas se desvían hacia la lente L que enfoca la luz en
la pantalla de observación. La irradiancia estará dada por la eq. (3.76).
En la fig. 3.9, para 𝛾 (𝜏) = 1, se muestra cómo cambia la irradiancia
transmitida en el plano de observación a medida que cambia la separación
entre los espejos. En este caso, el contraste de la irradiancia es 1. Al cambiar
el espesor de la lámina de la fig. 3.33(a), también se obtiene una modulación
de la irradiancia en el plano de observación (plano focal). En la fig. 3.34, se
muestra el valor de la irradiancia en el plano focal en función del espesor de
Interferencia
·
223
la lámina (del orden de la longitud de onda) para tres valores del coeficiente
de reflexión r = 0.2, 0.56 y 0.96.
ni
D
nl
ni
L
Pantalla de
observación
ni
D
d
nl
ni
d
L
(a)
Pantalla de
observación
( b)
Figura 3.33. Interferencia axial de múltiples ondas planas en una lámina de caras
paralelas: (a) transmitidas, (b) reflejadas.
Irradiancia normalizada, It (I 0)
1.0
0.9
r = 0.20 (R = 0.04)
0.8
r = 0.56 (R = 0.31)
0.7
r = 0.96 (R = 0.92)
0.6
0.5
0.4
0.3
0.2
0.1
0
l / nl
2l / n l
3l / n l
4l / n l
Espesor de la lámina, d (l )
Figura 3.34. Modulación de la irradiancia de múltiples ondas transmitidas en el
plano focal (fig. 3.33(a)) cuando el coeficiente de reflexión de las caras de la lámina
es r = 0.2, 0.56 y 0.96.
En particular, el coeficiente de reflexión r = 0.2 (r k = −r⊥ ) se obtiene para una lámina de vidrio (nl = 1.5, 𝜆 = 632.8 nm) sumergida en aire, cuando
𝜃 i = 0. La forma de la modulación de la irradiancia tiene un comportamiento similar al de la irradiancia mostrada en la fig. 3.9, para 𝛾 (𝜏) = 1, en el
interferómetro de Michelson. La diferencia está en el contraste de la modulación, pues en el caso de la lámina es bajo, igual a 0.08. Esta similitud
no es coincidencia. Cuando r = 0.2, entonces r 2 = 0.04 y r 4 = 0.0016, por
224
·
Interferencia
2
lo que r 2 ei2𝛿 , y los demás sumandos de orden superior no contribuyen
de manera relevante en la suma de la eq. (3.81). Así que en este caso de baja
reflectancia (R = 0.04), la interferencia está determinada solo por los dos
primeros haces transmitidos, es decir,
Et = tt 0 E0 1 + r 2 e i𝛿 ,
y la irradiancia será (omitiendo el término r 4 )
4𝜋
2
It = I0 (1 − R) 1 + 2R cos
nl d .
𝜆
(3.83)
(3.84)
Esta expresión es análoga a la eq. (3.29) de la interferencia de dos ondas
planas cuando |𝛾 | = 1 y 𝜏 = 2(d2 − d1 )/c.
Entonces, cuando la reflectancia de las caras de la lámina es baja (como
en una lámina de vidrio) la interferencia efectiva de las múltiples transmisiones se asemeja a la interferencia de dos ondas. Si la reflectancia aumenta,
se irán agregando otros sumandos y el resultado se aleja del correspondiente
a dos ondas. Para aumentar la reflectancia, una opción es aumentar el índice
de refracción de la lámina. Sin embargo, en la práctica, no se logra mejorar mucho, ya que índices altos de refracción están alrededor de 2.5 (por
ejemplo, en el diamante), lo que da reflectancias alrededor de 0.18. Para
lograr reflectancias como las mostradas en la fig. 3.34, de 0.31 (r = 0.56) o
0.92 (r = 0.96), se depositan películas delgadas metálicas o dieléctricas en
las caras de la lámina.
Considerando el caso en el que el coeficiente de reflexión es r = 0.96,
vemos que el resultado en la interferencia cambia notablemente en comparación con el caso con r = 0.2. Se obtiene máximos de irradiancia (I0 )
cuando el espesor de la lámina es un múltiplo de media longitud de onda
divido entre el índice de refracción de la lámina (igual que para dos ondas), pero rápidamente decaen los valores de la irradiancia al variar poco
el espesor de la lámina. En otras palabras, tenemos valores de irradiancia
importantes solo en bandas muy estrechas.
Para el caso de las múltiples ondas reflejadas (con la fig. 3.33(b)), se tiene
una situación análoga, como se muestra en la fig. 3.35, para los mismos valores del coeficiente de reflexión. Se obtienen mínimos de irradiancia (cero)
cuando el espesor de la lámina es un múltiplo de media longitud de onda
divido entre el índice de refracción de la lámina (igual que para dos ondas).
Ahora el contraste de la irradiancia cuando r = 0.2 es igual 1, como en la
fig. 3.9, para 𝛾 (𝜏) = 1. Y cuando r = 0.96, se tiene bandas estrechas donde
la irradiancia está alrededor de cero y rápidamente aumentan los valores de
Interferencia
·
225
la irradiancia al variar poco el espesor de la lámina. Este es el principio de
funcionamiento de las películas delgadas antirreflectivas.
Irradiancia normalizada, Ir (I 0)
1.0
0.9
r = 0.20 (R = 0.04)
0.8
r = 0.56 (R = 0.31)
0.7
r = 0.96 (R = 0.92)
0.6
0.5
0.4
0.3
0.2
0.1
0
l / nl
2l / n l
3l / n l
4l / n l
Espesor de la lámina, d (l )
Figura 3.35. Modulación de la irradiancia de múltiples ondas reflejadas en el
plano focal (fig. 3.33(b)) cuando el coeficiente de reflexión de las caras de la lámina es r = 0.2, 0.56 y 0.96.
Note que las gráficas para la transmisión (fig. 3.34) y la reflexión (fig.
3.35 ) son complementarias, lo que resulta de la conservación de la energía
si no hay absorción en la lámina.
Caso 2. Interferencia de ondas esféricas I. Consideremos ahora una onda esférica incidiendo en la lámina de caras paralelas. Ya hemos visto que
en el interferómetro de Michelson iluminado con una onda esférica se tiene
un patrón de franjas circulares. En el caso de la lámina, también ocurre algo similar, pero la estructura de las franjas depende de la reflectancia de las
caras de la lámina. Vamos a considerar las configuraciones mostradas en la
fig. 3.36 en las que se observan las franjas de interferencia por transmisión.
S
S
ni
nl
D
ni
ni
Pantalla de
observación
d
(a)
nl
ni
D
L
Pantalla de
observación
d
( b)
Figura 3.36. Interferencia de múltiples ondas transmitidas en una lámina de caras
paralelas cuando se ilumina con una onda esférica. (a) Formación de franjas no
localizadas, (b) formación de franjas localizadas.
226
·
Interferencia
En (a), la interferencia en un punto de la pantalla de observación ocurre
por la superposición de rayos que llegan con diferente ángulo. En (b), se
coloca una lente y, en el plano focal secundario, la pantalla de observación.
Ahora la interferencia en un punto en la pantalla de observación ocurre por
la superposición de rayos que inciden con el mismo ángulo en la lente. Por
otro lado, en (a), las franjas circulares de interferencia se observan para cualquier posición de la pantalla de observación a lo largo del eje óptico (franjas
no localizadas), mientras que en (b) las franjas circulares de interferencia se
observan enfocadas en el plano focal de la lente (franjas localizadas).
Primero, veremos la formación de las franjas de interferencia en la configuración (b), ya que el álgebra que se requiere ya ha sido desarrollada en
la eq. (3.82). Para obtener esta ecuación, se consideró en la fig. 3.30 la incidencia de un rayo con cierto ángulo. Luego, a partir de la fig. 3.33(a), se
examinó el caso particular de 𝜃 i = 0: en el punto focal secundario se observa
la irradiancia dada por la eq. (3.82). Si ahora en la configuración de la fig.
3.33(a) suponemos que 𝜃 i ≠ 0, la interferencia de las múltiples ondas planas inclinadas 𝜃 i se verá en un punto luminoso fuera de eje en la posición
radial f tan 𝜃 i , donde f es la distancia focal de la lente. Esto último es lo
que ocurre con los múltiples rayos transmitidos correspondientes a un rayo
que diverge de S en la fig. 3.36(b), con 𝜃 i ≠ 0: los rayos transmitidos se enfocarán en un punto localizado en f tan 𝜃 i . Teniendo en cuenta la simetría
de revolución alrededor del eje óptico, lo que tendremos es un patrón de
anillos. Los radios de los círculos de máxima irradiancia estarán dados por
𝜌 m = f tan 𝜃 m .
donde
q
sin 𝜃 m =
nl2 − (m𝜆 /2d) 2
(3.85)
,
(3.86)
ni
de acuerdo con la eq. (3.79), cuando 𝛿 = 2m𝜋. El valor máximo de m,
mmáx , será el entero inferior más próximo a 2nl d/𝜆 . Al alejarnos del centro
disminuye el valor de m. Así con m = mmáx − 1, mmáx − 2, ..., se identifican
los anillos de interferencia desde el centro.
Con el propósito de comparar los interferogramas generados por ondas
esféricas con el interferómetro de Michelson y con la lámina de caras paralelas, vamos a suponer que en el interferómetro de Michelson de la fig. 3.18
la separación de los espejos es a/2 = 0.25 mm y que tenemos una lámina
de vidrio de espesor d = (a/2)/nl , con nl = 1.5 (para 𝜆 = 632.8 nm). El
interferograma que se obtiene con el interferómetro de Michelson, cuando
la distancia entre el punto medio de las fuentes virtuales y la pantalla de observación es z0 = 100 mm, se muestra en la fig. 3.16. Y los interferogramas
Interferencia
·
227
que se obtienen cuando se usa una lente de distancia focal f = 65.65 mm
para r = 0.2 (lámina de vidrio sin recubrimientos reflectivos), r = 0.5 y
R = 0.9 se muestran en la fig. 3.37. La distancia focal se fijó en este valor
teniendo en cuenta el ángulo que subtiende el primer anillo de interferencia
en el patrón de la fig. 3.16. El radio de este anillo es 𝜌 790 = 1.88 mm. Por
otra parte, para la lámina, el ángulo correspondiente con el primer anillo es
𝜃 790 = 1.61◦ (eq. (3.86)), lo que da una distancia focal igual a 65.65 mm
(eq. (3.85)).
r = 0.2
-10
-5
0
10
r = 0.5
5
-10
10
-5
0
10
r = 0.9
5
-10
10
0
5
10
10
5
5
5
0
0
0
-5
-5
-5
-10
-10
-10
(a )
-5
(b)
(c)
Figura 3.37. Interferogramas en transmisión generados por una lámina de espesor óptico 0.5 mm para r = 0.2, r = 0.5 y r = 0.9, usando una lente de distancia
focal 65.65 mm. La escala de los ejes está dada en mm.
En los interferogramas de la fig. 3.37, la posición de los anillos (radio de
los círculos de máxima irradiancia) es igual. Lo anterior se debe a que las
eqs. (3.85) y (3.86) no dependen del coeficiente de reflexión. Sin embargo, el coeficiente de reflexión sí determina el ancho de las franjas circulares.
Entre mayor sea el número efectivo de haces que interfieren (lo que ocurre
al aumentar el coeficiente de reflexión), menor es el ancho de las franjas.
Cuando r = 0.2, el patrón se asemeja con el patrón de dos ondas esféricas
mostrado en la fig. 3.16, pero el contraste es bajo, C = 0.08. En la lámina
a medida que aumenta la reflectancia de las caras también aumenta el contraste de las franjas. Así, con r = 0.5, C = 0.47 y, con r = 0.9, C = 0.98.
Para la interferencia por reflexión se puede emplear la configuración de
la fig. 3.33(b), pero iluminando con una onda esférica. En este caso, los
máximos de irradiancia ocurren cuando 𝛿 = 2m𝜋 ± 𝜋. Usando los mismos
parámetros empleados en el ejemplo de la interferencia por transmisión, los
patrones de interferencia por reflexión se muestran en la fig. 3.38. Como es
de esperar, estos interferogramas son el complemento de los interferogramas por transmisión. A diferencia de los interferogramas por transmisión,
el contraste de las franjas de interferencia en reflexión es C = 1, ya que las
zonas oscuras tienen valor de irradiancia cero.
228
·
Interferencia
r = 0.2
-10
-5
0
r = 0.5
5
-10
10
10
-5
0
r = 0.5
0.9
5
-10
10
10
-5
0
5
10
10
5
5
5
0
0
0
-5
-5
-5
-10
-10
-10
(a)
(b)
(c)
Figura 3.38. Interferogramas en reflexión generados por una lámina de espesor
óptico 0.5 mm para r = 0.2, r = 0.5 y r = 0.9. La escala de los ejes está en mm.
El cálculo de la irradiancia del interferograma mostrado en la fig. 3.37(a)
se realizó usando r = 0.2 independientemente del ángulo. Estrictamente,
no debe ser así, ya que los coeficientes de reflexión y transmisión dependen
del ángulo, de acuerdo con las ecuaciones de Fresnel (eqs. (2.96), (2.97),
(2.98) y (2.99)). Sin embargo, en el ejemplo tratado, el rango del ángulo de
incidencia con el que se genera el patrón de interferencia va de 0 a 10◦ , y
para ese rango el valor de r cambia muy poco, alrededor del 2 % (fig. 2.13).
Incluso para ángulos aún mayores, la variación sigue siendo pequeña, por lo
que para los primeros anillos de interferencia basta con tomar el coeficiente
de reflexión igual al que se tiene para 𝜃 i = 0. Esto también aplica para las
láminas con recubrimientos reflectivos.
48
44
*
*
a = 2dnl = 0.1 mm
*
40
*
36
*
*
r (mm)
32
*
28
*
24
*
20
16
12
*
*
*
a = 2dnl = 0.5 mm
*
*
*
*
*
*
*
8
*
*
*
*
4
0
m max -12 m max -10 mmax -8
m max -6
m max -4
m max -2
*
*
m max
m
Figura 3.39. Radio ( 𝜌) de los primeros 12 anillos de interferencia de ondas esféricas con el interferómetro de Michelson ( o ) cuando a = 0.5 mm y 0.1 mm y con
una lámina de caras paralelas ( ★ ) cuando 2dnl = 0.1 mm y 0.5 mm.
A primera vista, los interferogramas mostrados en las figs. 3.16 y 3.37(a)
son semejantes. Esto se puede verificar si comparamos las posiciones radiales de los anillos de interferencia, eqs. (3.47) y (3.85). En la fig. 3.39, se
Interferencia
·
229
compara la posición radial de los 12 primeros anillos de interferencia cuando a = 0.1 mm y 0.5 mm en el interferómetro de Michelson y cuando
2dnl = 0.1 mm y 0.5 mm en la lámina de caras paralelas. En el caso en
que a = 0.5 mm, en efecto, la posición radial de los anillos de los dos interferogramas es aproximadamente igual. Sin embargo, al disminuir a, por
ejemplo a = 0.1 mm, los anillos de interferencia generados con el interferómetro de Michelson tienen un radio menor en comparación con los anillos
generados con la lámina.
Caso 3. Interferencia de ondas esféricas II. Consideremos ahora la configuración de la fig. 3.36(a). Supongamos que de la fuente puntual S divergen tres rayos (etiquetados 1, 2 y 3), como se muestra en la fig. 3.40. En la
transmisión, tendremos múltiples rayos paralelos a los rayos incidentes. En
la fig. 3.40, solo dibujamos 3 rayos transmitidos para cada uno de los rayos
incidentes.
3
S'3
S'2 S S'1
2
1
ni
nl
ni
Figura 3.40. Refracción de tres rayos que divergen de la fuente S junto con algunos rayos transmitidos.
El primero de los rayos transmitidos en cada caso experimenta una desviación lateral para una lámina de espesor d. Las prolongaciones hacia atrás
de los primeros rayos transmitidos (rectas en gris continuas) convergen aproximadamente en el punto S10 . El segundo de los rayos transmitidos en cada
caso experimenta una desviación lateral para una lámina equivalente de espesor 3d. Las prolongaciones hacia atrás de los segundos rayos transmitidos
(rectas en gris segmentos iguales) convergen aproximadamente en el punto S20 . Y el tercero de los rayos transmitidos en cada caso experimenta una
desviación lateral para una lámina equivalente de espesor 5d. Las prolongaciones hacia atrás de los terceros rayos transmitidos (rectas en gris segmentos largos y cortos) convergen aproximadamente en el punto S30 . En forma
230
·
Interferencia
análoga, se continúa para los demás rayos transmitidos. Las prolongaciones
de los j-ésimos ( j = 1, 2, 3, ...) rayos transmitidos no convergen exactamente en un punto (S0j ) debido a que la desviación axial que experimentan
los rayos refractados depende del ángulo de incidencia, de acuerdo con la
eq. (3.65).
P
r
S'3
S'2 S S'1
ni
nl
ni
(a)
Pantalla de
observación
P2
P1
S'3
S'2 S S'1
ni
(b)
nl
ni
Pantalla de
observación
Figura 3.41. (a) Fuentes virtuales: los rayos que llegan al punto P parecen emerger
de múltiples fuentes virtuales localizadas en S10 , S20 , S30 . (b) Rayos reales: la interferencia en un punto de la pantalla de observación resulta de la superposición de
rayos con diferente ángulo y con diferente número de reflexiones internas en la
lámina.
Para el análisis que sigue, vamos a suponer que las prolongaciones axiales de los j-ésimos rayos transmitidos convergen en el punto S0j . Lo anterior
implica que el ángulo de incidencia de los rayos que divergen de S y llegan
Interferencia
·
231
a la lámina es pequeño. Con esto en mente, en un punto P de la pantalla de
observación llegan rayos que parecen emerger de múltiples fuentes virtuales localizadas en S10 , S20 , S30 , ..., como se muestra en la fig. 3.41(a). Por lo
tanto, la interferencia en P ocurre por la superposición de rayos con distinto
ángulo. Así que los rayos que se superponen en P son rayos que emergen de
la fuente S con diferentes ángulos. Entonces, ¿cómo es posible que los rayos
refractados se junten en el punto P? Esto es posible si los diferentes rayos
experimentan diferentes reflexiones internas en la lámina, como se muestra
en la fig. 3.41(b). Por ejemplo, al punto P2 llegan tres rayos (como en la fig.
3.41(a)): el rayo que parece salir de S10 llega después de transmitirse en las
dos caras de la lámina sin reflejarse internamente (rayo en negro); el rayo
que parece salir de S20 llega después de transmitirse en la primera cara, reflejarse internamente en la segunda cara, reflejarse internamente en la primera
cara y transmitirse en la segunda cara (rayo en gris segmentado); y el rayo
que parece salir de S30 llega después de transmitirse en la primera cara, reflejarse internamente en la segunda cara dos veces, reflejarse internamente
en la primera cara dos veces y transmitirse en la segunda cara (rayo en gris
continuo). Esto ocurrirá progresivamente para los rayos que emergen de las
otras fuentes virtuales.
ni
nl
A3
a
S'3
B2
A2
qi
S'2
ni
B1
A1
S S'1
zS
d
Figura 3.42. Geometría para calcular la distancia entre dos fuentes virtuales consecutivas.
La separación entre dos fuentes virtuales consecutivas se puede calcular con ayuda de la fig. 3.40. Consideramos las prolongaciones de los rayos
transmitidos correspondientes con uno de los rayos que diverge de S, como
se muestra en la fig. 3.42. De la geometría de la figura, se deduce que la
separación entre cualquier par de fuentes consecutivas es constante. Definiendo esta separación como a, se tiene que a = S10 S20 = S20 S30 = ... = S0j S0j+1 .
También se cumple que B1 B2 = A1 A2 = A2 A3 = ... = A j A j+1 . Por lo tanto,
para cualquier par de fuentes consecutivas (j y j+1), tan 𝜃 i = B1 B2 /a. Ya que
232
·
Interferencia
B1 B2 = 2d tan 𝜃 t , entonces
2d tan 𝜃 t
.
tan 𝜃 i
a=
(3.87)
La eq. (3.87) dice que la separación entre las fuentes virtuales varía con
el ángulo de incidencia. Sin embargo, en una situación práctica, limitando
los ángulos de incidencia a valores pequeños (alrededor de 10◦ ), de modo
que cos 𝜃 i ≈ 1 y cos 𝜃 t ≈ 1, podemos cambiar tan 𝜃 t /tan 𝜃 i por sin 𝜃 t /sin 𝜃 i .
Usando la ley de Snell, se llega a
a = 2d
ni
,
nl
(3.88)
que es independiente del ángulo. Así, en esta situación tenemos que la interferencia de ondas esféricas en la configuración de la fig. 3.36(a) se puede ver
como la superposición de ondas esféricas que divergen de múltiples fuentes
virtuales separadas uniformemente una distancia 2dni /nl a lo largo del eje
óptico. La distancia de la fuente virtual S0j a la lámina (cara anterior) resulta
ser
z j = zS − 𝛿z0 + ( j − 1)a,
(3.89)
donde zS es la distancia entre la fuente puntual S y la lámina, y 𝛿z0 es la
desviación axial dada por la eq. (3.65), con nt = nl , para 𝜃 t = 0.
Con base en lo anterior, el campo óptico
p para un punto P en la pantalla
de observación a la distancia radial 𝜌 = x 2 + y 2 (omitiendo el término
temporal de fase 𝜔t y el término de fase inicial) será
Et = tt
0
E0†
s1
e
iks1
2 0
+ tr t
E0†
s2
e
iks2
4 0
+ tr t
E0†
s3
e iks3 + · · ·+,
(3.90)
o, de manera más compacta,
Et = tt 0 E0†
J
Õ
j=1
r 2( j−1)
e iks j
,
sj
(3.91)
donde s j es la distancia entre la fuente virtual S0j y el punto P, y J es el
número total de reflexiones ( J → ∞). Suponiendo que la distancia entre la
lámina y la pantalla de observación es d + zP , entonces
q
s j = R 2j + 𝜌2 ,
(3.92)
con
R j = z j + d + zP .
(3.93)
Interferencia
·
233
Al igual que en los casos 1 y 2, el coeficiente de reflexión determina el
peso con el que cada sumando interviene en la suma. Por ejemplo, para
la lámina de vidrio sin recubrimiento reflectivo, basta con tomar los dos
primeros sumandos, la irradiancia transmitida será
p
2𝜋
2
2
(s2 − s1 ) ,
(3.94)
It = (1 − R) I1 + I2 R + 2R I1 I2 cos
𝜆
donde I1 = 𝜖 0 c(E0† /s1 ) 2 /2 y I2 = 𝜖 0 c(E0† /s2 ) 2 /2. Esta irradiancia es análoga
a la eq. (3.44), salvo por el contraste de las franjas, el cual es bajo para la
lámina. Al aumentar la reflectancia de la lámina, tendremos más sumandos
y ya no se puede escribir de manera sencilla la irradiancia resultante de la
superposición de J haces transmitidos ( J → ∞), tal y como se hace con la
eq. (3.82) en el caso de la superposición de haces paralelos.
Irradiancia Transmitida, I t
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2
4
6
8
Distancia radial, r (mm)
10
12
Figura 3.43. Perfiles de los interferogramas obtenidos con los interferómetros de
la fig. 3.36(a) (en negro) y 3.36(b) (en gris segmentado).
Para ver la diferencia que se tiene entre el interferograma obtenido con
la configuración de la fig. 3.36(a) y el interferograma obtenido con la configuración de fig. 3.36(b), vamos a comparar el perfil del interferograma de
la fig. 3.37(b), que se obtiene cuando r = 0.5, y el perfil del interferograma con la eq. (3.91), con el mismo valor de r. Para el cálculo del segundo
perfil, tenemos en cuenta los siguientes parámetros: d = 0.25nl (en mm),
nl = 1.5 y ni = 1.0. Con esto, se tiene que las fuentes virtuales están separadas a = 0.5 mm. Además, fijamos las distancias zS = 50 − 𝛿z0 y zP = 50 − d,
ambas en mm. En la fig. 3.43, se muestra los dos perfiles para los primeros
6 anillos en función de la coordenada radial: en negro, el obtenido con el
interferómetro de la fig. 3.36(a), en gris (segmentos largos y cortos), el obtenido con el interferómetro de la fig. 3.36(b). Dos cosas llaman la atención:
234
·
Interferencia
la primera, a medida que nos alejamos del centro los máximos de irradiancia, se van separando; segunda, a medida que nos alejamos del centro, los
anillos del interferograma en negro se van atenuando. La separación entre
los máximos corresponde con la mostrada en la fig. 3.39 para a = 0.5. Aunque el cálculo del perfil en negro se debe realizar con J → ∞, solamente
empleamos los primeros 12 sumandos de la sumatoria de la eq. (3.91), lo
cual es más que suficiente, ya que el sumado 12 resulta ser el ≈ 0.0001 %
del segundo sumando.4
La eq. (3.94) es completamente análoga a la eq. (3.44), lo que implica
que los radios de los círculos de máxima irradiancia para el interferómetro
de la fig. 3.36(a), con r = 0.2, coinciden con los radios de los anillos de
interferencia generados por dos ondas en el interferómetro de Michelson.
Por otra parte, si el efecto de aumentar la reflectancia de la lámina se traduce
en un adelgazamiento de los anillos de interferencia manteniendo el radio
de los círculos de máxima irradiancia, entonces podemos anticipar que los
círculos de máxima irradiancia en el interferómetro de la fig. 3.36(a) también se calculan con la eq. (3.47). En cuanto a la interferencia por reflexión,
también se tendrá un resultado similar al de la fig. 3.38, como por supuesto,
será el complemento de los interferogramas generados por transmisión.
3.5.3. Interferencia de dos ondas
Ya hemos mencionado que en una lámina de caras planas paralelas cuando la reflectancia de las caras es baja, en la práctica, solo interfieren las dos
primeras ondas reflejadas o transmitidas. En ambos casos, el análisis de la
formación de las franjas de interferencia se puede hacer considerando las
dos fuentes virtuales que se generan por la reflexión o por la transmisión.
En esta sección, vamos a tratar una situación de particular interés: la interferencia de las dos primeras ondas esféricas reflejadas por una lámina de
baja reflectancia (r ∼ 0.2). Este caso nos permitirá analizar más adelante la
interferencia generada por fuentes de luz extendidas policromáticas.
De acuerdo con lo visto en las unidades anteriores, tenemos dos configuraciones posibles para observar la interferencia, las cuales se ilustran en la
fig. 3.44(a) y (b). Así que tenemos dos fuentes virtuales (en el lado opuesto
al de la fuente S) generadas por la reflexión en cada una de las caras de la
lámina. En (a), llegan dos rayos a P con diferentes ángulos desde las fuentes
virtuales. Para cualquier punto P del lado de la fuente ocurrirá lo mismo,
de modo que tendremos franjas de interferencia en cualquier lugar del lado
4 Otro
ejemplo. Si el coeficiente de reflexión es r = 0.9, se requieren los primeros 68
sumandos para que el último sea aproximadamente el 0.0001 % del segundo sumando.
·
Interferencia
235
P
S
S
P
ni
nl
d
nm
(a)
(b)
Figura 3.44. Interferencia por reflexión. (a) Franjas no localizadas, (b) franjas localizadas.
de la fuente (franjas no localizadas). En (b), dos rayos paralelos son enfocados por la lente en P, por lo tanto, solo se tendrán franjas de interferencia
en el plano focal (franjas localizadas) que dependen del ángulo de los rayos
(franjas de igual inclinación).
S
S
P
P
O
S'1
S'2
( a)
S'1
S'2
(b)
Figura 3.45. Formación de las franjas por reflexión. (a) Franja circular en un plano
de observación a cierta distancia de la lámina, (b) franja circular en un plano de
observación próximo a la primera cara de la lámina.
En esta sección, vamos a considerar la formación de franjas para la configuración de la fig. 3.44(a). Con ayuda de la fig. 3.45, podemos observar
que, debido a la simetría alrededor del eje óptico (línea que pasa por S y las
fuentes virtuales), las franjas de interferencia en un plano ortogonal al eje
óptico que contiene a P son circulares. La separación entre las fuentes virtuales a = S10 S20 está dada por a = 2d tan 𝜃 t /tan 𝜃 i (eq. (3.87)) y el radio de
los anillos de interferencia está dado por la eq. (3.47), con z0 ≥ (SO + a/2).
En la fig. 3.45(a), se muestra la formación de un anillo de interferencia
en un plano de observación a cierta distancia z0 > (SO + a/2). Al cam-
236
·
Interferencia
biar la distancia z0 , cambia la escala de los anillos (fig. 3.15). En el límite,
cuando el plano de observación coincide con la primera cara de la lámina
(z0 ≈ (SO+a/2) ), las franjas tendrán el menor tamaño posible (fig. 3.45(b)).
Si la lámina presenta irregularidades en su espesor óptico (variaciones de
índice de refracción y variaciones del espesor geométrico), las franjas de
interferencia se distorsionan. En particular, si el plano de observación coincide con la primera cara de la lámina, entonces las franjas de interferencia
en ese plano permiten medir las irregularidades de la lámina con respecto
al patrón de anillos regular que se obtendría para una lámina ideal de caras
planas paralelas. Más aún, si la distancia de la fuente S a la lámina es tal que
los frentes de onda son prácticamente planos, entonces el patrón de interferencia será un mapa topográfico de espesor óptico (similar a las curvas de
nivel en los mapas geográficos). De esta manera tendremos una forma de
medir directamente la calidad óptica de la lámina.
Para ver lo que acabamos de mencionar, en la fig. 3.46 se muestra un
experimento para observar la interferencia por reflexión producida por una
lámina de vidrio (n = 1.51). En (a), se muestra el montaje completo: un
rayo láser (He-Ne, 632.8 nm), una lente de enfoque (8 mm de distancia
focal), una lámina porta objeto de microscopio (espesor 1 mm), una lente
formadora de imagen (150 mm de distancia focal y 60 mm de diámetro) y
una pantalla de observación (vidrio esmerilado). El rayo láser se enfoca con
la lente positiva para generar la fuente puntual. La luz que diverge (onda
esférica) llega a la lámina donde ocurren las dos reflexiones relevantes para
la interferencia. En (b), se muestra un detalle de la lámina a la cual se le ha
colocado una etiqueta (con la palabra “óptica”) que servirá para formar la
imagen de la lámina sobre la pantalla de observación. En (c), se muestra el
patrón de interferencia en la pantalla de observación cuando se ha retirado la
lente formadora de imagen, es decir, la luz viaja libremente desde la lámina
hasta la pantalla de observación. En (d), se observa la imagen del patrón
de interferencia que se tiene justo en la primera cara de la lámina. Para
esto, se emplea la lente formadora de imagen. En efecto, se logra ver la
imagen de la etiqueta al lado del interferograma. Ya que las franjas son no
localizadas, en (d) se tiene una versión escalada de (c). Este interferograma
muestra los defectos de la lámina que pueden ocurrir por variaciones del
índice de refracción o por irregularidades en la planitud de las caras.
Note que la apertura de la lente formadora de imagen debe ser lo suficientemente grande para recoger todos (o casi todos) los haces reflejados
en la lámina si se desea observar el interferograma completo. Si en lugar
de esta lente se coloca uno de nuestros ojos para mirar hacia la lámina, no
Interferencia
·
237
lograremos ver el interferograma, ya que el manojo de rayos que entra es
muy pequeño, limitado por nuestra pupila.
(a)
(b)
(c)
(d)
Figura 3.46. (a) Montaje experimental para ver la interferencia por reflexión en
una lámina. (b) Detalle de la lámina con una etiqueta (palabra “óptica”). (c) Interferograma sobre la pantalla de observación a unos 60 cm de la lámina, sin la lente
de imagen. (d) Imagen (formada con la lente de imagen) del interferograma que se
tiene en la primera cara de la lámina.
238
·
Interferencia
3.6. Interferencia con N fuentes puntuales
En las unidades anteriores, hemos considerado el fenómeno de interferencia por dos fuentes puntuales mediante el interferómetro de Michelson y J
fuentes puntuales con J → ∞ mediante una lámina de caras paralelas. El
resultado de aumentar el número de fuentes tendiendo a infinito y que la
contribución de cada onda en la interferencia sea relevante es el adelgazamiento de los anillos de interferencia. Si la reflectancia tiende a 1, el perfil de
las franjas tiende a una distribución de bandas muy estrechas (como deltas
de Dirac).
En esta unidad, veremos el caso intermedio: la interferencia de ondas
coherentes entre sí generadas por N fuentes puntuales (2 < N < ∞). En
particular, trataremos dos situaciones: un arreglo de fuentes separadas uniformemente en dirección axial, como en la fig. 3.47(a); y un arreglo de
fuentes separadas uniformemente en dirección transversal, como en la fig.
3.47(b). En ambos casos, vamos a suponer que las fuentes puntuales tienen
la misma amplitud y fase inicial, por lo que el campo en un punto P en la
pantalla de observación resulta ser (omitiendo el término temporal 𝜔t)
E=
E0†
N
Õ
e iks j
j=1
(3.95)
sj
SN
S3
S2
S1
sN
S1 S 2 S 3
SN
s3
s1
s3
sN
s1
z0
R1
R2
R3
R1
RN
O
(a)
P
R2
R3
RN
O
P
(b)
Figura 3.47. Arreglo de N fuentes puntuales (a) axial, (b) transversal.
La interferencia con el primer arreglo de fuentes, en cierto modo, ya la
hemos tratado en la unidad anterior. La distancia s j está determinada por la
·
Interferencia
239
eq. (3.92)
sj =
q
R 2j + 𝜌2 ,
donde R j es el radio de curvatura del frente de onda con centro en S j y
vértice en el punto O de la pantalla de observación. La distancia radial 𝜌 =
1/2
mide la separación entre O y P. Si a es la separación entre
x2 + y2
fuentes consecutivas, entonces
R j = R1 + ( j − 1)a.
N =2
-10
-5
(3.96)
N =3
0
5
-10
10
-5
N =5
0
5
-10
10
10
10
5
5
5
0
0
0
-5
-5
-5
-10
-10
-10
1.0
1.0
1.0
0.8
0.8
0.8
0.6
0.6
0.6
0.4
0.4
0.4
0.2
0.2
Irradiancia
10
0
0
2
4
6
8
10
Distancia radial, r (mm)
(a)
12
0
-5
0
5
10
0.2
2
4
6
8
10
Distancia radial, r (mm)
( b)
12
0
2
4
6
8
10
Distancia radial, r (mm)
12
( c)
Figura 3.48. Interferencia de ondas esféricas generadas por 2, 3 y 5 fuentes puntuales localizadas axialmente y separadas uniformemente una distancia a = 1000𝜆 .
La distancia de la primera fuente a la pantalla de observación es R1 = 100 mm.
En la fig. 3.48, se muestra los patrones de interferencia (y sus perfiles) normalizados cuando a = 1000𝜆 , 𝜆 = 632.8 nm, R1 = 100 mm y
N = 2, 3 y 5. Como es de esperar, al aumentar el número de fuentes, disminuye el ancho de las franjas, pero ahora hay un hecho notable: entre los
máximos de las franjas más brillantes aparecen unas franjas de mucho menor intensidad. A las primeras franjas se les denomina máximos principales
y a las segundas franjas se les denomina máximos secundarios. Lo que es un
hecho es que se tienen (N − 2) máximos secundarios entre dos máximos
principales consecutivos. A medida aumenta el número de fuentes disminuye la intensidad de los máximos secundarios y si N → ∞, los máximos
secundarios desaparecen y tendremos franjas muy estrechas (limitadas por
la difracción), como las mostradas en la fig. 3.37(c).
·
240
Interferencia
Para el segundo arreglo de fuentes puntuales (fig. 3.47(b)), los radios de
curvatura de los frentes de onda con vértice en la pantalla de observación
son iguales a z0 . Si suponemos que el arreglo lineal de fuentes está a lo largo
de la dirección x, entonces la distancia de la fuente S j al punto P será
sj =
q
N =2
-10
z02 + (x − ( j − 1)a) 2 + y 2
N =4
-5
0
5
-10
10
0
5
-10
10
10
10
5
5
5
0
0
0
-5
-5
-5
-10
-10
-10
0.8
0.8
0.8
0.2
0
0
Irradiancia
1.0
0.4
0.6
0.4
0.2
10
20
30
40
50
0
0
-5
0
5
10
x
a = 80l 0 ; z 0 = 500 mm
1.0
Irradiancia
Irradiancia
a = 8l 0 ; z 0 = 50 mm
1.0
0.6
y
N =4
-5
10
a = 8l 0 ; z 0 = 50 mm
(3.97)
0.6
0.4
0.2
10
20
30
40
50
0
0
10
20
30
x (mm)
x (mm)
x (mm)
(a)
(b)
(c)
40
50
Figura 3.49. Interferencia de ondas esféricas generadas por 2 y 4 fuentes puntuales localizadas lateralmente. En (a) y (b), la distancia de las fuentes a la pantalla
de observación es z0 = 50 mm, y estas están separadas uniformemente una distancia a = 8𝜆 . En (c), la distancia de las fuentes a la pantalla de observación es
z0 = 500 mm, y estas están separadas uniformemente una distancia a = 80𝜆 , pero
se mantiene la misma región de observación.
En la fig. 3.49, se muestra los patrones de interferencia (y sus perfiles)
normalizados para arreglos de 2 y 4 fuentes puntuales. En (a) y (b), las fuentes están separadas a = 8𝜆 y a una distancia z0 = 50 mm de la pantalla de
observación. Nuevamente, podemos ver que al pasar de 2 a 4 fuentes las
franjas principales se adelgazan y emergen 2 franjas secundarias, pero se
mantiene la posición de las franjas principales. En (c), hemos aumentado
en 10 veces las cantidades a y z0 para el arreglo de 4 fuentes, pero hemos
dejado la misma región de observación. Con esto, el patrón de interferencia cambia la forma de las franjas de hiperbólicas a líneas rectas. Ahora las
franjas principales están separadas aproximadamente la misma distancia y,
por supuesto, se sigue observando los máximos secundarios.
Interferencia
·
241
3.6.1. Aproximación con ondas planas
En el arreglo de la fig. 3.47(b), cuando la región de observación es mucho
menor que z0 , las ondas de las N fuentes cuando llegan a la pantalla de
observación se pueden aproximar por ondas planas. Esto explica por qué en
la fig. 3.49(c) las franjas se asemejan a un patrón de franjas rectas igualmente
espaciadas.
Si, además de la condición mencionada anteriormente, se tiene que la
extensión del arreglo lineal de fuentes satisface (N − 1)a z0 , entonces las
amplitudes de las N ondas en el punto P serán aproximadamente iguales y
en el denominador de la eq. (3.95) podemos cambiar s j por z0 . Limitando
el análisis a la dirección x, entonces
s
x 2 − 2( j − 1)xa + ( j − 1) 2 a2
s j = z0 1 +
,
(3.98)
z02
que en primera aproximación queda
s j = z0 +
x2
( j − 1)xa
−
.
2z0
z0
(3.99)
Con esto la eq. (3.95), se puede escribir como
E=
E0†
z0
e ikz0 e ikx
2 /2z
0
N
Õ
e −ikx ( j−1) a/z0
(3.100)
j=1
Definiendo I0 = (𝜖 0 c/2)E0†2 /z02 , la irradiancia I = (𝜖 0 c/2) (E ∗ E) es
I = I0
N
Õ
2
e −ikx ( j−1) a/z0 .
(3.101)
j=1
La suma resulta ser
N
Õ
1 − e −ikxN a/z0
,
1 − e −ikxa/z0
(3.102)
i2 sin (kxN a/2z0 )
.
i2 sin(kxa/2z0 )
(3.103)
e −ikx ( j−1) a/z0 =
j=1
lo que se puede re-escribir como
e −k (N −1) a/2z0
Finalmente, la irradiancia queda
2
sin(kxN a/2z0 )
I = I0
.
sin(kxa/2z0 )
(3.104)
242
·
Interferencia
Máximos principales. Los ceros en el denominador de la eq. (3.104) determinan la posición de los máximos principales. Estos se obtienen para
ka
x = m𝜋 ,
2z0
(3.105)
con m entero. Luego, la irradiancia en estos puntos será
I = I0
sin(N m𝜋)
sin(m𝜋)
2
.
(3.106)
Ya que tanto el denominador como el numerador para m entero son cero,
de la regla de l’hôpital se tiene que
lı́m
m→entero
sin(N m𝜋)
N cos(N m𝜋)
=
= ±N .
sin(m𝜋)
cos(m𝜋)
(3.107)
Por lo tanto,
I = N 2 I0
(3.108)
es el valor de los máximos principales que se localizan en
xm = m
𝜆 z0
.
a
(3.109)
Es decir, la separación entre máximos consecutivos resulta ser
Δx =
𝜆 z0
.
a
(3.110)
Por otra parte, en el numerador se obtienen otros ceros en medio de los
ceros del denominador, los cuales están dados por
N
ka
x = m0𝜋 ,
2z0
(3.111)
con m 0 (entero) < N , y se localizan en
xm0 =
m 0 𝜆 z0
.
N a
(3.112)
Es decir, se tendrán (N − 1) mínimos (I = 0) entre dos máximos principales
consecutivos. En consecuencia, se debe tener (N − 2) máximos secundarios
intercalados con los mínimos.
Interferencia
Irradiancia, I (I0)
25
N=2
N=3
·
243
N=5
20
15
10
5
0
0
10
20
x (mm)
30
40
50
Figura 3.50. Perfil de los patrones de interferencia de N = 2, 3 y 5, fuentes puntuales de igual amplitud y uniformemente espaciadas.
En la fig. 3.50, se muestra el perfil de los patrones de interferencia para
N = 2, 3, y 5, fuentes puntuales cuando a = 80𝜆 , z0 = 1000 mm y
𝜆 = 632.8 nm. En todos los casos suponemos que la amplitud de las fuentes
es igual, de modo que la irradiancia producida por una fuente en un punto
de la pantalla de observación es I0 .
Los resultados de la fig. 3.50 son la base de las rejillas de difracción, tema
que trataremos en el capítulo 4.
244
·
Interferencia
3.7. Interferencia con fuentes de luz
extendidas
Hasta ahora hemos mencionado la interferencia de ondas emitidas por una
fuente puntual monocromática. Esta situación es muy común en el laboratorio, en el que disponemos de fuentes láser y elementos ópticos para
formar una fuente puntual. Fuera del laboratorio, podemos observar interferencia con luz blanca (luz solar) en las pompas de jabón o en las películas
de aceite sobre agua. En ambos casos, tenemos una película delgada con un
espesor alrededor de la mitad de la longitud de coherencia de la luz. Ahora
la luz solar directa o difusa que ilumina la película delgada llega en diferentes direcciones y se puede modelar como una fuente extendida incoherente,
es decir, un conjunto de fuentes puntuales incoherentes entre sí distribuidas
espacialmente. En la fig. 3.51, se muestra el patrón de interferencia coloreado registrado con una cámara fotográfica al enfocar una película de aceite
sobre el piso húmedo en un día de lluvia.
Figura 3.51. Interferencia generada por una mancha de aceite sobre el asfalto
húmedo (agua) con la luz blanca (solar).
Para explicar la formación de las franjas de la fig. 3.51, consideremos la
fig. 3.52, en la que se muestra una lámina de caras planas paralelas de índice
nl que descansa sobre un bloque de índice nm . Una fuente extendida, representada por la curva donde está S y S0, ilumina la lámina. Vamos a analizar
Interferencia
·
245
por partes esta figura. Primero, supongamos que solo tenemos la fuente
puntual S, lo que genera un patrón de franjas no localizadas. En particular,
fijemos la atención en el patrón de interferencia que se tiene cerca de la cara anterior de la lámina, como en la fig. 3.45(b). Si cambiamos S por otra
fuente puntual S0, en forma análoga al caso de la fuente S, tendremos otro
patrón de franjas no localizadas. Si ahora dejamos las dos fuentes activas,
suponiendo que las dos fuentes son incoherentes entre sí, en P tendremos
la superposición de los patrones de interferencia generados individualmente
por cada fuente. Al añadir otras fuentes incoherentes entre sí, hasta completar la fuente extendida, el efecto de la superposición de los diferentes
patrones de interferencia será una región iluminada sin modulación de la
irradiancia por interferencia. En otras palabras, con la fuente extendida eliminamos las franjas de interferencia no localizadas que se podían observar
con una fuente puntal.
S'
S
Pantalla de
observación
L
DA
nl
ni
P'
P
nm
Figura 3.52. Franjas de interferencia con una fuente extensa.
Regresando a la situación en que solo se tiene la fuente puntual S, las
franjas de interferencia no localizadas cerca de la cara anterior de la lámina
se pueden observar formado la imagen de la lámina mediante una lente L,
como se muestra en la fig. 3.52. Si el diafragma de apertura es pequeño
(como en el ojo o en una cámara fotográfica) la región iluminada por S que
se puede observar queda limitada al punto P y su vecindad. Esta vecindad
está definida por los rayos que salen de S, inciden en la lámina y se reflejan
pasando por el diafragma de apertura. El tamaño angular de la vecindad
se define con el ángulo que subtiende la imagen virtual del diafragma de
apertura (imagen que genera la primera cara de la lámina) con respecto a la
fuente S.
246
·
Interferencia
Supongamos que la vecindad del punto P es muy pequeña, de modo
que la interferencia en P se puede explicar como la superposición del rayo
principal (línea tipo eje) reflejado en la primera cara y el rayo vecino que se
refleja en la segunda cara de la lámina, ambos saliendo de S. Rayos que salen
de S con otros ángulos no caen dentro de la vecindad de P. Si queremos ver
la interferencia en otras regiones de la lámina, necesitamos rayos que salgan
de otras fuentes. Por ejemplo, con la fuente S0 podremos observar la interferencia en P0. Y al considerar todas la fuentes puntuales que conforman la
fuente extendida podremos observar el interferograma completo, similar al
que se tiene con una sola fuente puntual (y la lente de gran apertura). Ahora el tamaño de la pantalla de observación (diafragma de campo) define la
región en que se ve el interferograma.
Por último, si las fuentes puntuales son policromáticas, cada color satisface las condiciones de interferencia, y como la posición de las franjas
depende de la longitud de onda, entonces el resultado final son franjas de
color. A medida que aumenta la longitud de onda, disminuye el tamaño de
las franjas de interferencia (eq. (3.56)).
(a)
(b)
Figura 3.53. (a) Patrones de interferencia por reflexión generados por la película
de aire entre dos láminas portaobjeto de microscopio en contacto. (a) Franjas sobre una pantalla de observación (a 25 cm de las láminas) cuando se ilumina con
una fuente puntual (longitud de onda 632.8 nm). (b) Franjas sobre las láminas en
contacto cuando se ilumina con luz blanca (solar) registradas con una cámara fotográfica.
En la fig. 3.53, se muestra las franjas de interferencia por reflexión generadas por la película de aire entre dos láminas portaobjeto de microscopio.
En (a), franjas sobre una pantalla de observación separada de las láminas
unos 25 cm cuando se ilumina con una fuente puntual (𝜆 = 632.8 nm), en
(b), franjas sobre las láminas cuando se ilumina con la luz blanca registradas
con una cámara fotográfica. Para generar la cuña de aire, se depositó una
Interferencia
·
247
gota de agua muy pequeña cerca del borde en una de las láminas, luego se
colocó la otra lámina encima de la primera y se ejerció presión mecánica
sobre las láminas, con lo que se extendió la gota de agua en una mancha.
Más allá del límite de la mancha de agua, se tiene aire y es allí donde se
observan las franjas de interferencia. Los dos patrones (a) y (b) se observan
en una dirección cercana a la normal de las láminas. Cuando se observan
las franjas de color en otro ángulo, la posición de las franjas cambia,5 como se muestra en la fig. 3.54. En (a), las franjas se observan bajo un ángulo
aproximado de 10◦ con respecto a la normal de las láminas, lo que se puede
considerar cercano a la normal. En este caso, las franjas serán básicamente
de igual espesor y las podremos emplear para hacer un mapa topográfico
de la película de aire. En (b) y (c), se inclinó la cámara fotográfica 45◦ y 70◦ ,
aproximadamente. Este cambio de tamaño de las franjas depende no solo
del cambio del camino óptico en la película con el ángulo, sino del espesor
de la lámina que está encima. En el caso de la película de aceite mostrada
en la fig. 3.51, no tenemos otro medio (distinto al aire) encima, por lo que
al cambiar el ángulo de observación el cambio del tamaño de las franjas es
menos notable.
(a) ∼ 10◦
(b) ∼ 45◦
(c) ∼ 70◦
Figura 3.54. Franjas de interferencia con luz blanca (solar) cuando se observan a
diferentes ángulos con respecto a la normal de las láminas.
Entonces, con luz que proviene de una fuente extendida policromática,
se pueden observar franjas coloreadas localizadas en la película (de aire, jabón, aceite, etc). Si se observan en dirección de la normal a la película, las
franjas serán básicamente de igual espesor.
5 La
diferencia de fase cambia de manera similar a la eq. (3.79) para rayos paralelos.
Al aumentar el ángulo de incidencia disminuye la diferencia de fase, por lo que las franjas
aumentan su tamaño.
248
·
Interferencia
3.7.1. Fuentes extendidas artificiales
La luz blanca (solar) directa y difusa son un ejemplo de una fuente extendida, en que las fuentes puntuales están prácticamente en el infinito. Una
manera de obtener una fuente extendida artificial es mediante el empleo de
un vidrio pulido (lámina difusora), esto es una lámina de vidrio a la cual se
le ha modificado una o ambas superficies lisas mediante un proceso de lijado (mediante algún abrasivo, como óxido de silicio). Con esto, la lámina se
ve como una superficie opaca translucida (como la pantalla de observación
que se usó en la fig. 3.46 para ver los interferogramas). Al iluminar el vidrio
pulido las microrugosidades de la cara lijada actúan como fuentes secundarias de luz que emiten ondas aproximadamente esféricas. La iluminación
se puede hacer con una fuente extendida (luz blanca, lámpara de filamento,
lámpara de descarga, etc.) o con una onda esférica generada con un láser.
El primer caso se suele emplear para homogenizar la iluminación. El segundo caso sirve para obtener una fuente extendida monocromática, pero
ahora las diferentes fuentes puntuales secundarias son coherentes entre sí.
La superposición de los campos generados por la multitud de estas fuentes secundarias coherentes generan un patrón de interferencia de estructura
granulada (aleatoria) conocido como patrón de speckle (moteado en español).
El tamaño promedio de las motas depende inversamente del tamaño de la
región iluminada en el vidrio esmerilado. Por lo general, cuando se quiere obtener una fuente extendida monocromática, la región de iluminación
tiene un tamaño tal que el tamaño promedio de la mota es muy pequeña, y lo que observamos es una iluminación homogénea (de gránulos muy
pequeños).
Interferómetro de Michelson con fuente extendida. Un ejemplo de la
interferencia con una fuente extendida artificial común en los laboratorios
de docencia emplea un interferómetro de Michelson y una lámina difusora
iluminada con una lámpara de descarga (usualmente lámparas de vapor de
sodio o mercurio). En estas lámparas, la mayor parte de la radiación emitida
ocurre en unas pocas líneas espectrales. Por el ejemplo, para la lámpara de
sodio, la mayor parte de la radiación está alrededor de las líneas 589.0 nm
y 589.6 nm. De ahí su color amarillo intenso.
En la fig. 3.55(a), se muestra un esquema del interferómetro de Michelson iluminado por la fuente extendida Σ (pantalla difusora iluminada por
una lámpara). La fuente Σ será una colección de fuentes puntuales incoherentes entre sí con fases iniciales aleatorias. Los espejos M1 y M2 generan
las imágenes virtuales Σ10 y Σ20 de la fuente Σ, las cuales se ven una detrás
Interferencia
·
249
de otra desde la pantalla de observación, como se muestra en la fig. 3.55(b).
Suponiendo que la longitud de coherencia de la lámpara es mayor que la separación entre Σ10 y Σ20 , las ondas emitidas por las fuentes puntuales virtuales
S10 y S20 (imágenes de la fuente puntual S en Σ) interfieren. Esto ocurre para
todas las fuentes puntuales virtuales. Pero no tendremos interferencia entre
ondas emitidas por las diferentes fuentes puntuales en Σ. En consecuencia,
sin la lente L, en la pantalla de observación no se verán franjas de interferencia. Con ayuda de la lente L, colocando el plano de obervación en el
plano focal de la lente, podremos observar franjas de interferencia de igual
inclinación. Estas franjas son el resultado de la superposición en intensidad
de los patrones generados por cada fuente puntual en Σ. Las Eqs. (3.85) y
(3.86), con nl = ni = 1, describen estas franjas.
M2
S' 2
S' 2
S' 1
S' 1
M1
O
Lámpara
S
S
BS
L
f
L
f
y
x
(a)
y
Pantalla de
observación
x
Pantalla de
observación
(b)
Figura 3.55. (a) Interferómetro de Michelson iluminado con una fuente extendida Σ. (b) Ilustración de las imágenes virtuales Σ10 y Σ20 de la fuente extendida Σ
generadas por los espejos M1 y M2 vistas desde la lente L.
Figura 3.56. Patrón de interferencia con luz blanca (solar) entre dos láminas portaobjeto de microscopio cuando se presionan entre sí con un lápiz.
250
·
Interferencia
En la fig. 3.56, se muestra la interferencia entre dos láminas portaobjeto
de microscopio cuando se presionan entre sí con la punta de un lápiz. De
acuerdo con lo expuesto en esta unidad, se propone al lector que realice una
descripción cualitativa del proceso de formación de las franjas de color y del
espesor de la película de aire entre las láminas.
Interferencia
·
251
3.8. Interferómetro de Young I
En el siglo XVIII, prevaleció la teoría corpuscular de la luz desarrollada por
Newton (1643-1727). Aunque ya se observaba un comportamiento ondulatorio de la luz, la dificultad de observar la difracción (como ya se conocía
en el sonido o en las ondas superficiales en el agua) hizo que Newton se
ocupara en desarrollar una teoría corpuscular de la luz, la cual fue aceptada gracias a la reputación científica con la que contaba Newton. Casi por
la misma época, otros científicos como Christian Huygens (1629-1695) y
Robert Hooke (1635-1703) defendían teorías ondulatorias para la luz. Un
poco antes, Francesco Grimaldi (1618-1663) observó la difracción de la luz
por pequeñas aberturas, lo cual sugería un comportamiento ondulatorio de
la luz. A pesar de estos antecedentes, no se tenía una prueba contundente
de que la teoría corpuscular de Newton fuera incorrecta. En 1803, Thomas
Young (1773-1829) realizó un experimento con el que se puso en serias
dudas la teoría corpuscular [17].
La versión moderna del interferómetro de Young se ilustra en la fig.
3.57. En la fig. 3.57(a), se muestra el esquema general. La fuente de iluminación S es una fuente (extendida) de tamaño 𝜎. A la distancia zs se encuentra la pantalla 1, la cual tiene un agujero pequeño (S0 ). Luego, a la distancia zp de la pantalla 1 se encuentra la pantalla 2 que contiene otros dos
agujeros idénticos (S1 y S2 ) separados entre sí la distancia a. Finalmente, a
la distancia z0 de la pantalla 2 se encuentra la pantalla de observación. El
tamaño de S0 determina la correlación espacial de los campos en S1 y S2 .
Si S0 es una fuente puntual, se tendrá la máxima correlación espacial entre S1 y S2 . Por otro lado, el tamaño de S1 y S2 determina la modulación
por difracción del patrón de interferencia en la pantalla de observación. El
análisis del patrón de interferencia, teniendo en cuenta la geometría de los
agujeros y el tamaño de la fuente luminosa, lo veremos en el capítulo 4.
En lo que sigue, trataremos la situación ideal en la que los agujeros son
tan pequeños que podemos suponer que en S0 se tiene una fuente puntual
primaria y en S1 y S2 dos fuentes puntuales secundarias, como se muestra
en la fig. 3.57(b). Lo usual en el experimento de Young es la simetría con
respecto al eje óptico, de modo que S1 y S2 están a la misma distancia del eje
óptico y, por lo tanto, S0 S1 = S0 S2 . Entonces, en la pantalla de observación
tendremos la superposición de los frentes de onda esféricos que divergen
de S1 y S2 . Esta situación ya se discutió en la unidad 3.3. En la fig. 3.17 se
muestran algunos patrones de interferencia cambiando la distancia entre las
fuentes S1 y S2 , y la distancia entre las fuentes y la pantalla de observación.
252
·
Interferencia
zs
zp
z0
S1
a
s
S
S0
Pantalla 1
S2
Pantalla 2
Pantalla de
observación
( a)
S1
S
S0
Pantalla 1
S2
Pantalla 2
Pantalla de
observación
(b)
P
S1
S
S0
Pantalla 1
a
x'
S2
Pantalla 2
(x,y)
( c)
Pantalla de
observación
(x',y')
Figura 3.57. Experimento de Young. (a) Geometría del experimento. En la pantalla 1, se tiene un agujero pequeño para dejar pasar parte de la luz emitida por la
fuente extendida S de tamaño 𝜎. En la pantalla 2, se tienen otros dos agujeros S1
y S2 , también pequeños, que a su vez dejan pasar parte de la luz que diverge de S0 .
En la pantalla de observación se superpone la luz que diverge de los agujeros S1 y
S2 . (b) Esquema simplificado con fuentes puntuales en S0 , S1 y S2 . (c) Geometría
para el cálculo de la diferencia de camino óptico.
Suponiendo que la fuente es monocromática con longitud de onda 𝜆
y longitud de coherencia
mayor
de camino óptico en P,
que la diferencia
es decir, lc > S0 S2 + S2 P − S0 S1 + S1 P = S2 P − S1 P (fig. 3.57(c)),
los máximos de irradiancia en la pantalla de observación a lo largo de la
Interferencia
·
253
dirección x 0 están dados por
s
xm0 =
m𝜆
2
4z02
a2 − m2 𝜆 2
+ 1,
(3.113)
de acuerdo con la eq. (3.48), cambiando y0 → z0 y zm → xm0 . El parámetro
m etiqueta las franjas de interferencia. Así, m = 0 corresponde con la franja
central, m = 1, 2, 3, ... a las franjas al lado derecho (izquierdo) de la franja
central según su orden y m = −1, −2, −3, ... a las franjas al lado izquierdo
(derecho) de la franja central según su orden. En el experimento de Young,
se satisface que z0 a 𝜆 . Si la región en que se observa el interferograma tiene una extensión mucho menor que z0 , las franjas que se observan son
franjas paralelas uniformemente espaciadas (como en la imagen de la derecha en la fig. 3.17 cuando la separación entre las fuentes y la pantalla de
observación es 200 mm y a = 32𝜆 ). En este caso, la posición de la m-ésima
franja se puede obtener haciendo las aproximaciones correspondientes en
la eq. (3.113), es decir,
z0 𝜆
xm0 = m
,
(3.114)
a
y la separación entre dos franjas consecutivas será
Δx 0 =
z0 𝜆
.
a
(3.115)
Estos resultados (eqs. (3.114) y (3.115)) también los obtuvimos en la
unidad 3.6 (eqs. (3.109) y (3.110)), en la que hemos aproximado los frentes
de onda esféricos por frentes de onda planos, aproximación que también se
satisface en el experimento de Young. Con esto en mente, la irradiancia en
la pantalla de observación en el experimento de Young estará dada por la
eq. (3.104) con N = 2, esto es,
I = I0
sin(kx 0 a/z0 )
sin(kx 0 a/2z0 )
2
(3.116)
2
con I0 = (𝜖 0 c/2)E0† /z02 , donde E0† es la amplitud del campo (por unidad
de longitud) de las fuentes S1 y S2 . Empleando la identidad trigonométrica
sin(2𝛼) = 2 sin 𝛼 cos 𝛼 en el numerador de la eq. (3.116), se llega a
I = 4I0
𝜋a 0
cos
x
z0 𝜆
2
.
(3.117)
Otra manera aproximada para determinar la irradiancia se obtiene directamente de la fig. 3.57(c). Teniendo en cuenta la condición z0 a, el
254
·
Interferencia
campo en P debido a S1 será E1 (P) = (E0† /z0 )e iks1 y el campo en P debido
a S2 será E2 (P) = (E0† /z0 )e iks2 . Por lo tanto, la irradiancia en P, dada por
I = (𝜖 0 c/2) |E1 (P) + E2 (P)| 2 , queda
I = 2I0 [1 + cos (k(s2 − s1 ))] .
Aproximando s2 − s1 ≈ a𝛼 ≈ ax 0/z0 , se llega a
2𝜋 a 0
x
I = 2I0 1 + cos
𝜆 z0
(3.118)
(3.119)
lo que es equivalente a la eq. (3.117).
3.8.1. División de frente de onda y división de
amplitud
En el interferómetro de Young, tenemos un hecho notable en cuanto a la
forma de generar las dos fuentes secundarias S1 y S2 en comparación con el
interferómetro de Michelson. En el interferómetro de Michelson (al igual
que en la lámina de caras paralelas), las fuentes secundarias son imágenes
virtuales de una fuente primaria, obtenidas mediante el divisor de haz y los
espejos M1 y M2 , fig. 3.18. El divisor de haz divide la amplitud de la onda
incidente (en una onda reflejada y en una onda transmitida). A los interferómetros basados en este principio, también se les denomina interferómetros de
división de amplitud. En cambio, en el interferómetro de Young, las fuentes
secundarias S1 y S2 se obtienen aislando regiones del frente de onda emitido por la fuente primaria S0 . Se dice entonces que las fuentes secundarias
se obtienen mediante la división del frente de onda. A los interferómetros
basados en este principio, también se les denomina interferómetros de división
de frente de onda.
En los interferómetros de división de amplitud, las fuentes secundarias
son copias de la fuente primaria, por lo que la interferencia entre las ondas
secundarias depende de la correlación temporal de los campos que se superponen. Si el retraso temporal entre las ondas es mayor que el tiempo de
coherencia (fig. 3.6) no se observará interferencia. En el caso de los interferómetros de división de frente de onda, la interferencia también depende
de la similitud espacial de los campos ópticos en S1 y S2 . La correlación espacial de los campos en S1 y S2 mide la coherencia espacial de las ondas. En
particular, en el interferómetro de Young, el tamaño de la región de observación del interferograma suele ser tal que para cualquier punto P dentro
de la región, la longitud de coherencia es mayor que la diferencia de camino óptico, por lo que la coherencia de las ondas que interfieren queda
Interferencia
·
255
determinada básicamente por la correlación espacial de los campos en S1 y
S2 . Así que la coherencia presenta dos aspectos, uno temporal y otro espacial, que se pueden medir con ayuda del interferómetro de Michelson y del
interferómetro de Young, respectivamente.
256
·
Interferencia
3.9. Otros interferómetros
Podemos decir que un interferómetro es un sistema óptico que divide en
amplitud o en frente de onda una onda primaria en dos o más ondas secundarias, y luego, después de que las ondas secundarias han recorrido diferentes caminos ópticos, estas se superponen para observar un patrón de
interferencia. La geometría de las franjas da cuenta de algunos parámetros
del sistema interferométrico, por ejemplo, calidad de las superficies ópticas, la homogeneidad del vidrio óptico (variación del índice de refracción),
curvaturas de las superficies, etc.
En esta unidad, describiremos brevemente algunos interferómetros diferentes a los interferómetros de Michelson y Young.
3.9.1. Interferómetro de Fabry-Perot
Figura 3.58. Interferómetro de Fabry-Perot básico. Consta de dos planos ópticos
de vidrio semiplateados en una de las caras, de un anillo espaciador (∼ 0.5 mm de
espesor) y de un soporte cilíndrico que ajusta el sistema de espejos con el espaciador
en medio.
En la fig. 3.58, se muestra un sistema conformado por dos espejos planos,
un anillo espaciador de unos 0.5 mm de espesor y un soporte cilíndrico.
Los espejos son láminas gruesas de vidrio (en forma de cuña) con un recubrimiento metálico (aluminio) en una de sus caras para producir alta reflectancia (0.9 < r < 1). El anillo espaciador se coloca en medio de los dos
espejos (en contacto con sus caras metalizadas) garantizando una distancia
fija entre los espejos. El conjunto de espejos y anillo se coloca dentro del so-
Interferencia
·
257
porte cilíndrico y se ajusta. Este dispositivo se conoce como interferómetro
de Fabry-Perot, en su forma más simple. El funcionamiento del interferómetro se explica con lo que ya hemos desarrollado para la lámina de caras
paralelas, pero ahora nl = 1 (aire en medio de los espejos).
En la fig. 3.59(a), tenemos un esquema de un montaje experimental para observar simultáneamente las franjas de interferencia (no localizadas) por
reflexión y transmisión con el interferómetro de Fabry-Perot de la fig. 3.58.
Un haz láser se enfoca en el centro de un agujero de unos 3 mm de diámetro localizado en una pantalla opaca (pantalla 1). Allí tendremos la fuente
puntual S. El frente de onda esférico divergente se transmite y se refleja
múltiples veces en las láminas del interferómetro. En las figs. 3.59(b) y (c),
se muestran los interferogramas que se ven por reflexión en la pantalla 1 y
por transmisión en la pantalla 2, respectivamente. En (b), el punto oscuro
corresponde con agujero en que se ubica la fuente puntual. En efecto, los
dos interferogramas se complementan entre sí (como en las figs. 3.37(c) y
3.38(c)).
Láser
S
Interferómetro
Fabry-Perot
Pantalla 1
Pantalla 2
(a)
(b)
(c)
Figura 3.59. (a) Sistema óptico para observar simultáneamente la interferencia
por reflexión y por transmisión. (b) Interferograma por reflexión en la pantalla 1.
(c) Interferograma por transmisión en la pantalla 2.
258
·
Interferencia
Interferómetro de Fabry-Perot como cavidad resonante
Una aplicación de gran importancia del interferómetro de Fabry-Perot se
encuentra en los láseres en los que el interferómetro es la cavidad resonante. Para ver esto, consideremos la fig. 3.34 en la que se muestra que para
r = 0.96 se obtiene una irradiancia transmitida en bandas muy estrechas.
Esta gráfica está en función del espesor de la lámina. Sin embargo, si se
deja fijo el espesor de la lámina y se dibuja la irradiancia en función de la
frecuencia de la onda, se obtiene una gráfica similar, ya que la fase dada
en la eq. (3.79) también depende linealmente de la frecuencia 𝜈 = c/𝜆 . Es
decir, para reflectancias muy altas de los espejos tendremos que la irradiancia transmitida solo ocurre en bandas de frecuencia muy estrechas, lo que
explica el alto grado de monocromaticidad de los láseres.
En este libro no abordaremos los detalles de este interferómetro como
cavidad resonante, los cuales se pueden consultar en obras especializadas
sobre láseres [18]. También se puede tener un primer acercamiento al tema
consultando libros de óptica básica [3].
3.9.2. Película delgada antirreflectiva
Una aplicación de la interferencia en una lámina de caras paralelas la encontramos en los recubrimientos antirreflectivos. El sistema más simple consiste en una lámina de caras paralelas cuyo espesor es del orden de la longitud
de onda, denominada película delgada, sobre otra lámina de caras paralelas,
denominada sustrato, como se ilustra en la fig. 3.60.
E0
n
nd
n'
E r1
E r2
Película delgada
Sustrato
Figura 3.60. Película delgada sobre un sustrato. Cuando el espesor de la película
es d = 𝜆 /4nd , Er1 y Er2 interfieren destructivamente.
El campo reflejado en la primera cara es Er1 = r1 E0 y en la segunda es
Er2 = t1 r2 t10 E0 . Así, el campo total reflejado (omitiendo la reflexión en la
Interferencia
·
259
base del sustrato) será,
Er = r1 E0 + t1 r2 t10 E0 e i𝛿
donde
𝛿=
4𝜋nd
d.
𝜆
La irradiancia reflejada será
Ir = I0 R,
con I0 = (𝜖 0 c/2)E02 y la reflectancia
R = r12 + (t1 t10 r2 ) 2 + 2r1 t1 t10 r2 cos 𝛿.
A incidencia normal, los coeficientes de reflexión y transmisión (para el
estado de polarización paralelo) son
r1 =
nd − n
n 0 − nd
2nd
2n
; r2 = 0
; t0 =
.
; t1 =
nd + n
n + nd
nd + n 1 nd + n
En la práctica, es común usar el MgF2 (fluoruro de magnesio), cuyo índice es nd = 1.38, para la película delgada. Si esta película está depositada
sobre un sustrato de vidrio (n 0 = 1.5) y n = 1 (aire), se tiene la relación
n < nd < n 0, por lo que la reflectancia obtiene un valor mínimo cuando
𝛿 = 𝜋, es decir el espesor de la película debe ser
d=
𝜆
.
4nd
Con un poco más de trabajo, se encuentra que el mínimo toma el valor de
cero si se satisface la condición
nd2 = n 0 n.
Por ejemplo, para el sustrato de vidrio la película delgada debería tener un
índice de 1.22, algo más bajo que el de MgF2 .
3.9.3. Interferómetro de Newton y Fizeau
En general, cualquier arreglo de dos superficies ópticas en contacto iluminadas con luz monocromática se denomina interferómetro de Newton [19].
El nombre dado a este tipo de interferómetros viene de los primeros experimentos reportados por Newton [2] al colocar en contacto un par de lentes
para telescopio. En este experimento, Newton observa franjas circulares coloreadas con centro en la región de contacto. Algo similar a esto es lo que se
260
·
Interferencia
muestra en la fig. 3.56, en la que el centro de las franjas coloreadas está en
la punta del lápiz. A estas franjas circulares también se les denomina anillos
de Newton.
Imagen
LI
Lámpara
S
BS
Lente de prueba
1 2
Plano óptico
Figura 3.61. Montaje para observar los anillos de Newton generados por la cara
curva de la lente en contacto con el plano óptico.
El montaje básico para observar los anillos de Newton se muestra en la
fig. 3.61. Una lente de caras esféricas se coloca sobre un plano óptico de
referencia (error pico-valle 𝜆 /100). Las superficies en contacto, superficie
esférica 1 y superficie plana 2, forman una película de aire. Para iluminar
las superficies en contacto, se emplea una fuente extendida monocromática
(lámpara de descarga de mercurio). El patrón de interferencia que se forma
por la superposición de las ondas reflejadas externamente en el plano óptico
(superficie 2) e internamente en la lente (superficie 1) se observa con ayuda
de una lente formadora de imagen LI. Con este montaje, se examina la
calidad de la superficie curva de la lente que está en contacto con un plano
óptico de referencia. Si la cara de la lente es esférica, se tendrá un patrón
de interferencia formado por anillos circulares. El radio del m-ésimo anillo
brillante está dado por
𝜌m =
p
(m + 1/2)𝜆 R,
(3.120)
y el radio del m-ésimo anillo oscuro será
√
𝜌 m = m𝜆 R,
(3.121)
Interferencia
·
261
donde R es el radio de curvatura de la superficie esférica 1 y m = 0, 1, 2, ...
Se deja como tarea deducir las eqs. (3.120) y (3.121). Note que ahora la
franja central se etiqueta con m = 0 (en donde está la región de contacto),
mientras que para las franjas generadas por dos fuentes virtuales como en
la fig. 3.16 el valor de m para la franja central depende del cociente entre la
separación de las fuentes virtuales y la longitud de onda.
El montaje de la fig. 3.61 también se puede usar para evaluar la calidad
de las superficies planas de otros elementos ópticos (lentes, planos, prismas).
Por ejemplo, en el proceso de pulido de las superficies planas de un prisma, fig. 3.62(a), se puede verificar la calidad de las superficies colocando la
superficie que se desea evaluar en contacto con el plano óptico del interferómetro de Newton de la fig. 3.61. En la fig. 3.62(b), se muestra el patrón
de franjas que se obtiene para la superficie diagonal de uno de los prismas
de la fig. 3.62(a). Ya que las franjas son de igual espesor, se puede tener un
mapa de la topografía de la superficie bajo análisis.
(a)
(b)
Figura 3.62. (a) Pulido de las superficies diagonales de dos prismas rectos. (b)
Franjas de interferencia generadas por la superficie diagonal de uno de los prismas
en (a) cuando se pone un contacto con el plano óptico de referencia del interferómetro de Newton.
En general, la superficie de referencia debe tener una forma similar a
la superficie que se desea evaluar mediante las franjas de interferencia. Si
la forma de las dos superficies difiere en un gran número de longitudes de
onda, se tendrán muchas franjas y no se podrán resolver con el sistema formador de imagen.
Si en la práctica no es posible colocar en contacto las dos superficies, se
puede hacer una variación al sistema óptico de la fig. 3.61, como se muestra
en la fig. 3.63 (interferómetro de Fizeau). La fuente de iluminación debe
tener una longitud de coherencia mayor a dos veces la separación t entre el
plano óptico de referencia y la superficie de prueba. Así que lo común es
262
·
Interferencia
emplear un haz láser enfocado en S. Las franjas de interferencia serán de
igual espesor.
2 Plano óptico
Imagen
1 Superficie de
Lente
colimadora
prueba
LI
BS
t
S (Láser)
Figura 3.63. Esquema del interferómetro de Fizeau para evaluar una superficie
de prueba que está separada una distancia t del plano óptico de referencia.
Capítulo
cuatro
Difracción
Difracción
·
265
Figura 4.1. Imagen experimental de una fuente puntual monocromática generada
por un sistema óptico con astigmatismo, aberración esférica y un desenfoque.
La difracción, al igual que la interferencia, es un fenómeno de naturaleza
ondulatoria. Desde el punto de vista matemático, la diferencia entre la interferencia y la difracción está en el número de fuentes que generan las ondas
que interfieren. En la interferencia, se tiene un número discreto de fuentes,
mientras que en la difracción, se tiene un número continuo de fuentes. En
cuanto al comportamiento del campo luminoso, la difracción se ve como la
desviación de la trayectoria rectilínea (de la luz) que no se debe a la reflexión
o a la refracción.
En este capítulo, veremos la difracción limitándonos al rango paraxial,
es decir, difracción de Fresnel y difracción de Fraunhofer. Trataremos en
detalle los ejemplos de la difracción por una abertura circular y por una
abertura rectangular. Con la primera, podremos analizar la formación de
imagen cuando se tiene en cuenta la naturaleza ondulatoria de la luz, con la
segunda, desarrollaremos la matemática básica para las rejillas de difracción
unidimensionales.
En la fig. 4.1, se muestra la imagen de un objeto puntual (monocromático) generada por un sistema óptico que modela un ojo humano con miopía,
astigmatismo y aberración esférica. El efecto de la difracción y las aberraciones reduce la agudeza visual en el ojo humano y, en general, reduce la
resolución en los sistemas formadores de imagen.
Nota sobre los patrones de difracción calculados
Los patrones de difracción calculados se muestran como imágenes en niveles de gris, y con el propósito de resaltar las regiones de menor intensidad
en lugar de mostrar la distribución de irradiancia, mostraremos la raíz cuadrada de la distribución de irradiancia, excepto en la sección acerca de la
266
·
Difracción
resolución de la imagen en la unidad 4.5. Para el caso de las gráficas de los
perfiles de irradiancia, estos sí se muestran en su escala real.
Difracción
·
267
4.1. Principio de Huygens-Fresnel
El principio de Huygens, enunciado en la sección 1.1.3, reza “cada punto en
un frente de onda se puede considerar como una fuente de ondas esféricas
secundarias que se propagan con la misma velocidad que el frente de onda.
Al cabo de un tiempo, el frente de onda propagado será la envolvente de
las ondas esféricas secundarias” [3]. Con este principio, se puede deducir
la propagación (sin obstrucción) de un frente de onda, como se muestra en
la fig. 4.2, donde se obtiene Σ0 a partir de Σ, y también se puede deducir
correctamente la ley de la reflexión y la ley de la refracción (fig. 1.8). Por otra
parte, Fresnel establece que el campo óptico en un punto P se obtiene de la
interferencia de las ondas secundarias [20]. De esta manera Fresnel da una
explicación satisfactoria al fenómeno de la difracción. A la combinación del
principio de Huygens y la interferencia de las ondas secundarias de Fresnel
se le denomina principio de Huygens-Fresnel.
S'
S
P
Ondas esféricas
secundarias
Figura 4.2. El principio de Huygens-Fresnel establece que el campo en P es la
superposición (interferencia) de las ondas esféricas secundarias emitidas por las
fuentes virtuales localizadas en el frente de onda Σ.
La formalización matemática del principio de Huygens-Fresnel será realizada un siglo después por Kirchhoff y refinada después por Rayleigh y
Sommerfeld [21]. Si bien el estudio de la difracción se puede iniciar a partir del formalismo matemático de Kirchhoff, vale la pena seguir las ideas de
Fresnel para obtener una mayor comprensión conceptual de la difracción.
El tratamiento que seguiremos se describe en el libro de Born & Wolf [22].
Vamos a comenzar por la situación más simple: la propagación en el
vacío de un frente de onda esférico emitido por una fuente puntual. En
la fig. 4.3, se tiene una fuente puntual S. De acuerdo con la expresión del
campo para una onda esférica, omitiendo el término de fase temporal e −i𝜔t ,
268
·
Difracción
el campo en el punto P será
E(P) = E0†
e ikd
,
d
(4.1)
donde d = SP y E0† es la amplitud del campo multiplicada por la unidad de
longitud.
Q
c
r0
S
s
q
V
P
S
Figura 4.3. Propagación de una onda esférica. La contribución de la fuente secundaria Q al campo en P depende del ángulo 𝜒 .
Si empleamos el principio de Huygens-Fresnel para calcular el campo
en P, se debe tener el mismo resultado de la eq. (4.1). Sea Σ el frente de onda esférico de radio r0 emitido por la fuente puntual S en un tiempo dado.
Partiendo de este frente de onda, las fuentes que emiten las ondas secundarias de Fresnel estarán localizadas en los puntos que conforman Σ. En
particular, en el punto Q del frente de onda Σ tendremos un emisor secundario cuya contribución al campo en P será de la forma E(Q)e iks /s, donde
E(Q) = E0† e ikr0 /r0 . En la suma de todas las ondas secundarias (infinitas),
para obtener E(P), se incluye otra hipótesis de Fresnel: la amplitud de las
ondas secundarias varía con la dirección definida por el ángulo 𝜒 , el cuál
es el ángulo entre la normal del frente de onda Σ en Q y la línea que une
Q con P, fig. 4.3. Por lo tanto, la amplitud de las ondas secundarias será de
la forma E(Q)K ( 𝜒 ), donde K ( 𝜒 ) es la función que determina la manera
como ocurre la variación de la amplitud. El ángulo 𝜒 se denomina ángulo de
inclinación y la función K se denomina factor de inclinación. Con la función
K, se describe la hipótesis de Fresnel: “ya que el impulso comunicado en
cualquier parte del frente de onda primario Σ sigue la normal del frente de
onda, el efecto sobre el medio (éter) tiene que ser más intenso en la dirección
de la normal, por lo que los rayos de Q a P serán menos intensos a medida
Difracción
·
269
que se desvían de la normal”.1 Fresnel menciona que la investigación para
conocer la forma explícita de la función K es un “asunto muy difícil” pero
eso no es un problema, ya que en muchas situaciones prácticas los rayos de
Q a P se desvían poco de la normal, de modo que se puede dejar un valor constante para la función K. Siguiendo a Fresnel, K es máximo cuando
𝜒 = 0 y se anula cuando la línea de Q a P es tangente al frente de onda Σ,
es decir, 𝜒 = 𝜋/2. Esto implica que no todo el frente de onda esférico Σ
contribuye a la suma en P. La validez de estas condiciones se considerará
más adelante con el tratamiento analítico desarrollado por Kirchhoff. De
acuerdo con lo anterior, el campo en P estará dado por
E(P) =
E0† e ikr0
r0
∫ ∫
Σ
e iks
K ( 𝜒 )d𝜎 ,
s
(4.2)
donde d𝜎 describe el elemento diferencial de área en Q. Esta integral es la
versión matemática del principio de Huygens-Fresnel.
4.1.1. Zonas de Fresnel
La integral de Huygens-Fresnel se puede resolver dividiendo el dominio en
regiones en que el factor de inclinación se puede aproximar por una constante. Este procedimiento propuesto por Fresnel da resultados sorprendentes, los cuales ocurren en la práctica, como veremos más adelante. Las regiones en las que se divide el dominio se denominan zonas de Fresnel y
para el frente de onda esférico se construyen como se muestra en la fig. 4.4.
Desde el punto P se trazan esferas de radio b + j𝜆 /2, con j = 0, 1,..., N
y b = VP (luego, d = r0 + b). La j-ésima zona (Z j ) es la región anular de Σ
contenida entre las esferas de radio b + ( j − 1)𝜆 /2 y b + j𝜆 /2.
Si b 𝜆 y r0 𝜆 , entonces en el factor de inclinación se realizan las
siguientes aproximaciones:
- K ( 𝜒 ) ≈ constante, para una zona dada de Fresnel, y cambia muy
poco entre zonas consecutivas.
- K j ( 𝜒 ) ≈ K j+1 ( 𝜒 ) + K j−1 ( 𝜒 ) /2.
Además, se tiene que
1 El texto entre comillas es una versión personal (traducida al español) del tercer párrafo
del texto que está en la página 115 del libro Great Experiments in Physics, editado por Morris H. Shamos, editorial Dover (1987), en el que se presenta la versión en inglés del texto
original de Fresnel sobre la difracción.
270
·
Difracción
- KN ( 𝜒 ) = 0, si 𝜒 = 𝜋/2.
Z4
Z3
Z2
Z1
r0
V
S
b
b+l/ 2
b+l
b+3l/ 2
b+2l
b+5l/ 2
P
b+3l
S
Figura 4.4. Zonas de Fresnel en un frente de onda esférico.
De la geometría de la fig. 4.3, se tiene que
s2 = r02 + (r0 + b) 2 − 2r0 (r0 + b) cos 𝜃 ,
con 𝜃 el ángulo polar. Diferenciando parcialmente, entonces
2sds = 2r0 (r0 + b) sin 𝜃d𝜃 .
Como el elemento diferencial d𝜎 = r02 sin 𝜃d𝜃d𝜙, con 𝜙 el ángulo azimutal,
reemplazando sin 𝜃d𝜃, se tiene que
d𝜎 =
r0
sdsd𝜙.
(r0 + b)
(4.3)
Teniendo en mente los anteriores resultados, la integral de difracción
(eq. (4.2)) se puede aproximar como
E(P) =
N
Õ
E j (P),
(4.4)
j=1
donde
E j (P) =
E0† e ikr0
r0
b+
∫j𝜆 /2
2𝜋K j
b+( j−1)𝜆 /2
e iks r0
sds,
s (r0 + b)
(4.5)
Difracción
·
271
donde se ha usado la aproximación K j ( 𝜒 ) = K j (constante para la j-ésima
zona). Evaluando la integral de la eq. (4.5), el campo óptico en P será
E(P) =
N
Õ
E j (P) = i2𝜆
j=1
N
E0† e ikd Õ
d
(−1) j+1 K j .
(4.6)
j=1
Así que el valor de la integral depende de la suma de los factores de inclinación en cada zona de Fresnel. Al tener en cuenta la segunda aproximación
sobre el valor medio del factor de inclinación de las zonas adyacentes para
una zona dada, es decir, K j ( 𝜒 ) = K j+1 ( 𝜒 ) + K j−1 ( 𝜒 ) /2. La suma
N
Õ
(−1) j+1 K j = K1 − K2 + K3 − K4 + ... + (−1) N +1 KN
(4.7)
j=1
se puede escribir como
N
Õ
(−1)
j+1
Kj
j=1
K1
K3
K1
+
+
− K2 +
=
2
2
2
KN /2
;N
+
KN −1 /2 − KN ; N
K3
K5
+ ...(4.8)
− K4 +
2
2
→ impar
→ par
Ya que el promedio de las zonas adyacentes a la zona Z j es aproximadamente igual al valor de la zona Z j , la suma se reduce a
N
Õ
j=1
(−1)
j+1
K1 KN
Kj =
±
→
2
2
+ ; N → impar
.
− ; N → par
(4.9)
Por lo tanto,
E0† e ikd K1 KN
±
E(P) = i2𝜆
,
d
2
2
o bien
(4.10)
1
[E1 (P) ± EN (P)] .
(4.11)
2
Cuando el frente de onda Σ se propaga sin ser obstruido, el número total
de zonas N se obtiene cuando 𝜒 = 𝜋/2 y EN (P) = 0. El campo en P resulta
ser
1
E(P) = E1 (P).
(4.12)
2
Teniendo en cuenta el resultado de la eq. (4.1) para E(P) y la expresión
del campo para la primera zona E1 (P) = i2𝜆 K1 E0† e ikd /d, la eq. (4.12) se
satisface si
i
e −i 𝜋/2
K1 = − =
.
(4.13)
𝜆
𝜆
E(P) =
·
272
Difracción
De esta manera se puede encontrar el valor explícito del factor de inclinación para la primera zona.
4.1.2. Resultados del tratamiento de Fresnel
La eq. (4.12) se puede interpretar como se muestra en la fig. 4.5. En (a), se
tiene la propagación libre del frente de onda Σ; en (b) se tiene el frente de
onda obstruido por una abertura circular que deja pasar el campo limitado
por la mitad de la primera zona de Fresnel. En ambos casos, el campo en P
estará dado por E0† e ikd /d y la irradiancia por I (P) = I0 = (𝜖 0 c/2) (E0† /d) 2 .
Desde el punto de vista de la óptica geométrica, el resultado no depende
del radio de la abertura, ya que la energía que llega a P se propaga a lo largo
del rayo que une S con P. Por lo que la irradiancia en P corresponde con
lo esperado. Entonces, ¿cuál es la ganancia del tratamiento ondulatorio de
Fresnel?
Abertura
circular
S
P
S
S
P
S
(a)
(b)
Figura 4.5. El campo en P debido a la libre propagación del frente de onda esférico
(a) es igual al campo limitado por una abertura circular que deja pasar solo el campo
correspondiente con la mitad de la primera zona de Fresnel (b).
En el tratamiento de Fresnel, el campo en P, sí depende del tamaño de
la abertura. Consideremos los siguientes casos:
- Abertura para N = 1. Si el radio de la abertura es tal que deja pasar
el campo limitado por la primera zona de Fresnel, de la eq. (4.6),
tenemos que
E † e ikd
E(P) = i2𝜆 0
K1 .
d
Luego, la irradiancia en P será
I (P) = 4I0 .
Este resultado ya no es predecible por la óptica geométrica. El aumento de la irradiancia al aumentar el radio de la abertura parece
Difracción
·
273
razonable. Sin embargo, el tratamiento de Fresnel también nos dice que no siempre es así, pues un aumento adicional del radio de la
abertura disminuye la irradiancia, incluso a cero.
- Abertura para N = 2. Si el radio de la abertura aumenta de tal modo
que la abertura coincide con el borde externo de la segunda zona de
Fresnel, de la eq. (4.6), tenemos que
E(P) = i2𝜆
E0† e ikd
d
[K1 − K2 ] .
Teniendo en cuenta la hipótesis de Fresnel, que el factor de inclinación cambia muy poco entre zonas consecutivas, entonces K1 ≈ K2 .
Luego la irradiancia en P será
I (P) ≈ 0.
Este resultado sorprende aún más, pero se explica al considerar la interferencia. Grosso modo, podemos decir que el campo en la segunda
zona está desfasado en 𝜋 con respecto al campo de la primera zona.
Esto gracias a la manera como se han construido las zonas de Fresnel:
con esferas cuyos radios aumentan en 𝜆 /2.
Con base en los resultados anteriores, podemos anticipar que cuando
la abertura deja pasar M zonas de Fresnel, donde M es impar, las zonas
consecutivas agrupadas por parejas se cancelan y la irradiancia en P estará
dada solo por la zona restante (I ∼ 4I0 ). Y cuando la abertura deja pasar
M zonas de Fresnel, donde M es par, las zonas consecutivas agrupadas por
parejas se cancelan y la irradiancia en P será nula (I ∼ 0).
- Disco opaco para N = 1. Otra situación que llama la atención se da
si en lugar de una abertura en una pantalla opaca, como la mostrada
en la fig. 4.5(b), se coloca un disco opaco cuyo radio sea igual al borde
de la primera zona, como en la fig. 4.6. Entonces, se bloquea el paso
del campo limitado por la primera zona de Fresnel y se deja pasar el
campo desde la segunda zona de Fresnel (hasta la última zona donde
𝜒 = 𝜋/2). Ahora el campo en P será
E(P) =
1
1
E1 (P) − E1 (P) = − E1 (P).
2
2
Y se tiene que la irradiancia en P será
274
·
Difracción
I (P) = I0 .
En otras palabras, en P tendremos un punto brillante aun cuando se bloquee
el rayo que va de S a P. Este punto se denomina punto de Poisson.2
Disco
circular
P
S
S
Figura 4.6. Punto de Poisson. A pesar del disco circular que obstaculiza la propagación de la luz dentro de la primera zona de Fresnel, detrás del obstáculo se tiene
un punto luminoso en P.
- Placa zonal de Fresnel. Por último, consideremos la situación en la
que se bloquea solo las zonas pares o impares. Ya que dos zonas consecutivas tienen un desfase de 𝜋 y cada dos zonas estarán en fase (desfase
de 2𝜋), entonces, un obstáculo con aberturas equivalentes a las zonas
anulares pares o impares eleva considerablemente el valor de la irradiancia en el punto P. En la fig. 4.7, se ilustra esta situación: (a) placa
zonal bloqueando zonas pares, (b) placa zonal bloqueando zonas impares.
En ambos casos, si se deja pasar M zonas, el campo en P se aproxima
por E(P) ≈ M E1 (P), luego la irradiancia será
I (P) = 4M 2 I0 .
2 El
tratamiento de Fresnel predice que detrás de un obstáculo se puede tener luz. Este
hecho, anotado por Poisson como algo equivocado, en efecto ocurre.
Difracción
S
·
275
P
S
(a)
S
P
S
( b)
Figura 4.7. Placas zonales de Fresnel para bloquear (a) zonas pares y (b) zonas
impares.
P
S
S
Figura 4.8. La plaza zonal de fase aprovecha todo el campo óptico de Σ y hace
interferir constructivamente los campos contenidos en las zonas pares e impares
de Fresnel.
Una mejora adicional a la placa zonal se logra si en lugar de bloquear
zonas pares o impares se introduce un desfase de 𝜋 en las zonas pares o las
zonas impares. Lo anterior se puede hacer depositando sobre un sustrato de
vidrio una película delgada de material transparente cuyo espesor óptico sea
igual 𝜆 /2. La película delgada se deposita solo en las regiones anulares que
corresponden con las zonas pares o impares de Fresnel. Para esto se emplea
una máscara que obstruya el depósito del material (como en un proceso
litográfico).
276
·
Difracción
En la fig. 4.8, se muestra una placa zonal de fase de Fresnel para las zonas
pares. De este modo se aumenta aún más la irradiancia en P. El aumento
de la irradiancia en P ocurre a expensas de la disminución de la irradiancia
en los puntos vecinos a P, garantizando la conservación de la energía.
Difracción
·
277
4.2. Integral de difracción
La difracción implica encontrar el campo óptico en cualquier punto del espacio generado por una fuente con unas condiciones de frontera. La geometría usual en la difracción se ilustra en la fig. 4.9. En la región I, se localiza
la fuente S (puntual o extendida); en la región II, se tiene el volumen limitado por la superficie cerrada Σ = Σ1 +Σ2 , en la que interesa medir el campo
óptico. La región II se denomina región de difracción. La superficie Σ1 que
separa las regiones I y II es una superficie opaca con aberturas que permiten
el paso de parte del campo óptico emitido por la fuente S.
S1
S
I
II
S2
Figura 4.9. Geometría general en el problema de difracción.
Una primera aproximación al problema de encontrar el campo óptico en
la región de difracción consiste en resolver la ecuación de onda homogénea
para el campo óptico escalar (sin tener en cuenta la polarización). Partiendo
de una onda monocromática
E 0 (x, y, z, t) = E(x, y, z)e −i𝜔t ,
(4.14)
de la ecuación de onda en el vacío (eq. (2.5,)) se tiene que
(∇2 + k 2 )E = 0,
(4.15)
con k = 𝜔/c = 2𝜋/𝜆 . Para determinar E en cualquier punto de la región
de difracción, se puede hacer uso del teorema de Green, el cual a su vez se
deduce del teorema de Gauss. El teorema de Gauss establece que si F es una
función vectorial de la posición, entonces
∬
∭
F · n̂d𝜎 =
∇ · Fdv,
(4.16)
Σ
V
donde n̂ es el vector unitario normal a la superficie cerrada Σ (hacia afuera),
V es el volumen encerrado por la superficie y d𝜎 y dv denotan los elementos
278
·
Difracción
diferenciales de área y volumen, respectivamente. Si la función F se puede
obtener como
F = E∇U ,
(4.17)
donde E y U son funciones escalares definidas en Σ y V , entonces
∬
∭ (E∇U · n̂) d𝜎 =
E∇2U − ∇E · ∇U dv.
Σ
Si se intercambian E y U , se llega a una relación similar
∬
∭ (U ∇E · n̂) d𝜎 =
U ∇2 E − ∇U · ∇E dv.
Σ
(4.19)
V
Al restar las eqs. (4.18) y (4.19), se llega a
∬
∭ (E∇U · n̂−U ∇E · n̂) d𝜎 =
E∇2U − U ∇2 E dv,
Σ
(4.18)
V
(4.20)
V
y teniendo en cuenta las derivadas direccionales 𝜕E/𝜕n = ∇E · n̂ y 𝜕U /𝜕n =
∇U · n̂, se obtiene el teorema de Green
∭ ∬ 𝜕E
𝜕U
−U
d𝜎 =
(4.21)
E∇2U − U ∇2 E dv.
E
𝜕n
𝜕n
V
Σ
Si la función U satisface la ecuación de onda independiente del tiempo,
eq. (4.15), ∇2 + k 2 U = 0, entonces el lado derecho de la eq. (4.21) se
anula, por lo tanto,
∬ 𝜕U
𝜕E
E
−U
d𝜎 = 0.
(4.22)
𝜕n
𝜕n
Σ
Con esta integral, dado el campo E (y su derivada 𝜕E/𝜕n) en la superficie Σ, se puede calcular el campo E en un punto P(x 0 , y 0 , z 0) dentro de la
superficie Σ con ayuda de la función U (y su derivada 𝜕U /𝜕n).
4.2.1. Teorema integral de Kirchhoff
Kirchhoff usa el teorema de Green con la función
U (x, y, z) =
e iks
s
(4.23)
donde s es la distancia entre el punto P(x 0 , y 0 , z 0) y el punto (x, y, z) en la
superficie. Esta función genera una singularidad en la región de difracción
que debe ser removida (ya que U debe estar definida en cualquier punto de
V ). La singularidad se puede eliminar construyendo una esfera Σ𝜀 de radio
𝜀 → 0 centrada en el punto P, como se ilustra en la fig. 4.10.
Difracción
·
279
S1
S
Se
P
S2
Figura 4.10. Geometría para calcular la difracción en el punto P con la función
de Green U (x, y, z) = e−iks /s.
Con 𝜀 → 0, se mantiene el volumen V que encierra Σ, pero ahora la
superficie de integración será Σ + Σ𝜀 . Así, la integral de difracción sobre Σ
queda
∬ ∬ 𝜕E
𝜕E
𝜕U
𝜕U
−U
d𝜎 = −
−U
d𝜎.
(4.24)
E
E
𝜕n
𝜕n
𝜕n
𝜕n
Σ
Σ𝜀
La derivada direccional 𝜕U /𝜕n es igual a
∇U · n̂ =
=
ikeiks s∇s − e iks ∇s
· n̂
s2
e iks
1
ik −
(ŝ · n̂),
s
s
(4.25)
con ∇s = ŝ el vector unitario en la dirección radial desde el punto P. Para el
caso de la esfera Σ𝜀 , el vector unitario normal apunta hacia el punto P, de
modo que (ŝ · n̂) = −1.
En la integral de la derecha de la eq. (4.24),
ik𝜀
𝜕U
1
e
=
− ik
,
(4.26)
𝜕n s=𝜀
𝜀
𝜀
por lo que la integral queda
ik𝜀 ik𝜀
∬ 1
e
e 𝜕E 2
E
− ik
−
𝜀 sin 𝜃d𝜃d𝜙,
𝜀
𝜀
𝜀 𝜕n
Σ𝜀
(4.27)
donde la diferencial de área se ha escrito en coordenadas esféricas (para la
esfera Σ𝜀 ), con 𝜃 el ángulo polar y 𝜙 el ángulo acimutal. En el límite 𝜀 → 0
esta última integral se reduce a
∬
E sin 𝜃d𝜃d𝜙 = 4𝜋E(x 0 , y 0 , z 0).
(4.28)
Σ𝜀
280
·
Difracción
En consecuencia, el campo en el punto P se puede calcular como
E(x 0 , y 0 , z 0) = −
1
4𝜋
∬
Σ
e iks
1
𝜕E
E ik −
(ŝ · n̂)−
d𝜎 ,
s
s
𝜕n
(4.29)
donde ahora el vector unitario n̂ corresponde con la superficie Σ. Esta integral se denomina teorema integral de Kirchhoff .
4.2.2. Difracción de Fresnel-Kirchhoff
Supongamos que tenemos una pantalla plana opaca con una abertura y se
desea determinar el campo óptico difractado cuando la fuente de iluminación S es puntual, como en la fig. 4.11(a). Para resolver la integral eq. (4.29)
para el punto P, lo primero que se debe hacer es seleccionar la superficie de
integración Σ. En la fig. 4.11(b), se muestra la superficie que usualmente se
propone en este problema. La superficie cerrada consta de tres superficies
abiertas: la superficie plana A que llena la abertura, la superficie plana Σ1
detrás de la pantalla opaca y la superficie Σ2 que es un casquete esférico de
radio R centrado en el punto P.
S1
S
S
A
P
R
P
S1
Pantalla opaca
con una abertura
(a)
S2
(b)
Figura 4.11. (a) Geometría de la difracción de una onda esférica en una abertura.
(b) Selección de la superficie de integración para resolver la integral de Kirchhoff.
Entonces, debemos resolver la integral de Kirchhoff para las tres superficies, que sumadas completan la superficie cerrada Σ = A + Σ1 + Σ2 . Ya que
la superficie se escoge de manera arbitraria (pero en forma conveniente), si
R → ∞, la superficie Σ1 tendrá una extensión infinita. En este caso, el problema de difracción para una abertura supone que la pantalla opaca tiene
una extensión infinita. Así, la contribución del campo emitido por la fuente
puntual, E = E0† e ikr /r, donde r es la distancia entre la fuente S y un punto
(x, y, z) cualquiera, en cada superficie será:
Difracción
·
281
- en A, si suponemos que el campo en la abertura es igual al campo en
ausencia de la pantalla opaca con la abertura, entonces
EA = E0† e ikr /r ,
(4.30)
donde r es la distancia entre S y un punto en la abertura;
- en Σ1 , si suponemos que la pantalla opaca no transmite luz, entonces
EΣ1 = 0;
(4.31)
- en Σ2 , con R → ∞, EΣ2 (y también U ) decrece como 1/R, por lo que
el campo E es prácticamente nulo. Sin embargo, el área de integración
crece como R 2 (en Σ2 , d𝜎 = R 2 sin 𝜃d𝜃d𝜙), de modo que no resulta
evidente que en Σ2 la integral de difracción se anule.
Las dos primeras suposiciones también presentan algunos inconvenientes, por ejemplo: en la primera, la presencia de la pantalla sí cambia el campo
en el borde de la apertura; en la segunda, se tiene que en la vecindad de la
abertura el campo se extiende detrás de la pantalla opaca [23]. Sin embargo,
para los problemas prácticos en los que el tamaño de la abertura es mucho
mayor que la longitud de onda, estas dos suposiciones dan muy buenos resultados. Para la superficie Σ2 , si R 𝜆 , la integral de la eq. (4.29), con
s = R, se aproxima por
∬
𝜕E
1
U R ikE−
R sin 𝜃d𝜃d𝜙,
(4.32)
−
4𝜋 Σ2
𝜕n
teniendo en cuenta que ahora (ŝ · n̂) = 1. Ya que U R tiene un valor finito
con R → ∞, entonces la integral en Σ2 , eq. (4.32), se anula si
𝜕E
lı́m R ikE−
= 0.
(4.33)
R→∞
𝜕n
Esta condición se llama condición de radiación de Sommerfeld, y se satisface si
E → 0 tan rápido como 1/R. Lo anterior ocurre para una fuente puntual
esférica, así que la contribución de la integral en la superficie Σ2 , en efecto,
es nula. Por lo tanto, la difracción generada por una abertura cuando es
iluminada por una fuente puntual estará dada por
∬
ikr e iks
1
1
1
†e
0 0 0
E
ik −
(ŝ · n̂)− ik −
(r̂ · n̂) d𝜎 ,
E(x , y , z ) = −
4𝜋 A 0 r s
s
r
(4.34)
282
·
Difracción
donde r̂ es el vector unitario desde la fuente S a un punto Q (de coordenadas
(x, y, z)) en la abertura A, ŝ el vector unitario desde el punto de observación
P (de coordenadas (x 0 , y 0 , z 0)) hasta el punto Q y n̂ el vector unitario normal
a la superficie A en el punto Q, como se ilustra en la fig. 4.12(a).
s
n
b
a
r
Q
Q
S
c
S
P
P
A
A
(a)
(b)
Figura 4.12. Vectores unitarios en el punto Q de la abertura difractante.
Si las distancias r = SQ y s = QP son mucho mayores que la longitud
de onda, las aproximaciones (ik − 1/s) ≈ ik y (ik − 1/r) ≈ ik se pueden
emplear en la eq. (4.34), por lo tanto,
∬
ikr e iks (ŝ · n̂)−(r̂ · n̂)
i
†e
0 0 0
E(x , y , z ) = −
d𝜎.
(4.35)
E
𝜆 A 0 r s
2
Esta integral se denomina integral de difracción de Fresnel-Kirchhoff . En
efecto, el término −i [(ŝ · n̂)−(r̂ · n̂)] /2𝜆 define formalmente el factor de
inclinación K ( 𝜒 ) de la eq. (4.2) en el tratamiento de Fresnel. Definiendo
los ángulos entre los vectores unitarios como se muestra en la fig. 4.12(b),
el factor de inclinación se puede escribir como
i [cos 𝛼 − cos 𝛽 ]
𝜆
2
i [cos 𝛽 + cos( 𝜒 + 𝛽 )]
.
𝜆
2
K( 𝜒) = −
=
(4.36)
Con esta definición, tendremos una ecuación análoga a la eq. (4.2), así,
∬
E(P) =
A
E0†
e ikr e iks
K ( 𝜒 )d𝜎.
r s
(4.37)
El factor de inclinación definido en la eq. (4.36) no depende solo del ángulo
𝜒 , como lo sugiere la formulación de Fresnel. Esto ocurre debido a que la
superficie de integración en la eq. (4.37) es plana, mientras que la superficie
de integración en la eq. (4.2) es el frente de onda esférico de radio r0 , en la
que la amplitud de las fuentes secundarias es constante e igual a E0† e ikr0 /r0 .
Difracción
·
283
En cambio, en la eq. (4.37), no solo la amplitud de las fuentes secundarias en
la abertura A es variable, sino que las fuentes secundarias E(Q) = E0† e ikr /r
no están siempre en el mismo frente de onda. En este sentido, la eq. (4.37)
es una versión generalizada del principio de Huygens-Fresnel.
Cuando la fuente está en el infinito, las eqs. (4.2) y (4.37) coinciden, ya
que el ángulo 𝛽 = 𝜋 (y 𝛼 = 𝜒 ). En este caso, el factor de inclinación resulta
ser
i 1 + cos 𝜒
K( 𝜒) = −
.
(4.38)
𝜆
2
La situación se ilustra en la fig. 4.13.
l
s
n
Q
c
r
P
A
Figura 4.13. Vectores unitarios cuando el frente de onda incidente en la abertura
es plano.
Una simplificación adicional ocurre en la aproximación paraxial donde
𝜒 ≈ 0. Esta última situación es muy común en la práctica y será analizada
en la siguiente unidad.
4.2.3. Difracción de Sommerfeld
Para obtener la integral de Fresnel-Kirchhoff, se empleó como función de
Green la onda esférica de amplitud unitaria e iks /s. La selección de la función es arbitraria pero debe facilitar el cálculo de la difracción. Esta función
presenta algunos inconvenientes con el campo E dentro de la abertura, en
los bordes de la abertura y justo detrás de la abertura cerca de los bordes.
Sommerfeld propone otra función de Green, de modo que los problemas
de la frontera de la apertura sean resueltos, aunque se sigue manteniendo la
suposición de que el campo óptico dentro de la abertura es igual al campo
óptico en la misma región cuando no se tiene la pantalla opaca que define
la abertura.
La nueva función U se construye con dos ondas esféricas unitarias, una
con origen en el punto de observación P (como en la eq. (4.23)) y la otra
284
·
Difracción
con origen en el punto P0, el cual es la imagen especular de P con respecto
al plano de la abertura A, como se ilustra en la fig. 4.14.
Q
n
s'
s
P'
P
A
Figura 4.14. P y P0: origen de las dos ondas esféricas unitarias auxiliares para el
cálculo de la difracción.
Con esta configuración, la función de Green queda
0
e iks eiks
(4.39)
− 0 .
s
s
Usando esta función en el problema de la difracción descrito en la fig. 4.11(b)
cuando R → ∞, para cualquier punto en Σ1 y en A, se tiene que s 0 = s y, por
lo tanto, U = 0 y 𝜕U /𝜕n = 0. Así, no se requiere hacer ninguna suposición
sobre las condiciones de frontera del campo E en Σ1 y en el borde de la
abertura, eliminando las inconsistencias que allí se presentan con la función
de Green escogida por Kirchhoff. Con la eq. (4.39), se llega a [24]
∬
i
e ikr e iks
0 0 0
E(x , y , z ) = −
E0†
(ŝ · n̂)d𝜎.
(4.40)
𝜆 A
r s
U=
Esta integral se denomina primera solución de Rayleigh-Sommerfeld.
0
También se puede elegir la función U = e iks /s + e iks /s 0, lo que da origen
a la segunda solución de Rayleigh-Sommerfeld [24]
∬
e ikr e iks 0
i
0 0 0
E0†
(ŝ · n̂)d𝜎.
(4.41)
E(x , y , z ) =
𝜆 A
r s
El factor de inclinación será diferente en cada caso:
- K ( 𝜒 ) = −i [(ŝ · n̂)−(r̂ · n̂)] /2𝜆 , en Fresnel-Kirchhoff,
- K ( 𝜒 ) = −i (ŝ· n̂)/𝜆 , en la primera solución de Rayleigh-Sommerfeld,
- K ( 𝜒 ) = i (ŝ0 · n̂)/𝜆 , en la segunda solución de Rayleigh-Sommerfeld.
En la situación en que la abertura es iluminada por una onda plana (fuente S en el infinito) y en la aproximación paraxial, los factores de inclinación
coinciden en K ( 𝜒 ) = −i/𝜆 .
Difracción
·
285
4.3. Difracción de Fresnel y Fraunhofer
En esta unidad, vamos a considerar el problema de la difracción para aberturas en una pantalla opaca plana, como se ilustra en la fig. 4.15.
y
r
Q
x
R
d
A
s
y'
r'
P
x'
z
Figura 4.15. Geometría para el cálculo de la difracción por aberturas planas.
De acuerdo con la eq. (4.37), la integral de difracción de Huygens-Fresnel
se puede escribir en general como
∫ ∫
eiks
E(P) =
E(Q)K ( 𝜒 )
d𝜎.
(4.42)
s
A
E(Q) es la amplitud compleja del campo en la abertura. La abertura se encuentra en el plano xy y la pantalla de observación del patrón de difracción
(distribución espacial de la irradiancia) en el plano x 0 y 0. Estos planos están
separados la distancia d = |d|. En particular, nos limitaremos a la aproximación paraxial, la cual queda definida bajo las condiciones:
1. la separación d entre el plano de la abertura y el plano del patrón de
difracción satisface d 𝜆 ,
2. las dimensiones de la abertura son mucho menores que la distancia d,
3. las dimensiones de la región de observación del patrón de difracción
son mucho menores que la distancia d,
4. el factor de inclinación para cualquier punto en la abertura se aproxima por el factor de inclinación de la primer zona de Fresnel, es decir,
K ( 𝜒 ) ≈ −i/𝜆 .3
3 Este valor del factor de inclinación se obtiene de K ( 𝜒 ) = −i (1 + cos 𝜒 )/2𝜆 cuando en
la eq. (4.36) el ángulo 𝛽 = 𝜋, es decir, cuando se ilumina con una onda plana. En la práctica,
el frente de onda en la abertura puede tener pequeñas desviaciones, de modo que 𝛽 ≈ 𝜋.
En este caso, aún se podrá suponer que K ( 𝜒 ) = −i/𝜆 .
286
·
Difracción
Los vectores indicados en la fig. 4.15 son:
- d, vector de separación entre los planos de la abertura y la pantalla de
observación.
- r = {x, y}, vector de posición del punto Q en la abertura.
- r0 = {x 0 , y 0 }, vector de posición del punto P en la pantalla de observación.
- R = d + r0, vector de posición relativa del punto P con respecto al
origen de coordenadas de la abertura.
- s, vector de posición relativa del punto P con respecto al punto Q.
|r0 |
Teniendo en cuenta la condición paraxial, se cumple que |r| |R|,
|R| y |R| ≈ |d|.
Del teorema del coseno, tenemos
s2 = R 2 + r 2 − 2R · r,
o bien
r
s =R 1+
r 2
R
−
2R · r
.
R2
Ya que R · r = (d + r0) · r = r0 · r, entonces
r
r 2 2r0 · r
−
s =R 1+
.
R
R2
(4.43)
(4.44)
(4.45)
La aproximación paraxial implica que la raíz cuadrada se puede aproximar a segundo orden, de modo que
1 r 2 − 2r0 · r
.
(4.46)
s =R 1+
2
R2
Completando el binomio cuadrado para el término que está entre paréntesis en la eq. (4.46),
r 02
1 r 02 − 2r0 · r + r 2
s =R 1−
+
.
2R 2 2
R2
(4.47)
Con r 0 R, se tiene que 1 − r 02 /2R 2 ≈ 1, y reemplazando R por d, la
eq. (4.47) se simplifica a
|r0 − r| 2
s=d+
.
(4.48)
2d
Difracción
·
287
Entonces, la forma paraxial de la eq. (4.42) se obtiene reemplazando s
con la expresión dada por la eq. (4.48). La distancia s está en la función
exponencial y en el denominador de la eq. (4.42). La cantidad |r0 − r| 2 /2d
describe pequeñas variaciones con respecto a la distancia d. En la función
exponencial, estas pequeñas variaciones son comparables con la longitud de
onda, de modo que el cociente entre estas dos cantidades da cambios de fase
importantes en el proceso de interferencia. Por otro lado, en el denominador, estas pequeñas variaciones solo se comparan con la distancia d, por lo
que no se tiene un cambio apreciable en el denominador, y allí podemos
cambiar s por d. Finalmente, la versión paraxial de la eq. (4.42) queda
∫ ∫
2
0
e ikd
0
E(r ) = −i
E(r)e ik |r −r| /2d d 2 r.
(4.49)
𝜆d
A
(y '- y) 2 /2d
P
s
Q
V
d
y
O
y'
O'
d
z
Frente de onda
A
parabólico
Figura 4.16. Aproximación de la distancia s como d + (y 0 − y) 2 /2d.
A partir de esta integral, podemos ver cómo son las ondas secundarias
del principio de Huygens-Fresnel en la aproximación paraxial. Consideremos la fig. 4.16, en la que tomamos r = y ĵ y r0 = y 0ĵ. En Q(y), tenemos
una fuente de amplitud E(y) que emite una onda parabólica. El campo en
P(y 0), debido a Q, es igual al campo atenuado E(y)/d y el cambio de fase
de la onda en P está dado por ik [d + (y 0 − y) 2 /2d]. Note que el término
(y 0 − y) 2 /2d es la sagita a la distancia y 0 − y del vértice V del frente de onda
parabólico centrado en Q. Entonces, en la aproximación paraxial las ondas
secundarias del principio de Huygens-Fresnel son paraboloides centrados
en las fuentes localizadas en el frente de onda primario Σ.
Al escribir los vectores de la eq. (4.49) en componentes cartesianas se
tiene la expresión
∫ ∫
02 02
2 2
0
0
e ikd e ik (x +y )/2d
E(x 0 , y 0) = −i
E(x, y)e ik (x +y )/2d e −ik (x x+y y)/d dxdy.
𝜆d
A
(4.50)
288
·
Difracción
Esta versión de la integral de difracción permite observar la influencia de
las zonas de Fresnel en el campo que llena la abertura A. Fijando la atención
en el plano de la abertura, se tiene que dentro de la integral el campo E(x, y)
2 2
está modulado por el término e ik (x +y )/2d . Ahora, el término (x 2 + y 2 )/2d
será la sagita a la distancia (x 2 + y 2 ) 1/2 desde el origen de coordenadas O
de un paraboloide centrado en O0 (fig. 4.16). Si la distancia (x 2 + y 2 )/2d
se divide entre 𝜆 /2, estaremos contando el número de zonas de Fresnel
contenidas en una abertura circular de radio (x 2 + y 2 ) 1/2 . Por lo tanto,
e ik (x
2 +y 2 )/2d
= e i 𝜋N ,
(4.51)
donde N = (x 2 + y 2 )/𝜆 d es el número de zonas de Fresnel.
4.3.1. Difracción de Fraunhofer
Sea 𝜌 máx el radio del círculo que circunscribe la abertura difractante y Nmáx =
𝜌2máx /𝜆 d el número de zonas de Fresnel que subtiende el círculo con respecto al plano de observación del patrón de difracción. Si Nmáx 1 (Nmáx ≈ 0),
2 2
entonces el término e ik (x +y )/2d dentro de la integral se puede despreciar y
el patrón de difracción estará dado por
I (x 0 , y 0) =
(𝜖 0 c/2)
𝜆 2d2
∫ ∫
0
2
0
E(x, y)e −i2𝜋 (x x+y y)/𝜆 d dxdy .
(4.52)
A
A esta integral, se le denomina difracción de Fraunhofer.
4.3.2. Difracción de Fresnel
Sea 𝜌 máx el radio del círculo que circunscribe la abertura difractante y Nmáx =
𝜌2máx /𝜆 d el número de zonas de Fresnel que subtiende el círculo con respecto al plano de observación del patrón de difracción. Si Nmáx es del orden
2 2
de una zona de Fresnel, entonces el término e ik (x +y )/2d no se puede despreciar dentro de la integral y, en este caso, el patrón de difracción estará
dado por
(𝜖 0 c/2)
I (x , y ) =
𝜆 2d2
0
0
∫ ∫ h
E(x, y)e
ik (x 2 +y 2 )/2d
i
e
−i2𝜋 (x0 x+y0 y)/𝜆 d
2
dxdy .
A
(4.53)
A esta integral se le denomina difracción de Fresnel.
Difracción
·
289
Las integrales de difracción dadas por las eqs. (4.52) y (4.53) tienen la
forma de una transformada bidimensional de Fourier cuyas frecuencias espaciales son x 0/𝜆 d y y 0/𝜆 d. Por lo tanto, resulta simple calcular numéricamente estas integrales.
4.3.3. Algunos ejemplos
La abertura circular
Una abertura muy común en difracción es la abertura circular. Esta tiene
aplicaciones prácticas muy importantes, ya que los diafragmas de apertura
o los bordes de las lentes de un sistema óptico suelen ser circulares.
Supongamos que tenemos una abertura circular de radio w iluminada
por un frente de onda plano homogéneo (de amplitud E0 y longitud de
onda 𝜆 ) ortogonal al plano de la abertura. El campo en la abertura se puede
describir como
!
p
x2 + y2
E(x, y) = E0 circ
,
(4.54)
w
donde circ( ) se denomina función círculo y se define como 1 para (x 2 +
y 2 ) 1/2 ≤ w y 0 para otros valores de (x, y). En este caso, la abertura coincide con el círculo que circunscribe a la abertura difractante. Entonces, el
número de zonas de Fresnel está dado por N = w 2 /𝜆 d. En la fig. 4.17, se
muestra los patrones de difracción4 de Fresnel, para una abertura circular
de radio w = 0.5 mm, obtenidos cuando la distancia de la pantalla de observación corresponde con: (a) la primera zona de Fresnel (d = 395.1 mm),
(b) las dos primeras zonas de Fresnel (d = 197.5 mm), (c) las tres primeras
zonas de Fresnel (d = 131.7 mm) y (d) las cuatro primeras zonas de Fresnel
(d = 98.7 mm), para 𝜆 = 632.8 nm. Por supuesto, la distancia a la que se
debe tener la pantalla de observación en cada caso se calcula de d = w 2 /N𝜆 .
En el caso de la difracción de Fraunhofer el cálculo es aún más simple ya
2 2
que no incluye el término eik (x +y )/2d dentro de la integral. Lo anterior implica que d → ∞. En la práctica, la pantalla de observación se debe colocar
a una distancia finita tal que d w. Por ejemplo, en la fig. 4.18(a) se muestra el patrón de Fraunhofer cuando d = 3951 mm. Este valor particular
de la distancia d corresponde a la distancia para la cual la abertura circular
4 Con el fin de hacer visible los anillos o regiones de menor intensidad, en lugar de dibujar
la irradiancia se dibuja la raíz cuadrada de la irradiancia. Esto lo haremos en los patrones
simulados de esta unidad, así como en las unidades 4.4 y 4.5. Pero en la sección acerca de
la resolución en la unidad 4.5 sí se dibujará la irradiancia, ya que ilustra mejor el asunto de
la resolución de la imagen de dos puntos y corresponde con lo que en la práctica se observa.
290
·
Difracción
subtiende 0.1 zonas de Fresnel. El perfil de este patrón, fig. 4.18(b), corresponde con el cuadrado de una función de Bessel divida entre argumento,
como veremos en seguida.
(a) d =395.1 mm
(b) d =197.5 mm
(c) d =131.7 mm
(d) d =98.7 mm
Figura 4.17. Patrones de difracción de Fresnel de una abertura circular de radio
0.5 mm para una longitud de onda 632.8 nm. El tamaño del cuadro de la imagen
en todos los casos es de 3 mm de lado.
Irradiancia, I (I0)
1.0
0.8
0.6
0.4
0.2
0
-10
-8
(a)
-6
-4
-2
0
rA
x' (mm)
2
4
6
8
10
(b)
Figura 4.18. (a) Patrón de difracción de Fraunhofer en la pantalla de observación
a la distancia 3951 mm de la abertura circular de radio 0.5 mm. El tamaño del
cuadro de la imagen es de 20 mm de lado. (b) Perfil del patrón de difracción.
La integral de Fraunhofer para la abertura circular tiene una solución
analítica bien conocida. Ya que la abertura es circular, conviene resolver la
integral en coordenadas cilíndricas.
Sea r = (x 2 + y 2 ) 1/2 y tan 𝜙 = y/x, y r 0 = (x 02 + y 02 ) 1/2 y tan 𝜑. Entonces,
x = r cos 𝜙, y = r sin 𝜙, x 0 = r 0 cos 𝜑 y y 0 = r 0 sin 𝜑. Cambiando las variables
en la integral de difracción, se tiene
I (r 0) =
E02 (𝜖 0 c/2)
2
∫w ∫2𝜋
e
𝜆 2d2
0
0
−i2𝜋r 0 r [cos(𝜙−𝜑) ]/𝜆 d
rdrd𝜙 .
(4.55)
Difracción
·
291
Ya que el problema tiene simetría para 𝜑, se puede resolver para cualquier
𝜑. En particular, para 𝜑 = 0 la integral queda
∫w ∫2𝜋
0
0
e −i2𝜋r r cos 𝜙/𝜆 d rdrd𝜙,
(4.56)
0
lo que es igual a
∫w
2𝜋
J0 (2𝜋r 0r/𝜆 d)rdr.
(4.57)
0
∫u
Teniendo en cuenta la relación de recurrencia 0 J0 (u 0)u 0du 0 = u J1 (u), se
llega a
2 J1 (2𝜋wr 0/𝜆 d) 2
I (r 0) = I0
,
(4.58)
2𝜋wr 0/𝜆 d
con I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 d) 2 .
El primer anillo oscuro del patrón de la fig. 4.18 se obtiene para el primer
cero de la función de Bessel, es decir, cuando 2𝜋wr 0/𝜆 d = 3.8317. Ya que
la energía contenida en la región encerrada por el primer anillo oscuro es
alrededor del 84 %, el primer anillo juega un papel muy importante en la
formación de imagen de una fuente puntual. A la distribución de irradiancia
contendida dentro del primer anillo se le denomina disco de Airy. El radio
del disco de Airy está dado por
rA0 = 1.22
𝜆d
.
(2w)
(4.59)
En el ejemplo de la fig. 4.18(b), el radio de Airy es 3.0541 mm. El segundo anillo oscuro del patrón se obtiene para el segundo cero de la función
de Bessel, es decir, 2𝜋wr 0/𝜆 d = 7.0156, lo que da r 0 = 2.23𝜆 d/(2w). En el
ejemplo de la fig. 4.18(b), este radio es 5.5825 mm. La energía en la región
encerrada por el segundo anillo oscuro es del 91 %.
A la función 2 J1 (u)/u, se le denomina función J inc(u).
La abertura rectangular
Otra abertura, también muy empleada en problemas prácticos de difracción
es la abertura rectangular. Supongamos que tenemos una abertura rectangular de lados 2wx y 2wy iluminada por un frente de onda plano homogéneo
(de amplitud E0 y longitud de onda 𝜆 ) ortogonal al plano de la abertura. El
campo en la abertura se puede describir como
x
y
E(x, y) = E0 rect
rect
,
(4.60)
2wx
2wy
292
·
Difracción
donde rect(x/2wx ) se denomina función rectángulo y se define como 1 para
|x| ≤ wx y 0 para otros valores de x. En forma análoga se define la función
rect(y/2wy ) para la coordenada y.
(a) d =6321 mm
(b) d =3161 mm
(c) d =2107 mm
(d) d =1580 mm
Figura 4.19. Patrones de difracción de Fresnel de una abertura rectangular de
lados 1 mm y 4 mm para una longitud de onda 632.8 nm. El tamaño de la imagen
en todos los casos es 24 mm de lado.
En la fig. 4.19, se muestra los patrones de difracción de Fresnel para una
abertura rectangular de lados 2wx = 1 mm y 2wy = 4 mm obtenidos cuando
la distancia de la pantalla de observación corresponde con: (a) la primera
zona de Fresnel (d = 6321 mm), (b) las dos primeras zonas de Fresnel (d =
3161 mm), (c) las tres primeras zonas de Fresnel (d = 2107 mm) y (d) las
cuatro primeras zonas de Fresnel (d = 1580 mm), para 𝜆 = 632.8 nm. Ya
que wy > wx , el círculo que circunscribe la abertura rectangular tendrá un
radio aproximado a wy , por lo tanto, el número de zonas de Fresnel en este
caso se calcula como N = wy2 /𝜆 d y, en consecuencia, la distancia a la que se
coloca la pantalla de observación será d = wy2 /N𝜆 .
Irradiancia, I (I0)
1.0
0.8
0.6
0.4
0
-125
(a)
ld/ (2wx)
0.2
-100
-75
-50
-25
0
x' (mm)
25
50
75
100
125
(b)
Figura 4.20. (a) Patrón de difracción de Fraunhofer en la pantalla de observación
a la distancia 63211 mm de la abertura rectangular de lados 1 mm y 4 mm. El
tamaño de la imagen es de 250 mm de lado. (b) Perfil del patrón de difracción.
·
Difracción
293
La difracción de Fraunhofer cuando d = 63211 mm se muestra en la
fig. 4.20(a). En este ejemplo, este valor de d también corresponde con la
distancia para la cual el círculo que circunscribe a la abertura rectangular
subtiende 0.1 zonas de Fresnel.
La integral de Fraunhofer para la abertura rectangular también tiene una
solución analítica bien conocida. En este caso,
I (x 0 , y 0) =
=
E02 (𝜖 0 c/2)
𝜆 2d2
E02 (𝜖 0 c/2)
𝜆 2d2
∫wx ∫wy
2
0
0
e −i2𝜋 (x x+y y)/𝜆 d dxdy
−wx −wyx
∫wx
2
0
e −i2𝜋 (x x)/𝜆 d dx
−wx
∫wy
2
0
e −i2𝜋 (y y)/𝜆 d dy ,
−wy
(4.61)
es decir,
0
0
I (x , y ) = I0
sin(2𝜋wx x 0/𝜆 d)
(2𝜋wx x 0/𝜆 d)
2 sin(2𝜋wy y 0/𝜆 d)
(2𝜋wy y 0/𝜆 d)
2
,
(4.62)
con I0 = (𝜖 0 c/2) (4wx wy E0 /𝜆 d) 2 . A la función sin(u)/u ya la encontramos
en la sección 3.1.3, esto es, la función sinc(u). El perfil de este patrón en
la dirección horizontal (x 0) se muestra en la fig. 4.20(b). Los ceros de la
función sinc(2𝜋wx x 0/𝜆 d) se obtienen en
xm0 = m
𝜆d
,
(2wx )
(4.63)
con m = ±1, ±2, ±3, ..... En la dirección vertical (y 0) se tiene un comportamiento similar, con los ceros en ym0 = ±m𝜆 d/(2wy ). La mayor parte de la energía se encuentra en la región limitada por los primeros ceros
0 = ±𝜆 d/(2w ) y y 0 = ±𝜆 d/(2w ). Entonces, conviene definir el ancho
x±1
x
y
±1
de la función sinc( ) como Δx 0 = 2x10 en la dirección x 0 y Δy 0 = 2y10 en la
dirección y 0.
Note que el patrón de difracción tiene una mayor extensión en la dirección en la cual la abertura rectangular tiene una menor longitud, fig. 4.20(a).
Sobre esto volveremos en la unidad que trata las rejillas de difracción. Las
rejillas unidimensionales son tales que cada elemento difractante satisface
que wx wy , lo que hace parecer al patrón de difracción como una distribución de irradiancia unidimensional.
294
·
Difracción
Por otra parte, cuando wx = wy = w tendremos una abertura cuadrada
de lado 2w. El patrón de difracción de Fraunhofer es simétrico, como se
muestra en la fig. 4.21.
Figura 4.21. Patrón de difracción de Fraunhofer generado por una abertura cuadrada de lado 2w = 1 mm a la distancia d = 3951 mm (N = 0.1) para la longitud
de onda 632.8 nm. El tamaño de la imagen es de 20 mm de lado.
Difracción
·
295
4.4. Interferómetro de Young II
En la unidad 3.8, discutimos el interferómetro de Young como un sistema
de dos fuentes S1 y S2 puntuales coherentes entre sí. En esta unidad, trataremos dos aspectos prácticos que se tienen en el interferómetro de Young.
El primero tiene que ver con el tamaño finito de las dos fuentes (aberturas)
S1 y S2 , el segundo con el tamaño y coherencia de la fuente de iluminación. Con esto, estaremos haciendo una mejor descripción del experimento
original de Thomas Young [17] en el siglo XIX.
En la fig. 4.22, se muestra un diagrama del experimento de Young que
emplearemos en esta unidad. La fuente primaria S con la que se iluminan
las aberturas S1 y S2 es una fuente monocromática de longitud de onda 𝜆
extendida e incoherente de tamaño 𝜎. Las dos aberturas son círculos de
radio w y están separadas entre sí (desde sus centros) la distancia a a lo largo
de la dirección x. La distancia entre la fuente S y las aberturas es zp , y la
distancia entre las aberturas y la pantalla de observación es d.
zp
s
d
S1
S
Fuente
extendida
a
x'
P
S2
Pantalla con
aberturas
(x,y)
Pantalla de
observación
(x',y')
Figura 4.22. Experimento de Young o difracción por dos aberturas en una pantalla opaca.
Teniendo en cuenta las condiciones bajo las cuales se realiza el experimento de Young, d a 𝜆 , la difracción en la pantalla de observación
corresponde con la difracción de Fraunhofer.
4.4.1. Efecto del tamaño de las aberturas
difractantes
Primero, vamos a suponer que la fuente primaria es una fuente puntual (en
el eje óptico) y que la amplitud del campo en cada abertura es uniforme y
296
·
Difracción
de fase constante. Por lo tanto, la irradiancia será
q
∫∞ ∫∞
(𝜖 0 c/2)
0 0
2
2
E0 circ
x + y /w ∗ [𝛿 (x − a/2) + 𝛿 (x + a/2]
I (x , y ) =
𝜆 2d2
−∞ −∞
(4.64)
0
2
0
×e −i2𝜋 (x x+y x)/𝜆 d dxdy .
La función circ( ) describe la geometría de cada abertura de radio w y
las funciones delta de Dirac ubican las aberturas en x = −a/2 y x = a/2.
El símbolo ∗ denota la operación de convolución. Teniendo en cuenta que
la transformada de Fourier de la convolución de dos funciones es igual al
producto de las transformadas de Fourier de cada función, se tiene que
2
𝜋a i2
2 J1 (2𝜋wr 0/𝜆 d) h
0 0
I (x , y ) = 4I0
cos
x0
,
(4.65)
2𝜋wr 0/𝜆 d
𝜆d
p
con I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 d) 2 y r 0 = x 02 + y 02 . Note que cos2 (𝜋 ax 0/𝜆 d)
es la transformada de Fourier de [𝛿 (x − a/2) + 𝛿 (x + a/2]. En efecto, el resultado dado en la eq. (4.65) es la versión modulada del resultado dado en
la eq. (3.117). Así que la modulación del patrón está determinada por el
tamaño de las aberturas, mientras que la separación entre franjas está determinada por la separación entre las aberturas. En la fig. 4.23(a), se muestra
la simulación del patrón de difracción por dos aberturas circulares idénticas
de radio w = 0.5 mm separadas a = 5 mm, con 𝜆 = 632.8 nm, cuando la
pantalla de observación se encuentra a la distancia d = 3956 mm (como en
la fig. 4.18). En la fig. 4.23(b), se muestra el perfil horizontal del patrón. La
curva segmentada en gris describe la modulación del patrón de interferencia
debida al patrón de difracción.
Irradiancia, I (I0)
1.0
1.22ld/2w
0.6
0.4
0.2
0
(a)
ld/a
0.8
-6
-4
-2
0
x' (mm)
2
4
6
(b)
Figura 4.23. (a) Patrón de interferencia generado por dos aberturas circulares de
radio 0.5 mm y separadas 5 mm. El patrón de interferencia está modulado por
el patrón de difracción (en gris) de una de las aberturas. (b) Perfil del patrón de
interferencia.
Difracción
·
297
4.4.2. Efecto del tamaño de la fuente luminosa
Ahora veremos cómo afecta la extensión 𝜎 de la fuente S al patrón de difracción. Suponemos que la fuente es monocromática e incoherente espacialmente. En otras palabras, las oscilaciones de los campos emitidos por
dos fuentes puntuales (independientes) de S no están correlacionadas, de
manera que estos campos no interfieren entre sí. Lo anterior implica que
si consideramos dos fuentes puntuales de S, cada una generará su propio
patrón de interferencia de Young. El resultado final es la suma de las intensidades producidas por cada una de las fuentes puntuales.
Para ver en forma cualitativa el efecto del tamaño de la fuente, consideremos una fuente luminosa conformada por dos fuentes puntuales incoherentes separadas entre sí la distancia 𝜎 0, como se muestra en la fig. 4.24.
El tamaño angular de la fuente será 𝛼 = 𝜎 0/zp . Cada fuente genera su propio patrón de interferencia con el máximo desplazado ±d𝛼/2. Las franjas
de interferencia en cada patrón estarán separadas entre sí la distancia 𝜆 d/a.
Ya que los dos patrones son idénticos, cuando el desplazamiento entre los
patrones sea igual a 𝜆 d/2a, los mínimos de un patrón coinciden con los máximos del otro patrón, por lo que la suma de los patrones elimina las franjas
de interferencia. Denotemos por 𝛼0 = 𝜆 /2a el ángulo que subtiende el desplazamiento 𝜆 d/2a con respecto al punto medio entre las aberturas.
zp
s'
d
S1
S
Dos fuentes puntuales
incoherentes entre sí.
S2
Figura 4.24. Suma de intensidades de dos fuentes incoherentes.
En la fig. 4.25, se muestra la evolución del patrón de interferencia a medida que aumenta el tamaño angular de la fuente. Los parámetros empleados son los mismos que hemos empleado en la fig. 4.18. Cuando 𝛼 = 0,
las dos fuentes puntuales coinciden en el eje óptico, por lo que la intensidad
en cada punto es el doble de la intensidad del patrón generado por una sola
fuente. La visibilidad del interferograma (eq. (3.32)) es la máxima (C = 1).
Cuando 𝛼 = 𝛼0 /4, las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /8a. El
cambio en la intensidad es pequeño en comparación con el primer caso
·
298
Difracción
y la visibilidad del interferograma sigue siendo elevada (C = 0.93). Con
𝛼 = 𝛼0 /2, las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /4a y ahora el
cambio en intensidad es apreciable; los mínimos dentro de la envolvente
se alejan de cero. Esto último disminuye la visibilidad del interferograma
en forma notable (C = 0.71). Para 𝛼 = 3𝛼0 /4, las fuentes puntuales están separadas 𝜎 0 = 3𝜆 zp /8a y la visibilidad disminuye considerablemente
(C = 0.38). Por último, cuando 𝛼 = 𝛼0 , las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /2a y la visibilidad del interferograma se hace cero, es decir,
no hay franjas de interferencia.
2.0
a 0 =l/(2a)
a = a 0/ 4
a=
a = 2a 0 / 4
a = a0
a = 3a 0/ 4
Irradiancia, I (4I 0 )
1.5
1.0
0.5
0
-4
-2
0
x' (mm)
2
4
-4
-2
0
x' (mm)
2
4
-4
-2
0
x' (mm)
2
4
-4
-2
0
x' (mm)
2
4
-4
-2
0
x' (mm)
2
4
Figura 4.25. Disminución de la visibilidad del interferograma tipo Young generado por dos aberturas circulares de radio w = 0.5 mm separadas a = 5 mm,
cuando se iluminan con luz emitida por dos fuentes puntuales incoherentes entre
sí en función de la separación angular 𝛼 de las fuentes. La longitud de onda de la
luz es 𝜆 = 632.8 nm.
El ejemplo de arriba ilustra en forma cualitativa lo que le ocurre al patrón de interferencia de Young cuando se ilumina con una fuente extendida (conformada por infinitas fuentes puntuales incoherentes). De acuerdo
con la visibilidad del interferograma que generan los campos ópticos que
emergen de las aberturas S1 y S2 , podemos establecer el grado de similitud
espacial de estos campos. La visibilidad del interferograma mide el grado
de coherencia espacial de los campos en las aberturas. Si los campos en las
aberturas son idénticos, lo que ocurre si la fuente es puntual, como en el
caso 𝛼 = 0 de la fig. 4.25, la visibilidad es máxima y los campos son mutuamente coherentes o complemente coherentes. A medida que aumenta el
tamaño de la fuente extendida, las oscilaciones de los campos en las aberturas están menos correlacionadas, por lo que disminuye la visibilidad del
interferograma y el grado espacial de coherencia.
Resultados similares a los mostrados en la fig. 4.25 se obtienen si en lugar
de variar el tamaño de la fuente de iluminación se cambia la separación de
las dos aberturas. Supongamos que el tamaño de la fuente de iluminación
es 𝜎. Con base en lo visto anteriormente, la separación de las aberturas
tiene un valor límite en el que la visibilidad del interferograma se hace cero.
Difracción
·
299
Para separaciones menores, se observará interferencia. En el caso de una
fuente conformada por dos fuentes puntuales incoherentes, la separación
límite es a = 𝜆 zp /2𝜎. Sin embargo, para una fuente continua este valor
límite se calcula a partir del teorema de Van Cittert-Zernike: la posición del
primer cero de la transformada de Fourier de la distribución de irradiancia
de la fuente incoherente se toma como la máxima separación de las dos
aberturas.5
Si la amplitud de los campos ópticos en las aberturas es aproximadamente igual, el resultado del teorema de van Cittert-Zernike mide la visibilidad
del interferograma, lo que equivale a medir la coherencia espacial de los
campos en las aberturas. Por ejemplo, si la fuente de iluminación es cuadrada de lado 𝜎, con una distribución de irradiancia constante, la visibilidad
estará dada por C ∼ sin(𝜋𝜎 a/𝜆 zp )/(𝜋𝜎 a/𝜆 zp ) . Si la fuente de iluminación es circular de radio 𝜎/2, con una distribución de irradiancia constante,
la visibilidad estará dada por C ∼ | J1 (𝜋𝜎 a/𝜆 d)/(𝜋𝜎 a/𝜆 d)|. Entonces, los
valores límite para la separación de las aberturas serán: con la fuente de
iluminación cuadrada, a = 𝜆 zp /𝜎, y con la fuente de iluminación circular,
a = 1.22𝜆 zp /𝜎.
En la fig. 4.26, se muestra los patrones de interferencia experimentales generados por dos aberturas circulares de radio w = 0.5 mm cuando
la fuente de iluminación es incoherente con una distribución de irradian2
cia que sigue un perfil gaussiano [25]. En este experimento, C ∼ e −(a/5.95) ,
donde 5.95 es el ancho de la gaussiana en mm y se toma como el radio de la
región de coherencia. En el experimento la separación de las aberturas varía
desde 2 mm hasta 12 mm en pasos de 2. Al examinar el perfil de los interferogramas en la dirección horizontal (x 0), se obtienen curvas semejantes a las
mostradas en la fig. 4.25. Cuando a = 12 mm, ya no se tiene interferencia.
Note que en estas imágenes no se observan anillos de interferencia (como
se muestra en el patrón simulado de la fig. 4.23(a). Esto ocurre porque en
la práctica el máximo de irradiancia del primer anillo es muy pequeño con
respecto al máximo de la región central, como se puede ver en el perfil de
la fig. 4.23(b).
A partir de lo dicho en esta unidad podríamos imaginar los cuidados que
Thomas Young tuvo para observar franjas de interferencia, las cuales han
de ser coloreadas si la fuente primaría es el sol.
5 El teorema de Van Cittert-Zernike establece que la región en el plano de las aberturas
difractantes dentro de la cual la coherencia espacial no es nula está determinada por la transformada de Fourier de la distribución de irradiancia de la fuente luminosa incoherente. En
el libro Principles of Optics de Born & Wolf [22] se encuentra una buena explicación de este
teorema.
300
·
Difracción
(a) 2 mm
(b) 4 mm
(c) 6 mm
(d) 8 mm
(e) 10 mm
(f) 12 mm
Figura 4.26. Patrones de interferencia en el experimento de Young con luz parcialmente coherente monocromática de longitud de onda 632.8 nm en función de
la separación de dos aberturas circulares de radio 0.5 mm.
Difracción
·
301
4.5. Formación de imagen con difracción
De acuerdo con la óptica geométrica, la imagen de un punto formada por un
sistema óptico libre de aberraciones ópticas también es un punto. Supongamos que el objeto puntual está localizado en el eje óptico. El frente de onda
esférico que diverge del objeto al pasar por el sistema óptico será truncado por el diafragma de apertura, es decir, el diafragma juega el papel de la
abertura que difracta la luz. Lo anterior implica que la imagen no puede ser
un punto. Por otra parte, la imagen de un objeto extendido dependerá de la
coherencia espacial del campo óptico en el objeto. En esta unidad, trataremos brevemente la formación de imagen teniendo en cuenta la difracción6
en la aproximación paraxial (difracción de Fresnel/Fraunhofer).
4.5.1. Imagen de un objeto (fuente) puntual
Consideremos el sistema de la fig. 4.27. La lente delgada representa el sistema óptico formador de imagen y el borde de la lente es el diafragma de
apertura. La lente introduce un retraso de fase en el frente de onda al pasar
por el diafragma. Con esto en mente, se puede modelar la lente como una
transmitancia de variable compleja que cambia la fase del frente de onda
incidente en el diafragma. Entonces, el proceso de formación de imagen
de un objeto puntual se puede describir así: del objeto puntual diverge un
frente de onda esférico, que es truncado por el diafragma de apertura y experimenta un cambio de fase debido a la transmitancia de la lente, luego se
difracta y en el plano imagen gaussiano el patrón de difracción describe la
imagen del objeto puntual.
- so
si
DA
O
Objeto puntual
Lente
(x,y)
Plano imagen
gaussiano
(x',y')
Figura 4.27. Esquema de un sistema óptico formador de imagen. El diafragma
de apertura limita el frente de onda y genera difracción en la imagen.
6 Para
una discusión detallada sobre el problema de la formación de imagen teniendo en
cuenta la difracción, se puede consultar el libro Introduction to Fourier Optics [24].
302
·
Difracción
En la fig. 4.27, −so y si son las distancias objeto e imagen con respecto
a la lente delgada en el plano de la abertura (diafragma). La fase del campo óptico (que diverge del objeto puntual) justo antes de la abertura será
2 2
e −ikso e −ik (x +y )/2so . La transmitancia de la lente en la abertura está dada por
2 2
t(x, y) = e −ik (x +y )/2f . Este resultado se deduce fácilmente y se puede consultar en el libro Introduction to Fourier Optics [24]. Por lo tanto, si E0 es
la amplitud del campo en la abertura, el campo óptico justo después de la
abertura será
!
p
x 2 + y 2 −ik (x2 +y2 )/2so −ik (x2 +y2 )/2f
−ikso
E(x, y) = E0 e
circ
e
e
,
(4.66)
w
donde la función circ( ) describe el borde de la lente y w es el radio de la
lente.
La difracción entre el diafragma (lente) y el plano imagen gaussiano resulta
(𝜖 0 c/2)
I (x 0 , y 0) =
𝜆 2 si2
∫∞ ∫∞ h
2
E(x, y)e
ik (x 2 +y 2 )/2si
i
e
−i2𝜋 (x0 x+y0 y)/𝜆 si
dxdy .
−∞ −∞
(4.67)
Dentro de la integral están los siguientes términos de fase
e −ik (x
2 +y 2 )/2s
o
e ik (x
2 +y 2 )/2s
i
e −ik (x
2 +y 2 )/2f
= e ik [1/si −1/so −1/f ] (x
2 +y 2 )/2
= 1.
(4.68)
Lo anterior se tiene como consecuencia de la ecuación de las lentes delgadas
1/si −1/so = 1/f (eq. (1.42)). Así, la imagen de un objeto puntual estará dada
por
I (x 0 , y 0) =
E02 (𝜖 0 c/2)
𝜆 2 si2
2
∫∞ ∫∞
circ
q
x 2 + y 2 /w e
−i2𝜋 (x0 x+y0 y)/𝜆 si
dxdy .
−∞ −∞
(4.69)
Esta integral ya la resolvimos en el ejemplo de la abertura circular (sección
4.3.3). De modo que la imagen de un objeto puntual formada por una lente
de diámetro 2w depende del diámetro de la lente y de la distancia imagen
Gaussiana si , y es de la forma
I (r 0) = I0
2 J1 (2𝜋wr 0/𝜆 si )
(2𝜋wr 0/𝜆 si )
donde I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 si ) 2 .
2
,
(4.70)
Difracción
·
303
En óptica geométrica, se definió la PSF geométrica (unidad 1.9) para
describir la forma de la imagen de un objeto puntual. Si el sistema óptico
está libre de aberraciones la PSF geométrica será un punto. Al tener en
cuenta la difracción, encontramos que la imagen de un objeto puntual ya
no es un punto sino un patrón de difracción. Entonces, de manera análoga,
en óptica física (cuando se tiene en cuenta la naturaleza ondulatoria de la
luz) también se define la PSF difractiva para describir la forma de la imagen
de un objeto puntual. Si el sistema óptico está libre de aberraciones la PSF
difractiva estará dada por la eq. (4.70). Cuando un sistema óptico está libre
de aberraciones ópticas se dice que el sistema está limitado por difracción.
Función pupila y aberraciones ópticas
La eq. (4.69) indica que en el proceso de formación de imagen, el cual es del
dominio de la difracción de Fresnel, la lente compensa el término de fase
cuadrático de Fresnel, dando como resultado una integral de difracción de
Fraunhofer. Esta ecuación se puede generalizar a sistemas ópticos de varias
lentes con un diafragma de apertura separado de las lentes. La abertura difractante será el borde de la pupila de salida y la distancia en la que ocurre
la difracción de Fresnel será la distancia entre la pupila de salida y el plano
imagen gaussiano, digamos sps . La pupila se describe mediante una función
P (x, y) que incluye la geometría de la pupila y una posible variación de la
transmitancia en la pupila. Si, adicionalmente, el sistema óptico presenta
aberraciones ópticas, estás afectan la fase del frente de onda en la pupila,
lo cual se puede incluir multiplicando la función P (x, y) por un término
e −ikW (x, y) , donde W (x, y) es la variación del frente de onda real con respecto al frente de onda esférico ideal de radio sps . Entonces, la PSF de un
sistema óptico en general estará dada por
I (x 0 , y 0) =
E02 (𝜖 0 c/2)
2
𝜆 2 sps
∫∞ ∫∞
2
P (x, y)e −ikW (x,y) e
−i2𝜋 (x0 x+y0 y)/𝜆 s
ps
dxdy .
−∞ −∞
(4.71)
La función W (x, y) es un polinomio cuyos términos describen las aberraciones ópticas presentes en el sistema óptico [26]. Por ejemplo, las aberraciones primarias como el astigmatismo, la coma y la esférica en el frente
de onda están dadas por: aa (x 2 − y 2 ), ac y(x 2 + y 2 ) y as (x 2 + y 2 ) 2 , respectivamente. El desenfoque también se puede incluir como una aberración,
llamada defoco, dada por ad (x 2 + y 2 ). Los coeficientes ad , aa , ac y as dependen de los parámetros del sistema óptico. En la fig. 4.28, se muestra la PSF
de un sistema óptico limitado por difracción cuando la distancia entre la
304
·
Difracción
pupila de salida y el plano imagen gaussiano es sps = 100 mm y el diámetro
de la pupila de salida 2w = 10 mm, con 𝜆 = 632.8 nm. El radio del disco
de Airy es rA = 7.7 𝜇m. El tamaño del cuadro de la imagen es 316 𝜇m de
lado.
En la fig. 4.29, se muestra los patrones de difracción cuando en el mismo sistema óptico de la fig. 4.28 el frente de onda en la pupila de salida está
afectado por aberraciones como: defoco, con ad = 5 × 10−5 mm−1 ; astigmatismo, con aa = 3.5 × 10−5 mm−1 ; coma, con ac = 1.25 × 10−5 mm−2 ;
y aberración esférica, con as = 2 × 10−6 mm−3 . El tamaño del cuadro de la
imagen en todos los casos es 316 𝜇m de lado.
Figura 4.28. Patrón de difracción (función J inc( )) sin aberraciones. El radio del
disco de Airy es 7.7 𝜇m.
(a) defoco
(b) astigmatismo
(c) coma
(d) esférica
Figura 4.29. Patrones de difracción correspondientes a las aberraciones primarias
cuando el diámetro de la pupila de salida es 10 mm y la distancia entre la pupila
de salida y el plano imagen gaussiano es 100 mm, con 𝜆 = 632.8 nm. El tamaño
del cuadro de la imagen en todos los casos es de 0.316 mm de lado.
Lo primero que podemos observar es que la presencia de cualquiera de
estas aberraciones aumenta el tamaño de la PSF, comparada con la PSF sin
aberraciones de la fig. 4.28. Note que la aberración de defoco corresponde con un patrón de difracción de Fresnel, ya que en este caso el término
2 2
e −ikW (x, y) en la integral de la eq. (4.71) es igual a e −ikad (x +y ) , lo que tiene la
forma del factor cuadrático de Fresnel. El número de zonas de Fresnel que
introduce el defoco en la pupila será N = 2ad w 2 /𝜆 . En el ejemplo, esto es
Difracción
·
305
2 ), donde
N = 3.95. El coeficiente de defoco está dado por ad = −Δs/(2sps
Δs es el desenfoque. En nuestro ejemplo, se tiene que Δs = −1 mm, y el
signo negativo significa que el desenfoque ocurre cuando el plano imagen
se desplaza 1 mm acercándose a la pupila de salida.
En la práctica, la PSF será el resultado de la combinación de las aberraciones. Por ejemplo, la PSF experimental de la fig. 4.1 corresponde con
un sistema óptico (modelo de ojo humano) afectado por defoco (miopía),
astigmatismo y aberración esférica.
4.5.2. Resolución en la imagen (dos puntos)
Desde el punto de vista de la óptica geométrica, si el objeto consiste en
dos puntos separados cierta distancia, en la imagen también tendremos dos
puntos separados una distancia que depende del aumento del sistema. Sin
importar cual sea la distancia que separa los dos puntos del objeto en la imagen siempre podremos observar también dos puntos. Pero como lo mencionamos anteriormente, la imagen de un objeto puntual es una distribución
de irradiancia denominada la PSF. Por lo tanto, la imagen de dos puntos
incoherentes espacialmente será dos patrones de difracción que pueden superponerse (en intensidad) dependiendo de la distancia que separa los dos
puntos. Esto quiere decir que se puede tener una situación en la que los dos
patrones de difracción se superponen dando como resultado una distribución de irradiancia en la que no son distinguibles los patrones individuales.
¿Cuál es la distancia mínima entre estos dos patrones de difracción de modo
que aún se pueda identificar los dos patrones? Esta distancia se denomina
límite de resolución espacial y depende del diámetro de la pupila de salida del
sistema óptico y de la distancia imagen.
Si el sistema formador de imagen está limitado por difracción, el tamaño de la imagen de un objeto puntual se toma igual al disco de Airy. En la
fig. 4.30, se muestra la superposición incoherente de las imágenes de dos
objetos puntuales idénticos cuando están separadas: 2rA , 3rA /2, rA y rA /2,
donde rA es el radio del disco de Airy. La distancia que separa las imágenes se mide desde el centro de cada uno de los patrones de difracción, lo
que corresponde con la distancia de las imágenes puntuales según la óptica
geométrica. Los cálculos se realizaron teniendo en cuenta los mismos parámetros de la fig. 4.28, es decir, cuando la distancia entre la pupila de salida y
el plano imagen gaussiano es sps = 100 mm y el diámetro de la pupila de salida 2w = 10 mm, con 𝜆 = 632.8 nm. En (a), se dibujan los perfiles de cada
uno de los patrones de difracción; en (b), el resultado de la superposición incoherente de los dos patrones de difracción y, en (c), la imagen difractiva de
306
·
Difracción
la superposición. Cuando la separación es 2rA o 3rA /2 las imágenes de los
dos puntos se identifican claramente. Cuando la separación es rA , parte de
los patrones se superponen y aún se puede resolver las dos imágenes difractivas, pero cuando se acercan aún más, a la distancia rA /2, ya no es posible
identificar la imagen de dos objetos puntuales. Aunque entre las distancias
rA y rA /2 se puede tener distancias para las cuales aún se puede resolver las
imágenes, se suele establecer como criterio de resolución la situación en la
que la separación es rA . Este es el criterio de Rayleigh [3]:
las imágenes de dos fuentes puntuales incoherentes están resueltas cuando el centro del patrón de Airy de una de las imágenes cae en el primer mínimo del patrón de Airy de la otra
imagen.
Irradiancia, I (I0)
2rA
1.5rA
rA
0.5rA
1.0
0.5
0
-20
-10
0
10
20
-20
-10
x' (mm)
0
10
20
x' (mm)
-20
-10
0
10
20
-20
-10
x' (mm)
(a)
0
10
20
10
20
x' (mm)
Irradiancia, I (I0)
1.5
1.0
0.5
0
-20
-10
0
x' (mm)
10
20
-20
-10
0
x' (mm)
10
20
-20
(b)
-10
0
x' (mm)
10
20
-20
-10
0
x' (mm)
( c)
Figura 4.30. Superposición incoherente de las imágenes de dos fuentes puntuales
cuando las imágenes están separadas 2rA , 3rA /2, rA y rA /2. (a) Perfiles de la irradiancia de cada imagen, (b) perfiles de la imagen resultante de la superposición de
las dos imágenes, (c) patrones de difracción de la imagen de dos fuentes puntuales.
Ya que rA = 1.22𝜆 d/(2w), para una distancia fija resulta de gran relevancia el tamaño del diafragma de apertura del sistema óptico; a mayor diámetro mejor resolución. Esta es la razón por la que en astronomía es deseable
Difracción
·
307
tener en los telescopios espejos primarios de gran tamaño. Por otra parte, en
otros casos, como en litografía, se puede modificar (disminuir) la longitud
de onda de la luz que proviene del objeto para aumentar la resolución. Esto
mismo ocurre en microscopía electrónica, en la que la longitud de onda es
del orden 1 Å. Por supuesto, la calidad del patrón de difracción depende
de las aberraciones ópticas, las cuales aumentan con el aumento del diámetro del diafragma de apertura. Así que no necesariamente al aumentar el
diámetro del diafragma mejoramos la resolución.
Si las dos fuentes puntuales son coherentes entre sí, el resultado de la
superposición de las imágenes depende de la fase inicial de la luz en cada
una de las fuentes. Por ejemplo, si la diferencia de fase entre las dos fuentes
es 𝜋 se puede disminuir por debajo de rA la distancia entre las imágenes.
Pero si la diferencia de fase es 0, se debe aumentar por encima de rA la
separación de las imágenes para poderlas resolver [24].
Agudeza visual
En óptica visual (optometría y oftalmología), en lugar de usar el concepto
de resolución como se ha explicado arriba, se suele usar el concepto agudeza
visual. En la práctica, es equivalente, pero para el ojo humano se ha establecido una norma que determina las condiciones bajo las cuales se dice que
una persona tiene una buena agudeza visual. Si a una distancia de 20 pies
(∼ 6 m) una persona puede resolver dos líneas separadas 10 de arco, se dice
que esa persona tiene una agudeza visual de 20/20 (ojo emétrope).
Siguiendo el criterio de Rayleigh, el límite de resolución angular está
dado por
rA
𝜆
(Δ𝜃)mı́n =
= 1.22
.
(4.72)
sps
(2w)
Para el ojo emétrope, el límite de resolución será (Δ𝜃)mı́n _o jo = 10. Tomando 540 nm como el valor de la longitud de onda en el centro del espectro visible, el diámetro de la pupila del ojo para el cual se obtiene el valor
del límite de resolución será 2w = 2.3 mm. Si consideramos el ojo esquemático de Gullstrand-Emsley (fig. 1.68), donde f 0 = 22.05 (∼ sps ), se tiene
que el tamaño de una fuente puntual en la retina será una mancha circular
de 12.8 𝜇m de diámetro.
4.5.3. Imagen de un objeto extendido
Un objeto se puede considerar como un conjunto (infinito) de puntos. Ya sabemos (por lo dicho en la sección anterior) cómo se forma la imagen de un
308
·
Difracción
objeto puntual, esto es la PSF dada por la eq. (4.71). La generalización a un
conjunto de puntos no es inmediata, sino que depende del grado de coherencia de la iluminación del objeto. Por ejemplo, para el caso incoherente
la imagen está dada por
Ii (x 0) = Io (x 0) ∗ PSF ,
(4.73)
donde Io (x 0) representa la imagen gaussiana, PSF es la función que describe
la PSF difractiva (eq. (4.71)) y el símbolo ∗ la operación de convolución. Lo
anterior significa que cada punto de la imagen gaussiana es afectado por la
PSF del sistema de la misma manera.7
Para el caso de iluminación coherente la situación es más compleja, ya
que la convolución de la imagen gaussiana se debe realizar con una función
que depende del sistema óptico (geometría de la pupila y aberraciones ópticas) y de las características del objeto (contenido de frecuencias espaciales).
En otras palabras, si cambiamos el objeto (manteniendo el mismo sistema
óptico), cambia la función [27], [28]. Una situación similar se tiene con luz
parcialmente coherente. En Mejía [29], se puede ver una generalización del
proceso formador de imagen con luz parcialmente coherente.
7 Esto
es válido solo en la región paraxial. Para campos de visión mayores, se debe tener
en cuenta que la PSF varía con el ángulo. Por ejemplo, la aberración de coma aumenta a
medida que el rayo principal aumenta su inclinación.
Difracción
·
309
4.6. Rejillas de difracción
Una rejilla de difracción consiste en un gran número de elementos idénticos
que difractan la luz. Estos elementos pueden ser aberturas en una pantalla
opaca, escalones o surcos sobre un sustrato o incluso un patrón de interferencia de franjas rectas paralelas grabado en amplitud o fase en un material
fotosensible. La posición de los máximos de irradiancia producidos por las
rejillas de difracción es función de la longitud de onda, por lo que las rejillas de difracción encuentran una gran aplicación en la medida espectral de
longitud de onda de la luz.
En esta unidad, se analiza una configuración básica de rejilla de difracción, la cual consiste en un arreglo de N aberturas rectangulares de ancho
b y largo c separadas entre sí una distancia a (> b), como se muestra en la
fig. 4.31. Suponiendo que b c, entonces basta con analizar el patrón de
difracción en una sola dimensión a lo largo de la distribución de las aberturas (eje x en la figura). La distancia a la que se suele observar el patrón
de difracción producido por rejillas de difracción es tal que d N a, por
lo que el patrón de difracción observado corresponde con la difracción de
Fraunhofer.
y
a
x
y'
x'
d
A
z
Figura 4.31. Arreglo de N aberturas rectangulares idénticas.
En el caso unidimensional, el perfil de cada una de las aberturas se puede describir mediante la función rect( ), que ya hemos visto en la sección
4.3.3. Por otra parte, en la unidad 3.6 hemos visto la interferencia de N
fuentes puntuales (fig. 3.47(b)). La interferencia de N fuentes con geometría rectangular equivale a la difracción del arreglo de aberturas rectangulares. Suponiendo que iluminamos el arreglo de aberturas con una onda
plana de amplitud E0 en dirección ortogonal, el campo óptico en el arreglo
310
·
Difracción
de aberturas se puede escribir de manera sencilla como
E(x) = E0 rect
N
x Õ
∗
𝛿 (x − ja),
b
(4.74)
j=1
donde 𝛿 (x − ja) determina la posición de la j-ésima abertura, y con la operación de convolución copiamos la forma rectangular de las aberturas en
cada punto localizado en x = ja. La difracción de Fraunhofer será
I (x 0) =
E02 (𝜖 0 c/2)
𝜆 2d2
2

∫∞ 
N
x Õ
 −i2𝜋x0 x/𝜆 d

rect
∗
𝛿 (x − ja)  e
dx , (4.75)

b


j=1
−∞ 

lo que resulta ser
sin(𝜋x 0b/𝜆 d)
I (x 0) = I0
(𝜋x 0b/𝜆 d)
2
N
Õ
2
e
−i2𝜋x0 ( ja)/𝜆 d
.
(4.76)
j=1
En I0 , hemos reunido a (𝜖 0 c/2) (E0 /𝜆 d) 2 y las demás constantes que salen
de la integral. La sumatoria del segundo factor de la derecha de la igualdad se resuelve de la misma forma como lo hicimos para la eq. (3.101). El
resultado final es
I (x 0) = I0
sin(𝜋x 0b/𝜆 d)
(𝜋x 0b/𝜆 d)
2
sin(N 𝜋x 0 a/𝜆 d)
sin(𝜋x 0 a/𝜆 d)
2
.
(4.77)
Esta integral se diferencia de la integral dada en la eq. (3.104) en el término correspondiente a la difracción de una sola abertura. Así, el patrón
de difracción producido por un arreglo de N aberturas idénticas es igual al
patrón de interferencia de N fuentes puntuales (localizadas en el centro de
las aberturas) modulado por el patrón de difracción de una de las aberturas.
En la fig. 4.32, se muestra el perfil del patrón de difracción para un arreglo de 8 aberturas rectangulares idénticas separadas a = 4b. El arreglo se
ubica de manera simétrica con respecto al eje óptico (eje z en la fig. 4.31).
En la figura se incluye el perfil de difracción (curva segmentada) de una
abertura, y resulta evidente la modulación que esta produce en el patrón
de interferencia generado por 8 fuentes puntuales ubicadas en el centro de
las aberturas. La unidad de la escala horizontal está dada como 𝜆 d/a, esto
es, la separación entre los máximos principales del patrón de interferencia.
Por otra parte, a las distancias ±m 0𝜆 d/b (m 0 = 1, 2, 3, ...) con respecto al
centro en 0 (eje óptico) se tienen los ceros del patrón de difracción. Ya que
·
Difracción
311
a = 4b, el máximo principal del patrón de interferencia ubicado en 4(𝜆 d/a)
cae justo en el primer cero del patrón de difracción ubicado en 𝜆 d/b, por
lo que allí no se observa el máximo de la interferencia. En el lóbulo central,
tendremos 2(a/b) − 1 máximos principales, mientras que en los lóbulos laterales tendremos (a/b) − 1 máximos principales. Los máximos principales
se ubican en ±m𝜆 d/a (m = 0, 1, 2, 3, ...) y con m se etiquetan los máximos
como el orden de difracción. Así, el máximo central será el orden cero de difracción, los dos máximos más próximos al central serán los órdenes +1 y
−1 de difracción, y así sucesivamente.
64
ld/b
Irradiancia, I (I0)
56
48
40
32
24
16
8
0
-8
-7
-6
-5
-4
-3
-2
-1
0
1
x' (ld/a)
2
3
4
5
6
7
8
Figura 4.32. Patrón de difracción producido por una arreglo de 8 aberturas rectangulares idénticas separadas a = 4b, con b el ancho de cada abertura. La curva
segmentada corresponde con el patrón de difracción de una sola abertura.
Al aumentar N la energía en los máximos secundarios disminuye (acercándose a cero) y los máximos principales tienen la forma de picos muy
agudos. El pico de orden m subtiende el ángulo 𝜃 m con respecto al centro
de la rejilla (en el eje óptico) y está dado por
tan 𝜃 m = m
(𝜆 d/a)
.
d
(4.78)
En la aproximación de Fraunhofer, podemos cambiar la función tan( ) por
la función sin( ) de modo que la ecuación de la rejilla de difracción que
ubica angularmente un orden de difracción es
m𝜆 = a sin 𝜃 m .
(4.79)
Cuando la fuente de iluminación es policromática, en el orden cero tendremos un máximo del mismo color que el de la fuente, pero para m ≠ 0
312
·
Difracción
tendremos máximos de diferente color separados espacialmente. Por ejemplo, si la fuente es de luz blanca, se verá un espectro continuo para un m dado
(≠ 0).
Si el espectro de la fuente consiste en dos longitudes de onda, ¿cuál es la
mínima diferencia en longitud de onda que se puede resolver en el patrón
de difracción? Este problema se puede tratar de manera similar a como se
trató la resolución espacial de dos imágenes puntuales en la unidad anterior.
La eq. (3.112) permite determinar la separación de los mínimos entre los
máximos principales del patrón de interferencia de N fuentes. La separación entre dos mínimos consecutivos estará dada por
Δx 0 =
𝜆d
,
Na
(4.80)
lo que a su vez es la mitad del ancho de los máximos principales. Si aplicamos el criterio de Rayleigh, entonces Δx 0 será la mínima separación en x 0
entre los máximos de difracción para dos longitudes de onda 𝜆 y 𝜆 + Δ𝜆
para un orden de difracción m. Por otro lado, la separación angular entre
los dos máximos se puede calcular de la siguiente manera: sea x 0 la posición
del máximo de orden m, entonces x 0/d = tan 𝜃 m ≈ sin 𝜃 m , de donde
Δx 0
= Δ𝜃 m cos 𝜃 m .
d
(4.81)
Reemplazando la eq. 4.80 en la eq. 4.81, se tiene que la separación angular
es igual a
𝜆
.
(4.82)
Δ𝜃 m =
N a cos 𝜃 m
Por otra parte, de la eq. (4.79) también se puede evaluar la separación
angular. Diferenciando se tiene que
mΔ𝜆 = aΔ𝜃 m cos 𝜃 m ,
es decir
Δ𝜃 m =
mΔ𝜆
.
a cos 𝜃 m
(4.83)
(4.84)
El poder de resolución de la rejilla de difracción8 se define como
<=
8 El
𝜆
,
(Δ𝜆 )mı́n
(4.85)
poder de resolución en una rejilla de difracción es una medida de la capacidad para
separar espacialmente dos longitudes de onda.
Difracción
·
313
donde (Δ𝜆 )mı́n es la diferencia en longitud de onda que se puede resolver
alrededor de la longitud de onda 𝜆 . Al igualar las eqs. (4.82) y (4.84,) se
tiene que el poder de resolución de la rejilla también se puede escribir como
< = N m.
(4.86)
Entonces, el poder de resolución aumenta con N y el orden de difracción
m.
En una rejilla de difracción, la densidad de elementos difractantes (aberturas) suele ser de cientos o miles por milímetro. Esta densidad es el parámetro que se suele usar para caracterizar la rejilla y su valor se da en líneas
por milímetro. Una línea equivale a un elemento difractante. Por ejemplo,
en el catálogo de una tienda de elementos ópticos, una rejilla de difracción,
de 12.5 mm de ancho, tiene 500 líneas/mm. A partir de esta información
encontramos que N = 6250. Si iluminamos completamente la rejilla con
una onda plana, el poder de resolución con el orden m = 1 será < = 6250.
Entonces, para una señal luminosa alrededor de 𝜆 = 540 nm, podremos
separar dos longitudes de onda cuya diferencia sea (Δ𝜆 )mı́n = 0.086 nm.
Si el análisis se hace para el segundo orden de difracción, la diferencia en
longitudes de onda será (Δ𝜆 )mı́n = 0.043 nm.
En la práctica, las rejillas se diseñan de tal manera que se pueda controlar
la cantidad de luz en los órdenes de difracción. En el caso de la rejilla plana
iluminada ortogonalmente, la mayor parte de la luz está en el orden cero,
donde no se puede resolver el espectro. Entonces, sería conveniente tener
la mayor parte de la luz en el orden 1 o 2. Lo anterior se puede hacer,
por ejemplo, grabando escalones inclinados en la superficie de un espejo.
Si además el espejo es cóncavo, se logra enfocar los diferentes órdenes de
difracción, lo que es común en los espectrómetros. Para una ampliación de
este tema, se puede consultar los libros Diffraction Gratings and Application
[30] y Diffraction Grating Handbook [31].
Apéndice
A
Trazo de rayos
Trazo de rayos
·
317
Considerando la aproximación paraxial, se puede establecer un método para propagar un rayo óptico en un sistema de superficies refractoras o reflectoras. Lo anterior permite medir las propiedades paraxiales del sistema
óptico, a saber: puntos focales, puntos principales y puntos nodales.
En la fig. A.1, se indican los ángulos u y u 0 de inclinación de los rayos
incidente y refractado en una superficie esférica de radio R, y la altura y
del rayo incidente en la superficie esférica. En la aproximación paraxial, la
altura del rayo en la superficie se mide a lo largo de la línea segmentada que
pasa por el vértice V de la superficie y las tangentes de los ángulos se toman
como los ángulos (en radianes). Por lo tanto,
y
u=−
(A.1)
s
y
y
(A.2)
u0 = − 0 .
s
.
V
- u'
s'
R
-s
y
.
u
n
n'
Figura A.1. Altura y ángulos de inclinación de un rayo en una superficie esférica
refractora.
Multiplicando por la altura y la ecuación de Gauss para la superficie esférica refractora (eq. 1.21), se tiene que
n 0 y ny
n0 − n
−
=
y
.
s0
s
R
(A.3)
Y a partir de las eqs. (A.1) y (A.2), se llega a
n 0u 0 = nu − (n 0 − n)cy,
(A.4)
donde c = 1/R es la curvatura de la superficie. La eq. (A.4) permite propagar
el ángulo de inclinación del rayo a lo largo del sistema óptico.
Para generalizar la propagación en varias superficies, consideremos dos
superficies esféricas de un sistema óptico, como en la fig. A.2. La ecuación
para propagar el ángulo desde la izquierda hacia la derecha de la superficie
j queda
n j u j = n j−1 u j−1 − P j y j ,
(A.5)
318
·
Trazo de rayos
donde P j = (n j −n j−1 )c j es la potencia refractora. Aquí se tiene que n 0j−1 = n j ,
y c j = 1/R j .
n j-1
u j-1
uj
yj
nj
n j+1
y j+1
u j+1
tj
j
j+1
Figura A.2. Propagación de un rayo en dos superficies.
Por otro lado, el objeto de la ( j + 1)-ésima superficie será la imagen de
la j-ésima superficie, por lo que las distancias se relacionan mediante la separación o espesor t j entre las superficies como
s j+1 = s 0j − t j ,
(A.6)
y j+1
yj
= − − tj ,
uj
uj
(A.7)
que es igual a
−
es decir,
y j+1 = y j + 𝜏j (n j u j ),
(A.8)
donde 𝜏j = t j /n j es el espesor reducido.
Entonces, mientras que con la eq. (A.5) propagamos el ángulo, con la eq.
(A.8) propagamos la altura. Con estas dos ecuaciones, podemos ver cómo
evoluciona un rayo en un sistema óptico con cualquier número de superficies refractoras y/o reflectoras. Las eqs. (A.5) y (A.8) son la base del método
y-nu de trazo de rayos paraxial [12].
Distancia focal de un conjunto de lentes
A partir de la eq. (A.5), se puede determinar la distancia focal de un conjunto
de superficies refractoras (lentes). Supongamos que tenemos M superficies
Trazo de rayos
·
319
refractoras. Entonces, para las M superficies
nM uM = nM−1 uM−1 − PM yM
nM−1 uM−1 = nM−2 uM−2 − PM−1 yM−1
.
.
.
n1 u1 = n0 u0 − P1 y1 ,
(A.9)
y sumando se llega a
nM uM = n0 u0 −
M
Õ
Pj y j .
(A.10)
j=1
La distancia focal del sistema se determina cuando s0 = −∞, es decir,
u0 = 0 (y y1 = y0 ). Por lo tanto,
f =−
y1
,
uM
(A.11)
y
M
1 Õ yj
1
=
Pj .
f
nM
y1
(A.12)
j=1
Distancia focal de una lente simple
n0= 1
n 1 = nl
n 2 =1
u0= 0
y0
u1
y1
y2
t
V P
0
u2
P' V'
1
2
F'
3
H H'
Figura A.3. Cálculo de la distancia focal de una lente.
Como resultado particular de la eq. (A.12), vamos a calcular la distancia
focal de una lente de espesor t sumergida en aire. En la fig. A.3, se ilustra
320
·
Trazo de rayos
la geometría para el cálculo de la distancia focal. En este caso, M = 2 y
n0 = n2 = 1. Luego, la eq. (A.12) se reduce a
y2
1
= P1 + P2 .
f
y1
(A.13)
Empleando la eq. (A.8) para y2 , se tiene
1
𝜏1 (n1 u1 )
= P1 + P2 + P2
,
f
y1
(A.14)
y, con la eq. (A.5) para n1 u1 , se llega a
1
t
= P1 + P2 − P1 P2 ,
f
nl
(A.15)
donde nl = n1 y t = t1 . Esta última ecuación equivale a
1 (nl − 1) (1 − nl ) (nl − 1) (1 − nl ) t
=
+
−
.
f
R1
R2
R1
R2 nl
(A.16)
Así, se obtiene el resultado para la distancia focal de una lente de espesor t
dada en la eq. (1.50), es decir,
1
1
1
(n − 1) 2 t
= (nl − 1)
−
+ l
.
f
R1 R2
R1 R2 nl
(A.17)
Planos principales
Los planos principales se pueden ubicar con respecto a los vértices de la
lente. Así, el plano principal secundario estará a la distancia V0P0 del vértice
V0 y el plano principal primario estará a la distancia VP del vértice V. La
distancia entre V0 y F0 se denomina distancia focal posterior, fp = V0F0
y la distancia entre V y F se denomina distancia focal anterior, fa = VF.
Entonces,
V0P0 = fp − f
(A.18)
y como
y1 y2
= ,
f
fp
de la eq. (A.8), se tiene
fp = f
y, con la eq. (A.5),
y1 + 𝜏1 (n1 u1 )
y1
(A.19)
Trazo de rayos
fp = f
y1 + 𝜏1 (−P1 y1 )
,
y1
·
321
(A.20)
tP1
.
nl
(A.21)
t(nl − 1)
.
nl R1
(A.22)
fp = f − f
Por lo tanto,
V0P0 = −f
Note que V0P0 depende de la potencia de la primera cara de la lente. Si esta
es cero (r1 = ∞), entonces el plano principal secundario se localiza en V0.
Para determinar VP, podemos considerar que se gira la lente y se realiza
el mismo procedimiento del caso anterior, por lo tanto, se tiene que
VP = − f
t(nl − 1)
.
nl R2
(A.23)
Distancia focal de un conjunto de lentes delgadas
Si aproximamos un conjunto de lentes N por lentes delgadas (sumergidas
en aire), la eq. (A.12) se simplifica de la siguiente manera
N
1 Õ yk 1
=
,
f
y1 fk
k=1
donde yk es la altura del rayo en la k-ésima lente y fk la distancia focal de la késima lente. Por ejemplo, la distancia focal de dos lentes delgadas separadas
una distancia d estará dada por
1 1 y2 1
=
+
.
f
f1 y1 f2
Empleando la eq. (A.8) para y2 y luego la eq. (A.5) para (n1 u1 ), se llega al
resultado conocido
1 1 1
1 1
=
+ −
d.
f
f1 f2 f1 f2
Apéndice
B
Índice de
refracción
Índice de refracción
·
325
El índice de refracción en un medio mide el cambio de la velocidad de la
luz en el medio con respecto a la velocidad de la luz en el vacío. Ya que
la velocidad de la luz en un medio depende de la frecuencia 𝜈, entonces el
índice de refracción también depende de la frecuencia. Denotando por n el
índice de refracción, 𝜐 la velocidad de la luz en el medio y c la velocidad de
la luz en el vacío, el índice de refracción está dado por
n(𝜈) =
c
,
𝜐 (𝜈)
(B.1)
ecuación conocida también como relación de dispersión.
Desde el punto de vista microscópico, en una aproximación clásica, el
cambio de la velocidad ocurre por el cambio de fase de la onda electromagnética reemitida por los dipolos eléctricos inducidos que componen el
medio con respecto a la onda electromagnética incidente (de velocidad c).
El índice de refracción en materiales dieléctricos
Para obtener un primer modelo del índice de refracción en un medio dieléctrico, vamos a suponer inicialmente que el medio en presencia de un campo
eléctrico externo está compuesto por N dipolos inducidos del tipo p = −er
(electrón ligado a un átomo) por unidad de volumen. Ya que el dipolo está
rodeado de otros dipolos, en presencia de una onda electromagnética armónica de amplitud E0 y frecuencia 𝜈, el dipolo oscilará de manera similar
a como lo hace un oscilador armónico amortiguado - forzado. Entonces, si
E = E0 e −i𝜔t
(B.2)
representa la onda armónica, con 𝜔 = 2𝜋 𝜈, la fuerza eléctrica sobre la carga
e será
F = −eE.
(B.3)
El vector de desplazamiento de la carga e estará determinado por la ecuación
d2r
dr
me 2 + me 𝛾 + kr = −eE0 e −i𝜔t ,
(B.4)
dt
dt
donde me es la masa de la carga e, 𝛾 la constante de amortiguación (debido a
la presencia de los otros dipolos) y k la constante que da cuenta de la fuerza
que mantiene ligada la carga al átomo.
En el estado estacionario, la respuesta del dipolo será
r = r0 e −i (𝜔t+𝛿) ,
(B.5)
326
·
Índice de refracción
es decir, oscilará con la misma frecuencia de la onda incidente, pero con un
desfase 𝛿. Reemplazando la eq. (B.5) en la eq. (B.4), se llega a
r0 =
(𝜔02
−eE0 /me
e i𝛿 .
2
− 𝜔 ) − i𝛾𝜔
(B.6)
con 𝜔02 = k/me . Con este resultado, se tiene que
r=−
(𝜔02
(e/me )
E,
− 𝜔 2 ) − i𝛾𝜔
(B.7)
y el vector de polarización eléctrico inducido P = −N er será
P=
N e 2 /me
E.
(𝜔02 − 𝜔 2 ) − i𝛾𝜔
(B.8)
Entonces, el efecto macroscópico de la onda electromagnética incidente
en el medio es un vector de polarización, el cual es proporcional a E. En
general, lo anterior se escribe como
(B.9)
P = 𝜖 0 𝜒 E,
donde 𝜖 0 es la permitividad del vacío (una constante) y 𝜒 la susceptibilidad
eléctrica del medio, la cual mide el grado de proporcionalidad con E y se
define como 𝜒 = 𝜖 /𝜖 0 − 1, donde 𝜖 es la permitividad del medio.
Por otro lado, en medios dieléctricos (no magnéticos), se tiene que el
vector de polarización magnético, M = 0, el vector de densidad de corriente
eléctrica, J = 0 y la densidad de carga libre, 𝜌 = 0. Así, las ecuaciones de
Maxwell para el medio tienen la forma
∇ × E = − 𝜇0
∇ × H = 𝜖0
𝜕H
,
𝜕t
(B.10)
𝜕E 𝜕P
+
,
𝜕t
𝜕t
∇·E=−
(B.11)
∇·P
,
𝜖0
(B.12)
∇ · H = 0,
(B.13)
donde H es el vector magnético y 𝜇 0 la permeabilidad del vacío.
La ecuación de onda que resulta de tomar ∇× (∇×E) = − 𝜇 0 𝜕(∇×H)/𝜕t
y las eqs. (B.11) y (B.9) es
∇(∇ · E) − ∇2 E = − 𝜇 0 𝜖 0 (1 + 𝜒 )
𝜕2E
.
𝜕t 2
(B.14)
Índice de refracción
·
327
Medios isotrópicos
Un medio se dice isotrópico si sus propiedades físicas no dependen de la
dirección. En particular, en óptica, se dice que el medio es isotrópico si el
índice de refracción no depende de la dirección. Lo anterior implica que en
la eq. (B.9) la susceptibilidad eléctrica se describe mediante un escalar. En
caso contrario, en un medio anisotrópico (en el que el índice de refracción
sí depende de la dirección), la susceptibilidad eléctrica se describe mediante
un tensor (matriz de 3 × 3).
Suponiendo que el medio dieléctrico es isotrópico, entonces en la eq.
(B.12) se tiene que
∇ · (𝜖 0 E + 𝜒 𝜖 0 E) = (1 + 𝜒 )∇ · E = 0,
(B.15)
lo cual implica que ∇ · E = 0, ya que 𝜒 > 0. Por lo tanto, la ecuación de
onda para el medio dieléctrico isotrópico está dada por
∇2 E = 𝜇 0 𝜖 0 (1 + 𝜒 )
𝜕2E
,
𝜕t 2
(B.16)
por lo que la velocidad de la luz en el medio se determina de
1
= 𝜇 0 𝜖 0 (1 + 𝜒 ).
𝜐2
(B.17)
Ya que c 2 = 1/ 𝜇 0 𝜖 0 , entonces el índice de refracción resulta ser
n2 = 1 + 𝜒 .
(B.18)
Y con el resultado obtenido para el medio del ejemplo dado por la eq. (B.8),
se llega a
1
N e2
2
.
n2 = 1 +
(B.19)
me 𝜖 0 (𝜔0 − 𝜔 2 ) − i𝛾𝜔
Partiendo del resultado anterior, se logra una generalización del medio
si suponemos que en lugar de un solo tipo de dipolos eléctricos se tienen
M tipos de dipolos. Si N j es la densidad volumétrica del j-ésimo tipo de
dipolos, entonces
Nj
(B.20)
N
Í
es la fracción del j-ésimo tipo de dipolos y se satisface M
j=1 g j = 1. Con
esto en mente, se puede escribir el índice de refracción de un modo general
como
M
gj
N e2 Õ
2
h
i,
n =1+
(B.21)
me 𝜖 0
(𝜔 2 − 𝜔 2 ) − i𝛾 𝜔
gj =
j=1
0j
j
328
·
Índice de refracción
donde ahora se tienen varias frecuencias propias 𝜔0 j y constantes de amortiguamiento 𝛾 j correspondientes a cada tipo de dipolos.
Según la eq. (B.21), el índice de refracción es una cantidad de variable
compleja, es decir, n = nR + inI . Tomando las partes real e imaginaria del
cuadrado del índice de refracción se llega a
nR2
−
nI2
M
(𝜔02 j − 𝜔 2 )
N e2 Õ
i gj
h
=1+
me 𝜖 0
2
2 2
2 2
j=1 (𝜔0 j − 𝜔 ) + 𝛾 j 𝜔
(B.22)
M
𝛾j𝜔
N e2 Õ
h
i gj .
me 𝜖 0
2
2 2
2 2
j=1 (𝜔0 j − 𝜔 ) + 𝛾 j 𝜔
(B.23)
y
2nR nI =
Parte real del índice, nR
Este modelo, aunque requiere ajustes para ser aplicado en casos reales,
permite ver la dependencia del índice de refracción con la frecuencia. Por
otro lado, nos muestra que el índice de refracción tiene dos componentes,
una real, nR , con la que podemos explicar la refracción, y una imaginaria,
nI , que da cuenta de la absorción en el medio.
Dispersión
normal
1
Parte imaginaria del índice, n I
0
01
02
1
Bandas de
absorción
0
 01
 02
Frecuencia angular, 
Figura B.1. Comportamiento general de las partes real e imaginaria del índice de
refracción de acuerdo con las eqs. (B.22) y (B.23).
Índice de refracción
·
329
En la fig. B.1 se muestra el comportamiento general de nR y nI a partir
de las eqs. (B.22) y (B.23) para dos frecuencias de resonancia 𝜔01 y 𝜔02 .
Las constantes de amortiguamiento 𝛾 j suelen ser pequeñas en comparación
con las respectivas frecuencias de resonancia 𝜔0 j . Cuando 𝜔 ≈ 𝜔0 j la parte
imaginaria del índice de refracción toma valores relevantes lo que da lugar
a bandas de absorción. Cuando 𝜔 se aleja de las frecuencias de resonancia
la parte imaginaria del índice de refracción es prácticamente cero y la parte
real del índice de refracción aumenta con la frecuencia. A este comportamiento se le denomina dispersión normal. Cuando la parte real del índice
de refracción disminuye con la frecuencia se denomina dispersión anómala
(región donde ocurre la absorción).
La velocidad de la luz en el medio también se puede dar en términos de
la permitividad 𝜖 y la permeabilidad 𝜇 del medio (que también dependen
de la frecuencia de la onda electromagnética que incide en el medio), es
decir
1
= 𝜇𝜖 .
(B.24)
𝜐2
Por lo tanto, el índice de refracción queda
n2 =
𝜇𝜖
.
𝜇0𝜖 0
(B.25)
Para materiales no magnéticos, se puede hacer la aproximación 𝜇 ≈ 𝜇 0 ,
por lo que en este caso el índice de refracción se puede calcular como
r
𝜖
.
(B.26)
n=
𝜖0
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
Apéndice
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
C
n -1
n -1
n -1
n -1
V= n -n
V= n -n
V= n -n
V= n -n
Vidrios ópticos
d
F
d
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
F
d
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
F
d
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
n -1
V = nd - n
F
C
Vidrios ópticos
·
333
El índice de refracción varía con la velocidad de la onda electromagnética en el medio, como se muestra en el apéndice B. A su vez, la velocidad
depende la frecuencia de la onda (o de la longitud de onda en el vacío, mediante 𝜆 = c/𝜈, donde 𝜈 es la frecuencia de la onda). En función de la
longitud de onda, lejos de las frecuencias de resonancia, el índice de refracción disminuye al aumentar la longitud de onda. Cerca de las frecuencias
de resonancia, donde ocurre absorción, el índice de refracción aumenta. Lo
anterior se puede entender mediante la relación de dispersión obtenida en
la Eq, (B.21). En la práctica, para cada medio se obtiene empíricamente la
relación de dispersión en función de la longitud de onda. Por ejemplo, el
vidrio empleado para las láminas portaobjetos de microscopio, soda lime silica, se puede caracterizar en el rango visible mediante la relación obtenida
por Rubin [32]
n = 1.5130 − 0.003169𝜆 2 + 0.003962𝜆 −2
(C.1)
Otra manera de caracterizar los vidrios ópticos se hace mediante el índice de refracción en tres longitudes de onda correspondientes a dos líneas
espectrales del hidrógeno y a una línea espectral del helio, como se muestra
en el tabla D.1.
Tabla C.1. Líneas espectrales para caracterizar los vidrios ópticos.
Línea
F
d
C
Longitud de onda
486.13
587.56
656.27
Elemento
H
He
H
Color
azul
amarillo
rojo
Con estas líneas espectrales, se abarca el rango visible. Estas se usan para
el análisis de las aberraciones cromáticas. Los índices para los correspondientes colores se denotan por nF , nd , y nC . Por otro lado, para tener una
medida de la dispersión cromática, se define
V =
nd − 1
,
nF − nC
(C.2)
conocido como el número de Abbe. Usualmente, cuando se dice que el índice de refracción de un medio es n, por defecto (salvo que se mencione lo
contrario) este valor corresponde con el índice nd .
Los vidrios ópticos se fabrican a partir de SiO2 y una combinación de
metales ligeros (vidrio crown) o metales pesados (vidrio flint), con lo que se
logra fijar los índices de refracción y el número de Abbe deseado.
334
·
Vidrios ópticos
Figura C.1. Diagrama de vidrios ópticos de la compañía Schott.
En la fig. C.1, se muestra un diagrama de vidrios de la compañía Schoot
según el índice de refracción nd y el número de Abbe. Cada vidrio se identifica con un punto etiquetado en la gráfica nd vs V . Así, los vidrios utilizados
en la fabricación de elementos ópticos (lentes, prismas, espejos, etc) se identifican con el nombre del vidrio (y no con el índice).
Por ejemplo, consideremos un doblete acromático fabricado por una
compañía. El catálogo dice que la primera lente está hecha de vidrio BK7
y la segunda está hecha de vidrio SF5. La diferencia de los vidrios tiene
por objeto corregir la aberración cromática axial (para los colores azul y
rojo). En la fig. C.1, podemos ver que el índice nd para el vidrio BK7 es
1.52 ± 0.05 (1.5168) y su número de Abbe 64.0 ± 0.5 (64.17); y el índice nd para el vidrio SF5 es 1.68 ± 0.05 (1.6727) y su número de Abbe
32.0 ± 0.5 (32.21).
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
F
C
Apéndice
d
d
C
F
C
d
F
d
F
C
D
Aberraciones
cromáticas
d
C
F
C
d
F
d
F
C
d
F
C
d
C
F
C
d
F
d
F
C
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
d
C
F
C
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
C
d
C
F
C
d
F
C
d
F
d
C
F
C
d
F
d
C
F
d
F
d
C
F
C
C
Aberraciones cromáticas
·
337
En el capítulo 1 tratamos la formación de imagen para una sola longitud de
onda. Cuando la luz que proviene del objeto es policromática, los parámetros que dependen del índice de refracción cambian según el color de la luz.
Por ejemplo, la distancia focal de una lente, eq. (1.50), y la posición de los
planos principales, eqs. (1.51) y (1.52). En consecuencia, para cada color
tendremos una imagen de diferente tamaño y en diferente posición axial.
Consideremos las tres longitudes de onda con las que se caracterizan los
vidrios ópticos
Tabla D.1. Líneas espectrales para caracterizar los vidrios ópticos.
Línea
F
d
C
Longitud de onda
486.13
587.56
656.27
Elemento
H
He
H
Color
azul
amarillo
rojo
Denotando las distancias focales para estos colores como fF , fd y fC , las
ecuaciones para localizar la imagen en cada caso son
1
1
1
−
= ,
0
sF sF
fF
(D.1)
1 1
1
− = ,
0
sd sd
fd
(D.2)
1
1
1
−
= .
0
sC sC
fC
(D.3)
En el caso de una lente, la distancia entre el objeto y la primera superficie
de la lente es igual en los tres casos, es decir, sF − (VP)F = sd − (VP)d =
sC − (VP)C . Lo anterior también implica que, en general, la distancia objeto
es diferente según el color. Para la imagen, la situación es un poco más
compleja, ya que en general sF0 + (V0P0)F ≠ sd0 + (V0P0)d ≠ sC0 + (V0P0)C .
La diferencia axial entre las posiciones de las imágenes correspondientes
a las líneas espectrales F y C
AchrL = sF0 + (V0P0)F − sC0 + (V0P0)C
= sF0 − sC0 + (V0P0)F − (V0P0)C
(D.4)
se denomina aberración cromátical axial. Por ejemplo, en la fig. D.1 se muestra la posición de las imágenes para las líneas espectrales F, d y C, para una
lente de distancia focal fd = 50 mm (R1 = 25.84 mm, R2 = ∞, espesor
338
·
Aberraciones cromáticas
t = 4.5 mm, vidrio BK7) cuando el objeto se encuentra a sd = −100 mm,
lo que da un aumento md = −1. En este ejemplo el plano principal primario
se localiza en el vértice de la primera superficie, por lo tanto, sd = sF = sC .
-s
AchrL
F
-h
d
C
Figura D.1. Aberración cromática axial en una lente positiva.
En la tabla D.2, se resumen los parámetros de este ejemplo. Todas las
distancias (salvo la longitud de onda) están dadas en mm. El aumento se
denota por m.
Tabla D.2. Parámetros de una lente positiva y la imagen según las líneas espectrales para caracterizar los vidrios ópticos cuando el objeto está a -100 mm del plano
principal primario.
Línea
F
d
C
𝜆 (nm)
486.13
587.56
656.27
f
49.46
50.00
50.24
V0P0
-3.21
-3.23
-3.23
s0
94.67
96.77
97.73
m
-0.9788
1
-1.0097
A partir de estos datos, se tiene que la aberración cromática axial es
AchrL = −3.05 mm.
Supongamos que el objeto es puntual y el sistema está libre de aberraciones primarias monocromáticas (Seidel), entonces tendremos para las líneas espectrales F, d y C tres puntos imagen localizados en sF0 = 94.67
mm, sd0 = 96.77 mm y sC0 = 97.73 mm, respectivamente. ¿Dónde debemos colocar el plano imagen? Si lo colocamos en sF0 , tendremos un punto
azul enfocado, pero las imágenes en amarillo y rojo estarán desenfocadas.
Situaciones análogas se tienen si ubicamos el plano imagen en sd0 y sC0 . Sin
embargo, en medio de las imágenes en azul y rojo se tendrá el círculo de
menor confusión y este será el lugar donde veremos la mejor imagen. Al enfocar en sF0 , se tendrá una mancha roja de mayor extensión que la mancha
en amarillo. Por otra parte, al enfocar en sC0 se tendrá una mancha azul de
mayor extensión que la mancha en amarillo. Esto tiene como consecuencia
que al observar un objeto policromático con una lente simple (como la del
ejemplo en la fig. D.1) al enfocar en sF0 el borde de la imagen se ve de color
Aberraciones cromáticas
·
339
rojo, mientras que si enfocamos en sC0 , el borde de la imagen se ve de color
azul.
Ya que el aumento también depende de la longitud de onda en un plano
imagen, tendremos la superposición de imágenes de distinto color y tamaño
(una enfocada y las demás desenfocadas). Si hF0 = mF h y hC0 = mC h son las
alturas de la imagen, la diferencia
AchrT = hF0 − hC0
(D.5)
se define como aberración cromática transversal.
Con una lente negativa, el orden en el que se ubican las imágenes para
cada color es contrario al de la lente positiva. Podemos ver esto con un
ejemplo similar al de la lente positiva. Para una lente de distancia focal fd =
−50 mm (R1 = −25.84 mm, R2 = ∞, espesor t = 3.5 mm, vidrio BK7)
cuando el objeto se encuentra a sd = −100 mm, la imagen virtual para el
color azul está más cerca de la lente que la imagen para el color rojo (y la
imagen en amarillo en medio), fig. D.2.
-s
C F
-h
Figura D.2. Aberración cromática axial en una lente negativa.
En la tabla D.3, se muestra los valores de las distancias. La aberración
cromática en este caso es AchrL = 0.36 mm.
Tabla D.3. Parámetros de una lente negativa y la imagen virtual según las líneas
espectrales para caracterizar los vidrios ópticos cuando el objeto está a -100 mm
del plano principal primario.
Línea
F
d
C
𝜆 (nm)
486.13
587.56
656.27
f
-49.46
-50.00
-50.24
V0P0
-2.30
-2.31
-2.31
s0
-35.39
-35.64
-35.75
m
0.3309
0.3333
0.3344
340
·
Aberraciones cromáticas
Doblete acromático
Lo anterior sugiere que combinando una lente positiva con una negativa se
puede reducir la aberración cromática axial. En la práctica, las lentes que se
combinan se hacen con diferentes tipos de vidrio para compensar el poder
de dispersión de cada lente (número de Abbe, eq. (C.2)). Uniendo las dos
lentes se obtiene una sola lente denominada doblete acromático. Esto supone
que el radio de curvatura de la cara posterior de la primera lente debe ser
igual al radio de curvatura de la cara anterior de la segunda lente, es decir
R12 = R21 , fig. D.3.
t1
R11
t2
R12 R 22
(R21)
Figura D.3. Doblete acromático.
Supongamos que deseamos obtener un doblete acromático de distancia
focal fd . A partir de la aproximación de lentes delgadas, la distancia focal de
la combinación de dos lentes delgadas (eq. (1.53)) será
1
1
1
=
+
,
fd
f1d f2d
ya que la separación entre las lentes es cero. Para cada lente,
1
1
1
= (n1d − 1) 𝜅 1
= P1d = (n1d − 1)
−
f1d
R11 R12
(D.6)
(D.7)
y
1
1
1
= P2d = (n2d − 1)
−
= (n2d − 1) 𝜅 2 .
f2d
R21 R22
(D.8)
En las eqs. (D.7) y (D.8), se han introducido los factores 𝜅 1 y 𝜅 2 para la
diferencia de las curvaturas. Entonces, la potencia del doblete acromático
en la aproximación de lentes delgadas es
P = (n1d − 1) 𝜅 1 + (n2d − 1) 𝜅 2 .
(D.9)
Aberraciones cromáticas
·
341
El doblete acromático implica que la potencia sea constante al variar la longitud de onda alrededor de la longitud de onda 𝜆 = 587.56 nm, es decir,
𝜕P
= 0.
(D.10)
𝜕𝜆 d
En otras palabras,
𝜕n1
𝜕n2
+ 𝜅2
= 0.
(D.11)
𝜕𝜆
𝜕𝜆
Aproximando la variación del índice de refracción con nF − nC y la variación de la longitud de onda con 𝜆 F − 𝜆 C , tenemos
𝜅1
𝜅1
n2F − n2C
n1F − n1C
− 𝜅2
= 0.
𝜆F − 𝜆C
𝜆F − 𝜆C
(D.12)
Multiplicando y dividiendo cada sumando por (n1d − 1) y (n2d − 1), respectivamente, para introducir el número de Abbe
(n1F − n1C ) (n1d − 1)
(n2F − n2C ) (n2d − 1)
− 𝜅2
(n1d − 1) (𝜆 F − 𝜆 C )
(n2d − 1) (𝜆 F − 𝜆 C )
(n1d − 1)
(n2d − 1)
= 𝜅1
− 𝜅2
.
(D.13)
(𝜆 F − 𝜆 C ) V1
(𝜆 F − 𝜆 C ) V2
0 = 𝜅1
Eliminando el factor común del denominador y empleando la definición
de potencia para cada lente, eqs. (D.7) y (D.8), se llega a
P2d
P
= − 1d .
V2
V1
(D.14)
Esta ecuación, junto con la eq. (D.6) en la forma de potencias Pd = P1d +
P2d , permite escribir la potencia de cada lente en términos de la potencia y
los números de Abbe de cada vidrio como
−V1
V2 − V1
(D.15)
V2
.
V2 − V1
(D.16)
P1d = Pd
y
P2d = Pd
Después de esto, se obtiene los factores de curvatura
𝜅1 =
P1d
n1d − 1
(D.17)
𝜅2 =
P2d
.
n2d − 1
(D.18)
y
342
·
Aberraciones cromáticas
Para terminar el diseño del doblete, se debe determinar los radios de curvatura de las lentes. Un diseño muy común propone que la primera lente
sea equiconvexa de vidrio crown. Así, los radios satisfacen las siguientes relaciones:
R12
R11 = −R12 , R12 = R21 y R22 =
.
(D.19)
1 − 𝜅 2 R12
Ejemplo: doblete acromático
Supongamos que queremos un doblete acromático de distancia focal fd =
50 mm. La potencia será P = 20 D. Usando los vidrios LAKN22 para la
primera lente y SFL6 para la segunda lente (apéndice C) y las eqs. (D.15)
- (D.18) junto con la definición de los factores de curvatura, en la tabla D.4
se muestra los resultados para los radios de curvatura.
Tabla D.4. Parámetros de diseño de un doblete acromático en la aproximación de
lentes delgadas.
P (D)
V1
V2
n1d
n2d
𝜅 1 (D)
𝜅 2 (D)
R11 (mm)
R22 (mm)
20
55.89
25.39
1.6511
1.8051
56.29
-20.68
35.52
-133.97
Para tener lentes reales, debemos asignar algún espesor a cada lente, por
ejemplo, 8 mm para la primer lente y 4 mm para la segunda. El doblete
acromático (real) se resume en la tabla D.5.
Tabla D.5. Doblete acromático. Las unidades del radio y el espesor se dan en mm.
Superficie
Radio
1
2
3
35.52
−35.52
−133.97
Espesor
8
4
Índice
LAKN22
SFL6
Con estos parámetros, la distancia focal para la línea espectral d queda
fd = 50.85 mm.
Aberraciones cromáticas
·
343
Para ver la mejora en la formación de imagen, comparemos la formación
de imagen con este doblete y la formación de imagen con la lente simple
de la fig. D.1 colocando un objeto a sd = −101.7 mm del doblete (para
que el aumento sea nuevamente md = −1). En la tabla D.6, se muestra los
parámetros para las tres líneas espectrales. La aberración cromática axial
resulta AchrL = −0.19 mm, esto es, solo el 6 % de la aberración obtenida
con la lente simple. Por otra parte, el aumento para cada color varía muy
poco, lo que hace que la aberración cromática transversal sea despreciable.
Entonces, con el doblete acromático se logra una imagen de alta calidad.
Tabla D.6. Parámetros de un doblete acromático y la imagen según las líneas
espectrales para caracterizar los vidrios ópticos cuando el objeto está a -101.7 mm
del plano principal primario para la línea espectral d.
Línea
F
d
C
𝜆 (nm)
486.13
587.56
656.27
f
50.83
50.85
50.90
VP
1.05
1.10
1.12
V0P0
-6.13
-6.13
-6.14
s0
95.54
95.57
95.73
m
-1.0002
1
-1.0014
Aunque el diseño original pide una distancia focal de 50 mm en la línea d, el doblete real propuesto tiene un valor ligeramente mayor. Con un
pequeño ajuste en los radios de curvatura de la primera lente, se puede obtener el valor deseado (por ejemplo, con R11 = −R12 = 34.7 mm, se obtiene
fd = 50.01 mm).
Los dobletes acromáticos son muy comunes en los sistemas formadores
de imagen, pues, además de generar imágenes de buena calidad, también
disminuyen la aberración esférica. Otra posible solución para disminuir la
aberración cromática consiste en diseñar dos lentes del mismo vidrio separadas la distancia (( f1d + f2d )/2). Esto último se puede consultar en [12].
Apéndice
E
Prismas
Prismas
·
347
Un prisma es un elemento óptico de caras planas, en el que al menos dos
de ellas están pulidas especularmente e inclinadas entre sí, de manera que
la luz se puede reflejar o transmitir en estas caras. Los prismas que se usan
para reflejar luz lo hacen a partir de la reflexión total interna en una o varias
de sus caras y sirven para cambiar la orientación de las imágenes en un
sistema óptico o la dirección de propagación de la luz [33]. Por otra parte,
los prismas que hacen uso de la refracción son empleados como elementos
para dispersar luz, por lo que sirven para medir el cambio del índice de
refracción en un medio (prisma) con la longitud de onda o las componentes
espectrales de una fuente luminosa.
Primas reflectores
Figura E.1. Primas reflectores: (a) recto, (b) Porro, (c) pentaprisma y (d) Amici.
En la fig. E.1, se muestra una imagen de algunos prismas reflectores denominados: (a) prisma recto, (b) prisma Porro, (c) pentaprisma y (d) prima
Amici. En estos prismas, un haz de luz incide en una de las caras y el haz
transmitido debe experimentar al menos una reflexión total interna. Los
prismas recto y Porro geométricamente son iguales, lo que cambia es la
orientación con respecto a la dirección de la luz. Suponiendo que la luz incide de izquierda a derecha, la trayectoria que sigue la luz en estos tipos
de prismas se ilustra en la fig. E.2. Para ver cómo cambia la orientación
en la imagen se incluye un par de símbolos en el haz incidente: una flecha
hacia arriba y un círculo hacia la izquierda (saliendo del plano del papel).
También se supone que la luz se propaga hacia el observador. El prisma
recto después de la reflexión en la cara diagonal desvía la luz 90◦ , invierte
la flecha y mantiene la orientación del círculo, de manera que al observar
la flecha nuevamente hacia arriba (con una rotación de 180◦ ) el círculo se
ve a la derecha (invierte izquierda-derecha); el prisma Porro refleja la luz
348
·
Prismas
paralela al haz incidente, invierte la flecha dos veces y mantiene la orientación del círculo, de manera que al observar la flecha nuevamente hacia
arriba el círculo se mantiene a la izquierda (no cambia las orientaciones1 );
el pentaprisma desvía la luz 90◦ y no cambia las orientaciones; el prisma
Amici desvía la luz 90◦ , invierte la flecha y refleja dos veces el círculo en el
techo del prisma cambiando su orientación, de manera que al observar la
flecha nuevamente hacia arriba el círculo está a la izquierda (no cambia las
orientaciones).
(a )
(b)
(c)
(d)
Figura E.2. Dirección que sigue la luz al reflejarse internamente (totalmente) en
los prismas: (a) recto, (b) Porro, (c) pentaprisma y (d) Amici.
Una configuración que permite mantener la dirección de propagación de
la luz con una inversión de la imagen (simetría central) se logra combinando
dos prismas Porro como se muestra en la fig. E.3. Este sistema de prismas se
suele usar en los binoculares (telescopio terrestre) en los que la imagen se ve
derecha. El prisma Amici también se suele usar en oculares para corregir la
inversión de la imagen en telescopios terrestres. El pentaprisma se suele usar
en telémetros y en instrumentos de alineación en topografía. Una variante
en el pentaprisma resulta al cambiar una de las caras planas reflectoras por
una cara en forma techo (similar a la del prisma Amici); se suele usar en
cámaras fotográficas tipo reflex.
Figura E.3. Dos prismas Porro se combinan para invertir la imagen (simetría central con respecto a un punto en el eje óptico) manteniendo la dirección de propagación.
1 Las
orientaciones relativas entre la flecha y el círculo.
Prismas
·
349
Otro prisma de gran utilidad es el prisma Dove, cuya configuración se
muestra en la fig. E.4. Un rayo que incide paralelo a la base se refracta en la
primera cara, luego se refleja internamente en la base (punto medio) y, finalmente, emerge paralelo al rayo incidente invirtiendo la flecha. El prisma
se debe usar con luz colimada y tiene la siguiente propiedad: si el prisma se
rota alrededor del eje óptico (haz incidente) cierto ángulo, la imagen rota el
doble de ese ángulo. Por ejemplo, en algunas lámparas de hendidura (instrumento oftálmico) el prisma Dove se coloca en medio de las dos lentes
de un sistema confocal que proyecta una línea de luz en la superficie de la
córnea. Para observar el astigmatismo corneal, es común rotar la línea un
ángulo de 90◦ , lo que se hace girando el soporte cilíndrico que contiene al
prisma Dove un ángulo de 45◦ . Esto resulta muy cómodo para el especialista cuando debe rotar la línea luminosa.
Figura E.4. Prisma Dove.
Cubos divisores de haz
Otra configuración de prismas muy empleada es el cubo divisor de haz formado por dos prismas rectos unidos por sus caras diagonales para dividir un
haz incidente en un haz transmitido y uno reflejado, fig. E.5(a). Una de las
caras diagonales se recubre con una película reflectiva (semiespejo) y luego
se unen las diagonales mediante un adhesivo óptico. El espesor de la película reflectiva determina los porcentajes de luz reflejada y transmitida en la
diagonal. El índice de refracción del adhesivo óptico ha de ser cercano al
de los vidrios de los prismas para evitar reflexiones no deseadas. Uno de los
cubos más comunes transmite el 50 % y refleja el 50 % de la luz.
Ei
Ei
Et
(p)
Er
(s)
( a)
( b)
Figura E.5. Cubos divisores de haz. (a) No-polarizador, (b) polarizador.
350
·
Prismas
Los cubos también se diseñan para separar un haz no polarizado en un
haz transmitido con polarización p y un haz reflejado con polarización s, como se muestra en la fig. E.5(b). La diagonal de uno de los prismas se recubre
con una película dieléctrica o una mezcla de metal-dieléctrico. Cuando el
haz incidente llega a la película, el haz con polarización paralela al plano de
incidencia (p) se transmite, mientras que el haz con polarización ortogonal
al plano de incidencia (s) se refleja.
Prismas refractores
Los prismas también se pueden usar para analizar las componentes espectrales (en longitud de onda o frecuencia) de una fuente luminosa. Ya que
el índice de refracción es función de la longitud de onda, un haz de luz
policromático se refracta en varios haces según su longitud de onda. Esta separación física de los haces refractados hace posible medir el espectro
luminoso. Para determinar la desviación del haz refractado en función del
índice de refracción, consideremos la refracción de un haz en dos caras de
un prisma que forman un ángulo 𝛼, como se muestra en la fig. E.6.
a
qi 1
n1 = 1
q t 1 qi 2
n 2= n
qt2
d
n1 = 1
Figura E.6. Refracción de un haz en dos caras de un prisma.
Supongamos que el prisma está sumergido en un medio de índice n1 y
que el índice de refracción del prisma para el haz considerado es n2 . La ley
de Snell en ambas caras será
n1 sin 𝜃 i1 = n2 sin 𝜃 t1 ,
(E.1)
n2 sin 𝜃 i2 = n1 sin 𝜃 t2 .
(E.2)
y
Prismas
·
351
De la geometría de la figura, se tiene que 𝛼 = 𝜃 t1 + 𝜃 i2 . Al cambiar 𝜃 i2 por
𝛼 − 𝜃 t1 en la eq. (E.2), se tiene
sin 𝜃 t2 =
n2
[sin 𝛼 cos 𝜃 t1 − cos 𝛼 sin 𝜃 t1 ] ,
n1
(E.3)
que es igual a
s
sin 𝜃 t2 = sin 𝛼
n2
n1
2
− sin2 𝜃 i1 − cos 𝛼 sin 𝜃 i1 .
(E.4)
Si n1 = 1 y n2 = n, el índice de refracción del prisma para un rayo de
cierta longitud de onda está dado por
n 2 = sin2 𝜃 i1 +
(sin 𝜃 t2 + sin 𝜃 i1 cos 𝛼) 2
.
sin2 𝛼
(E.5)
Empleando un prisma caracterizado en sus índices de refracción según
la longitud de onda, podemos medir el espectro luminoso de una fuente
observando sobre una escala la posición de los rayos refractados. Una configuración empleada en los espectrómetros de prisma se basa en el mínimo
valor del ángulo 𝛿 = 𝜃 i1 + 𝜃 t2 − 𝛼, el cual mide la desviación del rayo refractado al salir del prisma con respecto al rayo incidente en el prisma. El
mínimo de 𝛿 ocurre cuando 𝜃 t2 = 𝜃 i1 = 𝜃 mı́n [3]. En este caso,
p
sin 𝜃 mı́n 2(1 + cos 𝛼)
n=
,
sin 𝛼
(E.6)
y como 𝜃 mı́n = (𝛿mı́n + 𝛼)/2, entonces
n=
sin [(𝛿mı́n + 𝛼)/2]
.
sin(𝛼/2)
(E.7)
En particular, si el prisma se construye como un triángulo isósceles, siendo
𝛼 el ángulo entre los dos lados iguales, el rayo refractado dentro del prisma
será paralelo al otro lado del prisma (base del prisma), como se muestra en
la fig. E.7.
Otro prisma usado en espectroscopía es el prisma Pellin-Broca. El principio de funcionamiento de este prisma se puede entender como una variante de un prisma equilátero ( 𝛽 = 𝛼 = 60◦ en la fig. E.7).
352
·
Prismas
a
b
b
Figura E.7. Prisma Isósceles en el que la mínima desviación del rayo ocurre cuando el rayo refractado dentro del prisma se propaga paralelo a la base del prisma.
60°
30°
30°
30°
45°
60°
60°
60°
60°
60°
30°
60°
(a)
(b)
(c)
Figura E.8. Principio del prisma Pellin-Broca. (a) Prisma equilátero y un rayo
en condición de mínima desviación. (b) Separación del prisma equilátero en dos
prismas de 30◦ − 60◦ − 90◦ manteniendo la condición de mínima desviación. (c)
Cambio de la trayectoria del rayo con un espejo a 45◦ manteniendo la condición
de mínima desviación en los prismas. El resultado final es que el rayo refractado
forma un ángulo de 90◦ con el rayo incidente.
Supongamos que en el prisma equilátero de la fig. E.8 (a) se hace incidir
un rayo de una longitud de onda dada en la condición de mínima desviación (el rayo refractado dentro del prisma es paralelo a la base). Si el prisma
equilátero se separa en dos primas de 30◦ − 60◦ − 90◦ , como en la fig.E.8(b),
el rayo refractado sigue cumpliendo la condición de mínima desviación. Si
adicionalmente se coloca un espejo a 45◦ y se desplaza el segundo prisma, como se muestra en la fig. E.8(c), se sigue mateniendo la condición de
mínima desviación en el segundo prisma. El resultado final es que el haz
refractado, independientemente de la longitud de onda, si se mantiene la
condición de mínima desviación, será refractado formando un ángulo de
90◦ con respecto al rayo incidente.
Si en lugar del espejo se usa un prisma de 45◦ − 45◦ − 90◦ , se puede
construir en un solo bloque un prisma como el mostrado en la fig. E.9. Este
es el prisma Pellin-Broca [34].
Entonces, para un rayo incidente policromático, el rayo refractado a 90◦
corresponde con una longitud de onda dada. Rayos de otras longitudes de
onda no se propagan bajo la condición de mínima desviación y emergen del
Prismas
·
353
prisma formando un ángulo diferente a 90◦ . Sin embargo, con un pequeño
giro alrededor de un eje ortogonal al plano del papel, se puede ajustar la
condición de mínima desviación para otra longitud de onda. En particular,
si el eje de giro pasa por un punto definido por la intersección de la bisectriz
del ángulo ∠BAD y el lado BC, esto es, el punto O en la fig. E.9, el rayo
refractado a 90◦ con respecto al rayo incidente mantiene su posición lateral.
B
30° 45°
A
60°
30°
90°
O
45°
90°
C
60°
D
Figura E.9. Prisma Pellin-Broca.
O
n = 1.5628
n = 1.6361
Figura E.10. Ilustración de la ventaja de girar el prisma en el punto O. Independientemente de la longitud de onda el rayo refractado a 90◦ mantiene su posición
lateral.
En la fig. E.10, se ilustra esta situación para dos rayos de diferente longitud de onda en un prisma cuyos índices de refracción para las dos longitudes de onda son 1.5628 y 1.6361. En la figura, se superpone el prisma
con las dos orientaciones (con eje de giro en O) que satisfacen la condición
354
·
Prismas
de mínima desviación para cada longitud de onda. En gris, la orientación
correspondiente al índice de refracción 1.5628 y, en negro, la orientación
correspondiente al índice de refracción 1.6331. El ángulo de giro es 3.5◦ .
En efecto se tiene que los dos rayos refractados mantienen su localización
espacial gracias a la rotación del prisma en el punto O. Si el giro se hace en
otro punto, los dos rayos se refractan con un desplazamiento lateral entre
sí. Así que el punto de giro en O ofrece una ventaja a la hora de diseñar un
espectrómetro.
Apéndice
F
Elipse de
polarización
Elipse de polarización
·
357
Para determinar el estado de polarización general, consideremos la parte
real de las amplitudes del vector eléctrico dado en la eq. (2.31), es decir,
Ex = |Eox | cos 𝛿 x ,
(F.1)
Ey = Eoy cos 𝛿 y .
(F.2)
Multiplicando por sin 𝛿 x y sin 𝛿 y las funciones cos 𝛿 x y cos 𝛿 y de las eqs.
(F.1) y (F.2) de la siguiente manera
Ex
sin 𝛿 y = cos 𝛿 x sin 𝛿 y ,
|Eox |
Ey
Eoy
sin 𝛿 x = cos 𝛿 y sin 𝛿 x ,
(F.3)
(F.4)
y luego restando las eqs. (F.3) y (F.4), se tiene que
Ey
Ex
sin 𝛿 x = sin(𝛿 y − 𝛿 x ).
sin 𝛿 y −
|Eox |
Eoy
(F.5)
Mediante un procedimiento análogo, multiplicando por cos 𝛿 x y cos 𝛿 y las
funciones cos 𝛿 x y cos 𝛿 y de las eqs. (F.1) y (F.2), y luego restando, se llega a
Ey
Ex
cos 𝛿 y −
cos 𝛿 x = 0.
|Eox |
Eoy
(F.6)
Por último, al elevar al cuadrado las eqs. (F.5) y (F.6), y luego sumarlas,
se encuentra la siguiente forma cuadrática
Ex2
|Eox | 2
−2
Ey2
E x Ey
cos(Δ𝛿) +
= sin2 (Δ𝛿),
2
|Eox | Eoy
Eoy
(F.7)
con Δ𝛿 = 𝛿 y − 𝛿 x . Esta ecuación representa una cónica rotada.1 Mediante
una rotación de ejes se elimina el término cruzado de Ex Ey . El ángulo de la
rotación es
2 cos(Δ𝛿)/ |Eox | Eoy
tan 2𝜓 = −
.
(F.8)
2
1/|Eox | 2 − 1/ Eoy
1 La
forma cuadrática Ax 2 + 2Bxy + Cy 2 = D representa una cónica rotada en el sistema cartesiano xy. Si B2 − AC < 0, es una elipse; si B2 − AC = 0, es una parábola; si
B2 − AC > 0, es una hipérbola. La versión no rotada de la cónica en un nuevo sistema cartesiano x 0 y 0 se logra mediante una transformación de coordenadas que corresponde con un
problema de valores propios de una matriz 2×2 simétrica cuyos elementos son los coeficientes A, B hy C. En el sistema de coordenadas
rotado,
coeficientes están
i
h los nuevos
i dados por:
p
p
1
1
0
0
2
2
2
2
A = 2 (A + C) + (A − C) + 4B , C = 2 (A + C) − (A − C) + 4B ; y el ángulo
2B .
de rotación se puede determinar a partir de: 𝜓 = 12 arctan A−C
358
·
Elipse de polarización
Definiendo
tan 𝛼 =
Eoy
,
|Eox |
(F.9)
se llega a
tan 2𝜓 = tan 2𝛼 cos Δ𝛿.
(F.10)
El signo del discriminante de la eq. (F.7),
cos2 (Δ𝛿)/ |Eox | Eoy
2
− 1/ |Eox | Eoy
2
=−
sin2 (Δ𝛿)
|Eox | Eoy
2 < 0,
(F.11)
determina el tipo de cónica. Ya que el resultado es menor que cero, tenemos
que la eq. (F.7) es una elipse rotada el ángulo 𝜓 en el sistema cartesiano xy.
Bibliografía
[1] S.R. Wilk. Ibn al-haytham: 1,000 Years after the Kitāb al-Manāzir.
Optics and Photonics News, 26(10):42–48, 2015.
[2] I. Newton. Opticks, or, a Treatise of the Reflections, Refractions, Inflections
& Colours of Light. London, 1718.
[3] E. Hecht. Óptica. Addison Wesley Longman, 2000.
[4] W.E. Humphrey. Method and Apparatus for Analysis of Corneal Shape, December 13 1983. US Patent 4,420,228.
[5] H. Von Helmholtz. Helmholtz’s Treatise on Physiological Optics, volume 1. Optical Society of America, 1924.
[6] Y. LeGrand and S.G. ElHage. Physiological Optics, volume 13. Springer, 2013.
[7] H. Davson. Physiology of the Eye. Macmillan International Higher
Education, 1990.
[8] G. Smith and D.A. Atchison. The Eye and Visual Optical Instruments.
Cambridge University Press, 1997.
[9] D.A. Atchison and G. Smith. Optics of the Human Eye, volume 35.
Butterworth-Heinemann Oxford, 2000.
[10] V.N. Mahajan. Optical Imaging and Aberrations: Ray Geometrical Optics.
SPIE press, 1998.
[11] S. Dupr. Galileo, the Telescope and the Science of Optics in the Sixteenth
Century. PhD thesis, Ghent University, 2002.
[12] D. Malacara and Z. Malacara. Handbook of Optical Design. CRC Press,
2016.
[13] E.H. Land. Some Aspects of the Development of Sheet Polarizers.
JOSA, 41(12):957–963, 1951.
360
·
Bibliografía
[14] Grant R Fowles. Introduction to Modern Optics. Dover Publications,
Inc., 1989.
[15] M. Born and E. Wolf. Principles of Optics, Chapter X: Interference and
Diffraction with Partially Coherent Light. Pergamon Press, 1993.
[16] J.D. Jackson. Classical Electrodynamics, Chapter XVI: Radiation Damping, Classical Models of Charged Particles. American Association of
Physics Teachers, 1999.
[17] M.H. Shamos. Great Experiments in Physics: Firsthand Accounts from
Galileo to Einstein, Chapter VII: The Interference of Light. Dover Publications, Inc., 1987.
[18] M. Csele. Fundamentals of Light Sources and Lasers. Wiley Online Library, 2004.
[19] M.V. Mantravadi and D. Malacara. Optical Shop Testing, Chapter I:
Newton, Fizeau, and Haidinger Interferometers. John Wiley and Sons,
Inc, 2007.
[20] M.H. Shamos. Great Experiments in Physics: Firsthand Accounts from
Galileo to Einstein, Chapter VIII: The Diffraction of Light. Dover Publications, Inc., 1987.
[21] J.D. Jackson. Classical Electrodynamics, Chapter X: Scattering and Diffraction. American Association of Physics Teachers, 1999.
[22] M. Born and E. Wolf. Principles of Optics, Chapter VIII: Elements of the
Theory of Diffraction. Pergamon Press, 1993.
[23] A. Sommerfeld. Lectures on Theoretical Physics, Vol 4: Optics, 1964.
[24] J.W. Goodman. Introduction to Fourier Optics. Roberts and Company
Publishers, 2005.
[25] Y. Mejía and A.I. González. Measuring Spatial Coherence by Using
a Mask with Multiple Apertures. Optics Communications, 273(2):428–
434, 2007.
[26] Y. Mejía. El Frente de Onda y su Representación con Polinomios de
Zernike. Ciencia y Tecnología para la Salud Visual y Ocular, 9(2):145–
166, 2011.
Bibliografía
·
361
[27] H.H. Hopkins. On the Diffraction Theory of Optical Images. Proceedings of the Royal Society of London. Series A. Mathematical and Physical
Sciences, 217(1130):408–432, 1953.
[28] B.J. Thompson. IV Image Formation with Partially Coherent Light.
In Progress in optics, volume 7, pages 169–230. Elsevier, 1969.
[29] Y. Mejía and D.E.G. Suárez. Optical Transfer Function with Partially
Coherent Monochromatic Illumination. Optik, 193:163021, 2019.
[30] E.G. Loewen and E. Popov. Diffraction Gratings and Applications. CRC
Press, 2018.
[31] C.A. Palmer and E.G. Loewen. Diffraction Grating Handbook. Newport
Corporation New York, 2005.
[32] M. Rubin. Optical Properties of Soda Lime Silica Glasses. Solar
Energy Materials, 12(4):275–288, 1985.
[33] NAVEDTRA. Basic Optics and Optical Instruments. Dover Publications,
1997.
[34] Ph. Pellin and A. Broca. A Spectroscope of Fixed Deviation. The
Astrophysical Journal, 10:337, 1899.
Índice
Aberración cromática
axial, 337
transversal, 339
Aberraciones primarias monocromáticas, 95
astigmatismo, 102
coma, 102
curvatura de campo, 97
distorsión, 100
esférica, 97
patrones de difracción, 304
Petzval, 96
polinomio de aberración, 303
Ángulo crítico, 12, 146
Apertura numérica, 92
Aumento
angular, 73
espejos esféricos, 38
lentes, 45, 46
lupa, 83
microscopio, 92
superficie esférica refractora, 33
telescopio, 85
Cámara oscura, 4
Campo de visión y objeto, 70
lupa, 80
Coherencia
grado de coherencia, 180, 184
longitud de coherencia, 186,
188
teorema de Van Cittert-Zernike,
299
Convención de signos, 25
Diafragmas
apertura, 63
campo, 69
Difracción, 277
abertura circular, 289
abertura rectangular, 291
condición de Sommerfeld, 281
disco de Airy, 291
dos aberturas circulares, 296
factor de inclinación, 268, 282
Fraunhofer, 288
Fresnel, 288
Huygens-Fresnel, 285
integral de Fresnel-Kirchhoff,
282
integral de Kirchhoff, 280
Rayleigh-Sommerfeld, 284
Divisor de haz, 211
Ecuación de onda
dieléctrico, 134
material birrefringente, 154
vacío, 117
Ecuaciones de Fresnel, 138
Ecuaciones de Maxwell, 117, 134,
326
Espejo parabólico, 41
Espejo plano, 14
Espejos esféricos, 37
aberración esférica, 39
trazo de rayos, 37
364
·
Índice
Franjas de interferencia
circulares, 201, 205, 217
hiperbólicas, 199
rectas, 191, 208, 216
Fuente extendida, 244, 247
Imagen objeto puntual
difractiva, 302
geométrica, 19
Índice de refracción, 155, 325, 327,
329
ordinario, extraordinario, 160
Intensidad, 61
Interferómetros
Fabry-Perot, 257
Fizeau, 261
lámina de caras paralelas, 218
Michelson, 182, 201, 207, 210,
248
Newton, 259
Young, 251, 254
Interferencia
con luz blanca, 244, 246
con N fuentes puntuales, 238
de dos ondas, 180
de múltiples ondas reflejadas,
221
de múltiples ondas transmitidas, 222
dos ondas esféricas, 196, 225,
229
dos ondas planas, 189, 191, 222
franjas localizadas, 225, 226,
235, 245, 247
franjas no localizadas, 225, 226,
236, 245
igual espesor, 247, 261, 262
igual inclinación, 235, 249
máximos principales, 239, 242
máximos secundarios, 239, 242
visibilidad, contraste, 190, 194
Irradiancia, 65, 120, 121, 179
Láminas birrefringentes, 156
de cuarto de onda, 156
de media onda, 157
ejes lento y rápido, 156
Límite de resolución espacial, 305
criterio de Rayleigh, 306
Lentes
colimadora, 211
delgada, 43
distancia focal lente delgada, 43
distancia focal lente gruesa, 53
doblete acromático, 340
ecuación de Gauss, 43
ecuación de Newton, 46
ecuación lente delgada, 43
gruesa, 53
negativa, 48
planos focales, 48
planos principales, 54
positiva, 47
potencia lente delgada, 59
punto focal primario, 44
punto focal secundario, 44
rayos oblicuos, 49
sistema de lentes, 57
trazo de rayos, 45
Ley de la reflexión, 36, 135
Ley de la refracción, 10, 136
Ley de Malus, 132
Ley de Snell, 10, 14
Longitud de camino óptico, 16
Lupa, 80
Materiales birrefringentes, 155
índices ordinario y extraordinario, 160
biaxiales, 160
doble imagen, 163
Índice
eje óptico, 160
rayos ordinario y extraordinario, 161
uniaxiales, 160
Matrices de Jones, 171
Microscopio, 91
Número de Abbe, 333
Número f, 63
Oculares, 86
Ojo humano, 23, 74
acomodación, 75
distancia de punto cercano (dpc),
75, 78
Gullstrand-Emsley, 74
hipermetropía, 78
miopía, 78
Purkinje, 74
Ondas
esférica, 196
plana armónica, 117, 118, 134,
179
Ovoide cartesiano, 21
Plano de incidencia, 36
Plano meridional, 32, 101
Planos tangencial y sagital, 101
Poder de resolución
microscopio, 93
rejilla de difracción, 312
Polarización
ángulo de Brewster, 141
circular, 123, 126
elíptica, 123, 126
lineal, 126
luz natural, 122
luz polarizada, 122
por reflexión, 141
reflectancia y transmitancia, 142,
152
·
365
Polarizadores
coeficiente de extinción, 130
lineal dicroico, 129
prisma Glan-Thompson, 166
prisma Rochon, 166
prisma Senarmont, 166
prisma Wollaston, 166
rombo de Fresnel, 150
Principio de Fermat, 13, 16
espejismo, 15
frente de onda geométrico, 18
rayo de luz, 17
Principio de Huygens, 8, 267
Principio de Huygens-Fresnel, 267
Prismas, 347
birrefringente, 164
cubos divisores de haz, 349
Dove, 349
Isósceles, mínima desviación,
352
Pellin-Broca, 353
recto, Porro, pentaprisma, Amici, 347
PSF
difractiva, 303
geométrica, 106
Pupilas
acoplamiento, 86
entrada y salida, 65
función pupila, 303
Rayos
marginal, 68, 85
principal, 68, 99, 101
Reflexión total interna, 146
Rejillas de difracción, 309
orden de difracción, 311
Relaciones de Stokes, 219
Superficie esférica refractora
aberración esférica, 27
366
·
Índice
aproximación paraxial, 27
distancia focal primaria, 28
distancia focal secundaria, 28
ecuación de Gauss, 28
potencia refractiva, 34
punto focal primario, 29
punto focal secundario, 28
trazo de rayos, 32
Telescopio, 84
reflector newtoniano, 90
refractor galileano, 88
refractor kepleriano, 85
Trazo de rayos
exacto, 107
gráfico, 12
lentes delgadas, 44
paraxial, método y-nu, 318
Vector de onda, 133
Vector de Poynting, 120
Vectores de Jones, 168
Vidrios ópticos, 333
diagrama de vidrios, 334
Zonas de Fresnel, 269
placa zonal, 275
punto de Poisson, 274
Editado por el Centro Editorial de la Facultad de Ciencias,
Universidad Nacional de Colombia, sede Bogotá,
Fuente principal Baskerllive y Fira Sans.
Otros títulos
Nanomateriales que revolucionan la tecnología.
Perspectivas y aplicaciones en espintrónica
Anderson Dussán Cuenca, Heiddy Paola Quiroz
Gaitán y Jorge Arturo Calderón Cómbita
Notas de clase: Introducción al estado sólido
William Javier Herrera
Diseño de experimentos. Métodos y
aplicaciones. Segunda edición
Oscar Melo, Luis Alberto López y Sandra Melo
Descargar