Fundamentos de óptica Curso introductorio Yobani Mejía Barbosa Facultad de Ciencias Sede Bogotá Fundamentos de óptica Curso introductorio Fundamentos de óptica Curso introductorio Yobani Mejía Barbosa Bogotá, D. C., Colombia, 2020 © Universidad Nacional de Colombia Facultad de Ciencias © Yobani Mejía Barbosa Primera edición, diciembre de 2020 ISBN 978-958-794-412-9 (papel) ISBN 978-958-794-415-0 (digital) Edición Angélica María Olaya Murillo coorpub_fcbog@unal.edu.co Coordinación de publicaciones - Facultad de Ciencias Corrección de estilo Juliana Monroy Diseño de la colección Leonardo Fernández Suárez Maqueta LaTex Camilo Cubides Salvo las figuras 1.1, 1.58, 1.76, 1.80, 1.84, 1.85 y C.1, todas las demás fueron elaboradas por el autor. Prohibida la reproducción total o parcial por cualquier medio sin la autorización escrita del titular de los derechos patrimoniales Impreso y hecho en Bogotá, D. C., Colombia Este libro está dedicado a mi esposa, Janneth, y a mis hijos, Ana Catalina, María Isabel y Daniel. Contenido Prefacio Introducción XI XIII Capítulo uno Óptica geométrica 1.1. Rayos u ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1. La cámara oscura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2. La teoría corpuscular de Newton . . . . . . . . . . . . . . . . . . . . 1.1.3. La teoría ondulatoria de Huygens . . . . . . . . . . . . . . . . . . . . 1.1.4. Trazo gráfico de rayos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Principio de Fermat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Formulación moderna del principio de Fermat . . . . . . . . 1.2.2. Rayos y frente de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3. Imagen de una fuente puntual . . . . . . . . . . . . . . . . . . . . . . 1.3. Superficies refractoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1. Modelo de la córnea del ojo humano . . . . . . . . . . . . . . . . . 1.3.2. Refracción con superficies esféricas . . . . . . . . . . . . . . . . . . 1.3.3. Puntos y distancias focales . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.4. Planos focales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.5. La imagen paraxial de objetos extendidos . . . . . . . . . . . . . 1.3.6. Potencia y vergencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4. Superficies reflectoras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1. Trazo de rayos en espejos esféricos . . . . . . . . . . . . . . . . . . . 1.4.2. El espejo parabólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5. Lentes: aproximación lentes delgadas . . . . . . . . . . . . . . . . . . . . . 1.5.1. Trazo de rayos en lentes delgadas . . . . . . . . . . . . . . . . . . . . 1.5.2. Ecuación de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.3. Dominio de las imágenes real y virtual . . . . . . . . . . . . . . . 1.5.4. Planos focales en lentes delgadas . . . . . . . . . . . . . . . . . . . . 1.5.5. Trazo de rayos oblicuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6. Lentes: planos principales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 4 4 6 7 10 13 16 17 19 21 23 25 28 30 32 34 36 37 39 42 44 46 47 48 49 52 viii · Contenido 1.6.1. Sistema de lentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 1.7. Diafragmas y pupilas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 1.7.1. Diafragma de apertura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 1.7.2. Pupilas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 1.7.3. Rayos principal y marginal . . . . . . . . . . . . . . . . . . . . . . . . . 68 1.7.4. Diafragma de campo, campo de visión y tamaño angular 69 1.8. Algunos instrumentos ópticos . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 1.8.1. El ojo humano (ojo esquemático) . . . . . . . . . . . . . . . . . . . . 74 1.8.2. La lupa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 1.8.3. El telescopio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 1.8.4. El microscopio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 1.9. Aberraciones ópticas monocromáticas . . . . . . . . . . . . . . . . . . . . 95 1.9.1. Curvatura de campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 1.9.2. Esférica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 1.9.3. Distorsión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 1.9.4. Astigmatismo y coma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 Capítulo dos Polarización 113 2.1. Ondas planas y luz polarizada . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 2.1.1. Ecuaciones de Maxwell con ondas planas . . . . . . . . . . . . . 118 2.1.2. Irradiancia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 2.1.3. Luz natural y luz polarizada . . . . . . . . . . . . . . . . . . . . . . . . 121 2.1.4. Polarización elíptica, circular y lineal . . . . . . . . . . . . . . . . . 122 2.1.5. Polarización: caso general . . . . . . . . . . . . . . . . . . . . . . . . . . 124 2.2. Polarización por dicroísmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 2.2.1. Polarizador lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 2.2.2. Ley de Malus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 2.3. Polarización por reflexión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 2.3.1. Leyes de la reflexión y la refracción . . . . . . . . . . . . . . . . . . 133 2.3.2. Ecuaciones de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 2.3.3. Reflectancia y transmitancia . . . . . . . . . . . . . . . . . . . . . . . . 142 2.4. Polarización por reflexión total interna . . . . . . . . . . . . . . . . . . . . 146 2.4.1. Reflexión total interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 2.4.2. Reflectancia y transmitancia . . . . . . . . . . . . . . . . . . . . . . . . 152 2.5. Polarización con materiales birrefringentes . . . . . . . . . . . . . . . . 153 2.5.1. Láminas retardadoras de fase . . . . . . . . . . . . . . . . . . . . . . . 154 2.5.2. Cristales birrefringentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 2.5.3. Refracción en cristales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161 2.5.4. Prismas polarizadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 Contenido · ix 2.6. Vectores y matrices de Jones . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 Capítulo tres Interferencia 175 3.1. Interferencia y coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 3.1.1. Grado de coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180 3.1.2. Interferencia y coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . 181 3.1.3. Longitud de coherencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 3.2. Interferencia de dos ondas planas . . . . . . . . . . . . . . . . . . . . . . . . 189 3.2.1. Interferencia con ondas planas inclinadas . . . . . . . . . . . . . 191 3.2.2. Desplazamiento de las franjas . . . . . . . . . . . . . . . . . . . . . . . 193 3.2.3. Visibilidad del interferograma . . . . . . . . . . . . . . . . . . . . . . . 194 3.3. Interferencia de dos ondas esféricas . . . . . . . . . . . . . . . . . . . . . . 196 3.3.1. Franjas circulares con el interferómetro de Michelson . . . 200 3.3.2. Aproximación de franjas paralelas con el interferómetro de Michelson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 3.4. Aspectos prácticos en el interferómetro de Michelson . . . . . . . 210 3.4.1. Interferómetro de laboratorio . . . . . . . . . . . . . . . . . . . . . . . 215 3.5. Interferencia en una lámina de caras paralelas . . . . . . . . . . . . . . 218 3.5.1. Relaciones de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 3.5.2. Interferencia de múltiples ondas . . . . . . . . . . . . . . . . . . . . . 220 3.5.3. Interferencia de dos ondas . . . . . . . . . . . . . . . . . . . . . . . . . . 234 3.6. Interferencia con N fuentes puntuales . . . . . . . . . . . . . . . . . . . . 238 3.6.1. Aproximación con ondas planas . . . . . . . . . . . . . . . . . . . . . 241 3.7. Interferencia con fuentes de luz extendidas . . . . . . . . . . . . . . . . 244 3.7.1. Fuentes extendidas artificiales . . . . . . . . . . . . . . . . . . . . . . . 248 3.8. Interferómetro de Young I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 3.8.1. División de frente de onda y división de amplitud . . . . . . 254 3.9. Otros interferómetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256 3.9.1. Interferómetro de Fabry-Perot . . . . . . . . . . . . . . . . . . . . . . 256 3.9.2. Película delgada antirreflectiva . . . . . . . . . . . . . . . . . . . . . . 258 3.9.3. Interferómetro de Newton y Fizeau . . . . . . . . . . . . . . . . . . 259 Capítulo cuatro Difracción 263 4.1. Principio de Huygens-Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . 267 4.1.1. Zonas de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 4.1.2. Resultados del tratamiento de Fresnel . . . . . . . . . . . . . . . . 272 4.2. Integral de difracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277 x · Contenido 4.2.1. Teorema integral de Kirchhoff . . . . . . . . . . . . . . . . . . . . . . 278 4.2.2. Difracción de Fresnel-Kirchhoff . . . . . . . . . . . . . . . . . . . . . 280 4.2.3. Difracción de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . 283 4.3. Difracción de Fresnel y Fraunhofer . . . . . . . . . . . . . . . . . . . . . . 285 4.3.1. Difracción de Fraunhofer . . . . . . . . . . . . . . . . . . . . . . . . . . 288 4.3.2. Difracción de Fresnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288 4.3.3. Algunos ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 4.4. Interferómetro de Young II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 4.4.1. Efecto del tamaño de las aberturas difractantes . . . . . . . . . 295 4.4.2. Efecto del tamaño de la fuente luminosa . . . . . . . . . . . . . . 297 4.5. Formación de imagen con difracción . . . . . . . . . . . . . . . . . . . . . 301 4.5.1. Imagen de un objeto (fuente) puntual . . . . . . . . . . . . . . . . 301 4.5.2. Resolución en la imagen (dos puntos) . . . . . . . . . . . . . . . . 305 4.5.3. Imagen de un objeto extendido . . . . . . . . . . . . . . . . . . . . . . 307 4.6. Rejillas de difracción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 Apéndice A Trazo de rayos 315 Apéndice B Índice de refracción 323 Apéndice C Vidrios ópticos 331 Apéndice D Aberraciones cromáticas 335 Apéndice E Prismas 345 Apéndice F Elipse de polarización 355 Bibliografía Índice 359 363 Prefacio Este libro presenta los temas en óptica clásica del curso Fundamentos de óptica que durante 12 años he impartido como profesor del Departamento de Física de la Universidad Nacional de Colombia, sede Bogotá. Inicialmente di el curso como una materia electiva1 y a partir del segundo semestre de 2009, hasta el segundo semestre de 2017, lo di en forma ininterrumpida como un curso optativo de la carrera de Física.2 El programa del curso lo propuse teniendo en cuenta mi experiencia como investigador en óptica aplicada desde mi doctorado en Ciencias-Óptica (1998-2001, Centro de Investigaciones en Óptica, México). El libro está conformado por 4 capítulos: óptica geométrica, polarización, interferencia y difracción, distribuidos en 30 unidades (y 6 apéndices), que se dan en 28 clases de 2 horas. El objetivo de este libro es que sirva de guía para los estudiantes del curso Fundamentos de óptica y también para aquellos estudiantes de otras carreras que deseen tener un primer acercamiento a la óptica. Para ampliar la formación básica en óptica el estudiante puede consultar textos clásicos de óptica como Fundamentals of Optics de Jenkins and White (editorial McGrawHill, 2001), Optics de Hecht (editorial Pearson, 2017) o Principles of Optics de Born and Wolf (editorial Pergamon Press, 1980). Agradezco a la Universidad Nacional de Colombia por permitirme disfrutar de un año sabático (febrero 2018 - febrero 2019), durante el cual pude escribir la mayor parte de este libro. Bogotá, D. C., Colombia, marzo de 2020. 1 Curso que no forma parte del plan obligatorio de estudios, ofrecido voluntariamente por un profesor para estudiantes que deseen tomarlo. 2 Curso que forma parte del plan de estudios pero que no es obligatorio. Introducción En términos actuales, se puede definir la óptica como la ciencia que estudia la naturaleza de la luz (rango visible del espectro electromagnético), su propagación y su interacción con la materia. Los orígenes de la óptica están estrechamente relacionados con los estudios de la visión y de la propagación de la luz. Alhazen (965-1040) compara la formación de la imagen en el ojo humano con la formación de la imagen en la cámara oscura (caja cerrada con un pequeño orificio en una de sus paredes), que él mismo construyó por primera vez. La cámara oscura también permite observar la propagación rectilínea de la luz (rayos de luz). La descripción geométrica de la propagación de la luz la había hecho Euclides (325-265 AC) siglos atrás en su tratado sobre la óptica. Siguiendo uno de los postulados geométricos de Euclides (dados dos puntos se puede trazar una línea recta que los une), la luz, en un medio homogéneo, para ir de un punto a otro sigue la línea recta que los une, es decir, sigue el camino geométrico más corto. Esto es una versión preliminar del principio de Fermat sobre la propagación de la luz, el cual permite deducir las leyes de la reflexión y la refracción de la luz. En el siglo XVII, Huygens propone una nueva descripción para la propagación de la luz, una versión preliminar de la teoría ondulatoria. Huygens deduce que la luz disminuye su velocidad al entrar en medios más densos y explica la reflexión y la refracción con su teoría ondulatoria. En el siglo posterior, Fresnel añade la interferencia de ondas a la teoría de Huygens y con esto puede explicar el fenómeno de la difracción. Actualmente, se acepta estas dos versiones para la propagación de la luz. Si se trata del diseño de instrumentos ópticos, la versión de rayos es más apropiada. Si se trata de estudiar la calidad de la imagen, la versión ondulatoria será la más apropiada.1 1 En el libro A History of Optics, from Greek Antiquity to the Nineteenth Centutry de Oliver Darrigol (Oxford, University Press, 2012) se encuentra una mirada de los orígenes de la óptica hasta el siglo XIX. Capítulo uno Óptica geométrica Óptica geométrica · 3 Figura 1.1. Formación de imagen mediante una lente positiva. La imagen que genera la lente es real y se convierte en el objeto para la cámara del dispositivo móvil con el que tomó la fotografía. Este proceso de formación de imagen lo podemos entender desde la óptica geométrica. Fuente: imagen cedida por Felix Ernesto Charry Pastrana. Cuando ciertos fenómenos ópticos se pueden explicar mediante conceptos geométricos, estamos en el dominio de lo que se llama óptica geométrica. Partiendo de la idea de que la luz se propaga como rayos geométricos y de que esa propagación está gobernada por el principio de Fermat, podemos estudiar la propagación de la luz en medios de índice de refracción constante o variable, la formación de imagen en sistemas ópticos formados por lentes, prismas y espejos, las aberraciones ópticas que deterioran la calidad de la imagen, el diseño de instrumentos ópticos, etc. Así que aunque con la óptica geométrica no se puede explicar los fenómenos que obedecen a la naturaleza ondulatoria de la luz, sí se tiene un campo muy amplio de aplicaciones, por lo que iniciar el estudio de la óptica desde el punto de vista geométrico está justificado plenamente. En este capítulo, a partir del principio de Fermat, se deducen las propiedades geométricas de los sistemas ópticos formados por superficies esféricas refractoras, espejos esféricos y lentes. La mayor parte del capítulo se desarrolla dentro de la aproximación paraxial, pero al final se hace una introducción al tema de aberraciones ópticas monocromáticas. Los temas de aberración cromática y prismas se tratan brevemente en los apéndices D y E. 4 · Óptica geométrica 1.1. Rayos u ondas 1.1.1. La cámara oscura La cámara oscura es básicamente una caja cerrada con un pequeño agujero de forma circular en una de sus caras. La función del agujero es dejar pasar luz contenida en un cono cuyo vértice es un punto luminoso en el objeto (punto objeto) y cuya base es el agujero. El tamaño del agujero determina el ángulo del cono. Objeto Imagen d L Figura 1.2. Formación de imagen con una cámara oscura. Supongamos que tenemos una caja cuadrada de lado L con un agujero circular de radio ra y un objeto a la distancia d de la caja (fig. 1.2). La luz que emerge de un punto del objeto se proyecta en la cara posterior de la caja como una mancha luminosa aproximadamente circular de radio ra (L + d)/d.1 Si definimos un objeto como la unión de puntos luminosos, en la cara posterior de la caja se verá la superposición de las manchas luminosas correspondientes a cada punto del objeto. Si el agujero es relativamente grande, en la cara posterior veremos algo como una imagen muy desenfocada del objeto. Pero si se achica gradualmente el agujero, la imagen pasará de desenfocada a nítida. Será completamente nítida si el radio del agujero tiende a cero (el ángulo del cono de iluminación tiende a cero). En este caso el cono de iluminación se transforma en lo que se denomina un rayo luminoso. Por supuesto, si el radio del agujero es cero, el rayo luminoso será una línea recta (que no transportará energía). En este caso límite (no real), diremos que la imagen es una copia idéntica del objeto, salvo por un factor de escala. Siguiendo la geometría de la fig. 1.2, también es evidente que la imagen estará invertida. 1 Para el punto del objeto en el eje óptico será circular y para un punto del objeto fuera del eje óptico será, más bien, una elipse. Óptica geométrica · 5 Figura 1.3. Imágenes con una cámara oscura. (a) Objeto. (b) Cámara oscura: cámara digital a la que se le retiró el sistema óptico formador de imagen (objetivo de la cámara) para reemplazarlo por un iris. (c), (d), (e) y (f) Imágenes tomadas con la cámara oscura cuando el diámetro del iris es, aproximadamente, 0.5 mm, 1.0 mm, 2.0 mm, y 3.0 mm, respectivamente. En todos los casos, el tiempo de exposición fue el mismo (menor a 1 s). Con el agujero de menor diámetro en (c), se observa el objeto con menor iluminación y un poco desenfocado. En (d), al abrir el iris hasta 1.0 mm, aumenta la iluminación, pero el desenfoque se hace mayor. En (e), al aumentar aún más el iris, hasta 2.0 mm, se mejora notablemente la iluminación, pero la imagen está muy desenfocada. Finalmente, en (f), el iris se aumenta hasta 3.0 mm, y en este caso se tiene una imagen muy iluminada, pero se ha perdido casi toda la información sobre la forma del objeto. En la fig. 1.3, se muestra un ejemplo de 4 imágenes de un mismo objeto (en (a)), tomadas con una cámara oscura (en (b)), con el mismo tiempo de exposición menor a 1 s, para diferentes diámetros del agujero (iris de tamaño variable): (c) ≈ 0.5 mm, (d) ≈ 1.0 mm, (e) ≈ 2.0 mm y (f) ≈ 3.0 mm. 6 · Óptica geométrica La cámara oscura en este ejemplo es una cámara digital a la que se le ha retirado el sistema óptico formador de imagen (objetivo de la cámara) y se le ha reemplazado por un iris de diámetro variable. Alhazen2 (945-1040) usa la cámara oscura (que él mismo construyó) para mostrar que la luz de los objetos llega al ojo humano viajando en línea recta [1]. En la práctica, con un agujero muy pequeño, el aspecto ondulatorio de la luz se hace evidente mediante la difracción, lo que da una mancha luminosa de mayor tamaño que la que se tendría con la proyección geométrica. Trataremos el fenómeno de la difracción al final del curso. Por ahora, vamos a aceptar que con la cámara oscura se puede observar que la luz se propaga como rayos, que siguen una línea recta en medios homogéneos (índice de refracción constante). 1.1.2. La teoría corpuscular de Newton u ix u iy -u iy q q u ix Superficie reflectora Figura 1.4. Ley de la reflexión según Newton. Newton (1642-1727) comparte la idea de que la luz se propaga en línea recta y también afirma que la luz está compuesta de pequeñas partículas de luz que siguen las leyes de la mecánica newtoniana [2]. De esta manera Newton da una explicación a las leyes de la reflexión y refracción de la luz. En un medio homogéneo se propagan en línea recta y con velocidad constante. Cuando las partículas de luz inciden en una superficie reflectora experimentan un choque elástico manteniendo la velocidad tangencial y cambiando la dirección de la velocidad ortogonal a la superficie. Esto se esquematiza en la fig. 1.4, en la que se muestra que después de la colisión solo cambia la dirección de la componente y, el módulo de la velocidad se 2 Alhazen es el nombre en su versión latina de Ibn al-Haytham, nacido en lo que hoy es Basora (Iraq), en 965. Alhazen vivió en el período en el que el mundo musulmán fue la sede de grandes avances científicos. Óptica geométrica · 7 mantiene y el ángulo con que se refleja el rayo luminoso es igual al ángulo con el que incide el rayo luminoso. u ix u iy qi ni Superficie refractora nt nt qt > ni ut x = u i x ut y > u i y Figura 1.5. Ley de la refracción según Newton. Por otra parte, en el caso de la refracción, Newton sostiene que la interfase que separa dos medios de distinto índice de refracción (con el índice de refracción del medio incidente menor al índice del medio de transmisión) ejerce una atracción sobre las partículas de luz, aumentando así la componente normal de la velocidad, mientras que la componente tangencial permanece invariable, como se muestra en la fig. 1.5. Lo anterior implica que el módulo de la velocidad aumenta cuando la luz pasa de un medio de menor índice a un medio de mayor índice, contrario a lo que realmente ocurre. 1.1.3. La teoría ondulatoria de Huygens La teoría corpuscular de Newton no solo se equivoca en cuanto al cambio de la velocidad cuando la luz se refracta, sino que no puede explicar los fenómenos de interferencia. Una propuesta diferente a la de Newton es presentada por Huygens conocida como el principio de Huygens. Antes de enunciar dicho principio vamos a definir cualitativamente lo que es un frente de onda a partir de ondas mecánicas en la superficie del agua. Cuando una gota cae sobre la superficie de un estanque de agua que está en reposo, podemos observar una serie de ondulaciones (crestas y valles) en la superficie que se propagan alejándose del lugar donde cayó la gota. La forma de las crestas (valles) son círculos (fig 1.6(a)). Idealmente, los puntos que están en la parte más alta de una de las crestas estarán a la misma altura. 8 · Óptica geométrica Diremos que todos los puntos de una cresta (valle) que están a la misma altura describen un perfil que se denomina frente de onda. (a) (b) Figura 1.6. Ondas en una cubeta con agua: (a) ondas circulares, (b) ondas circulares secundarias en una abertura (difracción). Entonces, en el ejemplo de la fig. 1.6(a), la gota equivale a la fuente que origina las ondas circulares (esféricas en el caso 3D). En un medio homogéneo, los frentes de onda circulares se propagan con la misma velocidad. A medida que el frente de onda se aleja de la fuente, incrementa su radio, y para grandes distancias el frente de onda en la vecindad de un punto se verá como un frente de onda plano. Supongamos que se obstruye un frente de onda dejando pasar solamente una porción pequeña, como se muestra en la fig. 1.6(b), lo que ocurre es que al atravesar la abertura se generan frentes de onda nuevamente circulares que se propagan con la misma velocidad del frente de onda original. Este hecho, que se debe a la difracción de las ondas, es la idea central del principio de Huygens, que se puede enunciar como sigue [3]: cada punto en un frente de onda se puede considerar como una fuente de ondas esféricas secundarias que se propagan con la misma velocidad que el frente de onda. Al cabo de un tiempo, el frente de onda propagado será la envolvente de las ondas esféricas secundarias. Lo anterior se ilustra en la fig. 1.7, en la que se recrea la propagación de un frente de onda a partir de las ondas secundarias de Huygens. Esta idea de Huygens es aplicable a la propagación de la luz y permite deducir correctamente las leyes de la reflexión y la refracción. En la refracción, como en la fig. 1.5, la velocidad de la luz en el medio de mayor índice es menor a la que tiene en el medio de menor índice (contrario al supuesto de Newton). Óptica geométrica Ondas secundarias Frente de onda · 9 Nuevo frente de onda Figura 1.7. Construcción de un frente de onda en propagación con el principio de Huygens. Finalmente, veamos cómo se deduce la ley de la refracción a partir del principio de Huygens. En la fig. 1.8(a), se muestra un frente de onda S − S 0 que incide con una inclinación 𝜃 en una interfase que separa dos medios homogéneos de índices de refracción n (medio incidente) y n 0 (medio de refracción). Cuando el frente de onda llega al punto a, se generan ondas secundarias que se propagan con velocidades 𝜐 (en el medio incidente) y 𝜐 0 (medio de refracción). En un tiempo t posterior, el frente de onda llega al punto b, por lo que las ondas secundarias emitidas en a tendrán los radios ae = 𝜐t y ad = 𝜐 0t, respectivamente. La velocidad de propagación en un medio de índice n se define como 𝜐 = c/n, donde c es la velocidad de la luz en el vacío. Por lo tanto, si n < n 0, entonces 𝜐 > 𝜐 0, y la situación se verá como se ilustra en la fig. 1.8(a). c e S' n sinq = n' sinq ' q n n' n q S a q' d (a) b n' q' (b) Figura 1.8. Ley de la refracción según el principio de Huygens. 10 · Óptica geométrica De acuerdo con el principio de Huygens, en el tiempo t la envolvente para la onda reflejada será el frente de onda plano be y la envolvente para la onda refractada será el frente de onda plano bd. Para la refracción, tenemos que sin 𝜃 0 = ad/ab y sin 𝜃 = cb/ab. Como cb = ae, se llega a sin 𝜃 0 𝜐 0t = . sin 𝜃 𝜐t (1.1) Usando la definición de índice de refracción,3 finalmente, llegamos a la ley de la refracción, también conocida como la ley de Snell4 n sin 𝜃 = n 0 sin 𝜃 0 , (1.2) que nos índica la manera como cambia la inclinación del frente de onda refractado (ángulo 𝜃 0). Si en lugar de observar la inclinación de los frentes de onda nos fijamos en las direcciones de propagación de los frentes de onda, entonces la ley de Snell también se puede esquematizar como en la fig. 1.8(b). De hecho, si volvemos a la interpretación de rayos de luz, la ley de Snell también se puede enunciar diciendo que si un rayo luminoso en el medio de índice n incide en una interfase con un ángulo 𝜃 (medido con respecto a la normal de la interfase en el punto donde incide el rayo), el rayo refractado en el medio de índice n 0 formará un ángulo 𝜃 0 con respecto a la normal. Entonces, tenemos dos conceptos: el rayo luminoso y el frente de onda. Geométricamente, ambos se relacionan, los rayos son ortogonales a los frentes de onda. Así que usar una u otra representación resulta equivalente mientras consideremos la propagación de la luz como un asunto geométrico. En 1678, Huygens (en Traité de la Lumière) muestra que con sus ideas de ondas secundarias se cumple la ley de Snell, que él ya conocía de los trabajos de Snell. Como veremos más adelante, esta ley también puede ser derivada a partir de otros principios físicos. 1.1.4. Trazo gráfico de rayos La ley de Snell tiene una interpretación gráfica que permite hacer de manera sencilla (y exacta) el trazo de los rayos en cualquier superficie refractora. En la fig. 1.9(a), tenemos la refracción de un rayo incidente. Supongamos que construimos un triángulo, como se muestra en la fig. 1.9(b), de la 3 En el apéndice B se trata el índice de refracción en materiales dieléctricos, en particular el vidrio óptico. 4 La ley de la refracción también se denomina ley de Snell en memoria de Willebrord Snellius (1580-1626), quien fue profesor de matemáticas en la Universidad de Leiden. Óptica geométrica · 11 siguiente manera: un lado de longitud igual al índice n en la prolongación del rayo incidente con origen en el punto de incidencia A. El extremo de este lado será B. Un lado de longitud igual al índice n 0 con la misma orientación del rayo refractado con origen en el punto de incidencia A. El extremo de este lado será C. El tercer lado será la línea que une los extremos B y C. Este triángulo tiene la propiedad que el lado BC es paralelo a la línea normal N. N N N q n n n A n' n n' q' q q' (a) B n' n' C (c) (b) Figura 1.9. Trazo gráfico de rayos según la ley de Snell. El triángulo ABC de la fig. 1.9(b) cumple la ley de Snell. Lo anterior resulta directamente de la ley de los senos para el triángulo, así AB AC = , 0 sin 𝜃 sin(𝜋 − 𝜃) (1.3) n0 n = , sin 𝜃 0 sin 𝜃 (1.4) lo que es igual a que es la ley de Snell. n < n' n n > n' n' N N n n' n n' (a) n n' (b) Figura 1.10. Trazo gráfico de rayos en superficies curvas. 12 · Óptica geométrica Lo anterior permite desarrollar una técnica para hacer el trazo gráfico de rayos en la refracción, como se ilustra en la fig. 1.9(c), que dice: consideremos un rayo que incide en una superficie que separa dos medios: medio de incidencia con índice n y medio de refracción con índice n 0. El rayo refractado se obtiene así: en el punto de incidencia se determina la normal a la superficie y se dibuja dos círculos de radios n y n 0 centrados en ese punto. El rayo incidente se prolonga hasta el círculo de radio n y en la intersección se tiene un punto desde el que se traza una línea paralela a la normal en el punto de incidencia. Esta nueva línea corta al círculo de radio n 0 en otro punto que índica la dirección en que debe ser trazado el rayo refractado desde el punto de incidencia. Esta técnica funciona en superficies planas y curvas, ya que la ley de Snell se aplica localmente. Por ejemplo, en la fig. 1.10 se muestra dos ejemplos con superficies curvas; en (a), n < n 0, y en (b), n > n 0. Note el cambio en la prolongación del rayo incidente en (b), donde ahora va hasta el círculo de mayor radio. En este último caso, se presenta una situación relevante cuando la línea paralela a la normal N toca tangencialmente al círculo de menor radio. El rayo refractado forma un ángulo de 𝜋/2, es decir, el rayo es tangente a la interfase. En la fig. 1.11, se ilustra este hecho particular. N n qc A n' C B Figura 1.11. Cuando la paralela a la normal N toca tangencialmente al círculo de radio n 0 se tiene reflexión total interna. El ángulo del rayo incidente para el cual ocurre esto se denota por 𝜃 c y se denomina ángulo crítico. Para 𝜃 > 𝜃 c , se produce el fenómeno de reflexión total interna, el cual veremos en detalle en la sección 2.4.1. Del triángulo ABC de la fig.1.11, se tiene que sin 𝜃 c = n0 . n (1.5) Óptica geométrica · 13 1.2. Principio de Fermat Euclides (325-265 AC), en sus tratados de geometría, postuló que “dados dos puntos se puede trazar una línea recta que los une”, y en el espacio Euclidiano la distancia más corta entre dos puntos es la longitud de la línea recta que los une. Siguiendo este postulado, Hero de Alejandría (10-70 AC) establece que la luz para ir de un punto a otro sigue el camino geométrico más corto. Otra manera de decir que la luz se propaga como rayos geométricos. Teniendo en cuenta que en un medio homogéneo la luz se propaga con velocidad constante, también se puede decir que la luz para ir de un punto a otro sigue el camino para el cual se emplea el menor tiempo. Para un mismo medio homogéneo los dos enunciados resultan equivalentes. Sin embargo, si los dos puntos están en diferentes medios (ambos homogéneos), lo que resulta es que la luz ya no sigue el camino geométrico más corto. P P h n T1 T2 q n T T3 n' n' b Q q' Q x a (a) (b) Figura 1.12. Ley de Snell con el principio de Fermat. (a) Tres posibles trayectorias para ir de P a Q. (b) Geometría para calcular la trayectoria real. En la fig. 1.12(a), se ilustra la situación con tres posibles trayectorias para la luz. La interfase plana separa los medios de índice de refracción n y n 0. La trayectoria geométrica más corta es la línea recta PT2 Q, pero no corresponde con la trayectoria que sigue la luz si n 0 ≠ n. La trayectoria que sigue la luz se asemeja a las líneas PT1 Q cuando n 0 < n y a las líneas PT3 Q cuando n 0 > n. Entonces, ¿cómo se puede obtener la trayectoria real de la luz cuando n 0 ≠ n? La respuesta a esta pregunta se obtiene al usar el segundo enunciado para el menor tiempo. Este enunciado fue formulado por Fermat (1601-1665) y se conoce como el principio de Fermat. 14 · Óptica geométrica Para aplicar el principio de Fermat al problema ilustrado en la fig. 1.12(a), vamos a considerar la geometría de la fig. 1.12(b). La interfase se localiza en y = 0 y el punto T en x. Las coordenadas del punto P son (0, h) y del punto Q son (a, −b). El tiempo para que la luz vaya de P a Q pasando por T será n n0 t = PT + TQ, (1.6) c c es decir, q n0 2 np 2 h + x2 + b + (a − x) 2 . (1.7) t= c c El principio de Fermat establece que t debe ser el menor posible, lo cual equivale a encontrar el valor de x para el cual el lado derecho de la ecuación es el menor. En otras palabras, debemos derivar el lado derecho con respecto a x e igualar a cero. Esto es, 0= x (a − x) n n0 − p √ c h2 + x 2 c b 2 + (a − x) 2 (1.8) de donde resulta la ley de Snell n 0 sin 𝜃 0 = n sin 𝜃 (eq. (1.2)). P P Q h q b Q q q q' n n T T x a P' (a ) (b ) Figura 1.13. Ley de la reflexión con el principio de Fermat. (a) Geometría para calcular la trayectoria de P a Q pasando por T. (b) T está en la intersección de la recta que une P0 con Q. La distancia de P0 al espejo es igual a la distancia de P al espejo. Para el caso de la reflexión, como en un espejo plano, la geometría del problema, se muestra en la fig. 1.13(a). El ángulo del rayo incidente con la normal en T es 𝜃 y el ángulo del rayo reflejado con la normal en T es 𝜃 0. Al aplicar el principio de Fermat a la fig. 1.13(a), obtenemos ecuaciones iguales a las que tuvimos en el caso de la refracción, pero ahora n 0 = n, de modo que la eq. (1.8) queda 0 = sin 𝜃 0 − sin 𝜃, por lo tanto, el rayo reflejado tiene un ángulo de inclinación igual al ángulo del rayo incidente, es decir, Óptica geométrica · 15 𝜃 0 = 𝜃. En la fig. 1.13(b), se incluye la imagen virtual P0 de P. La distancia de P0 al espejo es igual a la distancia de P al espejo. Un observador en Q verá la luz llegar desde P0 y no desde P. Entonces, en efecto, el punto T está en la intersección de la línea recta P0Q, de modo que para la fuente virtual también se satisface el principio de Fermat. Observador T Figura 1.14. Un espejismo. El observador ve algo que realmente no está en el punto T. Lo que ve es la luz proveniente del cielo. Un ejemplo interesante que se explica con el principio de Fermat es el espejismo, fig. 1.14. Supongamos que estamos parados en una carretera recta en una llanura con cielo despejado. Debido al calor, el aire que está más cerca de la superficie de la carretera tendrá una menor densidad que el que está a mayor altura. En consecuencia, el índice de refracción varía con la altura y es menor cerca de la superficie de la carretera. Si ahora dirigimos nuestra mirada hacia un punto T en la carretera, ocurre que la luz que llega en esa dirección no es la que sale del punto T, sino luz proveniente del cielo. Entonces, vemos como si la carretera delante de nosotros estuviera mojada o como si fuera un espejo. Lo que ha ocurrido es que la luz evita las zonas de mayor índice de refracción buscando la trayectoria del tiempo mínimo y algunos de los rayos provenientes del cielo terminan llegando a nuestros ojos cuando miramos en la dirección índicada. Una situación en que se tiene infinitas trayectorias con el mismo tiempo la tenemos en un espejo elipsoidal de revolución, el cual tiene la propiedad de formar la imagen de una fuente puntual localizada en uno de los focos en el otro foco. Consideremos una sección transversal del elipsoide que contiene al eje de revolución, como se muestra en la fig. 1.15. Supongamos que dentro del espejo tenemos aire (n = 1) y que en el foco P se localiza una fuente puntual de la que divergen rayos en dirección radial. Cualquier rayo seguirá una trayectoria recta hasta llegar al espejo en un punto T y se reflejará siguiendo nuevamente una trayectoria recta pasando por el punto Q, que está en el otro foco de la elipse. Al cambiar la posición de T, el rayo luminoso reflejado pasará nuevamente por Q. En ambos casos, el tiempo es el mismo, y esto ocurre para cualquier otro punto T en la superficie del 16 · Óptica geométrica espejo. Así que ninguna de las trayectorias es un mínimo. Lo anterior índica que la formulación original del principio de Fermat no contempla todos los casos. T P Q Figura 1.15. Espejo elíptico. La luz que emite una fuente puntal en P llegará después de reflejarse en el espejo al punto Q siguiendo cualquiera de las infinitas trayectorias que cumplen la ecuación de la elipse. 1.2.1. Formulación moderna del principio de Fermat Si en la eq. (1.6) pasamos a multiplicar el tiempo por la velocidad de la luz, ct = nPT + n 0TQ, tenemos una igualdad de dos cantidades de naturaleza distinta. Al lado izquierdo, tenemos la distancia que recorre la luz en el vacío en el tiempo mínimo; al lado derecho, una distancia diferente a la distancia geométrica, esto es, la distancia geométrica multiplicada por el índice de refracción. A esta última distancia se le denomina longitud de camino óptico (LCO). Teniendo en cuenta este concepto, el principio de Fermat en su forma moderna establece que: un rayo de luz va de un punto a otro siguiendo una trayectoria cuya longitud de camino óptico es estacionaria con respecto a las variaciones de dicho camino. En este enunciado, “estacionaria” significa que puede ser un valor mínimo, máximo o un punto de inflexión con pendiente horizontal. De esta manera, se incluyen todos los casos posibles para la trayectoria de la luz. Por ejemplo, en el espejo elipsoidal de la fig. 1.15, las trayectorias de los rayos corresponden con el punto de inflexión en el principio de Fermat. · Óptica geométrica Trayectoria para el camino óptico más corto 17 P2 s n (x,y,z) P1 ds Trayectoria geométrica más corta Figura 1.16. Longitud de camino óptico en un medio inhomogéneo. Entonces, de manera general, supongamos que tenemos un camino C de longitud s que une dos puntos P1 y P2 que se encuentran en un medio inhomogéneo, como se muestra en la fig. 1.16. El índice de refracción será una función de las coordenadas espaciales, n = n(x, y, z), y la longitud de camino óptico estará dada por ∫ LCO = n(s)ds, (1.9) C p donde ds = dx 2 + dy 2 + dz 2 . Si LCO satisface 𝜕 (LCO) = 0, 𝜕s (1.10) entonces C es el camino que seguirá la luz. En la fig. 1.16, aunque la longitud de la trayectoria para el camino óptico más corto resulta ser mayor que la longitud de la trayectoria geométrica más corta (segmento P1 P2 ), se tiene que la longitud del camino óptico a lo largo de C es menor que la longitud de camino óptico a lo largo de P1 P2 . 1.2.2. Rayos y frente de onda Teniendo en cuenta lo anterior, desde el punto de vista geométrico, un rayo de luz es la curva que satisface el principio de Fermat. Si el medio es homogéneo, n = n0 (constante), entonces ∫ LCO = n0 ds = n0 P1 P2 , C ya que le camino más corto entre dos puntos (en el espacio euclidiano) es una línea recta. Por lo tanto, los rayos en un medio homogéneo son líneas rectas, mientras que en un medio inhomogéneo serán curvas. 18 · Óptica geométrica Por ejemplo, en la fig. 1.17(a) se muestra en un plano una posible configuración para algunos rayos emitidos por una fuente puntual sumergida en un medio de índice de refracción variable. Ahora consideremos una curva ortogonal a los rayos. Si la distancia a la que está cada punto de esta curva a lo largo de los rayos con respecto a la fuente puntual es tal que el camino óptico es el mismo, esta curva se denomina frente de onda geométrico. Por supuesto para otra longitud de camino óptico tendremos otro frente de onda, así que lo que tenemos es una familia de rayos y una familia de frentes de onda ortogonales entre sí. En la situación tridimensional, los rayos no estarán limitados a un plano y los frentes de onda serán superficies ortogonales a los rayos. En el caso cuando el índice de refracción es constante, los rayos serán líneas radiales y los frentes de onda serán esferas, fig. 1.17(b). Si observamos los frentes de onda a una distancia que tiende a infinito de la fuente, el frente de onda será un plano y los rayos correspondientes serán líneas paralelas entre sí, fig. 1.17(c). A estos rayos se les denomina rayos colimados. Rayos radiales Rayos curvos S Rayos colimados S n = n(x,y,z) Frente de onda n = n0 n = n0 Frente de onda esférico (a ) Frente de onda plano (b ) (c ) Figura 1.17. Los rayos y los frentes de onda son ortogonales entre sí. (a) Fuente puntual en un medio inhomogéneo. Los rayos son curvas y el frente de onda es una superficie distorsionada; (b) fuente puntual en un medio homogéneo. Los rayos son líneas radiales y el frente de onda es una esfera; (c) a una distancia infinita de la fuente puntual en un medio homogéneo los rayos son líneas paralelas (colimadas) y el frente de onda es un plano Desde el punto de vista matemático, si Φ(x, y, z) representa el frente de onda, entonces ∇Φ representa los rayos y t̂ = ∇Φ k∇Φk (1.11) da la dirección del rayo. Por lo tanto, para referirnos a la propagación de la luz lo podemos hacer con cualquiera de las dos representaciones: rayos o frentes de onda. Dada una de las representaciones podemos pasar a la otra con la eq. (1.11). Óptica geométrica · 19 En la sección 1.1.3, definimos cualitativamente el frente de onda a partir del movimiento ondulatorio de las crestas y valles en la superficie del agua. Formalmente, en ondas, el frente de onda se define como la superficie en que cada punto tiene el mismo valor de fase. Por otro lado, en el principio de Fermat, el frente de onda se define como la superficie en que cada punto tiene el mismo valor de longitud de camino óptico. Las dos definiciones son equivalentes. Como veremos más adelante, la fase se puede obtener a partir de la longitud de camino óptico. 1.2.3. Imagen de una fuente puntual Supongamos que tenemos una fuente puntual S sumergida en un medio homogéneo de la que divergen rayos, como en la fig. 1.17(b). Teniendo en cuenta que la refracción de la luz en una interfase implica que los rayos luminosos cambian su dirección de acuerdo con la ley de Snell, entonces es posible diseñar una superficie o un conjunto de superficies refractoras (sistema óptico) con las que se puedan volver a juntar los rayos en un punto S0 (también en un medio homogéneo). Si la longitud de camino óptico es igual para todos los rayos que salen del punto S, refractándose en el sistema óptico y llegando al punto S0, entonces diremos que S0 es la imagen de S. Lo anterior implica que el frente de onda que converge en S0 también debe ser esférico, como se muestra en la fig. 1.18. S Objeto Sistema óptico S' Imagen Figura 1.18. Formación de la imagen de una fuente puntual. La fig. 1.18 describe la formación de la imagen de un objeto puntual S en una imagen también puntual S0. Pero también se puede hacer la descripción en el sentido inverso, es decir, si S0 es el objeto, entonces S será la imagen. Se dice entonces que S y S0 son puntos conjugados. Si el sistema óptico es tal que los rayos que salen de S no llegan a S0 con la misma longitud de camino óptico, entonces no tendremos la imagen 20 · Óptica geométrica de un punto, sino una mancha de cierta extensión. Lo anterior se explica teniendo en cuenta que una imagen puntual implica un frente de onda esférico convergente, y si los rayos llegando o acercándose a la posición ideal de S0 no tienen el mismo camino óptico, el frente de onda convergente no será esférico, por lo que no se puede tener una imagen puntual. En este caso se dice que el sistema óptico introduce aberraciones que distorsionan la imagen. Este tema lo abordaremos de manera general al final del capítulo. La cuestión que nos interesa ahora es determinar la forma que las superficies refractoras deben tener para generar una imagen puntual de un objeto puntual. Óptica geométrica · 21 1.3. Superficies refractoras En la fig. 1.18, el sistema óptico recibe a la entrada un manojo de rayos divergentes generados por un objeto puntual (fuente puntual) y entrega a la salida un manojo de rayos convergentes hacia un punto imagen. ¿Cómo debe ser el sistema óptico para realizar esta tarea? Para responder esta pregunta comenzaremos por el caso más simple: la formación de imagen por una superficie refractora. La forma de la superficie se determina a partir del principio de Fermat. l l' P P' n n' Figura 1.19. La forma de la superficie refractora que permite obtener la imagen puntual P0 de un objeto puntual P se denomina ovoide cartesiano. En la fig. 1.19, se muestra la formación de imagen de un objeto puntual P empleando una superficie refractora que separa dos medios de índice de refracción n y n 0, (n 0 > n). La longitud de cualquier rayo incidente se denota por l y la longitud del correspondiente rayo refractado se denota por l 0. La longitud de camino óptico para cualquier rayo debe ser la misma, por lo tanto LCO = nl + n 0l 0 = constante. (1.12) La superficie que se obtiene al resolver la eq. (1.12) es una superficie de revolución denominada ovoide cartesiano. El eje de revolución coincide con la línea recta PP0. La intersección del eje con la superficie define el vértice de la superficie. El centro de curvatura de la superficie en el vértice estará en el eje. Entonces, con el ovoide cartesiano formamos la imagen de P en P0, como se muestra en la fig. 1.19. En otros casos podemos necesitar más de una superficie, por ejemplo, si lo que queremos es que la imagen esté en el mismo medio del objeto. En cualquier caso, en lo que sigue en este capítulo, nos vamos a limitar a sistemas ópticos cuyas superficies refractoras tengan simetría de revolución. Además, todos los ejes de revolución serán coincidentes, en otras palabras, tendremos un solo eje de revolución que se 22 · Óptica geométrica denominará eje óptico del sistema. Por lo tanto, el eje óptico debe contener todos los vértices y centros de curvatura (correspondientes a los vértices) de las superficies refractoras. Un ejemplo sencillo de ovoide cartesiano se obtiene cuando queremos formar una imagen puntual a una distancia b del vértice V de la superficie refractora cuando el punto objeto está a una distancia infinita del vértice. Ahora los rayos incidentes serán colimados y paralelos al eje óptico, como se muestra en la fig. 1.20. n < n' Q P A n V a S r q n' P' b Figura 1.20. La forma de la superficie que genera una imagen puntal de un objeto puntual que está en el infinito es un elipsoide de revolución cuando n < n 0. Consideremos un plano ortogonal al eje óptico que pasa por A. Los rayos incidentes en ese plano tendrán la misma longitud de camino óptico desde el objeto puntual. Por lo tanto, podemos tomar ese plano como referencia para medir las longitudes de camino óptico desde P, pasando por Q en la superficie refractora Σ, hasta el punto imagen P0. Luego, si P0 es la imagen del punto que está en infinito, todos los rayos desde el plano en A hasta P0 deben tener la misma longitud de camino óptico. En particular, para el rayo que sale de P, tenemos LCO = nPQ + n 0 𝜌 = na + n 0b, (1.13) donde a es la distancia desde A hasta V. Note que el lado derecho de la eq. (1.13) es la longitud de camino óptico a lo largo del eje óptico. Ya que PQ = a + b − 𝜌 cos 𝜃, entonces n n 0 𝜌 1 − 0 cos 𝜃 = b(n 0 − n). (1.14) n Definiendo una nueva constante p = b (n 0 − n) /n 0 se llega a 𝜌 (1 − e cos 𝜃) = p, (1.15) Óptica geométrica · 23 lo que describe una superficie cónica con excentricidad e = n/n 0. Ya que n 0 > n, entonces e < 1, lo que corresponde con una elipse. Por lo tanto, la superficie refractora Σ, que enfoca los rayos colimados paralelos al eje óptico en un punto imagen, es un elipsoide de revolución. 1.3.1. Modelo de la córnea del ojo humano Un ejemplo en que la superficie refractora se asemeja a un elipsoide de revolución es la cara anterior de la córnea del ojo humano. El ojo humano es un sistema biológico-óptico que enfoca los rayos luminosos en la superficie cóncava de la retina. Anatómicamente, el globo ocular de un ojo normal en un adulto es un ovoide aproximadamente esférico de unos 23 mm de diámetro. La luz entra al ojo primero por la córnea, un tejido transparente que sobresale del globo, fig. 1.21. El índice de refracción promedio de la córnea es 1.376. En un ojo emétrope, la córnea tiene una superficie anterior con un radio medio de 7.8 mm en la zona central (alrededor del vértice) y a medida que se aleja del centro el radio aumenta ya que la córnea se empalma con la esclerótica (la capa más externa que recubre el globo ocular). Esto hace que la forma de la cara anterior de la córnea se asemeje a un elipsoide. Varios estudios experimentales [4] han demostrado que la mayor parte de las córneas normales se pueden caracterizar mediante un modelo elipsoidal con una excentricidad 0.5 y con el vértice descentrado hacia la zona temporal con respecto al eje óptico en 0.4 mm aproximadamente. Esclerótica Cristalino Córnea Humor acuoso Iris Retina Mácula Humor vítreo Eje visual Eje óptico Punto ciego Figura 1.21. Esquema del ojo humano. La superficie anterior de la córnea en los ojos emétropes se asemeja a un elipsoide de revolución. La superficie posterior de la córnea, con un radio medio de 6.5 mm, está separada de la superficie anterior en 0.6 mm, aproximadamente. Inmediatamente detrás de la córnea, está la cámara anterior, que contiene al humor 24 · Óptica geométrica acuoso con un índice de refracción 1.336. Luego, se encuentra el iris, que controla la cantidad de luz que entra al ojo, variando su diámetro interno desde 2 mm (objetos con alta iluminación) hasta 8 mm (objetos con baja iluminación). Detrás del iris está la lente del cristalino, con forma de lente biconvexa de 9 mm de diámetro y 4 mm de espesor, aproximadamente. El índice de refracción del cristalino varía, alrededor de 1.406 en el núcleo interior hasta aproximadamente 1.386 en las zonas externas. El cristalino puede variar su forma para realizar un enfoque fino, de modo que la luz que provenga de cualquier objeto exterior sea enfocada en la superficie de la retina. Detrás del cristalino hay otra cámara con una sustancia transparente, denominada humor vítreo, con un índice de refracción 1.337. Finalmente, la luz es enfocada en la retina, una superficie cóncava que contiene dos clases de células foto-receptoras, los conos y los bastones. Una descripción detallada sobre la anatomía del ojo y su funcionamiento se puede consultar en las obras de Gullstrand [5], Le Grand [6], Davson [7], Smith [8]. V P' neq Figura 1.22. Modelo simplificado del ojo humano. El ojo se modela con una superficie refractora elipsoidal y con un índice de refracción equivalente neq . Debido a la complejidad del ojo humano (por ejemplo, el eje visual no coincide con el eje óptico, fig. 1.21), en optometría y oftalmología se suele trabajar con modelos simplificados del ojo humano que permiten analizar la formación de imagen en la retina. Varias propuestas de esto se han hecho y algunas incluyen un elipsoide para modelar la córnea [9]. Por ejemplo, se podría pensar el ojo humano como un sistema óptico de una sola superficie refractora (córnea), con un índice de refracción equivalente neq , como se muestra en la fig. 1.22. Los rayos que vienen de puntos objeto muy distantes se enfocan en un mismo punto en la retina si la forma de la córnea simulada es elipsoidal, de acuerdo con la eq. (1.15). Algunos modelos simplificados usan en lugar de un elipsoide una esfera para la córnea. Este cambio es adecuado si el manojo de rayos que viene de infinito está limitado a una región muy cercana al eje óptico (en la que podemos modelar una esfera Óptica geométrica · 25 por una superficie de segundo orden). Si el manojo de rayos no se limita a una región pequeña, no se cumplirá el principio de Fermat para todos los rayos y la imagen ya no será un punto, será una mancha borrosa. 1.3.2. Refracción con superficies esféricas Aunque con los ovoides cartesianos tenemos sistemas ópticos para formar imágenes ideales (imágenes puntuales de objetos puntuales), en la mayoría de sistemas formadores de imagen son poco prácticos, ya que la imagen ideal se obtiene para una posición fija del objeto. Si cambiamos la posición del objeto (a lo largo del eje óptico), ya no se formará una imagen puntual. Por otro lado, las superficies esféricas son fáciles de fabricar y se puede obtener imágenes de gran calidad para diferentes posiciones del objeto mediante la combinación de varias superficies esféricas refractoras y/o limitando la extensión transversal del manojo de rayos a la región cercana al eje óptico. Para ver cómo se comportan los rayos en una superficie esférica refractora vamos a calcular la refracción de los rayos de acuerdo al principio de Fermat con base en la fig. 1.23. f q Q V -s q' -a R P -l N n l' C s' - f' P' n' Figura 1.23. Geometría para calcular la refracción en una superficie esférica. En la fig. 1.23, algunas cantidades aparecen con signo negativo. Lo anterior obedece a que la convención de signos que usaremos de aquí en adelante sigue la convención cartesiana, es decir: - Las distancias a la izquierda (del vértice o del punto Q) son negativas. - Las distancias a la derecha (del vértice o del punto Q) son positivas. - Los ángulos (con respecto al eje óptico o a la normal N) son negativos si van en la dirección de las manecillas de reloj. - Los ángulos (con respecto al eje óptico o a la normal N) son positivos si van en contra de la dirección de las manecillas de reloj. 26 · Óptica geométrica - El radio de curvatura de la superficie refractora es negativo si el centro de curvatura está a la izquierda del vértice. - El radio de curvatura de la superficie refractora es positivo si el centro de curvatura está a la derecha del vértice. - La altura de un punto objeto fuera del eje óptico (distancia desde el eje óptico) es negativa si el punto está por debajo del eje óptico. - La altura de un punto objeto fuera del eje óptico (distancia desde el eje óptico) es positiva si el punto está por encima del eje óptico. Adicionalmente, se supone que la luz viaja de izquierda a derecha y que todos los rayos están contenidos en el mismo plano (definido por los puntos P, Q y P0). La convención de signos en los sistemas ópticos varía según el autor. En nuestro caso, la que hemos seleccionado se suele usar en diseño óptico. La consecuencia de tener diferentes convenciones de signo se manifiesta en el cambio de algunos signos en las ecuaciones que relacionan las distancias del objeto y la imagen. De acuerdo con lo anterior, en la fig. 1.23 todas las distancias y los ángulos se dibujan como positivas. Por ejemplo, P está a la izquierda de V, por lo tanto s < 0, y en el dibujo ponemos −s. Entonces, la longitud de camino óptico para el rayo PQP0 será: LCO = −nl + n 0l 0 . (1.16) De los triángulos PQC y P0QC, se tiene que q −l = R 2 + (−s + R) 2 − 2R(−s + R) cos(−𝛼) (1.17) q R 2 + (s 0 − R) 2 − 2R(s 0 − R) cos(𝜋 + 𝛼). (1.18) y l0 = Ya que 𝛼 la única variable en el lado derecho de las eqs. (1.17) y (1.18), el principio de Fermat para el rayo PQP0 implica que d(LCO)/d𝛼 = 0. Lo anterior nos lleva a 0=n de donde (−s + R) (s 0 − R) − n0 , −l l0 (1.19) Óptica geométrica n 0 n 1 n 0 s 0 ns − = − . l0 l R l0 l · 27 (1.20) Esta ecuación nos dice a qué distancia de V se encuentra P0 para el rayo PQP0. Esta es una ecuación con dos incógnitas, s 0 y l 0. Por lo que, para encontrar la posición de P0, podemos optar por algún método numérico. Sin embargo, para ver cómo se refracta un manojo de rayos saliendo del punto P, en lugar de usar la eq. (1.20), vamos a usar el trazo gráfico de rayos descrito en la sección 1.1.4. Por ejemplo, en la fig. 1.24 se muestra el trazo de 5 rayos en una superficie esférica Σ de radio R = 41 mm, con n = 1.0 y n 0 = 1.8. Los rayos emergen de un punto P localizado en s = −149 mm y llegan a la superficie Σ con incrementos de altura iguales. C P n n' S Figura 1.24. Trazo gráfico de rayos en una superficie esférica. Los rayos refractados no convergen en un mismo punto. De la fig. 1.24, se observa que los rayos refractados no convergen en un único punto en el eje óptico. Ya que este defecto aparece al usar una superficie esférica en lugar de un ovoide cartesiano, se dice que la imagen está afectada por aberración esférica. También se observa que los rayos que viajan más cerca del eje óptico se separan menos entre sí al llegar al eje óptico que los rayos que viajan más lejos. Lo anterior sugiere que se puede tener imágenes aceptables si limitamos la región en la que inciden los rayos a una zona circular muy próxima al eje óptico. Esto significa que para un punto objeto en el eje óptico los rayos incidentes que vamos a considerar serán aquellos que viajen casi paralelos al eje óptico, tal y como se muestra en la fig. 1.25. A lo anterior se le llama aproximación paraxial y, en consecuencia, en la eq. (1.20), se tiene que l ≈ s y l 0 ≈ s 0, por lo tanto, n 0 n (n 0 − n) − = s0 s R (1.21) 28 · Óptica geométrica es la ecuación que describe la formación de imagen por una superficie esférica en la aproximación paraxial. Esta ecuación se denomina ecuación de Gauss. C P n P' n' S Figura 1.25. En la aproximación paraxial los rayos incidentes que emergen de P están muy cercanos al eje óptico. Los rayos refractados convergen en un punto, P0. 1.3.3. Puntos y distancias focales Una superficie esférica refractora se dice convexa si el radio de curvatura es positivo y se dice cóncava si el radio de curvatura es negativo. Para ambas superficies, vamos a ver lo que ocurre para un manojo de rayos paralelos incidentes o refractados con n 0 > n. Supongamos que un manojo de rayos paralelos y paraxiales inciden en una superficie esférica convexa, es decir, el objeto puntual está localizado en s = −∞. Por lo tanto, de la eq. (1.21), se tiene que s 0 es una constante que depende solo de los parámetros de la superficie refractora. Esta distancia se denomina distancia focal secundaria f 0 y está dada por 1 (n 0 − n) 1 . (1.22) = f0 n0 R Entonces, s 0 = f 0 es la distancia (a la derecha del vértice) en la que todos los rayos convergen. El punto donde convergen se denomina punto focal secundario F0. Esto se ilustra en la fig. 1.26(a). Ahora, ¿dónde se debe colocar un objeto puntual para que los rayos refractados emerjan paralelos? Lo anterior implica que s 0 = ∞. Por lo tanto, en la eq. (1.21) se tiene que s también es una constante que depende solo de los parámetros de la superficie refractora. Esta distancia se denomina distancia focal primaria f y está dada por 1 (n 0 − n) 1 = . f n R . (1.23) Óptica geométrica · 29 Entonces, s = − f es la distancia (a la izquierda del vértice) en la que se debe colocar un objeto puntual de manera que su imagen esté en el infinito. El punto en el que se coloca el objeto puntual se denomina punto focal primario F. Esto se ilustra en la fig. 1.26(b). n n' R C F' f' (a) n n' R C F f (b) Figura 1.26. Distancias y puntos focales en una superficie esférica refractora convexa para n 0 > n. (a) F0: punto focal secundario; (b) F: punto focal primario. En las figs. 1.26(a) y 1.26(b), se incluye una línea ortogonal (segmentada) que pasa por el vértice de la superficie refractora. Note que los rayos incidentes se refractan en esta línea y no en la superficie (como debería ser). Lo anterior resulta de la aproximación paraxial y nos recuerda que en la práctica los rayos viajan muy cerca del eje óptico. Sin embargo, con el fin de ilustrar el trazo de rayos para localizar la imagen, se dibujan rayos lejos del eje óptico. En el caso de una superficie cóncava, las distancias focales y puntos focales se muestran en la fig. 1.27. Las distancias focales están dadas por las eqs. (1.22) y (1.23), pero ahora R < 0 y, por lo tanto, f 0 < 0 y f < 0. Cuando s = −∞, los rayos refractados divergen como si provinieran de un punto F0 localizado en s 0 = − | f 0 |, como se muestra en la fig. 1.27(a). En este caso, diremos que se tiene una imagen virtual en F0 (punto focal secundario). Cuando s 0 = ∞, los rayos incidentes deben converger en un punto F localizado en s = | f |, como se muestra en la fig. 1.27(b). En este caso diremos que se tiene un objeto virtual en F (punto focal primario). 30 · Óptica geométrica n n' R C F' f' (a) n n' R C F f (b) Figura 1.27. Distancias y puntos focales en una superficie esférica refractora cóncava para n 0 > n. (a) F0: punto focal secundario; (b) F: punto focal primario. 1.3.4. Planos focales En la fig. 1.26(a), tenemos que rayos paralelos al eje óptico, limitados a la región paraxial, se enfocan en el punto focal secundario. Estos rayos provienen de un objeto puntual (en infinito) que está en el eje óptico. Si ahora consideramos otro objeto puntal fuera de este eje óptico (también en el infinito), tendremos rayos paralelos que llegan a la superficie refractora con cierta inclinación. Estos rayos convergen en un punto que está a la distancia focal f 0 de la superficie a lo largo de la línea inclinada que pasa por el centro de curvatura. Esto se muestra en la fig.1.28. La refracción de los rayos paralelos inclinados se puede entender fácilmente si desde el objeto puntual fuera de eje se traza un eje óptico auxiliar. Con respecto a este eje óptico la situación resulta equivalente al objeto puntual en eje. El resultado de considerar la refracción de manojos de rayos paralelos con diferentes inclinaciones es una superficie (esférica) en la que se enfocan los rayos. Esta superficie se denomina superficie focal. La consideración paraxial implica que las inclinaciones de los manojos también sea para ángulos pequeños. En ese caso, los manojos de rayos se enfocarán en una región de la superficie focal que se puede aproximar por un plano. Este será el plano focal (fig. 1.28). Óptica geométrica · 31 De acuerdo con lo anterior, podemos decir que en la aproximación paraxial los planos focales se definen como planos perpendiculares al eje óptico y contienen los puntos focales. En consecuencia, tendremos planos focales primarios y secundarios para cada una de las superficies refractoras. Superficie focal Plano focal R C n n' f' Figura 1.28. Superficie focal. En la aproximación paraxial, la superficie se puede describir por un plano en el que convergen los manojos de rayos inclinados. Generalizando, en la aproximación paraxial para n < n 0, se tiene que: - Un manojo de rayos paralelos inclinados que incide en una superficie esférica refractora convexa converge en un punto localizado en el plano focal secundario. Y para un objeto puntual localizado en cualquier lugar en el plano focal primario, los rayos se refractan en un manojo de rayos paralelos inclinados. - Un manojo de rayos paralelos inclinados que incide en una superficie esférica refractora cóncava diverge de un punto localizado en el plano focal secundario. Y para un objeto puntual virtual localizado en cualquier lugar en el plano focal primario, los rayos se refractan en un manojo de rayos paralelos inclinados. En ambos casos, la inclinación del manojo de rayos paralelos está dada por el rayo que no se desvía y que pasa por el centro de curvatura C. Este rayo se localiza en el eje óptico auxiliar (Fig. 1.28). Ejemplo: la esfera refractora Como una aplicación de un sistema que contiene dos superficies esféricas: convexa y cóncava, vamos a considerar la imagen que genera una esfera de radio R0 e índice n 0 = 3/2 de un objeto puntual en el infinito. La refracción de los rayos tendrá lugar en dos superficies, denotadas 1 y 2 en la fig. 1.29. La primera superficie de radio R = R0 y la segunda de radio R = −R0 , separada una distancia 2R0 de la primera. Con respecto a la primera superficie 32 · Óptica geométrica tenemos s1 = −∞. Por lo tanto, s10 = f10 = 3R0 . Con respecto a la segunda superficie, se tiene un objeto virtual en s2 = 3R0 − 2R0 = R0 y, por lo tanto, la imagen estará en s20 = R0 /2. Entonces, el objeto virtual para la segunda superficie es generado por la primera superficie. n' = 3/ 2 n=1 1 2 R0 n=1 F'1 C s'2 = R 0 / 2 s'1 = f '1= 3R 0 s2 = R 0 Figura 1.29. La esfera refractora de índice n 0 = 3/2 genera la imagen de un objeto en s = −∞ a la distancia R0 /2 desde la segunda cara. Note que si lo que se quiere es que la imagen esté justo en el vértice de la segunda superficie, es decir, en s10 = 2R0 , cuando s1 = −∞, de la eq. (1.21), se tiene que el índice de refracción de la esfera debería ser n 0 = 2. En cierto modo, esto explica por qué el ojo humano no es completamente esférico, pues con un índice de refracción equivalente neq = 4/3 todos seríamos hipermétropes. En lugar de esto, la cara anterior de la córnea tiene un radio menor que el globo ocular, de modo que refracta la luz para que llegue justo a la retina (vértice de la segunda superficie), tal y como se ilustra en el modelo de ojo reducido de la fig. 1.22. 1.3.5. La imagen paraxial de objetos extendidos Hasta ahora solo hemos considerado objetos puntuales. Si el objeto no es puntual, diremos que es un objeto extendido y su tamaño lo describiremos mediante una flecha de cierta altura medida desde el eje óptico. Todos los rayos que salen del objeto estarán contenidos en un plano que incluye al eje óptico. Este plano se denomina plano meridional. Con ayuda de los rayos paralelos trazados en la sección 1.3.3, podemos encontrar gráficamente la posición y el tamaño de la imagen. Para esto, consideremos la fig. 1.30, en la que se muestra la refracción en los casos: (a) superficie convexa y (b) superficie cóncava. En ambos casos, vamos a colocar un objeto de altura h a una distancia −s del vértice. Óptica geométrica · 33 En el primer caso, se traza un rayo que sale del extremo del objeto y viaja paralelo al eje óptico. Este rayo se refracta dirigiéndose al punto focal secundario. Luego, se traza otro rayo que sale del extremo del objeto pasando por el punto focal primario y se refracta viajando paralelo al eje óptico. Los dos rayos refractados se intersecan en un punto que define el extremo de la imagen. Por lo tanto, se tiene el tamaño de la imagen y la proyección de este punto en el eje óptico ubica la imagen, es decir, −h 0 y s 0, respectivamente. Un tercer rayo que se puede trazar del extremo del objeto es el rayo que pasa por el centro de curvatura de la superficie. Este rayo no se desvía al atravesar la superficie refractora, ya que el ángulo de incidencia es cero. Por supuesto, este rayo también llegará al punto en que se intersecan los dos primeros rayos. -s s' h F' C O I - h' F n n' (a) -s - s' h O F' I C F h' n n' (b) Figura 1.30. Trazo de rayos para localizar y determinar el tamaño de la imagen en superficies esféricas refractoras con n 0 > n: (a) convexa, R > 0; (b) cóncava, R < 0. En el segundo caso, se traza un rayo que sale del extremo del objeto y viaja paralelo al eje óptico. Este rayo se refracta divergiendo del punto focal secundario. Luego, se traza otro rayo que sale del extremo del objeto pasando por el centro de curvatura de la superficie refractora. Al igual que en el caso anterior, este rayo no se desvía al atravesar la superficie refractora, ya que el ángulo de incidencia es cero. Los dos rayos refractados son divergentes, por lo que no se intersecan (no se tiene una imagen real). Sin embargo, los dos rayos refractados parecen emerger de un punto común detrás de la superficie refractora. Este punto es el extremo de la imagen virtual y su proyección en el eje óptico ubica la imagen. Nuevamente, tenemos 34 · Óptica geométrica el tamaño y la posición de la imagen, es decir, h 0 y −s 0, respectivamente. Un tercer rayo que se puede trazar sale del extremo del objeto dirigido al punto focal primario (que está a la derecha de la superficie) y al llegar a la superficie se refracta en dirección paralela al eje óptico. Este rayo también parece emerger del extremo de la imagen virtual. El aumento de la imagen es la relación entre el tamaño de la imagen y el tamaño del objeto, es decir, m = h 0/h. Si es negativo la imagen estará invertida, como en el caso (a); si es positivo, la imagen estará derecha, como en el caso (b). Por otro lado, si |m| > 1, la imagen será de mayor tamaño; si |m| < 1 la imagen será de menor tamaño, en comparación con el tamaño del objeto. Teniendo en cuenta la geometría de la fig. 1.30(a), se tiene que el aumento está dado por R − s0 m= . (1.24) R−s Esta relación también es válida para el caso de la fig. 1.30(b) teniendo en cuenta que ahora R < 0. 1.3.6. Potencia y vergencias Otra manera útil de interpretar la eq. (1.21) es analizando el cambio de curvatura del frente de onda refractado con respecto al frente de onda incidente por medio de la potencia refractiva de la superficie esférica refractora, la cual se define como (n 0 − n) P= . (1.25) R La unidad de la potencia es la dioptría (D) y se define como 1 D = 1/m. Ya que estamos en la aproximación paraxial, los frentes de onda que emergen del objeto puntual y que convergen en la imagen puntual son esféricos. En particular, la curvatura del frente de onda incidente en el vértice de la superficie será 1/s y la curvatura del frente de onda refractado desde el vértice será 1/s 0. Estas curvaturas multiplicadas por los índices de refracción correspondientes se denominan vergencias, U y V , respectivamente. La unidad de las vergencias también es la dioptría. En términos de estas cantidades, la eq. (1.21) se transforma en V − U = P. (1.26) Esta relación de vergencias y potencia es muy útil en optometría, y se suele usar como U +P =V. (1.27) Así, la curvatura U /n del frente de onda del objeto es modificada por la potencia P de la superficie refractora, dando como resultado la curvatura Óptica geométrica · 35 V /n 0 del frente de onda de la imagen. Por otro lado, teniendo en cuenta la convención de signos, un frente de onda divergente tiene una curvatura negativa, mientras que un frente de onda convergente tendrá una curvatura positiva. También se tiene que un frente de onda esférico divergente corresponde a un objeto real o a una imagen virtual, mientras que un frente de onda esférico convergente corresponde a una imagen real o a un objeto virtual. En un sistema de varias superficies refractoras, la potencia de la j-ésima superficie es n 0j − n j Pj = , (1.28) Rj donde n 0j , n j y R j son el índice de refracción a la derecha, el índice de refracción a la izquierda y el radio de curvatura de la j-ésima superficie, respectivamente. 36 · Óptica geométrica 1.4. Superficies reflectoras Una interfase que separa dos medios además de refractar la luz también puede reflejarla. Si la superficie es lisa (un espejo), la reflexión será especular; si es rugosa, la reflexión será difusa. En esta unidad nos ocuparemos de la reflexión especular, la cual también se puede describir mediante rayos luminosos y, por supuesto, cumple con el principio de Fermat, como ya lo mencionamos en la unidad 1.2. En la fig. 1.13, describimos la reflexión en un espejo plano y concluimos que al aplicar el principio de Fermat a la Fig 1.13(a) se obtenía una ecuación igual a la eq. (1.8) si n 0 = n. Teniendo en cuenta la convención de signos introducida en la sección 1.3.2, se tiene que la reflexión en espejos planos y esféricos se puede describir a partir de las ecuaciones que hemos obtenido para la refracción en interfases planas y esféricas reemplazando n 0 = −n. Aún más, vamos a limitar el tratamiento a espejos sumergidos en aire, es decir, n = 1 y, por lo tanto, n 0 = −1. Con esto en mente, la eq. (1.2) se transforman en 𝜃 0 = −𝜃 . (1.29) En la fig. 1.31, se ilustra la reflexión de un rayo en: (a) una superficie plana y (b) una superficie curva. En cualquier caso, el ángulo del rayo incidente se mide con respecto a la línea normal N de la superficie en el punto donde incide el rayo. Con respecto a esta normal también se mide el ángulo de reflexión. El rayo incidente, el rayo reflejado y la normal están contenidos en un plano denominado plano de incidencia. N q N q'. = - q q q' .= - q n=1 n=1 n' = -1 n' = -1 ( a) (b) Figura 1.31. Reflexión en una superficie lisa. (a) Espejo plano y (b) superficie curva. El ángulo de reflexión es igual a menos el ángulo de incidencia. Entonces, la ley de la reflexión se puede enunciar como sigue: el haz reflejado forma un ángulo con la normal de igual valor que el ángulo del rayo incidente con la normal. Los dos rayos y la normal están contenidos en un mismo plano. Óptica geométrica · 37 Por otro lado, la eq. (1.21) se transforma en 1 1 2 + = s0 s R (1.30) para los espejos esféricos. De acuerdo a la convención de signos de la sección 1.3.2, aquí tenemos que R > 0 si el centro de curvatura está a la derecha del vértice del espejo y R < 0 si el centro de curvatura está a la izquierda del vértice del espejo. En el primer caso, diremos que el espejo es convexo; en el segundo, cóncavo. Las distancias s y s 0 se miden con respecto al vértice del espejo. 1.4.1. Trazo de rayos en espejos esféricos En los espejos esféricos se suele trazar dos rayos incidentes: un rayo paralelo al eje óptico y un rayo dirigido al vértice del espejo, como se muestra en la fig. 1.32. C F V C F V (a) R < 0 V F C V F C (b) R > 0 Figura 1.32. Rayos en espejos esféricos en la aproximación paraxial: (a) espejo cóncavo, (b) espejo convexo. Para el primer rayo, se tiene que s = −∞, es decir, s 0 = R/2. Por lo tanto, si R < 0, un manojo de rayos paralelos al eje óptico se refleja convergiendo en un punto localizado a la izquierda del vértice V a la distancia s 0 = f = − |R| /2. Este punto se denomina punto focal F del espejo y será la imagen de un objeto puntual localizado en el infinito. Si R > 0, un manojo de rayos paralelos al eje óptico se refleja divergiendo de un punto localizado a la derecha del vértice a la distancia s 0 = f = R/2. Ahora el punto focal F es 38 · Óptica geométrica virtual y la imagen de un objeto puntual localizado en el infinito será una imagen puntual virtual en F. En superficies esféricas, la normal en el punto de incidencia es una línea radial con origen en el centro de curvatura C. Para el segundo rayo, la situación es muy sencilla. En el vértice la normal de la superficie coincide con el eje óptico, así que para ambos espejos (cóncavo y convexo) el rayo se refleja hacia la izquierda y hacia abajo. El trazo de estos dos rayos se muestra en la fig. 1.32(a) para el espejo cóncavo y en la fig. 1.32(b) para el espejo convexo. Con estos dos rayos, podemos localizar la imagen generada por los espejos. En la fig. 1.33, se muestra la formación de imagen en 4 situaciones para un espejo cóncavo. En (a), (b) y (c), la imagen es real e invertida, pasando de menor a mayor tamaño que el objeto. En particular, en (b), s = R y s 0 = R, y la imagen es del mismo tamaño. En (d) la imagen es virtual, derecha y de mayor tamaño. O O h O h C F h' V h C h' I F V C F V h' I (a) (b) I (c) I O h' h C F V (d) Figura 1.33. Formación de la imagen en espejos esféricos cóncavos: (a) imagen real, invertida y de menor tamaño que el objeto; (b) imagen real, invertida y de igual tamaño que el objeto; (c) imagen real, invertida y de mayor tamaño que el objeto; (b) imagen virtual, derecha y de igual tamaño que el objeto. El aumento de la imagen m = h 0/h se puede obtener considerando el rayo que va al vértice del espejo. Con respecto a este rayo tenemos dos triángulos semejantes que satisfacen la relación h/(−s) = (−h 0)/(−s 0). Por lo tanto, el aumento será s0 m=− . (1.31) s Óptica geométrica · 39 Así, en el caso (b), el aumento resulta ser m = −1. El signo (−) indica que la imagen está invertida. O h I V h' F C Figura 1.34. Formación de imagen en un espejo convexo. Siempre es virtual, derecha y de menor tamaño, y su posición aparente es entre el vértice y el punto focal F. En la fig. 1.34, se muestra la formación de imagen en un espejo convexo. Para cualquier posición del objeto, la imagen es virtual, derecha y de menor tamaño que el objeto. La imagen parece estar detrás del espejo. El aumento de la imagen también se calcula con la eq. (1.31). 1.4.2. El espejo parabólico El trazo de rayos que hemos hecho para los espejos esféricos está limitado a la región paraxial. Para el caso general (no paraxial), consideremos la formación de la imagen mediante un espejo esférico cóncavo de un objeto puntual en el eje óptico localizado en el infinito. Lo anterior implica que al espejo llega un manojo de rayos paralelos. En la aproximación paraxial, el manojo converge al punto focal, fig. 1.32(a). Sin embargo, si aplicamos la ley de Snell para cada uno de los rayos del manojo, la reflexión de los rayos ocurre como se muestra en la fig. 1.35. Al igual que en las superficies esféricas refractoras, a esto se le llama aberración esférica. Lo anterior se puede verificar fácilmente con ayuda de la fig. 1.36. Un rayo paralelo al eje óptico incide en Q, luego se refleja pasando por el punto X en el eje óptico. El triángulo CXQ es isósceles, de modo que se establece la siguiente relación CX + QX > R, (1.32) siempre y cuando Q no coincida con V. Además, CX = QX, por lo tanto, CX > R , 2 (1.33) 40 · Óptica geométrica mientras que el punto focal F está a R/2 de C. Esto implica que los rayos que inciden paralelos al eje óptico no convergen en F. A medida que aumenta el ángulo 𝜃 más cerca del vértice cruza el rayo reflejado. Figura 1.35. Los rayos paralelos en un espejo esférico cóncavo no convergen en un mismo punto. q R C q F q Q X V Figura 1.36. En un espejo esférico cóncavo los rayos no paraxiales cruzan el eje óptico en un punto distinto al punto focal. A medida que aumenta el ángulo 𝜃 más cerca del vértice cruza el rayo reflejado. Entonces, ¿qué forma debe tener el espejo cóncavo para enfocar los rayos paralelos al eje óptico en un solo punto? La respuesta nuevamente la da el principio de Fermat. En la fig. 1.37, se muestra la geometría para aplicar el principio de Fermat, que en este caso es LCO = a + 𝜌 cos 𝜃 + 𝜌. (1.34) Todos los rayos desde la línea ortogonal que pasa por P deben tener la misma LCO para llegar a F. Definiendo una nueva constante p = LCO − a, se tiene que 𝜌(1 + cos 𝜃) = p. (1.35) Óptica geométrica · 41 a P Q r F q V n=1 Figura 1.37. Un espejo parabólico enfoca los rayos paralelos que vienen del infinto en el punto focal. Esta es la ecuación de una parábola. Entonces, la forma del espejo que buscamos es un paraboloide de revolución. Note que la eq. (1.35) también se puede obtener si cambiamos n 0 = −n = −1 en la eq. (1.15). En coordenadas cartesianas, el perfil del paraboloide se puede escribir como y2 z= , (1.36) 2Rv donde z es la coordenada a lo largo del eje óptico, y es la coordenada meridional y Rv es el radio de curvatura de la parábola en el vértice. Entonces, el punto focal del espejo se localiza a la distancia Rv /2 del vértice V (fig. 1.37). · 42 Óptica geométrica 1.5. Lentes: aproximación lentes delgadas Cuando se quiere formar la imagen en un medio diferente al de la superficie esférica refractora discutida en la sección 1.3.2, se debe incluir otra superficie refractora. En esta unidad trataremos con elementos refractores limitados por dos superficies esféricas con un eje óptico en común. Este tipo de elementos de denominan lentes. Para obtener la posición de la imagen de un objeto puntual, se debe emplear la eq. (1.21) para cada una de las caras. La ecuación de Gauss para la superficie 1 será n10 − n1 n1 − = s10 s1 R1 n10 (1.37) y para la superficie 2 será n20 s20 − n2 = s2 n20 − n2 R2 . (1.38) Limitándonos a una lente de índice nl sumergida en un solo medio de índice n, como en la fig. 1.38, entonces n1 = n20 = n y n10 = n2 = nl . Al sumar las eqs. (1.37) y (1.38) se llega a (nl − n) 1 1 1 1 n n − = − + l − 0l (1.39) 0 s2 s1 n R1 R2 s2 s1 - s1 1 O n s'2 2 nl t s'1 n O' I s2 Figura 1.38. Localización de la imagen en una lente positiva. El espesor de la lente t es la distancia entre los vértices y está relacionado con las distancias s10 y s2 mediante t = s10 −s2 . Si t s10 y t s2 tal que s10 ≈ s2 , entonces el segundo sumando de la derecha en la eq. (1.39) se aproxima a cero. Esta aproximación implica que se desprecia el espesor de la lente en comparación con los radios de curvatura de las dos superficies, y se conoce Óptica geométrica · 43 como aproximación de lente delgada. Definiendo la distancia objeto como so = s1 y la distancia imagen como si = s20 , la eq. (1.39) se reduce a 1 1 (nl − n) 1 1 − = , (1.40) − si so n R1 R2 que se conoce como ecuación de la lente delgada. El lado derecho de la eq. (1.40) es una constante que solo depende de los parámetros de la lente. Esta distancia se denomina distancia focal f de la lente y está dada por 1 (nl − n) 1 1 = − . (1.41) f n R1 R2 Con la definición de la distancia focal, llegamos a la ecuación de Gauss para las lentes 1 1 1 − = . (1.42) si so f f >0 f <0 Figura 1.39. Lentes positivas y negativas sumergidas en aire (n = 1). La distancia focal es un parámetro que identifica la lente. El signo de la distancia focal depende de los valores de los índices de refracción n y nl y de los radios de curvatura R1 y R2 . Ya que en la práctica la mayoría de las lentes se usan en el aire, en lo que sigue tomaremos n = 1, y la distancia focal de la lente delgada estará definida por 1 1 1 = (nl − 1) − . (1.43) f R1 R2 Teniendo en cuenta lo anterior, en la fig. 1.39 se muestra las formas generales de las lentes positivas y negativas. Note que como regla se puede decir que una lente es positiva si el borde es menor que el espesor y que es negativa si el borde es mayor que el espesor. 44 · Óptica geométrica 1.5.1. Trazo de rayos en lentes delgadas En la sección 1.3.3, definimos los puntos focales para las superficies esféricas refractoras como los puntos localizados a las distancias f 0 y f del vértice de la superficie. Para las lentes delgadas, las superficies 1 y 2 de la fig. 1.38 se juntan en un plano ortogonal al eje óptico. Desde ese plano se miden las distancias. Así, para una lente positiva, un manojo de rayos provenientes de un objeto puntual en el infinito, so = −∞, se refracta convergiendo en una imagen puntual a la distancia si = f . El punto donde convergen los rayos se denomina punto focal secundario. Por otro lado, si ubicamos un objeto puntual en so = −f , los rayos refractados son paralelos al eje óptico. El punto donde se coloca el objeto es el punto focal primario. Para una lente negativa, la situación es análoga, un manojo de rayos provenientes de un objeto puntual en el infinito se refracta como si los rayos divergieran de un punto localizado en si = − | f | (foco secundario). Y, para un objeto virtual localizado en so = | f | (foco primario), los rayos refractados son paralelos al eje óptico. En la fig. 1.40, se muestra la distancia focal y los puntos focales en las lentes delgadas. Las lentes positivas se representan con una línea y un par de flechas apuntando hacia afuera. Las lentes negativas se representan con una línea y un par de flechas apuntando hacia adentro. f f >0 F' -f f <0 f F' F -f F Figura 1.40. Puntos focales y distancias focales en las lentes delgadas. A partir del trazo de los rayos mostrados en la fig. 1.40, podemos obtener la posición y el tamaño de la imagen de un objeto extendido. Consideremos un objeto de altura ho a la distancia −so como se muestra en la fig. 1.41. Entonces, para encontrar la imagen trazamos desde el extremo del objeto un rayo paralelo al eje óptico y un rayo que pasa por el punto focal primario. Al Óptica geométrica · 45 refractarse en la lente delgada, el primer rayo pasa por el punto focal secundario y el segundo rayo viaja paralelo al eje óptico. La intersección de los dos rayos refractados determina el tamaño de la imagen −hi y la proyección de la intersección sobre el eje óptico determina la distancia imagen si . - so si ho O F' F - xo f f I - hi xi Figura 1.41. Trazo de rayos para localizar la imagen en la lente delgada positiva. - so ho O si F' I h' xi -f -f F - xo Figura 1.42. Trazo de rayos para localizar la imagen en la lente delgada negativa. En general, cualquier rayo que sale del extremo del objeto y que pase por la lente se refractará de tal forma que llegue al extremo de la imagen. En particular, en la fig. 1.41, se tiene un tercer rayo que va del extremo del objeto al extremo de la imagen pasando por el centro de la lente sin desviarse. Teniendo en cuenta este rayo, de la geometría de la figura se tiene que el aumento de la imagen está dado por m= hi si = . ho so (1.44) 46 · Óptica geométrica Para una lente delgada negativa, el trazo de rayos se muestra en la fig. 1.42. El aumento de la imagen está dado nuevamente por la eq. (1.44). 1.5.2. Ecuación de Newton En las figs. 1.41 y 1.42, se ha incluido dos cantidades nuevas, xo y xi . Estas cantidades se definen de la siguiente manera: xo es la distancia medida desde el punto focal primario al objeto y xi es la distancia medida desde el punto focal secundario a la imagen. Para estas cantidades también aplica la convención de signos definida en la sección 1.3.2. Así, xo < 0 si el objeto está a la izquierda de F y xo > 0 si el objeto está a la derecha de F. Y xi < 0 si la imagen está a la izquierda de F0 y xi > 0 si la imagen está a la derecha de F0. Siguiendo la geometría de la fig. 1.41, se tiene que ho −hi = −xo f (1.45) y −hi ho = . xi f Igualando hi /ho en ambas ecuaciones, se llega a xo xi = −f 2 . (1.46) (1.47) Esta es la ecuación de Newton para las lentes delgadas, tanto positivas como negativas. Por otro lado, el cociente hi /ho es el aumento de la imagen. Entonces tenemos otras dos expresiones para el aumento dadas por m= f xo y (1.48) xi . (1.49) f Las distancias en la formulación de Gauss se relacionan con las distancias en la formulación de Newton como so = xo − f y si = xi + f . La ecuación de Newton resulta ventajosa en algunos casos en comparación con la de Gauss. Por ejemplo, supongamos que se nos plantea la siguiente situación: dada una lente positiva de distancia focal f , ¿dónde se debe colocar el objeto para que la imagen tenga un aumento m = −2? De acuerdo con la formulación de Gauss el aumento es m = si /so . Pero no se conoce ninguna de las distancias, por lo que también tendríamos que usar la eq. 1.42, es decir, es un problema de dos ecuaciones con dos incógnitas. Por otro lado, con la formulación de Newton el aumento es m = f /xo , de donde se obtiene directamente que la posición del objeto debe ser xo = −f /2 (so = −3f /2). m=− Óptica geométrica · 47 1.5.3. Dominio de las imágenes real y virtual Vamos a explorar los rangos para los cuales se tienen imágenes reales y virtuales en las lentes positivas y negativas. a b c d f - - 3f - 2f 2f 3f a' -f b' c' e' d' e f - - 3f - 2f 2f 3f -f Figura 1.43. Rangos en los que se obtienen imágenes reales y virtuales con una lente positiva. En la figura de arriba, para el objeto en el rango {−∞, −2f } a la izquierda, la lente forma una imagen invertida, real y de menor tamaño que el objeto en el rango { f , 2f } a la derecha; para el objeto en el rango {−2f , − f } a la izquierda, la lente forma una imagen invertida, real y de mayor tamaño que el objeto en el rango {2f , ∞} a la derecha. En la figura de abajo, para el objeto en el rango {−f , 0} a la izquierda, la lente forma una imagen derecha, virtual y de mayor tamaño que el objeto en el rango {−∞, 0} a la izquierda. Aquí la lente funciona como lupa. Para la lente positiva, en la fig. 1.43, se han seleccionado 5 posiciones para el objeto, etiquetadas como a, b, c, d y e. - La posición a corresponde con el objeto en el infinito (xo = −∞), por lo que su imagen a0 estará en el punto focal secundario (xi = 0), y el aumento será m = 0. - La posición c corresponde con xo = −f , por lo que la imagen c0 está en xi = f con aumento m = −1. Esta es la configuración en que la imagen tiene el mismo tamaño que el objeto. - Para la posición intermedia b entre a y c, con xo = −3f /2, la imagen b0 estará en xi = 2f /3 con aumento = −2/3. Aquí la imagen es de menor tamaño que el objeto. - El objeto en d está a la distancia xo = −f /2, por lo que su imagen d 0 está en xi = 2f con aumento m = −2. - Si se mueve el objeto acercándolo al punto focal primario, la imagen se aleja aún más, aumentando su tamaño. Cuando el objeto se localiza 48 · Óptica geométrica en xo = 0 (punto focal primario), la imagen estará en xi = ∞ con aumento m = −∞. - Por último, en e el objeto está en una posición intermedia entre el punto focal primario y la lente, xo = f /2. Los rayos refractados divergen, por lo que se tendrá una imagen e0 virtual en xi = −2f (si = −f ) con aumento m = 2. La imagen virtual es derecha, del doble del tamaño de objeto y está detrás del objeto. Resumiendo, para objetos localizados en el rango −∞ ≤ so ≤ −2f , la imagen estará localizada en el rango f ≤ si ≤ 2f , de menor tamaño que el objeto, real e invertida; para objetos en el rango −2f ≤ so ≤ − f , la imagen estará localizada en el rango 2f ≤ si ≤ ∞, de mayor tamaño que el objeto, real e invertida; para objetos en el rango −f ≤ so ≤ 0, la imagen estará localizada en el rango −∞ < si ≤ 0, de mayor tamaño que el objeto, virtual y derecha. Esta última configuración corresponde con el uso de la lente como una lupa. o o' - -3 f -2 f f 2f 3f -f Figura 1.44. Una lente negativa forma imágenes virtuales, derechas y de menor tamaño que el objeto, entre el objeto y la lente. En el caso de la lente negativa (f < 0) solo se tiene una configuración para un objeto real. El rango en el que está el objeto es −∞ ≤ xo ≤ − | f | , lo que equivale a −∞ ≤ so ≤ 0, ya que xo se mide desde el punto focal primario, que en la lente negativa está a la derecha. Entonces, para cualquier distancia xo = −𝛼 | f |, donde 𝛼 > 1, la imagen siempre estará a la derecha del punto focal secundario en xi = | f | /𝛼 y a la izquierda de la lente, es decir, el rango de la imagen es − | f | ≤ si ≤ 0 con aumento m = 1/𝛼. En la fig. 1.44, se muestra el rango del objeto y el rango de la imagen. La imagen siempre es de menor tamaño que el objeto. 1.5.4. Planos focales en lentes delgadas De manera similar a como se hizo en la sección 1.3.4, definiremos los planos focales en las lentes delgadas como planos perpendiculares al eje óptico que contienen a los puntos focales. Un manojo de rayos paralelos incidente Óptica geométrica · 49 con cualquier inclinación (dentro de la aproximación paraxial) se refracta en las lentes positivas convergiendo en un punto localizado en el plano focal secundario, y se refracta en las lentes negativas divergiendo desde un punto localizado en plano focal secundario. En otro caso, tendremos en la refracción un manojo de rayos paralelos e inclinados: para la lente positiva, cuando se coloque un objeto puntual en el plano focal primario; para la lente negativa, cuando se coloque un objeto virtual en el plano focal primario, tal y como se muestra en la fig. 1.45. En cualquier caso, el rayo que pasa por el centro de la lente no se desvía al refractarse. Plano focal f Plano focal f Plano focal Plano focal -f -f Figura 1.45. Planos focales en las lentes positivas y negativas. 1.5.5. Trazo de rayos oblicuos Denominamos rayos oblicuos a aquellos rayos que salen del extremo del objeto y no viajan en dirección paralela al eje óptico. En particular, vamos a tratar con los rayos oblicuos que se mantienen en el plano meridional. Ya hemos tratado con algunos de ellos, por ejemplo, el rayo que se dirige al centro de la lente y el rayo que se dirige al punto focal primario. Sin embargo, en esta sección nos interesa tratar con los rayos oblicuos que se dirigen en cualquier otra dirección. Lo anterior puede ocurrir en el trazo de rayos en una combinación de dos a más lentes. Por ejemplo, en la fig. 1.46 el rayo refractado por la lente L1 se dirige al punto focal secundario de L1 . Al llegar a la lente L2 , ¿cómo se refracta 50 · Óptica geométrica el rayo? Con el trazo de rayos de la fig. 1.40 no tenemos la solución. Sin embargo, el trazo de rayos de la fig. 1.45 sí nos da la pista de cómo determinar gráficamente la refracción generada por la lente L2 . Si suponemos que el rayo oblicuo que llega a la lente L2 hace parte de un manojo de rayos paralelos, como se ilustra en la fig. 1.47(a), de acuerdo con la fig. 1.45, estos se refractarán divergiendo de un punto localizado en el plano focal secundario. Este punto está determinado por la intersección del rayo que va por el centro de la lente (rayo auxiliar) y el plano focal secundario. Con esto en mente, podemos determinar la dirección de la refracción del rayo oblicuo en la lente 2, como se muestra en la fig. 1.47(a). La prolongación hacia atrás del rayo refractado se une en el plano focal con el rayo que pasa por el centro de la lente. Un procedimiento similar se tiene para una lente positiva, como se ilustra en la fig. 1.47(b). O F1 F'2 F'1 L1 F2 L2 Figura 1.46. Trazo del rayo paralelo que sale del extremo del objeto. El rayo refractado en la lente 1 se convierte en un rayo oblicuo para la lente 2. Rayo oblicuo Rayo oblicuo F F' Rayo auxiliar Plano Focal Secundario F F' Rayo auxiliar (a) (b) Plano Focal Secundario Figura 1.47. Rayos oblicuos en lentes (a) negativa y (b) positiva. Para refractar un rayo oblicuo se construye un rayo auxiliar paralelo al rayo oblicuo que pase por el centro de la lente. El rayo oblicuo se refracta desde o hacia el punto en que el rayo auxiliar interseca el plano focal secundario de la lente. En resumen, para determinar la dirección de la refracción de un rayo oblicuo construimos un rayo auxiliar paralelo al rayo oblicuo que pase por el centro de la lente. El rayo oblicuo se refracta de modo que el rayo o su Óptica geométrica · 51 prolongación pase por el punto en que el rayo auxiliar interseca el plano focal secundario de la lente. Ejemplo: dos lentes positivas Considere un sistema óptico con dos lentes delgadas de distancias focales f1 = 50 mm y f2 = 35 mm separadas 20 mm. Encuentre la posición y tamaño de la imagen si el objeto está a la distancia so1 = −70 mm y con un tamaño ho = 11.80 mm. Realice el trazo gráfico de los rayos y verifique analíticamente el resultado. 70 28,56 20 O F1 F '1 F '2 F2 I f 1 = 50 f 2 = 35 Figura 1.48. Trazo de rayos en un sistema de dos lentes positivas. La solución gráfica se muestra en la fig. 1.48, en la que se ha trazado del extremo de objeto dos rayos: un rayo paralelo al eje óptico y un rayo dirigido al centro de la primera lente. Los dos rayos refractados en la lente 1 llegan a la lente 2 como rayos oblicuos. Con el método del trazo del rayo oblicuo se obtiene la refracción final de los dos rayos. En el punto donde se intersecan, se tiene el extremo de la imagen. La verificación analítica se puede hacer con la ecuación de Newton. Para la primera lente, tenemos xo1 = −20, por lo tanto, xi1 = (502 /20) = 125. Para la segunda lente se tiene que so2 = (125 + 50 − 20) = 155, de donde xo2 = (155 + 35) = 190, por lo tanto xi2 = (−352 /190) = −6.44. De este modo, llegamos a que si2 = (35 − 6.44) = 28.56, como en la fig. 1.48. Todas las distancias están dadas en milímetros. El aumento de la imagen resulta del producto de los aumentos generados por cada lente. Con la primera lente m1 = −125/50 = −2.5 y con la segunda m2 = 6.44/35 = 0.18, de donde resulta que el aumento del sistema óptico es m = m1 m2 = 0.46. Finalmente, el tamaño de la imagen será hi = mho = 5.43 mm. 52 · Óptica geométrica 1.6. Lentes: planos principales En la unidad 1.5, se analizó la formación de imagen en la aproximación de lentes delgadas en el rango paraxial. La lente delgada es una simplificación de la lente real en la que las dos superficies refractoras se juntan en un plano (ortogonal al eje óptico), y partir de la cual se miden las distancias del objeto y la imagen. La ecuación de Gauss (eq. (1.42)) es la ecuación que nos relaciona estas distancias a través de un parámetro de la lente, que es la distancia focal, la cual depende de los radios de curvatura de las dos superficies refractoras y del índice de refracción de la lente y del medio que rodea la lente. A partir de la distancia focal se definen los puntos focales, y con relación a estos se determina la ecuación de Newton, que también permite determinar la posición y el tamaño de la imagen. Con la aproximación de lente delgada, podemos diseñar y analizar en primera instancia un sistema óptico, es decir, podemos definir los parámetros iniciales del sistema, por ejemplo, el número de lentes, sus distancias focales, separación entre lentes, el tamaño angular de la imagen, la cantidad de energía que puede colectar el sistema, etc. Sin embargo, en el análisis de la calidad de la imagen (que tan parecida es la imagen al objeto) se requiere considerar las aberraciones ópticas del sistema y la difracción de la luz. Lo anterior implica conocer de forma precisa la geometría de las lentes, por lo que se debe tener en cuenta el espesor de las lentes. 1 2 F' n nl n Figura 1.49. Punto focal secundario en una lente. La distancia focal es el primer parámetro con el que identificamos una lente. Para obtener su valor, se hace incidir en la lente (a lo largo del eje óptico) un manojo de rayos paralelos y se determina el punto donde convergen los rayos refractados, si es una lente positiva, o el punto de donde divergen los rayos, si es una lente negativa. Este punto de convergencia o divergencia es el punto focal secundario F0. En la aproximación de lente delgada, la distancia focal corresponde con la distancia que hay entre el plano que Óptica geométrica · 53 representa la lente y el punto focal secundario. En el caso de la lente real (denominada comúnmente como lente gruesa), tenemos el punto focal secundario, como se muestra en la fig. 1.49, pero ¿cuál es la distancia focal? y ¿desde dónde se mide? En la lente delgada, el rayo paralelo al eje óptico y el rayo refractado se intersecan en el plano que representa la lente. Si en la fig. 1.49 prolongamos el rayo paralelo (hacia adelante) y el rayo refractado (hacia atrás) hasta el punto donde se intersecan, se puede definir un plano ortogonal al eje óptico que contiene el punto de intersección. En este plano se puede colocar una lente delgada (omitiendo la lente real), cuya distancia focal iguale a la distancia entre el plano y el punto focal secundario. Con esto, la refracción del rayo paralelo hacia el punto focal secundario en la lente real y en la lente delgada es equivalente. El plano en que se coloca la lente delgada se denomina plano principal secundario y se denota por H0 en la fig. 1.50. La distancia focal de la lente delgada equivalente en H0 será la distancia focal f de la lente real y está dada por5 (n − 1) 2 t 1 1 1 = (nl − 1) − + l f R1 R2 R1 R2 nl (1.50) donde t es el espesor de la lente. En forma análoga, se puede obtener el punto focal primario F si enviamos un rayo paralelo de derecha a izquierda hacia la lente. La distancia focal medida en esta dirección es igual a la eq. (1.50) y se mide desde el plano principal primario, denotado por H en la fig. 1.50. 1 H H' 2 F' F n f nl n f Figura 1.50. Definición de puntos focales y distancia focal en una lente real. La distancia focal se mide desde los planos principales H y H0. 5 En el apéndice A se deduce esta expresión de la distancia focal de una lente sumergida en aire. El procedimiento se basa en las ecuaciones de propagación de los rayos paraxiales. 54 · Óptica geométrica A partir de los planos principales, podemos representar la lente real y, con respecto a ellos, medir las distancias del objeto y la imagen, como se muestra en la fig. 1.51. Al comparar la geometría de las figs. 1.41 y 1.51, podemos establecer que las ecuaciones de Gauss (eq. (1.42)) y de Newton (eq. (1.47)) también son válidas en las lentes reales, pero ahora las distancias objeto e imagen se deben medir desde los planos principales y la distancia focal de la lente está dada por la eq. (1.50). H F O - so f nl I F' P' V' V P n - xo H' n f si xi Figura 1.51. Distancias objeto e imagen en una lente real con respecto a los planos principales. En la lente delgada, se tiene el rayo que va al centro de la lente y no se desvía. En la lente real, se tiene un rayo equivalente, pero discontinuo en la lente. Este rayo sale del extremo del objeto y se dirige al punto donde el eje óptico interseca al plano principal primario. El punto de intersección se denota por P y se denomina punto principal primario. El rayo se refracta con la misma inclinación del rayo incidente saliendo del punto donde el eje óptico interseca el plano principal secundario y llega al extremo de la imagen. El punto de intersección se denota por P0 y se denomina punto principal secundario, como se muestra en la fig. 1.51. Por su puesto, la trayectoria del rayo dentro de la lente será desde el punto donde el rayo incidente interseca la primera superficie hasta el punto donde el rayo refractado interseca la segunda superficie. Cuando la lente está sumergida en dos medios de diferente índice de refracción, es decir, el objeto se encuentra en un medio y la imagen en otro (ambos con índice de refracción diferente al de la lente), el rayo oblicuo que no cambia la inclinación al refractarse ya no pasa por los puntos principales. Sin embargo, se pueden definir otro par de puntos en el eje óptico que permiten saber la dirección que tiene este rayo oblicuo. Estos puntos se de- Óptica geométrica · 55 nominan puntos nodales y el rayo se denomina rayo nodal. Un ejemplo de lentes sumergidas en diferentes medios lo tenemos en las cámaras submarinas (agua - vidrio - aire). En casos como estos, las eqs. (1.42)) y (1.47) ya no son válidas. Este tipo de casos no los vamos a considerar en este libro. Nos ocuparemos de lentes sumergidas en un mismo medio, de modo que los puntos nodales y los puntos principales coinciden. La posición de los planos principales se suele dar mediante la distancia entre el vértice de la superficie refractora y el plano principal, fig. 1.51 (ver apéndice A). Para el plano H, se tiene VP = −f (nl − 1) t , R2 nl (1.51) y para H0, se tiene V0P0 = −f (nl − 1) t . R1 nl (1.52) En la fig. 1.52, se muestra la ubicación de los planos principales para algunas configuraciones de lentes positivas y negativas. En lentes simétricas, los planos principales también son simétricos; en lentes con una superficie plana uno de los planos principales se ubica en el vértice de la otra superficie; y en lentes tipo menisco, los planos principales pueden estar fuera de la lente. H H' H H' H H' H H' H H' HH' f >0 f <0 Figura 1.52. Planos principales en algunas lentes positivas y negativas. Ejemplo: de una lente delgada a una lente real Supongamos que se dispone de una cámara de video CMOS (por sus siglas en inglés) con un sensor que tiene una región para el registro de la imagen de (4.5 × 2.8) mm (formato 1/3”, 752 × 480 pixeles). Se quiere utilizar esta 56 · Óptica geométrica cámara para registrar imágenes de objetos cuyo tamaño 2h0 es alrededor de 11 mm. La distancia de trabajo entre el sensor de la cámara y el objeto debe ser cercana a 200 mm, pero no mayor. ¿Qué lente simple se puede utilizar de modo que se registre la imagen en la mayor región posible del sensor? Una solución al problema puede darse comenzando con un diseño de lente delgada y luego reemplazarla por una lente real que se encuentre en el comercio. Lo primero es establecer el aumento del sistema, lo cual se deduce al relacionar la menor dimensión del sensor con el mayor tamaño del objeto, es decir, 2.8/11 = 0.254. Con este resultado, vamos a tomar un aumento m = −1/4. Luego, deducimos las distancias del objeto y de la imagen a la lente delgada. La distancia objeto será xo = f /m = −4f y la distancia imagen será xi = f /4. Por lo tanto, so = −5f y si = 5f /4. La suma de estas distancias debe ser tal que si − so = 6.25 f ≤ 200 mm. Con la igualdad, se tiene que la distancia focal debería ser 32 mm. 187.50 - so = 150 si = 37.5 F' O I F f = 30 (a) 190.53 - s o = 150 si = 37.5 H H' F' O I F f = 30 (b ) Figura 1.53. Formación de imagen con una lente simple que genera un aumento m = −1/4. En (a), la solución en la aproximación de lente delgada. En (b), cambio de la lente delgada por una lente convexa-plana real (comercial) de índice 1.7847, R1 = 23.54 mm y espesor t = 6.90 mm. Óptica geométrica · 57 En el catálogo de una compañía fabricante de lentes encontramos que la lente simple más cercana a la que buscamos es una lente de 30 mm de distancia focal. Por lo tanto, seleccionamos f = 30 mm, y la distancia de trabajo será 187.5 mm, lo cual es adecuado. Entonces, la solución en la aproximación de la lente delgada es: lente de distancia focal f = 30 mm, con el objeto a la distancia so = −150 mm y el sensor a la distancia si = 37.5 mm. Con esto, se obtiene un aumento m = si /so = −1/4 y un objeto de tamaño 11 mm quedará registrado con un tamaño 2.75 mm. En la fig. 1.53(a,) se muestra la solución en la aproximación de lente delgada. Para pasar a la solución práctica, debemos reemplazar la lente delgada por la lente real de distancia focal 30 mm. La lente seleccionada del catálogo de la compañía es una lente convexa-plana (30 mm de diámetro) de espesor t = 6.90 mm. El radio de la superficie convexa es R1 = 23.54 mm. El material de la lente es el vidrio N-SF11 de la compañía Schott. Para la longitud de onda 𝜆 = 587.56 nm, el índice de refracción es 1.7847. Los planos principales se localizan en VP = 0 y V0P0 = −3.8662 mm. Por lo tanto, si se hace coincidir el plano principal H con la posición de la lente delgada, se tiene que la distancia entre el objeto y el vértice de la primera superficie es 150 mm. Ya que el plano principal H0 está a 3.03 mm de H, en esta distancia se desplazará el plano en que se forma la imagen (donde se debe poner el sensor), como se muestra en la fig. 1.53(b). Con esto, la distancia total de trabajo entre el objeto y el sensor aumenta en 3.03 mm. Note que el incremento de la distancia no es igual al espesor de la lente. Finalmente, se ha obtenido una solución práctica, logrando un aumento de −1/4 en una distancia de trabajo (objeto-sensor) de 190.53 mm con una lente de 30 mm de distancia focal. 1.6.1. Sistema de lentes En la sección anterior, se definieron los planos principales de una lente simple. La gran ventaja de introducir los planos principales es que para determinar la posición y el tamaño de la imagen podemos utilizar las ecuaciones de Gauss y Newton deducidas para la lente delgada. El concepto de planos principales se puede generalizar a un sistema de lentes y se definen de la misma forma como se hizo para las lentes simples. Nuevamente, las ecuaciones de Gauss y Newton son válidas, pero ahora la distancia focal será la del sistema de lentes. Las posiciones de los planos principales ya no se calculan con las eqs. (1.51) y (1.52). 58 · Óptica geométrica Ejemplo: sistema de tres lentes Para ilustrar los planos principales en un sistema de varias lentes, vamos a considerar el ejemplo dado en la tabla 1.1. En esta se enumeran las superficies, incluyendo el objeto (plano objeto) y la imagen (plano imagen). Frente a la superficie se da el radio de curvatura de la misma, y en medio de las superficies se da el espesor o separación y el índice de refracción. El radio y el espesor se dan en milímetros (como es costumbre en diseño óptico). La distancia entre el plano objeto y la primera superficie refractora se denota por lo y la distancia entre la última superficie refractora y el plano imagen se denota por li . Note que no hemos usado las notaciones so y si , ya estas son las distancias a los planos principales y en la tabla 1.1 lo que se muestra son las distancias entre superficies. Tabla 1.1. Sistema óptico de tres lentes. Las unidades para el radio y el espesor se dan en mm. Superficie 0 (Obj) 1 2 3 4 Radio Índice lo 1.0000 4.5 1.6700 12.0 1.0000 2.0 1.7847 7.0 1.0000 8.0 1.6727 li 1.0000 ∞ 20.10 ∞ −31.82 31.82 5 31.94 6 -31.94 7 (Imag) Espesor ∞ De acuerdo a la tabla 1.1, la primera lente (superficies 1 y 2) es convexaplana de distancia focal f1 = 30 mm y espesor t = 4.5 mm. La segunda lente (superficies 3 y 4) es bicóncava de distancia focal f2 = −20 mm y espesor t = 2.0 mm, y la tercera lente (superficies 5 y 6) es una lente biconvexa de distancia focal f3 = 25 mm y espesor t = 8 mm. La distancia focal de este sistema de lentes es f = 40.17 mm. · Óptica geométrica 59 En la fig. 1.54, se muestra el sistema óptico cuando se forma la imagen de un objeto que está a la distancia lo = −70 mm. En este caso la imagen estará en li = 44.60 mm. Note que en este ejemplo los planos principales tienen un orden diferente al que se tiene en las lentes simples (fig. 1.52). Teniendo esto en cuenta, se encuentra que las distancias objeto e imagen para la ecuación de Gauss son so = −92.39 mm y si = 71.07 mm. s i = 71,07 - so = 92,39 H' H F' O F I 1 2 3 4 5 6 f = 40,17 Figura 1.54. Localización de los planos principales en un sistema de tres lentes. Mediante este ejemplo queda claro que un sistema óptico en general se puede representar por los planos objeto e imagen, los planos focales primario y secundario, y los planos principales primario y secundario. La distancia focal en un sistema de lentes se determina del mismo modo que se hace para una sola lente: se hace incidir (a lo largo del eje óptico) un manojo de rayos paralelos y se determina: el punto donde convergen los rayos refractados si es una lente positiva, o el punto de donde divergen los rayos si es una lente negativa. Este punto de convergencia o divergencia es el punto focal secundario F0. La distancia entre el plano principal secundario H0 y F0 es la distancia focal del sistema. En particular, para un sistema de dos lentes delgadas, separadas una distancia d, se tiene que6 1 1 1 1 1 = + − d. f f1 f2 f1 f2 (1.53) La potencia de la j-ésima lente delgada se define como P̃k = 1 . fk (1.54) Con esta definición, la potencia de la combinación de lentes dada por la eq. (1.53) se puede escribir como P = P̃1 + P̃2 − P̃1 P̃2 d. 6 En (1.55) el apéndice A se deduce la expresión de la distancia focal para un sistema de dos lentes delgadas. El procedimiento se basa en las ecuaciones de propagación de los rayos paraxiales. 60 · Óptica geométrica Esta ecuación resulta análoga a la potencia de una lente real de espesor t e índice de refracción nl , definida también como 1/f . Teniendo en cuenta la definición de potencia de una superficie refractora dada por la eq. (1.28), la eq. (1.50) se puede escribir como P = P1 + P2 − P1 P2 (t/nl ). (1.56) En efecto, las eqs. (1.55) y (1.56) son análogas y muy útiles en la práctica. Basta con conocer la eq. (1.56) y de ahí se pasa fácilmente a las dos lentes delgadas, donde t = d y nl = 1. Óptica geométrica · 61 1.7. Diafragmas y pupilas Hasta ahora nos hemos ocupado solamente del aspecto geométrico en la formación de la imagen. Con esto, la imagen ideal de un objeto extendido será una copia del objeto, salvo por un factor de escala. Sin embargo, para una descripción completa de la formación de la imagen, también se debe analizar la distribución de la energía en la imagen en términos de la distribución de la energía del objeto. Ya que un objeto extendido se puede modelar como un conjunto de objetos puntuales, vamos a limitar el análisis del flujo de energía dentro del sistema óptico formador de imagen a objetos puntuales e imágenes puntuales en el eje óptico en la aproximación paraxial. Un objeto puntual, por definición, es un radiador isotrópico de energía, que emite energía radialmente y es igual en cualquier dirección. Entonces, desde el punto de vista de la energía luminosa, la imagen de un objeto puntual será una fiel copia del objeto si es posible colectar toda la energía emitida por el objeto en la imagen. Por ejemplo, un objeto puntual localizado en uno de los focos de un espejo elipsoidal tendrá su imagen (también puntual) en el otro foco del elipsoide (fig. 1.15). Omitiendo la absorción de energía en el espejo, podemos decir que aquí tenemos una imagen perfecta del objeto. Pero en el caso de la formación de imagen con una lente, el borde de la lente determinará la cantidad de energía que puede ser colectada para formar la imagen. En este sentido, no podemos tener una fiel copia del objeto. La intensidad luminosa para una fuente puntual se define como el flujo de energía dF (en vatios, W) en una dirección dada contenida en cierto ángulo sólido dΩ (en esterorradian, sr), es decir, dF I˜ = . dΩ (1.57) ˜ Para una fuente puntal que emite un flujo constante, se tiene que F = 4𝜋 I, ˜ por lo tanto, I (en W/sr) también es una constante. En la fig. 1.55, se muestra la formación de imagen de un objeto puntual con una lente simple. La energía que fluye del objeto está contenida en el cono cuyo vértice es el objeto y cuya base es el borde de la lente. Y la energía que llega a la imagen está contenida en el cono cuyo vértice es la imagen y cuya base también es el borde de la lente. Si el área de la lente es dA, el ángulo sólido que subtiende la lente con respecto al objeto será dΩo = dA/so2 , mientras que el ángulo sólido que subtiende la lente con respecto a la imagen será dΩi = dA/si2 . Suponiendo que la intensidad del objeto puntual es I˜o , la 62 · Óptica geométrica energía que puede colectar la lente será dA dF = I˜o 2 . so (1.58) Si no hay absorción de energía en la lente, a la imagen puntual llegará la misma cantidad de energía dF . Si I˜i es la intensidad del punto imagen, entonces dF = I˜i dA/si2 . Así, la intensidad en la imagen puntual será [10] I˜i = I˜o si2 (1.59) so2 - so si O I dA Figura 1.55. La cantidad de energía luminosa colectada por una lente está determinada por el borde de la lente. 1.7.1. Diafragma de apertura Si se quiere disminuir el flujo de energía que llega a la imagen se debe reducir el área de la lente a través de la cual fluye la energía. Lo anterior se puede lograr introduciendo en el sistema óptico una pantalla opaca con una abertura DA (circular, centrada en el eje óptico) delante o detrás de la lente, como se muestra en la fig.1.56 DA O I dA' Figura 1.56. Control del flujo de energía en la imagen mediante la abertura DA. Ahora, el flujo de energía que llega a la imagen será 0 dA dF 0 = I˜i 2 , si (1.60) Óptica geométrica · 63 donde dA0 es el área que proyecta la abertura (vista desde el objeto) en la lente. A este tipo de aberturas se les denomina diafragma de apertura. Si el radio del diafragma es variable (iris), se puede controlar la cantidad de energía que entra al sistema formador de imagen. Si el radio del diafragma está fijo, también estará fija la cantidad de energía que entra al sistema formador de imagen. Supongamos que la región circular definida por dA0 en la lente tiene un diámetro D, es decir, dA0 = 𝜋D2 /4, entonces el flujo de energía en la imagen se puede escribir como 2 𝜋 I˜i D dF 0 = . (1.61) 4 si Ya que I˜i está fijo, se tiene que el flujo de energía es proporcional al cuadrado de la cantidad (D/si ). Una situación de particular interés se tiene cuando el objeto puntual está en el infinito, fig. 1.57. En este caso, el flujo de energía será proporcional al cuadrado de la cantidad (D/f ), donde f es la distancia focal de la lente. A la cantidad ( f /D) se le denomina el número-f y se denota por f f /# = . (1.62) D Esta cantidad es de uso común en astronomía para caracterizar las lentes (o espejos) objetivo de los telescopios y en fotografía es un indicador para fijar el tiempo de exposición. En términos del f /#, el flujo de energía resulta dF 0 ∝ DA 1 ( f /#) 2 (1.63) f F' D (Diámetro efectivo de la lente) Figura 1.57. La cantidad f /D es un parámetro que se suele utilizar en la caracterización de las lentes (o espejos) en relación con la cantidad de energía que puede colectar el sistema. Usualmente, los objetivos de las cámaras fotográficas manuales tienen un anillo con marcas que denotan el f /# como f /1.4, f /2, f /2.8, f /4, 64 · Óptica geométrica f /5.6, f /8, ... Para una distancia focal fija, al pasar consecutivamente de un f /# a otro (girando el anillo), se está aumentando o disminuyendo en un factor de 2 el área efectiva en la lente. Por ejemplo, si paso de f /1.4 a f /2, disminuyo a la mitad el flujo de energía que llega a la imagen. Ya que el flujo de energía es energía en la unidad de tiempo, llegará la misma cantidad de energía luminosa a la imagen se si realiza el registro de la imagen, por ejemplo, con f /1.4 a 1/500 de segundo o con f /2 a 1/250 de segundo. Los números del f /# corresponden con la raíz cuadrada de 2, 4, 8, 16, 32, 64, ... En otras palabras, el número del f /# índica el factor en el que se reduce el radio (o diámetro) del diafragma. En la fig. 1.58, se muestra un objetivo de cámara fotográfica de la compañía Nikon de distancia focal f = 28 mm con un f /# que varía desde f /2.8 hasta f /22. Anillo para seleccionar el f/# Figura 1.58. Objetivo de una cámara fotográfica manual de distancia focal 28 mm de la compañía Nikon. El f /# varía desde f /2.8 hasta f /22. Fuente: imagen tomada de https://matthewdurrphotography.com/2012/07/20/nikons-seriese-primes-compared/. Cuando el objeto puntual está fuera de eje, por ejemplo, el punto del extremo de un objeto extendido, el cono de energía no es simétrico y el área de la sección transversal (al eje del cono) proyectada en la lente (dA00 en la fig.1.59) será menor que el área dA0 que se tiene cuando el objeto puntual está en eje (fig. 1.56, suponiendo el mismo diafragma DA). Por lo tanto, si todos los puntos de un objeto extendido tienen la misma intensidad, en la imagen los puntos no tendrán la misma intensidad, disminuyendo a medida que nos alejamos del eje óptico. Este fenómeno recibe el nombre de viñeta. En la aproximación paraxial, suponemos que los rayos que salen del objeto hacia la lente viajan con inclinaciones muy pequeñas, esto es, prácticamente paralelos al eje óptico. Lo anterior implica que la extensión de los objetos debe ser mucho menor a la distancia so . Con esto en mente, podemos aproximar los conos de energía de los objetos puntuales fuera de eje · Óptica geométrica 65 (que conforman el objeto extendido) por el cono de energía del objeto puntual en eje. DA I O dA'' Figura 1.59. Para un objeto puntual fuera de eje, el cono de energía no es simétrico, pero dentro de la aproximación paraxial los conos de cualquier punto objeto (de un objeto extendido) se toman iguales al cono del objeto puntual en eje. El rayo segmentado pasa por el centro del diafragma. La cantidad I= dF I˜ = 2 dA s (1.64) (en W/m2 ) se denomina irradiancia y es una medida de la distribución de energía en una región plana de área dA. Por lo tanto, con la irradiancia se puede caracterizar la imagen de objetos extendidos. Esta ecuación también describe la ley del inverso del cuadrado de la distancia para la irradiancia, donde s es la distancia desde la fuente puntual. 1.7.2. Pupilas En la eq. (1.61), se tiene el flujo de energía que llega a la imagen en términos del diámetro efectivo de la lente, el cual resulta de la proyección del diafragma de apertura. Este diámetro efectivo es la base de los conos de energía objeto e imagen. Otra forma de definir los conos de energía, más conveniente, es a partir de las imágenes del diafragma de apertura vistas a través de las lentes que están antes del diafragma y a través de las lentes que están después del diafragma. Estas imágenes reciben el nombre de pupilas de entrada y de salida, respectivamente. La pupila de entrada define la base del cono de energía del objeto y la pupila de salida define la base del cono de energía de la imagen. En la fig. 1.60, se ilustra el concepto de pupilas de entrada (Pen ) y salida (Pex ) en un sistema óptico de dos lentes positivas con el diafragma de apertura en medio de las lentes. La pupila de entrada es la imagen que forma la lente 1. La pupila de salida es la imagen que forma la lente 2. Note 66 · Óptica geométrica que estas imágenes son virtuales, ya que el diafragma de apertura, en ambos casos, está entre la lente y el punto focal. Denotando por Den y Dex los diámetros de las pupilas de entrada y salida, respectivamente, y por −len y lex las distancias de las pupilas de entrada al objeto y de salida a la imagen, respectivamente, el flujo de energía estará dado por 2 2 𝜋 I˜o Den 𝜋 I˜i Dex 0 dF = = . (1.65) 4 len 4 lex Y el f /# efectivo del sistema se define como f /# = lex . Dex (1.66) - l en Pen Pex DA O F1 I F2 1 2 F'1 F'2 lex Figura 1.60. Las pupilas de entrada Pen y salida Pex determinan la base de los conos efectivos de iluminación para el objeto y para la imagen. Entonces, el tamaño del diafragma de apertura determina la cantidad de energía que entra al sistema óptico. Por otra parte, la posición del diafragma ( junto con el tamaño) juega un papel muy importante en el control de las aberraciones ópticas del sistema. Así que la ubicación del diafragma de apertura debe obedecer a criterios de optimización de la calidad de la imagen. Ejemplo: identificación del diafragma en un sistema óptico En la tabla 1.1 (sección 1.6.1), que describe el sistema óptico de la fig. 1.54, no es evidente el diafragma de apertura. Sin embargo, aunque no esté explícito, el diafragma de apertura será el borde de una de las lentes. Para determinar ese borde, se debe formar la imagen de cada uno de los bordes por los elementos ópticos que lo preceden. La imagen que subtiende · Óptica geométrica 67 el menor ángulo sólido con respecto al objeto puntual define al borde que corresponde al diafragma de apertura. En el caso la tabla 1.1, el borde de la superficie 1 (primera lente) es el diafragma de apertura, como se muestra en la fig. 1.61. Lo anterior, aunque posible, es poco práctico, ya que no se puede controlar la cantidad de iluminación que llega a la imagen. Por otra parte, se tendrá una abertura relativamente grande, lo que puede afectar la calidad de la imagen con las aberraciones ópticas. DA O F' F I Figura 1.61. El borde cuya imagen subtiende el menor ángulo solido con respecto al objeto puntual en eje es el diafragma de apertura. Una mejora del sistema óptico de la fig. 1.61 se tiene introduciendo una abertura en medio de las lentes, como se muestra en la fig. 1.62. P ex P en I O 1 2 34 5 6 DA 7 Figura 1.62. El diafragma de apertura separado de las lentes se cuenta como otra superficie del sistema óptico. Al introducir el diafragma de apertura como un elemento separado de las lentes, el diafragma se cuenta como una superficie adicional del sistema óptico. Por lo tanto, la tabla 1.1 se transforma en la tabla 1.2 (que se muestra abajo), donde la superficie 5 es el DA a 3 mm de la cuarta superficie. El radio y el espesor se dan en milímetros. 68 · Óptica geométrica Tabla 1.2. Sistema óptico de tres lentes con diafragma de apertura. El radio y el espesor se dan en mm. Superficie 0 (Obj) Radio 20.10 2 ∞ 4 5 (DA) 6 7 8 (Imag) Índice lo 1.0000 4.5 1.6700 12.0 1.0000 2.0 1.7847 3.0 1.0000 4.0 1.0000 8.0 1.6727 li 1.0000 ∞ 1 3 Espesor −31.82 31.82 ∞ 31.94 -31.94 ∞ 1.7.3. Rayos principal y marginal Supongamos que tenemos un objeto extendido y formamos la imagen con el sistema óptico de la fig. 1.60. Esta situación se ilustra en la fig. 1.63. A partir de las pupilas de entrada y salida, se definen dos nuevos rayos: el rayo marginal, que pasa por el borde del diafragma de apertura y permite localizar la imagen, y el rayo principal, que pasa por el centro del diafragma de apertura y determina el tamaño de la imagen. Para trazar estos dos rayos, seguimos el siguiente procedimiento: Rayo marginal. Rayo que sale de la base del objeto dirigido hacia el borde de la pupila de entrada, se refracta en el sistema óptico, pasando por el borde del diafragma, y sale del sistema óptico como si viniera del borde de la pupila de salida. La intersección del rayo refractado con el eje óptico da la base de la imagen. Rayo principal. Rayo que sale del extremo del objeto dirigido al centro de la pupila de entrada, se refracta en el sistema óptico, pasando Óptica geométrica · 69 por el centro del diafragma, y sale del sistema óptico como si viniera del centro de la pupila de salida. La intersección del rayo refractado con la normal del eje óptico en la base de la imagen da la altura de la imagen. Pen Pex DA ginal Rayo mar O F'1 F'2 F1 cipal Rayo prin F2 I 1 2 Figura 1.63. Definición de los rayos principal y marginal. Estos dos rayos también se pueden trazar para un objeto puntual. Por ejemplo, para el objeto puntual de la fig. 1.60, el rayo principal coincide con el eje óptico, y para el punto del extremo del objeto en la fig. 1.59, tenemos un rayo marginal que va al borde superior del diafragma y un rayo marginal que va al borde inferior del diafragma. Así, para un objeto puntual, el rayo marginal delimita la extensión del cono de iluminación que entra al sistema óptico, mientras que el rayo principal determina el eje del cono de iluminación. 1.7.4. Diafragma de campo, campo de visión y tamaño angular En los sistemas ópticos también se puede encontrar otro tipo de diafragma cuya tarea es determinar la región dentro de la cual se observa la imagen. Este tipo de diafragma se denomina diafragma de campo. Este diafragma puede estar en el plano objeto (no muy común), en el plano imagen (como en una cámara fotográfica), en un plano intermedio, donde se tenga una primera imagen (como en un microscopio, telescopio), o incluso puede ser el borde de una lente. Consideremos un sistema óptico como una cámara fotográfica con distancia focal fija. En la fig. 1.64, se muestra un esquema simplificado de la óptica y el sensor de la cámara. Ya que la cámara está pensada para tomar fotografías de objetos a distancias mucho mayores que la distancia focal de 70 · Óptica geométrica la lente, el plano imagen coincide con el plano focal secundario. La imagen se registra con un sensor de irradiancia (película fotográfica, dispositivo de estado sólido CMOS (del inglés Complementary Metal Oxide-Semiconductor) o CCD (del inglés Charge-Coupled Device)) dentro de la región definida por el borde del sensor (usualmente de geometría rectangular). Este borde es el diafragma de campo DC del sistema óptico y fija el tamaño angular de la imagen 𝛼 0, que se define como el ángulo entre el rayo principal refractado y eje óptico, es decir 0 tan 𝛼 0 = hmáx /lex , (1.67) 0 donde hmáx es la altura máxima que puede tener la imagen (medida desde el eje óptico). Ya que 𝛼 0 es ángulo máximo que subtiende la imagen (con respecto al centro de la pupila de salida), el ángulo 2𝛼 0 se denomina campo de visión, y se suele denotar por las siglas FOV (del inglés field of view) en los instrumentos ópticos y se da en grados. l ex a' a Pex DA F' h'max DC Borde del sensor Figura 1.64. El diafragma de campo determina la región dentro de la cual se puede observar la imagen. Del lado del objeto, también se define el campo objeto como el ángulo 2𝛼, donde 𝛼 es el ángulo que forma el rayo principal incidente y el eje óptico. En otras palabras, 𝛼 es el ángulo que subtiende el objeto con respecto al centro de la pupila de entrada. Hemos visto que el diafragma de apertura determina (mediante las pupilas) los conos de iluminación y el rayo marginal delimita estos conos. En forma análoga, el diafragma de campo determina conos de visión y el rayo principal delimita los conos. Entonces, si definimos el cono del campo objeto como la región correspondiente al campo objeto y el cono del campo imagen como la región correspondiente al campo de visión, se tiene que el cono del campo objeto tiene su vértice en el centro de la pupila de entrada y su base en el diafragma de campo, y el cono del campo de visión tiene su vértice en el centro de la pupila de salida y su base en el diafragma de campo. · Óptica geométrica 71 1.7.4.1. Ejemplo: conos de energía y de visión Consideremos un objetivo de cámara fotográfica formado por una lente negativa f1 = −40 mm y una positiva f2 = 40 mm, separadas 40 mm. Ambas lentes tienen un diámetro de 40 mm. La imagen se registra en una película de 35 mm (horizontal) × 24 mm (vertical). La máxima altura de la imagen será la mitad de la dimensión vertical de la película, es decir, 12 mm, como se ilustra en la fig.1.65. 12 mm F'1 F2 F1 f 1 = - 40 F'2 f 2 = 40 Película fotográfica (35 mm ´ 24 mm) Figura 1.65. Sistema óptico de dos lentes para formar imagen en una película fotográfica de 35 mm × 24 mm. Suponiendo que los objetos que se quieren registrar están a distancias mucho mayores que la distancia focal efectiva de las dos lentes, es decir, so → −∞, el plano imagen se debe localizar en el punto focal secundario. Para determinar el punto focal secundario y la distancia focal observamos la refracción en las lentes de un rayo incidente de izquierda a derecha paralelo al eje óptico. Después de refractarse en las lentes interseca al eje óptico en el punto que determina el punto focal secundario F0. Por otro lado, la instersección de la prolongación del rayo incidente y el rayo refractado (en el espacio imagen) localiza el plano principal H0. La distancia de H0 al punto focal resulta ser f = 40 mm. El punto focal F y el plano principal H se localizan de manera similar, observando la refracción de otro rayo incidente de derecha a izquierda, como se muestra en la fig. 1.66. H F '1 F F2 F1 H' F' F2' f = 40 Figura 1.66. Planos principales y distancia focal del sistema óptico de la figura anterior. 72 · Óptica geométrica El diafragma de campo es el borde de la película fotográfica y la altura 0 de la imagen es hm áx = 12 mm. ¿Cuál es el diafragma de apertura? Como el objeto está en infinito, si primero trazamos el rayo marginal al borde de la primera lente, el rayo se refracta en forma divergente y no pasa por la segunda lente. Por lo tanto, la segunda lente es la que limita el cono de energía, lo que se puede ver con el rayo paralelo de izquierda a derecha que se trazó en la fig. 1.66. Luego, el borde de la segunda lente es el diafragma de apertura. La imagen de este borde desde el lado del objeto es la pupila de entrada, la cual es virtual y de menor tamaño que el diafragma de apertura (la mitad), y como no hay más lentes entre la segunda lente y el plano imagen, el borde de la segunda lente también es la pupila de salida, imagen real y del mismo tamaño que el diafragma de apertura, como se muestra en la fig. 1.67(a). La distancia de la pupila de salida resulta lex = 80 mm. Pen F'1 Pex F2 F1 DA F'2 DC (a ) Pen Pex 2a = 33,3° 2a' = 17,0° DA DC (b ) Figura 1.67. Conos de energía y de visión del sistema de la fig. 1.65. (a) Trazo de los rayos marginal y principal. (b) El borde del cono de energía está definido por el rayo marginal, mientras que el borde del cono de visión objeto-imagen está definido por el rayo principal. Por otro lado, el rayo principal determina la altura de la imagen; en este 0 . Por lo tanto, ya podemos determinar el campo de visión, 2𝛼 0 = caso, es hmáx −1 2 tan (12/80) = 17.06◦ . Como ya se conoce la altura de la imagen, para trazar el rayo principal en el sistema óptico, se hace de derecha a izquierda. El resultado se muestra en la fig. 1.67(a). El campo objeto resulta ser 2𝛼 = 33.3◦ . Por último, en la fig. 1.67(b) se trazan los conos de iluminación y de visión. La energía que esté dentro de los conos de iluminación llegará a la Óptica geométrica · 73 imagen. Los objetos que se localicen dentro del cono del campo objeto tendrán su imagen dentro del cono del campo imagen. Al cambiar el tamaño de DA, modificamos la energía, pero no se tiene ningún efecto en la extensión de la imagen, ya que el rayo principal pasa por el centro de DA. Al cambiar el tamaño de DC, modificamos la extensión que vemos de la imagen, pero no se tiene ningún efecto en la cantidad de energía que llega a cada punto de la imagen, ya que el rayo marginal pasa por el centro de DC. Note que en los sistemas formadores de imagen con el objeto en infinito, el tamaño de la imagen no se puede obtener como h 0 = mh, donde m = si /so . Para estos sistemas, el aumento se define en forma angular, es decir, m𝛼 = tan 𝛼 0 , tan 𝛼 (1.68) y, en el rango paraxial, simplemente m𝛼 = 𝛼 0/𝛼. En otras palabras, el aumento angular es el cociente entre el tamaño angular de la imagen (con respecto a la pupila de salida) y el tamaño angular del objeto (con respecto a la pupila de entrada). Para el ejemplo que estamos tratando, se tiene que m𝛼 = 0.5. 74 · Óptica geométrica 1.8. Algunos instrumentos ópticos En esta unidad, veremos la configuración básica de algunos instrumentos ópticos y describiremos su funcionamiento en términos de los temas vistos en las secciones anteriores. Primero, veremos al ojo humano como un sistema con simetría de revolución con superficies esféricas y simplificaremos el ojo como una lente delgada y un plano imagen. Luego, veremos la lupa acoplada al ojo (modelo de lente delgada). Finalmente, veremos el telescopio y el microscopio como una extensión de la lupa, esto es, cuando se añade otra lente para formar la imagen de objetos muy distantes u objetos muy próximos pero pequeños. 1.8.1. El ojo humano (ojo esquemático) En la sección 1.3.1, se hizo una descripción general del ojo como un sistema óptico de varias superficies refractoras. Debido a la variación de los parámetros del ojo de una otra persona, con el propósito de estudiar la formación de imagen en el ojo, se proponen modelos del ojo a partir de los valores medios de la población. Esto se puede hacer con diferentes grados de exactitud. Si se supone que las superficies refractoras del ojo son esféricas y centradas con un mismo eje (eje óptico), se obtiene una familia de modelos llamados ojos esquemáticos [9]. En particular, se emplean en la región paraxial para obtener información como la potencia refractiva, el aumento, la iluminación en la retina, las imágenes de Purkinje (reflexiones en las superficies refractoras del ojo), localización de las pupilas, localización de los puntos focales (F, F0), los puntos principales (P, P0) y los puntos nodales (N, N0), y efectos de los errores refractivos (miopía e hipermetropía). Cuando se requiere información sobre la formación de imagen más allá de la región paraxial, se usan modelos más refinados llamados ojos esquemáticos gran angulares, que incluyen superficies refractoras no esféricas, superficies refractoras descentradas y modelos Grin (Gradient Index) para el índice de refracción del cristalino [9]. Aquí vamos a considerar el ojo esquemático de Gullstrand-Emsley en las configuraciones de ojo relajado y de ojo en completa acomodación, suponiendo que el ojo no tiene defectos refractivos (ojo emétrope). Se entiende por ojo relajado la configuración que tiene el ojo cuando se está observando un objeto localizado en el infinito. En esta situación, el cristalino tiene la mayor distancia focal que puede tener. Cuando el objeto se acerca al ojo, el cristalino cambia su geometría para disminuir la distancia focal de modo que la imagen siga enfocada en la retina. Este proceso se llama acomodación. Óptica geométrica · 75 La acomodación tiene un límite, de modo que se tiene una distancia a partir de la cual, para distancias menores, ya no se puede mantener enfocada la imagen en la retina. La distancia donde se tiene el límite de acomodación se denomina distancia de punto cercano (dpc). La distancia más lejana, en donde el ojo puede ver sin acomodación, se denomina distancia de punto lejano (dpl). En un ojo emétrope, se tiene que dpl = ∞. El rango en dioptrías entre la dpc y la dpl se denomina rango de acomodación. La dpc varia con la edad y es menor en los niños. Por ejemplo, un niño de 10 años tiene una dpc ' 70 mm y su rango de acomodaci ón será (1000/(70 mm) − 1000/∞) = 14.29 D, mientras que un adulto de 50 años tiene una dpc ' 400 mm y su rango de acomodación será (1000/(400 mm) − 1000/∞) = 2.5 D. 23,9 V P P' 1 2 F N N' 3 4 R' F' Pen Pex f = 16,53 # f ' = 22,05 R d 0 (Obj) 1 Córnea 7.8 2 Iris (DA) 2 ----------Cristalino 3 ----------4 Retina 10.0 -6.0 Potencia equivalente n 1.000 3.6 4/3 0 4/3 3.6 16.69 1.416 4/3 Superficie Componente 42.74 42.74 0 8.27 13.78 Total en el ojo 60.48 21.75 Figura 1.68. Ojo esquemático de Gullstrand-Emsley relajado (dpl = ∞). R y d están dadas en mm, la potencia en D. En la fig. 1.68, se muestra el ojo esquemático de Gullstrand-Emsley en la configuración de ojo relajado. R y d están dadas en milímetros y la potencia está dada en dioptrías. El sistema óptico se representa mediante 4 superficies: (1) córnea, (2) iris (diafragma de apertura) y superficie anterior del cristalino, (3) superficie posterior del cristalino y (4) la retina. Las distancias de los puntos cardinales (focales F-F0, principales P-P0 y nodales N-N0) con 76 · Óptica geométrica respecto a la superficie 1 son: VF = −14.983, VF0 = 23.896, VP = 1.550, VP0 = 1.851, VN = 7.062 y VN0 = 7.363. El punto focal secundario F0 coincide con la retina R0. Las distancias focales son f = 16.53 y f 0 = 22.05. Por otra parte, con respecto a la superficie 1 las pupilas se localizan según VPen = 3.052 y VPex = 3.687. Al examinar la potencia refractiva de cada elemento (P = (n 0 − n)/R), se nota que la córnea contribuye con cerca de las 2/3 partes de la refracción total del ojo. Todas las distancias están dadas en milímetros. 23,9 V P P' F 1 R' N N' 2 F' 3 4 Pen Pex f = 14,34 # f ' = 19,12 R 0 (Obj) 1 Córnea 7.8 2 Iris (DA) 2 ----------Cristalino 3 ----------4 Retina 5.0 -5.0 d 116.3 Potencia equivalente n 1.000 3.2 4/3 0 4/3 4.0 16.69 1.416 4/3 Superficie Componente 42.74 42.74 0 16.53 16.53 Total en el ojo 69.72 32.30 Figura 1.69. Ojo esquemático de Gullstrand-Emsley en completa acomodación para una dpc = 116.3mm. R y d están dadas en mm, la potencia en D. En la fig. 1.69, se muestra el ojo esquemático de Gullstrand-Emsley en configuración de completa acomodación para la distancia dpc = 116.3 mm. Ahora el punto focal secundario F0 no cae en la retina R0, sin embargo, el tamaño del ojo se mantiene igual que en el ojo relajado. Es notable el cambio en la geometría del cristalino, donde los radios son 5 mm y -5 mm, y el espesor aumenta a 4 mm, lo que se traduce en un aumento de la potencia. La potencia total del ojo en completa acomodación resulta ser 69.72 D, es decir, un cambio de 8.59 D con respecto al ojo relajado. Las distancias de los puntos cardinales con respecto a la superficie 1 son: VF = −12.561, VF0 = 21.252, VP = 1.782, VP0 = 2.128, VN = 6.562 y VN0 = 6.909. Óptica geométrica · 77 La distancia entre F0 y R0 es F0R0 = 2.644. Las distancias focales son f = 14.343 y f 0 = 19.124. Por otra parte, con respecto a la superficie 1 las pupilas se localizan según VPen = 2.674 y VPex = 3.249. Todas las distancias están dadas en milímetros. Ejemplo: tamaño de la imagen de la luna Como ejemplo del uso del ojo esquemático, vamos a calcular el tamaño de la imagen en la retina a partir del rayo nodal. Supongamos que un objeto muy distante subtiende un ángulo 𝜃 con respecto al punto nodal N, como se ilustra en la figura 1.70. Considerando el punto nodal N0, se tiene que h 0 = 𝜃N0F0. Por ejemplo, la luna llena subtiende un ángulo de 0.52◦ (0.0091 radianes) con respecto a un observador en la tierra, por lo tanto, el tamaño de la imagen en la retina del ojo relajado será 0.0091 × (VR0−VN0) = 0.155 mm. Si consideramos el ojo en completa acomodación, el mismo ángulo se obtiene con un objeto de altura −h = 1.12 mm a la distancia de dpc+VN = (116.3 + 6.562) mm = 122.86 mm. Entonces, para determinar el tamaño de la imagen en la retina se debe conocer la distancia del punto nodal secundario a la retina y el ángulo que subtiende el objeto con respecto al punto nodal primario. Note que como estamos en la aproximación paraxial la imagen no se dibuja en la superficie curva de la retina, sino en el plano ortogonal que pasa por el vértice de la retina (R0). -h q P P' N N' q h' R' Pen Pex Figura 1.70. A partir del rayo nodal, se puede medir la imagen en la retina del ojo esquemático. Para esto es necesario conocer la distancia N0R0. El ojo como lente delgada Para hacer más simple el análisis en lo que sigue, usaremos un modelo simplificado del ojo: sistema óptico conformado por una lente delgada positiva sumergida en aire, cuyo borde es el diafragma de apertura (iris) y un plano imagen (retina) a la distancia lo jo de la lente. Cuando el ojo está relajado, fo jo = lo jo , cuando está en acomodación fo jo < lo jo . Para el diseño de lentes oftálmicas e instrumentos visuales, se tiene una norma que establece que en 78 · Óptica geométrica un ojo emétrope la dpc = 250 mm (10 in). En la fig. 1.71, se ilustra esta situación: ojo relajado (arriba) y el ojo con máxima acomodación (abajo), según la norma. El rango de acomodación en este caso será 4 D. dpl = dpc = 250 Retina l ojo f ojo = l ojo Pupila Retina l ojo f ojo < l ojo Pupila Figura 1.71. Una representación simple del ojo consiste en una lente delgada positiva sumergida en aire. La distancia entre la lente y el plano imagen es fija y se denota por lo jo . Miopía. Cuando en un ojo la dpl < ∞, se dice que el ojo es miope. El punto focal secundario está antes de la retina y la imagen de un objeto en el infinito se verá borrosa en la retina. Esto también implica que el rango de acomodación disminuye. Entonces, el ojo miope puede enfocar en la retina imágenes de objetos que estén a una distancia finita entre la dpl y la dpc. Ya que el ojo miope en estado relajado enfoca los rayos paralelos antes de la retina, podemos decir que el ojo tiene una potencia mayor de la requerida al observar objetos en el infinito. Por lo tanto, podemos disminuir la potencia con la ayuda de una lente negativa. Hipermetropía. Un ojo se dice hipermétrope si el punto focal secundario está después de la retina. Nuevamente, un objeto en el infinito se verá borroso en la retina. Ya que el ojo hipermétrope en estado relajado enfoca los rayos paralelos después de la retina, podemos decir que el ojo tiene una potencia menor de la requerida al observar objetos en infinito. Por lo tanto, podemos aumentar la potencia con la ayuda de una lente positiva. Óptica geométrica · 79 En la fig. 1.72, se muestra en (a) el ojo miope y su corrección, y en (b) el ojo hipermétrope y su corrección. La distancia focal de la lente oftálmica negativa o positiva se denota por fo f t . De la geometría de la fig. 1.72, se puede determinar fo f t siempre y cuando se conozca la distancia d entre la lente oftálmica y el ojo. Esta distancia debe garantizar que la potencia del ojo no cambie cuando se adiciona la lente oftálmica. Esta condición obedece al hecho que la imagen de un objeto vista con los dos ojos debe tener el mismo tamaño aun cuando el defecto refractivo en cada ojo sea diferente. De otro modo tendríamos una situación compleja para el cerebro, que tendría que procesar dos imágenes de diferente tamaño del mismo objeto. R F' dpl R' dpc - foft R' d ( a) R' F' R' dpc d R R dpl f oft (b) Figura 1.72. Defectos refractivos. (a) Miopía: el punto lejano R está a una distancia dpl < ∞. Con una lente negativa se puede corregir el defecto. (b) Hipermetropía: el punto lejano R está detrás del ojo. Con una lente positiva se puede corregir el defecto. Para determinar la distancia d consideremos la ecuación (eq. (1.53)) de la distancia focal de dos lentes delgadas 1/f = 1/f1 + 1/f2 − d/( f1 f2 ). Sea f1 = fo f t y f2 = fo jo . Si d = fo jo , entonces la distancia focal de la combinación ojo-lente oftálmica será f = fo jo . Resultado notable, que en cierto modo es garantizado por la fisionomía de nuestro rostro, donde la nariz no solo sirve de apoyo a las gafas, sino que nos sirve para garantizar que la distancia entre las gafas y el ojo sea cercana a la distancia focal del ojo (≈ 20 mm). En la práctica, una persona con dpl < 0.167 m (6 D) se considera altamente miope. En el rango (0 − 6.0) D, se puede omitir la distancia d en el cálculo de la potencia de la lente oftálmica, P = 1/fo f t , de modo que la distancia focal de la lente oftálmica se puede igualar por −dpl. Por ejemplo, una persona con una miopía de −2 D tendrá su punto lejano en dpl = 0.5 m, por lo que la lente oftálmica que requiere para mejorar su visión será una lente negativa de distancia focal fo f t = −500 mm (ya que 80 · Óptica geométrica 500 mm >> fo jo = 22 mm). En el caso de la hipermetropía, se tiene una situación análoga. 1.8.2. La lupa En la sección 1.5.3, se mencionó que para una lente positiva la imagen de un objeto colocado entre el punto focal primario y la lente es virtual, derecha, de mayor tamaño que el objeto y se localiza a la izquierda del objeto. Esta es la cofiguración de la lupa (o microscopio simple). Antes de ver en detalle el funcionamiento de la lupa, vamos a revisar la configuración de los campos de visión y objeto para una lente L formadora de imagen colocada delante del ojo. En la fig. 1.73, se muestra el sistema lente-ojo. Suponemos que el ojo es emétrope y lo modelamos como en la fig. 1.71. Si el diámetro de la lente es mucho mayor que el iris, entonces el iris será el diafragma de apertura, por lo que el borde de la lente será el diafragma de campo, ya que determina la región que puede ver el ojo. En este caso, la pupila de entrada es una imagen real, invertida y de mayor tamaño que el iris y se ubica a la izquierda del punto focal primario de L. Por otro lado, el iris es la pupila de salida. Aunque en la fig. 1.73 no hemos incluido un objeto, se puede trazar el rayo principal del sistema a partir de las pupilas y el diafragma de campo, tal y como se mencionó en la sección 1.7.4. Con esto se determina los conos del campo de visión y del campo objeto. El ángulo 𝛼 0 determina la altura máxima de la imagen que se puede observar en el ojo. L P en Campo objeto FL Cam 2a 2a' Ojo po de v isió n P ex F'ojo F'L DA DC Figura 1.73. Campos de visión y objeto de una lente acoplada al ojo. Un objeto colocado dentro del campo objeto tendrá su conjugado dentro del campo de visión. Teniendo esto en mente, consideremos cuatro posiciones para un objeto de altura h como se muestra en la fig. 1.74. Para la posición a, la imagen del objeto estará contenida completamente en el cono del campo de visión. Para la posición b, solo una parte de la imagen se podrá observar, la parte superior será cortada. Para la posición c, el objeto está Óptica geométrica · 81 completamente por fuera del cono del campo objeto, por lo que no se tiene la imagen en ningún lugar del cono del campo de visión. Para la posición d nuevamente se puede observar la imagen completa del objeto, pero ahora se verá invertida en comparación con la posición a. Lo anterior se puede verificar fácilmente con una lente simple. Fijando la distancia entre la lente y el ojo (mayor que la distancia focal de la lente, pero no más de dos veces), nos movemos alejándonos y acercándonos a un objeto. Se podrá ver que en una posición la imagen desaparece y al seguir avanzando cambiará la orientación de la imagen. d c b L a Ojo P ex FL F'ojo F'L DA P en DC Figura 1.74. La extensión del objeto que se puede observar en la imagen depende de la ubicación del objeto dentro del campo objeto. Cuando el objeto se ubica entre el punto focal primario y la lente, en el ojo se observa una imagen de mayor tamaño y con la misma orientación que la del objeto (el procesamiento de la imagen en el cerebro implica invertir la orientación de la imagen física en la retina). En esta configuración, la lente funciona como una lupa. En la fig. 1.75(a), se localiza la imagen utilizando el rayo principal y dos rayos marginales que salen del extremo del objeto. Note que la imagen aún sigue dentro del cono del campo de visión, el cual se proyecta en el espacio del objeto. La imagen se verá enfocada en la retina si la distancia de la imagen virtual al ojo es mayor o igual a la dpc del ojo. Para calcular el aumento nominal de la lupa, se toma dpc = 250 mm, de acuerdo con la norma. Entonces, la distancia más corta a la que podemos acercar un objeto con el fin de verlo con el ojo (sin ayuda de la lupa) del mayor tamaño angular posible es la dpc. Con la lupa podemos acercar aún más el objeto y ahora la imagen que vemos es la imagen virtual que genera la lupa, y nuevamente la podríamos ver del mayor tamaño angular posible si esta imagen se localiza en la dpc. El cociente entre los dos ángulos, con y sin lupa, es el aumento nominal de la lupa. · 82 Óptica geométrica Cam po de v i sión L Ojo h' P ex h FL F'ojo F'L DA P en DC (a) h' q' h L Ojo h q F'ojo fL - s = dpc= 250 (b) L q' h q h - s = dpc= 250 fL Ojo F'ojo (c) Figura 1.75. La lupa: (a) trazo del rayo principal y de dos rayos marginales que salen del extremo del objeto. La imagen es virtual y de mayor tamaño; (b) el aumento de la lupa es el cociente entre el ángulo que subtiende la imagen virtual y el ángulo que subtiende el objeto, ambos a la distancia de punto cercano; (c) al acercar el ojo a la lupa se aumenta el campo de visión del sistema sin cambiar el tamaño de la imagen en la retina. Óptica geométrica · 83 Una manera de determinar el aumento angular de la lupa se ilustra en el fig. 1.75(b). Suponemos que estamos en el rango paraxial. Sin la lupa, cuando ubicamos el objeto de altura h a la dpc del ojo, este subtiende el ángulo 𝜃 = h/dpc. Con la lupa, se ubica el objeto de tal manera que la imagen virtual de altura h 0 quede a la dpc del ojo. El ángulo que subtiende la imagen virtual es 𝜃 0 = h 0/dpc. Si la lente del ojo se localiza en el punto focal secundario de la lupa, el rayo principal es paralelo al eje óptico. Con esto en mente, se tiene que h 0/dpc = h/fL . Por lo tanto, el aumento nominal angular m𝛼 = 𝜃 0/𝜃 estará dado por m𝛼 = dpc 250 mm = , fL fL (1.69) con fL en mm. Note que por el hecho de colocar la lente del ojo en el punto focal secundario de la lupa, el objeto se puede desplazar entre el punto focal primario de la lupa y la lupa sin que cambie el tamaño angular del objeto. Ya que fisiológicamente el ojo está relajado cuando observamos un objeto que está en el infinito, entonces conviene colocar el objeto en el punto focal primario de la lupa para observar su imagen virtual en el infinito sin cambiar el aumento angular. ¿Qué ocurre si acercamos el ojo a la lupa manteniendo el objeto en el punto focal primario de la lupa? Esta situación se ilustra en la fig. 1.75(c). Ya que los rayos que salen de cualquier punto del objeto, en particular del extremo del objeto, se refractan como un manojo de rayos paralelos e inclinados 𝜃 0, entonces el rayo que cruza por el centro de la lente del ojo llegará a la retina al mismo punto que se tiene en la fig. 1.75(b). Por lo tanto, no cambia el tamaño de la imagen en la retina. Sin embargo, sí aumenta el campo de visión, ya que el iris del ojo es la pupila de salida, de manera que al estar más cerca de la lupa, el ángulo 𝛼 0 que subtiende la lupa es mayor. Así que si ponemos nuestro ojo muy cerca de la lupa (como lo hacen los relojeros), tendremos una imagen aumentada dentro del mayor campo de visión que se puede lograr. El aumento nominal de las lupas se denota por m×, por ejemplo, una lupa de 10× es una lupa de distancia focal 25 mm (eq. (1.69)). Las lupas comerciales varían desde unos pocos aumentos hasta unos 30 aumentos. En la fig. 1.76, se muestra 2 lupas. En (a), la lupa está conformada por una lente simple y una base a la distancia focal de la lente, lo que garantiza que el objeto siempre esté a la distancia apropiada. En (b), una lupa de 20 aumentos. Entre mayor sea el aumento, más compleja es la lupa, ya que para garantizar una imagen de buena calidad se deben corregir las aberraciones que se hacen más evidentes en lupas de gran aumento. En (b), la lupa está 84 · Óptica geométrica conformada por 3 lentes de diámetro 15 mm. Las tres lentes están unidas. Esta lupa se denota como “Achromatic” 20×. La palabra Achromatic indica que el sistema está diseñado para corregir la aberración cromática, y el 20× indica que la distancia focal del sistema es 12.5 mm. (a) (b) Figura 1.76. Algunas lupas comerciales. (a) Lupa de 10x con base en el plano focal de la lente. Fuente: imagen tomada de https://eurogrow.es/microscopios/2450lupa-cuenta-hilos-10x.html. (b) Lupa de 20x de tres lentes unidas para corregir aberración cromática. Fuente: imagen tomada de http://www.mingaservice. com/web/index.php/producto/item/lupas-iwamoto-20x. 1.8.3. El telescopio DA s'ex f ob+ f oc a F'ob F oc Lob DC Loc a' P ex P en Figura 1.77. Configuración básica del telescopio refractor kepleriano. El punto focal secundario del objetivo coincide con el punto focal primario del ocular. Telescopio refractor kepleriano Una lente positiva forma la imagen de un objeto que está en el infinito en su plano focal secundario (sección 1.5.3). La imagen es real, invertida y pequeña. Si esta imagen se coloca en el plano focal primario de una lupa, Óptica geométrica · 85 entonces tendremos una imagen aumentada de un objeto que está en el infinito. Esta combinación de lente positiva formadora de imagen (Lob ) y lupa (Loc ) definen la estructura básica de un telescopio refractor kepleriano, como se muestra en la fig. 1.77. La lente Lob se denomina objetivo (por estar del lado del objeto) y la lente Loc se denomina ocular (por estar del lado del ojo). Los puntos focales, secundario del objetivo y primario del ocular, coinciden. El rayo marginal pasa por el borde del objetivo, luego este es el diafragma de apertura, y el borde del ocular será el diafragma de campo, por lo que el rayo principal debe pasar por este borde y por el centro de las pupilas de entrada y salida, definiendo el campo objeto 𝛼 y el campo de visión 𝛼 0 del telescopio, como se ilustra en la fig. 1.77. La pupila de entrada es el borde del objetivo y la pupila de salida es la imagen real que forma el ocular del borde del objetivo. De la geometría de la fig. 1.77 (y la eq. (1.42)), se tiene que la pupila de salida se localiza a la distancia fob + foc 0 sex = foc (1.70) fob del ocular. El telescopio como sistema óptico es afocal, es decir, no posee puntos focales. Lo anterior resulta claro al examinar el rayo marginal. Este rayo incide paralelo al eje óptico y se refractada paralelo al eje óptico. Lo anterior también implica que el objeto está en −∞ y la imagen está en +∞. Por lo tanto, en el telescopio el aumento también se debe definir en forma angular, es decir, m𝛼 = 𝛼 0/𝛼. De la geometría de la fig. 1.77, se tiene que los ángulos 0 , donde r es el radio del están dados por 𝛼 = −roc /( fob + foc ) y 𝛼 0 = roc /sex oc ocular. Así, el aumento será m𝛼 = − fob . foc (1.71) Finalmente, para observar la imagen con el telescopio colocamos el ojo después del ocular. Supongamos que el diámetro de la pupila del ojo es mayor que el diámetro de la pupila de salida del telescopio. Entonces, el proceso de la formación de la imagen es el siguiente: el objetivo del te0 ) una imagen intermedia lescopio forma en el plano focal secundario (Fob del objeto que está en el infinito. El máximo tamaño de esta imagen será h 0 = 𝛼 fob . Luego, el ocular, que funciona como una lupa, envía manojos de rayos paralelos al ojo, y la lente del ojo los enfoca en la retina, formando una imagen final de tamaño h 00 = 𝛼 0lo jo . Como ya vimos en la fig. 1.75(c), el ojo se puede desplazar acercándose o alejándose del ocular sin variar el 86 · Óptica geométrica aumento de la imagen. Sin embargo, hay una posición óptima para el ojo. Como la pupila de salida del telescopio está fija, también lo estará el campo de visión. Por lo tanto, si la pupila del ojo está a la izquierda o a la derecha de la pupila de salida del telescopio, puede ocurrir que la pupila del ojo disminuya el campo de visión en el ojo. Si la pupila del ojo se coloca en la misma posición de la pupila del telescopio, el campo de visión no se verá alterado. Esta última configuración del telescopio-ojo es la ideal y se dice que las pupilas están acopladas. En otras palabras, el ojo se debe colocar a 0 del ocular. En la fig. 1.78, se ilustra la formación de imagen la distancia sex en la retina y el acoplamiento de pupilas. También se muestran los conos de energía (delimitados por el rayo marginal) y de visión (delimitados por el rayo principal). DA Lob 2a Ojo s'ex DC h' h'' Loc F'ojo P ex P en Figura 1.78. Conos de los campos objeto y visión en el telescopio refractor definidos por el rayo principal. La pupila del ojo se acopla a la pupila de salida del telescopio. La posición óptima del diafragma de campo se da en el plano focal secundario del objetivo. El cono de energía está definido por el rayo marginal. En la fig. 1.78, se ha introducido una abertura (circular) en el plano focal secundario del objetivo, de modo que sea el diafragma de campo. Si la abertura es de diámetro variable, entonces se puede graduar la extensión de la imagen que se desea observar sin afectar el flujo de energía. Más importante es el hecho que en este plano se puede introducir una transparencia con información que se quiera observar en la imagen, por ejemplo, una escala métrica. Entonces, como regla podemos establecer que el lugar apropiado para colocar un diafragma de campo en un sistema óptico debe ser donde el rayo marginal corte al eje óptico. En la práctica, los oculares se componen de varias lentes y de un diafragma de campo separado de las lentes. Por ejemplo, se pueden consultar los siguientes tipos de oculares: Ramsden, Kellner, ortoscópico, simétrico, Erfle [3]. En la fig. 1.79, se muestran los elementos ópticos que componen un ocular tipo Kellner. 2a' Óptica geométrica · 87 Ocular Kellner h' P ex DC Figura 1.79. Esquema de los elementos ópticos que componen un ocular tipo Kellner. Ejemplo: telescopio de 36 aumentos Consideremos un telescopio refractor comercial que tiene una lente objetivo de distancia focal fob = 900 mm y diámetro 2rob = 80 mm, y un ocular 10× y diámetro 2roc = 10 mm. Objetivo Buscador Ocular Prisma recto Figura 1.80. Telescopio astronómico refractor comercial (Refractor Bresser 80/900 mm EQ Quasar). Incluye un buscador (telescopio de menor aumento y mayor campo objeto) para ubicar fácilmente los objetos. Fuente: imagen tomada de https://www.astrocity.es. A partir de estos parámetros, se encuentra que el ocular tiene una distancia focal foc = 25 mm (eq. (1.69)), por lo que el aumento del telescopio será m𝛼 = −36. Con este ocular, el campo objeto será 2𝛼 = −10/925 = −0.0108 0 = 0.3892 = 22.3◦ (el rad = −0.62◦ , y el campo de visión será 2𝛼 0 = 10/sex ◦ valor correcto es 22.02 ). Con este ejemplo, se puede advertir el valor tan pequeño del campo objeto (0.62◦ ). Por esta razón, algunos telescopios astronómicos suelen tener acoplado un pequeño telescopio (llamado buscador), de menor aumento y, mayor campo objeto, que permita ubicar rápidamente 88 · Óptica geométrica lo que se quiere observar. El buscador debe estar alineado con el telescopio. El tamaño de la pupila de salida del telescopio es Dex = 2rob ( foc /fob ) = 2.5 mm. El número f del telescopio es f /# = 10. En la fig. 1.80, se muestra el telescopio comercial con los anteriores parámetros. Note que el ocular no está a lo largo del eje óptico que pasa por el objetivo, sino a 90◦ , esto con el fin de que sea más cómoda la observación. Para cambiar la dirección del ocular se usa un prisma recto. El telescopio refractor galileano En el museo de historia de la ciencia en la ciudad de Florencia-Italia se exhiben dos de los telescopios (y una lente objetivo) construidos por Galileo alrededor del año 1610. A diferencia del telescopio refractor kepleriano visto anteriormente, los telescopios de Galileo en lugar de una lente positiva como ocular usan una lente negativa, pero manteniendo la configuración afocal, es decir el punto focal secundario del objetivo coincide con el punto focal primario del ocular. En el plano focal primario del ocular, se tendrá un objeto virtual (que corresponde con la imagen real, invertida y de menor tamaño, que forma el objetivo en ausencia del ocular) y su imagen estará en el infinito. Un análisis de la geometría de este telescopio nos lleva otra vez a las eqs. (1.70) y (1.71), pero ahora foc < 0. De acuerdo con la fig. 1.81(a), 0 . el campo objeto es 𝛼 = −roc /( fob − | foc |) y el campo de visión es 𝛼 0 = roc /sex El tamaño de la pupila de salida Dex = 2rob (| foc | /fob ). Al usar una lente negativa como ocular, la pupila de salida se localiza entre el objetivo y el ocular, y es una imagen virtual, derecha y de menor tamaño que el diafragma de apertura. En consecuencia, no es posible acoplar la pupila del ojo con la pupila de salida del telescopio. Entonces, ¿dónde se debe colocar el ojo para tener una visión óptima? En la fig. 1.81(b), se muestra el ojo cerca del ocular. Suponemos que el diámetro de la pupila del ojo es mayor que el diámetro de la pupila de salida del telescopio. La pupila del ojo recorta el campo de visión, teniendo entonces un nuevo campo de visión con ángulo 2 𝛽 0 < 2𝛼 0. Entre más lejos se coloque el ojo, menor será el campo de visión (y el campo objeto) efectivo del telescopio. Como el rayo principal ya no pasa por el centro de la lente del ojo, el tamaño máximo que puede tener la imagen en la retina dependerá de la posición del ojo. En otras palabras, en el sistema telescopio galileano-ojo el diafragma de campo será la pupila del ojo. Por lo tanto, la mejor forma de usar este telescopio es colocando el ojo lo más cerca posible del ocular. Uno de los telescopios de Galileo que se exhibe en el museo consiste en un tubo de madera cubierto en cuero. En los dos extremos del tubo se Óptica geométrica · 89 alojan el objetivo y el ocular. El objetivo de distancia focal fob = 980 mm y diámetro 2rob = 37 mm; el ocular de distancia focal foc = −47.5 mm y diámetro 2roc = 22 mm [11]. El aumento del telescopio será m𝛼 = 20.63 y el campo objeto del telescopio será 2𝛼 = −0.0236 rad = −1.35◦ . Sin embargo, el campo objeto efectivo será menor al colocar el ojo. Suponiendo que el ojo se coloca muy cerca del ocular y el diámetro de la pupila del ojo es 4 mm (media del rango de apertura de iris), entonces el campo objeto será 2 𝛽 = 4/(980 − 47.5) = 0.0043 rad = 0.25◦ (15 minutos de arco). f ob f oc L ob L oc F'oc 2a 2a' F'ob DC P ex s'ex P en (a) F'ojo 2b F'oc h'' 2b' F'ob P ex P en (b) Ojo Figura 1.81. Telescopio galileano. No se puede realizar el acople de las pupilas del telescopio y del ojo. El campo de visión efectivo lo determina la pupila del ojo. Telescopio reflector newtoniano En los telescopios refractores, el objetivo es una lente positiva que forma la imagen de un objeto (que está en el infinito) en el plano focal secundario y luego con el ocular (lupa) se observa la imagen aumentada en tamaño. La imagen de los objetos distantes también se puede traer al plano focal primario del ocular empleando en lugar de una lente positiva un espejo cóncavo. En la sección 1.4.2, vimos que un espejo cóncavo, cuya superficie reflectora es un paraboloide de revolución, enfoca los rayos paralelos al eje óptico en el punto focal. Este punto se localiza a Rv /2 del vértice del espejo, donde Rv es el radio de curvatura del paraboloide en el vértice (fig. 1.37). En el telescopio refractor la luz siempre viaja en el mismo sentido hasta llegar al ojo. Pero al cambiar el objetivo, pasando de una lente positiva a un espejo cóncavo, la luz cambia de sentido al reflejarse en el espejo. Por 90 · Óptica geométrica lo que se requiere de otro elemento óptico para volver a cambiar el sentido de propagación de la luz. Una configuración que resuelve este problema fue propuesta por Newton en 1668. La solución consistía en colocar un espejo plano (espejo secundario) cerca del punto focal del espejo cóncavo (espejo primario) con una orientación diagonal (45◦ ) respecto al eje óptico. El tamaño del espejo secundario es varias veces menor que el tamaño del espejo primario y debe recibir todos los rayos reflejados en el espejo primario. En la fig. 1.82, se ilustra la configuación básica del telescopio newtoniano. El aumento nominal del telescopio está dado por la eq. (1.71), donde fob = Rv /2. 2a' Pex f oc 2a Pen DC F V f ob Figura 1.82. El telescopio newtoniano usa un espejo cóncavo con forma de parabolide de revolución (espejo primario) y un espejo plano diagonal (espejo secundario) para enfocar la luz que viene del infinito en el plano primario del ocular. Hay otras configuraciones de telescopios reflectores que, en lugar de usar un espejo secundario plano, usan un espejo hiperbólico (Cassegrain) o un espejo elíptico (Gregoriano), manteniendo como espejo primario uno de forma parabólica.7 Una ventaja de los telescopios reflectores sobre los telescopios refractores está en evitar que el objetivo del telescopio sufra de aberración cromática (la dependencia del índice de refracción con la longitud de onda de la luz), propia de los elementos refractores. Aunque se puede construir sistemas refractores acromáticos (que corrigen la aberración cromática) combinando lentes, se tiene una limitación práctica cuando se quiere construir objeti7 En el libro Optical Imaging and Aberrations de Virendra N. Mahajan, se puede consultar en el capítulo 6 (Calculation of Primary Aberrations: Reflecting and Catadioptric Systems) los detalles ópticos y matemáticos de los tipos de telescopios reflectores más comunes y sus variantes. Libro editado por SPIE Optical Engineering Press, 1998. Óptica geométrica · 91 vos de gran diámetro (de algunos metros). De hecho, el telescopio refractor más grande construido se encuentra en el observatorio de Yerkes, en la Universidad de Chicago. El objetivo del telescopio consiste en dos lentes de diámetro 1.016 m (40 in) separadas 218 mm; la distancia focal resulta ser 18.897 m (744 in).8 A partir de estos datos, se tiene que este telescopio tiene un f /# = 18.6. La dificultad para construir grandes telescopios refractores está en obtener bloques de vidrio sin imperfecciones y con un índice de refracción homogéneo, y lograr la curvatura deseada en las dos caras de la lente. Esto no es una limitante para los espejos primarios de los telescopios reflectores, donde el cuidado se debe tener en la calidad de la superficie reflectora. Es así como varios observatorios astronómicos cuentan con grandes telescopios reflectores con espejos primarios que llegan a medir hasta 10 m de diámetro. El tamaño del espejo primario juega un papel fundamental en la resolución del telescopio. Esta se puede dar como la mínima distancia angular entre dos objetos puntuales con la cual se puede distinguir los dos puntos en la imagen (límite de resolución angular), o como la mínima distancia transversal entre las imágenes de los dos puntos que permite identificar los puntos (límite de resolución). De acuerdo con el criterio de Airy [3], el límite de resolución está dado por9 (Δl) mı́n = 1.22𝜆 ( f /#) . (1.72) 1.8.4. El microscopio En la actualidad hay muchos tipos de microscopios que se pueden consultar en la literatura especializada. Aquí solo trataremos la configuración tradicional del microscopio óptico que enfoca la imagen en la retina del ojo. Básicamente, el microscopio óptico añade una lente positiva (objetivo, Lob ) a una lupa (ocular, Loc ) para lograr imágenes aumentadas de objetos cercanos y muy pequeños, como se muestra en la fig. 1.83. La distancia entre el punto focal secundario del objetivo y el punto focal primario del ocular, denotada por lt , se denomina longitud del tubo. Esta longitud la fijan los fabricantes de microscopios y se busca que al cambiar la potencia refractiva del objetivo no se modifiquen las distancias entre las lentes, por lo que se 8 Los datos del telescopio se han obtenido de la página del observatorio de Yerkes. http://astro.uchicago.edu/yerkes/plates/plates3.html. 9 Este criterio será discutido en el capítulo 4. 92 · Óptica geométrica debe mover el objeto hasta que quede enfocado. Distancias comunes para la longitud del tubo son 160 mm (norma DIN) o 170 mm (norma JIS).10 f ob a DA foc lt P en P ex F oc F'ob O O' Lob DC Ojo s'ex I F'ojo Loc Figura 1.83. El microscopio. La longitud del tubo lt se fija en 160 mm. Con esto, la distancia entre el objetivo y el ocular se mantiene fija y, al cambiar la potencia del objetivo, se debe acercar o alejar el objeto hasta que quede enfocado. El aumento del microscopio se da como el producto del aumento que produce el objetivo y el aumento que produce el ocular. El objetivo forma la imagen del objeto O en O0 a la distancia lt del punto focal secundario del objetivo, por lo que el aumento de esta imagen será mob = −lt /fob . Por otra parte, el aumento del ocular es moc = 250/foc . Así, el aumento del microscopio es lt 250 m=− , (1.73) fob foc con las distancias focales dadas en milímetros. Los objetivos de microscopio cuando se usan en aire varían desde unos 4 aumentos hasta unos 40 aumentos. También se encuentran objetivos de mayor aumento, pero se usan sumergiendo el objeto en aceite para microscopía óptica. Estos objetivos se llaman objetivos de inmersión. El diafragma de apertura está definido por el borde del objetivo, por lo que allí estará la pupila de entrada. La pupila de salida estará a la derecha del ocular y es una imagen real y de menor tamaño que el DA. Por lo general, la pupila de salida es de menor diámetro que la pupila del ojo. Al igual que en el telescopio refractor, se logra un acople de pupilas colocando la pupila del ojo en la pupila de salida del microscopio. En los objetivos de telescopios, el f /# (eq. (1.62)) es el parámetro que se usa para establecer la cantidad de energía colectada por el objetivo y medir el límite de resolución. En los microscopios, se usa una cantidad un poco diferente, denominada apertura numérica N A, definida como N A = n sin 𝜑, (1.74) 10 La norma DIN es establecida en Alemania: Deutsche Industrie Norm. La norma JIS es establecida en Japón: Japanese Industry Standard. a' Óptica geométrica · 93 con n el índice de refracción del medio que rodea al objeto y 2𝜑 el ángulo que subtiende la pupila de entrada (de diámetro 2rP en ) con respecto al punto axial objeto, es decir, tan 𝜑 = −rP en /len , donde len es la distancia del objeto a la pupila de entrada. En la fig. 1.84, se muestra un objetivo de microscopio comercial identificado con el aumento, la longitud del tubo, la apertura numérica (en aire) y el espesor del cubre objetos que se debe usar. En este ejemplo, la distancia focal del objetivo es fob = (160/10) mm = 16 mm. Aumento Longitud del tubo Apertura Numérica (NA) Espesor de la lámina cubre objetos Figura 1.84. Parámetros en un objetivo de microscopio (DIN 45 mm acromático). Fuente: imagen tomada de https://www.amaina.com/97-objetivos-y-oculares. La resolución del microscopio se da mediante una cantidad análoga a la del telescopio. Esta cantidad se denomina poder de resolución (límite de resolución) y está dada por 1 (Δl) mı́n = 1.22𝜆 . (1.75) 2N A El campo objeto en un microscopio es mayor que en un telescopio. El ángulo 𝛼 se puede calcular como 𝛼 = rDC /(lt + fob ), donde rDC es el radio del diafragma de campo. Con 2𝛼, se estima la región del objeto que se puede observar con el microscopio. En la fig. 1.85, se muestra las partes básicas de un microscopio monocular (también son muy comunes los microscopios que usan dos oculares, uno para cada ojo, y se denominan microscopios binoculares). Este microscopio ilumina la muestra desde abajo, de modo que lo que se observa es la luz transmitida por el objeto (microscopio de transmisión). El objeto se coloca en la platina, la cual se puede desplazar verticalmente mediante los tornillos macrométrico (gran desplazamiento) y micrométrico (pequeños desplazamientos) para lograr el enfoque del objeto. El revolver aloja varios objetivos de diferente aumento y al rotarlo se selecciona el objetivo deseado. Al final del tubo, se encuentra el ocular, en el que se coloca el ojo para observar la 94 · Óptica geométrica imagen final. También se puede iluminar el objeto desde arriba (por ejemplo, con un espejo cóncavo), en cuyo caso lo que se verá es la luz reflejada por el objeto (microscopio de reflexión). Ocular Tubo Revolver Objetivo Platina Sistema de iluminación Tornillos (macrométrico y micrométrico) Figura 1.85. Partes de un microscopio monocular de transmisión. Fuente: imagen tomada de https://www.euromex.com/es/productos/productos/microscopiosverticales/educacin-microscopios-verticales/microblue/. Óptica geométrica · 95 1.9. Aberraciones ópticas monocromáticas En la unidad 1.3, se definió el ovoide cartesiano como la superficie de revolución que forma una imagen puntual de un objeto puntual, ambas en el eje óptico. La forma de la superficie se encuentra a partir del principio de Fermat y depende de las distancias del objeto y la imagen con respecto al vértice, y de los índices de refracción. Por lo tanto, para diferentes distancias del objeto, se tendrán diferentes ovoides cartesianos. Lo anterior impone una limitación práctica a la hora de diseñar sistemas ópticos formadores de imagen; la imagen está bien enfocada solo para una posición del objeto. Una solución práctica es usar superficies refractoras o reflectoras esféricas y limitar la región óptica que atravesará el flujo de energía a una región muy pequeña alrededor del eje óptico, lo que se puede hacer con un diafragma (de apertura) de diámetro pequeño. Esta condición se conoce como aproximación paraxial y da lugar a la ecuación de Gauss (eq. (1.21)), que implica que la imagen de un objeto puntual será una imagen puntual, de manera que la imagen de un objeto extendido será una copia del objeto salvo por un factor de escala y orientación. Cuando el sistema óptico no se limita a la región paraxial, la imagen ya no será una réplica del objeto. Las diferencias entre la imagen real y la imagen paraxial (ideal) se denominan aberraciones ópticas. Un análisis detallado de las aberraciones ópticas está fuera del alcance de este libro. El lector interesado en ampliar este tema puede consultar el libro de Malacara [12], entre otros. En esta unidad haremos una descripción cualitativa, muy general, que nos permita entender conceptulamente las aberraciones ópticas primarias monocromáticas (que no depende de la longitud de onda). La exposición se hace para una superficie esférica refractora, pero los resultados se extienden a sistemas de lentes. Las principales aberraciones debidas al color de la luz (aberraciones cromáticas) se presentan en el apéndice D. 1.9.1. Curvatura de campo En la aproximación paraxial, los rayos que salen de un objeto puntual deben ser casi paralelos al eje óptico y viajar muy cerca de este. Esto quiere decir que la extensión del objeto (y la imagen) también debe ser pequeña en comparación con la distancia objeto (e imagen). ¿Qué ocurre si la extensión del objeto es comparable con la distancia objeto aun cuando el tamaño del diafragma se mantenga pequeño? En la fig. 1.86, se representa un sistema óptico conformado por una superficie esférica refractora y un diafragma de apertura localizado en el centro de curvatura de la superficie. Un obje- 96 · Óptica geométrica to de altura h = −OP, de acuerdo con la óptica paraxial, tendrá su imagen en un plano (plano imagen gaussiano) localizado en O0 y tendrá la altura h 0 = O0P00. Sin embargo, debido a la extensión del objeto, la imagen de P no está en P00, sino un poco antes. Para ver esto, consideremos los manojos de rayos que salen de O y P. El rayo principal de O será el eje óptico OVO0 y el rayo principal de P será el eje auxiliar PV0P00. Tanto los rayos que salen de O como los que salen de P se mantienen casi paralelos al rayo principal correspondiente, pero el rayo principal del punto P ya no es paraxial. La distancia objeto PV0 es mayor que la distancia objeto OV, y de la eq. (1.21) resulta, entonces, que la distancia imagen V0P0 es menor que la distancia imagen VO0. La imagen P0 estará en el eje auxiliar, pero a la izquierda de la esfera de radio CO0 centrada en C. En conclusión, la imagen de un plano localizado en O es una superficie de revolución con vértice en O0. Esta superficie se denomina superficie de Petzval. En primera aproximación, la superficie de Petzval (Ptz) es un paraboloide de revolución con vértice en O0, es decir h 02 Ptz = , (1.76) 2rPtz donde rPtz es el radio de curvatura en el vértice del paraboloide. En un sistema óptico de varias superficies refractoras, el inverso del radio de curvatura depende de la suma de la potencia refractiva de las superficies. En la aproximación de lentes delgadas, el radio de la Petzval para N lentes está dado por N Õ 1 P̃k =− , (1.77) rPtz nk k=1 con P̃k dado por la eq. (1.54) y nk el índice de refracción de la lente k. Así que combinando lentes positivas y negativas se logra aumentar el radio de curvatura, es decir, aplanar la superficie imagen. Plano imagen gaussiano Esfera centrada en C Superficie de Petzval R O V DA C P' P'' O' V' P n n' Figura 1.86. Curvatura de campo. La imagen de un plano es una superficie denominada superficie de Petzval. Óptica geométrica · 97 Usualmente, la imagen se registra en un sensor plano (película fotográfica, cámara CCD o CMOS). Supongamos que el sensor se ubica en el plano imagen gaussiano. Teniendo en cuenta que la imagen de un punto es también un punto en la superficie de Petzval, entonces la imagen de un objeto extendido en el plano imagen gaussiano está enfocada en el eje óptico y a medida que nos alejamos del eje se irá desenfocando cada vez más, como se muestra en la fig. 1.87. Este defecto se conoce como aberración curvatura de campo. Si el diámetro del diafragma se reduce también se reduce el defecto. En el límite, un diafragma de radio que tiende a cero solo dejaría pasar el rayo principal y la imagen de cualquier punto del objeto se vería como una imagen puntual. En otras palabras, el efecto de la curvatura de campo sobre la imagen también se puede disminuir reduciendo el tamaño del diafragma de apertura (a costa de dejar pasar menos energía luminosa). Plano imagen gaussiano Superficie de Petzval O' Imagen de puntos del objeto a diferente altura Figura 1.87. Imagen de puntos del objeto a diferentes alturas afectados por la curvatura de campo. 1.9.2. Esférica Esta aberración ya se mencionó en la unidad 1.3 para la refracción en una superficie esférica y en la unidad 1.4 para la reflexión en una superficie esférica. En las figs. 1.24 y 1.35, se muestra la refracción y la reflexión, respectivamente, de un manojo de rayos limitados por un diafragma de apertura efectivo de gran diámetro. Los rayos marginales, al refractarse, en el primer caso, y al reflejarse, en el segundo, no convergen al punto donde convergen los rayos paraxiales correspondientes. Este defecto se denomina aberración esférica y se puede disminuir su efecto reduciendo el tamaño del diafragma de apertura. 98 · Óptica geométrica DA R y O Rayo margin al Rayo paraxial V C -s O' S' s' n n' Figura 1.88. Aberración esférica. Los rayos marginales no paraxiales no convergen en un mismo punto en el eje óptico. En la fig. 1.88, se muestra la refracción en una superficie esférica del rayo marginal y de un rayo paraxial. El diafragma de apertura se ha colocado a la izquierda del vértice de la superficie. Cuantitativamente, la aberración esférica se puede medir como SphL = S 0 − s 0 , (1.78) es decir, la diferencia longitudinal entre el punto de intersección del rayo marginal y el punto de intersección del rayo paraxial en el eje óptico. En primera aproximación esta aberración depende cuadráticamente de la altura del rayo marginal, de modo que SphL = as y 2 , (1.79) donde el coeficiente as depende de los parámetros del sistema (distancia objeto, radios de curvatura de las superficies, índices de refracción), pero no depende de la altura del objeto (imagen). La aberración esférica es positiva si S 0 > s 0 (as > 0) y negativa si S 0 < s 0 (as < 0). En al fig. 1.89, se muestra la refracción de un manojo de rayos que divergen del punto O afectado por aberración esférica. En el plano imagen gaussiano la intersección de los rayos determina el tamaño de la imagen del punto, como se muestra en la figura. La curva tangente a la intersección de los rayos refractados se denomina la cáustica y es una curva de máxima energía. Se observa que la cáustica tiene una sección transversal mínima, denominada cintura. En esta sección los rayos refractados tienen la menor dispersión radial. Por lo que allí se tendrá la mejor imagen del punto O, esto es, el menor desenfoque posible para el tamaño del diafragma dado. La aberración esférica afecta de la misma manera a puntos del objeto fuera de eje. Óptica geométrica · 99 Tamaño de la imagen del punto P Cáustica C O Cintura n Plano imagen gaussiano n' Figura 1.89. Cáustica de los rayos afectados por aberración esférica. En la cintura de la cáustica se logra la mejor imagen para P. 1.9.3. Distorsión Supongamos que el diafragma de la fig. 1.89 se cierra de manera que se puede despreciar el efecto de la aberración esférica para los rayos que salen del punto axial O; nuevamente, tenemos que la imagen de O es un punto en O0, como se muestra en la fig. 1.90. Por otro lado, del punto P, que está fuera de eje, también sale un manojo de rayos con los rayos viajando muy cerca del rayo principal que incide en el punto Q de la superficie. Por lo tanto, para los rayos que salen de P también se puede despreciar el efecto de la aberración esférica con respecto al rayo principal. Sin embargo, la distancia del punto Q con respecto al eje auxiliar PV0P00 es mayor que el tamaño del diafragma, de modo que el rayo principal que sale de P sí está afectado por aberración esférica y la imagen P0 de P estará a la distancia 2 SphL ≈ as QV0 de la superficie de Petzval. Plano imagen gaussiano Superficie de Petzval DA R Q O V P' C P'' P''' Dist O' V' P n n' Figura 1.90. La distorsión deforma la imagen pero mantiene el enfoque de cada punto. Esta aberración depende de la posición del diafragma de apertura. Como la imagen se observa en el plano imagen gaussiano, lo que veremos es la proyección de rayos que divergen de P0. Ya que el diafragma es pequeño y en la práctica VO0 SphL, entonces la intersección de estos rayos en el plano imagen gaussiano se verá aproximadamente como un punto, que se denota por P000 en la fig. 1.90. Así, P000 será la imagen de P 100 · Óptica geométrica en el plano imagen gaussiano. La diferencia entre la altura de P000, h̄ 0, y la altura de la imagen Gaussiana P00, h 0, se denomina aberración de distorsión o simplemente distorsión (Dist). En la fig. 1.86, el diafragma está localizado en el centro de curvatura de la superficie. Note que la proyección de los rayos que divergen de P0 llega a P00, por lo tanto, no hay distorsión. La distorsión depende de la posición del diafragma. En la fig. 1.90, el diafragma está a la izquierda de C y la altura de la imagen P000 es menor que la altura de la imagen Gaussiana P00; en este caso, se dice que se tiene distorsión de barril. Si el diafragma se coloca a la derecha de C, se tendrá lo contrario: la altura de la imagen P000 será mayor que la altura de la imagen Gaussiana P00; en este caso, se dice que se tiene distorsión de cojín. DA DA DA O P Objeto P P P O O O Imagen con distorsión de barril Imagen ideal Imagen con distorsión de cojín Figura 1.91. Ejemplos de distorsión. El DA está a la izquierda de la lente y se tiene la imagen con distorsión de cojín. El DA está justo al lado de la lente de la lente y se tiene la imagen (prácticamente) sin distorsión. El DA está a la derecha de la lente y se tiene la imagen con distorsión de barril. En primera aproximación la distorsión también depende del cubo de h 0 Dist = at h 03 = h̄ 0 − h 0 , (1.80) donde at es el coeficiente de distorsión que depende de los parámetros del sistema y de la posición del diafragma de apertura. En la fig. 1.91, se muestran las posibles configuraciones para la imagen afectada por distorsión en un sistema óptico de aumento m = −1 formado por una lente delgada biconvexa. Cuando el diafragma está justo al lado de la lente la distorsión, es aproximadamente cero. Estrictamente, la distorsión es cero cuando el diafragma está en el centro (dentro) de la lente. En un sistema de varias lentes, el diafragma se localizará entre las lentes buscando la mayor simetría posible para tener la mínima distorsión. Óptica geométrica · 101 1.9.4. Astigmatismo y coma Para ver estas dos aberraciones, primero vamos a definir el plano tangencial y el plano sagital. En la sección 1.3.5, se definió el plano meridional como el plano que contiene al eje óptico. Los objetos extendidos los representamos como flechas de una altura dada contenidos en el plano meridional y los rayos que salen de un punto cualquiera del objeto también quedaron limitados al plano meridional. En particular, en un sistema óptico el plano que contiene al eje óptico y al rayo principal, se denomina plano tangencial, y el plano que contiene al rayo principal y, además, es ortortogonal al plano tangencial, se denomina plano sagital. El plano tangencial es un plano meridional, pero el plano sagital no lo es. El plano tangencial mantiene su orientación espacial a lo largo del sistema óptico, en cambio, el plano sagital cambia su inclinación de la misma forma como lo hace el rayo principal. En la fig. 1.92, se ilustran estos planos en un sistema conformado por un diafragma y una superficie refractora convexa. La altura del objeto es h = −OP y la altura de la imagen es h 0 = O0P0. Los rayos que salen de P y que están en el plano tangencial se denominan rayos tangenciales (en azul); los rayos que salen de P y que están contenidos en el plano sagital se denominan rayos sagitales (en rojo). En fig. 1.92, se muestra la proyección del diafragma en la superficie y se marcan cuatro puntos: T1 y T2 corresponden con la intersecciones de los rayos tangenciales marginales en la superficie; S1 y S2 corresponden con las intersecciones de los rayos sagitales marginales en la superficie. Superficie refractora P' T1 DA O' S2 Plano tangencial S1 T2 O P Plano sagital Figura 1.92. Definición de los planos tangencial (azul) y sagital (rojo). En la fig. 1.93, se muestra el plano meridional que contiene los rayos tangenciales marginales que pasan por T1 y T2 . Los puntos sagitales S1 y · 102 Óptica geométrica S2 se proyectan en este plano meridional en un solo punto. Teniendo en cuenta el efecto de la aberración esférica sobre los rayos marginales, se tiene que los rayos sagitales marginales después de refractarse en los puntos S1 y S2 (rayos en rojo) se intersecan en el eje óptico auxiliar, debido a la simetría de S1 y S2 con respecto al vértice V0. Por otra parte, los rayos tangenciales marginales después de refractarse en los puntos T1 y T2 (rayos en azul) no se intersecan en el eje óptico auxiliar, ya que T1 y T2 no se encuentran a la misma distancia del vértice V0, como se puede apreciar en la parte superior izquierda de la figura. Esta asimetría da lugar a las aberraciones de astigmatismo y coma, que se definen a partir de las siguientes intersecciones: T10 , intersección del rayo tangencial marginal superior con el eje auxiliar; T20 , intersección del rayo tangencial marginal inferior con el eje auxiliar; T0, intersección entre los rayos tangenciales marginal superior e inferior; S0, intersección entre los rayos sagitales marginales, que se localiza en el eje auxiliar. La distancia longitudinal entre las proyecciones transversales de S0 y T0 sobre el rayo principal define la aberración de astigmatismo (longitudinal), AstL. La distancia transversal entre T0 y rayo principal define la aberración de coma tangencial, ComaT ; la distancia transversal entre S0 y rayo principal define la aberración de coma sagital, ComaS . T1 S2 A T2 V V' O S1 DA T' T1 S1 P' T'1 S' T'2 P'' P''' S2 T2 C V O'' O' V' P n n' Figura 1.93. Definición de las aberraciones astigmatismo y coma para los rayos marginales tangenciales (en azul) y sagitales (en rojo). La distancia S0T0 a lo largo del rayo principal es el astigmatismo (longitudinal). La distancia entre T0 y rayo principal es la coma tangencial (transversal), y la distancia entre S0 y el rayo principal es la coma sagital (transversal). El rayo principal interseca la superficie en A y al eje auxiliar en P0. Astigmatismo A medida que disminuye la altura del objeto, la aberración esférica que experimentan los rayos marginales (medida desde el eje auxiliar) también disminuye, por lo que las intersecciones T0 y S0 se acercan a la superficie de Petzval. En el eje óptico, T0 y S0 coinciden (el astigmatismo es igual a cero) Óptica geométrica · 103 en el punto O00 que está de O0 a la distancia SphL ≈ as (T1 V) 2 = as (T2 V) 2 (fig. 1.93). En primera aproximación, para un objeto plano, T0 y S0 describen dos paraboloides de revolución con vértice en O00, denominados superficies astigmáticas. A medida que se cierra el diafragma, O00 se acerca a O0 y las superficies astigmáticas también se desplazan hacia O0. Para una altura fija del objeto el AstL no cambia, en otras palabras, el AstL no depende del tamaño del diafragma. En la fig. 1.94, se muestra las secciones de las superficies astigmáticas en el plano tangencial, denotadas por T y S, suponiendo que el diámetro de DA tiende a cero11 (O00 coincide con O0). En T se enfocan los rayos tangenciales marginales, mientras que los rayos sagitales marginales aún no se intersecan. En un plano transversal, pasando por T, los rayos marginales describen una línea (horizontal), denominada línea focal tangencial, como se muestra en (b). En S, se enfocan los rayos sagitales marginales, mientras que los rayos tangenciales marginales divergen de T0. En un plano transversal, pasando por S, los rayos marginales describen una línea (vertical), denominada línea focal sagital, como se muestra en (d). La longitud de las líneas focales es igual y depende del tamaño del diafragma de apertura. En medio de las superficies astigmáticas, se encuentra la superficie M con la característica que allí los rayos marginales describen una circunferencia cuyo diámetro es la mitad de la longitud de las líneas focales, como se muestra en (c). En la vertical, se tienen las intersecciones de los rayos tangenciales marginales T1 y T2 , y en la horizontal, se tienen las intersecciones de los rayos sagitales marginales S1 y S2 . En particular, los rayos tangenciales marginales han invertido sus posiciones. Al círculo en M se le denomina círculo de menor confusión. Para un plano localizado antes de T, los rayos marginales describen una elipse con el eje mayor definido por los rayos sagitales, como se muestra en (a). Finalmente, en el plano imagen gaussiano, los rayos marginales también describen una elipse, pero ahora el eje mayor lo definen los rayos tangenciales. También se incluye la superficie de Petzval, en la que se formaría la imagen en ausencia de astigmatismo. De acuerdo con lo dicho anteriormente, la imagen de un objeto puntual fuera de eje cambiará su geometría dependiendo del plano que se utilice para observar la imagen. Los rayos marginales describen el borde de la imagen correspondiente al punto. Los demás rayos, que van dentro del diafragma, llenarán la figura descrita por los rayos marginales. Reduciendo el tamaño del diafragma disminuye la longitud de las líneas focales, es decir, en general el tamaño de las elipses disminuye, por lo que se optimiza la imagen del punto. En la superficie M, se tendrá la mejor imagen para el punto (una 11 Esta condición implica que la coma también tiende a cero. 104 · Óptica geométrica mancha simétrica). Sin embargo, las curvas astigmáticas no cambian su forma con la variación del tamaño del diafragma de apertura. (a) (b) T1 S2 S1 S2 T2 (c) T1 T2 S1 P S2 S1 T1 (e) T2 T2 T2 DA O (d) T1 M n' S Ptz P'' P''' O' C V S2 T1 T n S1 S2 S1 AstL Figura 1.94. Curvas astigmáticas T y S e intersección de los rayos marginales en diferentes planos en ausencia de la aberración de coma. La proyección de los rayos marginales en el plano imagen gaussiano es una elipse. En M, se obtiene el círculo de menor confusión. Las distancias de T y S con respecto a Ptz satisfacen PtzT = 3PtzS. Al igual que la superficie de Petzval, las superficies astigmáticas se pueden caracterizar por los radios de curvatura en el vértice O0, los cuales dependen de los parámetros del sistema óptico y de la posición del diafragma. Entonces h 02 T= (1.81) 2rT y h 02 S= . (1.82) 2rS Coma Ahora vamos a suponer que se tiene la aberración de coma y que no hay astigmatismo. Así, los puntos T0 y S0 estarán en un mismo plano ortogonal al eje óptico y se tiene la relación ComaT = 3ComaS . La ComaS depende linealmente de la altura h 0, luego, ComaS = ac h 0 , (1.83) Óptica geométrica · 105 donde el coeficiente de coma depende de los parámetros del sistema óptico y la posición y tamaño del diafragma de apertura. La figura que describen los rayos marginales es una circunferencia (círculo comático) de radio igual a ComaS y con su centro a la distancia 2ComaS del rayo principal. Al disminuir el radio del diafragma de apertura disminuye el valor de ComaS , por lo que disminuye el radio del círculo comático y se acerca al rayo principal, como se muestra en la fig. 1.95. La figura que se tiene se asemeja a un cometa, de ahí el nombre para esta aberración. Al ir de T1 a S1 en la fig. 1.92 siguiendo la proyección del diafragma en la superficie refractora, en la figura comática se va desde T0 hasta S0 en el círculo correspondiente, es decir, mientras se da una vuelta en el borde del diafragma se dan dos vueltas en el círculo comático correspondiente. P' Coma S S' S' Coma S T' ComaT T' Figura 1.95. Geometría de la aberración de coma. Cada círculo corresponde a un diámetro del diafragma de apertura. Ejemplo: la PSF geométrica DA H H' _ h' = 9.28 h = - 10 f = 49.5 Figura 1.96. Sistema óptico para ver la PSF en diferentes planos para la imagen. Hasta aquí hemos hecho una descripción cualitativa de las aberraciones ópticas primarias por separado con el propósito de entender las principales características de cada una de ellas. Sin embargo, en la práctica en la imagen se tiene la mezcla de las aberraciones. En el plano imagen gaussiano 106 · Óptica geométrica tendremos entonces que la imagen de un punto fuera del eje óptico será, en general, una mancha asimétrica denominada PSF geométrica (del inglés Point Spread Function). Para ver esto, vamos a considerar el sistema óptico de la fig. 1.96, cuyos datos están dados en la tabla 1.3. En particular, vamos a considerar la formación de la imagen de dos puntos en el plano objeto: el punto en eje, con h = 0 y el punto fuera de eje, con h = −10 mm. La distancia focal de esta lente es f = 49.55 mm, la altura imagen Gaussiana es h 0 = 9.3844 mm y la altura del rayo principal en el plano imagen gaussiano es h̄ 0 = 9.2817 mm, por lo que la distorsión del rayo principal resulta ser Dist(h = −10) = −0.1027 mm. Tabla 1.3. Sistema óptico de una lente biconvexa con diafragma de apertura. El radio y el espesor se dan en mm. Superficie 0 (Obj) 1 (DA) 2 3 4 (Imag) Radio Espesor Índice 80 1.0000 20 1.0000 7 1.5168 93.7 1.0000 ∞ ∞ 50 -50 ∞ Convención de colores (figs. 1.97-1.101). La PSF será dibujada mediante un diagrama de puntos (pequeños círculos) correspondientes a las intersecciones de los rayos que emergen de un objeto puntual con el plano imagen. Este tipo de diagrama se denomina diagrama de manchas (spot diagram). El diagrama de manchas en el plano imagen lo presentaremos de dos formas: la primera, para rayos tangenciales y sagitales distribuidos uniformemente en el diafragma de apertura (ambos en color negro, a lo largo de las direcciones x 0 y y 0); la segunda, para rayos marginales distribuidos uniformemente en el perímetro de tres círculos concéntricos con el diafragma de apertura, con diámetros D1 = DDA (en color negro), D2 = 2DDA /3 (en color verde), y D3 = DDA /3 (en color magenta). Los puntos T1 y T2 en los rayos tangenciales marginales se pintan de azul y los puntos S1 y S2 en los rayos sagitales marginales se pintan de rojo. Óptica geométrica · 107 Los cálculos para obtener los diagramas de manchas se realizan con las ecuaciones para trazo exacto de rayos presentadas por Kingslake.12 En todos los casos, el origen de coordenadas corresponde con la intersección del rayo principal con el plano imagen. 30 30 T2 20 DA = 5 mm 10 10 Plano imagen, Ds' = 0 (Plano imagen gaussiano) 0 S1 S2 y' (mm) 20 y' (mm) h=0 -10 -10 -20 (a) -30 -30 0 -20 T1 -20 -10 0 x' (mm) 10 20 -30 -30 30 30 h=0 20 20 DA = 5 mm 10 (b) 0 S1 S2 T1 -20 -10 0 10 20 30 0 10 20 30 x' (mm) 0 -10 -10 -20 -20 -30 -30 -10 10 T2 y' (mm) Plano imagen, Ds' = - 0.63 mm (Círculo de menor confusión) y' (mm) 30 -20 -20 -10 0 x' (mm) 10 20 30 -30 -30 x' (mm) Figura 1.97. Aberración esférica con un diafragma de 5 mm de diámetro. (a) En el plano imagen gaussiano la imagen es un mancha circular de unos 60 𝜇m. (b) Al desplazar el plano imagen una distancia -0.63 mm del plano imagen gaussiano se obtiene la mancha circular de menor tamaño (círculo de menor confusión) con un tamaño aproximado de 12 𝜇m. Ver convención de colores en la página 106. En la fig. 1.97, se muestra los diagramas de manchas para el objeto puntual en eje cuando el diafragma de apertura tiene un diámetro de 5 mm. En (a), se observa la imagen en el plano imagen gaussiano. El tamaño de la imagen resulta ser una mancha circular de 55 𝜇m de diámetro aproximadamente. Note que aunque los rayos marginales se distribuyen en el diafragma en tres círculos cuyos radios varían uniformemente, no ocurre lo mismo con los radios de los círculos en la imagen. Debido a la dependencia cuadrática de la aberración esférica longitudinal con el tamaño del diafrag12 En el libro Lens Design Fundamentals de Rudolf Kinslake, se encuentra una versión de la ecuaciones para realizar trazo exacto de rayos en sistemas ópticos con simetría de revolución. Los cálculos mostrados en este ejemplo se realizaron con un programa desarrollado por el autor (Yobani Mejía). 108 · Óptica geométrica ma, se puede mostrar que el tamaño de los círculos en la imagen varía con el cubo del tamaño del diafragma. Así, mientras que para un diafragma 5 mm de diámetro se obtiene una mancha de unos 55 𝜇m de diámetro, para un diafragma de 1.67 mm de diámetro se obtiene una mancha de 2 𝜇m de diámetro aproximadamente, lo cual representa una gran mejora en la imagen. En (b), se reduce el tamaño de la imagen cuando el plano imagen se desplaza Δs 0 = −0.63 mm con respecto al plano imagen gaussiano. Esta situación corresponde con la cintura de la cáustica (fig. 1.89), en la que se obtiene la mancha circular del menor diámetro. En este caso, la imagen ahora tiene un diámetro de 12 𝜇m aproximadamente. Las otras aberraciones se manifiestan en la imagen cuando el objeto puntual se desplaza del eje óptico. Para ver inicialmente el astigmatismo, consideremos el objeto puntual fuera de eje (h = −10 mm), con un diafragma de 1 mm de diámetro. En la fig. 1.98(a), se muestra el diagrama de manchas correspondiente, el cual se asemeja a una elipse. La asimetría de la elipse se debe a la presencia de coma. En la dirección del plano tangencial, el tamaño es 70 𝜇m aproximadamente. Note que para el diafragma de 1 mm el diámetro de la mancha circular, debido a la aberración esférica será 60/125 mm aproximadamente, lo cual es mucho menor que el tamaño del eje mayor de la elipse astigmática. Por lo que el aumento de la PSF se debe principalmente al astigmatismo. En la fig. 1.98(b), el plano imagen se desplazó Δs 0 = −2.0 mm con respecto al plano imagen gaussiano para encontrar la línea focal sagital. En efecto, se observa que los puntos S1 y S2 coinciden. En la fig. 1.98(c), el plano imagen se desplazó Δs 0 = −4.5 mm con respecto al plano imagen gaussiano para encontrar la línea focal tangencial. Ahora los puntos T1 y T2 coinciden y los puntos S1 y S2 se separan intercambiando sus posiciones con respecto a las posiciones que tienen en la fig. 1.98(a). Lo anterior nos dice que AstL = 2.5 mm aproximadamente.13 Al cambiar el tamaño del diafragma a 5 mm de diámetro, el efecto de la aberración de coma se hace notable. En la fig. 1.99(a), el diagrama de manchas es más asimétrico y ahora se asemeja a la figura comática (fig. 1.95). También aumentó considerablemente el tamaño de la imagen, que mide a lo largo del plano tangencial 370 𝜇m aproximadamente, en comparación con el tamaño de la imagen afectada solo por aberración esférica (60 𝜇m), como se muestra en la fig. 1.97(a). Al desplazar el plano imagen a las posiciones en que se encontró las líneas focales mostradas en la fig. 1.98, se llega a que ahora el diagrama de manchas difiere mucho de un par de líneas (vertical y horizontal). Lo anterior es consecuencia del aumento de la coma al 13 En el programa de trazo de rayos, para el astigmatismo y la coma, el plano imagen se desplaza en pasos de 0.1 mm. Por lo tanto, el valor del AstL es aproximado. Óptica geométrica · 109 aumentar el diámetro del diafragma. Note que, al aumentar el diámetro del diafragma, los rayos sagitales marginales S1 y S2 y tangenciales marginales T1 y T2 experimentan mayor aberración esférica longitudinal, por lo que se enfocaran antes con respecto a las posiciones para un diafragma de 1 mm de diámetro. Esto explica por qué en las figs. 1.99(b) y (c) los rayos sagitales marginales y los tangenciales marginales no coinciden, como sí ocurre en las figs. 1.98 (b) y (c). Para que los rayos sagitales marginales y tangenciales marginales coincidan, se debe desplazar aún más el plano imagen. En la fig. 1.100(a), el plano imagen se ha desplazado Δs 0 = −2.7 mm, donde S1 y S2 coinciden, es decir, donde se tendría la línea focal sagital. En la fig. 1.100(b), el plano imagen se ha desplazado Δs 0 = −5.3 mm, donde T1 y T2 coinciden, es decir, donde se tendría la línea focal tangencial. Aunque los diagramas de manchas en (a) y en (b) distan de ser una línea vertical (en (a)) y horizontal (en (b)), el tamaño en general es menor en un factor aproximado de 2. Note que la diferencia entre las dos posiciones de los planos imagen es AstL = 2.6 mm aproximadamente. Esto muestra que, en efecto, el AstL no depende del tamaño del diafragma. Para terminar, consideremos nuevamente la fig. 1.98. Aquí tenemos tres posiciones para el plano imagen. ¿Cuál replica mejor al objeto puntual? Idealmente, la imagen de un objeto puntual es un punto, así que esperaríamos que la imagen se parezca a una mancha circular. En la fig. 1.94, se mencionó que en medio de las superficies astigmáticas se tiene el círculo de menor confusión. Esto sería la mejor imagen que se puede tener en presencia de astigmatismo. Para nuestro ejemplo, con el diafragma de diámetro 1 mm, el plano imagen se debe desplazar Δs 0 = −3.3 mm con respecto al plano imagen, lo que resulta ser AstL/2 = 1.3 mm a la izquierda de la superficie S. En la fig. 1.101, se muestra el diagrama de manchas correspondiente. Aunque el diafragma es pequeño, se nota el efecto de la coma en la asimetría de la PSF. Esta es la mejor imagen para el objeto puntual h = −10 mm. El punto central de la imagen está en h̄ 0 = 9.28 mm. Si se cambia la altura del objeto puntual, el círculo de menor confusión se encontrará en otra posición para el plano imagen. Por lo tanto, en un objeto extendido la imagen estará bien enfocada en unas regiones y desenfocada en otras. Con la combinación de lentes en un sistema óptico se busca disminuir las aberraciones ópticas, de modo que el enfoque global de la imagen sea óptimo. Cuando la iluminación del objeto es policromática resulta otro tipo de aberraciones: aberración cromática axial y aberración cromática transversal. 110 · Óptica geométrica En el apéndice D se definen estas aberraciones y se hace una breve descripción de ellas. 30 Plano imagen, Ds' = 0 y' (mm) DA = 1 mm (Plano imagen gaussiano) (a) 30 T2 20 20 10 10 y' (mm) h = - 10 mm 0 S1 S2 -10 -20 -20 -30 -30 T1 -30 -20 -10 0 x' (mm) 10 20 30 30 h = - 10 mm DA = 1 mm y' (mm) y' (mm) 0 S2 S1 -10 0 x' (mm) 10 20 -30 -20 -10 30 0 10 20 30 0 10 20 30 0 30 x' (mm) 30 20 20 10 10 0 T2 T1 S2 y' (mm) y' (mm) -10 20 -30 -20 30 (c) -20 10 -20 T1 -30 -30 Plano imagen, Ds' = - 4.5 mm (Plano imagen línea focal tangencial) -30 0 x' (mm) -10 -20 DA = 1 mm -10 10 -10 h = - 10 mm -20 20 T2 10 (b) -30 30 20 Plano imagen, Ds' = - 2.0 mm (Plano imagen línea focal sagital) 0 -10 S1 0 -10 -10 -20 -20 -30 -30 -30 -20 -10 0 x' (mm) 10 20 30 x' (mm) Figura 1.98. Aberración de astigmatismo. (a) En el plano imagen gaussiano el diagrama de manchas se asemeja a una elipse, como en 1.94(e). Aquí la elipse es ligeramente asimétrica debido a la presencia de coma. En (b) y (c), se muestran las líneas focales sagital y tangencial, respectivamente. El efecto de la aberración de coma, pequeño, por lo que se pueden apreciar muy bien las líneas focales. Ver convención de colores en la página 106. Óptica geométrica 300 h = -10 mm 200 200 DA = 5 mm 100 T2 0 S1 S2 -100 0 -100 -200 (a) -200 T1 -300 -300 -200 -100 0 x' (mm) 100 200 -300 -300 300 300 h = -10 mm 200 200 DA = 5 mm 100 0 S1 S2 -100 -300 -300 T1 -200 -100 0 x' (mm) 100 200 -300 -300 300 200 DA = 5 mm 100 100 0 S2 T2 y' (mm) 200 y' (mm) h = -10 mm S1 T1 -100 -200 -100 200 300 0 100 200 300 0 100 200 300 x' (mm) 0 -100 -200 -300 -300 -100 100 -200 300 (c) -200 0 x' (mm) 0 300 Plano imagen, Ds' = - 4.5 mm -100 -100 -200 (b) -200 100 T2 y' (mm) y' (mm) 300 Plano imagen, Ds' = - 2 mm 111 100 y' (mm) Plano imagen, Ds' = 0 (Plano imagen gaussiano) y' (mm) 300 · -200 -200 -100 0 x' (mm) 100 200 300 -300 -300 x' (mm) Figura 1.99. La aberración de coma se hace más relevante al aumentar el diámetro del diafragma de apertura. (a) En el plano imagen gaussiano se hace evidente la forma comática. En (b) y (c), se desplaza el plano imagen para encontrar las líneas astigmáticas, las cuales están muy afectadas por coma. Ver convención de colores en la página 106. 112 · Óptica geométrica 180 h = -10 mm 120 120 DA = 5 mm 60 60 y' (mm) Plano imagen, Ds' = - 2.7 mm (Plano imagen línea focal sagital) y' (mm) 180 T2 0 S2 S1 -60 -60 -120 (a) -180 -180 0 -120 T1 -120 -60 0 60 120 -180 -180 180 -120 -60 x' (mm) h = -10 mm 120 120 DA = 5 mm 60 60 y' (mm) 180 y' (mm) 180 Plano imagen, Ds' = - 5.3 mm (Plano imagen línea focal tangencial) 0 S2 S1 -60 -180 -180 60 120 180 60 120 180 0 -60 T2 T1 -120 (b) 0 x' (mm) -120 -120 -60 0 60 120 -180 -180 180 -120 -60 x' (mm) 0 x' (mm) Figura 1.100. Diagrama de manchas en que los rayos sagitales marginales (a) y los tangenciales marginales coinciden. Esto corresponde con las líneas focales cuando el diafragma tiene un diámetro de 5 mm. Ver convención de colores en la página 106. 30 h = - 10 mm 20 DA = 1 mm (Plano imagen mancha de menor confusión) y' (mm) Plano imagen, Ds' = - 3.3 mm 10 T2 0 S2 S1 -10 T1 -20 -30 -30 -20 -10 0 10 20 30 x' (mm) Figura 1.101. Diagrama de manchas correspondiente al círculo de menor confusión para las superficies astigmáticas cuando el diámetro del diafragma de apertura es 1 mm. La asimetría se debe a la presencia de coma. Ver convención de colores en la página 106. Capítulo dos Polarización Polarización (a) Imagen con luz no polarizada · 115 (b) Imagen con luz polarizada Figura 2.1. Polarización por reflexión. La luz que viene de la ventana no está polarizada. Al reflejarse en una lámina de vidrio (superficie lisa), como en (a), se observa parte de la ventana junto con el texto que está debajo de la lámina. Si se observa la reflexión formando un ángulo con la normal de la lámina cercano al ángulo de Brewster, la luz estará linealmente polarizada, lo que se comprueba colocando un polarizador lineal entre la lámina y la cámara que forma la imagen. Con esto elimina la luz reflejada y se puede ver claramente el texto que está debajo de la lámina, como se muestra en (b). De acuerdo con la física clásica, la luz es una onda electromagnética y sus propiedades se obtienen de las ecuaciones de Maxwell. Una de estas propiedades es que la luz es una onda transversal, es decir, los vectores eléctrico y magnético (campo óptico) vibran ortogonalmente a la dirección de propagación de la onda. Si suponemos que la fuente de luz está compuesta por osciladores que emiten energía electromagnética, en general las direcciones de los vectores eléctrico y magnético son aleatorias. Sin embargo, mediante ciertos mecanismos es posible mantener la vibración del vector eléctrico (magnético) resultante en un plano fijo o siguiendo una curva elíptica o circular. Entonces, se dice que la onda está polarizada. En este capítulo, se define polarización y se muestran algunas aplicaciones. Teniendo en cuenta la linealidad de las ecuaciones de Maxwell, limitaremos el estudio de la polarización a las ondas planas armónicas. Aunque el campo óptico emitido o reflejado puede tener cualquier forma, del análisis de Fourier se tiene que la forma compleja del frente de onda del campo óptico se puede sintetizar mediante la suma de ondas planas armónicas. Así, los resultados para las ondas planas se hacen extensivos para formas más complejas del campo óptico. En este capítulo, primero se desarrolla el álgebra para describir la polarización lineal, elíptica y circular, y se usa el formalismo de Jones para describir los estados de polarización y los elementos polarizadores. Entre 116 · Polarización los mecanismos de polarización, se discute en cierto detalle el dicroísmo, la polarización por reflexión externa y total interna, y la birrefringencia, limitando este último al caso en que las direcciones principales para los índices de refracción coinciden con los ejes del cristal. Los medios refractivos que vamos a considerar son dieléctricos sin absorción. Polarización · 117 2.1. Ondas planas y luz polarizada En el vacío, para un punto r = (x, y, z) y el tiempo t, el campo óptico se describe mediante el vector eléctrico E y el vector magnético H, los cuales se relacionan entre sí de acuerdo con las ecuaciones de Maxwell, dadas por 𝜕H , 𝜕t (2.1) 𝜕E , 𝜕t (2.2) ∇ × E = − 𝜇0 ∇ × H = 𝜖0 ∇ · E = 0, (2.3) ∇ · H = 0. (2.4) La ecuación de onda para el campo eléctrico, a partir de las eqs. (2.1), (2.2) y (2.3), queda1 1 𝜕2E (2.5) ∇2 E = 2 2 , c 𝜕t con c 2 = 1/ 𝜇 0 𝜖 0 . Para el campo magnético, se obtiene una ecuación análoga a la eq. (2.5). Ya que E(x, y, z) = {Ex (x, y, z), Ey (x, y, z), Ez (x, y, z)}, para un tiempo t, la eq. (2.5) representa un conjunto de tres ecuaciones, una para cada componente del campo E. Si representamos cualquiera de estas componentes por V = V (x, y, z), se tiene una ecuación escalar de la forma 𝜕 2V 𝜕 2V 𝜕 2V 1 𝜕 2V + + = . 𝜕x 2 𝜕y 2 𝜕z2 c 2 𝜕t 2 (2.6) Sea ŝ = (sx , sy , sz ) un vector unitario en una dirección fija del espacio, la solución de la eq. (2.6) de la forma V (r, t) = g (r · ŝ, t) representa una onda plana homogénea que se propaga en la dirección ŝ, ya que en un tiempo dado g es constante para los planos r · ŝ = a (con a constante). En particular, una onda plana armónica se puede escribir como V (r, t) = A0 cos(kr · ŝ − 𝜔t + 𝛿), (2.7) donde A0 es la amplitud de la onda. k = 2𝜋/𝜆 , con 𝜆 la longitud de onda en el vacío, se denomina número de onda angular, 𝜔 = 2𝜋 𝜈, con 𝜈 la frecuencia de la onda, se denomina frecuencia angular y 𝛿 es el desfase inicial. 1 La ∇2 ( ). ecuación de onda se obtiene mediante la identidad vectorial ∇ × (∇× ) = ∇(∇· ) − 118 · Polarización Entonces, la fase de la onda se compone de tres sumandos: una fase espacial dada por la superficie 𝜑(x, y, z) = kr · ŝ, una fase temporal 𝜔t y una fase constante 𝛿 que permite ajustar el valor en el origen (espacial y/o temporal). Las superficies de fase espacial constante se denominan frentes de onda y corresponden con los frentes de onda geométricos definidos a partir del principio de Fermat en el capítulo 1. 2.1.1. Ecuaciones de Maxwell con ondas planas Si en las ecuaciones de Maxwell los campos E y H describen ondas planas, estas ecuaciones diferenciales se simplifican a ecuaciones algebraicas. Para ver esto, escribamos E y H en forma compleja, es decir, E(r, t) = E0 e i (k·r−𝜔t) , (2.8) H(r, t) = H0 e i (k·r−𝜔t) , (2.9) donde k es el vector de onda cuyo módulo es el número de onda angular y la dirección es la del vector unitario ŝ, es decir, k = kŝ. El término de fase inicial se ha omitido para simplificar el tratamiento, pero cuando se requiera se volverá a incluir. Entonces, el resultado de los operadores ∇ y 𝜕/𝜕t sobre las ondas planas es ∇ × E = i (k × E), (2.10) ∇ · E = i (k · E), (2.11) 𝜕E = −i𝜔E, (2.12) 𝜕t para el campo E. Para el campo H, se obtienen relaciones similares. Por lo tanto, las ecuaciones de Maxwell se reducen a k × E = 𝜇 0 𝜔H, (2.13) k × H = −𝜖 0 𝜔E, (2.14) k · E = 0, (2.15) k · H = 0. (2.16) De estas ecuaciones, se tiene que E=− 1 k × H, 𝜖 0𝜔 (2.17) lo que implica junto con la eq. (2.16) que E, H y k forman un sistema ortogonal de vectores, como se ilustra en la fig. 2.2. · Polarización H 119 H E k k -E Figura 2.2. Orientación de los campos E, H y el vector de onda k. Sea H = |H| (el módulo de H) y E = |E| (el módulo de E). Teniendo en cuenta la ortogonalidad mutua entre E , H y k, de la eq. (2.14), se tiene que H = 𝜖 0 cE, (2.18) donde c = 𝜔/k. Entonces, los campos E y H vibran en fase (eqs. (2.8) y (2.9)) en un plano ortogonal a k y se propagan del modo en que se ilustra en la fig. 2.3. H E k Figura 2.3. Ilustración de la propagación de los campos armónicos E y H. 2.1.2. Irradiancia Experimentalmente, en el rango visible, no se mide el campo E debido a la falta de detectores que logren una respuesta tan rápida como el periodo temporal de las vibraciones de E. En lugar de medir la amplitud del campo, se puede medir un promedio temporal del cuadrado del campo, es decir, la energía media por unidad de tiempo por unidad de área. El tiempo empleado para hacer el promedio está determinado por la respuesta del detector. 120 · Polarización Los tiempos de respuesta de los detectores son de varios órdenes de magnitud del periodo temporal. Formalmente, el valor medio de la energía se calcula a partir del vector de Poynting S = E × H. (2.19) De la ortogonalidad mutua entre E , H y k, teniendo en cuenta la eq. (2.13), el vector de Poynting se puede escribir como 1 (E · E)k, 𝜇0𝜔 (2.20) 1 (E · E)ŝ = 𝜖 0 c(E · E)ŝ. 𝜇0c (2.21) S= y, ya que 𝜔/k = c, se tiene que S= Esta ecuación indica que la dirección en la que fluye la energía es normal al frente de onda, ya que ŝ es el vector unitario que define la normal del frente de onda. Este resultado también es válido en medios dieléctricos (isotrópicos). La irradiancia se define entonces como I = hSiŤ , (2.22) donde S = |S|. hi denota el valor medio de la función2 y Ť el tiempo de integración (detección). Reemplazando la eq. (2.21) en la eq. (2.22), la irradiancia será ∫Ť /2 𝜖 0c I= (E · E)dt. (2.23) Ť −Ť /2 En particular, para una función periódica, el valor promedio se toma con respecto al periodo de la señal. De modo que para la onda plana armónica la irradiancia será ∫T /2 𝜖 0c (E · E)dt, (2.24) I= T −T /2 donde T = 1/𝜈 es el periodo de la onda. Si la onda plana armónica está dada por E = E0 cos(kr · ŝ − 𝜔t), 2 El valor medio de la función f durante el tiempo 𝜏 se define como h f i = 1𝜏 (2.25) 𝜏/2 ∫ −𝜏/2 f dt. Polarización · 121 la irradiancia será 1 I = 𝜖 0 c(E0 · E0 ) T ∫T /2 cos2 (kr · ŝ − 𝜔t)dt. (2.26) −T /2 El valor medio de la función coseno cuadrado en un periodo es igual a 1/2, por lo tanto 𝜖 0c 2 𝜖 0c (E0 · E0 ) = E0 . I= (2.27) 2 2 Otra forma muy común para representar la onda plana armónica, que también emplearemos en el libro, es mediante la función exponencial compleja. Supongamos que la onda está dada por E = E0 e i (kr·ŝ−𝜔t) , (2.28) donde la amplitud E0 también es compleja y kE0 k = E0 . En este caso, la irradiancia se debe definir como 𝜖 0c I= 2T ∫T /2 (E · E∗ )dt, (2.29) −T /2 donde E∗ es el conjugado de E. De esta manera, se garantiza que el valor de la irradiancia sea igual al que se obtiene si la onda se representa como una función coseno (o seno). Reemplazando la eq. (2.28) en la eq. (2.29), la irradiancia será 𝜖 0c I= (E0 · E∗0 ). (2.30) 2 2.1.3. Luz natural y luz polarizada Ya que E y H están en fase y se relacionan según la eq. (2.17), en lo que sigue, para referirnos a la propagación del campo óptico, solo tomaremos en cuenta el vector E. Supongamos que el campo E es el resultado de ondas planas monocromáticas emitidas por los osciladores que componen una fuente luminosa. Simplificando el modelo, vamos a suponer también que las ondas se propagan en la dirección z, por lo que en un instante dado de tiempo en un plano (x, y) a la distancia z tenemos que el campo E se puede escribir como n o E(x, y, z; t) = |Eox | e i𝛿x e i (kz−𝜔t) , Eoy e i𝛿y e i (kz−𝜔t) . (2.31) La amplitud de cada una de las componentes del campo tiene un término de fase (𝛿 x y 𝛿 y ), de modo que su diferencia permite medir el retraso de 122 · Polarización una componente con respecto a la otra. Si fijamos el plano z = z0 para observar el vector resultante a medida que transcurre el tiempo, el resultado estará determinado por la manera como evoluciona la diferencia de las fases Δ𝛿 = 𝛿 y − 𝛿 x . Lo anterior depende de la naturaleza de la fuente. Por lo general, las oscilaciones en las fuentes son tales que Δ𝛿 es una variable aleatoria. En consecuencia, no podemos predecir cómo evoluciona el vector E en el tiempo (qué amplitud y dirección tiene en un tiempo dado). Decimos que este tipo de fuentes, muy comunes en la naturaleza, emite luz natural o no-polarizada. Pero si Δ𝛿 se mantiene estable en el tiempo, es decir Δ𝛿 = constante, entonces es posible determinar cómo evoluciona el vector E. En este último caso, diremos que la luz está polarizada. 2.1.4. Polarización elíptica, circular y lineal La luz polarizada implica que, dadas dos componentes para el campo E, la diferencia de fase de las amplitudes de las componentes es una constante. Dependiendo del valor de esta diferencia, el vector eléctrico evoluciona confinado en un plano o siguiendo una elipse (círculo). En el primer caso, se tiene polarización lineal, en el segundo, polarización elíptica (circular) a izquierda o derecha. Para ver esto, vamos a considerar un ejemplo. Supongamos que E(x, y, z; t) = Eox , Eoy e i (kz−𝜔t) , (2.32) con Eox = |Eox | e i0 y Eoy = Eoy ei 𝜋/2 . (2.33) Es decir, 𝛿 x = 0 y 𝛿 y = 𝜋/2. Por lo tanto, Δ𝛿 = 𝜋/2. Primero, vamos a ver cómo se observa el extremo del vector eléctrico proyectado en un plano, digamos z = 0. Entonces, las componentes de E toman la forma Ex = |Eox | e −i2𝜋t/T , (2.34) Ey = Eoy e −i (2𝜋t/T −𝜋/2) . (2.35) Si consideramos cada componente como un fasor, es decir, un vector rotatorio de radio |Eox | ( Eoy ) y fase 𝛿 x (𝛿 y ), gráficamente cada componente se verá como se ilustra en la fig. 2.4(a). La componente y (en la parte superior izquierda), en t = 0, inicia con un desfase de 𝜋/2, esto es en el punto 1. Por su parte, la componente x (en la parte de abajo), en t = 0, inicia con un desfase de 0, lo que también se indica con el punto 1. Al aumentar el tiempo, en particular para t = T /4, T /2, 3T /4 y 2T , los fasores para x y y tendrán las posiciones indicadas por los puntos 2, 3, 4 y 5, respectivamente. Las proyecciones de los puntos 1, 2, 3, 4 y 5 en dirección vertical Polarización · 123 para el fasor en x y en dirección horizontal para el fasor en y se intersecan en la región rectangular sombreada de lados 2 |Eox | y 2 Eoy . El lugar geométrico de las intersecciones describe la evolución del vector eléctrico en el tiempo, como se muestra en la parte superior derecha de la fig. 2.4(a). En el ejemplo, la trayectoria es una elipse, ya que |Eox | > Eoy , y se va construyendo siguiendo la dirección contraria a las manecillas del reloj. En este caso, se dice que se tiene polarización elíptica a izquierda. El sentido contrario de la trayectoria (en la dirección de las manecillas del reloj) se obtiene si Δ𝛿 = −𝜋/2, entonces se dice que se tiene polarización elíptica a derecha. En particular, si |Eox | = Eoy , la trayectoria es un círculo, tendremos, pues, polarización circular a izquierda o derecha. y y 2 1 5 2 90° 5 1 3 E oy 3 4 x y x 4 1 4 d y = 90° l0 4 t1= 0 t 2= T/ 4 E ox 3 3 5 1 2l 0 2 3l 0 4l 0 Z x t 3= T/ 2 t 4= 3T/ 4 2 t 5= T d x= 0 (a) (b) Figura 2.4. Polarización elíptica a izquierda. (a) Extremo del vector eléctrico proyectado en un plano fijo (z = 0). Se observa que el extremo del vector gira en la dirección contraria a las manecillas del reloj. (b) Evolución espacial (t = 0) del vector eléctrico. Se observa que el extremo del vector describe una hélice que avanza en la dirección de z en la dirección de las manecillas del reloj. Si ahora observamos cómo evoluciona en el espacio el vector eléctrico, se ve algo diferente. Fijando el tiempo en t = 0, las componentes de E toman la forma Ex = |Eox | e i2𝜋z/𝜆 , (2.36) Ey = Eoy e i (2𝜋z/𝜆 +𝜋/2) . (2.37) Para la parte real, en z = 0, E = {|Eox | , 0}; en z = 𝜆 /4, E = 0, − Eoy ; en z = 𝜆 /2, E = {− |Eox | , 0}; en z = 3𝜆 /4, E = 0, Eoy ; y finalmente, en z = 𝜆 , E = {|Eox | , 0}. Lo anterior se ilustra en la Fig 2.4(b) con las flechas. En este caso, la trayectoria que sigue el extremo del vector eléctrico es una · 124 Polarización hélice que avanza en la dirección de las manecillas del reloj. Por supuesto, las dos imágenes son equivalentes. En efecto, si en (b) nos fijamos cómo van llegando los extremos del vector eléctrico al plano z = 0, tendremos la trayectoria dada en (a). Cuando Δ𝛿 = 0, la trayectoria que se observa del extremo del vector eléctrico en un plano fijo (z = 0) es una línea recta inclinada un ángulo arctan( Eoy /|Eox |), como se muestra en la fig. 2.5(a). La extensión de la línea está limitada por el rectángulo de lados 2 |Eox | y 2 Eoy . Este es el caso de polarización lineal. y y 1 5 1 5 E oy 4 2 3 x 4 2 E x 3 d y = 0° l0 4 t1= 0 t 2= T/ 4 y E ox 3 5 1 2l 0 3l 0 4l 0 Z x t 3= T/ 2 t 4= 3T/ 4 2 t 5= T d x= 0 (a ) (b) Figura 2.5. Polarización lineal, cuando las dos componentes están en fase. (a) La trayectoria del extremo del vector eléctrico es una línea recta limitada por la región rectángular de lados 2 |Eox | y 2 Eoy , inclinada un ángulo tan−1 ( Eoy /|Eox |). (b) El campo E está confinado en un plano inclinado un ángulo tan−1 ( Eoy /|Eox |) y avanza armónicamente. Si se observa la evolución espacial del vector eléctrico, se tendrá que el campo E vibra armónicamente confinado en un plano inclinado el ángulo arctan( Eoy /|Eox |), como se ilustra en la fig. 2.5(b). 2.1.5. Polarización: caso general En la sección anterior, se mostró el caso de la polarización elíptica a izquierda y polarización lineal, que resultan de las diferencias de fase Δ𝛿 = 𝜋/2 y Δ𝛿 = 0. Sin embargo, el valor de Δ𝛿 puede ser cualquiera (pero constante). En general, el estado de polarización de una onda electromagnética está Polarización · 125 dado por una elipse rotada Ex2 |Eox | 2 −2 Ey2 E x Ey cos(Δ𝛿) + = sin2 (Δ𝛿), 2 |Eox | Eoy Eoy como se muestra en la fig. 2.6. (2.38) y y 2 E oy x 2 E ox Figura 2.6. Elipse de polarización en el caso general. La elipse sigue confinada en el rectángulo de lados 2 |Eox | y 2 Eoy y el ángulo de rotación 𝜓 de la elipse se determina a partir de tan(2𝜓) = tan(2𝛼) cos(Δ𝛿), (2.39) donde tan 𝛼 = Eoy . |Eox | (2.40) El signo de sin(Δ𝛿) indica el sentido de la polarización. Si sin(Δ𝛿) > 0, la polarización es a izquierda; si sin(Δ𝛿) < 0, la polarización es a derecha. En el apéndice F se muestra el desarrollo completo para obtener las eqs. (2.38), (2.39) y (2.40). Caso 1. Δ𝛿 = m𝜋; m = 0, ±1, ±2,..., La eq. (2.38) queda Ex2 |Eox | 2 − 2(−1) m Ey2 E x Ey + = 0, 2 |Eox | Eoy Eoy (2.41) que es igual a Ey Ex − (−1) m |Eox | Eoy !2 = 0. (2.42) 126 · Polarización Lo que representa la línea recta Ey = (−1) m (tan 𝛼)Ex , (2.43) es decir, polarización lineal con el plano de vibración inclinado el ángulo ±𝛼. Caso 2. Δ𝛿 = (2m − 1)𝜋/2; m = 0, ±1, ±2,..., La eq. (2.38) queda Ex2 |Eox | 2 + Ey2 Eoy 2 = 1. (2.44) Lo que representa una elipse con sus ejes mayor y menor orientados con los ejes x (Ex ) y y (Ey ). Entonces, se tiene polarización elíptica a izquierda o derecha. En particular, si |Eox | = Eoy se tiene polarización circular a izquierda o derecha. Caso 3. Δ𝛿 ≠ m𝜋 , (2m − 1)𝜋/2. Para desfases diferentes a los tratados en los casos 1 y 2, se tiene polarización elíptica, cuya elipse está rotada de acuerdo con las eqs. (2.39) y (2.40). Dd = 0 Dd = p/4 Dd = p/2 Dd = 3p/4 Dd = p E+45 EL EL EL E-45 Eox = Eoy Dd = 5p/4 Dd = 3p/2 Dd = 7p/4 Dd = 2p ER ER ER E+45 2 E oy 2 E ox Figura 2.7. Estados de polarización para varios desfases con |Eox | = Eoy . Ejemplo. Para ilustrar las situaciones mencionadas en los tres casos, supongamos que tenemos un campo óptico con |Eox | = Eoy y Δ𝛿 = 0, 𝜋/4, 𝜋/2, 3𝜋/4, 𝜋 , 5𝜋/4, 3𝜋/2, 7𝜋/4 y 2𝜋. En este ejemplo, ya que tan 2𝛼 = ∞, el ángulo de rotación de la elipse general estará dado por Polarización · 127 tan 2𝜓 = ±∞, donde el signo lo determina el signo de cos(Δ𝛿). En otras palabras, el ángulo de rotación de la elipse será 𝜓 = 45◦ , si (0 ≤ Δ𝛿 < 𝜋/2) ∪ (3𝜋/2 < Δ𝛿 ≤ 2𝜋) y 𝜓 = −45◦ , si 𝜋/2 < Δ𝛿 < 3𝜋/2. En la fig. 2.7, se muestra los estados de polarización para los desfases mencionados. E+45 denota polarización lineal con el plano de vibración a 45◦ ; E−45 denota polarización lineal con el plano de vibración a −45◦ ; EL denota polarización elíptica o circular a izquierda; ER denota polarización elíptica o circular a derecha. Por otra parte, 𝛼 = 0 define un estado de polarización lineal horizontal (EH ) y 𝛼 = 90◦ define un estado de polarización lineal vertical (EV ). 128 · Polarización 2.2. Polarización por dicroísmo Una manera de eliminar una de las componentes del campo E es mediante absorción de esa componente. Esto se puede lograr mediante el diseño de un dispositivo que realice esta tarea o mediante un material natural que tenga esta propiedad [13]. En cualquier caso, a la absorción selectiva de una de las componentes del campo E se le denomina Dicroísmo. El efecto final sobre el campo será obtener luz linealmente polarizada. 2.2.1. Polarizador lineal Para ver cómo funciona un polarizador lineal basado en dicroísmo, supongamos que se construye una malla de alambres conductores, como se muestra en la fig. 2.8, y un campo E no-polarizado (luz natural) incide en dirección ortogonal al plano de la malla. Ya que en la dirección horizontal (a lo largo de los alambres) las cargas eléctricas tienen la posibilidad de un mayor desplazamiento en comparación con la dirección vertical (sección transversal de los alambres), se tendrá mayor absorción de energía eléctrica en la dirección de los alambres, por lo que la componente neta Ex experimenta una mayor atenuación que la componente neta Ey . Si, idealmente, se atenua completamente la componente Ex , tendremos un polarizador lineal y el campo transmitido tendrá un estado de polarización lineal vertical, EV . A la dirección en la que no se atenúa el campo, se le denomina eje de transmisión del polarizador lineal. Ey Ex y x Luz natural EV Figura 2.8. Polarizador lineal hecho con una rejilla de alambres conductores. Polarización · 129 Polarizadores basados en una malla de alambres conductores para el espectro visible se fabrican por métodos litográficos, logrando arreglos con una separación de 100 nm entre alambres. Los microalambres de aluminio se depositan sobre sustratos de vidrio. Los polarizadores lineales dicroicos más comunes se fabrican en láminas de un plástico especial (alcohol polivinílico) transparente. Estas láminas se han estirado en una dirección para alinear sus largas moléculas que luego se recubren con yodo. De esta manera, se obtiene algo semejante al arreglo de alambres de la fig. 2.8, pero a nivel microscópico (polarizadores tipo H). Coeficiente de extinción y grado de polarización. En la práctica, no se logra atenuar completamente la componente ortogonal al eje de transmisión del polarizador y tampoco se logra transmitir completamente la componente paralela al eje de transmisión del polarizador. Si representamos el polarizador lineal, como en la fig. 2.9, y descomponemos el campo resultante que incide en el polarizador en una componente paralela al eje de transmisión, Eq , y en una componente ortogonal al eje de transmisión, E⊥ , entonces el campo incidente será E = {Eq , E⊥ } e i (kz−𝜔t) . E (2.45) E y E' Luz natural Eje de transmisión E' x PL Figura 2.9. En un polarizador real, no se transmite el 100 % de la componente paralela al eje de transmisión y no se anula completamente la componente ortogonal al eje de transmisión. 130 · Polarización Para caracterizar el polarizador lineal teniendo en cuenta la absorción de las componentes Eq y E⊥ , se definen dos cantidades: el coeficiente de extinción tq t⊥ (2.46) tq − t⊥ , tq + t⊥ (2.47) 𝜌P = y el grado de polarización PP = donde tq = Eq0 /|Eq | es la fracción transmitida de la componente paralela al eje de transmisión y t⊥ = E⊥0 /|E⊥ | es la fracción transmitida de la componente ortogonal al eje de transmisión. Usualmente, la extinción se da como 𝜌 P : 1. También se emplea la transmitancia del polarizador, definida como la fracción de la intensidad de luz linealmente polarizada paralela al eje de transmisión que es transmitida por el polarizador, T = tq2 . Por ejempo, en las características técnicas de los polarizadores lineales dicroicos de una empresa se dice: Tabla 2.1. Especificaciones técnicas. Ancho de banda (nm) Extinción Transmisión ( %) Calidad óptica 100 - 1000 102 - 106 > 50 , < 90 𝜆 /5 - 𝜆 /2 El ancho de banda nos dice el rango espectral para el cual el coeficiente de extinción y la transmisión se mantienen de acuerdo al valor nominal. Una extinción de 100:1 corresponde con un polarizador de baja calidad, mientras que un polarizador de extinción 1000000:1 es de alta calidad. Por otro lado, una transmisión cercana al 100 % se refiere a un polarizador de alta calidad. Finalmente, la calidad óptica de la lámina polarizadora se refiere a la máxima distorsión que la lámina genera en un frente de onda plano una vez que pasa por el polarizador. 2.2.2. Ley de Malus La combinación de varios polarizadores lineales permite controlar no solo el estado de polarización resultante sino la irradiancia. Supongamos que disponemos de varios polarizadores lineales ideales, es decir, con 𝜌 P = ∞ y PP = 1. En la fig. 2.10, se muestra una configuración con dos polarizadores donde sus ejes de transmisión forman un ángulo 𝜃. El primer polarizador Polarización · 131 recibe luz natural. El segundo recibe luz linealmente polarizada vibrando en planos paralelos al eje de transmisión del primer polarizador y transmite luz linealmente polarizada, pero cambiando la orientación de los planos de vibración paralelos al eje de transmisión del segundo polarizador. E E E' E'' I0 I' = I0 2 q I'' = I' cos2q Figura 2.10. Ley de Malus. Para determinar la irradiancia que se obtiene al final del segundo polarizador, supongamos que la irradiancia de la luz natural es I0 . Esta irradiancia es el valor medio del flujo de energía por unidad de área, que emiten los osciladores que forman la fuente luminosa. Los osciladores están orientados de manera aleatoria y emiten trenes de ondas electromagnéticas de corta duración (10−8 s). Observando las ondas planas (a gran distancia del oscilador), cada tren de ondas estará linealmente polarizado. Por lo tanto, se tendrá una superposición de trenes de onda con diferentes fases iniciales (origen temporal) y con diferentes planos de vibración aleatorios. Ya que el tiempo de integración es mucho mayor que la duración de los trenes de onda, no es posible predecir el estado de polarización. En un tiempo dado, tendremos un vector resultante para el campo E, tiempo después, habrá cambiado de orientación y amplitud aleatoriamente. Sin embargo, podemos definir un vector promedio en una dirección dada. Ya que el proceso es aleatorio, tendremos que, para otra dirección, se tendrá un vector promedio con la misma amplitud del primero. En consecuencia, si descomponemos el vector E resultante que incide en el primer polarizador, en una componente paralela al eje de transmisión y otra ortogonal al eje de transmisión (eq. (2.45)), se tiene que 𝜖 0c {Eq , E⊥ } · {Eq , E⊥ }∗ , I0 = (2.48) 2 132 · Polarización que es igual a 𝜖 0c |Eq | 2 + |E⊥ | 2 . (2.49) 2 Y, de acuerdo con lo mencionado antes para la luz natural, |Eq | = |E⊥ |, entonces 𝜖 0c I0 = (2.50) 2 |Eq | 2 . 2 Después del primer polarizador se tiene que Eq0 = Eq por lo tanto la irradiancia transmitida será I0 = I0 = 𝜖 0 c 0 2 I0 Eq = . 2 2 (2.51) Finalmente, después del segundo polarizador tenemos que Eq00 = Eq0 cos 𝜃, la irradiancia transmitida será I 00 = 𝜖 0 c 00 2 𝜖 0 c 0 2 Eq = Eq cos2 𝜃 , 2 2 (2.52) es decir, I 00 = I 0 cos2 𝜃 . (2.53) Esta expresión, conocida como ley de Malus, nos dice que cuando colocamos dos polarizadores lineales, uno detrás del otro, con sus ejes de transmisión paralelos entre sí, el segundo polarizador transmite el 100 % de la luz linealmente polarizada que emerge del primer polarizador (I 00 = I0 /2); y cuando colocamos dos polarizadores lineales, uno detrás del otro, con sus ejes de transmisión ortogonales entre sí, el segundo polarizador transmite el 0 % de la luz linealmente polarizada que emerge del primer polarizador (I 00 = 0). Para otras orientaciones de los ejes de transmisión, la transmitancia tendrá un valor en el rango 0 < I 00 < I 0, de acuerdo con la eq. (2.53). En otras palabras, el sistema de dos polarizadores de la fig. 2.10 es un dispositivo atenuador de la irradiancia (que también gira el plano de vibración del campo E transmitido). Polarización · 133 2.3. Polarización por reflexión Otra manera de generar luz linealmente polarizada a partir de luz natural es mediante la reflexión en una superficie lisa (espejo) en un ángulo apropiado (ángulo de Brewster). Para determinar este ángulo, se observa cómo cambia la amplitud de la onda reflejada en función del ángulo de incidencia. Lo anterior depende de las condiciones de frontera para las ondas incidente, reflejada y transmitida en la superficie. Las condiciones de frontera se deben satisfacer tanto para las fases como para las amplitudes de las ondas. De las condiciones de frontera para las fases, se obtienen las leyes de la reflexión y de la refracción (ley de Snell), y de las condiciones de frontera para las amplitudes de las ondas se obtienen las ecuaciones de Fresnel. A partir de estas ecuaciones, se establece la condición para obtener luz linealmente polarizada. 2.3.1. Leyes de la reflexión y la refracción Consideremos primero la vibración con frecuencia 𝜈 del campo E en un punto de espacio, dada por la expresión E(t) = E0 e −i2𝜋 𝜈t . (2.54) Supongamos que el punto de observación está sumergido en un medio dieléctrico homogéneo de índice de refracción n, entonces la velocidad (de fase) con que se propaga la onda progresiva será 𝜐 = c/n, donde c es la velocidad de la luz. La expresión para la onda progresiva plana y armónica en la dirección del vector unitario ŝ resulta ŝ · r E(r, t) = E0 exp −i2𝜋 𝜈 t − , (2.55) 𝜐 que se puede reescribir como ŝ · r E(r, t) = E0 exp i2𝜋 𝜈 n −t c o ŝ · r E(r, t) = E0 exp i 2𝜋n − 2𝜋 𝜈t . 𝜆 (2.56) (2.57) Definiendo el vector de onda en un medio de índice de refracción n como 2𝜋 k= nŝ, (2.58) 𝜆 134 · Polarización la onda plana queda E(r, t) = E0 e i (k·r−𝜔t) , (2.59) con k dado por la eq. (2.58). En un medio dieléctrico homogéneo, las ecuaciones de Maxwell se escriben como están en la sección 2.1.1, pero cambiando 𝜖 0 por 𝜖 , 𝜇 0 por 𝜇 y el vector de onda k de acuerdo con la eq. (2.58). Con estos cambios, la ecuación de onda resulta ser ∇2 E = 1 𝜕2E , 𝜐 2 𝜕t 2 (2.60) √ con 𝜐 = 1/ 𝜖 𝜇 (ver apéndice B). Si ahora suponemos que tenemos una interfase (superficie plana) que separa dos medios de índices de refracción ni y nt , y una onda plana viajando en el medio de índice ni e incidiendo en la interfase, tendremos entonces una onda plana reflejada y una onda plana transmitida (o refractada). Sea ŝi , ŝr y ŝt los vectores unitarios que indican la dirección de propagación de las ondas planas incidente, reflejada y transmitida, respectivamente, en un punto de la interfase localizado con el vector r, tendremos que las ondas incidente, reflejada y transmitida estarán dadas por Ei (r, t) = E0i e i (ki ·r−𝜔t) , (2.61) Er (r, t) = E0r e i (kr ·r−𝜔t+𝜀r ) , (2.62) Et (r, t) = E0t e i (kt ·r−𝜔t+𝜀t ) , (2.63) con ki = (2𝜋/𝜆 )ni ŝi , kr = (2𝜋/𝜆 )nr ŝr y kt = (2𝜋/𝜆 )nt ŝt . Usualmente, las ondas reflejada e incidente están en el mismo medio de la onda incidente, entonces, nr = ni . Los términos de fase constante 𝜀 r y 𝜀 t dan cuenta de los desfases de las ondas reflejada y transmitida con respecto a la onda incidente en el punto r de la interfase. Igualando las variaciones de la fase para las tres ondas se tiene ki · r = kr · r + 𝜀 r = kt · r + 𝜀 t . (2.64) Esta doble igualdad implica que los vectores ki , kr y kt son coplanares. En la fig. 2.11, se muestra los vectores unitarios ŝi , ŝr y ŝt , junto con el vector normal unitario ûn de la interfase en el punto de incidencia. La interfase corresponde con el plano xz y el plano que contiene los vectores ŝi , ŝr y ŝt corresponde con el plano xy y se denomina plano de incidencia. Los ángulos de incidencia 𝜃 i , reflexión 𝜃 r y transmisión 𝜃 t , se miden con respecto a la normal de la interfase en el punto de incidencia. Polarización · 135 y ni nt si qi un qr sr st x qt Figura 2.11. Vectores unitarios correspondientes a las direcciones de propagación de las ondas planas incidente, reflejada y transmitida. Ley de la reflexión De la eq. (2.64), se tiene para la onda reflejada (ki − kr ) · r = 𝜀 r , (2.65) es decir, (kr − ki ) es paralelo al vector normal unitario de la interfase. Así, (ki − kr ) k ûn . (2.66) 2𝜋 ni (ŝi − ŝr ) × ûn = 0, 𝜆 (2.67) ŝr × ûn = ŝi × ûn , (2.68) sin 𝜃 r = − sin 𝜃 i , (2.69) Por lo tanto, y de donde se obtiene que es la ley de la reflexión, 𝜃 r = −𝜃 i . 2.3.1.1. Ley de la refracción De la eq. (2.64), se tiene para la onda transmitida (ki − kt ) · r = 𝜀 t , (2.70) por lo que el vector (kt − ki ) también es paralelo al vector normal unitario de la interfase. Así, (ki − kt ) k ûn . (2.71) 136 · Polarización Por lo tanto, 2𝜋 (ni ŝi − nt ŝt ) × ûn = 0, 𝜆 (2.72) nt ŝt × ûn = ni ŝi × ûn , (2.73) nt sin 𝜃 t = ni sin 𝜃 i , (2.74) y de donde se obtiene que es la ley de la refracción o ley de Snell. Note que la eq. (2.71) implica que ni ŝi − nt ŝt = Γûn , (2.75) lo que resulta ser la forma vectorial de la construcción geométrica mostrada en la fig. 1.9(b), donde Γ es la longitud del lado BC. 2.3.2. Ecuaciones de Fresnel Consideremos ahora las condiciones de frontera para las amplitudes de las ondas incidente, reflejada y transmitida. Ya que estamos tratando con medios dieléctricos (sin absorción), se satisface que en la interfase la componente tangencial de los campos E y H son continuas. Conviene, entonces, descomponer los vectores E y H en una componente ortogonal al plano de incidencia y en una componente paralela al plano de incidencia, como se muestra en la fig. 2.12. y y Hi Ei Hr Ei si sr un Er qi q r Er Hi si ni sr un Hr qi qr ni x qt Ht Et (a) nt x nt qt Et Ht st st (b) Figura 2.12. Componentes paralela y ortogonal de los campos E y H con respecto al plano de incidencia. E⊥ En la fig. 2.12(a), se toma la componente ortogonal del campo eléctrico y su correspondiente campo magnético Hq , y en la fig. 2.12(b), se toma Polarización · 137 la componente paralela del campo eléctrico Eq y su correspondiente campo magnético H⊥ . Teniendo en cuenta la orientación a derecha de los campos E y H mostrados en la fig. 2.2, la representación gráfica de las componentes normales en dirección positiva se hace mediante un círculo con una cruz para indicar que el vector se dirige entrando al plano del papel (alejándose del lector) y la representación gráfica de las componentes normales en dirección negativa se hace mediante un círculo con un punto central para indicar que el vector sale del plano del papel (hacia el lector). Para las componentes paralelas, se tienen a su vez componentes en la dirección x y en la dirección y. Los vectores deben tener su origen en el punto de incidencia, pero en aras de la claridad de los diagramas se han dibujado a cierta distancia del punto de incidencia. Las orientaciones de los vectores reflejado y transmitido pueden cambiar de acuerdo con los corrimientos de fase que experimenten estas componentes en la interfase (como veremos más adelante). El estado de polarización del campo E⊥ se suele llamar polarización “TE” (campo eléctrico transversal) o polarización “s”y el estado de polarización del campo Eq se suele llamar polarización “TM” (campo magnético transversal) o polarización “p”. Con estas componentes, las amplitudes de los campos eléctricos se escriben E0i = Ei⊥ , Eiq , (2.76) E0r = Er⊥ , Erq , (2.77) ⊥ q E0t = Et , Et , (2.78) y los campos magnéticos se escriben H0i = Hi⊥ , Hiq , H0r = Hr⊥ , Hrq , H0t = Ht⊥ , Htq . (2.79) (2.80) (2.81) Teniendo en cuenta la eq. (2.18) para un medio dieléctrico homogéneo, en cada caso se satisface que H q = 𝜖 𝜐E ⊥ (2.82) y H ⊥ = 𝜖 𝜐E q . (2.83) Aplicando las condiciones de frontera para las componentes de los campos, tenemos que para el estado de polarización TE (fig. 2.12(a)) Ei⊥ + Er⊥ = Et⊥ , (2.84) 138 · Polarización Hiq cos 𝜃 i − Hrq cos 𝜃 r = Htq cos 𝜃 t . (2.85) Y la eq. (2.85) se puede reescribir como 𝜖 i 𝜐i Ei⊥ cos 𝜃 i − 𝜖 i 𝜐i Er⊥ cos 𝜃 i = 𝜖 t 𝜐t Et⊥ cos 𝜃 t (2.86) empleando la eq. (2.82) y la ley de la reflexión. Usando el hecho que en un material dieléctrico (no magnético) la permeabilidad magnética se puede aproximar por la del vacío, si multiplicamos la eq. (2.86) por 𝜇 0 c, luego, en el lado izquierdo de la igualdad, se cambia 𝜇 0 por 𝜇 i y, en el lado derecho de la igualdad, se cambia 𝜇 0 por 𝜇 t , se llega a ni Ei⊥ cos 𝜃 i − ni Er⊥ cos 𝜃 i = nt Et⊥ cos 𝜃 t . (2.87) Dado el campo incidente, las eqs. (2.84) y (2.87) constituyen un sistema de dos ecuaciones con dos incógnitas, a saber: Er⊥ y Et⊥ . Resolviendo este sistema de ecuaciones para cada una de las incógnitas, se llega a Er⊥ = ni cos 𝜃 i − nt cos 𝜃 t ⊥ E ni cos 𝜃 i + nt cos 𝜃 t i (2.88) Et⊥ = 2ni cos 𝜃 i E⊥ . ni cos 𝜃 i + nt cos 𝜃 t i (2.89) y Si ahora aplicamos las condiciones de frontera para las componentes en el estado de polarización TM (fig. 2.12(b)), tenemos −Hi⊥ − Hr⊥ = −Ht⊥ , (2.90) Eiq cos 𝜃 i − Erq cos 𝜃 r = Etq cos 𝜃 t . (2.91) Usando la eq. (2.83) para escribir la eq. (2.90) en términos de las componentes paralelas de E, siguiendo un procedimiento análogo al empleado en el caso de polarización TE para resolver el sistema de ecuaciones, se llega a Erq = nt cos 𝜃 i − ni cos 𝜃 t q E nt cos 𝜃 i + ni cos 𝜃 t i (2.92) Etq = 2ni cos 𝜃 i Eq . nt cos 𝜃 i + ni cos 𝜃 t i (2.93) y Las eqs. (2.88), (2.89), (2.92) y (2.93) son las ecuaciones de Fresnel. Los coeficientes que multiplican a Ei⊥ y Eiq en el lado derecho de estas ecuaciones determinan la fracción de la amplitud de las componentes del campo eléctrico que se refleja y se transmite en la interfase. Estos coeficientes son Polarización r⊥ (= rs ) = Er Ei Et Ei Et tq (= tp ) = Ei t⊥ (= ts ) = , ⊥ para el estado de polarización TE, y Er rq (= rp ) = , Ei q , · 139 (2.94) ⊥ , (2.95) q para el estado de polarización TM. Entonces para la onda reflejada en la interfase, las amplitudes de cada componente son Er⊥ = r⊥ Ei⊥ y Erq = rq Eiq , donde r⊥ = ni cos 𝜃 i − nt cos 𝜃 t , ni cos 𝜃 i + nt cos 𝜃 t (2.96) nt cos 𝜃 i − ni cos 𝜃 t . (2.97) nt cos 𝜃 i + ni cos 𝜃 t Para la onda transmitida en la interfase, las amplitudes de cada componente son Et⊥ = t⊥ Ei⊥ y Etq = tq Eiq , donde rq = t⊥ = 2ni cos 𝜃 i , ni cos 𝜃 i + nt cos 𝜃 t (2.98) 2ni cos 𝜃 i . (2.99) nt cos 𝜃 i + ni cos 𝜃 t En la fig. 2.13, se muestra el comportamiento de los coeficientes de reflexión r⊥ y rq y de transmisión t⊥ y tq en función del ángulo de incidencia 𝜃 i cuando los índices de refracción son ni = 1.0 (aire) y nt = 1.5 (vidrio). tq = 1.0 0.8 t Coeficientes de Fresnel 0.6 0.4 r 0.2 qp 0 -0.2 r -0.4 -0.6 56.3° -0.8 -1.0 t 0 10 20 30 40 50 60 Ángulo de incidencia, q i (°) 70 80 90 Figura 2.13. Coeficientes de Fresnel para la reflexión y transmisión en una interfase aire (ni = 1.0) - vidrio (nt = 1.5). El ángulo de polarización es 𝜃 p . 140 · Polarización De la fig. 2.13, se puede establecer los siguientes hechos: - En incidencia normal, 𝜃 i = 0, se tiene la mayor transmisión con t⊥ = 0.8 y tq = 0.8. Para la reflexión, se tiene que rq = 0.2, mientras que para r⊥ = −0.2. El signo negativo en r⊥ indica que en la interfase mientras que el vector incidente apunta entrando al papel, el vector reflejado apunta saliendo del papel. Decimos entonces que la componente ortogonal experimenta un cambio de fase de ±𝜋, así, Er⊥ = 0.2e i±𝜋 Ei⊥ en 𝜃 i = 0. - En incidencia rasante, 𝜃 i → 90◦ , la transmisión tiende cero para las dos componentes. Para la reflexi ón, las dos componentes tienden a −1, es decir, se refleja completamente el campo incidente y cada una de las componentes experimenta un cambio de fase de ±𝜋. - En la reflexión, la componente paralela está en fase en 0 < 𝜃 i < 𝜃 p y experimenta un cambio de fase de ±𝜋 en 𝜃 p < 𝜃 i < 𝜋/2. Para el ángulo 𝜃 i = 𝜃 p , la componente paralela se anula (rq = 0). Lo anterior significa que si hacemos incidir una onda plana electromagnética no-polarizada en una superficie reflectora formando un ángulo de incidencia igual a 𝜃 p , obtendremos en la reflexión una onda linealmente polarizada en el estado de polarización TE. Para encontrar explícitamente el ángulo de polarización 𝜃 p , igualamos a cero el numerador de la eq. (2.97), con 𝜃 i = 𝜃 p . Entonces, nt cos 𝜃 p = ni cos 𝜃 t . (2.100) Cambiando las funciones coseno por funciones seno y empleando la ley de Snell, tenemos q q nt 1 − sin2 𝜃 p = ni 1 − ni2 sin2 𝜃 p /nt2 . (2.101) Elevando al cuadrado y multiplicando por nt2 nt4 − nt4 sin2 𝜃 p = ni2 nt2 − ni4 sin2 𝜃 p , (2.102) sin2 𝜃 p (ni4 − nt4 ) = nt2 (ni2 − nt2 ), (2.103) factorizando, de donde sin 𝜃 p = q nt nt2 + , ni2 (2.104) Polarización · 141 que equivale a nt 𝜃 p = arctan . ni (2.105) Este ángulo también es conocido como ángulo de Brewster.3 En la fig. 2.14, se ilustra la manera de obtener luz linealmente polarizada a partir de luz natural cuando se refleja en una interfase lisa. Cuando el ángulo de incidencia de la luz natural es igual al ángulo de Brewster dado por la eq. (2.105), la componente del campo incidente paralela al plano de incidencia se anula en la reflexión. En consecuencia, solo se refleja la componente ortogonal al plano de incidencia (con un cambio de fase de 𝜋), es decir, se tiene luz linealmente polarizada en el estado de polarización TE. Para el ejemplo de la fig. 2.13, r⊥ = −0.3846. La luz transmitida sigue siendo natural. Las dos componentes del campo incidente son transmitidas con una amplitud similar. Para el ejemplo de la fig. 2.13, tq = 0.6667 y t⊥ = 0.6145. Ei Ei Luz natural normal Et qp qp Er ni nt Interfase Et Luz natural Luz polarizada Figura 2.14. Polarización por reflexión. La componente del campo incidente que es paralela al plano de incidencia se anula en la reflexión cuando el ángulo de incidencia es igual al ángulo de Brewster 𝜃 p . Por supuesto, el ángulo de Brewster depende de la longitud de onda. Por ejemplo, supongamos que la interfase es la cara de una lámina de vidrio 3 David Brewster (1781-1868) fue un científico escocés que realizó investigaciones en la polarización de la luz. En 1815, formuló la ley que lleva su nombre y que permite encontrar el ángulo de polarización. 142 · Polarización BK7 (apéndice C). Los índices de refracción para las longitudes de onda empleadas para caracterizar los vidrios ópticos son nF (𝜆 = 486.13nm) = 1.5223, nd (𝜆 = 587.56nm) = 1.5168 y nC (𝜆 = 656.27nm) = 1.5143. Con estos valores, los ángulos de incidencia para tener la polarización lineal en cada caso son: 𝜃 pF = 56.6991◦ , 𝜃 pd = 56.6038◦ y 𝜃 pC = 56.5604◦ . Estos valores son cercanos entre sí, por lo que en la práctica, con luz blanca, si estamos cerca del ángulo de polarización correspondiente a la longitud de onda central del espectro visible, se podrá observar muy bien el efecto de la polarización por reflexión. Note que incluso el efecto se observa bien si el ángulo de incidencia se aleja unos pocos grados del ángulo de Brewster, ya que el valor de rq se mantiene cerca de cero, como se muestra en la fig. 2.1. 2.3.3. Reflectancia y transmitancia Los coeficientes de reflexión y transmisión miden el cambio en la amplitud de la onda incidente. Para medir la cantidad de energía reflejada y transmitida, empleamos la intensidad e I (eq. (1.64)), es decir, el flujo de energía promedio. En una superficie plana, la intensidad se puede calcular como e I = I (Área). (2.106) Supongamos que la región donde incide el haz luminoso (onda plana) es circular, de área 𝜎. Los haces incidente, reflejado y transmitido estarán contenidos en tubos de sección transversal 𝜎 cos 𝜃 i , 𝜎 cos 𝜃 r y 𝜎 cos 𝜃 t , como se ilustra en la fig. 2.15. ~ Ii ni nt Interfase scosq i scosq r ~ Ir s scosq t ~ It Figura 2.15. Intensidades reflejada y transmitida en una interfase. La reflectancia es el cociente entre la intensidad reflejada y la intensidad incidente, y la transmitancia es el cociente entre la intensidad transmitida y Polarización · 143 la intensidad incidente. Para la reflectancia tenemos R= e (𝜖 r 𝜐r /2) |Er | 2 𝜎 cos 𝜃 r Ir Ir 𝜎 cos 𝜃 r . = = e Ii 𝜎 cos 𝜃 i (𝜖 i 𝜐i /2) |Ei | 2 𝜎 cos 𝜃 i Ii (2.107) Ya que la reflexión ocurre en el mismo medio del haz incidente, y teniendo en cuenta la ley de la reflexión, entonces R = r2, (2.108) donde r = Er /Ei es el coeficiente de reflexión. Para la transmitancia, se tiene que e It It 𝜎 cos 𝜃 t (𝜖 t 𝜐t /2) |Et | 2 𝜎 cos 𝜃 t T= = = e (𝜖 i 𝜐i /2) |Ei | 2 𝜎 cos 𝜃 i Ii Ii 𝜎 cos 𝜃 i (2.109) y, suponiendo que en los materiales dieléctricos que estamos considerando 𝜇 i = 𝜇 0 , 𝜇 t = 𝜇 0 , al multiplicar y dividir por 𝜇 0 c la eq. (2.109) se tiene T= nt cos 𝜃 t 2 t , ni cos 𝜃 i (2.110) donde t = Et /Ei es el coeficiente de transmisión. La conservación de la energía implica R +T = 1 (2.111) si los medios dieléctricos no absorben energía. En el caso de absorción de energía, R + T < 1, y se debe sumar un término de absorción para hacer el balance de energía. Para los estados de polarización TE y TM, las eqs. (2.107) y (2.110) se aplican para cada componente, ortogonal y paralela. Por lo tanto, el balance de energía (suponiendo que no hay absorción) en cada caso será R⊥ + T⊥ = 1, (2.112) para el estado de polarización TE, y Rq + Tq = 1, para el estado de polarización TM. (2.113) 144 · Polarización Reflectancia y transmitancia 1.0 T 0.9 0.8 T 0.7 0.6 0.5 56.3° 0.4 R 0.3 0.2 0.1 0 R qp 0 10 20 30 40 50 60 Ángulo de incidencia, q i (°) 70 80 90 Figura 2.16. Reflectancia y transmitancia para cada una de las componentes, paralela y ortogonal. En la fig. 2.16, se muestra R⊥ , Rq , T⊥ y Tq en función del ángulo de incidencia cuando los índices de refracción son ni = 1.0 (aire) y nt = 1.5 (vidrio). Para cualquier ángulo, se puede verificar que la suma de la reflectancia y la transmitancia es igual a 1. Por ejemplo, si la incidencia se da en el ángulo de Brewster, se tiene que 𝜃 i = 56.3◦ y 𝜃 t = 33.7◦ ; rq = 0, r⊥ = −0.3846, tq = 0.6667 y t⊥ = 0.6145. Note que la suma rq + tq ≠ 1, sin embargo, Rq + Tq = Tq = (1.5 cos(33.7◦ )/cos(56.3◦ )) (0.66672 ) = 1. Otro ejemplo, cuando la incidencia se da con un ángulo 𝜃 i = 0 (incidencia normal a la interfase), los coeficientes son rq = 0.2, r⊥ = −0.2, tq = 0.8 y t⊥ = 0.8. Por lo tanto, la reflectancia y transmitancia resultan Rq = R⊥ = 0.04 y Tq = T⊥ = 1.5(0.8) 2 = 0.96 y nuevamente se cumplen las eqs. (2.112) y (2.113). Es común dar la reflectancia y la transmitancia en porcentaje, multiplicando por 100 %. Por ejemplo, para 𝜃 i = 0 la reflectancia resulta ser el 4 % y la transmitancia el 96 %. Para una superficie óptica de vidrio (ni = 1.0 y nt = 1.5) la energía reflejada con 𝜃 i = 0 es pequeña. Sin embargo, en un sistema de varias lentes la luz transmitida puede reducirse considerablemente. Por ejemplo, en un sistema con tres lentes, la luz debe atravesar 6 interfases, por lo que en primera aproximación la transmitancia total será T 6 = 78, 3 %.4 Por esta 4 Note que en este ejemplo se tienen 3 interfases aire-vidrio y tres interfases vidrio-aire. Denotando con n a el índice del aire y con nv el índice del vidrio, para el primer tipo de interfase la transmitancia es T = (nv /n a )(2n a /(n a + nv )) 2 y para el segundo tipo de interfase la transmitancia es T 0 = (n a /nv )(2nv /(nv + n a )) 2 . Ya que T = T 0 = 4n a nv /(n a + nv ) 2 , entonces la transmitancia total T 3T 03 es igual a T 6 . Este resultado es aproximado, ya que se están omitiendo reflexiones y transmisiones sucesivas en las caras. Sin embargo, estas son contribuciones menores y el resultado final está muy cerca del aproximado. Polarización · 145 razón, los recubrimientos de películas delgadas dieléctricas antirreflectivas son muy comunes en las lentes. Finalmente, vale la pena comentar cómo la reflectancia se acerca a 1 cuando el ángulo de incidencia se acerca a 90◦ . Cualquier superficie lisa se comporta como un espejo a incidencia rasante (a la interfase). Incluso esto también ocurre para superficies planas opacas. Por ejemplo, si observamos una hoja de papel en forma rasante, podremos ver muy bien la reflexión especular de la luz. 146 · Polarización 2.4. Polarización por reflexión total interna En la unidad anterior, vimos que las componentes ortogonal y paralela del campo reflejado pueden experimentar un cambio de fase con respecto a las componentes del campo incidente. La componente paralela se refleja en fase, cuando 0 < 𝜃 i < 𝜃 p , y con desfase de ±𝜋, cuando 𝜃 p < 𝜃 i < 𝜋/2. Por otra parte, la componente ortogonal siempre se refleja con un desfase de ±𝜋. Lo anterior, junto con el cambio de amplitud de las componentes reflejadas, implica que una onda linealmente polarizada al reflejarse sigue siendo linealmente polarizada, pero con una rotación en el plano de vibración. Cuando ocurre reflexión total interna, las componentes del campo reflejado tienen desfases que varían entre 0 y ±𝜋, y la diferencia de fase entre las componentes ya no está limitada a 0 o ±𝜋. Por lo tanto, la onda reflejada puede tener un estado de polarización elíptico. 2.4.1. Reflexión total interna Si la onda incidente va de un medio de mayor índice a uno de menor índice, a partir de cierto ángulo, denominado ángulo crítico, los coeficientes de reflexión y transmisión obtienen los valores |rq | = |r⊥ | = 1 y tq = t⊥ = 0. En otras palabras, la energía de la onda reflejada es igual a la energía de la onda incidente. En la unidad 1.1, en la fig. 1.11, se ilustra la condición en la que el rayo transmitido es tangencial a la interfase. El ángulo de incidencia para el cual esto ocurre es (eq. (1.5)) nt 𝜃 c = arcsin , ni (2.114) con ni > nt . A partir de este ángulo ocurre el fenómeno de reflexión total interna. Las ecuaciones de Fresnel para ni > nt y 𝜃 i < 𝜃 c se aplican de la misma manera que en el caso de la reflexión externa (ni < nt ) y los únicos cambios de fase de las componentes reflejadas con respecto a las componentes incidentes son 0 ó ±𝜋, como se muestra en la fig. 2.17 para ni = 1.5 y nt = 1.0. Contrario a la reflexión externa (fig. 2.13), la componente ortogonal no experimenta cambio de fase. En cambio, la componente paralela tiene un cambio de fase de ±𝜋 para 0 < 𝜃 i < 𝜃 p0 , y está en fase para 𝜃 p0 < 𝜃 i < 𝜃 c . El ángulo 𝜃 p0 es el ángulo en el que ocurre la polarización por reflexión y se determina mediante tan 𝜃 p0 = (nt /ni ). Este ángulo junto con Polarización · 147 el ángulo de polarización externa satisfacen la relación 𝜃 p + 𝜃 p0 = 𝜋/2. (2.115) 1.0 0.8 Coeficientes de Fresnel 0.6 r 0.4 0.2 0 r -0.2 qc q 'p -0.4 -0.6 33.7° -0.8 -1.0 0 10 20 30 41.8° 40 50 60 Ángulo de incidencia, q i (°) 70 80 90 Figura 2.17. Coeficientes de reflexión para las componentes paralela y ortogonal en la reflexión interna (0 < 𝜃 i < 𝜃 c ) y total interna (𝜃 c < 𝜃 i < 𝜋/2). Pero cuando ni > nt y 𝜃 i > 𝜃 c , los coeficientes de reflexión son cantidades de variable compleja. Parapver esto, notemos quepa partir de la ley de Snell se puede escribir cos 𝜃 t = 1 − (ni /nt ) 2 sin2 𝜃 i = 1 − (sin 𝜃 i /sin 𝜃 c ) 2 , y para 𝜃 i > 𝜃 c , el término dentro de la raíz cuadrada es negativo. Entonces, conviene escribir q i cos 𝜃 t = sin2 𝜃 i − n 2 , (2.116) n √ con i = −1 y n = nt /ni < 1. Así, los coeficientes de reflexión se pueden reescribir como p n 2 cos 𝜃 i − i sin2 𝜃 i − n 2 (2.117) rq = p n 2 cos 𝜃 i + i sin2 𝜃 i − n 2 y p cos 𝜃 i − i sin2 𝜃 i − n 2 r⊥ = . (2.118) p cos 𝜃 i + i sin2 𝜃 i − n 2 En los dos coeficientes, el numerador es el conjugado del denominador, por lo tanto |rq | = |r⊥ | = 1. (2.119) Esto se muestra en la fig. 2.17 para 𝜃 c < 𝜃 i < 𝜋/2. 148 · Polarización Entonces, los coeficientes de reflexión los podemos escribir como rq = |rq | e i𝛿q = e i𝛿q = e −i2𝜙q , (2.120) r⊥ = |r⊥ | e i𝛿⊥ = e i𝛿⊥ = e −i2𝜙⊥ , (2.121) donde p sin2 𝜃 i − n 2 tan 𝜙q = , n 2 cos 𝜃 i p sin2 𝜃 i − n 2 tan 𝜙⊥ = . cos 𝜃 i (2.122) (2.123) En la fig. 2.18, se muestra el comportamiento de los desplazamientos de fase 𝛿q = −2𝜙q y 𝛿⊥ = −2𝜙⊥ de los coeficientes de reflexión paralelo y ortogonal en la reflexión interna 0 < 𝜃 i < 𝜃 c y total interna 𝜃 c < 𝜃 i < 𝜋/2, cuando ni = 1.5 y nt = 1.0. Desplazamientos de fase 0 -p/4 -p/2 d -3p/4 -p 0 10 20 30 q 'p 40 qc 50 d 60 Ángulo de incidencia, q i (°) 70 80 90 Figura 2.18. Desplazamientos de fase de las componentes paralela y ortogonal en la reflexión interna (0 < 𝜃 i < 𝜃 c ) y total interna (𝜃 c < 𝜃 i < 𝜋/2). El estado de polarización de la onda reflejada estará determinado por Δ𝛿 = 𝛿q − 𝛿⊥ . Para el rango 0 < 𝜃 i < 𝜃 c , una onda incidente linealmente polarizada se refleja linealmente polarizada (salvo un cambio en la orientación del plano de vibración). Para el rango 𝜃 c < 𝜃 i < 𝜋/2, la diferencia de las fases se puede determinar a partir de 𝛿q 𝛿⊥ tan − = tan(𝜙⊥ − 𝜙q ), (2.124) 2 2 Polarización · 149 es decir, p p 2 sin 𝜃 i − n 2 /cos 𝜃 i − sin2 𝜃 i − n 2 / n 2 cos 𝜃 i 𝛿q 𝛿⊥ − = tan . 2 2 1 + sin2 𝜃 i − n 2 / n 2 cos2 𝜃 i (2.125) Simplificando, p cos 𝜃 i sin2 𝜃 i − n 2 𝛿q 𝛿⊥ =− − . tan 2 2 sin2 𝜃 i (2.126) Por lo tanto, la diferencia de las fases será, ! p cos 𝜃 i sin2 𝜃 i − n 2 . Δ𝛿 = 𝛿q − 𝛿⊥ = −2 arctan sin2 𝜃 i (2.127) En la fig. 2.19, se muestra la diferencia de los desplazamientos de fase en la reflexión interna 0 < 𝜃 i < 𝜃 c y total interna 𝜃 c < 𝜃 i < 𝜋/2, cuando ni = 1.5 y nt = 1.0. En la figura se puede ver como para la reflexión total interna, la diferencia de fases varía entre 0 y un valor cercano a −𝜋/4. En consecuencia, una onda reflejada en el dominio de la reflexión total interna tendrá un estado de polarización elíptico. q 'p 0 q c q i1 q i2 Dd = d - d -p/4 Dd min = -45.24° (q i = 51.67°) -p/2 q 'p = 33.69° q c = 41.81° q i1 = 50.23° -3p/4 -p q i2 = 53.26° 0 10 20 30 40 50 60 Ángulo de incidencia, q i (°) 70 80 90 Figura 2.19. Diferencia de los desplazamientos de fase de las componentes reflejadas paralela y ortogonal, cuando ni = 1.5 y nt = 1.0. Para determinar el valor mínimo de la diferencia de fases en la reflexión total interna, basta con resolver d(Δ𝛿)/d𝜃 i = 0 para 𝜃 i . El resultado que se 150 · Polarización obtiene para el ángulo de incidencia es sin2 𝜃 i = 2n 2 1 + n2 y el valor mínimo de la diferencia de fases resulta ser 2 n −1 Δ𝛿mı́n = 2 arctan . 2n (2.128) (2.129) Para la fig. 2.19, el mínimo de la diferencia de fases y el ángulo de incidencia correspondiente son Δ𝛿mı́n = −45.24◦ y 𝜃 i = 51.67◦ . Lo anterior nos indica que con una reflexión, en el dominio de la reflexión total interna, cuando ni = 1.5 y nt = 1.0, no es posible obtener una onda con un estado de polarización circular. Una opción para lograr Δ𝛿mı́n = −𝜋/2 es tener un material cuyo índice ni sea√tal que n 2 − 1 = −2n. La solución positiva de esta ecuación es n = −1 + 2 = 0.4142. Suponiendo que nt = 1, entonces ni = 2.4142. Este es un índice muy elevado para un vidrio óptico. Otra opción consiste en mantener un vidrio óptico común y lograr dos reflexiones sucesivas, siempre y cuando la suma de las dos diferencias de fase dé como resultado −𝜋/2. La opción más usada es la que se tiene cuando en cada reflexión se tiene una diferencia de fase de −𝜋/4. En la fig. 2.19, se ilustra con las líneas segmentadas los valores de los ángulos de incidencia para los cuales se obtienen las diferencias de fase de −𝜋/4, estos son: 𝜃 i1 = 50.23◦ y 𝜃 i2 = 53.26◦ . Un elemento óptico que cambia la polarización lineal en circular, basado en la ideas mencionadas anteriormente, es el rombo de Fresnel, como el de la fig. 2.20, con vidrio de índice de refracción 1.5 para el ángulo 𝜃 i2 = 53.26◦ . Supongamos que un haz de luz (que viaja de izquierda a derecha) linealmente polarizado con el plano de vibración a −45◦ con respecto al plano de incidencia (45◦ con respecto a la dirección positiva de la componente ortogonal) incide normalmente en la primera cara. Omitiendo los términos de fase espacial y temporal, el campo en: - (1) se puede escribir como E(1) = e i0 , e i0 E0 . - (2) será n o E(2) = t⊥(2) e i0 , tq(2) e i0 E0 = e i0 , e i0 0.8E0 . Es decir, sigue siendo linealmente polarizado, pero la amplitud de las componentes es 0.8 veces la inicial. Polarización · 151 - (3) será o n E(3) = r⊥(3) t⊥(2) e i0 , rq(3) tq(2) e i0 E0 = e −i (1.2785) , e −i (2.0639) 0.8E0 , es decir, e i0 , e −i 𝜋/4 0.8e −i (1.2785) E0 , lo cual representa un estado de polarización elíptica a derecha. - (4) será o n E(4) = r⊥(4) r⊥(3) t⊥(2) e i0 , rq(4) rq(3) tq(2) ei0 E0 = e −i (2.5570) , e −i (4.1277) 0.8 ×E0 , es decir, e i0 , e −i 𝜋/2 0.8e −i (2.5570) E0 , lo cual representa un estado de polarización circular a derecha. El radio del círculo es 0.8E0 . - (5) será o n E(5) = t⊥(5) r⊥(4) r⊥(3) t⊥(2) ei0 , tq(5) rq(4) rq(3) tq(2) e i0 E0 = e −i (2.5570) , e −i (4.1277) 0.96E0 , es decir, e i0 , e −i 𝜋/2 0.96e−i (2.5570) E0 , lo cual representa un estado de polarización circular a derecha. El radio del círculo es 0.96E0 . 1 2 3 q i2 q i2 1 q i2 4 5 4 5 3 2 Figura 2.20. Rombo de Fresnel en aire (nt = 1.0) para un vidrio de índice ni = 1.5. El ángulo de incidencia en las caras diagonales es 𝜃 i = 53.26◦ . Luz que incide linealmente polarizada a −45◦ (con respecto al plano de incidencia) emerge circularmente polarizada a derecha. 152 · Polarización Si el haz incidente es linealmente polarizado pero con el plano de vibración diferente a ±45◦ , el resultado será un estado de polarización diferente al circular. En particular, si el ángulo del plano de vibración es 0 o 90◦ tendremos que el estado de polarización lineal no cambia, manteniéndose en un plano perpendicular o paralelo al plano de incidencia. Note que el plano de incidencia se define con la normal de la segunda superficie, ya que con la primera superficie no está definido el plano de incidencia (el vector de onda incidente es colineal con la normal de la interfase). 2.4.2. Reflectancia y transmitancia Reflectancia y Transmitancia 1.0 T 0.9 T 0.8 0.7 0.6 0.5 'p 0.4 0.3 0.2 R 0.1 0 R 0 10 20 30 c 40 50 60 70 80 90 Ángulo de incidencia, i (°) Figura 2.21. Reflectancia y transmitancia para la reflexión interna (0 < 𝜃 i < 𝜃 c ) y total interna (𝜃 c < 𝜃 i < 𝜋/2). En la fig. 2.21, se muestran las curvas para la reflectancia y la transmitancia. La reflectancia es el cuadrado de las curvas mostradas en la fig. 2.17 (eq. (2.108)). Para la transmitancia también tenemos dos intervalos. En el primero, 0 < 𝜃 i < 𝜃 c , los coeficientes de transmisión se calculan de acuerdo con las eqs. (2.98) y (2.99). En el segundo intervalo, 𝜃 c < 𝜃 i < 𝜋/2, el ángulo de transmisión 𝜃 t = 90◦ , por lo que, de acuerdo con la eq. (2.110), la transmitancia tanto para la componente paralela como para la componente ortogonal se hace igual a 0.5 Por supuesto, nuevamente se verifica que R + T = 1 para las dos componentes de los campos. 5 En la reflexión total interna, la energía incidente se refleja completamente. Sin embargo, aún existe una onda electromagnética más allá de la interfase que se atenúa rápidamente. Esta onda se conoce como evanescente. Polarización · 153 2.5. Polarización con materiales birrefringentes El vector de polarización eléctrico en materiales dieléctricos se relaciona con el campo eléctrico mediante la susceptibilidad eléctrica según la eq. (B.9) P = 𝜖 0 𝜒 E. Cuando el material es isotrópico, la susceptibilidad se describe mediante una cantidad escalar y la ecuación deponda (eq. (B.14)) se reduce a ∇2 E = 𝜇 0 𝜖 0 (1 + 𝜒 )𝜕 2 E/𝜕t 2 , donde 𝜐 = c/ 1 + 𝜒 es la velocidad de la luz en el material. Cuando el material es anisotrópico, la susceptibilidad se describe mediante un tensor (matriz de 3 × 3) y la ecuación de onda es un poco más compleja. En general, la susceptibilidad eléctrica se puede describir como © 𝜒 11 𝜒 = ­­ 𝜒 21 « 𝜒 31 𝜒 12 𝜒 22 𝜒 32 𝜒 13 𝜒 23 𝜒 33 𝜒 12 𝜒 22 𝜒 32 𝜒 13 𝜒 23 𝜒 33 ª ® ® ¬ (2.130) y el vector de polarización eléctrico © Px ª © 𝜒 11 ­ Py ® = 𝜖 0 ­ 𝜒 21 ­ ­ ® P « z ¬ « 𝜒 31 ª © Ex ª ® ­ Ey ® ®­ ® E ¬« z ¬ (2.131) no necesariamente es paralelo al vector eléctrico. En el caso particular (de interés en este libro) de materiales dieléctricos anisotrópicos no absorbentes, 𝜒 es simétrica y se puede reducir en un sistema de ejes principales a [14] © 𝜒1 𝜒 = ­­ 0 « 0 0 𝜒2 0 0 0 𝜒3 ª ®. ® ¬ (2.132) Las cantidades 𝜒 1 , 𝜒 2 y 𝜒 3 se denominan susceptibilidades principales. En general, los cristales son materiales anisotrópicos cuyos elementos (átomos, moléculas, iones) están localizados en arreglos geométricos regulares: cúbico, trigonal, tetragonal, hexagonal, triclínico, monoclínico y ortorrómbico. Para cristales dieléctricos no absorbentes, las susceptibilidades principales se relacionan de la siguiente manera: (a) cúbico, 𝜒 1 = 𝜒 2 = 𝜒 3 , 154 · Polarización es decir, se comporta como un material isotrópico; (b) trigonal, tetragonal, hexagonal, 𝜒 1 = 𝜒 2 ≠ 𝜒 3 , y (c) triclínico, monoclínico y ortorrómbico, 𝜒1 ≠ 𝜒2 ≠ 𝜒3. Al escribir la ecuación de onda (B.14)) como ∇ × (∇ × E) + 1 𝜕2E 1 𝜕2E = − 𝜒 c 2 𝜕t 2 c 2 𝜕t 2 (2.133) y proponiendo una solución de ondas planas E(r, t) = E0 e i (k·r−𝜔t) , pasamos a un conjunto de ecuaciones algebraicas de las cuales podemos analizar el comportamiento de las componentes del campo eléctrico dentro del material anisotrópico. De acuerdo con las eqs. (2.10) y (2.12), para las ondas planas armónicas podemos hacer los siguientes cambios ∇ → ik y 𝜕/𝜕t → −i𝜔. Con esto en mente, la eq. (2.133) se transforma en k × (k × E) + 𝜔2 𝜔2 E = − 𝜒 E. c2 c2 En términos de las componentes de k y de E,6 se llega a 𝜔2 𝜔2 2 2 −ky − kz + 2 Ex + kx ky Ey + kx kz Ez = − 2 𝜒 1 Ex , c c 𝜔2 𝜔2 2 2 kx ky Ex + −kx − kz + 2 Ey + ky kz Ez = − 2 𝜒 2 Ey , c c 𝜔2 𝜔2 kx kz Ex + ky kz Ey + −kx2 − ky2 + 2 Ez = − 2 𝜒 3 Ez . c c (2.134) (2.135) (2.136) (2.137) 2.5.1. Láminas retardadoras de fase Un primer resultado de las eqs. (2.135), (2.136) y (2.137) se obtiene directamente si suponemos que dentro del material se propaga una onda en una de las direcciones, por ejemplo, k = {kx , 0, 0}, donde la magnitud de k, k = kx . En este caso, las ecuaciones se reducen a 𝜔2 𝜔2 E = − 𝜒 1 Ex , x c2 c2 𝜔2 𝜔2 2 −kx + 2 Ey = − 2 𝜒 2 Ey , c c 6 Para (2.138) (2.139) obtener cada una de las componentes, se puede utilizar la identidad vectorial [x × (y × z)] i = yi x j z j − zi x j y j , donde x j y j (x j z j ) indica el producto punto x · y (x · z). Con esta ecuación obtenemos la i-ésima componente del doble producto cruz. Polarización −kx2 𝜔2 𝜔2 + 2 Ez = − 2 𝜒 3 Ez . c c · 155 (2.140) Ya que en el material dieléctrico 𝜖 ≠ 𝜖 0 , entonces 𝜒 1 (y 𝜒 2 , 𝜒 3 ) ≠ 0. Por lo tanto, en la eq. (2.138), se tiene que Ex = 0, es decir, E es transversal a la dirección de propagación, o sea, E = {0, Ey , Ez }. En la eq. (2.139), si Ey ≠ 0, se tiene que 𝜔2 (1 + 𝜒 2 ) . (2.141) c2 p Como el índice de refracción se define n = 1 + 𝜒 (eq. (B.18)), entonces el número de onda de la componente del campo que vibra en el plano yx y que se propaga en la dirección x está dado por k2 = k= 2𝜋 n2 . 𝜆 (2.142) En otras palabras, p la componente Ey se propaga en un material de índice de refracción n2 = 1 + 𝜒 2 . En forma análoga, en la eq. (2.140), si Ez ≠ 0, se tiene que k2 = 𝜔2 (1 + 𝜒 3 ) , c2 (2.143) por lo tanto, el número de onda de la componente del campo que vibra en el plano zx y que se propaga en la dirección x está dado por k= 2𝜋 n3 . 𝜆 (2.144) Ahora la componente Ez del campo se propaga en un material de índice de p refracción n3 = 1 + 𝜒 3 . Así que para la onda propagándose en la dirección x, el material presenta dos índices de refracción, uno para cada componente del campo. Este tipo de materiales se denominan materiales birrefringentes (de doble índice). En resumen, la onda electromagnética que se propaga en dirección x tendrá la forma E = {0, E0y e i (2𝜋xn2 /𝜆 −𝜔t) , E0z e i (2𝜋xn3 /𝜆 −𝜔t) }. (2.145) Lo anterior tiene como consecuencia que las componentes Ey y Ez se desfasan continuamente. Para la distancia x, el desfase entre las componentes será 2𝜋 (n3 − n2 ) Δ𝛿 = x. (2.146) 𝜆 156 · Polarización Resultados similares se obtienen si la dirección de propagación es en y o en z. Así que los índices de refracción principales n1 , n2 y n3 están asociados a las direcciones x, y y z, respectivamente. Con base en los anteriores resultados, se fabrican láminas birrefringentes para generar retrasos de fase entre las componentes controlando el espesor de la lámina. Supongamos que tenemos una lámina birrefringente de espesor d, como se muestra en la fig. 2.22, cuyas aristas coinciden con las direcciones principales y n3 > n2 . Una onda vibrando en el plano zx se propaga con la velocidad 𝜐3 = c/n3 y una onda vibrando en el plano yx se propaga con velocidad 𝜐2 = c/n2 . Ya que n3 > n2 , entonces 𝜐3 < 𝜐2 . En otras palabras, para la eq. (2.145), la componente Ez viaja más lento que la componente Ey . Se dice entonces que en z se tiene un eje lento y en y un eje rápido. Con esto, queda claro que la componente Ey se adelanta a la componente Ez cuando emergen de la lámina y la diferencia de fase entre ellas será 2𝜋 (n3 − n2 )d/𝜆 . d z E'z n3 > n2 E'y y x Ez Ey Eje rápido a Eje lento Figura 2.22. Lámina retardadora de fase. Lámina de 𝜆 /4 Supongamos que se quiere generar una diferencia de fase igual 𝜋/2, es decir, 2𝜋 (n3 − n2 )d/𝜆 = 𝜋/2. El espesor de la lámina debe ser 𝜆 1 d= , 4 Δn con Δn = |n3 − n2 |. A este tipo de láminas se les denomina láminas de 𝜆 /4 y se suelen usar para generar luz circularmente polarizada. Por ejemplo, si una onda plana linealmente polarizada con el plano de vibración en un ángulo 𝛼 = 45◦ incide en la cara anterior de la lámina con 𝜃 i = 0 (indicencia Polarización · 157 normal), la luz que sale de la lámina tendrá un estado de polarización circular a izquierda, como se muestra en la fig. 2.22 Note que si se gira la lámina 90◦ alrededor del eje x (ahora el eje rápido estará vertical y el eje lento estará horizontal) manteniendo la polarización del haz incidente, el resultado será luz con un estado de polarización circular a derecha. Lámina de 𝜆 /2 Si se quiere generar una diferencia de fase de 𝜋, se debe duplicar el espesor de la lámina, es decir, 𝜆 1 . d= 2 Δn A este tipo de láminas se les denomina láminas de 𝜆 /2 y se suelen usar para rotar el plano de vibración de una onda linealmente polarizada. En particular, si la onda incidente es como la del caso anterior, con 𝛼 = 45◦ , la onda que emerge de la lámina de 𝜆 /2 será linealmente polarizada con 𝛼 = −45◦ . Una ventaja notable de usar una lámina de 𝜆 /2 parta rotar el plano de vibración de una onda linealmente polarizada está en que el giro se hace sin atenuar la amplitud de la onda, lo que sí ocurre cuando se utilizan polarizadores dicroicos de acuerdo con la ley de Malus (eq. (2.53)). Para estimar el espesor de las láminas retardadoras de fase, supongamos que se desea construir una lámina de 𝜆 /4 hecha de calcita (estructura cristalina trigonal). Los índices de refracción principales de la calcita son: n1 = n2 = 1.658 y n3 = 1.486,7 es decir, Δn = 0.172. Con esto, el espesor para la línea “d” del helio (𝜆 = 587.56 nm) será d = 0.8540 𝜇m. Esto es un espesor muy pequeño para un dispositivo práctico. Así que a nivel comercial las láminas se fabrican con cristales birrefringentes cuyo espesor sea un múltiplo impar de 𝜆 /4 (o par de 𝜆 /2). 2.5.2. Cristales birrefringentes En la sección anterior, se vio cómo se comporta un cristal suponiendo que la onda se propaga a lo largo de una de las direcciones principales. Un caso más general supone cualquier dirección de propagación. En este caso, debemos volver a las eqs. (2.135), (2.136) y (2.137). Estas ecuaciones constituyen un sistema de ecuaciones lineales homogéneo. La solución distinta a la trivial (Ex = Ey = Ez = 0) supone que el determinante de los coeficientes sea igual 7 Estos son los índices ordinario y extraordinario. Estas definiciones las veremos en la siguiente sección. 158 · Polarización a 0, es decir, (n1 𝜔/c) 2 − ky2 − kz2 kx ky kx kz kx ky (n2 𝜔/c) 2 − kx2 − kz2 ky kz kx kz ky kz (n3 𝜔/c) 2 − kx2 − ky2 = 0. (2.147) En un sistema de coordenadas kx , ky y kz , la ecuación anterior representa una superficie de doble hoja. Para ver de manera sencilla estas superficies vamos a examinar los cortes de las superficies con los planos kx ky (kz = 0), kx kz (ky = 0) y ky kz (kx = 0), suponiendo que n1 < n2 < n3 . Comenzando con el plano kz = 0, la eq. (2.147) se reduce a (n1 𝜔/c) 2 − ky2 kx ky 0 kx ky (n2 𝜔/c) 2 − kx2 0 0 0 (n3 𝜔/c) 2 − kx2 − ky2 = 0, (2.148) de donde o n o nh ih i (n3 𝜔/c) 2 − kx2 − ky2 (n1 𝜔/c) 2 − ky2 (n2 𝜔/c) 2 − kx2 − kx2 ky2 = 0. (2.149) Esto es el producto de dos factores (los que están entre las llaves), y cada uno de ellos debe ser igual a 0. Del primer factor kx2 + ky2 = (n3 𝜔/c) 2 , (2.150) es decir, un círculo de radio n3 𝜔/c. Del segundo factor, kx2 (n2 𝜔/c) 2 + ky2 (n1 𝜔/c) 2 = 1, (2.151) es decir, una elipse con semiejes n2 𝜔/c y n1 𝜔/c en kx y ky , respectivamente. ky n3w c n1 w c n2w c n3 w c kx kz Figura 2.23. Curvas de vectores de onda en un cristal en el plano kz = 0. Polarización · 159 En la fig. 2.23, se muestra las dos curvas que resultan de la intersección de la superficie de dos hojas con el plano kz = 0: el círculo de radio n3 𝜔/c y la elipse con semiejes n1 𝜔/c y n2 𝜔/c. Haciendo un análisis análogo para los planos kx = 0 y kz = 0, se tiene entonces que en cada plano las intersecciones de las dos superficies son un círculo y una elipse, como se muestra en la fig. 2.24 . Así que, en general, para cualquier dirección k tendremos dos valores para el número de onda k, es decir, dos índices de refracción. En particular, para la propagación en la dirección x, tendremos dos velocidades de fase, 𝜐2 = c/n2 , para la componente Ey , y 𝜐3 = c/n3 , para la componente Ez ; para la propagación en la dirección y, tendremos dos velocidades de fase, 𝜐1 = c/n1 , para la componente Ex , y 𝜐3 = c/n3 , para la componente Ez ; y para la propagación en la dirección z, tendremos dos velocidades de fase, 𝜐1 = c/n1 , para la componente Ex y 𝜐2 = c/n2 , para la componente Ey . Lo anterior significa que para cada dirección de propagación hay dos velocidades de fase correspondientes a dos componentes del campo eléctrico mutuamente ortogonales. Para cualquier otra dirección de propagación ocurre igual, se tienen dos velocidades de fase que siempre corresponden con dos direcciones mutuamente ortogonales de polarización. Esto se ilustra en la fig. 2.24, con el vector de onda k en el plano kz = 0. Los valores de los índices de refracción para cada dirección de polarización son la medida de la distancia desde el origen del sistema de coordenadas hasta las dos intersecciones del vector k, divida entre 𝜔/c. ky n3 w c n1 w c k O n2 w c kz n2 w c n3 w c n1 w c kx Eje óptico Figura 2.24. Superficies del vector de onda en un cristal con n1 < n2 < n3 . En la dirección del eje óptico, las velocidades de fase asociadas a cada una de las direcciones de polarización son iguales. 160 · Polarización Una situación particular para las velocidades de fase se tiene cuando las dos superficies del vector de onda se intersecan en un punto, como se muestra en la fig. 2.24 para el plano ky = 0. Allí, el número de onda k es igual para las dos direcciones de polarización, por lo tanto, los índices de refracción son iguales y, en consecuencia, las velocidades de fase también serán iguales. La dirección de k para la cual ocurre esto se denomina eje óptico del cristal. Entonces, una onda que se propaga en un cristal anisotrópico a lo largo del eje óptico del cristal lo hace de la misma manera que en un material isotrópico. Las dos componentes ortogonales del campo no se desfasan entre sí. En los cristales en que los tres índices de refracción principales son diferentes entre sí, se tienen dos ejes ópticos; a estos cristales se les denomina cristales biaxiales. En los cristales en que dos de los tres índices de refracción principales son iguales entre sí se tiene un solo eje óptico; a estos cristales se les denomina cristales uniaxiales. Las dos superficies del vector de onda en los cristales uniaxiales consisten en una esfera y un elipsoide de revolución. Dependiendo de qué superficie contiene a la otra, los cristales uniaxiales se clasifican en positivos o negativos. Es positivo si el elipsoide circunscribe a la esfera, es negativo si la esfera circunscribe al elipsoide. En el caso de los cristales biaxiales, estas superficies son elipsoides de revolución que se cruzan. En la fig. 2.25, se muestra la clasificación de los cristales a partir de las secciones de la esfera y los elipsoides en el plano que contiene a los ejes ópticos. eje óptico eje óptico O O (a) (b) eje óptico eje óptico O (c) Figura 2.25. Clasificación de los cristales según el eje óptico del cristal: (a) uniaxial positivo, (b) uniaxial negativo, (c) biaxial. En los cristales uniaxiales 𝜒 1 = 𝜒 2 , al índice de refracción correspondiente se le llama índice ordinario, no . Al índice correspondiente a 𝜒 3 se le llama índice extraordinario, ne . Así, en un cristal uniaxial positivo, no < ne , y en un cristal uniaxial negativo, no > ne . Por otra parte, a la componente del campo que vibra con el número de onda correspondiente a no se denomina Polarización · 161 onda ordinaria (rayo ordinario) y a la componente del campo que vibra con el número de onda correspondiente a ne se le denomina onda extraordinaria (rayo extraordinario). En la tabla 2.2, se dan algunos ejemplos de cristales uniaxiales positivos (+) y negativos (−) y de cristales biaxiales [14]. En particular se ve que la calcita tiene un Δn relativamente grande, lo que explica que sea un material muy usado para fabricar elementos ópticos (retardadores de fase y prismas). Tabla 2.2. Algunos cristales. En los cristales uniaxiales, a los índices que son iguales se les llama índice ordinario y al que es diferente índice extraordinario. Estructura Isotrópico cubico Susceptibilidad a 0 0 c= 0 a 0 0 0 a a 0 0 Uniaxial trigonal tetragonal c= 0 a 0 hexagonal 0 0 b a 0 0 monoclínico c= 0 b 0 ortorrómbico 0 0 c Cristal n1 n2 n3 Cloruro de sodio 1.544 1.544 1.544 Diamante 2.417 2.417 2.417 + Cuarzo 1.544 1.544 1.553 + Hielo 1.309 1.309 1.310 - Calcita 1.658 1.658 1.486 - Nitrato de sodio 1.587 1.587 1.336 Biaxial triclínico Topacio 1.619 1.620 1.627 Mica 1.552 1.582 1.588 2.5.3. Refracción en cristales Ya que en general un cristal birrefringente muestra dos índices de refracción para una dirección de propagación, en la refracción en una interfase que separa dos medios, uno isotrópico y el otro anisotrópico, un haz incidente con 𝜃 i ≠ 0 (desde el medio isotrópico) será separado en dos haces refractados. En particular, para la refracción vamos a considerar interfases que sean paralelas u ortogonales al eje óptico del cristal. En la fig. 2.24, en el plano ky = 0, se puede observar que la onda ordinaria vibra ortogonalmente al eje óptico del cristal. Esto es un hecho en todos los cristales y nos permite determinar la dirección que siguen las ondas ordinaria y extraordinaria en la refracción. Para ver la refracción, vamos a considerar un cristal uniaxial negativo sumergido en aire. Supongamos que la interfase es una cara plana del cristal que contiene al eje óptico y que el 162 · Polarización plano de incidencia es ortogonal al eje óptico. De la fig. 2.25(b), se establece que la incidencia y refracción de los rayos ocurren como se muestra en la fig. 2.26. Las curvas de índice (número de onda dividido entre 𝜔/c) son círculos. Ya que el eje óptico indica una dirección, en la figura el eje óptico se muestra con puntos (líneas ortogonales al plano del papel). Si descomponemos el haz incidente en un vector paralelo al plano de incidencia (plano del papel), Eqi , y en un vector ortogonal al plano de incidencia, E⊥ i , entonces la componente paralela será ortogonal al eje óptico; esta será la onda ordinaria. Ei Ei no ne ni n i si n o so n e se Et Et Figura 2.26. Refracción en un cristal uniaxial negativo (no > ne ). En la refracción se tienen dos haces separados: la onda ordinaria, Etq , y la onda extraordinaria Et⊥ . Para obtener las direcciones de propagación de las ondas ordinaria y extraordinaria en la refracción, podemos hacer uso del trazo gráfico de rayos de la fig. 1.9, como se muestra en la fig. 2.26. Por supuesto, ambos rayos cumplen con la ley vectorial de la ley de Snell (eq. (2.75)). Para el rayo ordinario, nt = no , y para el rayo extraordinario, nt = ne . Por lo tanto, para el rayo ordinario, no sin 𝜃 to = ni sin 𝜃 i , (2.152) y para el rayo extraordinario, ne sin 𝜃 te = ni sin 𝜃 i . (2.153) El resultado final es la separación de las dos componentes de la onda incidente: Eqt vibra propagándose en la dirección del rayo ordinario y E⊥ t vibra propagándose en la dirección del rayo extraordinario. La separación de los haces debido a la doble refracción explica la doble imagen que puede verse con los cristales de calcita, como se muestra en la fig. 2.27. · Polarización 163 Figura 2.27. Doble imagen generada con un cristal de calcita. uniaxial negativo Si se cambia la orientación del eje óptico con respecto a la interfase, también se cambian las curvas de índice y, por lo tanto, la manera como se refractan los rayos ordinario y extraordinario. En la fig. 2.28, se muestra algunas configuraciones básicas de las curvas de índice para los cristales uniaxiales positivo y negativo. El eje óptico se representa con las líneas paralelas en gris o con puntos (líneas ortogonales al plano del papel). Además de la separación de los rayos ordinario (o) y extraordinaro (e), en los cristales uniaxiales negativos el rayo ordinario se retrasa con respecto al rayo extraordinario, en los cristales uniaxiales positivos sucede lo contrario. i i i ni ni ne ne no ne no no e o (a) o (b) i uniaxial positivo ni e i ni i ni ni no ne no ne e o e o (c) ne e no o e o Figura 2.28. Algunas configuraciones de la interfase y el plano de incidencia en cristales uniaxiales cuyo eje óptico es paralelo u ortogonal a la interfase. 2.5.4. Prismas polarizadores A partir de las configuraciones mostradas en la fig. 2.28, se pueden construir elementos ópticos para obtener luz linealmente polarizada a partir de luz 164 · Polarización natural. Ya que las dos componentes del campo refractadas tienen estados de polarización lineal mutuamente ortogonales, se puede bloquear una de ellas para obtener luz linealmente polarizada. Sin embargo, el haz obtenido tendrá una dirección de propagación diferente a la del haz incidente. Et n q te (n o , n e ) (c) Ei qo qi Ei qi (c) qe Er Er Figura 2.29. Reflexión total interna en la calcita para el rayo ordinario, n < no y n < ne . Para obtener luz linealmente polarizada en la misma dirección del haz de luz natural incidente, se puede usar un par de prismas birrefringentes con sus caras diagonales unidas por un medio óptico o por una película de aire. En el primer prisma, los haces con polarizaciones mutuamente ortogonales mantienen la dirección del haz incidente (ortogonal a la primera cara), en la cara diagonal, uno de los haces se refleja totalmente mientras que el otro se refleja y se transmite ingresando al segundo prisma para mantener la dirección del haz incidente. Lo notable aquí es la reflexión total interna de uno de los haces. Para ver el principio de funcionamiento, consideremos la reflexión interna de un haz en la calcita, como se muestra en la fig. 2.29. Ya que tenemos dos índices de refracción en la calcita, no = 1.658 y ne = 1.486, el primero para la onda que vibra paralela al plano de incidencia (rayo ordinario) y el segundo para la onda que vibra ortogonal al plano de incidencia (rayo extraordinario), entonces también tendremos dos ángulos críticos para la reflexión total interna. Si n = 1 (aire), para el rayo ordinario n (c) 𝜃 o = arcsin = 37.09◦ , no para el extraordinario 𝜃 e(c) n = arcsin = 42.29◦ . ne Polarización · 165 Con base en estos dos ángulos, si el rayo incidente llega a la interfase con un ángulo 𝜃 o(c) < 𝜃 i < 𝜃 e(c) , entonces el rayo ordinario se refleja con reflexión total interna, mientras que el rayo extraordinario se refleja y se transmite, de modo que en el segundo medio (aire) se tiene un haz linealmente polarizado vibrando ortogonalmente al plano de incidencia. En la fig. 2.30, se muestra un posible sistema con un par de prismas de calcita con el que se logra que el haz a la salida sea linealmente polarizado en el estado “s” y con la misma dirección del haz incidente (luz natural). La normal de la cara diagonal (del primer prisma) y el haz incidente determinan el plano de incidencia. Por otro lado, la inclinación de la diagonal es tal que los haces transmitidos en el primer prisma llegan con un ángulo 𝜃 i = 40◦ a la diagonal. En la reflexión en esta diagonal, se tiene la reflexión total interna del rayo ordinario y la reflexión interna de rayo extraordinario. En la transmisión solo se tiene el rayo extraordinario que se desvía (según la ley de Snell) y al llegar a la segunda diagonal vuelve a tomar la dirección que tenía en el primer prisma, gracias a que las dos diagonales son caras paralelas entre sí. 40° e 40° Figura 2.30. Sistema de dos prismas de calcita con el eje óptico ortogonal al plano de incidencia para generar luz linealmente polarizada en el estado “s”. Las dos diagonales son paralelas y el medio entre ellas es aire ( n = 1.000). Comercialmente, hay una gran variedad de prismas polarizadores. Usualmente las caras diagonales se unen con un medio óptico diferente al aire, por ejemplo, con bálsamo de Canadá,8 el cual tiene un índice de refracción que varía entre 1.54 y 1.55. Este índice está en medio de los dos índices de la calcita, por lo que solo tendremos el ángulo crítico para el rayo ordinario, esto es, 𝜃 o(c) = 68.25◦ . En la fig. 2.31, se muestra un prisma de 8 El bálsamo de Canadá es una resina de un árbol que, debido a su transparencia y a su índice de refracción cercano al del vidrio (después de ser sometido a un proceso de evaporación de aceites), se usa para pegar lentes en los instrumentos ópticos. 166 · Polarización Glan-Thompson hecho de calcita con el eje óptico ortogonal al plano de incidencia. La geometría de los prismas es tal que el ángulo de incidencia en la primera cara diagonal es mayor que 𝜃 o(c) . Aire Calcita Aire e Calcita Bálsamo de Canadá Figura 2.31. Prisma Glan-Thompson hecho con dos prismas de calcita unidos con bálsamo de Canadá. Wollaston Rochon Senarmont Figura 2.32. Algunos tipos de prismas polarizadores que separan las componentes del campo óptico en los estados “s” y “p”. En todos los casos, los prismas son de cuarzo. En la fig. 2.32, se muestra otro tipo de prismas hechos de cuarzo en los que los ejes ópticos de cada uno de los prismas cambian de dirección y las diagonales están inclinadas 45◦ . En los prismas de Wollaston, E⊥ i en el primer prisma es el rayo ordinario y al pasar al segundo prisma cambia a rayo extraordinario, por lo que en la diagonal se refracta acercándose a la normal, y Eqi en el primer prisma es el rayo extraordinario y al pasar al segundo prisma cambia a rayo ordinario, por lo que en la diagonal se refracta aleq jándose de la normal. En los prismas de Rochon, E⊥ i y Ei entran al primer prisma a lo largo del eje óptico, por lo que ambos rayos veran el índice ordinario; luego en el segundo prisma E⊥ i cambia a rayo extraordinario y se q refracta acercándose a la normal, y Ei sigue como rayo ordinario, por lo que no cambia su dirección de propagación. Por último, en los prismas de q Senarmont, E⊥ i y Ei también entran al primer prisma a lo largo del eje óptico, por lo que ambos rayos verán el índice ordinario; luego, en el segundo prisma E⊥ i sigue como rayo ordinario, por lo que no cambia su dirección de propagación, y Eqi cambia a rayo extraordinario y se refracta acercándose a la normal. Polarización · 167 También se puede tener prismas polarizadores hechos de vidrio óptico isotrópico. Estos son cubos divisores de haz con una película dieléctrica en medio de las diagonales que unen los prismas, lo que permite la trasmisión del estado de polarización p y la reflexión en la diagonal del estado de polarización s. En el apéndice E se hace una breve mención al respecto. 168 · Polarización 2.6. Vectores y matrices de Jones Para describir el estado de polarización de una onda plana, hemos empleado en la unidad 2.1 el vector (eq. (2.32)) E(x, y, z; t) = ı̂Eox + ̂Eoy e i (kz−𝜔t) , donde Eox = |Eox | e i𝛿x y Eoy = Eoy e i𝛿y . Ya que los términos de fase temporal y espacial son comunes a las amplitudes complejas de las dos componentes de la onda, una manera conveniente de escribir el estado de polarización es mediante un vector columna en el que sus elementos determinan la relación entre las componentes de la onda. Esta representación es conocida como vector de Jones: |Eox | e i𝛿x Eox = . (2.154) Eoy Eoy e i𝛿y Por ejemplo, para algunos de los estados de polarización más comunes la representación explicita se ve como sigue: - Polarización lineal. El desfase entre las componentes ha de ser Δ𝛿 = m𝜋 (m = 0, ±1, ±2, ...). Por lo tanto, |Eox | . (2.155) ± Eoy En los casos más comunes de la polarización lineal, el vector de Jones se puede reducir de acuerdo con la orientación del plano de vibración. Para la polarización horizontal (EH ), Eoy = 0, |Eox | 1 0 (2.156) para la polarización vertical (EV ), |Eox | = 0, ± Eoy 0 1 , (2.157) y para la polarización diagonal a ±45◦ (E±45 ), |Eox | = Eoy , |Eox | 1 ±1 . (2.158) Polarización · 169 - Polarización circular. El desfase entre las componentes ha de ser Δ𝛿 = (2m − 1)𝜋/2; (m = 0, ±1, ±2, ...) y |Eox | = Eoy . Por lo tanto, el vector de Jones queda 1 |Eox | . (2.159) ±i El signo (+) para la polarización circular izquierda (EL ) y el signo (−) para la polarización circular derecha (ER ). - Polarización elíptica. Cuando el desfase entre las componentes es Δ𝛿 = (2m − 1)𝜋/2; (m = 0, ±1, ±2, ...) con |Eox | ≠ Eoy , tenemos una elipse no rotada. El vector de Jones será 1 |Eox | (2.160) ±ib con b = Eoy /|Eox |. El signo (+) para la polarización elíptica izquierda (EL ) y el signo (−) para la polarización elíptica derecha (ER ). Tabla 2.3. Algunos estados de polarización en la notación de vectores de Jones. Vector de Jones 1 0 0 1 1 ±1 Estado polarización EH , (Lineal horizontal) EV , (Linea vertical) 1 i 1 −i E±45 , (Lineal diagonal ±45◦ ) EL , (Circular izquierda) ER , (Circular derecha) Cualquier otro estado de polarización quedará descrito por la eq. ( 2.154). Los estados de polarización más usados en la práctica se representan en la 170 · Polarización tabla 2.3. Note que se omite el factor que multiplica al vector columna, ya que es común a ambos elementos. Entonces, para representar un estado de polarización solamente emplearemos la forma más simple del vector de Jones. Con los vectores de Jones, podemos hacer operaciones entre estados de polarización, por ejemplo: - la suma de dos estados de polarización lineales mutuamente ortogonales 1 1 1 + = 0 0 1 resulta en un estado de polarización diagonal; - la suma de un estado de polarización lineal y uno circular 1 1 1 =2 + 0.5i i 0 resulta en un estado de polarización elíptico; - la suma de dos estados de polarización circular, uno a izquierda y otro a derecha 1 1 1 =2 + 0 −i i resulta en un estado de polarización lineal. Por otra parte, los elementos polarizadores también se pueden representar convenientemente como matrices 2 × 2, de modo que el efecto de un elemento polarizador sobre un estado de polarización se describe mendiante una transformación lineal. Así, si a b (2.161) c d describe el elemento polarizador, el resultado sobre un estado de polarizaA ción será B 0 A a b A = . (2.162) B0 c d B Por ejemplo, consideremos un polarizador lineal con su eje de transmisión horizontal. Sabemos que el resultado sobre EH es nuevamente EH y, el resultado sobre EV es 0, esto es, 1 a b 1 = (2.163) 0 c d 0 Polarización · 171 y 0 0 a b c d = 0 1 . (2.164) Inmediatamente, se ve que de eq. (2.163) a = 1 y c = 0, y de eq. (2.164) b = 0 y d = 0. Por lo tanto, la matriz 1 0 (2.165) 0 0 representa un polarizador lineal con se eje de transmisión horizontal. Tabla 2.4. Algunos polarizadores representados como matrices de Jones. Elemento Matriz de Jones horizontal Polarizador lineal Lámina de l/4 Lámina de l/2 1 0 0 0 0 0 0 1 eje rápido horizontal eje rápido vertical 1 0 1 0 0 i 0 i eje rápido horizontal 1 0 0 -1 Polarizador circular vertical derecho 1 i 1 2 -i 1 diagonal 1 +-1 1 2 +1 1 eje rápido + - 45° + 1 1 -i 2 +-i 1 eje rápido vertical 1 0 0 -1 izquierdo 1 -i 1 2 i 1 En la tabla 2.4, se muestra algunas matrices que representan elementos polarizadores. Algunas de las matrices están acompañadas de los factores √ 1/2 y 1/ 2, que son necesarios cuando se requiere hacer el balance de la energía, pero para el análisis de los cambios de la polarización se pueden omitir. También se puede tener varias representaciones para un mismo elemento. Por ejemplo, un polarizador circular a izquierda en la tabla 2.4 se 1 −i representa con . Pero también lo podemos hacer con la matriz i 1 172 · Polarización que resulta al combinar un polarizador lineal diagonal con una lámina de 𝜆 /4, esto es, 1 1 1 1 1 0 . = i i 1 1 0 i Con cualquiera de las dos matrices, transformamos un estado de polarización lineal (EH , EV , E±45 ) en un estado de polarización circular EL . Lo que se verifica fácilmente: 1 −i A 1 = (A − iB) i 1 B i y 1 1 i i A B = (A + B) 1 i . Como ejemplo consideremos el sistema de la fig. 2.33. Tenemos tres elementos ópticos alineados con el eje z: un polarizador lineal con su eje de trasmisión rotado 45◦ , una lámina de 𝜆 /4 con su eje rápido ( f ) vertical y una lámina de vidrio que refleja rq = 0.2 y r⊥ = −0.2. y y x Luz natural PL f s l/4 x z Lámina de vidrio Figura 2.33. Sistema óptico que anula la luz reflejada después de pasar de regreso por la lámina de 𝜆 /4. Si (desde la izquierda) incide luz natural en el polarizador lineal, se tendrá que la luz reflejada se anula cuando incide de regreso en el polarizador lineal. Cualitativamente (observando desde el lado positivo del eje z), se tiene que después del polarizador lineal la luz está linealmente polarizada a 45◦ , al pasar por la lámina de 𝜆 /4 se transforma en circular derecha, al reflejarse en la lámina de vidrio cambia a circular izquierda y, al llegar de regreso a Polarización · 173 la lámina de 𝜆 /4 queda con polarización lineal a −45◦ , por lo que no se transmite luz después del polarizador. Matemáticamente, con los vectores y matrices de Jones, se tendrá: 0 1 −1 1 0 −1 0 1 0 1 1 A = . 0 −1 1 0 −i 0 1 0 −i 1 1 B Note que las matrices se escriben en el orden contrario al de los elementos ópticos (que van de izquierda a derecha). El producto de las matrices en efecto es 0. La matriz del medio representa la superficie reflectora a incir⊥ 0 −1 0 dencia normal, que se escribe como = 0.2 . Por otro 0 rq 0 1 lado, al reflejarse la luz el sentido positivo del eje x cambia. Esto no tiene ningún efecto en la lámina de 𝜆 /4, ya que sus ejes rápido ( f ) y lento ( s ) siguen orientados vertical y horizontalmente, pero en el polarizador lineal no ocurre igual, pues ahora su eje de transmisión estará a −45◦ . Lo anterior explica el cambio de signo en la matriz que representa al polarizador lineal (primera matriz, después del signo =) en el regreso de la luz. Además de los vectores y matrices de Jones, también se tienen otras representaciones matemáticas posibles, como los parámetros de Stokes, la esfera de Poincaré y las matrices de Muller. Capítulo tres Interferencia Interferencia · 177 Figura 3.1. Interferencia de dos ondas y de múltiples ondas. La interferencia de las ondas luminosas se observa como una modulación de la irradiancia, generalmente franjas brillantes y franjas oscuras en una pantalla de observación. La geometría de las franjas depende de la forma de los frentes de onda y de la diferencia en el camino óptico que recorren las ondas. Diferencias del orden de la longitud de onda de la luz generan cambios en la irradiancia de una franja brillante a una oscura, lo que hace de la interferencia una herramienta de gran precisión para medir: índice de refracción, frente de onda, forma de superficies ópticas, espesores, etc. El parámetro físico que determina la calidad de la interferencia (la posibilidad de generar franjas) es la coherencia entre las ondas. La coherencia tiene su origen en las fluctuaciones del campo óptico emitido por las fuentes. Fuentes naturales, como el sol, emiten de manera espontánea (aleatoria), pero en fuentes artificiales, como el láser, la emisión tiene un alto grado de correlación. En la fig. 3.1, se muestra dos patrones de interferencia generados con un láser de He-Ne (𝜆 = 632.8 nm). El haz láser se enfoca con una lente positiva en un agujero pequeño en una pantalla opaca, lo que se ve como un punto luminoso en la figura (fuente puntual). La lente está detrás de la pantalla, por lo que no se ve en la imagen. El frente de onda (esférico) divergente se hace pasar por varios elementos ópticos. Primero, pasa por una lámina de vidrio portaobjeto de microscopio de 1 mm de espesor (lámina). Allí, 178 · Interferencia en cada cara se refleja luz y se produce la interferencia entre las dos señales reflejadas, la cual se observa sobre la pantalla opaca (patrón de interferencia inferior izquierdo-2 fuentes). Este patrón de interferencia consiste en franjas aproximadamente circulares, en las que el espesor de las franjas brillantes es similar al espesor de las franjas oscuras. Este es el resultado típico de la interferencia de dos fuentes que emiten ondas esféricas. Luego, se deja seguir el haz transmitido por la lámina portaobjeto de microscopio y entra a un interferómetro de Fabry-Perot, el cual consiste en dos láminas gruesas de vidrio de alta reflectancia paralelas entre sí. La separación entre las láminas es menor a un milímetro y las caras que están enfrentadas tienen un recubrimiento de película delgada de aluminio que aumenta la reflectancia. Lo anterior genera múltiples reflexiones, con coeficientes de amplitud similares, por lo que ahora se tiene la interferencia de más de dos ondas. El efecto en el patrón de interferencia reflejado es un adelgazamiento de las franjas oscuras, como se puede ver en la pantalla opaca (patrón de interferencia superior derecho-N fuentes) En este capítulo, veremos algunos de los interferómetros más comunes, comenzando por el interferómetro de Michelson, ya que resulta muy ilustrativo para estudiar la interferencia de ondas planas y ondas esféricas. Luego discutiremos la interferencia de múltiples haces en una lámina de caras paralelas, lo que también explica el funcionamiento del interferómetro de Fabry-Perot. En todos los casos, supondremos que las superficies de los elementos ópticos que componen los interferómetros son ideales, es decir, concuerdan con su descripción matemática. En la práctica, el proceso de fabricación de estos elementos limita la calidad óptica de las superficies. En la unidad 3.4 se comenta algunos aspectos prácticos en el interferómetro de Michelson, los cuales también pueden estar presentes en otros interferómetros. Interferencia · 179 3.1. Interferencia y coherencia Consideremos la suma de dos ondas planas armónicas dadas por E1 (r, t) = E01 e i (k1 ·r−𝜔t+𝜙1 ) y E2 (r, t) = E02 e i (k2 ·r−𝜔t+𝜙2 ) en un punto r del espacio vacío (aire). Las fases 𝜙1 y 𝜙2 son funciones del tiempo que dependen del proceso de emisión de luz y dan cuenta de las fluctuaciones de los campos en r. Las amplitudes E01 y E02 se suponen constantes en el tiempo. La onda resultante será: E(r, t) = E1 (r, t) + E2 (r, t). (3.1) La irradiancia en r, de acuerdo con la eq. (2.29), está dada por I (r) = 𝜖 0c hE1 · E∗1 + E2 · E∗2 + 2 Re{E1 · E∗2 }i, 2 (3.2) I (r) = 𝜖 0c 2 𝜖 0c 𝜖 0c 2 hE1 i + hE2 i + 2 RehE1 · E∗2 i. 2 2 2 (3.3) es decir, Definiendo como plano de referencia al plano que contiene los vectores de onda k1 = 2𝜋ŝ1 /𝜆 y k2 = 2𝜋ŝ2 /𝜆 , con respecto a este plano se definen las componentes paralelas y ortogonales de E1 y E2 , es decir, E01 = E⊥ + Eq01 01 y E02 = E⊥ + Eq02 . Entonces, 02 ⊥ E1 · E∗2 = E⊥ 01 · E02 ∗ e −i (Δk·r+Δ𝜙) + Eq01 · Eq02 ∗ e −i (Δk·r+Δ𝜙) , (3.4) donde Δk = k2 − k1 y Δ𝜙 = 𝜙2 − 𝜙1 . En la eq. (3.4), no se incluyen los ) ∗ y E⊥ · (Eq02 ) ∗ , ya que al ser mutuamente ortogonales términos Eq01 · (E⊥ 02 01 las componentes su resultado es 0. Esto último nos dice que las ondas con polarizaciones ortogonales entre sí no interfieren. y E⊥ son paralelos, mientras que los vectores Eq01 y Los vectores E⊥ 01 02 Eq02 forman un ángulo igual al ángulo entre s1 y s2 , así, 𝜖 0c 𝜖 0c 2 𝜖 0c 2 ⊥ ⊥ q q hE1 i+ hE2 i+2 Reh E02 E01 + E02 E01 cos(2𝛼) e −i (Δk·r+Δ𝜙) i, 2 2 2 (3.5) con 2𝛼 el ángulo entre ŝ1 y ŝ2 . De la eq. (3.5), tenemos que la interferencia debida a ondas cuyos estados de polarización son paralelos al plano de referencia depende del ángulo 2𝛼. Así, si 2𝛼 = 𝜋/2, las ondas no interfieren y la irradiancia será simplemente la suma de las irradiancias debidas a las componentes paralelas, Iq = (I1 + I2 )q . Por otro lado, la interferencia debida a ondas cuyos estados de polarización son ortogonales al plano de referencia no depende del ángulo formado entre ŝ1 y ŝ2 . I (r) = 180 · Interferencia En lo que sigue, vamos a suponer que las ondas que interfieren están en el estado de polarización que es ortogonal al plano de referencia, de manera que la expresión para la interferencia de dos ondas quedará p I (r) = I1 + I2 + 2 I1 I2 Rehe −i (Δk·r+Δ𝜙) i, (3.6) ⊥ ) 2 y I = (𝜖 c/2)hE 2 i = (𝜖 c/2) (E ⊥ ) 2 donde I1 = (𝜖 0 c/2)hE12 i = (𝜖 0 c/2) (E01 2 0 0 2 02 las irradiancias en r generadas por cada una de las ondas. En el término he −i (Δk·r+Δ𝜙) i, la diferencia de fases Δ𝜙 depende del tiempo. Para obtener el valor promedio, debemos conocer de manera explícita la variación de 𝜙1 y 𝜙2 con el tiempo. 3.1.1. Grado de coherencia Para llegar a la eq. (3.6), hemos supuesto que no hay retraso temporal entre las ondas, el cual puede ocurrir si el origen de una de las fuentes se desplaza o si una de las ondas viaja por un medio que produce un cambio en la velocidad de propagación. Si existe un retraso temporal 𝜏, entonces la suma de las ondas en general será E(r, t) = E1 (r, t) + E2 (r, t − 𝜏). Ahora, la irradiancia estará dada por p I (r) = I1 + I2 + 2 I1 I2 Rehe −i (Δk·r+𝜔𝜏+Δ𝜙 (𝜏)) i p = I1 + I2 + 2 I1 I2 Re{e −iΔk·r he −i𝜔𝜏 e−i (Δ𝜙(𝜏)) i} , (3.7) (3.8) con Δ𝜙(𝜏) = 𝜙2 (t − 𝜏) − 𝜙1 (t). Definiendo el grado complejo de coherencia 𝛾 (𝜏) = = he −i𝜔𝜏 e −i (Δ𝜙 (𝜏)) i |𝛾 (𝜏)| e −i (𝛼 (𝜏)+𝜔𝜏) (3.9) , donde 𝛼 (𝜏) + 𝜔𝜏 es la fase del grado de coherencia. Entonces p I (r) = I1 + I2 + 2 I1 I2 |𝛾 (𝜏)| cos(Δk · r+𝜔𝜏 + 𝛼 (𝜏)). (3.10) El módulo del grado de coherencia satisface 0 ≤ |𝛾 (𝜏)| ≤ 1. En los límites, obtiene el valor de 0 si Δ𝜙 es una función aleatoria y el valor de 1 si Δ𝜙 es constante en el tiempo. Se dice que la superposición de las ondas es incoherente, parcialmente coherente o coherente si para el módulo de 𝛾(𝜏) se tiene que 0 , incoherente |𝛾 (𝜏)| = {0, 1} , parcialmente coherente 1 , coherente. (3.11) Interferencia · 181 Aunque la expresión de la interferencia dada por la eq. (3.10) se ha obtenido en particular para ondas planas homogéneas (la amplitud de la onda en un frente de onda es constante), el resultado es válido para la suma de dos ondas en general. En este último caso el grado de coherencia es la versión normalizada de la correlación de los campos en el punto r. En libro Principles of Optics de Born & Wolf, se puede ver el formalismo general de la interferencia con ondas parcialmente coherentes [15]. 3.1.2. Interferencia y coherencia Para ver el efecto que 𝛾 (𝜏) tiene en la interferencia, vamos a considerar un ejemplo muy simple, pero ilustrativo. Siguiendo a Fowles [14], supongamos que la fuente luminosa que tenemos consiste en un sistema de dos niveles electrónicos, que emite espontáneamente un pulso dado por E(t) = E0 rect(t/𝜏0 )e −i (2𝜋 𝜈0 t−𝜙 (t)) (3.12) donde la función rect(t/𝜏0 ) describe una señal rectangular de la siguiente forma t 1, si |t| ≤ 𝜏0 /2 rect = . (3.13) 0, otro caso. 𝜏0 Entonces, el pulso es de forma cosenoidal de frecuencia 𝜈0 y duraci ón 𝜏0 , tal que 𝜏0 > T , donde el periodo T = 1/𝜈0 . La fase inicial 𝜙(t) es aleatoria dentro del rango −𝜋 < 𝜙 < 𝜋. El carácter espontáneo de la emisión se describe mediante la fase inicial aleatoria del pulso. Si imaginamos una emisión continua de pulsos pero con fases aleatorias, la representación gráfica de la fase en el proceso de emisión la podemos describir como se muestra en la fig. 3.2. p f (t) 0 t0 2t 0 3t 0 4t 0 5t 0 6t 0 7t 0 t -p Figura 3.2. Fases iniciales de los pulsos emitidos aleatoriamente uno tras otro por una fuente de dos niveles de transición electrónica. 182 · Interferencia Ahora, supongamos que usamos la luz generada de esta manera en un sistema óptico con el que podemos producir interferencia de dos ondas, esto es un interferómetro. Por ejemplo, en la fig. 3.3, se muestra el diagrama de un interferómetro de Michelson. A la onda (plana) que sale de la fuente S la denominaremos onda primaria (0). La primera tarea del interferómetro es generar dos ondas (secundarias) a partir de la onda primaria. Para esto podemos emplear un semiespejo plano, que refleja el 50 % de la amplitud de la onda primaria, y deja pasar el otro 50 % de la amplitud. El elemento que hace esta tarea se denomina divisor de haz (BS). De esta manera, obtenemos las ondas secundarias (1). La segunda tarea del interferómetro es sumar la dos ondas secundarias. Lo anterior se logra mediante los dos espejos M1 y M2, con los cuales se cambia la dirección de propagación de las ondas secundarias (2) dirigiéndolas nuevamente hacia el divisor de haz, de modo que las ondas reflejada y transmitida (3) se superpongan. En particular, si los espejos son ortogonales a los vectores de onda de las ondas secundarias (con el divisor de haz a 45◦ ) en la región de interferencia los vectores unitarios de propagación ŝ1 y ŝ2 serán paralelos, es decir, k2 − k1 = 0. M2 1 M1 2 0 1 O S 2 BS 3 3 y x Pantalla de observación Figura 3.3. Diagrama de un interferómetro de Michelson. El resultado final es la suma de dos ondas planas ( 3 ) con Δk = 0 y con un retraso temporal 𝜏 que resulta de la diferencia de camino óptico que han recorrido las dos ondas secundarias ( 1, 2, 3 ) desde el punto O en el divisor de haz. Si la distancia entre O y M1 es d1 y la distancia entre O y M2 es d2 , la diferencia de camino óptico (en aire n = 1) entre las ondas ( 3 ) en la región de interferencia es 2(d2 − d1 ). En consecuencia, el retraso Interferencia · 183 temporal será 𝜏 = 2(d2 − d1 )/c. Para d2 > d1 , 𝜏 > 0. Entonces, desplazando axialmente el espejo 2 (o el espejo 1), se logra el retraso temporal deseado. f (t) f (t-t ) p t -p t f (t-t )- f (t) p 0 t 0- t t0 2t 0 3t 0 4t 0 5t 0 6t 0 7t 0 t -p Figura 3.4. Diferencia de las fases 𝜙(t − 𝜏) y 𝜙(t)) para el retraso temporal 𝜏. Supongamos que el retraso temporal entre las dos ondas es menor a la duraci ón del pulso que genera la fuente luminosa, 𝜏 < 𝜏0 . El grado de coherencia entre las dos ondas depende de la diferencia de las fases iniciales de las dos ondas. Ya que con el interferómetro hacemos una copia de una onda, la diferencia de la fase dada en la fig. 3.2 se verá como se muestra en la fig. 3.4. En la parte de arriba de la fig. 3.4, se muestra la fase 𝜙(t) de una de las ondas junto con la fase de la otra onda incluyendo el retraso temporal. El resultado de la resta se muestra en la parte de abajo de la fig. 3.4. En los intervalos de duración (𝜏0 − 𝜏), las fases coinciden y, por lo tanto, el resultado es 0. En los otros intervalos, el resultado no es nulo, pero se sigue teniendo una distribución aleatoria de fases. Entonces, a partir de la eq. (3.9), se llega a 𝛾 (𝜏) = e −i𝜔𝜏 Ť ∫Ť 0 e −i ( 𝜙(t−𝜏)−𝜙 (t)) dt. (3.14) 184 · Interferencia Esta integral se puede resolver mediante la suma de las M integrales en cada intervalo de duración 𝜏0 , suponiendo que Ť = M 𝜏0 . Así, ∫𝜏0 ∫M 𝜏0 e −i𝜔𝜏 e −i (𝜙 (t−𝜏)−𝜙 (t)) dt , 𝛾 (𝜏) = e −i (𝜙(t−𝜏)−𝜙 (t)) dt + ... + Ť (M−1) 𝜏0 0 (3.15) y cada una de estas integrales, a su vez, se puede resolver en dos intervalos: el intervalo de duración (𝜏0 − 𝜏), donde la diferencia de fase es 0; y el intervalo de duración 𝜏, donde la diferencia de fase toma cualquier valor, digamos Δ j para el j-ésimo intervalo. Por lo tanto, agrupando las integrales para las cuales la diferencia de fase es 0 y poniendo en otro grupo las integrales con diferencias de fase Δ j , tenemos ∫𝜏0 −𝜏 2𝜏 M ∫0 −𝜏 ∫𝜏0 −𝜏 e −i𝜔𝜏 𝛾 (𝜏) = dt + dt + ... + dt (3.16) Ť 𝜏0 (M−1) 𝜏0 0 ∫𝜏0 2𝜏 0 ∫M 𝜏0 ∫ e −i𝜔𝜏 e iΔ2 dt + ... + e iΔM dt , + e iΔ1 dt + Ť M 𝜏0 −𝜏 2𝜏0 −𝜏 𝜏0 −𝜏 que es igual a 𝛾 (𝜏) = e −i𝜔𝜏 Ť [M (𝜏0 − 𝜏)] + e −i𝜔𝜏 Ť [0] . (3.17) El resultado del segundo grupo de integrales es 0, ya que las fases Δ j son aleatorias, por lo que la suma (para Ť 𝜏0 ) será 0. Entonces, el resultado final es 𝛾 (𝜏) = = e −i𝜔𝜏 𝜏0 − 𝜏 ; 𝜏0 0; 𝜏 < 𝜏0 (3.18) 𝜏 ≥ 𝜏0 . El módulo del grado de coherencia es |𝛾 (𝜏)| = 1 − 𝜏 , 𝜏0 (3.19) y la fase 𝛼 (𝜏) = 0. La representación gráfica se muestra en la fig. 3.5. Cuando 𝜏 = 0, la correlación de las ondas es máxima y el grado de coherencia Interferencia · 185 vale 1. Para valores 𝜏 > 𝜏0 , la correlación entre las ondas es nula, por lo tanto no hay interferencia y la irradiancia se reduce a la suma de las irradiancias individuales de las ondas, es decir, I = I1 + I2 . g (t) 1 t0 t Figura 3.5. Módulo del grado de coherencia para la fuente que emite pulsos aleatorios y consecutivos de duración 𝜏0 . Para ver en detalle el efecto de 𝛾 (𝜏) sobre la irradiancia en la pantalla de observación del interferómetro representado en la fig. 3.3, vamos a considerar la irradiancia en el punto {x = 0, y = 0}. Ya que el divisor de haz divide la amplitud de la onda en dos partes iguales, entonces I1 = I2 = I0 . Por lo tanto, la irradiancia en r = {0, 0} será 2𝜋𝜏 𝜏 I (0, 0) = 2I0 1 + 1 − cos , 𝜏 > 0. (3.20) 𝜏0 T La condición de 𝜏 > 0 se da porque hemos supuesto que d2 > d1 . Si embargo, el espejo 2 también se puede desplazar axialmente de manera que d2 < d1 , y ahora 𝜏 < 0. Con esto en mente 2𝜋𝜏 𝜏 cos , (3.21) I (0, 0) = 2I0 1 + 1 ± 𝜏0 T con el signo + para −𝜏0 < 𝜏 < 0 y con el signo − para 0 < 𝜏 < 𝜏0 . En la fig. 3.6, se muestra la irradiancia en función del retraso temporal (eq. (3.21)) en el rango −12T < 𝜏 < 12T , suponiendo que la fuente emite pulsos de duración 𝜏0 = 10T . Cuando los espejos están a la misma distancia del divisor de haz (punto O, fig. 3.3), d2 = d1 , entonces 𝜏 = 0 y se tiene el máximo valor de la irradiancia. Al desplazar axialmente uno de los espejos, la irradiancia oscila disminuyendo (aumentando) progresivamente el máximo (mínimo) de la irradiancia. Esta variación de la irradiancia ocurre de acuerdo con el módulo del grado de coherencia que se muestra en la fig. 3.5. Cuando el retraso temporal alcanza el valor de 𝜏0 , se anulan las oscilaciones 186 · Interferencia Irradiancia, I de la irradiancia, y para |𝜏 | > 𝜏0 la irradiancia se mantiene constante, esto es, I = 2I0 . Note que la envolvente de la gráfica de la irradiancia corresponde con el módulo del grado de coherencia. Así que tenemos una manera experimental (con un interferómetro de Michelson) para medir el grado de coherencia de una fuente luminosa. 4I 0 4I 0 2I 0 2I 0 envolvente 0 -10T -8T -6T -4T -2T 0 2T Retraso temporal, t 4T 6T 8T 10T 0 Figura 3.6. Irradiancia en función del retraso temporal 𝜏. Una oscilación completa de la irradiancia ocurre cada vez que la diferencia de camino óptico entre las ondas cambia en 𝜆 . En otras palabras, cada vez que el argumento de la función coseno cambia en 2𝜋 se obtiene un máximo (mínimo). Igualando el argumento de la función coseno a 2𝜋 en la siguiente forma: 2𝜋Δ𝜏/T = 2𝜋 (2Δd)/(cT ) = 2𝜋, se tiene que Δd = 𝜆 2 (3.22) es el incremento espacial en la separación de los espejos correspondiente a dos máximos o mínimos consecutivos. 3.1.3. Longitud de coherencia De lo dicho anteriormente, tendremos interferencia (modulación de la irradiancia) si el retraso temporal es menor a 𝜏0 . También es equivalente decir que se tendrá interferencia si la diferencia de camino óptico entre las ondas en la región de interferencia es menor a lc = c𝜏0 . A esta longitud se le llama longitud de coherencia y se suele usar para caracterizar la coherencia (temporal) de una fuente luminosa. Entonces, con el interferómetro de Michelson tenemos una forma de medir la longitud de coherencia. También se puede hacer por otro camino, que depende del ancho espectral (ancho de banda) de la fuente luminosa. Para ver esto, volvamos al pulso que hemos escogido como ejemplo, de acuerdo con la eq. (3.12). Aunque la vibración cosenoidal dentro de la función rect (eq. (3.13)) tiene una frecuencia definida, 𝜈0 , · Interferencia 187 el espectro del pulso no es un delta de Dirac localizado 𝜈0 , sino una distribución de frecuencias centradas en 𝜈0 debido a la duración finita del pulso. Una señal es estrictamente monocromática si está descrita por una función cosenoidal de duración infinita. Para evaluar el contenido espectral del pulso, hacemos uso del análisis de Fourier. Para un pulso en particular, la función 𝜙(t), que mide la fase inicial, tendrá un valor fijo. Omitiendo este término, la transformada de Fourier Ẽ(𝜈) = z [E(t)] será ∫∞ Ẽ(𝜈) = E0 rect(t/𝜏0 )e −i (2𝜋 𝜈0 t) e i2𝜋 𝜈t dt (3.23) −∞ ∫ ∞ = E0 rect(t/𝜏0 )e i2𝜋 𝜈t ∫ ∞ dt ∗ −∞ e −i (2𝜋 𝜈0 t) i2𝜋 𝜈t e dt , −∞ donde el símbolo ∗ denota la operación de convolución. Resolviendo las dos integrales se tiene que Ẽ(𝜈) = E0 [𝜏0 sin c (𝜋 𝜈 𝜏0 )] ∗ [𝛿 (𝜈 − 𝜈0 )] , (3.24) donde la función sinc(x) = sin(x)/x. La función delta centra a la función sinc(𝜋 𝜈 𝜏0 ) en 𝜈 = 𝜈0 . La gráfica de la eq. (3.24) se muestra en la fig. 3.7. El ancho espectral de la función sinc(𝜋 𝜈 𝜏0 ) se puede definir como la mitad de la separación espectral entre sus primeros ceros alrededor de 𝜈0 . Sea Δ𝜈 el ancho espectral, las posiciones espectrales de los primeros ceros se tienen en 𝜋 (𝜈0 + Δ𝜈)𝜏0 = 𝜋 y 𝜋 (𝜈0 − Δ𝜈)𝜏0 = −𝜋. Restando se llega a ~ Amplitud espectral, E(n ) Δ𝜈 = 1 . 𝜏0 (3.25) E 0t 0 Dn ~ 1/t 0 0 0 n 0 - 1/t 0 n0 Frecuencia, n n 0 +1/t 0 Figura 3.7. Espectro del pulso dado por la eq. (3.12). El ancho espectral Δ𝜈 se aproxima por la mitad de la separación espectral de los primeros ceros de la funcion sinc(𝜋 𝜈 𝜏0 ). 188 · Interferencia Entonces, el inverso del ancho espectral es una medida del tiempo de duración del pulso, el cual, a su vez, determina la longitud de coherencia. Por lo tanto, la longitud de coherencia de una fuente luminosa que tiene un ancho espectral Δ𝜈 está dada por lc = c . Δ𝜈 (3.26) Ya que 𝜈 = c/𝜆 , tomando las diferenciales para 𝜈 y 𝜆 , Δ𝜈 = −𝜈Δ𝜆 /𝜆 , se llega a una forma alternativa para la longitud de coherencia dada por 2 𝜆 lc = , |Δ𝜆 | (3.27) donde 𝜆 es el valor central de la longitud de onda en el rango espectral de ancho Δ𝜆 . Considerando el modelo clásico para una fuente de iluminación, el ancho espectral de la línea (para los osciladores electrónicos) es una constante universal [16] (3.28) Δ𝜆 = 1.2 × 10−4 Å. Con este valor, la longitud de coherencia para una línea del espectro visible, varía como 1.3 m < lc < 4.1 m (para 400 nm < 𝜆 0 < 700 nm). Por otro lado, para la luz blanca (también en el rango espectral entre 400 nm (violeta) y 700 nm (rojo)), la longitud de coherencia será aproximadamente lc = 1 𝜇m, con 𝜆 = 550 nm y Δ𝜆 = 300 nm. Otras fuentes, como lámparas de arco de mercurio, tienen longitudes de coherencia del orden de 3 cm y, lámparas de descarga de Kr, tienen longitudes de coherencia del orden de 30 cm. Por su parte, los láseres tienen grandes longitudes de coherencia. Por ejemplo, un láser de He-Ne estabilizado puede tener una longitud de coherencia de 300 m. Interferencia · 189 3.2. Interferencia de dos ondas planas M2 M1 O S LC BS y x Pantalla de observación Figura 3.8. Interferencia de ondas planas con un interferómetro de Michelson. Cuando los espejos son ortogonales a los vectores de onda, en la pantalla de observación se tiene una región iluminada uniformemente que cambia el nivel de irradiancia al desplazar axialmente uno de los espejos. En la anterior unidad, encontramos que la expresión para la interferencia de dos ondas planas de frecuencia angular 𝜔 = 2𝜋 𝜈0 está dada por p I (r) = I1 + I2 + 2 I1 I2 |𝛾 (𝜏)| cos(Δk · r+𝜔𝜏 + 𝛼 (𝜏)), donde |𝛾 (𝜏)| es el módulo del grado de coherencia, Δk = k2 − k1 la diferencia de los vectores de onda en el punto de observación r, 𝜏 el retraso temporal de las ondas con respecto a un punto o plano de referencia (punto O en el divisor de haz) y 𝛼 (𝜏) la fase ( junto con 𝜔𝜏) del grado de coherencia. Al tomar las dos ondas de la misma fuente, encontramos que 𝛼 (𝜏) = 0. En la práctica para observar la interferencia de dos ondas planas se suele expandir el haz (ampliar su sección transversal) que llega al divisor de haz. Lo anterior se puede hacer enfocando la luz en un punto S, el cual se hace coincidir con el punto focal primario de una lente corregida de aberraciones. A esta lente se le denomina lente colimadora, LC, como se muestra en la fig. 3.8. Después de la lente, tendremos frentes de onda planos ortogonales al eje óptico de la lente, que también tomaremos como eje óptico del interferómetro. Cualquiera de estos frentes de onda se puede tomar como plano de referencia, en particular, tomaremos el frente de onda que llega al punto O del divisor de haz. Una vez que se dividen los haces, desde O podremos medir las diferencias de camino óptico. · 190 Interferencia Supongamos que iluminamos con una fuente cuyo grado de coherencia se mantiene constante para los desplazamientos de los espejos que vamos a considerar, |𝛾 (𝜏)| = |𝛾 |. Dejando los espejos planos M1 y M2 ortogonales a los vectores de onda de los haces transmitido y reflejado por el divisor de haz, tenemos que la interferencia en el plano de observación estará dada por p I (x, y) = I1 + I2 + 2 |𝛾 | I1 I2 cos(𝜔𝜏). (3.29) Para 𝜏 fijo, I (x, y) no depende de x ni de y, por lo tanto en el plano de observación tendremos una distribución de irradiancia uniforme, como se muestra en la fig. 3.8. Al desplazar axialmente uno de los espejos, cambia el nivel de irradiancia en la pantalla de observación obteniendo valores máximos en (d2 − d1 ) = m𝜆 /2 (con m entero). En la fig. 3.9, se muestra tres ejemplos de la variación del nivel de irradiancia (con I1 = I2 = I0 ) en el plano de observación en función del desplazamiento axial relativo entre los espejos M1 y M2 , para tres grados de coherencia: |𝛾 | = 1, 1/2, 0. g (t )=1 Irradiancia, I 4I 0 2I 0 0 g (t )=1/2 4I 0 2I 0 - 2l l 0 (d 2 - d1 ) l 2l 0 g (t )=0 4I 0 2I 0 - 2l l 0 (d 2 - d1 ) l 2l 0 - 2l l 0 (d 2 - d1 ) l 2l Figura 3.9. Modulación de la irradiancia para diferentes grados de coherencia en el interferómetro de la fig. 3.8 en función de la diferencia de la posición de los espejos con respecto al punto O en el divisor de haz. Observando la variación de la irradiancia en función de (d2 − d1 ), podemos medir directamente |𝛾 |. En particular, se mide el máximo y el mínimo de irradiancia, que a su vez están dados por p Imáx = I1 + I2 + 2 |𝛾 | I1 I2 , (3.30) p Imı́n = I1 + I2 − 2 |𝛾 | I1 I2 , (3.31) de acuerdo con la eq. (3.29). Definiendo la visibilidad o contraste de la modulación de la irradiancia como C= Imáx − Imı́n , Imáx + Imı́n (3.32) se obtiene el módulo del grado de coherencia reemplazando las eqs. (3.30) y (3.31) en la eq. (3.32), es decir |𝛾 | = (I1 + I2 ) C. √ 2 I1 I2 (3.33) Interferencia · 191 Entonces, a partir de medidas de irradiancia se determina el módulo del grado de coherencia. Medimos las irradiancias individuales de cada onda y el contraste. En particular, si el divisor de haz refleja el 50 % y transmite el 50 %, entonces I1 = I2 y |𝛾 | = C. En este caso, el contraste es la medida del módulo del grado de coherencia. 3.2.1. Interferencia con ondas planas inclinadas En lo que sigue, vamos a suponer que |𝛾 (𝜏)| = 1. Por ejemplo, iluminando con un láser cuya longitud de coherencia es mucho mayor que los desplazamientos axiales de los espejos. Si giramos los espejos M1 y M2 un ángulo 𝛼/2, como se muestra en la fig. 3.10, cada haz en la región de interferencia estará inclinado un ángulo 𝛼 con respecto al eje óptico (vertical). En cada espejo, el giro se hace con respecto al punto de intersección del espejo con el eje óptico, esto es, O1 en el espejo M1 y O2 en el espejo M2 . Así, el ángulo entre los dos haces en la región de interferencia es 2𝛼. En el lugar de la superposición, se tendrá un patrón de franjas rectas (patrón de interferencia) cuya separación dependerá del ángulo de inclinación. O2 M2 a /2 M1 O S LC BS k1 O1 a /2 k2 y x Patrón de interferencia Figura 3.10. Interferencia con ondas planas inclinadas. En la pantalla de observación se tendrá un patrón de franjas. La separación de las franjas depende del ángulo de inclinación de los espejos. Para determinar la geometría de las franjas, primero vamos a suponer que las distancias de los espejos d1 = OO1 y d2 = OO2 son iguales. Lo anterior implica que no tendremos un retraso temporal entre las ondas a lo largo del eje óptico. La intersección del eje óptico con la pantalla de ob- 192 · Interferencia servación se toma como el origen de coordenadas para el interferograma (x = 0, y = 0). Ahora la expresión para la interferencia será p (3.34) I (r) = I1 + I2 + 2 I1 I2 cos(Δk · r). Si suponemos que la pantalla de observación está en el plano z = 0, de acuerdo con la geometría de la fig. 3.10, tendremos k1 = (2𝜋/𝜆 ){s1x , 0, s1z } y k2 = (2𝜋/𝜆 ){s2x , 0, s2z } con s1z = s2z , s1x = −s2x . Por otro lado, r = {x, y, 0}. Entonces, Δk · r = (2𝜋/𝜆 ) (s2x − s1x )x, y ya que s2x = sin 𝛼, se tiene que 2𝜋 Δk · r = (2x sin 𝛼). (3.35) 𝜆 Lo anterior indica que en la pantalla de observación se tendrá una modulación de la irradiancia en la dirección x, de acuerdo con p 4𝜋 I (x) = I1 + I2 + 2 I1 I2 cos x sin 𝛼 . (3.36) 𝜆 En la fig. 3.11, se muestra el patrón de interferencia simulado para dos ondas planas cuando 𝛼 = 0.01◦ , 𝜆 = 632.8 nm y I1 = I2 . La región donde se observa el patrón corresponde con (−5 < x < 5) mm y (−5 < y < 5) mm. La separación Δx entre dos máximos o mínimos consecutivos de irradiancia ocurre cada vez que (4𝜋/𝜆 )x sin 𝛼 cambia en 2𝜋, es decir, 𝜆 Δx = . (3.37) 2 sin 𝛼 Note que en el ejemplo de la fig. 3.11 para tener una separación entre franjas igual a 1.81 mm el ángulo de giro de los espejos es muy pequeño, 𝛼/2 = 0.005◦ . y -5 -4 -3 -2 -1 5 0 1 2 3 4 5 4 3 2 1 x 0 -1 -2 -3 -4 -5 Dx = l 2sina Dx = 1.81 Figura 3.11. Simulación del patrón de interferencia generado por dos ondas planas inclinadas cuando |𝛾 (𝜏)| = 1. El ángulo 𝛼 = 0.01◦ y 𝜆 = 632.8nm. La escala de los ejes está dada en mm. · Interferencia 193 3.2.2. Desplazamiento de las franjas Cuando en el interferómetro de la fig. 3.8, se desplaza axialmente uno de los espejos ocurre un cambio en el nivel de irradiancia que se tiene en la pantalla de observación. No se tiene una modulación espacial de la irradiancia (a lo largo de la pantalla de observación); la modulación es axial, es decir, temporal. Si en el interferómetro de la fig. 3.10 desplazamos axialmente uno de los espejos (d2 − d1 ≠ 0), en cada punto de la pantalla de observación también ocurre un cambio en el nivel de la irradiancia, pero el efecto neto que se observa es un desplazamiento transversal de las franjas en la dirección x. El desplazamiento axial de uno de los espejos introduce un retraso temporal 𝜏 = 2(d2 − d1 )/c entre las ondas (con respecto al punto O), y la irradiancia estará dada por p 4𝜋 4𝜋 I (x) = I1 + I2 + 2 I1 I2 cos x sin 𝛼 + (d2 − d1 ) . 𝜆 𝜆 d 2 - d1 = l 8 d 2 - d1 = 0 -5 -4 -3 -2 -1 5 0 1 2 3 4 5 -5 -4 -3 -2 -1 5 0 1 (3.38) d 2 - d1 = l 4 2 3 4 5 -5 -4 -3 -2 -1 5 4 4 4 3 3 3 2 2 2 1 1 1 0 0 0 -1 -1 -1 -2 -2 -2 -3 -3 -3 -4 -4 -4 -5 -5 0 1 2 3 4 5 x -5 x = - 0.45 x = - 0.90 Figura 3.12. Desplazamiento transversal de las franjas de interferencia en función del desplazamiento axial del espejo M1 acercándose al divisor de haz. La diferencia de camino óptico en las imágenes es d2 − d1 = 0, 𝜆 /8, 𝜆 /4. La escala de los ejes está dada en mm. Si acercamos el espejo M1 al punto O, tal que d2 − d1 > 0, se incrementa el valor del argumento de la función coseno y, para mantener el valor inicial, x debe tomar un valor negativo, por lo que las franjas se desplazan hacia la izquierda. En la fig. 3.12, se simulan tres interferogramas con 𝛼 = 0.01◦ , 𝜆 = 632.8 nm y I1 = I2 , cuando el corrimiento axial del espejo M1 da lugar a d2 − d1 = 0, 𝜆 /8, 𝜆 /4. Si alejamos el espejo M1 del punto O, tal que d2 − d1 < 0, el desplazamiento de las franjas será hacia la derecha. 194 · Interferencia 3.2.3. Visibilidad del interferograma Con la eq. (3.32), se definió el contraste de la modulación de la irradiancia en la dirección axial. Esta cantidad, basada en las irradiancias, permite medir el grado de coherencia. La eq. (3.32) también se puede usar para medir la visibilidad de las franjas de los patrones de interferencia, donde Imáx y Imı́n son los valores máximo y mínimo de la irradiancia de las franjas. El cambio en la visibilidad depende del grado de coherencia y de la relación entre las intensidades de las dos ondas. Por ejemplo, si |𝛾 | = 1, entonces la visibilidad √ 2 I1 I2 C= (3.39) (I1 + I2 ) solo depende de la relación entre I1 y I2 . En la fig. 3.13, se muestra tres interferogramas junto con sus perfiles en la dirección x cuando las amplitudes de las ondas son E1 = E0 y E2 = E0 , E1 = E0 y E2 = 0.4E0 , E1 = E0 y E2 = 0.1E0 . En el primer caso, se tiene que Imáx = 4I0 , Imı́n = 0 y C = 1; en el segundo, se tiene que Imáx = 1.96I0 , Imı́n = 0.36I0 y C = 0.69; y en el tercero, se tiene que Imáx = 1.21I0 , Imı́n = 0.81I0 y C = 0.20. Note que la irradiancia oscila espacialmente alrededor del valor promedio I1 + I2 , que en el primer caso es 2I0 , en el segundo caso es 1.16I0 y en el tercer caso es 1.01I0 . 5 4 3 2 1 0 1 2 3 4 5 5 4 3 2 1 0 1 2 3 4 5 5 4 3 2 1 1 1 1 2 2 2 3 3 3 4 4 4 5 5 E E 0 1 2 3 4 5 x 5 E E E E Irradiancia, I 4I 2I 1.16I 0 5 4 3 2 1 0 C 1 2 3 4 5 1.01I 5 4 3 2 1 0 1 C 2 3 4 5 5 4 3 2 1 0 1 2 3 4 5 C Figura 3.13. Interferogramas cuando la visibilidad de las franjas depende de la relación de las amplitudes de las ondas: C = 1, 0 (E1 = E0 y E1 = E0 ), C = 0.69 (E1 = E0 y E1 = 0.4E0 ), C = 0.20, (E1 = E0 y E1 = 0.1E0 ). El módulo del grado de coherencia está fijo en |𝛾 | = 1 . La escala de los ejes está dada en mm. Interferencia Entonces, cuando I1 = I2 = I0 y |𝛾 | = 1 se tiene que 2 4𝜋 I = 4I0 cos x sin 𝛼 , 𝜆 · 195 (3.40) de donde Imáx = 4I0 y Imı́n = 0, y la visibilidad es C = 1. Si I1 ≠ I2 , la visibilidad disminuye, y se hace cero si I1 = 0 o si I2 = 0. Si además se tiene que |𝛾 | < 1, entonces ocurre una disminución adicional de la amplitud de la oscilación espacial de las franjas (manteniendo el valor promedio). En otras palabras, la amplitud de los perfiles mostrados en la fig. 3.13 disminuye. En la práctica, uno de los espejos del interferómetro está fijo y alineado, mientras que el otro se puede desplazar e inclinar mediante tornillos de precisión. El análisis que hemos realizado para la formación de las franjas sigue siendo válido, obteniéndose los mismos resultados. 196 · Interferencia 3.3. Interferencia de dos ondas esféricas Una fuente luminosa se dice puntual si su tamaño aparente es despreciable con respecto a la distancia a la que se detecta la señal. El frente de onda detectado se verá como un frente de onda esférico cuyo radio es igual a la distancia entre la fuente y el punto de observación. En la unidad anterior, se mostró la generación de dos ondas planas mediante el interferómetro de Michelson. Esto gracias a que la fuente puntual se ubica en el punto focal primario de la lente LC (fig. 3.8). Si la fuente puntual se desplaza axialmente con respecto al punto focal primario de la lente LC, el frente de onda refractado por la lente será esférico y el radio de curvatura será igual a la distancia entre el conjugado de la fuente puntual y el punto en que se mide el frente de onda. Una vez que la onda esférica se divide en el divisor de haz, los espejos M1 y M2 generan dos imágenes virtuales (fuentes secundarias puntuales) del conjugado de la fuente puntual, y en la región de interferencia tendremos la superposición de dos ondas esféricas. En esta unidad, también mostraremos la interferencia cuando los espejos son ortogonales al eje óptico del interferómetro y cuando los espejos se inclinan un ángulo pequeño. P s2 S2 -a 2 r r s1 O S1 a 2 z Figura 3.14. Geometría para describir la interferencia de dos ondas esféricas emitidas por las fuentes puntuales S1 y S2 . Antes de ver los dos casos, vamos a describir la geometría del problema de acuerdo con la fig. 3.14. Supongamos que tenemos dos fuentes puntuales en un medio isotrópico y homogéneo (aire, n = 1) separadas una distancia a, localizadas en z = −a/2 y z = a/2, y se quiere determinar la irradiancia en un punto P localizado en r = {x, y, z}. Si las dos fuentes son imágenes de una fuente primaria, que emite ondas esféricas de frecuencia angular 𝜔 = 2𝜋 𝜈0 , las fases iniciales serán iguales y podremos escribir los campos de las ondas esféricas emitidas por S1 y S2 en el punto P como1 E1 (s1 , t) = 1 E† 0 † E01 s1 e i (ks1 −𝜔t) (3.41) es la amplitud del campo multiplicada por la unidad de longitud. Así, la amplitud del campo óptico en un frente de onda esférico de radio r será E0 = E0† /r. · Interferencia 197 y E2 (s2 , t) = † E02 s2 e i (ks2 −𝜔t) , (3.42) 1/2 1/2 , donde, a su y s2 = 𝜌2 + (a/2 + z) 2 donde s1 = 𝜌2 + (a/2 − z) 2 2 1/2 es la coordenada radial de la proyección del punto vez, 𝜌 = x + y 2 P en el plano xy. La forma escalar de las ecuaciones implica que en P los campos tienen el mismo estado de polarización. Si dejamos |𝛾 (𝜏)| = 1, la irradiancia en P debido a la superposición de las dos ondas será 𝜖 0c (E1 + E2 ) E1∗ + E2∗ . (3.43) I (r) = 2 † Las irradiancias individuales en P serán I1 = 𝜖 0 c(E01 /s1 ) 2 /2 y I2 = † 𝜖 0 c(E02 /s2 ) 2 /2. Con esto en mente, la eq. (3.43) queda p 2𝜋 (s2 − s1 ) . (3.44) I (r) = I1 + I2 + 2 I1 I2 cos 𝜆 Note que en esta situación (s2 − s1 )/c mide el retraso temporal de las ondas al llegar a P. Cuando el argumento de la función coseno toma un valor constante q, entonces 2𝜋 (s2 − s1 ) /𝜆 = q describe superficies en que la irradiancia es constante. En particular, si 2𝜋 (s2 − s1 ) /𝜆 = 2𝜋m (m = 0, ±1, ±2, ... ), tendremos superficies de máxima irradiancia. Estas superficies son hiperboloides de revolución definidos por (s2 − s1 ) = m𝜆 , (3.45) donde las fuentes puntuales son los puntos focales de las hipérbolas. 0 2 50 250 r (mm) 1 450 650 0 750 780 787 790 -1 -2 -5 -4 -3 -2 -1 0 z (mm) 1 2 3 4 5 Figura 3.15. Algunas curvas de máxima irradiancia generadas por fuentes puntuales localizadas en z = −0.25 mm y z = 0.25 mm, para m = 0, 50, 250, 450, 650, 750, 780, 787 y 790, con 𝜆 = 632.8 nm. · 198 Interferencia En la fig. 3.15, se muestra algunas de las hipérbolas que resultan de la intersección de un plano meridional con el eje z cuando las dos fuentes puntuales están separadas a = 0.5 mm y 𝜆 = 632.8 nm, para m = 0, 50, 250, 450, 650, 750, 780, 787 y 790. A lo largo de estas curvas, la irradiancia tiene un valor máximo. El número de curvas a lo largo de las cuales se obtiene el máximo de irradiancia está determinado por el entero inferior más próximo al cociente a/𝜆 , es decir, mmáx ≡ a/𝜆 , que en nuestro ejemplo es 790. La superficie para m = 0 es el plano z = 0 (que está en medio de las dos fuentes). En este caso, la diferencia de camino óptico es cero para cualquier punto de coordenadas {x, y, 0}. En particular, vamos a ver en detalle la interferencia en planos paralelos al plano z = 0 y al plano y = 0. En el primer caso, debido a la simetría de revolución alrededor del eje z, las curvas de máxima irradiancia en planos paralelos a z = 0 son círculos. Para determinar los radios de estos círculos escribimos en forma explícita la eq. (3.45) y despejamos s2 , q 𝜌2 + (a/2 + z) 2 = m𝜆 + q 𝜌2 + (a/2 − z) 2 . (3.46) Elevando al cuadrado y simplificando, tenemos que el radio del círculo para un m dado en el plano z = z0 está dado por s 𝜌m = 2az0 − m 2 𝜆 2 2m𝜆 2 − a 2 2 − z0 . (3.47) y 16 14 (mm) 12 10 8 6 4 2 0 780 x 782 784 786 788 790 792 m Figura 3.16. Franjas circulares de interferencia en el plano z = 100 mm centradas en {x, y} = {0, 0}, generadas por dos fuentes puntuales separadas a = 0.5 mm y localizadas en z = −a/2 y z = a/2, de longitud de onda 𝜆 = 632.8 nm. Interferencia · 199 En la fig. 3.16, se muestra las franjas circulares de interferencia y la variación del radio de las franjas para el ejemplo de dos fuentes puntuales separadas a = 0.5 mm (localizadas en z = −a/2 y z = a/2 y 𝜆 = 632.8 nm) en el plano z = 100 mm. A medida que nos alejamos del centro, las franjas se acercan entre sí. En el segundo caso, para un plano paralelo al plano y = 0, las intersecciones de los hiperboloides son curvas abiertas (hipérbolas). La posición de las curvas de máxima irradiancia a lo largo de la dirección z en función de m se obtiene dejando x = 0 y y = y0 en la eq. (3.46), esto es, s zm = -40 -30 -20 -10 40 0 10 20 30 m𝜆 2 4y02 a2 − m2 𝜆 2 + 1. (3.48) x 40 30 20 10 z 0 -10 -20 -30 -40 a=l ; y0 = 10mm a = 8l ; y0 = 10mm a = 8l ; y0 = 50mm a = 8l ; y0 = 100mm a = 32l ; y0 = 200mm Figura 3.17. Franjas de interferencia en planos paralelos al plano y = 0 localizados en y0 = 10, 50, 100 y 200 mm, generadas por dos fuentes puntuales separadas a = 𝜆 , 8𝜆 y 32𝜆 , con 𝜆 = 632.8 nm. La escala de los ejes está dada en mm. En la fig. 3.17, se muestra algunos interferogramas obtenidos en diferentes planos paralelos al plano y = 0 y para diferentes separaciones entre las fuentes, en una región de observación de 80 mm ×80 mm centrada en z = 0 y x = 0. El primer interferograma, en el plano y = 10 mm, tiene mmáx = 1, por lo que z1 → ∞. En otras palabras, solo se tiene una franja de interferencia, la franja central (m = 0), lo demás es una distribución de irradiancia que se extiende hasta infinito en cada lado. El segundo interferograma, también en el plano y = 10 mm, tiene mmáx = 8 y se observan todas las franjas de interferencia que se pueden tener en esta situación, 7 franjas de interferencia a cada lado de la franja central (m = ±1, ±2, ±3, ±4, ±5, ±6, ±7, a medida que se alejan de la franja central). La forma de las franjas es hiperbólica. En el tercer interferograma, se aleja el plano de observación a y = 50 mm, por lo que ahora vemos menos franjas de interferencia. El cuarto interferograma, se aleja aún más, a y = 100 mm, disminuyendo nuevamente el número de franjas. Ahora las franjas parecen rectas e igualmente espaciadas. Y el último interferograma, con y = 200 mm, tiene mmáx = 32. 200 · Interferencia Las franjas de interferencia en la región de observación son rectas e igualmente espaciadas. Esta última afirmación se puede soportar en el hecho que cuando el máximo número de franjas m en la región de observación satisface 2 , entonces a 2 m 2 𝜆 2 y la eq. (3.48) se puede aprola relación m 2 mmáx ximar por zm = m𝜆 y0 /a. Así, las franjas en esa región están uniformemente espaciadas con una separación igual a Δz = 𝜆 y0 . a (3.49) Volviendo al último interferograma, el máximo número de franjas laterales es 5 y, en efecto, se satisface que 25 1024. Las dos situaciones correspondientes a las figs. 3.16 y 3.17 se tienen en el interferómetro de Michelson cuando iluminamos con una onda esférica. La primera con la configuración de la fig. 3.8 y la segunda con la configuración de la fig. 3.10. En lo que sigue, veremos estos dos casos. 3.3.1. Franjas circulares con el interferómetro de Michelson Si en el interferómetro mostrado en la fig. 3.8 desplazamos axialmente la lente colimadora o simplemente retiramos la lente, al divisor de haz llega un frente de onda esférico, como se muestra en la fig. 3.18. Los espejos M1 y M2 formarán imágenes virtuales de la fuente puntual de la cual diverge el frente de onda. Estas imágenes virtuales constituyen dos fuentes puntuales secundarias S1 y S2 . Al mirar desde la pantalla de observación hacia el divisor de haz, veremos las dos fuentes puntuales secundarias, una detrás de otra, a lo largo del eje óptico del interferómetro,2 separadas una distancia a = 2(d2 − d1 ), siendo d2 = OO2 y d1 = OO1 . Los radios de curvatura de los frentes de onda emitidos por S2 y S1 , en la pantalla de observación, son: R2 = 2d2 + OS + OOP y R1 = 2d1 + OS + OOP . OP es la intersección del eje óptico del interferómetro con la pantalla de observación (x = 0 y y = 0). Manteniendo el origen de coordenadas en medio de las dos fuentes secundarias (como en la fig. 3.14) se tiene que z0 = (R1 +R2 )/2. En consecuencia, R1 = z0 − a/2 y R2 = z0 + a/2, y ΔR = R2 − R1 = a. En lo que sigue, vamos a suponer que R2 > R1 . 2 Note que S es la imagen virtual de S generada por el espejo M , pero S es la reflexión 2 2 1 en el divisor de haz de la imagen virtual que genera el espejo M1 de S. Esta imagen virtual está a la derecha del espejo M1 , pero para un observador en la pantalla de observación las dos fuentes secundarias están alineadas. Interferencia S2 · 201 a S1 M2 O2 M1 S O1 O BS y OP x Pantalla de Observación Figura 3.18. Interferómetro de Michelson iluminado por una onda esférica. En la pantalla de observación, a lo largo del eje óptico del interferómetro, se tiene un patrón de franjas circulares cuando la separación entre las fuentes secundarias S1 y S2 es a ≠ 0. 202 · Interferencia La interferencia de las dos ondas esféricas en la pantalla de observación se verá como se muestra en la fig. 3.16. Consideremos ahora qué ocurre con las franjas de interferencia si desplazamos axialmente uno de los espejos, por ejemplo, el espejo M2 . Para ver esto, supongamos que desplazamos el espejo M2 de modo que la separación entre las fuentes secundarias es a = 500𝜆 , 400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 y 0 (con 𝜆 = 632.8 nm). Mantenemos la pantalla de observación en z0 = 100 mm y la región de observación centrada en el eje z tiene las dimensiones 33 mm × 33 mm. Los radios de los círculos de máxima irradiancia se muestran en la fig. 3.19. El valor máximo de m, mmáx = a/𝜆 , se toma como punto de referencia y en cada caso nos dice que en el interferograma tenemos un máximo de irradiancia en {0, 0, z0 }. El primer anillo de irradiancia (franja circular) ocurre para mmáx − 1, y cada curva nos dice cuál es el radio del círculo de máxima irradiancia correspondiente (que en adelante tomaremos como el radio del anillo). El segundo anillo de irradiancia ocurre para mmáx − 2, y así sucesivamente. En la fig. 3.20, se muestra los patrones de interferencia para a = 500𝜆 , 400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 . Para a = 0, la región estará completamente iluminada; es decir, no se tienen anillos de interferencia, lo que se ilustra en la fig. 3.19 con la línea vertical etiquetada con 0. 16 14 500l 300 l 20 0 l 100 r (mm) 400 l l 12 10 0 8 6 4 2 0 mmax -6 m max -5 m max -4 m max -3 mmax -2 m max -1 mmax m Figura 3.19. Radios de los círculos de máxima irradiancia en función del número m con respecto a mmáx para diferentes valores de la separación (a = 500𝜆 , 400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 y 0) de las fuentes puntuales secundarias en el interferómetro de la fig. 3.18. Consideremos la posición del primer anillo en cada interferograma. Si inicialmente la posición del espejo M2 con respecto al espejo M1 da una separación a = 300𝜆 , el radio del primer anillo es 𝜌 mmáx −1 = 8.18 mm. Desplazando el espejo M2 , acercándose al divisor de haz, tal que a = 200𝜆 , el radio del primer anillo aumenta a 𝜌 mmáx −1 = 10.04 mm. Y cuando se des- Interferencia · 203 plaza el espejo M2 , alejándose del divisor de haz, tal que a = 400𝜆 , el radio del primer anillo disminuye a 𝜌 mmáx −1 = 7.08 mm. Luego, si R2 > R1 , al desplazar el espejo M2 disminuyendo la separación a, veremos un aumento en el radio de los anillos y, por lo tanto, menos anillos en la región de observación. Y al contrario, al desplazar el espejo M2 aumentando la separación a, veremos una disminución en el radio de los anillos y, por lo tanto, más anillos en la región de observación. Cuando se sigue el desplazamiento lentamente, en fracciones de longitud de onda, el efecto cuando a aumenta es que desde el centro emergen anillos y el efecto cuando a disminuye es que hacia el centro convergen anillos, como se muestra en la fig. 3.21 para a = 300𝜆 , a = (300 + 1/4)𝜆 , a = (300 + 1/2)𝜆 , a = (300 + 3/4)𝜆 y a = 301𝜆 . Una situación análoga se tiene si R2 < R1 . -16 -12 -8 16 -4 0 4 8 12 y 16 12 8 4 x 0 -4 -8 -12 -16 a = 500l a = 400l a = 300l a = 200l a = 100l Figura 3.20. Patrones de interferencia para diferentes separaciones a = 500𝜆 , 400𝜆 , 300𝜆 , 200𝜆 , 100𝜆 (𝜆 = 632.8 nm) en el interferómetro de la fig. 3.18 cuando la pantalla de observación está en z0 = 100 mm. La escala de los ejes está dada en mm. -16 -12 -8 16 -4 0 4 8 12 y 16 12 8 4 x 0 -4 -8 -12 -16 a = 300l a = 300.25l a = 300.50l a = 300.75l a = 301l Figura 3.21. Patrones de interferencia para diferentes separaciones a = 300𝜆 , 300.25𝜆 , 300.50𝜆 , 300.75𝜆 y 301𝜆 (𝜆 = 632.8 nm) en el interferómetro de la fig. 3.18 cuando la pantalla de observación está en z0 = 100 mm. La escala de los ejes está dada en mm. Aproximación para calcular el radio de los anillos La eq. (3.47) nos da los radios de las franjas en que se tiene la máxima irradiancia. En muchas situaciones prácticas en interferometría, se tiene que la separación de las fuentes secundarias es mucho menor que los radios de 204 · Interferencia curvatura R1 y R2 , es decir, ΔR {R1 , R2 }, y el tamaño de la región en que se observa el patrón de interferencia también es mucho menor que los radios de curvatura R1 y R2 . En este caso, podemos aproximar la distancia de las fuentes virtuales S1 y S2 a un punto en la pantalla de observación como s1 = R1 + Δ1 (3.50) y s2 = R2 + Δ2 , con (3.51) Δ1 = 𝜌2 2R1 (3.52) Δ2 = 𝜌2 , 2R2 (3.53) y donde 𝜌 es la distancia radial del punto en la pantalla de observación con respecto a x = 0 y y = 0. Δ1 y Δ2 son las distancias de los frentes de onda de radios R1 y R2 al punto en la pantalla de observación en la aproximación de segundo orden. Así, la diferencia (s2 − s1 ) en la eq. (3.44) para un punto en la pantalla de observación será 𝜌2 1 1 s2 − s1 = R2 − R1 + − . (3.54) 2 R2 R1 Por lo tanto, los círculos de máxima irradiancia en la pantalla de observación se obtienen cuando 𝜌2 = m𝜆 . (3.55) ΔR 1 − 2R1 R2 Y el radio de los círculos en función de m será r R1 R2 𝜌 m = 2 (ΔR − m𝜆 ) . ΔR (3.56) Nuevamente tenemos que el valor máximo de m (franja circular más cerca del centro) está dado por m = ΔR/𝜆 = a/𝜆 . Con la eq. (3.47), obtenemos el valor exacto de los radios de los círculos de máxima irradiancia, mientras que con la eq. (3.56) obtenemos los valores de los radios de los círculos en la aproximación de segundo orden. Para comparar los resultados dados por las dos ecuaciones, recordamos que R1 = z0 −a/2 y R2 = z0 +a/2. En la fig. 3.22, se comparan los resultados obtenidos Interferencia · 205 con las eqs. (3.47) y (3.56) para las primeras franjas circulares cuando a = 0.5 mm, z0 = 100 mm y 𝜆 = 632.8 nm. 16 exacta 14 aproximada r (mm) 12 10 8 6 4 2 0 780 782 784 786 m 788 790 792 Figura 3.22. Comparación de los radios de los círculos de irradiancia constante calculados con la forma exacta (la eq. (3.47)) y la forma aproximada (eq. (3.56)) para las primeras 11 franjas circulares, cuando a = 0.5 mm y z0 = 100 mm, con 𝜆 = 632.8 nm. La separación entre dos franjas consecutivas, tomada como la diferencia de los radios de los círculos de máxima irradiancia, se puede evaluar restando 𝜌 m − 𝜌 m+1 . Primero, hacemos la resta de los cuadrados, de donde se obtiene R1 R2 𝜌2m − 𝜌2m+1 = 2𝜆 . (3.57) ΔR Reescribiendo el lado izquierdo como ( 𝜌 m − 𝜌 m+1 ) ( 𝜌 m + 𝜌 m+1 ) y definiendo la separación entre dos franjas consecutivas como Δ 𝜌 = ( 𝜌 m − 𝜌 m+1 ) y el valor medio de los radios como 𝜌 = ( 𝜌 m + 𝜌 m+1 )/2, entonces Δ𝜌 = 𝜆 R1 R2 . 𝜌 ΔR (3.58) Note que hemos omitido el subíndice m en Δ 𝜌 y 𝜌, ya que el lado derecho de la eq. (3.57) no depende de m. La eq. (3.58) muestra cómo la separación entre franjas disminuye inversamente proporcional a la posición (radios) de las franjas a medida que nos alejamos del centro del interferograma. Por último, si ΔR {R1 , R2 }, entonces R1 R2 ≈ z02 , y la eq. (3.58) también se puede escribir como 2 𝜆 z0 Δ𝜌 = . (3.59) 𝜌 a 206 · Interferencia En la práctica, 𝜌 puede ser tomado como el radio del anillo oscuro entre las dos franjas brillantes para las cuales se quiere medir la separación, a es el doble de la diferencia de la separación de los espejos (con respecto al divisior de haz) y z0 es la media geométrica de los radios de curvatura de los frentes de onda que interfieren. 3.3.2. Aproximación de franjas paralelas con el interferómetro de Michelson Cuando el interferómetro de la fig. 3.10 se ilumina con ondas esféricas, manteniendo la separación de los espejos igual, es decir, (d2 − d1 ) = 0, las fuentes puntuales secundarias S1 y S2 se verán como se ilustra en la fig. 3.23. Las fuentes S1 y S2 están a la misma distancia axial de la pantalla de observación, pero tienen una separación transversal a 0 que depende del ángulo de giro 𝛼/2 de los espejos. El patrón de interferencia en la pantalla de observación consiste en franjas cuya irradiancia máxima sigue curvas que resultan de la intersección de hiperboloides de revolución con el plano en la pantalla de observación, semejantes a las que se muestran en el ejemplo de la fig. 3.17 (salvo por el nombre los ejes). En la fig. 3.23, si z0 es la distancia axial entre las fuentes {S1 , S2 } y la pantalla de observación, y a 0 la separación entre S1 y S2 , la separación de las franjas a lo largo de la dirección x en la pantalla de observación estará dada por la eq. (3.48), pero cambiando el nombre de los parámetros y0 → z0 y a → a 0, y cambiando el nombre de la variable zm → xm . Así, para la geometría del interferómetro de la fig. 3.23, la posición de las franjas de interferencia en la dirección x será s xm = m𝜆 2 4z02 a 02 − m2 𝜆 2 + 1, (3.60) donde a 0 depende del ángulo de giro de acuerdo con a 0 = 2 O2 O + OS sin 𝛼. (3.61) La distancia entre el punto O2 y el punto medio de las fuentes S1 y S2 es (a 0/2)/tan 𝛼, por lo tanto, z0 es z0 = a0 + O2 O + OOP . 2 tan 𝛼 (3.62) Interferencia · 207 a' S2 S1 O2 a /2 M2 M1 S O1 O BS a /2 y OP x Pantalla de Observación Figura 3.23. Interferómetro de Michelson con los espejos M1 y M2 inclinados un pequeño ángulo. Los espejos se encuentran a igual distancia del divisor de haz. 208 · Interferencia Si nos limitamos a la situación en que a 0 O2 O + OS y, a su vez, a 0 {R1 , R2 }, podemos aproximar tan 𝛼 por sin 𝛼. En la región de observación donde el cuadrado del máximo número de franjas laterales es mucho menor que el cuadrado de mmáx ≡ a 0/𝜆 , la eq. 3.60 se aproxima por xm = m𝜆 z0 /a 0, lo que corresponde con un patrón de franjas rectas paralelas uniformemente espaciadas. De acuerdo con la eq. (3.62), la separación entre franjas será 𝜆 𝜆 Δx = (3.63) + 0 O2 O + OOP . 2 sin 𝛼 a Esta ecuación es similar a la eq. (3.37) que se obtuvo para la interferencia de ondas planas. La diferencia está en que si en el interferómetro de la fig. 3.10 desplazamos axialmente la pantalla de observación, no cambia la separación de las franjas; mientras que si en el interferómetro de la fig. 3.23 desplazamos axialmente la pantalla de observación (cambiando OO de las franjas sí cambia. Podemos decir que el sumando P ), la separación 𝜆 O2 O + OOP /a 0 actúa como un factor de escala en la separación de las franjas. El primer sumando de la eq. (3.63) es idéntico a la eq. ((3.37). y x Figura 3.24. Patrón de interferencia generado por ondas esféricas en el interferómetro de Michelson cuando uno de los espejos está inclinado. La separación axial de las fuentes S1 y S2 es a = 400𝜆 y el desplazamiento lateral de fuente S2 es x0 (= a 0/2) = 0.03 mm. La escala de los ejes está dada en mm . En conclusión, los frentes de onda que llegan a la pantalla de observación en el interferómetro de la fig. 3.23 se asemejan a frentes de onda planos, cuando a 0 {R1 , R2 } y la región de observación tiene unas dimensiones 2 , donde m es el número de franjas laterales. tales que m2 mmáx Por último, si en el interferómetro de la fig. 3.18 se gira solamente uno de los espejos, lo que se observa es un desplazamiento lateral del centro de Interferencia · 209 los anillos, como se muestra en la fig. 3.24, donde la separación axial de las fuentes S1 y S2 es a = 400𝜆 y el giro del espejo M2 se da en un ángulo que desplaza lateralmente la fuente S2 en x0 (= a 0/2) = 0.03 mm. Si el ángulo de giro se incrementa el centro de los anillos sale de la región de observación y nos acercamos a patrones de franjas semejantes a los patrones de franjas rectas paralelas. 210 · Interferencia 3.4. Aspectos prácticos en el interferómetro de Michelson En las anteriores unidades de este capítulo, se empleó el interferómetro de Michelson como herramienta óptica para estudiar, con cierto detalle, los patrones de interferencia generados por la superposición de ondas planas u ondas esféricas. El interferómetro de Michelson es uno entre muchos interferómetros que se puede utilizar para este propósito. En cualquier caso, se busca generar dos ondas secundarias a partir de una onda primaria, de modo que se garantice la interferencia (siempre y cuando la diferencia de camino óptico entre los haces no sea mayor que la longitud de coherencia). El uso de los interferómetros va más allá que la explicación de los patrones de interferencia de ondas planas o esféricas. Su potencial se aplica en la evaluación de superficies o frentes de onda, ya sea para caracterizar las mismas superficies o medir algún otro parámetro como el índice de refracción o aberraciones ópticas. Para este tipo de aplicaciones, uno de los haces se toma como un haz de referencia, mientras que el otro haz se usa para analizar el elemento óptico que se desea medir. Lo más común es que el haz de referencia sea plano o esférico. En la práctica, surgen algunos inconvenientes con la generación del haz de referencia debido a la calidad óptica de las componentes del interferómetro y a la configuración misma del interferómetro. En esta unidad, vamos ver algunos aspectos prácticos en el caso del interferómetro de Michelson: la fuente puntual, la lente colimadora, los espejos, el error pico-valle (como medida de la calidad de las superficies ópticas) y un ejemplo de un interferómetro de Michelson. Fuente puntual Supongamos que queremos iluminar el interferómetro con una onda plana, como en la fig. 3.8. Para esto, debemos tener una fuente puntual S. Esto ya es un primer asunto de cuidado, pues físicamente podemos construir fuentes pequeñas, pero no puntuales (matemáticamente hablando), y de banda espectral muy estrecha (láser), pero no un delta de Dirac. Ahora no nos vamos a detener en este punto y vamos a suponer que tenemos una fuente cuasi-monocromática3 lo suficientemente pequeña para considerarla como fuente puntual. 3 Se dice que una fuente es cuasimonocromática si su ancho de banda Δ𝜆 es mucho menor que el valor de la longitud de onda centrada en el ancho de banda, es decir, Δ𝜆 /𝜆 1. Interferencia · 211 Lente colimadora Lo que sigue es seleccionar una lente colimadora para generar una onda plana. Una primera opción podría ser una lente simple (positiva o negativa) de caras esféricas alineada y con su punto focal primario coincidiendo con la fuente puntual. Al estar la fuente puntual en eje, la única aberración presente será la esférica. Aunque se puede disminuir la aberración dando la forma óptima a la lente (escogiendo apropiadamente los radios de curvatura de las caras de la lente), no se logra eliminar esta aberración. Una mejor opción consiste en usar un doblete acromático. Este tipo de lente, además de corregir la aberración cromática para dos colores (las líneas espectrales F y C, apéndice C), disminuye considerablemente la aberración esférica. Esta ya puede ser una buena solución. Pero si se aspira a una corrección total de la aberración esférica, se puede diseñar una lente asférica para los conjugados finito (punto focal primario) e infinito. Esta solución no siempre es posible por su elevado costo. Finalmente, tenemos un aspecto que no hemos mencionado antes, que tiene que ver con la extensión finita del frente de onda. En el tratamiento realizado en las unidades anteriores, hemos supuesto que tenemos un borde circular (como suele ocurrir, ya sea por el borde de la lente colimadora o por un diafragma que se coloca antes o después de la lente para determinar el tamaño de la sección transversal de los haces). Esta limitación física en la extensión del frente de onda genera difracción en el borde, así que el frente de onda no es estrictamente plano en toda su extensión. Divisor de haz Este elemento lo hemos representado con una línea diagonal, lo que por supuesto es otra idealización. En la práctica, este elemento suele ser una lámina de caras paralelas de vidrio u otro material. Cuando un rayo inclinado incide en la lámina, el rayo refractado al otro lado de la lámina sale con un ángulo igual al del rayo incidente, pero con un desplazamiento lateral, como se muestra en la fig. 3.25. Lo anterior no es un inconveniente cuando se ilumina el interferómetro con luz colimada (fig. 3.8), pues cualquier rayo asociado al frente de onda se desvía la misma cantidad, por lo que el frente de onda a la salida sigue siendo plano. Sin embargo, cuando se ilumina con una onda esférica (fig. 3.18), los rayos se refractan dependiendo del ángulo de incidencia, dando lugar a un frente de onda con aberración. Para calcular la traslación del rayo refractado, supongamos que tenemos una lámina de caras paralelas separadas una distancia d y de índice de refracción nt , y coloquemos una fuente puntual S a cierta distancia de la lámina. 212 · Interferencia La línea ortogonal a las caras que pasa por S define el eje z. Ahora consideremos un rayo que diverge de S con un ángulo de inclinación 𝜃 i , como se muestra en la fig. 3.25. La proyección (hacia atrás) del rayo refractado después de la segunda cara pasa por el punto S0. Por lo tanto, un observador después de la lámina verá el rayo refractado como si viniera del punto S0 y no de S. La separación entre S y S0 es la medida de la desviación en el eje z del rayo refractado, 𝛿z = S0S. En el punto de incidencia de la primera cara de la lámina, los vectores ni ŝi y nt ŝt asociados con los rayos incidente y refractado satisfacen la forma vectorial de la ley de Snell (eq. (2.75)), de donde Γ = nt cos 𝜃 t − ni cos 𝜃 i . Teniendo en cuenta la relación de semejanza Γ 𝛿z = nt d/cos 𝜃 t (3.64) se llega a que ni cos 𝜃 i 𝛿z = d 1 − . nt cos 𝜃 t (3.65) d qi ni s i dz dz S Gun nt s t qt qi z S' ni nt ni Figura 3.25. Desviación del rayo en una lámina paralela. 0.14 d z- d(1-n i /n t ), (mm) 0.12 0.10 0.08 0.06 0.04 0.02 0 0 5 10 15 20 25 qi ( °) 30 35 40 45 Figura 3.26. Desviación del rayo refractado en una lámina de caras paralelas de espesor igual a 1 mm. Interferencia · 213 En la fig. 3.26, se muestra la desviación con respecto a 𝛿z| 𝜃i=0 = d(1 − ni /nt ) en función del ángulo de incidencia 𝜃 i , para d = 1 mm, ni = 1 y nt = 1.5168 (vidrio BK7), con 𝜆 = 587.56 nm. La curva muestra que a medida que el ángulo de incidencia aumenta el punto S0 se aleja de S acercándose a la lámina. (a) (b) (c) Figura 3.27. Divisores de haz de la compañía ThorLabs. (a) Pellicle, (b) lámina y (c) cubo. En los interferómetros, las láminas divisoras de haz pueden ser: a) membranas de nitrocelulosa (pellicles), b) láminas delgadas (de unos pocos milímetros de espesor) y c) cubos formados por dos prismas rectos. En las tres opciones, una de las caras tendrá un recubrimiento de película delgada para aumentar la reflexión y lograr divisores de haz, por ejemplo, de 50 % en la reflexión y 50 % en la transmisión. Las pellicles son muy delgadas (∼ 2 𝜇m), por lo que se puede despreciar la desviación de los rayos refractados. Este elemento se aproxima muy bien a la idealización que hemos hecho del divisor de haz. La desventaja es que son elementos que se deben manipular con cuidado para no romper la membrana y deben protegerse del polvo. En sistemas cerrados y libres de vibraciones mecánicas son una buena solución. Las láminas delgadas son muy comunes en los interferómetros. Uno de los haces pasará una vez a través de la lámina, mientras que el otro debe hacerlo tres veces, lo que se debe tener en cuenta al utilizar fuentes de baja coherencia. Los divisores de cubo se forman con dos prismas rectos unidos por sus caras diagonales, apéndice E. Una de estas caras está recubierta con una película delgada para aumentar la reflexión. A diferencia de las láminas delgadas, los dos haces atraviesan el cubo el mismo número de veces. En la fig. 3.27, se muestra los tres divisores mencionados fabricados por la compañía ThorLabs (www.thorlabs.com). Resumiendo, si empleamos luz colimada para iluminar el interferómetro, podemos usar cualquiera de los divisores de haz mencionados. Pero si empleamos luz que diverge de una fuente puntual, la mejor opción será la pellicle. Sin embargo, lo usual es una lámina delgada. El cubo divisor no 214 · Interferencia será una buena opción si el radio de curvatura del frente de onda llegando al cubo es comparable al lado del cubo. Ya que la desviación de los rayos en una lámina es función del ángulo, este efecto es similar a la aberración esférica que afecta a los rayos que convergen para formar la imagen en una superficie esférica refractora, como se muestra en la fig. 1.88. Entonces, en una lámina gruesa, como el cubo divisor, el resultado final es que un frente de onda esférico incidente al refractarse adquiere una forma diferente a la forma esférica, esto es, un frente de onda con aberración (frente de onda asférico). Para una fuente puntual en el eje óptico del interferómetro de la fig. 3.18, el frente de onda asférico tendrá simetría de revolución, por lo que los patrones de interferencia generados en la pantalla de observación serán anillos de interferencia, pero su distribución espacial será diferente a la que se tiene con la interferencia de ondas esféricas. Espejos Después de pasar por el divisor de haz se llega a los espejos M1 y M2 . Estos son espejos planos, es decir, láminas de vidrio con una cara plana recubierta con una película metálica, usualmente de aluminio, pero también se encuentran de plata y de oro. Para proteger la cara metalizada de la oxidación, del polvo o mugre (huellas digitales), también se suele depositar una película delgada (media longitud de onda) de material dieléctrico, como óxido de silicio. Esta es una capa que permite la limpieza de la superficie. Error Pico-Valle Ahora consideremos un aspecto que afecta a todos los elementos ópticos que hemos mencionado. En la práctica, ¿qué se entiende por una superficie óptica esférica o plana? En el proceso de fabricación, se obtienen superficies pulidas (tipo espejo) que están muy próximas a la superficie matemática del diseño. La desviación entre la superficie real y la superficie matemática da una medida de la calidad óptica de la superficie. Por ejemplo, un plano óptico de precisión 𝜆 /4 se refiere a una superficie pulida cuyas desviaciones en comparación con un plano de referencia no son mayores que un cuarto de la longitud de onda nominal. Aunque 𝜆 /4 puede parecer una cantidad pequeña, implica un cambio considerable en la distribución de irradiancia. Un cambio en 𝜆 /2 implica pasar de una zona brillante a una oscura. Entonces, supongamos que construimos el interferómetro de la fig. 3.8 con elementos ópticos de calidad 𝜆 /4 (igual para el espejo M1 ). Ajustando la distancia de los espejos al divisor de haz para tener una diferencia de camino óptico igual a 2(d2 − d1 ) = m𝜆 , esperamos ver una región completamente ilumina- Interferencia · 215 da en la pantalla de observación. Sin embargo, no ocurre así, sino, más bien, una región iluminada con algunas zonas menos brillantes e incluso oscuras. Para tener mejores resultados, se debe cambiar la calidad de los elementos ópticos, por ejemplo de 𝜆 /10, 𝜆 /20 o 𝜆 /100. 3.4.1. Interferómetro de laboratorio Figura 3.28. Interferómetro de Michelson. El espejo M1 está montado sobre un carro axial. En la fig. 3.28, se muestra un interferómetro de Michelson construido en un laboratorio con elementos ópticos de precisión 𝜆 /4. La fuente puntual S es un haz láser (He-Ne, 𝜆 = 632.8 nm) enfocado en un pequeño agujero (pinhole) de alrededor de 15 𝜇m. El propósito de enfocarlo en el agujero es eliminar frecuencias espaciales altas presentes en el haz, con lo que se obtiene una iluminación aproximadamente homogénea. Esto lo discutiremos más adelante en el capítulo 4. Luego, se coloca un diafragma circular para fijar en unos 25 mm de diámetro la extensión del interferograma cuando la luz está colimada. Enseguida, se encuentra la lente colimadora, que en este caso es un doblete acromático de 300 mm de distancia focal. Esta lente está montada sobre un carro axial para facilitar la colimación del haz que se logra · 216 Interferencia cuando el punto focal primario de la lente coincide con la fuente S. El carro axial también nos sirve para cambiar la colimación del haz y obtener frentes de onda esféricos. A 225 ± 1 mm de la lente, se ubica el centro de un cubo divisor de haz (punto O en la fig. 3.8) de 50 mm de lado de vidrio BK7. Luego, se colocan los espejos planos de aluminio, como se ve en la figura, a 125±1 mm del centro del cubo. El espejo M1 está montado sobre otro carro axial con lo que se puede cambiar la diferencia de camino óptico entre los haces en la región de interferencia. Cada uno de los espejos está soportado por una montura que dispone de dos tornillos de rosca fina, con lo cual se puede inclinar el espejo. Finalmente, se tiene la pantalla de observación, P, a 125 ± 1 mm del centro del cubo. La pantalla de observación es un vidrio esmerilado (traslúcido). Los interferogramas en la pantalla de observación se registran con una cámara fotográfica (no se muestra en la figura). 12 12 15 8 8 10 4 4 5 0 0 0 -4 -4 -5 -8 -8 -10 -12 -12 -12 -8 -4 0 (a ) 4 8 12 -15 -12 -8 -4 0 (b) 4 8 12 -15 -10 -5 0 5 10 15 (c) Figura 3.29. Patrones de interferencia experimentales. En (a) y (b) los haces están colimados y en (c) los haces son esféricos divergentes. En (a) la diferencia de camino óptico es aproximadamente cero y los espejos están alineados; en (b) la diferencia de camino óptico es aproximadamente cero y uno de los espejos se inclina un pequeño ángulo; en (c) manteniendo los espejos alineados se desplaza la lente colimadora alejándola del cubo divisor de haz (40 mm) y también se aleja el espejo M1 en unos 60 mm. La escala de los ejes está dada en mm. Con este interferómetro, se generan los patrones de interferencia mostrados en la fig. 3.29. En (a), los dos espejos están aproximadamente a la misma distancia del centro del cubo divisor de haz y, además, están colimados y alineados (la diferencia de camino óptico entre los haces colimados es aproximadamente cero). Sin embargo, se nota que la región no tiene una iluminación homogénea o simétrica. Esto es un ejemplo de cómo afecta la calidad del interferograma la precisión de las superficies de los elementos ópticos empleados en el interferograma (de 𝜆 /4). Para obtener este interferograma se ajustó el espejo M1 hasta obtener la región iluminada sin franjas de interferencia. En (b), se tiene un patrón de franjas rectas paralelas al in- Interferencia · 217 clinar el espejo M1 un pequeño ángulo. En realidad, las franjas están algo distorsionadas, lo que se nota más en la parte inferior izquierda. Esto también es el resultado de la calidad de las superficies ópticas del interferómetro y muestra que los dos frentes de onda que interfieren no son estrictamente planos. En (c), se desplaza axialmente el espejo M1 , unos 60 mm, alejándolo del cubo divisor y también se desplaza la lente colimadora, unos 40 mm, alejándose del cubo divisor. Al desplazar la lente colimadora, el frente de onda que sale de la lente es esférico divergente y su centro de curvatura estará a 1950 mm de la lente. Ahora, la lente está a unos 265 mm del centro del cubo. Teniendo en cuenta las distancias mencionadas en el párrafo anterior: la distancia de los espejos, la distancia de la pantalla de observación y el camino óptico adicional debido al cubo divisor de haz, se encuentra que R2 = 2640 mm, R2 = 2720 mm. Por lo tanto, ΔR = 120 mm, de donde se tiene que mmáx = ΔR/𝜆 = 189633 es el valor de m correspondiente a la zona central en la fig. 3.29(c). En la figura en (c), se cuentan tres franjas circulares y se estima el radio de la tercera en unos 15 mm. Lo anterior se puede corroborar a partir de la eq. (3.56). Colocando ΔR = mmáx 𝜆 y m = mmáx − 3 para la tercera franja en la eq. (3.56), se tiene que r 6𝜆 R1 R2 𝜌 m3 = = 15.07 mm, ΔR lo cual concuerda muy bien con la estimación experimental. En conclusión, un haz de referencia plano real será un frente de onda distorsionado en una cantidad similar a las deformaciones de las superficies ópticas del divisor de haz y del espejo plano que envía el haz de referencia a la región de observación. Para un haz de referencia esférico, además se debe tener en cuenta el efecto del espesor del divisor de haz. El otro haz del interferómetro, también afectado inicialmente por el divisor de haz, se puede usar para evaluar la calidad óptica de algún elemento, por ejemplo, un espejo plano o uno esférico. La calidad óptica del haz de referencia determinará la precisión con la que podemos medir las superficies bajo prueba. En el ejemplo de la fig. 3.29(c), el efecto del cubo es despreciable, ya que el ángulo del rayo marginal resulta ser 0.37◦ , lo que da una desviación axial del rayo de 0.34 𝜇m. 218 · Interferencia 3.5. Interferencia en una lámina de caras paralelas 0 tr' 5 t'E tr' 3 t'E tr't' E0 rE E0 0 0 En el interferómetro de la fig. 3.8, lo que un observador ve desde la pantalla de observación es un par de superficies planas reflectoras paralelas separadas una distancia 2(d2 − d1 ). La luz reflejada en las dos superficies genera un patrón de interferencia en el plano de observación. Un sistema que se asemeja al anterior es una lámina de caras paralelas. Ahora en las caras de la lámina tendremos luz reflejada y transmitida, y es posible observar interferencia en ambos lados de la lámina: si es del mismo lado de la fuente de iluminación, diremos que es interferencia por reflexión, pero si es del lado donde no está la fuente de iluminación, diremos que es interferencia por transmisión. Para ver esto consideremos la fig. 3.30, en la que se muestra la incidencia de un rayo con un ángulo 𝜃 i en una lámina de índice de refracción nl y espesor d, sumergida en un medio de índice ni . ni qi d qt nl ni tr' tr' 4 t'E 0 2 t'E 0 tt'E 0 Figura 3.30. Reflexión y transmisión en una lámina de caras paralelas. En cada una de las interfases, tendremos múltiples rayos reflejados y transmitidos. Las amplitudes de las ondas asociadas con los rayos están dadas por las ecuaciones de Fresnel, eqs. (2.96), (2.97), (2.98) y (2.99). En la fig. 3.30, los coeficientes r y t denotan los coeficientes de reflexión (r⊥ o rq ) y transmisión (t⊥ o tq ) cuando la luz va del medio de índice ni al medio de índice nl , y los coeficientes r 0 y t 0 denotan los coeficientes de reflexión y transmisión cuando la luz va del medio de índice nl al medio de índice ni . Interferencia · 219 3.5.1. Relaciones de Stokes Las relaciones entre r y r 0 y entre t y t 0 se obtienen de las relaciones de Stokes, las cuales se deducen a partir de las ilustraciones de la fig. 3.31. En (a), se muestra la reflexión y la transmisión de un rayo de amplitud E0 que incide con un ángulo 𝜃 i en una interfase que separa dos medios de índices ni y nt . La amplitud de la onda reflejada será rE0 y la amplitud de la onda transmitida será tE0 . Teniendo en cuenta el principio de reversibilidad (o reciprocidad), si se envía dos rayos en las direcciones opuestas a los rayos reflejado y transmitido en (a) con amplitudes rE0 y tE0 , respectivamente, deberíamos obtener nuevamente el haz incidente (pero en sentido opuesto) con amplitud E0 . En (b), el rayo incidente es opuesto al rayo reflejado en (a), pero con la misma amplitud. Este rayo tendrá una reflexión y una transmisión con amplitudes r 2 E0 y trE0 , respectivamente. Por otro lado, en (c), el rayo incidente es opuesto al rayo transmitido en (a), pero con la misma amplitud. Este rayo también tendrá una reflexión y una transmisión, pero con amplitudes r 0tE0 y tt 0 E0 , respectivamente. Si se cumple el principio de reversibilidad, entonces r 2 + tt 0 = 1 (3.66) y tr + r 0t = 0. E0 ni rE0 r 2E0 rE0 qi qi qt nt tE0 (a) (3.67) t'tE 0 qi qt qt trE0 r'tE0 (b) tE0 (c) Figura 3.31. Coeficientes de Stokes. Reflexión y transmisión de: (a) una onda de amplitud E0 , (b) una onda de amplitud rE0 y (c) una onda de amplitud tE0 . Por lo tanto, tt 0 = 1 − r 2 (3.68) r 0 = −r. (3.69) y 220 · Interferencia Estas últimas dos ecuaciones se denominan relaciones de Stokes y son particularmente útiles al sumar las amplitudes de las múltiples ondas reflejadas y transmitidas de la fig. 3.30. La irradiancia reflejada/transmitida será el módulo al cuadrado de la suma de las ondas reflejadas/transmitidas incluyendo la diferencia de camino óptico entre ondas consecutivas. 3.5.2. Interferencia de múltiples ondas En esta unidad vamos a considerar la superposición de las múltiples ondas (rayos) reflejadas y transmitidas en la fig. 3.30. Interferencia por reflexión Para la irradiancia reflejada, tendremos Ir = 𝜖 0c Er Er∗ , 2 (3.70) con Er = rE0 + tr 0t 0 E0 e i𝛿 + tr 03 t 0 E0 e i2𝛿 + tr 05 t 0 E0 e i3𝛿 + · · ·+, (3.71) y Er∗ el conjugado de Er . La fase 𝛿 depende de la diferencia de camino óptico Λ entre dos rayos reflejados consecutivos, esto es, 𝛿 = 2𝜋Λ/𝜆 . La eq. (3.71) se puede reescribir como 2 3 0 0 i𝛿 2 i𝛿 2 i2𝛿 2 i3𝛿 e + r e + · · ·+ . (3.72) Er = rE0 + tt r E0 e 1 + r e + r Y en una forma más compacta, 0 0 Er = rE0 + tt r E0 e i𝛿 Q Õ r 2 e i𝛿 q , (3.73) q=0 donde q = 0, 1, 2, ... define la reflexión q + 2, y Q + 2 es el número total de reflexiones. La sumatoria en la eq. (3.73) representa una serie geométrica cuya razón es r 2 e i𝛿 y de módulo ≤ 1. La suma de esta serie está dada por Q+1 1 − r 2 e i𝛿 . 1 − r 2 e i𝛿 (3.74) Si el número de reflexiones es mucho mayor a 1 (se tendrán infinitas reflexiones si 𝜃 i = 0 ó si lámina tiene una extensión infinita), la suma se Interferencia · 221 reduce a 1/(1−r 2 e i𝛿 ). Con esto en mente y teniendo en cuenta las relaciones de Stokes, el campo reflejado será Er = rE0 1 − e i𝛿 . 1 − r 2 e i𝛿 (3.75) Finalmente, la irradiancia de las múltiples ondas reflejadas (eq. (3.70)) está dada por 4R sin2 (𝛿/2) Ir = I0 , (3.76) (1 − R) 2 + 4R sin2 (𝛿/2) donde I0 = 𝜖 0 c(E0 ) 2 /2 y la reflectancia R = r 2 . Para calcular la fase 𝛿, consideremos la fig. 3.32. La diferencia de camino óptico entre los dos haces reflejados será Λ = nl AB + BC − ni AD. qi D A C qt d (3.77) ni nl B ni Figura 3.32. Geometría para la calcular la diferencia de camino óptico entre dos reflexiones consecutivas. De los triángulos, se tiene que AB = BC = d/cos 𝜃 t y AD = (2d tan 𝜃 t ) × sin 𝜃 i . Entonces, la fase 𝛿 = 2𝜋Λ/𝜆 está dada por 2𝜋 2nl d 𝛿= − (2d tan 𝜃 t )ni sin 𝜃 i . 𝜆 cos 𝜃 t (3.78) Usando la ley de Snell y simplificando, se tiene que 𝛿= 2𝜋 (2nl d cos 𝜃 t ) . 𝜆 (3.79) 222 · Interferencia Interferencia por transmisión Para el caso de las ondas transmitidas (fig. 3.30), tenemos que la suma resultante será Et = tt 0 E0 + tr 02 t 0 E0 e i𝛿 + tr 04 t 0 E0 ei2𝛿 + · · ·+, (3.80) es decir, 0 Et = tt E0 2 2 i2𝛿 1+r e + r e + · · ·+ . 2 i𝛿 (3.81) En forma análoga a la deducción de la irradiancia de las múltiples ondas reflejadas, la irradiancia de las múltiples ondas transmitidas está dada por It = I0 (1 − R) 2 . (1 − R) 2 + 4R sin2 (𝛿/2) (3.82) Las ecuaciones (3.76) y (3.82) son complementarias cuando no hay absorción. Caso 1. Interferencia de ondas planas. Un primer resultado que podemos observar se tiene cuando la lámina se ilumina con ondas planas monocromáticas (coherentes) en dirección ortogonal a la lámina, es decir, cuando 𝜃 i = 0 y, por lo tanto, 𝜃 t = 0. En la fig. 3.33(a), se muestra la situación donde una onda plana limitada por un diafragma D incide ortogonalmente en una lámina de espesor d. Si la interferencia después de la lámina se observa en un plano (paralelo a la lámina), tendremos una situación similar a la del interferómetro de Michelson en la fig. 3.8 y se verá una región iluminada homogéneamente. Pero si colocamos una lente L y movemos la pantalla de observación al plano focal secundario de la lente, observaremos un punto luminoso. En ambos casos, la irradiancia estará dada por la eq. (3.82) y depende del espesor de la lámina. En la fig. 3.33(b), se muestra una variante del sistema de la fig. 3.33(a), con el fin de observar la interferencia de las múltiples ondas reflejadas por las caras de la lámina. Con ayuda del divisor de haz, las ondas reflejadas se desvían hacia la lente L que enfoca la luz en la pantalla de observación. La irradiancia estará dada por la eq. (3.76). En la fig. 3.9, para 𝛾 (𝜏) = 1, se muestra cómo cambia la irradiancia transmitida en el plano de observación a medida que cambia la separación entre los espejos. En este caso, el contraste de la irradiancia es 1. Al cambiar el espesor de la lámina de la fig. 3.33(a), también se obtiene una modulación de la irradiancia en el plano de observación (plano focal). En la fig. 3.34, se muestra el valor de la irradiancia en el plano focal en función del espesor de Interferencia · 223 la lámina (del orden de la longitud de onda) para tres valores del coeficiente de reflexión r = 0.2, 0.56 y 0.96. ni D nl ni L Pantalla de observación ni D d nl ni d L (a) Pantalla de observación ( b) Figura 3.33. Interferencia axial de múltiples ondas planas en una lámina de caras paralelas: (a) transmitidas, (b) reflejadas. Irradiancia normalizada, It (I 0) 1.0 0.9 r = 0.20 (R = 0.04) 0.8 r = 0.56 (R = 0.31) 0.7 r = 0.96 (R = 0.92) 0.6 0.5 0.4 0.3 0.2 0.1 0 l / nl 2l / n l 3l / n l 4l / n l Espesor de la lámina, d (l ) Figura 3.34. Modulación de la irradiancia de múltiples ondas transmitidas en el plano focal (fig. 3.33(a)) cuando el coeficiente de reflexión de las caras de la lámina es r = 0.2, 0.56 y 0.96. En particular, el coeficiente de reflexión r = 0.2 (r k = −r⊥ ) se obtiene para una lámina de vidrio (nl = 1.5, 𝜆 = 632.8 nm) sumergida en aire, cuando 𝜃 i = 0. La forma de la modulación de la irradiancia tiene un comportamiento similar al de la irradiancia mostrada en la fig. 3.9, para 𝛾 (𝜏) = 1, en el interferómetro de Michelson. La diferencia está en el contraste de la modulación, pues en el caso de la lámina es bajo, igual a 0.08. Esta similitud no es coincidencia. Cuando r = 0.2, entonces r 2 = 0.04 y r 4 = 0.0016, por 224 · Interferencia 2 lo que r 2 ei2𝛿 , y los demás sumandos de orden superior no contribuyen de manera relevante en la suma de la eq. (3.81). Así que en este caso de baja reflectancia (R = 0.04), la interferencia está determinada solo por los dos primeros haces transmitidos, es decir, Et = tt 0 E0 1 + r 2 e i𝛿 , y la irradiancia será (omitiendo el término r 4 ) 4𝜋 2 It = I0 (1 − R) 1 + 2R cos nl d . 𝜆 (3.83) (3.84) Esta expresión es análoga a la eq. (3.29) de la interferencia de dos ondas planas cuando |𝛾 | = 1 y 𝜏 = 2(d2 − d1 )/c. Entonces, cuando la reflectancia de las caras de la lámina es baja (como en una lámina de vidrio) la interferencia efectiva de las múltiples transmisiones se asemeja a la interferencia de dos ondas. Si la reflectancia aumenta, se irán agregando otros sumandos y el resultado se aleja del correspondiente a dos ondas. Para aumentar la reflectancia, una opción es aumentar el índice de refracción de la lámina. Sin embargo, en la práctica, no se logra mejorar mucho, ya que índices altos de refracción están alrededor de 2.5 (por ejemplo, en el diamante), lo que da reflectancias alrededor de 0.18. Para lograr reflectancias como las mostradas en la fig. 3.34, de 0.31 (r = 0.56) o 0.92 (r = 0.96), se depositan películas delgadas metálicas o dieléctricas en las caras de la lámina. Considerando el caso en el que el coeficiente de reflexión es r = 0.96, vemos que el resultado en la interferencia cambia notablemente en comparación con el caso con r = 0.2. Se obtiene máximos de irradiancia (I0 ) cuando el espesor de la lámina es un múltiplo de media longitud de onda divido entre el índice de refracción de la lámina (igual que para dos ondas), pero rápidamente decaen los valores de la irradiancia al variar poco el espesor de la lámina. En otras palabras, tenemos valores de irradiancia importantes solo en bandas muy estrechas. Para el caso de las múltiples ondas reflejadas (con la fig. 3.33(b)), se tiene una situación análoga, como se muestra en la fig. 3.35, para los mismos valores del coeficiente de reflexión. Se obtienen mínimos de irradiancia (cero) cuando el espesor de la lámina es un múltiplo de media longitud de onda divido entre el índice de refracción de la lámina (igual que para dos ondas). Ahora el contraste de la irradiancia cuando r = 0.2 es igual 1, como en la fig. 3.9, para 𝛾 (𝜏) = 1. Y cuando r = 0.96, se tiene bandas estrechas donde la irradiancia está alrededor de cero y rápidamente aumentan los valores de Interferencia · 225 la irradiancia al variar poco el espesor de la lámina. Este es el principio de funcionamiento de las películas delgadas antirreflectivas. Irradiancia normalizada, Ir (I 0) 1.0 0.9 r = 0.20 (R = 0.04) 0.8 r = 0.56 (R = 0.31) 0.7 r = 0.96 (R = 0.92) 0.6 0.5 0.4 0.3 0.2 0.1 0 l / nl 2l / n l 3l / n l 4l / n l Espesor de la lámina, d (l ) Figura 3.35. Modulación de la irradiancia de múltiples ondas reflejadas en el plano focal (fig. 3.33(b)) cuando el coeficiente de reflexión de las caras de la lámina es r = 0.2, 0.56 y 0.96. Note que las gráficas para la transmisión (fig. 3.34) y la reflexión (fig. 3.35 ) son complementarias, lo que resulta de la conservación de la energía si no hay absorción en la lámina. Caso 2. Interferencia de ondas esféricas I. Consideremos ahora una onda esférica incidiendo en la lámina de caras paralelas. Ya hemos visto que en el interferómetro de Michelson iluminado con una onda esférica se tiene un patrón de franjas circulares. En el caso de la lámina, también ocurre algo similar, pero la estructura de las franjas depende de la reflectancia de las caras de la lámina. Vamos a considerar las configuraciones mostradas en la fig. 3.36 en las que se observan las franjas de interferencia por transmisión. S S ni nl D ni ni Pantalla de observación d (a) nl ni D L Pantalla de observación d ( b) Figura 3.36. Interferencia de múltiples ondas transmitidas en una lámina de caras paralelas cuando se ilumina con una onda esférica. (a) Formación de franjas no localizadas, (b) formación de franjas localizadas. 226 · Interferencia En (a), la interferencia en un punto de la pantalla de observación ocurre por la superposición de rayos que llegan con diferente ángulo. En (b), se coloca una lente y, en el plano focal secundario, la pantalla de observación. Ahora la interferencia en un punto en la pantalla de observación ocurre por la superposición de rayos que inciden con el mismo ángulo en la lente. Por otro lado, en (a), las franjas circulares de interferencia se observan para cualquier posición de la pantalla de observación a lo largo del eje óptico (franjas no localizadas), mientras que en (b) las franjas circulares de interferencia se observan enfocadas en el plano focal de la lente (franjas localizadas). Primero, veremos la formación de las franjas de interferencia en la configuración (b), ya que el álgebra que se requiere ya ha sido desarrollada en la eq. (3.82). Para obtener esta ecuación, se consideró en la fig. 3.30 la incidencia de un rayo con cierto ángulo. Luego, a partir de la fig. 3.33(a), se examinó el caso particular de 𝜃 i = 0: en el punto focal secundario se observa la irradiancia dada por la eq. (3.82). Si ahora en la configuración de la fig. 3.33(a) suponemos que 𝜃 i ≠ 0, la interferencia de las múltiples ondas planas inclinadas 𝜃 i se verá en un punto luminoso fuera de eje en la posición radial f tan 𝜃 i , donde f es la distancia focal de la lente. Esto último es lo que ocurre con los múltiples rayos transmitidos correspondientes a un rayo que diverge de S en la fig. 3.36(b), con 𝜃 i ≠ 0: los rayos transmitidos se enfocarán en un punto localizado en f tan 𝜃 i . Teniendo en cuenta la simetría de revolución alrededor del eje óptico, lo que tendremos es un patrón de anillos. Los radios de los círculos de máxima irradiancia estarán dados por 𝜌 m = f tan 𝜃 m . donde q sin 𝜃 m = nl2 − (m𝜆 /2d) 2 (3.85) , (3.86) ni de acuerdo con la eq. (3.79), cuando 𝛿 = 2m𝜋. El valor máximo de m, mmáx , será el entero inferior más próximo a 2nl d/𝜆 . Al alejarnos del centro disminuye el valor de m. Así con m = mmáx − 1, mmáx − 2, ..., se identifican los anillos de interferencia desde el centro. Con el propósito de comparar los interferogramas generados por ondas esféricas con el interferómetro de Michelson y con la lámina de caras paralelas, vamos a suponer que en el interferómetro de Michelson de la fig. 3.18 la separación de los espejos es a/2 = 0.25 mm y que tenemos una lámina de vidrio de espesor d = (a/2)/nl , con nl = 1.5 (para 𝜆 = 632.8 nm). El interferograma que se obtiene con el interferómetro de Michelson, cuando la distancia entre el punto medio de las fuentes virtuales y la pantalla de observación es z0 = 100 mm, se muestra en la fig. 3.16. Y los interferogramas Interferencia · 227 que se obtienen cuando se usa una lente de distancia focal f = 65.65 mm para r = 0.2 (lámina de vidrio sin recubrimientos reflectivos), r = 0.5 y R = 0.9 se muestran en la fig. 3.37. La distancia focal se fijó en este valor teniendo en cuenta el ángulo que subtiende el primer anillo de interferencia en el patrón de la fig. 3.16. El radio de este anillo es 𝜌 790 = 1.88 mm. Por otra parte, para la lámina, el ángulo correspondiente con el primer anillo es 𝜃 790 = 1.61◦ (eq. (3.86)), lo que da una distancia focal igual a 65.65 mm (eq. (3.85)). r = 0.2 -10 -5 0 10 r = 0.5 5 -10 10 -5 0 10 r = 0.9 5 -10 10 0 5 10 10 5 5 5 0 0 0 -5 -5 -5 -10 -10 -10 (a ) -5 (b) (c) Figura 3.37. Interferogramas en transmisión generados por una lámina de espesor óptico 0.5 mm para r = 0.2, r = 0.5 y r = 0.9, usando una lente de distancia focal 65.65 mm. La escala de los ejes está dada en mm. En los interferogramas de la fig. 3.37, la posición de los anillos (radio de los círculos de máxima irradiancia) es igual. Lo anterior se debe a que las eqs. (3.85) y (3.86) no dependen del coeficiente de reflexión. Sin embargo, el coeficiente de reflexión sí determina el ancho de las franjas circulares. Entre mayor sea el número efectivo de haces que interfieren (lo que ocurre al aumentar el coeficiente de reflexión), menor es el ancho de las franjas. Cuando r = 0.2, el patrón se asemeja con el patrón de dos ondas esféricas mostrado en la fig. 3.16, pero el contraste es bajo, C = 0.08. En la lámina a medida que aumenta la reflectancia de las caras también aumenta el contraste de las franjas. Así, con r = 0.5, C = 0.47 y, con r = 0.9, C = 0.98. Para la interferencia por reflexión se puede emplear la configuración de la fig. 3.33(b), pero iluminando con una onda esférica. En este caso, los máximos de irradiancia ocurren cuando 𝛿 = 2m𝜋 ± 𝜋. Usando los mismos parámetros empleados en el ejemplo de la interferencia por transmisión, los patrones de interferencia por reflexión se muestran en la fig. 3.38. Como es de esperar, estos interferogramas son el complemento de los interferogramas por transmisión. A diferencia de los interferogramas por transmisión, el contraste de las franjas de interferencia en reflexión es C = 1, ya que las zonas oscuras tienen valor de irradiancia cero. 228 · Interferencia r = 0.2 -10 -5 0 r = 0.5 5 -10 10 10 -5 0 r = 0.5 0.9 5 -10 10 10 -5 0 5 10 10 5 5 5 0 0 0 -5 -5 -5 -10 -10 -10 (a) (b) (c) Figura 3.38. Interferogramas en reflexión generados por una lámina de espesor óptico 0.5 mm para r = 0.2, r = 0.5 y r = 0.9. La escala de los ejes está en mm. El cálculo de la irradiancia del interferograma mostrado en la fig. 3.37(a) se realizó usando r = 0.2 independientemente del ángulo. Estrictamente, no debe ser así, ya que los coeficientes de reflexión y transmisión dependen del ángulo, de acuerdo con las ecuaciones de Fresnel (eqs. (2.96), (2.97), (2.98) y (2.99)). Sin embargo, en el ejemplo tratado, el rango del ángulo de incidencia con el que se genera el patrón de interferencia va de 0 a 10◦ , y para ese rango el valor de r cambia muy poco, alrededor del 2 % (fig. 2.13). Incluso para ángulos aún mayores, la variación sigue siendo pequeña, por lo que para los primeros anillos de interferencia basta con tomar el coeficiente de reflexión igual al que se tiene para 𝜃 i = 0. Esto también aplica para las láminas con recubrimientos reflectivos. 48 44 * * a = 2dnl = 0.1 mm * 40 * 36 * * r (mm) 32 * 28 * 24 * 20 16 12 * * * a = 2dnl = 0.5 mm * * * * * * * 8 * * * * 4 0 m max -12 m max -10 mmax -8 m max -6 m max -4 m max -2 * * m max m Figura 3.39. Radio ( 𝜌) de los primeros 12 anillos de interferencia de ondas esféricas con el interferómetro de Michelson ( o ) cuando a = 0.5 mm y 0.1 mm y con una lámina de caras paralelas ( ★ ) cuando 2dnl = 0.1 mm y 0.5 mm. A primera vista, los interferogramas mostrados en las figs. 3.16 y 3.37(a) son semejantes. Esto se puede verificar si comparamos las posiciones radiales de los anillos de interferencia, eqs. (3.47) y (3.85). En la fig. 3.39, se Interferencia · 229 compara la posición radial de los 12 primeros anillos de interferencia cuando a = 0.1 mm y 0.5 mm en el interferómetro de Michelson y cuando 2dnl = 0.1 mm y 0.5 mm en la lámina de caras paralelas. En el caso en que a = 0.5 mm, en efecto, la posición radial de los anillos de los dos interferogramas es aproximadamente igual. Sin embargo, al disminuir a, por ejemplo a = 0.1 mm, los anillos de interferencia generados con el interferómetro de Michelson tienen un radio menor en comparación con los anillos generados con la lámina. Caso 3. Interferencia de ondas esféricas II. Consideremos ahora la configuración de la fig. 3.36(a). Supongamos que de la fuente puntual S divergen tres rayos (etiquetados 1, 2 y 3), como se muestra en la fig. 3.40. En la transmisión, tendremos múltiples rayos paralelos a los rayos incidentes. En la fig. 3.40, solo dibujamos 3 rayos transmitidos para cada uno de los rayos incidentes. 3 S'3 S'2 S S'1 2 1 ni nl ni Figura 3.40. Refracción de tres rayos que divergen de la fuente S junto con algunos rayos transmitidos. El primero de los rayos transmitidos en cada caso experimenta una desviación lateral para una lámina de espesor d. Las prolongaciones hacia atrás de los primeros rayos transmitidos (rectas en gris continuas) convergen aproximadamente en el punto S10 . El segundo de los rayos transmitidos en cada caso experimenta una desviación lateral para una lámina equivalente de espesor 3d. Las prolongaciones hacia atrás de los segundos rayos transmitidos (rectas en gris segmentos iguales) convergen aproximadamente en el punto S20 . Y el tercero de los rayos transmitidos en cada caso experimenta una desviación lateral para una lámina equivalente de espesor 5d. Las prolongaciones hacia atrás de los terceros rayos transmitidos (rectas en gris segmentos largos y cortos) convergen aproximadamente en el punto S30 . En forma 230 · Interferencia análoga, se continúa para los demás rayos transmitidos. Las prolongaciones de los j-ésimos ( j = 1, 2, 3, ...) rayos transmitidos no convergen exactamente en un punto (S0j ) debido a que la desviación axial que experimentan los rayos refractados depende del ángulo de incidencia, de acuerdo con la eq. (3.65). P r S'3 S'2 S S'1 ni nl ni (a) Pantalla de observación P2 P1 S'3 S'2 S S'1 ni (b) nl ni Pantalla de observación Figura 3.41. (a) Fuentes virtuales: los rayos que llegan al punto P parecen emerger de múltiples fuentes virtuales localizadas en S10 , S20 , S30 . (b) Rayos reales: la interferencia en un punto de la pantalla de observación resulta de la superposición de rayos con diferente ángulo y con diferente número de reflexiones internas en la lámina. Para el análisis que sigue, vamos a suponer que las prolongaciones axiales de los j-ésimos rayos transmitidos convergen en el punto S0j . Lo anterior implica que el ángulo de incidencia de los rayos que divergen de S y llegan Interferencia · 231 a la lámina es pequeño. Con esto en mente, en un punto P de la pantalla de observación llegan rayos que parecen emerger de múltiples fuentes virtuales localizadas en S10 , S20 , S30 , ..., como se muestra en la fig. 3.41(a). Por lo tanto, la interferencia en P ocurre por la superposición de rayos con distinto ángulo. Así que los rayos que se superponen en P son rayos que emergen de la fuente S con diferentes ángulos. Entonces, ¿cómo es posible que los rayos refractados se junten en el punto P? Esto es posible si los diferentes rayos experimentan diferentes reflexiones internas en la lámina, como se muestra en la fig. 3.41(b). Por ejemplo, al punto P2 llegan tres rayos (como en la fig. 3.41(a)): el rayo que parece salir de S10 llega después de transmitirse en las dos caras de la lámina sin reflejarse internamente (rayo en negro); el rayo que parece salir de S20 llega después de transmitirse en la primera cara, reflejarse internamente en la segunda cara, reflejarse internamente en la primera cara y transmitirse en la segunda cara (rayo en gris segmentado); y el rayo que parece salir de S30 llega después de transmitirse en la primera cara, reflejarse internamente en la segunda cara dos veces, reflejarse internamente en la primera cara dos veces y transmitirse en la segunda cara (rayo en gris continuo). Esto ocurrirá progresivamente para los rayos que emergen de las otras fuentes virtuales. ni nl A3 a S'3 B2 A2 qi S'2 ni B1 A1 S S'1 zS d Figura 3.42. Geometría para calcular la distancia entre dos fuentes virtuales consecutivas. La separación entre dos fuentes virtuales consecutivas se puede calcular con ayuda de la fig. 3.40. Consideramos las prolongaciones de los rayos transmitidos correspondientes con uno de los rayos que diverge de S, como se muestra en la fig. 3.42. De la geometría de la figura, se deduce que la separación entre cualquier par de fuentes consecutivas es constante. Definiendo esta separación como a, se tiene que a = S10 S20 = S20 S30 = ... = S0j S0j+1 . También se cumple que B1 B2 = A1 A2 = A2 A3 = ... = A j A j+1 . Por lo tanto, para cualquier par de fuentes consecutivas (j y j+1), tan 𝜃 i = B1 B2 /a. Ya que 232 · Interferencia B1 B2 = 2d tan 𝜃 t , entonces 2d tan 𝜃 t . tan 𝜃 i a= (3.87) La eq. (3.87) dice que la separación entre las fuentes virtuales varía con el ángulo de incidencia. Sin embargo, en una situación práctica, limitando los ángulos de incidencia a valores pequeños (alrededor de 10◦ ), de modo que cos 𝜃 i ≈ 1 y cos 𝜃 t ≈ 1, podemos cambiar tan 𝜃 t /tan 𝜃 i por sin 𝜃 t /sin 𝜃 i . Usando la ley de Snell, se llega a a = 2d ni , nl (3.88) que es independiente del ángulo. Así, en esta situación tenemos que la interferencia de ondas esféricas en la configuración de la fig. 3.36(a) se puede ver como la superposición de ondas esféricas que divergen de múltiples fuentes virtuales separadas uniformemente una distancia 2dni /nl a lo largo del eje óptico. La distancia de la fuente virtual S0j a la lámina (cara anterior) resulta ser z j = zS − 𝛿z0 + ( j − 1)a, (3.89) donde zS es la distancia entre la fuente puntual S y la lámina, y 𝛿z0 es la desviación axial dada por la eq. (3.65), con nt = nl , para 𝜃 t = 0. Con base en lo anterior, el campo óptico p para un punto P en la pantalla de observación a la distancia radial 𝜌 = x 2 + y 2 (omitiendo el término temporal de fase 𝜔t y el término de fase inicial) será Et = tt 0 E0† s1 e iks1 2 0 + tr t E0† s2 e iks2 4 0 + tr t E0† s3 e iks3 + · · ·+, (3.90) o, de manera más compacta, Et = tt 0 E0† J Õ j=1 r 2( j−1) e iks j , sj (3.91) donde s j es la distancia entre la fuente virtual S0j y el punto P, y J es el número total de reflexiones ( J → ∞). Suponiendo que la distancia entre la lámina y la pantalla de observación es d + zP , entonces q s j = R 2j + 𝜌2 , (3.92) con R j = z j + d + zP . (3.93) Interferencia · 233 Al igual que en los casos 1 y 2, el coeficiente de reflexión determina el peso con el que cada sumando interviene en la suma. Por ejemplo, para la lámina de vidrio sin recubrimiento reflectivo, basta con tomar los dos primeros sumandos, la irradiancia transmitida será p 2𝜋 2 2 (s2 − s1 ) , (3.94) It = (1 − R) I1 + I2 R + 2R I1 I2 cos 𝜆 donde I1 = 𝜖 0 c(E0† /s1 ) 2 /2 y I2 = 𝜖 0 c(E0† /s2 ) 2 /2. Esta irradiancia es análoga a la eq. (3.44), salvo por el contraste de las franjas, el cual es bajo para la lámina. Al aumentar la reflectancia de la lámina, tendremos más sumandos y ya no se puede escribir de manera sencilla la irradiancia resultante de la superposición de J haces transmitidos ( J → ∞), tal y como se hace con la eq. (3.82) en el caso de la superposición de haces paralelos. Irradiancia Transmitida, I t 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 2 4 6 8 Distancia radial, r (mm) 10 12 Figura 3.43. Perfiles de los interferogramas obtenidos con los interferómetros de la fig. 3.36(a) (en negro) y 3.36(b) (en gris segmentado). Para ver la diferencia que se tiene entre el interferograma obtenido con la configuración de la fig. 3.36(a) y el interferograma obtenido con la configuración de fig. 3.36(b), vamos a comparar el perfil del interferograma de la fig. 3.37(b), que se obtiene cuando r = 0.5, y el perfil del interferograma con la eq. (3.91), con el mismo valor de r. Para el cálculo del segundo perfil, tenemos en cuenta los siguientes parámetros: d = 0.25nl (en mm), nl = 1.5 y ni = 1.0. Con esto, se tiene que las fuentes virtuales están separadas a = 0.5 mm. Además, fijamos las distancias zS = 50 − 𝛿z0 y zP = 50 − d, ambas en mm. En la fig. 3.43, se muestra los dos perfiles para los primeros 6 anillos en función de la coordenada radial: en negro, el obtenido con el interferómetro de la fig. 3.36(a), en gris (segmentos largos y cortos), el obtenido con el interferómetro de la fig. 3.36(b). Dos cosas llaman la atención: 234 · Interferencia la primera, a medida que nos alejamos del centro los máximos de irradiancia, se van separando; segunda, a medida que nos alejamos del centro, los anillos del interferograma en negro se van atenuando. La separación entre los máximos corresponde con la mostrada en la fig. 3.39 para a = 0.5. Aunque el cálculo del perfil en negro se debe realizar con J → ∞, solamente empleamos los primeros 12 sumandos de la sumatoria de la eq. (3.91), lo cual es más que suficiente, ya que el sumado 12 resulta ser el ≈ 0.0001 % del segundo sumando.4 La eq. (3.94) es completamente análoga a la eq. (3.44), lo que implica que los radios de los círculos de máxima irradiancia para el interferómetro de la fig. 3.36(a), con r = 0.2, coinciden con los radios de los anillos de interferencia generados por dos ondas en el interferómetro de Michelson. Por otra parte, si el efecto de aumentar la reflectancia de la lámina se traduce en un adelgazamiento de los anillos de interferencia manteniendo el radio de los círculos de máxima irradiancia, entonces podemos anticipar que los círculos de máxima irradiancia en el interferómetro de la fig. 3.36(a) también se calculan con la eq. (3.47). En cuanto a la interferencia por reflexión, también se tendrá un resultado similar al de la fig. 3.38, como por supuesto, será el complemento de los interferogramas generados por transmisión. 3.5.3. Interferencia de dos ondas Ya hemos mencionado que en una lámina de caras planas paralelas cuando la reflectancia de las caras es baja, en la práctica, solo interfieren las dos primeras ondas reflejadas o transmitidas. En ambos casos, el análisis de la formación de las franjas de interferencia se puede hacer considerando las dos fuentes virtuales que se generan por la reflexión o por la transmisión. En esta sección, vamos a tratar una situación de particular interés: la interferencia de las dos primeras ondas esféricas reflejadas por una lámina de baja reflectancia (r ∼ 0.2). Este caso nos permitirá analizar más adelante la interferencia generada por fuentes de luz extendidas policromáticas. De acuerdo con lo visto en las unidades anteriores, tenemos dos configuraciones posibles para observar la interferencia, las cuales se ilustran en la fig. 3.44(a) y (b). Así que tenemos dos fuentes virtuales (en el lado opuesto al de la fuente S) generadas por la reflexión en cada una de las caras de la lámina. En (a), llegan dos rayos a P con diferentes ángulos desde las fuentes virtuales. Para cualquier punto P del lado de la fuente ocurrirá lo mismo, de modo que tendremos franjas de interferencia en cualquier lugar del lado 4 Otro ejemplo. Si el coeficiente de reflexión es r = 0.9, se requieren los primeros 68 sumandos para que el último sea aproximadamente el 0.0001 % del segundo sumando. · Interferencia 235 P S S P ni nl d nm (a) (b) Figura 3.44. Interferencia por reflexión. (a) Franjas no localizadas, (b) franjas localizadas. de la fuente (franjas no localizadas). En (b), dos rayos paralelos son enfocados por la lente en P, por lo tanto, solo se tendrán franjas de interferencia en el plano focal (franjas localizadas) que dependen del ángulo de los rayos (franjas de igual inclinación). S S P P O S'1 S'2 ( a) S'1 S'2 (b) Figura 3.45. Formación de las franjas por reflexión. (a) Franja circular en un plano de observación a cierta distancia de la lámina, (b) franja circular en un plano de observación próximo a la primera cara de la lámina. En esta sección, vamos a considerar la formación de franjas para la configuración de la fig. 3.44(a). Con ayuda de la fig. 3.45, podemos observar que, debido a la simetría alrededor del eje óptico (línea que pasa por S y las fuentes virtuales), las franjas de interferencia en un plano ortogonal al eje óptico que contiene a P son circulares. La separación entre las fuentes virtuales a = S10 S20 está dada por a = 2d tan 𝜃 t /tan 𝜃 i (eq. (3.87)) y el radio de los anillos de interferencia está dado por la eq. (3.47), con z0 ≥ (SO + a/2). En la fig. 3.45(a), se muestra la formación de un anillo de interferencia en un plano de observación a cierta distancia z0 > (SO + a/2). Al cam- 236 · Interferencia biar la distancia z0 , cambia la escala de los anillos (fig. 3.15). En el límite, cuando el plano de observación coincide con la primera cara de la lámina (z0 ≈ (SO+a/2) ), las franjas tendrán el menor tamaño posible (fig. 3.45(b)). Si la lámina presenta irregularidades en su espesor óptico (variaciones de índice de refracción y variaciones del espesor geométrico), las franjas de interferencia se distorsionan. En particular, si el plano de observación coincide con la primera cara de la lámina, entonces las franjas de interferencia en ese plano permiten medir las irregularidades de la lámina con respecto al patrón de anillos regular que se obtendría para una lámina ideal de caras planas paralelas. Más aún, si la distancia de la fuente S a la lámina es tal que los frentes de onda son prácticamente planos, entonces el patrón de interferencia será un mapa topográfico de espesor óptico (similar a las curvas de nivel en los mapas geográficos). De esta manera tendremos una forma de medir directamente la calidad óptica de la lámina. Para ver lo que acabamos de mencionar, en la fig. 3.46 se muestra un experimento para observar la interferencia por reflexión producida por una lámina de vidrio (n = 1.51). En (a), se muestra el montaje completo: un rayo láser (He-Ne, 632.8 nm), una lente de enfoque (8 mm de distancia focal), una lámina porta objeto de microscopio (espesor 1 mm), una lente formadora de imagen (150 mm de distancia focal y 60 mm de diámetro) y una pantalla de observación (vidrio esmerilado). El rayo láser se enfoca con la lente positiva para generar la fuente puntual. La luz que diverge (onda esférica) llega a la lámina donde ocurren las dos reflexiones relevantes para la interferencia. En (b), se muestra un detalle de la lámina a la cual se le ha colocado una etiqueta (con la palabra “óptica”) que servirá para formar la imagen de la lámina sobre la pantalla de observación. En (c), se muestra el patrón de interferencia en la pantalla de observación cuando se ha retirado la lente formadora de imagen, es decir, la luz viaja libremente desde la lámina hasta la pantalla de observación. En (d), se observa la imagen del patrón de interferencia que se tiene justo en la primera cara de la lámina. Para esto, se emplea la lente formadora de imagen. En efecto, se logra ver la imagen de la etiqueta al lado del interferograma. Ya que las franjas son no localizadas, en (d) se tiene una versión escalada de (c). Este interferograma muestra los defectos de la lámina que pueden ocurrir por variaciones del índice de refracción o por irregularidades en la planitud de las caras. Note que la apertura de la lente formadora de imagen debe ser lo suficientemente grande para recoger todos (o casi todos) los haces reflejados en la lámina si se desea observar el interferograma completo. Si en lugar de esta lente se coloca uno de nuestros ojos para mirar hacia la lámina, no Interferencia · 237 lograremos ver el interferograma, ya que el manojo de rayos que entra es muy pequeño, limitado por nuestra pupila. (a) (b) (c) (d) Figura 3.46. (a) Montaje experimental para ver la interferencia por reflexión en una lámina. (b) Detalle de la lámina con una etiqueta (palabra “óptica”). (c) Interferograma sobre la pantalla de observación a unos 60 cm de la lámina, sin la lente de imagen. (d) Imagen (formada con la lente de imagen) del interferograma que se tiene en la primera cara de la lámina. 238 · Interferencia 3.6. Interferencia con N fuentes puntuales En las unidades anteriores, hemos considerado el fenómeno de interferencia por dos fuentes puntuales mediante el interferómetro de Michelson y J fuentes puntuales con J → ∞ mediante una lámina de caras paralelas. El resultado de aumentar el número de fuentes tendiendo a infinito y que la contribución de cada onda en la interferencia sea relevante es el adelgazamiento de los anillos de interferencia. Si la reflectancia tiende a 1, el perfil de las franjas tiende a una distribución de bandas muy estrechas (como deltas de Dirac). En esta unidad, veremos el caso intermedio: la interferencia de ondas coherentes entre sí generadas por N fuentes puntuales (2 < N < ∞). En particular, trataremos dos situaciones: un arreglo de fuentes separadas uniformemente en dirección axial, como en la fig. 3.47(a); y un arreglo de fuentes separadas uniformemente en dirección transversal, como en la fig. 3.47(b). En ambos casos, vamos a suponer que las fuentes puntuales tienen la misma amplitud y fase inicial, por lo que el campo en un punto P en la pantalla de observación resulta ser (omitiendo el término temporal 𝜔t) E= E0† N Õ e iks j j=1 (3.95) sj SN S3 S2 S1 sN S1 S 2 S 3 SN s3 s1 s3 sN s1 z0 R1 R2 R3 R1 RN O (a) P R2 R3 RN O P (b) Figura 3.47. Arreglo de N fuentes puntuales (a) axial, (b) transversal. La interferencia con el primer arreglo de fuentes, en cierto modo, ya la hemos tratado en la unidad anterior. La distancia s j está determinada por la · Interferencia 239 eq. (3.92) sj = q R 2j + 𝜌2 , donde R j es el radio de curvatura del frente de onda con centro en S j y vértice en el punto O de la pantalla de observación. La distancia radial 𝜌 = 1/2 mide la separación entre O y P. Si a es la separación entre x2 + y2 fuentes consecutivas, entonces R j = R1 + ( j − 1)a. N =2 -10 -5 (3.96) N =3 0 5 -10 10 -5 N =5 0 5 -10 10 10 10 5 5 5 0 0 0 -5 -5 -5 -10 -10 -10 1.0 1.0 1.0 0.8 0.8 0.8 0.6 0.6 0.6 0.4 0.4 0.4 0.2 0.2 Irradiancia 10 0 0 2 4 6 8 10 Distancia radial, r (mm) (a) 12 0 -5 0 5 10 0.2 2 4 6 8 10 Distancia radial, r (mm) ( b) 12 0 2 4 6 8 10 Distancia radial, r (mm) 12 ( c) Figura 3.48. Interferencia de ondas esféricas generadas por 2, 3 y 5 fuentes puntuales localizadas axialmente y separadas uniformemente una distancia a = 1000𝜆 . La distancia de la primera fuente a la pantalla de observación es R1 = 100 mm. En la fig. 3.48, se muestra los patrones de interferencia (y sus perfiles) normalizados cuando a = 1000𝜆 , 𝜆 = 632.8 nm, R1 = 100 mm y N = 2, 3 y 5. Como es de esperar, al aumentar el número de fuentes, disminuye el ancho de las franjas, pero ahora hay un hecho notable: entre los máximos de las franjas más brillantes aparecen unas franjas de mucho menor intensidad. A las primeras franjas se les denomina máximos principales y a las segundas franjas se les denomina máximos secundarios. Lo que es un hecho es que se tienen (N − 2) máximos secundarios entre dos máximos principales consecutivos. A medida aumenta el número de fuentes disminuye la intensidad de los máximos secundarios y si N → ∞, los máximos secundarios desaparecen y tendremos franjas muy estrechas (limitadas por la difracción), como las mostradas en la fig. 3.37(c). · 240 Interferencia Para el segundo arreglo de fuentes puntuales (fig. 3.47(b)), los radios de curvatura de los frentes de onda con vértice en la pantalla de observación son iguales a z0 . Si suponemos que el arreglo lineal de fuentes está a lo largo de la dirección x, entonces la distancia de la fuente S j al punto P será sj = q N =2 -10 z02 + (x − ( j − 1)a) 2 + y 2 N =4 -5 0 5 -10 10 0 5 -10 10 10 10 5 5 5 0 0 0 -5 -5 -5 -10 -10 -10 0.8 0.8 0.8 0.2 0 0 Irradiancia 1.0 0.4 0.6 0.4 0.2 10 20 30 40 50 0 0 -5 0 5 10 x a = 80l 0 ; z 0 = 500 mm 1.0 Irradiancia Irradiancia a = 8l 0 ; z 0 = 50 mm 1.0 0.6 y N =4 -5 10 a = 8l 0 ; z 0 = 50 mm (3.97) 0.6 0.4 0.2 10 20 30 40 50 0 0 10 20 30 x (mm) x (mm) x (mm) (a) (b) (c) 40 50 Figura 3.49. Interferencia de ondas esféricas generadas por 2 y 4 fuentes puntuales localizadas lateralmente. En (a) y (b), la distancia de las fuentes a la pantalla de observación es z0 = 50 mm, y estas están separadas uniformemente una distancia a = 8𝜆 . En (c), la distancia de las fuentes a la pantalla de observación es z0 = 500 mm, y estas están separadas uniformemente una distancia a = 80𝜆 , pero se mantiene la misma región de observación. En la fig. 3.49, se muestra los patrones de interferencia (y sus perfiles) normalizados para arreglos de 2 y 4 fuentes puntuales. En (a) y (b), las fuentes están separadas a = 8𝜆 y a una distancia z0 = 50 mm de la pantalla de observación. Nuevamente, podemos ver que al pasar de 2 a 4 fuentes las franjas principales se adelgazan y emergen 2 franjas secundarias, pero se mantiene la posición de las franjas principales. En (c), hemos aumentado en 10 veces las cantidades a y z0 para el arreglo de 4 fuentes, pero hemos dejado la misma región de observación. Con esto, el patrón de interferencia cambia la forma de las franjas de hiperbólicas a líneas rectas. Ahora las franjas principales están separadas aproximadamente la misma distancia y, por supuesto, se sigue observando los máximos secundarios. Interferencia · 241 3.6.1. Aproximación con ondas planas En el arreglo de la fig. 3.47(b), cuando la región de observación es mucho menor que z0 , las ondas de las N fuentes cuando llegan a la pantalla de observación se pueden aproximar por ondas planas. Esto explica por qué en la fig. 3.49(c) las franjas se asemejan a un patrón de franjas rectas igualmente espaciadas. Si, además de la condición mencionada anteriormente, se tiene que la extensión del arreglo lineal de fuentes satisface (N − 1)a z0 , entonces las amplitudes de las N ondas en el punto P serán aproximadamente iguales y en el denominador de la eq. (3.95) podemos cambiar s j por z0 . Limitando el análisis a la dirección x, entonces s x 2 − 2( j − 1)xa + ( j − 1) 2 a2 s j = z0 1 + , (3.98) z02 que en primera aproximación queda s j = z0 + x2 ( j − 1)xa − . 2z0 z0 (3.99) Con esto la eq. (3.95), se puede escribir como E= E0† z0 e ikz0 e ikx 2 /2z 0 N Õ e −ikx ( j−1) a/z0 (3.100) j=1 Definiendo I0 = (𝜖 0 c/2)E0†2 /z02 , la irradiancia I = (𝜖 0 c/2) (E ∗ E) es I = I0 N Õ 2 e −ikx ( j−1) a/z0 . (3.101) j=1 La suma resulta ser N Õ 1 − e −ikxN a/z0 , 1 − e −ikxa/z0 (3.102) i2 sin (kxN a/2z0 ) . i2 sin(kxa/2z0 ) (3.103) e −ikx ( j−1) a/z0 = j=1 lo que se puede re-escribir como e −k (N −1) a/2z0 Finalmente, la irradiancia queda 2 sin(kxN a/2z0 ) I = I0 . sin(kxa/2z0 ) (3.104) 242 · Interferencia Máximos principales. Los ceros en el denominador de la eq. (3.104) determinan la posición de los máximos principales. Estos se obtienen para ka x = m𝜋 , 2z0 (3.105) con m entero. Luego, la irradiancia en estos puntos será I = I0 sin(N m𝜋) sin(m𝜋) 2 . (3.106) Ya que tanto el denominador como el numerador para m entero son cero, de la regla de l’hôpital se tiene que lı́m m→entero sin(N m𝜋) N cos(N m𝜋) = = ±N . sin(m𝜋) cos(m𝜋) (3.107) Por lo tanto, I = N 2 I0 (3.108) es el valor de los máximos principales que se localizan en xm = m 𝜆 z0 . a (3.109) Es decir, la separación entre máximos consecutivos resulta ser Δx = 𝜆 z0 . a (3.110) Por otra parte, en el numerador se obtienen otros ceros en medio de los ceros del denominador, los cuales están dados por N ka x = m0𝜋 , 2z0 (3.111) con m 0 (entero) < N , y se localizan en xm0 = m 0 𝜆 z0 . N a (3.112) Es decir, se tendrán (N − 1) mínimos (I = 0) entre dos máximos principales consecutivos. En consecuencia, se debe tener (N − 2) máximos secundarios intercalados con los mínimos. Interferencia Irradiancia, I (I0) 25 N=2 N=3 · 243 N=5 20 15 10 5 0 0 10 20 x (mm) 30 40 50 Figura 3.50. Perfil de los patrones de interferencia de N = 2, 3 y 5, fuentes puntuales de igual amplitud y uniformemente espaciadas. En la fig. 3.50, se muestra el perfil de los patrones de interferencia para N = 2, 3, y 5, fuentes puntuales cuando a = 80𝜆 , z0 = 1000 mm y 𝜆 = 632.8 nm. En todos los casos suponemos que la amplitud de las fuentes es igual, de modo que la irradiancia producida por una fuente en un punto de la pantalla de observación es I0 . Los resultados de la fig. 3.50 son la base de las rejillas de difracción, tema que trataremos en el capítulo 4. 244 · Interferencia 3.7. Interferencia con fuentes de luz extendidas Hasta ahora hemos mencionado la interferencia de ondas emitidas por una fuente puntual monocromática. Esta situación es muy común en el laboratorio, en el que disponemos de fuentes láser y elementos ópticos para formar una fuente puntual. Fuera del laboratorio, podemos observar interferencia con luz blanca (luz solar) en las pompas de jabón o en las películas de aceite sobre agua. En ambos casos, tenemos una película delgada con un espesor alrededor de la mitad de la longitud de coherencia de la luz. Ahora la luz solar directa o difusa que ilumina la película delgada llega en diferentes direcciones y se puede modelar como una fuente extendida incoherente, es decir, un conjunto de fuentes puntuales incoherentes entre sí distribuidas espacialmente. En la fig. 3.51, se muestra el patrón de interferencia coloreado registrado con una cámara fotográfica al enfocar una película de aceite sobre el piso húmedo en un día de lluvia. Figura 3.51. Interferencia generada por una mancha de aceite sobre el asfalto húmedo (agua) con la luz blanca (solar). Para explicar la formación de las franjas de la fig. 3.51, consideremos la fig. 3.52, en la que se muestra una lámina de caras planas paralelas de índice nl que descansa sobre un bloque de índice nm . Una fuente extendida, representada por la curva donde está S y S0, ilumina la lámina. Vamos a analizar Interferencia · 245 por partes esta figura. Primero, supongamos que solo tenemos la fuente puntual S, lo que genera un patrón de franjas no localizadas. En particular, fijemos la atención en el patrón de interferencia que se tiene cerca de la cara anterior de la lámina, como en la fig. 3.45(b). Si cambiamos S por otra fuente puntual S0, en forma análoga al caso de la fuente S, tendremos otro patrón de franjas no localizadas. Si ahora dejamos las dos fuentes activas, suponiendo que las dos fuentes son incoherentes entre sí, en P tendremos la superposición de los patrones de interferencia generados individualmente por cada fuente. Al añadir otras fuentes incoherentes entre sí, hasta completar la fuente extendida, el efecto de la superposición de los diferentes patrones de interferencia será una región iluminada sin modulación de la irradiancia por interferencia. En otras palabras, con la fuente extendida eliminamos las franjas de interferencia no localizadas que se podían observar con una fuente puntal. S' S Pantalla de observación L DA nl ni P' P nm Figura 3.52. Franjas de interferencia con una fuente extensa. Regresando a la situación en que solo se tiene la fuente puntual S, las franjas de interferencia no localizadas cerca de la cara anterior de la lámina se pueden observar formado la imagen de la lámina mediante una lente L, como se muestra en la fig. 3.52. Si el diafragma de apertura es pequeño (como en el ojo o en una cámara fotográfica) la región iluminada por S que se puede observar queda limitada al punto P y su vecindad. Esta vecindad está definida por los rayos que salen de S, inciden en la lámina y se reflejan pasando por el diafragma de apertura. El tamaño angular de la vecindad se define con el ángulo que subtiende la imagen virtual del diafragma de apertura (imagen que genera la primera cara de la lámina) con respecto a la fuente S. 246 · Interferencia Supongamos que la vecindad del punto P es muy pequeña, de modo que la interferencia en P se puede explicar como la superposición del rayo principal (línea tipo eje) reflejado en la primera cara y el rayo vecino que se refleja en la segunda cara de la lámina, ambos saliendo de S. Rayos que salen de S con otros ángulos no caen dentro de la vecindad de P. Si queremos ver la interferencia en otras regiones de la lámina, necesitamos rayos que salgan de otras fuentes. Por ejemplo, con la fuente S0 podremos observar la interferencia en P0. Y al considerar todas la fuentes puntuales que conforman la fuente extendida podremos observar el interferograma completo, similar al que se tiene con una sola fuente puntual (y la lente de gran apertura). Ahora el tamaño de la pantalla de observación (diafragma de campo) define la región en que se ve el interferograma. Por último, si las fuentes puntuales son policromáticas, cada color satisface las condiciones de interferencia, y como la posición de las franjas depende de la longitud de onda, entonces el resultado final son franjas de color. A medida que aumenta la longitud de onda, disminuye el tamaño de las franjas de interferencia (eq. (3.56)). (a) (b) Figura 3.53. (a) Patrones de interferencia por reflexión generados por la película de aire entre dos láminas portaobjeto de microscopio en contacto. (a) Franjas sobre una pantalla de observación (a 25 cm de las láminas) cuando se ilumina con una fuente puntual (longitud de onda 632.8 nm). (b) Franjas sobre las láminas en contacto cuando se ilumina con luz blanca (solar) registradas con una cámara fotográfica. En la fig. 3.53, se muestra las franjas de interferencia por reflexión generadas por la película de aire entre dos láminas portaobjeto de microscopio. En (a), franjas sobre una pantalla de observación separada de las láminas unos 25 cm cuando se ilumina con una fuente puntual (𝜆 = 632.8 nm), en (b), franjas sobre las láminas cuando se ilumina con la luz blanca registradas con una cámara fotográfica. Para generar la cuña de aire, se depositó una Interferencia · 247 gota de agua muy pequeña cerca del borde en una de las láminas, luego se colocó la otra lámina encima de la primera y se ejerció presión mecánica sobre las láminas, con lo que se extendió la gota de agua en una mancha. Más allá del límite de la mancha de agua, se tiene aire y es allí donde se observan las franjas de interferencia. Los dos patrones (a) y (b) se observan en una dirección cercana a la normal de las láminas. Cuando se observan las franjas de color en otro ángulo, la posición de las franjas cambia,5 como se muestra en la fig. 3.54. En (a), las franjas se observan bajo un ángulo aproximado de 10◦ con respecto a la normal de las láminas, lo que se puede considerar cercano a la normal. En este caso, las franjas serán básicamente de igual espesor y las podremos emplear para hacer un mapa topográfico de la película de aire. En (b) y (c), se inclinó la cámara fotográfica 45◦ y 70◦ , aproximadamente. Este cambio de tamaño de las franjas depende no solo del cambio del camino óptico en la película con el ángulo, sino del espesor de la lámina que está encima. En el caso de la película de aceite mostrada en la fig. 3.51, no tenemos otro medio (distinto al aire) encima, por lo que al cambiar el ángulo de observación el cambio del tamaño de las franjas es menos notable. (a) ∼ 10◦ (b) ∼ 45◦ (c) ∼ 70◦ Figura 3.54. Franjas de interferencia con luz blanca (solar) cuando se observan a diferentes ángulos con respecto a la normal de las láminas. Entonces, con luz que proviene de una fuente extendida policromática, se pueden observar franjas coloreadas localizadas en la película (de aire, jabón, aceite, etc). Si se observan en dirección de la normal a la película, las franjas serán básicamente de igual espesor. 5 La diferencia de fase cambia de manera similar a la eq. (3.79) para rayos paralelos. Al aumentar el ángulo de incidencia disminuye la diferencia de fase, por lo que las franjas aumentan su tamaño. 248 · Interferencia 3.7.1. Fuentes extendidas artificiales La luz blanca (solar) directa y difusa son un ejemplo de una fuente extendida, en que las fuentes puntuales están prácticamente en el infinito. Una manera de obtener una fuente extendida artificial es mediante el empleo de un vidrio pulido (lámina difusora), esto es una lámina de vidrio a la cual se le ha modificado una o ambas superficies lisas mediante un proceso de lijado (mediante algún abrasivo, como óxido de silicio). Con esto, la lámina se ve como una superficie opaca translucida (como la pantalla de observación que se usó en la fig. 3.46 para ver los interferogramas). Al iluminar el vidrio pulido las microrugosidades de la cara lijada actúan como fuentes secundarias de luz que emiten ondas aproximadamente esféricas. La iluminación se puede hacer con una fuente extendida (luz blanca, lámpara de filamento, lámpara de descarga, etc.) o con una onda esférica generada con un láser. El primer caso se suele emplear para homogenizar la iluminación. El segundo caso sirve para obtener una fuente extendida monocromática, pero ahora las diferentes fuentes puntuales secundarias son coherentes entre sí. La superposición de los campos generados por la multitud de estas fuentes secundarias coherentes generan un patrón de interferencia de estructura granulada (aleatoria) conocido como patrón de speckle (moteado en español). El tamaño promedio de las motas depende inversamente del tamaño de la región iluminada en el vidrio esmerilado. Por lo general, cuando se quiere obtener una fuente extendida monocromática, la región de iluminación tiene un tamaño tal que el tamaño promedio de la mota es muy pequeña, y lo que observamos es una iluminación homogénea (de gránulos muy pequeños). Interferómetro de Michelson con fuente extendida. Un ejemplo de la interferencia con una fuente extendida artificial común en los laboratorios de docencia emplea un interferómetro de Michelson y una lámina difusora iluminada con una lámpara de descarga (usualmente lámparas de vapor de sodio o mercurio). En estas lámparas, la mayor parte de la radiación emitida ocurre en unas pocas líneas espectrales. Por el ejemplo, para la lámpara de sodio, la mayor parte de la radiación está alrededor de las líneas 589.0 nm y 589.6 nm. De ahí su color amarillo intenso. En la fig. 3.55(a), se muestra un esquema del interferómetro de Michelson iluminado por la fuente extendida Σ (pantalla difusora iluminada por una lámpara). La fuente Σ será una colección de fuentes puntuales incoherentes entre sí con fases iniciales aleatorias. Los espejos M1 y M2 generan las imágenes virtuales Σ10 y Σ20 de la fuente Σ, las cuales se ven una detrás Interferencia · 249 de otra desde la pantalla de observación, como se muestra en la fig. 3.55(b). Suponiendo que la longitud de coherencia de la lámpara es mayor que la separación entre Σ10 y Σ20 , las ondas emitidas por las fuentes puntuales virtuales S10 y S20 (imágenes de la fuente puntual S en Σ) interfieren. Esto ocurre para todas las fuentes puntuales virtuales. Pero no tendremos interferencia entre ondas emitidas por las diferentes fuentes puntuales en Σ. En consecuencia, sin la lente L, en la pantalla de observación no se verán franjas de interferencia. Con ayuda de la lente L, colocando el plano de obervación en el plano focal de la lente, podremos observar franjas de interferencia de igual inclinación. Estas franjas son el resultado de la superposición en intensidad de los patrones generados por cada fuente puntual en Σ. Las Eqs. (3.85) y (3.86), con nl = ni = 1, describen estas franjas. M2 S' 2 S' 2 S' 1 S' 1 M1 O Lámpara S S BS L f L f y x (a) y Pantalla de observación x Pantalla de observación (b) Figura 3.55. (a) Interferómetro de Michelson iluminado con una fuente extendida Σ. (b) Ilustración de las imágenes virtuales Σ10 y Σ20 de la fuente extendida Σ generadas por los espejos M1 y M2 vistas desde la lente L. Figura 3.56. Patrón de interferencia con luz blanca (solar) entre dos láminas portaobjeto de microscopio cuando se presionan entre sí con un lápiz. 250 · Interferencia En la fig. 3.56, se muestra la interferencia entre dos láminas portaobjeto de microscopio cuando se presionan entre sí con la punta de un lápiz. De acuerdo con lo expuesto en esta unidad, se propone al lector que realice una descripción cualitativa del proceso de formación de las franjas de color y del espesor de la película de aire entre las láminas. Interferencia · 251 3.8. Interferómetro de Young I En el siglo XVIII, prevaleció la teoría corpuscular de la luz desarrollada por Newton (1643-1727). Aunque ya se observaba un comportamiento ondulatorio de la luz, la dificultad de observar la difracción (como ya se conocía en el sonido o en las ondas superficiales en el agua) hizo que Newton se ocupara en desarrollar una teoría corpuscular de la luz, la cual fue aceptada gracias a la reputación científica con la que contaba Newton. Casi por la misma época, otros científicos como Christian Huygens (1629-1695) y Robert Hooke (1635-1703) defendían teorías ondulatorias para la luz. Un poco antes, Francesco Grimaldi (1618-1663) observó la difracción de la luz por pequeñas aberturas, lo cual sugería un comportamiento ondulatorio de la luz. A pesar de estos antecedentes, no se tenía una prueba contundente de que la teoría corpuscular de Newton fuera incorrecta. En 1803, Thomas Young (1773-1829) realizó un experimento con el que se puso en serias dudas la teoría corpuscular [17]. La versión moderna del interferómetro de Young se ilustra en la fig. 3.57. En la fig. 3.57(a), se muestra el esquema general. La fuente de iluminación S es una fuente (extendida) de tamaño 𝜎. A la distancia zs se encuentra la pantalla 1, la cual tiene un agujero pequeño (S0 ). Luego, a la distancia zp de la pantalla 1 se encuentra la pantalla 2 que contiene otros dos agujeros idénticos (S1 y S2 ) separados entre sí la distancia a. Finalmente, a la distancia z0 de la pantalla 2 se encuentra la pantalla de observación. El tamaño de S0 determina la correlación espacial de los campos en S1 y S2 . Si S0 es una fuente puntual, se tendrá la máxima correlación espacial entre S1 y S2 . Por otro lado, el tamaño de S1 y S2 determina la modulación por difracción del patrón de interferencia en la pantalla de observación. El análisis del patrón de interferencia, teniendo en cuenta la geometría de los agujeros y el tamaño de la fuente luminosa, lo veremos en el capítulo 4. En lo que sigue, trataremos la situación ideal en la que los agujeros son tan pequeños que podemos suponer que en S0 se tiene una fuente puntual primaria y en S1 y S2 dos fuentes puntuales secundarias, como se muestra en la fig. 3.57(b). Lo usual en el experimento de Young es la simetría con respecto al eje óptico, de modo que S1 y S2 están a la misma distancia del eje óptico y, por lo tanto, S0 S1 = S0 S2 . Entonces, en la pantalla de observación tendremos la superposición de los frentes de onda esféricos que divergen de S1 y S2 . Esta situación ya se discutió en la unidad 3.3. En la fig. 3.17 se muestran algunos patrones de interferencia cambiando la distancia entre las fuentes S1 y S2 , y la distancia entre las fuentes y la pantalla de observación. 252 · Interferencia zs zp z0 S1 a s S S0 Pantalla 1 S2 Pantalla 2 Pantalla de observación ( a) S1 S S0 Pantalla 1 S2 Pantalla 2 Pantalla de observación (b) P S1 S S0 Pantalla 1 a x' S2 Pantalla 2 (x,y) ( c) Pantalla de observación (x',y') Figura 3.57. Experimento de Young. (a) Geometría del experimento. En la pantalla 1, se tiene un agujero pequeño para dejar pasar parte de la luz emitida por la fuente extendida S de tamaño 𝜎. En la pantalla 2, se tienen otros dos agujeros S1 y S2 , también pequeños, que a su vez dejan pasar parte de la luz que diverge de S0 . En la pantalla de observación se superpone la luz que diverge de los agujeros S1 y S2 . (b) Esquema simplificado con fuentes puntuales en S0 , S1 y S2 . (c) Geometría para el cálculo de la diferencia de camino óptico. Suponiendo que la fuente es monocromática con longitud de onda 𝜆 y longitud de coherencia mayor de camino óptico en P, que la diferencia es decir, lc > S0 S2 + S2 P − S0 S1 + S1 P = S2 P − S1 P (fig. 3.57(c)), los máximos de irradiancia en la pantalla de observación a lo largo de la Interferencia · 253 dirección x 0 están dados por s xm0 = m𝜆 2 4z02 a2 − m2 𝜆 2 + 1, (3.113) de acuerdo con la eq. (3.48), cambiando y0 → z0 y zm → xm0 . El parámetro m etiqueta las franjas de interferencia. Así, m = 0 corresponde con la franja central, m = 1, 2, 3, ... a las franjas al lado derecho (izquierdo) de la franja central según su orden y m = −1, −2, −3, ... a las franjas al lado izquierdo (derecho) de la franja central según su orden. En el experimento de Young, se satisface que z0 a 𝜆 . Si la región en que se observa el interferograma tiene una extensión mucho menor que z0 , las franjas que se observan son franjas paralelas uniformemente espaciadas (como en la imagen de la derecha en la fig. 3.17 cuando la separación entre las fuentes y la pantalla de observación es 200 mm y a = 32𝜆 ). En este caso, la posición de la m-ésima franja se puede obtener haciendo las aproximaciones correspondientes en la eq. (3.113), es decir, z0 𝜆 xm0 = m , (3.114) a y la separación entre dos franjas consecutivas será Δx 0 = z0 𝜆 . a (3.115) Estos resultados (eqs. (3.114) y (3.115)) también los obtuvimos en la unidad 3.6 (eqs. (3.109) y (3.110)), en la que hemos aproximado los frentes de onda esféricos por frentes de onda planos, aproximación que también se satisface en el experimento de Young. Con esto en mente, la irradiancia en la pantalla de observación en el experimento de Young estará dada por la eq. (3.104) con N = 2, esto es, I = I0 sin(kx 0 a/z0 ) sin(kx 0 a/2z0 ) 2 (3.116) 2 con I0 = (𝜖 0 c/2)E0† /z02 , donde E0† es la amplitud del campo (por unidad de longitud) de las fuentes S1 y S2 . Empleando la identidad trigonométrica sin(2𝛼) = 2 sin 𝛼 cos 𝛼 en el numerador de la eq. (3.116), se llega a I = 4I0 𝜋a 0 cos x z0 𝜆 2 . (3.117) Otra manera aproximada para determinar la irradiancia se obtiene directamente de la fig. 3.57(c). Teniendo en cuenta la condición z0 a, el 254 · Interferencia campo en P debido a S1 será E1 (P) = (E0† /z0 )e iks1 y el campo en P debido a S2 será E2 (P) = (E0† /z0 )e iks2 . Por lo tanto, la irradiancia en P, dada por I = (𝜖 0 c/2) |E1 (P) + E2 (P)| 2 , queda I = 2I0 [1 + cos (k(s2 − s1 ))] . Aproximando s2 − s1 ≈ a𝛼 ≈ ax 0/z0 , se llega a 2𝜋 a 0 x I = 2I0 1 + cos 𝜆 z0 (3.118) (3.119) lo que es equivalente a la eq. (3.117). 3.8.1. División de frente de onda y división de amplitud En el interferómetro de Young, tenemos un hecho notable en cuanto a la forma de generar las dos fuentes secundarias S1 y S2 en comparación con el interferómetro de Michelson. En el interferómetro de Michelson (al igual que en la lámina de caras paralelas), las fuentes secundarias son imágenes virtuales de una fuente primaria, obtenidas mediante el divisor de haz y los espejos M1 y M2 , fig. 3.18. El divisor de haz divide la amplitud de la onda incidente (en una onda reflejada y en una onda transmitida). A los interferómetros basados en este principio, también se les denomina interferómetros de división de amplitud. En cambio, en el interferómetro de Young, las fuentes secundarias S1 y S2 se obtienen aislando regiones del frente de onda emitido por la fuente primaria S0 . Se dice entonces que las fuentes secundarias se obtienen mediante la división del frente de onda. A los interferómetros basados en este principio, también se les denomina interferómetros de división de frente de onda. En los interferómetros de división de amplitud, las fuentes secundarias son copias de la fuente primaria, por lo que la interferencia entre las ondas secundarias depende de la correlación temporal de los campos que se superponen. Si el retraso temporal entre las ondas es mayor que el tiempo de coherencia (fig. 3.6) no se observará interferencia. En el caso de los interferómetros de división de frente de onda, la interferencia también depende de la similitud espacial de los campos ópticos en S1 y S2 . La correlación espacial de los campos en S1 y S2 mide la coherencia espacial de las ondas. En particular, en el interferómetro de Young, el tamaño de la región de observación del interferograma suele ser tal que para cualquier punto P dentro de la región, la longitud de coherencia es mayor que la diferencia de camino óptico, por lo que la coherencia de las ondas que interfieren queda Interferencia · 255 determinada básicamente por la correlación espacial de los campos en S1 y S2 . Así que la coherencia presenta dos aspectos, uno temporal y otro espacial, que se pueden medir con ayuda del interferómetro de Michelson y del interferómetro de Young, respectivamente. 256 · Interferencia 3.9. Otros interferómetros Podemos decir que un interferómetro es un sistema óptico que divide en amplitud o en frente de onda una onda primaria en dos o más ondas secundarias, y luego, después de que las ondas secundarias han recorrido diferentes caminos ópticos, estas se superponen para observar un patrón de interferencia. La geometría de las franjas da cuenta de algunos parámetros del sistema interferométrico, por ejemplo, calidad de las superficies ópticas, la homogeneidad del vidrio óptico (variación del índice de refracción), curvaturas de las superficies, etc. En esta unidad, describiremos brevemente algunos interferómetros diferentes a los interferómetros de Michelson y Young. 3.9.1. Interferómetro de Fabry-Perot Figura 3.58. Interferómetro de Fabry-Perot básico. Consta de dos planos ópticos de vidrio semiplateados en una de las caras, de un anillo espaciador (∼ 0.5 mm de espesor) y de un soporte cilíndrico que ajusta el sistema de espejos con el espaciador en medio. En la fig. 3.58, se muestra un sistema conformado por dos espejos planos, un anillo espaciador de unos 0.5 mm de espesor y un soporte cilíndrico. Los espejos son láminas gruesas de vidrio (en forma de cuña) con un recubrimiento metálico (aluminio) en una de sus caras para producir alta reflectancia (0.9 < r < 1). El anillo espaciador se coloca en medio de los dos espejos (en contacto con sus caras metalizadas) garantizando una distancia fija entre los espejos. El conjunto de espejos y anillo se coloca dentro del so- Interferencia · 257 porte cilíndrico y se ajusta. Este dispositivo se conoce como interferómetro de Fabry-Perot, en su forma más simple. El funcionamiento del interferómetro se explica con lo que ya hemos desarrollado para la lámina de caras paralelas, pero ahora nl = 1 (aire en medio de los espejos). En la fig. 3.59(a), tenemos un esquema de un montaje experimental para observar simultáneamente las franjas de interferencia (no localizadas) por reflexión y transmisión con el interferómetro de Fabry-Perot de la fig. 3.58. Un haz láser se enfoca en el centro de un agujero de unos 3 mm de diámetro localizado en una pantalla opaca (pantalla 1). Allí tendremos la fuente puntual S. El frente de onda esférico divergente se transmite y se refleja múltiples veces en las láminas del interferómetro. En las figs. 3.59(b) y (c), se muestran los interferogramas que se ven por reflexión en la pantalla 1 y por transmisión en la pantalla 2, respectivamente. En (b), el punto oscuro corresponde con agujero en que se ubica la fuente puntual. En efecto, los dos interferogramas se complementan entre sí (como en las figs. 3.37(c) y 3.38(c)). Láser S Interferómetro Fabry-Perot Pantalla 1 Pantalla 2 (a) (b) (c) Figura 3.59. (a) Sistema óptico para observar simultáneamente la interferencia por reflexión y por transmisión. (b) Interferograma por reflexión en la pantalla 1. (c) Interferograma por transmisión en la pantalla 2. 258 · Interferencia Interferómetro de Fabry-Perot como cavidad resonante Una aplicación de gran importancia del interferómetro de Fabry-Perot se encuentra en los láseres en los que el interferómetro es la cavidad resonante. Para ver esto, consideremos la fig. 3.34 en la que se muestra que para r = 0.96 se obtiene una irradiancia transmitida en bandas muy estrechas. Esta gráfica está en función del espesor de la lámina. Sin embargo, si se deja fijo el espesor de la lámina y se dibuja la irradiancia en función de la frecuencia de la onda, se obtiene una gráfica similar, ya que la fase dada en la eq. (3.79) también depende linealmente de la frecuencia 𝜈 = c/𝜆 . Es decir, para reflectancias muy altas de los espejos tendremos que la irradiancia transmitida solo ocurre en bandas de frecuencia muy estrechas, lo que explica el alto grado de monocromaticidad de los láseres. En este libro no abordaremos los detalles de este interferómetro como cavidad resonante, los cuales se pueden consultar en obras especializadas sobre láseres [18]. También se puede tener un primer acercamiento al tema consultando libros de óptica básica [3]. 3.9.2. Película delgada antirreflectiva Una aplicación de la interferencia en una lámina de caras paralelas la encontramos en los recubrimientos antirreflectivos. El sistema más simple consiste en una lámina de caras paralelas cuyo espesor es del orden de la longitud de onda, denominada película delgada, sobre otra lámina de caras paralelas, denominada sustrato, como se ilustra en la fig. 3.60. E0 n nd n' E r1 E r2 Película delgada Sustrato Figura 3.60. Película delgada sobre un sustrato. Cuando el espesor de la película es d = 𝜆 /4nd , Er1 y Er2 interfieren destructivamente. El campo reflejado en la primera cara es Er1 = r1 E0 y en la segunda es Er2 = t1 r2 t10 E0 . Así, el campo total reflejado (omitiendo la reflexión en la Interferencia · 259 base del sustrato) será, Er = r1 E0 + t1 r2 t10 E0 e i𝛿 donde 𝛿= 4𝜋nd d. 𝜆 La irradiancia reflejada será Ir = I0 R, con I0 = (𝜖 0 c/2)E02 y la reflectancia R = r12 + (t1 t10 r2 ) 2 + 2r1 t1 t10 r2 cos 𝛿. A incidencia normal, los coeficientes de reflexión y transmisión (para el estado de polarización paralelo) son r1 = nd − n n 0 − nd 2nd 2n ; r2 = 0 ; t0 = . ; t1 = nd + n n + nd nd + n 1 nd + n En la práctica, es común usar el MgF2 (fluoruro de magnesio), cuyo índice es nd = 1.38, para la película delgada. Si esta película está depositada sobre un sustrato de vidrio (n 0 = 1.5) y n = 1 (aire), se tiene la relación n < nd < n 0, por lo que la reflectancia obtiene un valor mínimo cuando 𝛿 = 𝜋, es decir el espesor de la película debe ser d= 𝜆 . 4nd Con un poco más de trabajo, se encuentra que el mínimo toma el valor de cero si se satisface la condición nd2 = n 0 n. Por ejemplo, para el sustrato de vidrio la película delgada debería tener un índice de 1.22, algo más bajo que el de MgF2 . 3.9.3. Interferómetro de Newton y Fizeau En general, cualquier arreglo de dos superficies ópticas en contacto iluminadas con luz monocromática se denomina interferómetro de Newton [19]. El nombre dado a este tipo de interferómetros viene de los primeros experimentos reportados por Newton [2] al colocar en contacto un par de lentes para telescopio. En este experimento, Newton observa franjas circulares coloreadas con centro en la región de contacto. Algo similar a esto es lo que se 260 · Interferencia muestra en la fig. 3.56, en la que el centro de las franjas coloreadas está en la punta del lápiz. A estas franjas circulares también se les denomina anillos de Newton. Imagen LI Lámpara S BS Lente de prueba 1 2 Plano óptico Figura 3.61. Montaje para observar los anillos de Newton generados por la cara curva de la lente en contacto con el plano óptico. El montaje básico para observar los anillos de Newton se muestra en la fig. 3.61. Una lente de caras esféricas se coloca sobre un plano óptico de referencia (error pico-valle 𝜆 /100). Las superficies en contacto, superficie esférica 1 y superficie plana 2, forman una película de aire. Para iluminar las superficies en contacto, se emplea una fuente extendida monocromática (lámpara de descarga de mercurio). El patrón de interferencia que se forma por la superposición de las ondas reflejadas externamente en el plano óptico (superficie 2) e internamente en la lente (superficie 1) se observa con ayuda de una lente formadora de imagen LI. Con este montaje, se examina la calidad de la superficie curva de la lente que está en contacto con un plano óptico de referencia. Si la cara de la lente es esférica, se tendrá un patrón de interferencia formado por anillos circulares. El radio del m-ésimo anillo brillante está dado por 𝜌m = p (m + 1/2)𝜆 R, (3.120) y el radio del m-ésimo anillo oscuro será √ 𝜌 m = m𝜆 R, (3.121) Interferencia · 261 donde R es el radio de curvatura de la superficie esférica 1 y m = 0, 1, 2, ... Se deja como tarea deducir las eqs. (3.120) y (3.121). Note que ahora la franja central se etiqueta con m = 0 (en donde está la región de contacto), mientras que para las franjas generadas por dos fuentes virtuales como en la fig. 3.16 el valor de m para la franja central depende del cociente entre la separación de las fuentes virtuales y la longitud de onda. El montaje de la fig. 3.61 también se puede usar para evaluar la calidad de las superficies planas de otros elementos ópticos (lentes, planos, prismas). Por ejemplo, en el proceso de pulido de las superficies planas de un prisma, fig. 3.62(a), se puede verificar la calidad de las superficies colocando la superficie que se desea evaluar en contacto con el plano óptico del interferómetro de Newton de la fig. 3.61. En la fig. 3.62(b), se muestra el patrón de franjas que se obtiene para la superficie diagonal de uno de los prismas de la fig. 3.62(a). Ya que las franjas son de igual espesor, se puede tener un mapa de la topografía de la superficie bajo análisis. (a) (b) Figura 3.62. (a) Pulido de las superficies diagonales de dos prismas rectos. (b) Franjas de interferencia generadas por la superficie diagonal de uno de los prismas en (a) cuando se pone un contacto con el plano óptico de referencia del interferómetro de Newton. En general, la superficie de referencia debe tener una forma similar a la superficie que se desea evaluar mediante las franjas de interferencia. Si la forma de las dos superficies difiere en un gran número de longitudes de onda, se tendrán muchas franjas y no se podrán resolver con el sistema formador de imagen. Si en la práctica no es posible colocar en contacto las dos superficies, se puede hacer una variación al sistema óptico de la fig. 3.61, como se muestra en la fig. 3.63 (interferómetro de Fizeau). La fuente de iluminación debe tener una longitud de coherencia mayor a dos veces la separación t entre el plano óptico de referencia y la superficie de prueba. Así que lo común es 262 · Interferencia emplear un haz láser enfocado en S. Las franjas de interferencia serán de igual espesor. 2 Plano óptico Imagen 1 Superficie de Lente colimadora prueba LI BS t S (Láser) Figura 3.63. Esquema del interferómetro de Fizeau para evaluar una superficie de prueba que está separada una distancia t del plano óptico de referencia. Capítulo cuatro Difracción Difracción · 265 Figura 4.1. Imagen experimental de una fuente puntual monocromática generada por un sistema óptico con astigmatismo, aberración esférica y un desenfoque. La difracción, al igual que la interferencia, es un fenómeno de naturaleza ondulatoria. Desde el punto de vista matemático, la diferencia entre la interferencia y la difracción está en el número de fuentes que generan las ondas que interfieren. En la interferencia, se tiene un número discreto de fuentes, mientras que en la difracción, se tiene un número continuo de fuentes. En cuanto al comportamiento del campo luminoso, la difracción se ve como la desviación de la trayectoria rectilínea (de la luz) que no se debe a la reflexión o a la refracción. En este capítulo, veremos la difracción limitándonos al rango paraxial, es decir, difracción de Fresnel y difracción de Fraunhofer. Trataremos en detalle los ejemplos de la difracción por una abertura circular y por una abertura rectangular. Con la primera, podremos analizar la formación de imagen cuando se tiene en cuenta la naturaleza ondulatoria de la luz, con la segunda, desarrollaremos la matemática básica para las rejillas de difracción unidimensionales. En la fig. 4.1, se muestra la imagen de un objeto puntual (monocromático) generada por un sistema óptico que modela un ojo humano con miopía, astigmatismo y aberración esférica. El efecto de la difracción y las aberraciones reduce la agudeza visual en el ojo humano y, en general, reduce la resolución en los sistemas formadores de imagen. Nota sobre los patrones de difracción calculados Los patrones de difracción calculados se muestran como imágenes en niveles de gris, y con el propósito de resaltar las regiones de menor intensidad en lugar de mostrar la distribución de irradiancia, mostraremos la raíz cuadrada de la distribución de irradiancia, excepto en la sección acerca de la 266 · Difracción resolución de la imagen en la unidad 4.5. Para el caso de las gráficas de los perfiles de irradiancia, estos sí se muestran en su escala real. Difracción · 267 4.1. Principio de Huygens-Fresnel El principio de Huygens, enunciado en la sección 1.1.3, reza “cada punto en un frente de onda se puede considerar como una fuente de ondas esféricas secundarias que se propagan con la misma velocidad que el frente de onda. Al cabo de un tiempo, el frente de onda propagado será la envolvente de las ondas esféricas secundarias” [3]. Con este principio, se puede deducir la propagación (sin obstrucción) de un frente de onda, como se muestra en la fig. 4.2, donde se obtiene Σ0 a partir de Σ, y también se puede deducir correctamente la ley de la reflexión y la ley de la refracción (fig. 1.8). Por otra parte, Fresnel establece que el campo óptico en un punto P se obtiene de la interferencia de las ondas secundarias [20]. De esta manera Fresnel da una explicación satisfactoria al fenómeno de la difracción. A la combinación del principio de Huygens y la interferencia de las ondas secundarias de Fresnel se le denomina principio de Huygens-Fresnel. S' S P Ondas esféricas secundarias Figura 4.2. El principio de Huygens-Fresnel establece que el campo en P es la superposición (interferencia) de las ondas esféricas secundarias emitidas por las fuentes virtuales localizadas en el frente de onda Σ. La formalización matemática del principio de Huygens-Fresnel será realizada un siglo después por Kirchhoff y refinada después por Rayleigh y Sommerfeld [21]. Si bien el estudio de la difracción se puede iniciar a partir del formalismo matemático de Kirchhoff, vale la pena seguir las ideas de Fresnel para obtener una mayor comprensión conceptual de la difracción. El tratamiento que seguiremos se describe en el libro de Born & Wolf [22]. Vamos a comenzar por la situación más simple: la propagación en el vacío de un frente de onda esférico emitido por una fuente puntual. En la fig. 4.3, se tiene una fuente puntual S. De acuerdo con la expresión del campo para una onda esférica, omitiendo el término de fase temporal e −i𝜔t , 268 · Difracción el campo en el punto P será E(P) = E0† e ikd , d (4.1) donde d = SP y E0† es la amplitud del campo multiplicada por la unidad de longitud. Q c r0 S s q V P S Figura 4.3. Propagación de una onda esférica. La contribución de la fuente secundaria Q al campo en P depende del ángulo 𝜒 . Si empleamos el principio de Huygens-Fresnel para calcular el campo en P, se debe tener el mismo resultado de la eq. (4.1). Sea Σ el frente de onda esférico de radio r0 emitido por la fuente puntual S en un tiempo dado. Partiendo de este frente de onda, las fuentes que emiten las ondas secundarias de Fresnel estarán localizadas en los puntos que conforman Σ. En particular, en el punto Q del frente de onda Σ tendremos un emisor secundario cuya contribución al campo en P será de la forma E(Q)e iks /s, donde E(Q) = E0† e ikr0 /r0 . En la suma de todas las ondas secundarias (infinitas), para obtener E(P), se incluye otra hipótesis de Fresnel: la amplitud de las ondas secundarias varía con la dirección definida por el ángulo 𝜒 , el cuál es el ángulo entre la normal del frente de onda Σ en Q y la línea que une Q con P, fig. 4.3. Por lo tanto, la amplitud de las ondas secundarias será de la forma E(Q)K ( 𝜒 ), donde K ( 𝜒 ) es la función que determina la manera como ocurre la variación de la amplitud. El ángulo 𝜒 se denomina ángulo de inclinación y la función K se denomina factor de inclinación. Con la función K, se describe la hipótesis de Fresnel: “ya que el impulso comunicado en cualquier parte del frente de onda primario Σ sigue la normal del frente de onda, el efecto sobre el medio (éter) tiene que ser más intenso en la dirección de la normal, por lo que los rayos de Q a P serán menos intensos a medida Difracción · 269 que se desvían de la normal”.1 Fresnel menciona que la investigación para conocer la forma explícita de la función K es un “asunto muy difícil” pero eso no es un problema, ya que en muchas situaciones prácticas los rayos de Q a P se desvían poco de la normal, de modo que se puede dejar un valor constante para la función K. Siguiendo a Fresnel, K es máximo cuando 𝜒 = 0 y se anula cuando la línea de Q a P es tangente al frente de onda Σ, es decir, 𝜒 = 𝜋/2. Esto implica que no todo el frente de onda esférico Σ contribuye a la suma en P. La validez de estas condiciones se considerará más adelante con el tratamiento analítico desarrollado por Kirchhoff. De acuerdo con lo anterior, el campo en P estará dado por E(P) = E0† e ikr0 r0 ∫ ∫ Σ e iks K ( 𝜒 )d𝜎 , s (4.2) donde d𝜎 describe el elemento diferencial de área en Q. Esta integral es la versión matemática del principio de Huygens-Fresnel. 4.1.1. Zonas de Fresnel La integral de Huygens-Fresnel se puede resolver dividiendo el dominio en regiones en que el factor de inclinación se puede aproximar por una constante. Este procedimiento propuesto por Fresnel da resultados sorprendentes, los cuales ocurren en la práctica, como veremos más adelante. Las regiones en las que se divide el dominio se denominan zonas de Fresnel y para el frente de onda esférico se construyen como se muestra en la fig. 4.4. Desde el punto P se trazan esferas de radio b + j𝜆 /2, con j = 0, 1,..., N y b = VP (luego, d = r0 + b). La j-ésima zona (Z j ) es la región anular de Σ contenida entre las esferas de radio b + ( j − 1)𝜆 /2 y b + j𝜆 /2. Si b 𝜆 y r0 𝜆 , entonces en el factor de inclinación se realizan las siguientes aproximaciones: - K ( 𝜒 ) ≈ constante, para una zona dada de Fresnel, y cambia muy poco entre zonas consecutivas. - K j ( 𝜒 ) ≈ K j+1 ( 𝜒 ) + K j−1 ( 𝜒 ) /2. Además, se tiene que 1 El texto entre comillas es una versión personal (traducida al español) del tercer párrafo del texto que está en la página 115 del libro Great Experiments in Physics, editado por Morris H. Shamos, editorial Dover (1987), en el que se presenta la versión en inglés del texto original de Fresnel sobre la difracción. 270 · Difracción - KN ( 𝜒 ) = 0, si 𝜒 = 𝜋/2. Z4 Z3 Z2 Z1 r0 V S b b+l/ 2 b+l b+3l/ 2 b+2l b+5l/ 2 P b+3l S Figura 4.4. Zonas de Fresnel en un frente de onda esférico. De la geometría de la fig. 4.3, se tiene que s2 = r02 + (r0 + b) 2 − 2r0 (r0 + b) cos 𝜃 , con 𝜃 el ángulo polar. Diferenciando parcialmente, entonces 2sds = 2r0 (r0 + b) sin 𝜃d𝜃 . Como el elemento diferencial d𝜎 = r02 sin 𝜃d𝜃d𝜙, con 𝜙 el ángulo azimutal, reemplazando sin 𝜃d𝜃, se tiene que d𝜎 = r0 sdsd𝜙. (r0 + b) (4.3) Teniendo en mente los anteriores resultados, la integral de difracción (eq. (4.2)) se puede aproximar como E(P) = N Õ E j (P), (4.4) j=1 donde E j (P) = E0† e ikr0 r0 b+ ∫j𝜆 /2 2𝜋K j b+( j−1)𝜆 /2 e iks r0 sds, s (r0 + b) (4.5) Difracción · 271 donde se ha usado la aproximación K j ( 𝜒 ) = K j (constante para la j-ésima zona). Evaluando la integral de la eq. (4.5), el campo óptico en P será E(P) = N Õ E j (P) = i2𝜆 j=1 N E0† e ikd Õ d (−1) j+1 K j . (4.6) j=1 Así que el valor de la integral depende de la suma de los factores de inclinación en cada zona de Fresnel. Al tener en cuenta la segunda aproximación sobre el valor medio del factor de inclinación de las zonas adyacentes para una zona dada, es decir, K j ( 𝜒 ) = K j+1 ( 𝜒 ) + K j−1 ( 𝜒 ) /2. La suma N Õ (−1) j+1 K j = K1 − K2 + K3 − K4 + ... + (−1) N +1 KN (4.7) j=1 se puede escribir como N Õ (−1) j+1 Kj j=1 K1 K3 K1 + + − K2 + = 2 2 2 KN /2 ;N + KN −1 /2 − KN ; N K3 K5 + ...(4.8) − K4 + 2 2 → impar → par Ya que el promedio de las zonas adyacentes a la zona Z j es aproximadamente igual al valor de la zona Z j , la suma se reduce a N Õ j=1 (−1) j+1 K1 KN Kj = ± → 2 2 + ; N → impar . − ; N → par (4.9) Por lo tanto, E0† e ikd K1 KN ± E(P) = i2𝜆 , d 2 2 o bien (4.10) 1 [E1 (P) ± EN (P)] . (4.11) 2 Cuando el frente de onda Σ se propaga sin ser obstruido, el número total de zonas N se obtiene cuando 𝜒 = 𝜋/2 y EN (P) = 0. El campo en P resulta ser 1 E(P) = E1 (P). (4.12) 2 Teniendo en cuenta el resultado de la eq. (4.1) para E(P) y la expresión del campo para la primera zona E1 (P) = i2𝜆 K1 E0† e ikd /d, la eq. (4.12) se satisface si i e −i 𝜋/2 K1 = − = . (4.13) 𝜆 𝜆 E(P) = · 272 Difracción De esta manera se puede encontrar el valor explícito del factor de inclinación para la primera zona. 4.1.2. Resultados del tratamiento de Fresnel La eq. (4.12) se puede interpretar como se muestra en la fig. 4.5. En (a), se tiene la propagación libre del frente de onda Σ; en (b) se tiene el frente de onda obstruido por una abertura circular que deja pasar el campo limitado por la mitad de la primera zona de Fresnel. En ambos casos, el campo en P estará dado por E0† e ikd /d y la irradiancia por I (P) = I0 = (𝜖 0 c/2) (E0† /d) 2 . Desde el punto de vista de la óptica geométrica, el resultado no depende del radio de la abertura, ya que la energía que llega a P se propaga a lo largo del rayo que une S con P. Por lo que la irradiancia en P corresponde con lo esperado. Entonces, ¿cuál es la ganancia del tratamiento ondulatorio de Fresnel? Abertura circular S P S S P S (a) (b) Figura 4.5. El campo en P debido a la libre propagación del frente de onda esférico (a) es igual al campo limitado por una abertura circular que deja pasar solo el campo correspondiente con la mitad de la primera zona de Fresnel (b). En el tratamiento de Fresnel, el campo en P, sí depende del tamaño de la abertura. Consideremos los siguientes casos: - Abertura para N = 1. Si el radio de la abertura es tal que deja pasar el campo limitado por la primera zona de Fresnel, de la eq. (4.6), tenemos que E † e ikd E(P) = i2𝜆 0 K1 . d Luego, la irradiancia en P será I (P) = 4I0 . Este resultado ya no es predecible por la óptica geométrica. El aumento de la irradiancia al aumentar el radio de la abertura parece Difracción · 273 razonable. Sin embargo, el tratamiento de Fresnel también nos dice que no siempre es así, pues un aumento adicional del radio de la abertura disminuye la irradiancia, incluso a cero. - Abertura para N = 2. Si el radio de la abertura aumenta de tal modo que la abertura coincide con el borde externo de la segunda zona de Fresnel, de la eq. (4.6), tenemos que E(P) = i2𝜆 E0† e ikd d [K1 − K2 ] . Teniendo en cuenta la hipótesis de Fresnel, que el factor de inclinación cambia muy poco entre zonas consecutivas, entonces K1 ≈ K2 . Luego la irradiancia en P será I (P) ≈ 0. Este resultado sorprende aún más, pero se explica al considerar la interferencia. Grosso modo, podemos decir que el campo en la segunda zona está desfasado en 𝜋 con respecto al campo de la primera zona. Esto gracias a la manera como se han construido las zonas de Fresnel: con esferas cuyos radios aumentan en 𝜆 /2. Con base en los resultados anteriores, podemos anticipar que cuando la abertura deja pasar M zonas de Fresnel, donde M es impar, las zonas consecutivas agrupadas por parejas se cancelan y la irradiancia en P estará dada solo por la zona restante (I ∼ 4I0 ). Y cuando la abertura deja pasar M zonas de Fresnel, donde M es par, las zonas consecutivas agrupadas por parejas se cancelan y la irradiancia en P será nula (I ∼ 0). - Disco opaco para N = 1. Otra situación que llama la atención se da si en lugar de una abertura en una pantalla opaca, como la mostrada en la fig. 4.5(b), se coloca un disco opaco cuyo radio sea igual al borde de la primera zona, como en la fig. 4.6. Entonces, se bloquea el paso del campo limitado por la primera zona de Fresnel y se deja pasar el campo desde la segunda zona de Fresnel (hasta la última zona donde 𝜒 = 𝜋/2). Ahora el campo en P será E(P) = 1 1 E1 (P) − E1 (P) = − E1 (P). 2 2 Y se tiene que la irradiancia en P será 274 · Difracción I (P) = I0 . En otras palabras, en P tendremos un punto brillante aun cuando se bloquee el rayo que va de S a P. Este punto se denomina punto de Poisson.2 Disco circular P S S Figura 4.6. Punto de Poisson. A pesar del disco circular que obstaculiza la propagación de la luz dentro de la primera zona de Fresnel, detrás del obstáculo se tiene un punto luminoso en P. - Placa zonal de Fresnel. Por último, consideremos la situación en la que se bloquea solo las zonas pares o impares. Ya que dos zonas consecutivas tienen un desfase de 𝜋 y cada dos zonas estarán en fase (desfase de 2𝜋), entonces, un obstáculo con aberturas equivalentes a las zonas anulares pares o impares eleva considerablemente el valor de la irradiancia en el punto P. En la fig. 4.7, se ilustra esta situación: (a) placa zonal bloqueando zonas pares, (b) placa zonal bloqueando zonas impares. En ambos casos, si se deja pasar M zonas, el campo en P se aproxima por E(P) ≈ M E1 (P), luego la irradiancia será I (P) = 4M 2 I0 . 2 El tratamiento de Fresnel predice que detrás de un obstáculo se puede tener luz. Este hecho, anotado por Poisson como algo equivocado, en efecto ocurre. Difracción S · 275 P S (a) S P S ( b) Figura 4.7. Placas zonales de Fresnel para bloquear (a) zonas pares y (b) zonas impares. P S S Figura 4.8. La plaza zonal de fase aprovecha todo el campo óptico de Σ y hace interferir constructivamente los campos contenidos en las zonas pares e impares de Fresnel. Una mejora adicional a la placa zonal se logra si en lugar de bloquear zonas pares o impares se introduce un desfase de 𝜋 en las zonas pares o las zonas impares. Lo anterior se puede hacer depositando sobre un sustrato de vidrio una película delgada de material transparente cuyo espesor óptico sea igual 𝜆 /2. La película delgada se deposita solo en las regiones anulares que corresponden con las zonas pares o impares de Fresnel. Para esto se emplea una máscara que obstruya el depósito del material (como en un proceso litográfico). 276 · Difracción En la fig. 4.8, se muestra una placa zonal de fase de Fresnel para las zonas pares. De este modo se aumenta aún más la irradiancia en P. El aumento de la irradiancia en P ocurre a expensas de la disminución de la irradiancia en los puntos vecinos a P, garantizando la conservación de la energía. Difracción · 277 4.2. Integral de difracción La difracción implica encontrar el campo óptico en cualquier punto del espacio generado por una fuente con unas condiciones de frontera. La geometría usual en la difracción se ilustra en la fig. 4.9. En la región I, se localiza la fuente S (puntual o extendida); en la región II, se tiene el volumen limitado por la superficie cerrada Σ = Σ1 +Σ2 , en la que interesa medir el campo óptico. La región II se denomina región de difracción. La superficie Σ1 que separa las regiones I y II es una superficie opaca con aberturas que permiten el paso de parte del campo óptico emitido por la fuente S. S1 S I II S2 Figura 4.9. Geometría general en el problema de difracción. Una primera aproximación al problema de encontrar el campo óptico en la región de difracción consiste en resolver la ecuación de onda homogénea para el campo óptico escalar (sin tener en cuenta la polarización). Partiendo de una onda monocromática E 0 (x, y, z, t) = E(x, y, z)e −i𝜔t , (4.14) de la ecuación de onda en el vacío (eq. (2.5,)) se tiene que (∇2 + k 2 )E = 0, (4.15) con k = 𝜔/c = 2𝜋/𝜆 . Para determinar E en cualquier punto de la región de difracción, se puede hacer uso del teorema de Green, el cual a su vez se deduce del teorema de Gauss. El teorema de Gauss establece que si F es una función vectorial de la posición, entonces ∬ ∭ F · n̂d𝜎 = ∇ · Fdv, (4.16) Σ V donde n̂ es el vector unitario normal a la superficie cerrada Σ (hacia afuera), V es el volumen encerrado por la superficie y d𝜎 y dv denotan los elementos 278 · Difracción diferenciales de área y volumen, respectivamente. Si la función F se puede obtener como F = E∇U , (4.17) donde E y U son funciones escalares definidas en Σ y V , entonces ∬ ∭ (E∇U · n̂) d𝜎 = E∇2U − ∇E · ∇U dv. Σ Si se intercambian E y U , se llega a una relación similar ∬ ∭ (U ∇E · n̂) d𝜎 = U ∇2 E − ∇U · ∇E dv. Σ (4.19) V Al restar las eqs. (4.18) y (4.19), se llega a ∬ ∭ (E∇U · n̂−U ∇E · n̂) d𝜎 = E∇2U − U ∇2 E dv, Σ (4.18) V (4.20) V y teniendo en cuenta las derivadas direccionales 𝜕E/𝜕n = ∇E · n̂ y 𝜕U /𝜕n = ∇U · n̂, se obtiene el teorema de Green ∭ ∬ 𝜕E 𝜕U −U d𝜎 = (4.21) E∇2U − U ∇2 E dv. E 𝜕n 𝜕n V Σ Si la función U satisface la ecuación de onda independiente del tiempo, eq. (4.15), ∇2 + k 2 U = 0, entonces el lado derecho de la eq. (4.21) se anula, por lo tanto, ∬ 𝜕U 𝜕E E −U d𝜎 = 0. (4.22) 𝜕n 𝜕n Σ Con esta integral, dado el campo E (y su derivada 𝜕E/𝜕n) en la superficie Σ, se puede calcular el campo E en un punto P(x 0 , y 0 , z 0) dentro de la superficie Σ con ayuda de la función U (y su derivada 𝜕U /𝜕n). 4.2.1. Teorema integral de Kirchhoff Kirchhoff usa el teorema de Green con la función U (x, y, z) = e iks s (4.23) donde s es la distancia entre el punto P(x 0 , y 0 , z 0) y el punto (x, y, z) en la superficie. Esta función genera una singularidad en la región de difracción que debe ser removida (ya que U debe estar definida en cualquier punto de V ). La singularidad se puede eliminar construyendo una esfera Σ𝜀 de radio 𝜀 → 0 centrada en el punto P, como se ilustra en la fig. 4.10. Difracción · 279 S1 S Se P S2 Figura 4.10. Geometría para calcular la difracción en el punto P con la función de Green U (x, y, z) = e−iks /s. Con 𝜀 → 0, se mantiene el volumen V que encierra Σ, pero ahora la superficie de integración será Σ + Σ𝜀 . Así, la integral de difracción sobre Σ queda ∬ ∬ 𝜕E 𝜕E 𝜕U 𝜕U −U d𝜎 = − −U d𝜎. (4.24) E E 𝜕n 𝜕n 𝜕n 𝜕n Σ Σ𝜀 La derivada direccional 𝜕U /𝜕n es igual a ∇U · n̂ = = ikeiks s∇s − e iks ∇s · n̂ s2 e iks 1 ik − (ŝ · n̂), s s (4.25) con ∇s = ŝ el vector unitario en la dirección radial desde el punto P. Para el caso de la esfera Σ𝜀 , el vector unitario normal apunta hacia el punto P, de modo que (ŝ · n̂) = −1. En la integral de la derecha de la eq. (4.24), ik𝜀 𝜕U 1 e = − ik , (4.26) 𝜕n s=𝜀 𝜀 𝜀 por lo que la integral queda ik𝜀 ik𝜀 ∬ 1 e e 𝜕E 2 E − ik − 𝜀 sin 𝜃d𝜃d𝜙, 𝜀 𝜀 𝜀 𝜕n Σ𝜀 (4.27) donde la diferencial de área se ha escrito en coordenadas esféricas (para la esfera Σ𝜀 ), con 𝜃 el ángulo polar y 𝜙 el ángulo acimutal. En el límite 𝜀 → 0 esta última integral se reduce a ∬ E sin 𝜃d𝜃d𝜙 = 4𝜋E(x 0 , y 0 , z 0). (4.28) Σ𝜀 280 · Difracción En consecuencia, el campo en el punto P se puede calcular como E(x 0 , y 0 , z 0) = − 1 4𝜋 ∬ Σ e iks 1 𝜕E E ik − (ŝ · n̂)− d𝜎 , s s 𝜕n (4.29) donde ahora el vector unitario n̂ corresponde con la superficie Σ. Esta integral se denomina teorema integral de Kirchhoff . 4.2.2. Difracción de Fresnel-Kirchhoff Supongamos que tenemos una pantalla plana opaca con una abertura y se desea determinar el campo óptico difractado cuando la fuente de iluminación S es puntual, como en la fig. 4.11(a). Para resolver la integral eq. (4.29) para el punto P, lo primero que se debe hacer es seleccionar la superficie de integración Σ. En la fig. 4.11(b), se muestra la superficie que usualmente se propone en este problema. La superficie cerrada consta de tres superficies abiertas: la superficie plana A que llena la abertura, la superficie plana Σ1 detrás de la pantalla opaca y la superficie Σ2 que es un casquete esférico de radio R centrado en el punto P. S1 S S A P R P S1 Pantalla opaca con una abertura (a) S2 (b) Figura 4.11. (a) Geometría de la difracción de una onda esférica en una abertura. (b) Selección de la superficie de integración para resolver la integral de Kirchhoff. Entonces, debemos resolver la integral de Kirchhoff para las tres superficies, que sumadas completan la superficie cerrada Σ = A + Σ1 + Σ2 . Ya que la superficie se escoge de manera arbitraria (pero en forma conveniente), si R → ∞, la superficie Σ1 tendrá una extensión infinita. En este caso, el problema de difracción para una abertura supone que la pantalla opaca tiene una extensión infinita. Así, la contribución del campo emitido por la fuente puntual, E = E0† e ikr /r, donde r es la distancia entre la fuente S y un punto (x, y, z) cualquiera, en cada superficie será: Difracción · 281 - en A, si suponemos que el campo en la abertura es igual al campo en ausencia de la pantalla opaca con la abertura, entonces EA = E0† e ikr /r , (4.30) donde r es la distancia entre S y un punto en la abertura; - en Σ1 , si suponemos que la pantalla opaca no transmite luz, entonces EΣ1 = 0; (4.31) - en Σ2 , con R → ∞, EΣ2 (y también U ) decrece como 1/R, por lo que el campo E es prácticamente nulo. Sin embargo, el área de integración crece como R 2 (en Σ2 , d𝜎 = R 2 sin 𝜃d𝜃d𝜙), de modo que no resulta evidente que en Σ2 la integral de difracción se anule. Las dos primeras suposiciones también presentan algunos inconvenientes, por ejemplo: en la primera, la presencia de la pantalla sí cambia el campo en el borde de la apertura; en la segunda, se tiene que en la vecindad de la abertura el campo se extiende detrás de la pantalla opaca [23]. Sin embargo, para los problemas prácticos en los que el tamaño de la abertura es mucho mayor que la longitud de onda, estas dos suposiciones dan muy buenos resultados. Para la superficie Σ2 , si R 𝜆 , la integral de la eq. (4.29), con s = R, se aproxima por ∬ 𝜕E 1 U R ikE− R sin 𝜃d𝜃d𝜙, (4.32) − 4𝜋 Σ2 𝜕n teniendo en cuenta que ahora (ŝ · n̂) = 1. Ya que U R tiene un valor finito con R → ∞, entonces la integral en Σ2 , eq. (4.32), se anula si 𝜕E lı́m R ikE− = 0. (4.33) R→∞ 𝜕n Esta condición se llama condición de radiación de Sommerfeld, y se satisface si E → 0 tan rápido como 1/R. Lo anterior ocurre para una fuente puntual esférica, así que la contribución de la integral en la superficie Σ2 , en efecto, es nula. Por lo tanto, la difracción generada por una abertura cuando es iluminada por una fuente puntual estará dada por ∬ ikr e iks 1 1 1 †e 0 0 0 E ik − (ŝ · n̂)− ik − (r̂ · n̂) d𝜎 , E(x , y , z ) = − 4𝜋 A 0 r s s r (4.34) 282 · Difracción donde r̂ es el vector unitario desde la fuente S a un punto Q (de coordenadas (x, y, z)) en la abertura A, ŝ el vector unitario desde el punto de observación P (de coordenadas (x 0 , y 0 , z 0)) hasta el punto Q y n̂ el vector unitario normal a la superficie A en el punto Q, como se ilustra en la fig. 4.12(a). s n b a r Q Q S c S P P A A (a) (b) Figura 4.12. Vectores unitarios en el punto Q de la abertura difractante. Si las distancias r = SQ y s = QP son mucho mayores que la longitud de onda, las aproximaciones (ik − 1/s) ≈ ik y (ik − 1/r) ≈ ik se pueden emplear en la eq. (4.34), por lo tanto, ∬ ikr e iks (ŝ · n̂)−(r̂ · n̂) i †e 0 0 0 E(x , y , z ) = − d𝜎. (4.35) E 𝜆 A 0 r s 2 Esta integral se denomina integral de difracción de Fresnel-Kirchhoff . En efecto, el término −i [(ŝ · n̂)−(r̂ · n̂)] /2𝜆 define formalmente el factor de inclinación K ( 𝜒 ) de la eq. (4.2) en el tratamiento de Fresnel. Definiendo los ángulos entre los vectores unitarios como se muestra en la fig. 4.12(b), el factor de inclinación se puede escribir como i [cos 𝛼 − cos 𝛽 ] 𝜆 2 i [cos 𝛽 + cos( 𝜒 + 𝛽 )] . 𝜆 2 K( 𝜒) = − = (4.36) Con esta definición, tendremos una ecuación análoga a la eq. (4.2), así, ∬ E(P) = A E0† e ikr e iks K ( 𝜒 )d𝜎. r s (4.37) El factor de inclinación definido en la eq. (4.36) no depende solo del ángulo 𝜒 , como lo sugiere la formulación de Fresnel. Esto ocurre debido a que la superficie de integración en la eq. (4.37) es plana, mientras que la superficie de integración en la eq. (4.2) es el frente de onda esférico de radio r0 , en la que la amplitud de las fuentes secundarias es constante e igual a E0† e ikr0 /r0 . Difracción · 283 En cambio, en la eq. (4.37), no solo la amplitud de las fuentes secundarias en la abertura A es variable, sino que las fuentes secundarias E(Q) = E0† e ikr /r no están siempre en el mismo frente de onda. En este sentido, la eq. (4.37) es una versión generalizada del principio de Huygens-Fresnel. Cuando la fuente está en el infinito, las eqs. (4.2) y (4.37) coinciden, ya que el ángulo 𝛽 = 𝜋 (y 𝛼 = 𝜒 ). En este caso, el factor de inclinación resulta ser i 1 + cos 𝜒 K( 𝜒) = − . (4.38) 𝜆 2 La situación se ilustra en la fig. 4.13. l s n Q c r P A Figura 4.13. Vectores unitarios cuando el frente de onda incidente en la abertura es plano. Una simplificación adicional ocurre en la aproximación paraxial donde 𝜒 ≈ 0. Esta última situación es muy común en la práctica y será analizada en la siguiente unidad. 4.2.3. Difracción de Sommerfeld Para obtener la integral de Fresnel-Kirchhoff, se empleó como función de Green la onda esférica de amplitud unitaria e iks /s. La selección de la función es arbitraria pero debe facilitar el cálculo de la difracción. Esta función presenta algunos inconvenientes con el campo E dentro de la abertura, en los bordes de la abertura y justo detrás de la abertura cerca de los bordes. Sommerfeld propone otra función de Green, de modo que los problemas de la frontera de la apertura sean resueltos, aunque se sigue manteniendo la suposición de que el campo óptico dentro de la abertura es igual al campo óptico en la misma región cuando no se tiene la pantalla opaca que define la abertura. La nueva función U se construye con dos ondas esféricas unitarias, una con origen en el punto de observación P (como en la eq. (4.23)) y la otra 284 · Difracción con origen en el punto P0, el cual es la imagen especular de P con respecto al plano de la abertura A, como se ilustra en la fig. 4.14. Q n s' s P' P A Figura 4.14. P y P0: origen de las dos ondas esféricas unitarias auxiliares para el cálculo de la difracción. Con esta configuración, la función de Green queda 0 e iks eiks (4.39) − 0 . s s Usando esta función en el problema de la difracción descrito en la fig. 4.11(b) cuando R → ∞, para cualquier punto en Σ1 y en A, se tiene que s 0 = s y, por lo tanto, U = 0 y 𝜕U /𝜕n = 0. Así, no se requiere hacer ninguna suposición sobre las condiciones de frontera del campo E en Σ1 y en el borde de la abertura, eliminando las inconsistencias que allí se presentan con la función de Green escogida por Kirchhoff. Con la eq. (4.39), se llega a [24] ∬ i e ikr e iks 0 0 0 E(x , y , z ) = − E0† (ŝ · n̂)d𝜎. (4.40) 𝜆 A r s U= Esta integral se denomina primera solución de Rayleigh-Sommerfeld. 0 También se puede elegir la función U = e iks /s + e iks /s 0, lo que da origen a la segunda solución de Rayleigh-Sommerfeld [24] ∬ e ikr e iks 0 i 0 0 0 E0† (ŝ · n̂)d𝜎. (4.41) E(x , y , z ) = 𝜆 A r s El factor de inclinación será diferente en cada caso: - K ( 𝜒 ) = −i [(ŝ · n̂)−(r̂ · n̂)] /2𝜆 , en Fresnel-Kirchhoff, - K ( 𝜒 ) = −i (ŝ· n̂)/𝜆 , en la primera solución de Rayleigh-Sommerfeld, - K ( 𝜒 ) = i (ŝ0 · n̂)/𝜆 , en la segunda solución de Rayleigh-Sommerfeld. En la situación en que la abertura es iluminada por una onda plana (fuente S en el infinito) y en la aproximación paraxial, los factores de inclinación coinciden en K ( 𝜒 ) = −i/𝜆 . Difracción · 285 4.3. Difracción de Fresnel y Fraunhofer En esta unidad, vamos a considerar el problema de la difracción para aberturas en una pantalla opaca plana, como se ilustra en la fig. 4.15. y r Q x R d A s y' r' P x' z Figura 4.15. Geometría para el cálculo de la difracción por aberturas planas. De acuerdo con la eq. (4.37), la integral de difracción de Huygens-Fresnel se puede escribir en general como ∫ ∫ eiks E(P) = E(Q)K ( 𝜒 ) d𝜎. (4.42) s A E(Q) es la amplitud compleja del campo en la abertura. La abertura se encuentra en el plano xy y la pantalla de observación del patrón de difracción (distribución espacial de la irradiancia) en el plano x 0 y 0. Estos planos están separados la distancia d = |d|. En particular, nos limitaremos a la aproximación paraxial, la cual queda definida bajo las condiciones: 1. la separación d entre el plano de la abertura y el plano del patrón de difracción satisface d 𝜆 , 2. las dimensiones de la abertura son mucho menores que la distancia d, 3. las dimensiones de la región de observación del patrón de difracción son mucho menores que la distancia d, 4. el factor de inclinación para cualquier punto en la abertura se aproxima por el factor de inclinación de la primer zona de Fresnel, es decir, K ( 𝜒 ) ≈ −i/𝜆 .3 3 Este valor del factor de inclinación se obtiene de K ( 𝜒 ) = −i (1 + cos 𝜒 )/2𝜆 cuando en la eq. (4.36) el ángulo 𝛽 = 𝜋, es decir, cuando se ilumina con una onda plana. En la práctica, el frente de onda en la abertura puede tener pequeñas desviaciones, de modo que 𝛽 ≈ 𝜋. En este caso, aún se podrá suponer que K ( 𝜒 ) = −i/𝜆 . 286 · Difracción Los vectores indicados en la fig. 4.15 son: - d, vector de separación entre los planos de la abertura y la pantalla de observación. - r = {x, y}, vector de posición del punto Q en la abertura. - r0 = {x 0 , y 0 }, vector de posición del punto P en la pantalla de observación. - R = d + r0, vector de posición relativa del punto P con respecto al origen de coordenadas de la abertura. - s, vector de posición relativa del punto P con respecto al punto Q. |r0 | Teniendo en cuenta la condición paraxial, se cumple que |r| |R|, |R| y |R| ≈ |d|. Del teorema del coseno, tenemos s2 = R 2 + r 2 − 2R · r, o bien r s =R 1+ r 2 R − 2R · r . R2 Ya que R · r = (d + r0) · r = r0 · r, entonces r r 2 2r0 · r − s =R 1+ . R R2 (4.43) (4.44) (4.45) La aproximación paraxial implica que la raíz cuadrada se puede aproximar a segundo orden, de modo que 1 r 2 − 2r0 · r . (4.46) s =R 1+ 2 R2 Completando el binomio cuadrado para el término que está entre paréntesis en la eq. (4.46), r 02 1 r 02 − 2r0 · r + r 2 s =R 1− + . 2R 2 2 R2 (4.47) Con r 0 R, se tiene que 1 − r 02 /2R 2 ≈ 1, y reemplazando R por d, la eq. (4.47) se simplifica a |r0 − r| 2 s=d+ . (4.48) 2d Difracción · 287 Entonces, la forma paraxial de la eq. (4.42) se obtiene reemplazando s con la expresión dada por la eq. (4.48). La distancia s está en la función exponencial y en el denominador de la eq. (4.42). La cantidad |r0 − r| 2 /2d describe pequeñas variaciones con respecto a la distancia d. En la función exponencial, estas pequeñas variaciones son comparables con la longitud de onda, de modo que el cociente entre estas dos cantidades da cambios de fase importantes en el proceso de interferencia. Por otro lado, en el denominador, estas pequeñas variaciones solo se comparan con la distancia d, por lo que no se tiene un cambio apreciable en el denominador, y allí podemos cambiar s por d. Finalmente, la versión paraxial de la eq. (4.42) queda ∫ ∫ 2 0 e ikd 0 E(r ) = −i E(r)e ik |r −r| /2d d 2 r. (4.49) 𝜆d A (y '- y) 2 /2d P s Q V d y O y' O' d z Frente de onda A parabólico Figura 4.16. Aproximación de la distancia s como d + (y 0 − y) 2 /2d. A partir de esta integral, podemos ver cómo son las ondas secundarias del principio de Huygens-Fresnel en la aproximación paraxial. Consideremos la fig. 4.16, en la que tomamos r = y ĵ y r0 = y 0ĵ. En Q(y), tenemos una fuente de amplitud E(y) que emite una onda parabólica. El campo en P(y 0), debido a Q, es igual al campo atenuado E(y)/d y el cambio de fase de la onda en P está dado por ik [d + (y 0 − y) 2 /2d]. Note que el término (y 0 − y) 2 /2d es la sagita a la distancia y 0 − y del vértice V del frente de onda parabólico centrado en Q. Entonces, en la aproximación paraxial las ondas secundarias del principio de Huygens-Fresnel son paraboloides centrados en las fuentes localizadas en el frente de onda primario Σ. Al escribir los vectores de la eq. (4.49) en componentes cartesianas se tiene la expresión ∫ ∫ 02 02 2 2 0 0 e ikd e ik (x +y )/2d E(x 0 , y 0) = −i E(x, y)e ik (x +y )/2d e −ik (x x+y y)/d dxdy. 𝜆d A (4.50) 288 · Difracción Esta versión de la integral de difracción permite observar la influencia de las zonas de Fresnel en el campo que llena la abertura A. Fijando la atención en el plano de la abertura, se tiene que dentro de la integral el campo E(x, y) 2 2 está modulado por el término e ik (x +y )/2d . Ahora, el término (x 2 + y 2 )/2d será la sagita a la distancia (x 2 + y 2 ) 1/2 desde el origen de coordenadas O de un paraboloide centrado en O0 (fig. 4.16). Si la distancia (x 2 + y 2 )/2d se divide entre 𝜆 /2, estaremos contando el número de zonas de Fresnel contenidas en una abertura circular de radio (x 2 + y 2 ) 1/2 . Por lo tanto, e ik (x 2 +y 2 )/2d = e i 𝜋N , (4.51) donde N = (x 2 + y 2 )/𝜆 d es el número de zonas de Fresnel. 4.3.1. Difracción de Fraunhofer Sea 𝜌 máx el radio del círculo que circunscribe la abertura difractante y Nmáx = 𝜌2máx /𝜆 d el número de zonas de Fresnel que subtiende el círculo con respecto al plano de observación del patrón de difracción. Si Nmáx 1 (Nmáx ≈ 0), 2 2 entonces el término e ik (x +y )/2d dentro de la integral se puede despreciar y el patrón de difracción estará dado por I (x 0 , y 0) = (𝜖 0 c/2) 𝜆 2d2 ∫ ∫ 0 2 0 E(x, y)e −i2𝜋 (x x+y y)/𝜆 d dxdy . (4.52) A A esta integral, se le denomina difracción de Fraunhofer. 4.3.2. Difracción de Fresnel Sea 𝜌 máx el radio del círculo que circunscribe la abertura difractante y Nmáx = 𝜌2máx /𝜆 d el número de zonas de Fresnel que subtiende el círculo con respecto al plano de observación del patrón de difracción. Si Nmáx es del orden 2 2 de una zona de Fresnel, entonces el término e ik (x +y )/2d no se puede despreciar dentro de la integral y, en este caso, el patrón de difracción estará dado por (𝜖 0 c/2) I (x , y ) = 𝜆 2d2 0 0 ∫ ∫ h E(x, y)e ik (x 2 +y 2 )/2d i e −i2𝜋 (x0 x+y0 y)/𝜆 d 2 dxdy . A (4.53) A esta integral se le denomina difracción de Fresnel. Difracción · 289 Las integrales de difracción dadas por las eqs. (4.52) y (4.53) tienen la forma de una transformada bidimensional de Fourier cuyas frecuencias espaciales son x 0/𝜆 d y y 0/𝜆 d. Por lo tanto, resulta simple calcular numéricamente estas integrales. 4.3.3. Algunos ejemplos La abertura circular Una abertura muy común en difracción es la abertura circular. Esta tiene aplicaciones prácticas muy importantes, ya que los diafragmas de apertura o los bordes de las lentes de un sistema óptico suelen ser circulares. Supongamos que tenemos una abertura circular de radio w iluminada por un frente de onda plano homogéneo (de amplitud E0 y longitud de onda 𝜆 ) ortogonal al plano de la abertura. El campo en la abertura se puede describir como ! p x2 + y2 E(x, y) = E0 circ , (4.54) w donde circ( ) se denomina función círculo y se define como 1 para (x 2 + y 2 ) 1/2 ≤ w y 0 para otros valores de (x, y). En este caso, la abertura coincide con el círculo que circunscribe a la abertura difractante. Entonces, el número de zonas de Fresnel está dado por N = w 2 /𝜆 d. En la fig. 4.17, se muestra los patrones de difracción4 de Fresnel, para una abertura circular de radio w = 0.5 mm, obtenidos cuando la distancia de la pantalla de observación corresponde con: (a) la primera zona de Fresnel (d = 395.1 mm), (b) las dos primeras zonas de Fresnel (d = 197.5 mm), (c) las tres primeras zonas de Fresnel (d = 131.7 mm) y (d) las cuatro primeras zonas de Fresnel (d = 98.7 mm), para 𝜆 = 632.8 nm. Por supuesto, la distancia a la que se debe tener la pantalla de observación en cada caso se calcula de d = w 2 /N𝜆 . En el caso de la difracción de Fraunhofer el cálculo es aún más simple ya 2 2 que no incluye el término eik (x +y )/2d dentro de la integral. Lo anterior implica que d → ∞. En la práctica, la pantalla de observación se debe colocar a una distancia finita tal que d w. Por ejemplo, en la fig. 4.18(a) se muestra el patrón de Fraunhofer cuando d = 3951 mm. Este valor particular de la distancia d corresponde a la distancia para la cual la abertura circular 4 Con el fin de hacer visible los anillos o regiones de menor intensidad, en lugar de dibujar la irradiancia se dibuja la raíz cuadrada de la irradiancia. Esto lo haremos en los patrones simulados de esta unidad, así como en las unidades 4.4 y 4.5. Pero en la sección acerca de la resolución en la unidad 4.5 sí se dibujará la irradiancia, ya que ilustra mejor el asunto de la resolución de la imagen de dos puntos y corresponde con lo que en la práctica se observa. 290 · Difracción subtiende 0.1 zonas de Fresnel. El perfil de este patrón, fig. 4.18(b), corresponde con el cuadrado de una función de Bessel divida entre argumento, como veremos en seguida. (a) d =395.1 mm (b) d =197.5 mm (c) d =131.7 mm (d) d =98.7 mm Figura 4.17. Patrones de difracción de Fresnel de una abertura circular de radio 0.5 mm para una longitud de onda 632.8 nm. El tamaño del cuadro de la imagen en todos los casos es de 3 mm de lado. Irradiancia, I (I0) 1.0 0.8 0.6 0.4 0.2 0 -10 -8 (a) -6 -4 -2 0 rA x' (mm) 2 4 6 8 10 (b) Figura 4.18. (a) Patrón de difracción de Fraunhofer en la pantalla de observación a la distancia 3951 mm de la abertura circular de radio 0.5 mm. El tamaño del cuadro de la imagen es de 20 mm de lado. (b) Perfil del patrón de difracción. La integral de Fraunhofer para la abertura circular tiene una solución analítica bien conocida. Ya que la abertura es circular, conviene resolver la integral en coordenadas cilíndricas. Sea r = (x 2 + y 2 ) 1/2 y tan 𝜙 = y/x, y r 0 = (x 02 + y 02 ) 1/2 y tan 𝜑. Entonces, x = r cos 𝜙, y = r sin 𝜙, x 0 = r 0 cos 𝜑 y y 0 = r 0 sin 𝜑. Cambiando las variables en la integral de difracción, se tiene I (r 0) = E02 (𝜖 0 c/2) 2 ∫w ∫2𝜋 e 𝜆 2d2 0 0 −i2𝜋r 0 r [cos(𝜙−𝜑) ]/𝜆 d rdrd𝜙 . (4.55) Difracción · 291 Ya que el problema tiene simetría para 𝜑, se puede resolver para cualquier 𝜑. En particular, para 𝜑 = 0 la integral queda ∫w ∫2𝜋 0 0 e −i2𝜋r r cos 𝜙/𝜆 d rdrd𝜙, (4.56) 0 lo que es igual a ∫w 2𝜋 J0 (2𝜋r 0r/𝜆 d)rdr. (4.57) 0 ∫u Teniendo en cuenta la relación de recurrencia 0 J0 (u 0)u 0du 0 = u J1 (u), se llega a 2 J1 (2𝜋wr 0/𝜆 d) 2 I (r 0) = I0 , (4.58) 2𝜋wr 0/𝜆 d con I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 d) 2 . El primer anillo oscuro del patrón de la fig. 4.18 se obtiene para el primer cero de la función de Bessel, es decir, cuando 2𝜋wr 0/𝜆 d = 3.8317. Ya que la energía contenida en la región encerrada por el primer anillo oscuro es alrededor del 84 %, el primer anillo juega un papel muy importante en la formación de imagen de una fuente puntual. A la distribución de irradiancia contendida dentro del primer anillo se le denomina disco de Airy. El radio del disco de Airy está dado por rA0 = 1.22 𝜆d . (2w) (4.59) En el ejemplo de la fig. 4.18(b), el radio de Airy es 3.0541 mm. El segundo anillo oscuro del patrón se obtiene para el segundo cero de la función de Bessel, es decir, 2𝜋wr 0/𝜆 d = 7.0156, lo que da r 0 = 2.23𝜆 d/(2w). En el ejemplo de la fig. 4.18(b), este radio es 5.5825 mm. La energía en la región encerrada por el segundo anillo oscuro es del 91 %. A la función 2 J1 (u)/u, se le denomina función J inc(u). La abertura rectangular Otra abertura, también muy empleada en problemas prácticos de difracción es la abertura rectangular. Supongamos que tenemos una abertura rectangular de lados 2wx y 2wy iluminada por un frente de onda plano homogéneo (de amplitud E0 y longitud de onda 𝜆 ) ortogonal al plano de la abertura. El campo en la abertura se puede describir como x y E(x, y) = E0 rect rect , (4.60) 2wx 2wy 292 · Difracción donde rect(x/2wx ) se denomina función rectángulo y se define como 1 para |x| ≤ wx y 0 para otros valores de x. En forma análoga se define la función rect(y/2wy ) para la coordenada y. (a) d =6321 mm (b) d =3161 mm (c) d =2107 mm (d) d =1580 mm Figura 4.19. Patrones de difracción de Fresnel de una abertura rectangular de lados 1 mm y 4 mm para una longitud de onda 632.8 nm. El tamaño de la imagen en todos los casos es 24 mm de lado. En la fig. 4.19, se muestra los patrones de difracción de Fresnel para una abertura rectangular de lados 2wx = 1 mm y 2wy = 4 mm obtenidos cuando la distancia de la pantalla de observación corresponde con: (a) la primera zona de Fresnel (d = 6321 mm), (b) las dos primeras zonas de Fresnel (d = 3161 mm), (c) las tres primeras zonas de Fresnel (d = 2107 mm) y (d) las cuatro primeras zonas de Fresnel (d = 1580 mm), para 𝜆 = 632.8 nm. Ya que wy > wx , el círculo que circunscribe la abertura rectangular tendrá un radio aproximado a wy , por lo tanto, el número de zonas de Fresnel en este caso se calcula como N = wy2 /𝜆 d y, en consecuencia, la distancia a la que se coloca la pantalla de observación será d = wy2 /N𝜆 . Irradiancia, I (I0) 1.0 0.8 0.6 0.4 0 -125 (a) ld/ (2wx) 0.2 -100 -75 -50 -25 0 x' (mm) 25 50 75 100 125 (b) Figura 4.20. (a) Patrón de difracción de Fraunhofer en la pantalla de observación a la distancia 63211 mm de la abertura rectangular de lados 1 mm y 4 mm. El tamaño de la imagen es de 250 mm de lado. (b) Perfil del patrón de difracción. · Difracción 293 La difracción de Fraunhofer cuando d = 63211 mm se muestra en la fig. 4.20(a). En este ejemplo, este valor de d también corresponde con la distancia para la cual el círculo que circunscribe a la abertura rectangular subtiende 0.1 zonas de Fresnel. La integral de Fraunhofer para la abertura rectangular también tiene una solución analítica bien conocida. En este caso, I (x 0 , y 0) = = E02 (𝜖 0 c/2) 𝜆 2d2 E02 (𝜖 0 c/2) 𝜆 2d2 ∫wx ∫wy 2 0 0 e −i2𝜋 (x x+y y)/𝜆 d dxdy −wx −wyx ∫wx 2 0 e −i2𝜋 (x x)/𝜆 d dx −wx ∫wy 2 0 e −i2𝜋 (y y)/𝜆 d dy , −wy (4.61) es decir, 0 0 I (x , y ) = I0 sin(2𝜋wx x 0/𝜆 d) (2𝜋wx x 0/𝜆 d) 2 sin(2𝜋wy y 0/𝜆 d) (2𝜋wy y 0/𝜆 d) 2 , (4.62) con I0 = (𝜖 0 c/2) (4wx wy E0 /𝜆 d) 2 . A la función sin(u)/u ya la encontramos en la sección 3.1.3, esto es, la función sinc(u). El perfil de este patrón en la dirección horizontal (x 0) se muestra en la fig. 4.20(b). Los ceros de la función sinc(2𝜋wx x 0/𝜆 d) se obtienen en xm0 = m 𝜆d , (2wx ) (4.63) con m = ±1, ±2, ±3, ..... En la dirección vertical (y 0) se tiene un comportamiento similar, con los ceros en ym0 = ±m𝜆 d/(2wy ). La mayor parte de la energía se encuentra en la región limitada por los primeros ceros 0 = ±𝜆 d/(2w ) y y 0 = ±𝜆 d/(2w ). Entonces, conviene definir el ancho x±1 x y ±1 de la función sinc( ) como Δx 0 = 2x10 en la dirección x 0 y Δy 0 = 2y10 en la dirección y 0. Note que el patrón de difracción tiene una mayor extensión en la dirección en la cual la abertura rectangular tiene una menor longitud, fig. 4.20(a). Sobre esto volveremos en la unidad que trata las rejillas de difracción. Las rejillas unidimensionales son tales que cada elemento difractante satisface que wx wy , lo que hace parecer al patrón de difracción como una distribución de irradiancia unidimensional. 294 · Difracción Por otra parte, cuando wx = wy = w tendremos una abertura cuadrada de lado 2w. El patrón de difracción de Fraunhofer es simétrico, como se muestra en la fig. 4.21. Figura 4.21. Patrón de difracción de Fraunhofer generado por una abertura cuadrada de lado 2w = 1 mm a la distancia d = 3951 mm (N = 0.1) para la longitud de onda 632.8 nm. El tamaño de la imagen es de 20 mm de lado. Difracción · 295 4.4. Interferómetro de Young II En la unidad 3.8, discutimos el interferómetro de Young como un sistema de dos fuentes S1 y S2 puntuales coherentes entre sí. En esta unidad, trataremos dos aspectos prácticos que se tienen en el interferómetro de Young. El primero tiene que ver con el tamaño finito de las dos fuentes (aberturas) S1 y S2 , el segundo con el tamaño y coherencia de la fuente de iluminación. Con esto, estaremos haciendo una mejor descripción del experimento original de Thomas Young [17] en el siglo XIX. En la fig. 4.22, se muestra un diagrama del experimento de Young que emplearemos en esta unidad. La fuente primaria S con la que se iluminan las aberturas S1 y S2 es una fuente monocromática de longitud de onda 𝜆 extendida e incoherente de tamaño 𝜎. Las dos aberturas son círculos de radio w y están separadas entre sí (desde sus centros) la distancia a a lo largo de la dirección x. La distancia entre la fuente S y las aberturas es zp , y la distancia entre las aberturas y la pantalla de observación es d. zp s d S1 S Fuente extendida a x' P S2 Pantalla con aberturas (x,y) Pantalla de observación (x',y') Figura 4.22. Experimento de Young o difracción por dos aberturas en una pantalla opaca. Teniendo en cuenta las condiciones bajo las cuales se realiza el experimento de Young, d a 𝜆 , la difracción en la pantalla de observación corresponde con la difracción de Fraunhofer. 4.4.1. Efecto del tamaño de las aberturas difractantes Primero, vamos a suponer que la fuente primaria es una fuente puntual (en el eje óptico) y que la amplitud del campo en cada abertura es uniforme y 296 · Difracción de fase constante. Por lo tanto, la irradiancia será q ∫∞ ∫∞ (𝜖 0 c/2) 0 0 2 2 E0 circ x + y /w ∗ [𝛿 (x − a/2) + 𝛿 (x + a/2] I (x , y ) = 𝜆 2d2 −∞ −∞ (4.64) 0 2 0 ×e −i2𝜋 (x x+y x)/𝜆 d dxdy . La función circ( ) describe la geometría de cada abertura de radio w y las funciones delta de Dirac ubican las aberturas en x = −a/2 y x = a/2. El símbolo ∗ denota la operación de convolución. Teniendo en cuenta que la transformada de Fourier de la convolución de dos funciones es igual al producto de las transformadas de Fourier de cada función, se tiene que 2 𝜋a i2 2 J1 (2𝜋wr 0/𝜆 d) h 0 0 I (x , y ) = 4I0 cos x0 , (4.65) 2𝜋wr 0/𝜆 d 𝜆d p con I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 d) 2 y r 0 = x 02 + y 02 . Note que cos2 (𝜋 ax 0/𝜆 d) es la transformada de Fourier de [𝛿 (x − a/2) + 𝛿 (x + a/2]. En efecto, el resultado dado en la eq. (4.65) es la versión modulada del resultado dado en la eq. (3.117). Así que la modulación del patrón está determinada por el tamaño de las aberturas, mientras que la separación entre franjas está determinada por la separación entre las aberturas. En la fig. 4.23(a), se muestra la simulación del patrón de difracción por dos aberturas circulares idénticas de radio w = 0.5 mm separadas a = 5 mm, con 𝜆 = 632.8 nm, cuando la pantalla de observación se encuentra a la distancia d = 3956 mm (como en la fig. 4.18). En la fig. 4.23(b), se muestra el perfil horizontal del patrón. La curva segmentada en gris describe la modulación del patrón de interferencia debida al patrón de difracción. Irradiancia, I (I0) 1.0 1.22ld/2w 0.6 0.4 0.2 0 (a) ld/a 0.8 -6 -4 -2 0 x' (mm) 2 4 6 (b) Figura 4.23. (a) Patrón de interferencia generado por dos aberturas circulares de radio 0.5 mm y separadas 5 mm. El patrón de interferencia está modulado por el patrón de difracción (en gris) de una de las aberturas. (b) Perfil del patrón de interferencia. Difracción · 297 4.4.2. Efecto del tamaño de la fuente luminosa Ahora veremos cómo afecta la extensión 𝜎 de la fuente S al patrón de difracción. Suponemos que la fuente es monocromática e incoherente espacialmente. En otras palabras, las oscilaciones de los campos emitidos por dos fuentes puntuales (independientes) de S no están correlacionadas, de manera que estos campos no interfieren entre sí. Lo anterior implica que si consideramos dos fuentes puntuales de S, cada una generará su propio patrón de interferencia de Young. El resultado final es la suma de las intensidades producidas por cada una de las fuentes puntuales. Para ver en forma cualitativa el efecto del tamaño de la fuente, consideremos una fuente luminosa conformada por dos fuentes puntuales incoherentes separadas entre sí la distancia 𝜎 0, como se muestra en la fig. 4.24. El tamaño angular de la fuente será 𝛼 = 𝜎 0/zp . Cada fuente genera su propio patrón de interferencia con el máximo desplazado ±d𝛼/2. Las franjas de interferencia en cada patrón estarán separadas entre sí la distancia 𝜆 d/a. Ya que los dos patrones son idénticos, cuando el desplazamiento entre los patrones sea igual a 𝜆 d/2a, los mínimos de un patrón coinciden con los máximos del otro patrón, por lo que la suma de los patrones elimina las franjas de interferencia. Denotemos por 𝛼0 = 𝜆 /2a el ángulo que subtiende el desplazamiento 𝜆 d/2a con respecto al punto medio entre las aberturas. zp s' d S1 S Dos fuentes puntuales incoherentes entre sí. S2 Figura 4.24. Suma de intensidades de dos fuentes incoherentes. En la fig. 4.25, se muestra la evolución del patrón de interferencia a medida que aumenta el tamaño angular de la fuente. Los parámetros empleados son los mismos que hemos empleado en la fig. 4.18. Cuando 𝛼 = 0, las dos fuentes puntuales coinciden en el eje óptico, por lo que la intensidad en cada punto es el doble de la intensidad del patrón generado por una sola fuente. La visibilidad del interferograma (eq. (3.32)) es la máxima (C = 1). Cuando 𝛼 = 𝛼0 /4, las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /8a. El cambio en la intensidad es pequeño en comparación con el primer caso · 298 Difracción y la visibilidad del interferograma sigue siendo elevada (C = 0.93). Con 𝛼 = 𝛼0 /2, las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /4a y ahora el cambio en intensidad es apreciable; los mínimos dentro de la envolvente se alejan de cero. Esto último disminuye la visibilidad del interferograma en forma notable (C = 0.71). Para 𝛼 = 3𝛼0 /4, las fuentes puntuales están separadas 𝜎 0 = 3𝜆 zp /8a y la visibilidad disminuye considerablemente (C = 0.38). Por último, cuando 𝛼 = 𝛼0 , las fuentes puntuales están separadas 𝜎 0 = 𝜆 zp /2a y la visibilidad del interferograma se hace cero, es decir, no hay franjas de interferencia. 2.0 a 0 =l/(2a) a = a 0/ 4 a= a = 2a 0 / 4 a = a0 a = 3a 0/ 4 Irradiancia, I (4I 0 ) 1.5 1.0 0.5 0 -4 -2 0 x' (mm) 2 4 -4 -2 0 x' (mm) 2 4 -4 -2 0 x' (mm) 2 4 -4 -2 0 x' (mm) 2 4 -4 -2 0 x' (mm) 2 4 Figura 4.25. Disminución de la visibilidad del interferograma tipo Young generado por dos aberturas circulares de radio w = 0.5 mm separadas a = 5 mm, cuando se iluminan con luz emitida por dos fuentes puntuales incoherentes entre sí en función de la separación angular 𝛼 de las fuentes. La longitud de onda de la luz es 𝜆 = 632.8 nm. El ejemplo de arriba ilustra en forma cualitativa lo que le ocurre al patrón de interferencia de Young cuando se ilumina con una fuente extendida (conformada por infinitas fuentes puntuales incoherentes). De acuerdo con la visibilidad del interferograma que generan los campos ópticos que emergen de las aberturas S1 y S2 , podemos establecer el grado de similitud espacial de estos campos. La visibilidad del interferograma mide el grado de coherencia espacial de los campos en las aberturas. Si los campos en las aberturas son idénticos, lo que ocurre si la fuente es puntual, como en el caso 𝛼 = 0 de la fig. 4.25, la visibilidad es máxima y los campos son mutuamente coherentes o complemente coherentes. A medida que aumenta el tamaño de la fuente extendida, las oscilaciones de los campos en las aberturas están menos correlacionadas, por lo que disminuye la visibilidad del interferograma y el grado espacial de coherencia. Resultados similares a los mostrados en la fig. 4.25 se obtienen si en lugar de variar el tamaño de la fuente de iluminación se cambia la separación de las dos aberturas. Supongamos que el tamaño de la fuente de iluminación es 𝜎. Con base en lo visto anteriormente, la separación de las aberturas tiene un valor límite en el que la visibilidad del interferograma se hace cero. Difracción · 299 Para separaciones menores, se observará interferencia. En el caso de una fuente conformada por dos fuentes puntuales incoherentes, la separación límite es a = 𝜆 zp /2𝜎. Sin embargo, para una fuente continua este valor límite se calcula a partir del teorema de Van Cittert-Zernike: la posición del primer cero de la transformada de Fourier de la distribución de irradiancia de la fuente incoherente se toma como la máxima separación de las dos aberturas.5 Si la amplitud de los campos ópticos en las aberturas es aproximadamente igual, el resultado del teorema de van Cittert-Zernike mide la visibilidad del interferograma, lo que equivale a medir la coherencia espacial de los campos en las aberturas. Por ejemplo, si la fuente de iluminación es cuadrada de lado 𝜎, con una distribución de irradiancia constante, la visibilidad estará dada por C ∼ sin(𝜋𝜎 a/𝜆 zp )/(𝜋𝜎 a/𝜆 zp ) . Si la fuente de iluminación es circular de radio 𝜎/2, con una distribución de irradiancia constante, la visibilidad estará dada por C ∼ | J1 (𝜋𝜎 a/𝜆 d)/(𝜋𝜎 a/𝜆 d)|. Entonces, los valores límite para la separación de las aberturas serán: con la fuente de iluminación cuadrada, a = 𝜆 zp /𝜎, y con la fuente de iluminación circular, a = 1.22𝜆 zp /𝜎. En la fig. 4.26, se muestra los patrones de interferencia experimentales generados por dos aberturas circulares de radio w = 0.5 mm cuando la fuente de iluminación es incoherente con una distribución de irradian2 cia que sigue un perfil gaussiano [25]. En este experimento, C ∼ e −(a/5.95) , donde 5.95 es el ancho de la gaussiana en mm y se toma como el radio de la región de coherencia. En el experimento la separación de las aberturas varía desde 2 mm hasta 12 mm en pasos de 2. Al examinar el perfil de los interferogramas en la dirección horizontal (x 0), se obtienen curvas semejantes a las mostradas en la fig. 4.25. Cuando a = 12 mm, ya no se tiene interferencia. Note que en estas imágenes no se observan anillos de interferencia (como se muestra en el patrón simulado de la fig. 4.23(a). Esto ocurre porque en la práctica el máximo de irradiancia del primer anillo es muy pequeño con respecto al máximo de la región central, como se puede ver en el perfil de la fig. 4.23(b). A partir de lo dicho en esta unidad podríamos imaginar los cuidados que Thomas Young tuvo para observar franjas de interferencia, las cuales han de ser coloreadas si la fuente primaría es el sol. 5 El teorema de Van Cittert-Zernike establece que la región en el plano de las aberturas difractantes dentro de la cual la coherencia espacial no es nula está determinada por la transformada de Fourier de la distribución de irradiancia de la fuente luminosa incoherente. En el libro Principles of Optics de Born & Wolf [22] se encuentra una buena explicación de este teorema. 300 · Difracción (a) 2 mm (b) 4 mm (c) 6 mm (d) 8 mm (e) 10 mm (f) 12 mm Figura 4.26. Patrones de interferencia en el experimento de Young con luz parcialmente coherente monocromática de longitud de onda 632.8 nm en función de la separación de dos aberturas circulares de radio 0.5 mm. Difracción · 301 4.5. Formación de imagen con difracción De acuerdo con la óptica geométrica, la imagen de un punto formada por un sistema óptico libre de aberraciones ópticas también es un punto. Supongamos que el objeto puntual está localizado en el eje óptico. El frente de onda esférico que diverge del objeto al pasar por el sistema óptico será truncado por el diafragma de apertura, es decir, el diafragma juega el papel de la abertura que difracta la luz. Lo anterior implica que la imagen no puede ser un punto. Por otra parte, la imagen de un objeto extendido dependerá de la coherencia espacial del campo óptico en el objeto. En esta unidad, trataremos brevemente la formación de imagen teniendo en cuenta la difracción6 en la aproximación paraxial (difracción de Fresnel/Fraunhofer). 4.5.1. Imagen de un objeto (fuente) puntual Consideremos el sistema de la fig. 4.27. La lente delgada representa el sistema óptico formador de imagen y el borde de la lente es el diafragma de apertura. La lente introduce un retraso de fase en el frente de onda al pasar por el diafragma. Con esto en mente, se puede modelar la lente como una transmitancia de variable compleja que cambia la fase del frente de onda incidente en el diafragma. Entonces, el proceso de formación de imagen de un objeto puntual se puede describir así: del objeto puntual diverge un frente de onda esférico, que es truncado por el diafragma de apertura y experimenta un cambio de fase debido a la transmitancia de la lente, luego se difracta y en el plano imagen gaussiano el patrón de difracción describe la imagen del objeto puntual. - so si DA O Objeto puntual Lente (x,y) Plano imagen gaussiano (x',y') Figura 4.27. Esquema de un sistema óptico formador de imagen. El diafragma de apertura limita el frente de onda y genera difracción en la imagen. 6 Para una discusión detallada sobre el problema de la formación de imagen teniendo en cuenta la difracción, se puede consultar el libro Introduction to Fourier Optics [24]. 302 · Difracción En la fig. 4.27, −so y si son las distancias objeto e imagen con respecto a la lente delgada en el plano de la abertura (diafragma). La fase del campo óptico (que diverge del objeto puntual) justo antes de la abertura será 2 2 e −ikso e −ik (x +y )/2so . La transmitancia de la lente en la abertura está dada por 2 2 t(x, y) = e −ik (x +y )/2f . Este resultado se deduce fácilmente y se puede consultar en el libro Introduction to Fourier Optics [24]. Por lo tanto, si E0 es la amplitud del campo en la abertura, el campo óptico justo después de la abertura será ! p x 2 + y 2 −ik (x2 +y2 )/2so −ik (x2 +y2 )/2f −ikso E(x, y) = E0 e circ e e , (4.66) w donde la función circ( ) describe el borde de la lente y w es el radio de la lente. La difracción entre el diafragma (lente) y el plano imagen gaussiano resulta (𝜖 0 c/2) I (x 0 , y 0) = 𝜆 2 si2 ∫∞ ∫∞ h 2 E(x, y)e ik (x 2 +y 2 )/2si i e −i2𝜋 (x0 x+y0 y)/𝜆 si dxdy . −∞ −∞ (4.67) Dentro de la integral están los siguientes términos de fase e −ik (x 2 +y 2 )/2s o e ik (x 2 +y 2 )/2s i e −ik (x 2 +y 2 )/2f = e ik [1/si −1/so −1/f ] (x 2 +y 2 )/2 = 1. (4.68) Lo anterior se tiene como consecuencia de la ecuación de las lentes delgadas 1/si −1/so = 1/f (eq. (1.42)). Así, la imagen de un objeto puntual estará dada por I (x 0 , y 0) = E02 (𝜖 0 c/2) 𝜆 2 si2 2 ∫∞ ∫∞ circ q x 2 + y 2 /w e −i2𝜋 (x0 x+y0 y)/𝜆 si dxdy . −∞ −∞ (4.69) Esta integral ya la resolvimos en el ejemplo de la abertura circular (sección 4.3.3). De modo que la imagen de un objeto puntual formada por una lente de diámetro 2w depende del diámetro de la lente y de la distancia imagen Gaussiana si , y es de la forma I (r 0) = I0 2 J1 (2𝜋wr 0/𝜆 si ) (2𝜋wr 0/𝜆 si ) donde I0 = (𝜖 0 c/2) (𝜋w 2 E0 /𝜆 si ) 2 . 2 , (4.70) Difracción · 303 En óptica geométrica, se definió la PSF geométrica (unidad 1.9) para describir la forma de la imagen de un objeto puntual. Si el sistema óptico está libre de aberraciones la PSF geométrica será un punto. Al tener en cuenta la difracción, encontramos que la imagen de un objeto puntual ya no es un punto sino un patrón de difracción. Entonces, de manera análoga, en óptica física (cuando se tiene en cuenta la naturaleza ondulatoria de la luz) también se define la PSF difractiva para describir la forma de la imagen de un objeto puntual. Si el sistema óptico está libre de aberraciones la PSF difractiva estará dada por la eq. (4.70). Cuando un sistema óptico está libre de aberraciones ópticas se dice que el sistema está limitado por difracción. Función pupila y aberraciones ópticas La eq. (4.69) indica que en el proceso de formación de imagen, el cual es del dominio de la difracción de Fresnel, la lente compensa el término de fase cuadrático de Fresnel, dando como resultado una integral de difracción de Fraunhofer. Esta ecuación se puede generalizar a sistemas ópticos de varias lentes con un diafragma de apertura separado de las lentes. La abertura difractante será el borde de la pupila de salida y la distancia en la que ocurre la difracción de Fresnel será la distancia entre la pupila de salida y el plano imagen gaussiano, digamos sps . La pupila se describe mediante una función P (x, y) que incluye la geometría de la pupila y una posible variación de la transmitancia en la pupila. Si, adicionalmente, el sistema óptico presenta aberraciones ópticas, estás afectan la fase del frente de onda en la pupila, lo cual se puede incluir multiplicando la función P (x, y) por un término e −ikW (x, y) , donde W (x, y) es la variación del frente de onda real con respecto al frente de onda esférico ideal de radio sps . Entonces, la PSF de un sistema óptico en general estará dada por I (x 0 , y 0) = E02 (𝜖 0 c/2) 2 𝜆 2 sps ∫∞ ∫∞ 2 P (x, y)e −ikW (x,y) e −i2𝜋 (x0 x+y0 y)/𝜆 s ps dxdy . −∞ −∞ (4.71) La función W (x, y) es un polinomio cuyos términos describen las aberraciones ópticas presentes en el sistema óptico [26]. Por ejemplo, las aberraciones primarias como el astigmatismo, la coma y la esférica en el frente de onda están dadas por: aa (x 2 − y 2 ), ac y(x 2 + y 2 ) y as (x 2 + y 2 ) 2 , respectivamente. El desenfoque también se puede incluir como una aberración, llamada defoco, dada por ad (x 2 + y 2 ). Los coeficientes ad , aa , ac y as dependen de los parámetros del sistema óptico. En la fig. 4.28, se muestra la PSF de un sistema óptico limitado por difracción cuando la distancia entre la 304 · Difracción pupila de salida y el plano imagen gaussiano es sps = 100 mm y el diámetro de la pupila de salida 2w = 10 mm, con 𝜆 = 632.8 nm. El radio del disco de Airy es rA = 7.7 𝜇m. El tamaño del cuadro de la imagen es 316 𝜇m de lado. En la fig. 4.29, se muestra los patrones de difracción cuando en el mismo sistema óptico de la fig. 4.28 el frente de onda en la pupila de salida está afectado por aberraciones como: defoco, con ad = 5 × 10−5 mm−1 ; astigmatismo, con aa = 3.5 × 10−5 mm−1 ; coma, con ac = 1.25 × 10−5 mm−2 ; y aberración esférica, con as = 2 × 10−6 mm−3 . El tamaño del cuadro de la imagen en todos los casos es 316 𝜇m de lado. Figura 4.28. Patrón de difracción (función J inc( )) sin aberraciones. El radio del disco de Airy es 7.7 𝜇m. (a) defoco (b) astigmatismo (c) coma (d) esférica Figura 4.29. Patrones de difracción correspondientes a las aberraciones primarias cuando el diámetro de la pupila de salida es 10 mm y la distancia entre la pupila de salida y el plano imagen gaussiano es 100 mm, con 𝜆 = 632.8 nm. El tamaño del cuadro de la imagen en todos los casos es de 0.316 mm de lado. Lo primero que podemos observar es que la presencia de cualquiera de estas aberraciones aumenta el tamaño de la PSF, comparada con la PSF sin aberraciones de la fig. 4.28. Note que la aberración de defoco corresponde con un patrón de difracción de Fresnel, ya que en este caso el término 2 2 e −ikW (x, y) en la integral de la eq. (4.71) es igual a e −ikad (x +y ) , lo que tiene la forma del factor cuadrático de Fresnel. El número de zonas de Fresnel que introduce el defoco en la pupila será N = 2ad w 2 /𝜆 . En el ejemplo, esto es Difracción · 305 2 ), donde N = 3.95. El coeficiente de defoco está dado por ad = −Δs/(2sps Δs es el desenfoque. En nuestro ejemplo, se tiene que Δs = −1 mm, y el signo negativo significa que el desenfoque ocurre cuando el plano imagen se desplaza 1 mm acercándose a la pupila de salida. En la práctica, la PSF será el resultado de la combinación de las aberraciones. Por ejemplo, la PSF experimental de la fig. 4.1 corresponde con un sistema óptico (modelo de ojo humano) afectado por defoco (miopía), astigmatismo y aberración esférica. 4.5.2. Resolución en la imagen (dos puntos) Desde el punto de vista de la óptica geométrica, si el objeto consiste en dos puntos separados cierta distancia, en la imagen también tendremos dos puntos separados una distancia que depende del aumento del sistema. Sin importar cual sea la distancia que separa los dos puntos del objeto en la imagen siempre podremos observar también dos puntos. Pero como lo mencionamos anteriormente, la imagen de un objeto puntual es una distribución de irradiancia denominada la PSF. Por lo tanto, la imagen de dos puntos incoherentes espacialmente será dos patrones de difracción que pueden superponerse (en intensidad) dependiendo de la distancia que separa los dos puntos. Esto quiere decir que se puede tener una situación en la que los dos patrones de difracción se superponen dando como resultado una distribución de irradiancia en la que no son distinguibles los patrones individuales. ¿Cuál es la distancia mínima entre estos dos patrones de difracción de modo que aún se pueda identificar los dos patrones? Esta distancia se denomina límite de resolución espacial y depende del diámetro de la pupila de salida del sistema óptico y de la distancia imagen. Si el sistema formador de imagen está limitado por difracción, el tamaño de la imagen de un objeto puntual se toma igual al disco de Airy. En la fig. 4.30, se muestra la superposición incoherente de las imágenes de dos objetos puntuales idénticos cuando están separadas: 2rA , 3rA /2, rA y rA /2, donde rA es el radio del disco de Airy. La distancia que separa las imágenes se mide desde el centro de cada uno de los patrones de difracción, lo que corresponde con la distancia de las imágenes puntuales según la óptica geométrica. Los cálculos se realizaron teniendo en cuenta los mismos parámetros de la fig. 4.28, es decir, cuando la distancia entre la pupila de salida y el plano imagen gaussiano es sps = 100 mm y el diámetro de la pupila de salida 2w = 10 mm, con 𝜆 = 632.8 nm. En (a), se dibujan los perfiles de cada uno de los patrones de difracción; en (b), el resultado de la superposición incoherente de los dos patrones de difracción y, en (c), la imagen difractiva de 306 · Difracción la superposición. Cuando la separación es 2rA o 3rA /2 las imágenes de los dos puntos se identifican claramente. Cuando la separación es rA , parte de los patrones se superponen y aún se puede resolver las dos imágenes difractivas, pero cuando se acercan aún más, a la distancia rA /2, ya no es posible identificar la imagen de dos objetos puntuales. Aunque entre las distancias rA y rA /2 se puede tener distancias para las cuales aún se puede resolver las imágenes, se suele establecer como criterio de resolución la situación en la que la separación es rA . Este es el criterio de Rayleigh [3]: las imágenes de dos fuentes puntuales incoherentes están resueltas cuando el centro del patrón de Airy de una de las imágenes cae en el primer mínimo del patrón de Airy de la otra imagen. Irradiancia, I (I0) 2rA 1.5rA rA 0.5rA 1.0 0.5 0 -20 -10 0 10 20 -20 -10 x' (mm) 0 10 20 x' (mm) -20 -10 0 10 20 -20 -10 x' (mm) (a) 0 10 20 10 20 x' (mm) Irradiancia, I (I0) 1.5 1.0 0.5 0 -20 -10 0 x' (mm) 10 20 -20 -10 0 x' (mm) 10 20 -20 (b) -10 0 x' (mm) 10 20 -20 -10 0 x' (mm) ( c) Figura 4.30. Superposición incoherente de las imágenes de dos fuentes puntuales cuando las imágenes están separadas 2rA , 3rA /2, rA y rA /2. (a) Perfiles de la irradiancia de cada imagen, (b) perfiles de la imagen resultante de la superposición de las dos imágenes, (c) patrones de difracción de la imagen de dos fuentes puntuales. Ya que rA = 1.22𝜆 d/(2w), para una distancia fija resulta de gran relevancia el tamaño del diafragma de apertura del sistema óptico; a mayor diámetro mejor resolución. Esta es la razón por la que en astronomía es deseable Difracción · 307 tener en los telescopios espejos primarios de gran tamaño. Por otra parte, en otros casos, como en litografía, se puede modificar (disminuir) la longitud de onda de la luz que proviene del objeto para aumentar la resolución. Esto mismo ocurre en microscopía electrónica, en la que la longitud de onda es del orden 1 Å. Por supuesto, la calidad del patrón de difracción depende de las aberraciones ópticas, las cuales aumentan con el aumento del diámetro del diafragma de apertura. Así que no necesariamente al aumentar el diámetro del diafragma mejoramos la resolución. Si las dos fuentes puntuales son coherentes entre sí, el resultado de la superposición de las imágenes depende de la fase inicial de la luz en cada una de las fuentes. Por ejemplo, si la diferencia de fase entre las dos fuentes es 𝜋 se puede disminuir por debajo de rA la distancia entre las imágenes. Pero si la diferencia de fase es 0, se debe aumentar por encima de rA la separación de las imágenes para poderlas resolver [24]. Agudeza visual En óptica visual (optometría y oftalmología), en lugar de usar el concepto de resolución como se ha explicado arriba, se suele usar el concepto agudeza visual. En la práctica, es equivalente, pero para el ojo humano se ha establecido una norma que determina las condiciones bajo las cuales se dice que una persona tiene una buena agudeza visual. Si a una distancia de 20 pies (∼ 6 m) una persona puede resolver dos líneas separadas 10 de arco, se dice que esa persona tiene una agudeza visual de 20/20 (ojo emétrope). Siguiendo el criterio de Rayleigh, el límite de resolución angular está dado por rA 𝜆 (Δ𝜃)mı́n = = 1.22 . (4.72) sps (2w) Para el ojo emétrope, el límite de resolución será (Δ𝜃)mı́n _o jo = 10. Tomando 540 nm como el valor de la longitud de onda en el centro del espectro visible, el diámetro de la pupila del ojo para el cual se obtiene el valor del límite de resolución será 2w = 2.3 mm. Si consideramos el ojo esquemático de Gullstrand-Emsley (fig. 1.68), donde f 0 = 22.05 (∼ sps ), se tiene que el tamaño de una fuente puntual en la retina será una mancha circular de 12.8 𝜇m de diámetro. 4.5.3. Imagen de un objeto extendido Un objeto se puede considerar como un conjunto (infinito) de puntos. Ya sabemos (por lo dicho en la sección anterior) cómo se forma la imagen de un 308 · Difracción objeto puntual, esto es la PSF dada por la eq. (4.71). La generalización a un conjunto de puntos no es inmediata, sino que depende del grado de coherencia de la iluminación del objeto. Por ejemplo, para el caso incoherente la imagen está dada por Ii (x 0) = Io (x 0) ∗ PSF , (4.73) donde Io (x 0) representa la imagen gaussiana, PSF es la función que describe la PSF difractiva (eq. (4.71)) y el símbolo ∗ la operación de convolución. Lo anterior significa que cada punto de la imagen gaussiana es afectado por la PSF del sistema de la misma manera.7 Para el caso de iluminación coherente la situación es más compleja, ya que la convolución de la imagen gaussiana se debe realizar con una función que depende del sistema óptico (geometría de la pupila y aberraciones ópticas) y de las características del objeto (contenido de frecuencias espaciales). En otras palabras, si cambiamos el objeto (manteniendo el mismo sistema óptico), cambia la función [27], [28]. Una situación similar se tiene con luz parcialmente coherente. En Mejía [29], se puede ver una generalización del proceso formador de imagen con luz parcialmente coherente. 7 Esto es válido solo en la región paraxial. Para campos de visión mayores, se debe tener en cuenta que la PSF varía con el ángulo. Por ejemplo, la aberración de coma aumenta a medida que el rayo principal aumenta su inclinación. Difracción · 309 4.6. Rejillas de difracción Una rejilla de difracción consiste en un gran número de elementos idénticos que difractan la luz. Estos elementos pueden ser aberturas en una pantalla opaca, escalones o surcos sobre un sustrato o incluso un patrón de interferencia de franjas rectas paralelas grabado en amplitud o fase en un material fotosensible. La posición de los máximos de irradiancia producidos por las rejillas de difracción es función de la longitud de onda, por lo que las rejillas de difracción encuentran una gran aplicación en la medida espectral de longitud de onda de la luz. En esta unidad, se analiza una configuración básica de rejilla de difracción, la cual consiste en un arreglo de N aberturas rectangulares de ancho b y largo c separadas entre sí una distancia a (> b), como se muestra en la fig. 4.31. Suponiendo que b c, entonces basta con analizar el patrón de difracción en una sola dimensión a lo largo de la distribución de las aberturas (eje x en la figura). La distancia a la que se suele observar el patrón de difracción producido por rejillas de difracción es tal que d N a, por lo que el patrón de difracción observado corresponde con la difracción de Fraunhofer. y a x y' x' d A z Figura 4.31. Arreglo de N aberturas rectangulares idénticas. En el caso unidimensional, el perfil de cada una de las aberturas se puede describir mediante la función rect( ), que ya hemos visto en la sección 4.3.3. Por otra parte, en la unidad 3.6 hemos visto la interferencia de N fuentes puntuales (fig. 3.47(b)). La interferencia de N fuentes con geometría rectangular equivale a la difracción del arreglo de aberturas rectangulares. Suponiendo que iluminamos el arreglo de aberturas con una onda plana de amplitud E0 en dirección ortogonal, el campo óptico en el arreglo 310 · Difracción de aberturas se puede escribir de manera sencilla como E(x) = E0 rect N x Õ ∗ 𝛿 (x − ja), b (4.74) j=1 donde 𝛿 (x − ja) determina la posición de la j-ésima abertura, y con la operación de convolución copiamos la forma rectangular de las aberturas en cada punto localizado en x = ja. La difracción de Fraunhofer será I (x 0) = E02 (𝜖 0 c/2) 𝜆 2d2 2 ∫∞ N x Õ −i2𝜋x0 x/𝜆 d rect ∗ 𝛿 (x − ja) e dx , (4.75) b j=1 −∞ lo que resulta ser sin(𝜋x 0b/𝜆 d) I (x 0) = I0 (𝜋x 0b/𝜆 d) 2 N Õ 2 e −i2𝜋x0 ( ja)/𝜆 d . (4.76) j=1 En I0 , hemos reunido a (𝜖 0 c/2) (E0 /𝜆 d) 2 y las demás constantes que salen de la integral. La sumatoria del segundo factor de la derecha de la igualdad se resuelve de la misma forma como lo hicimos para la eq. (3.101). El resultado final es I (x 0) = I0 sin(𝜋x 0b/𝜆 d) (𝜋x 0b/𝜆 d) 2 sin(N 𝜋x 0 a/𝜆 d) sin(𝜋x 0 a/𝜆 d) 2 . (4.77) Esta integral se diferencia de la integral dada en la eq. (3.104) en el término correspondiente a la difracción de una sola abertura. Así, el patrón de difracción producido por un arreglo de N aberturas idénticas es igual al patrón de interferencia de N fuentes puntuales (localizadas en el centro de las aberturas) modulado por el patrón de difracción de una de las aberturas. En la fig. 4.32, se muestra el perfil del patrón de difracción para un arreglo de 8 aberturas rectangulares idénticas separadas a = 4b. El arreglo se ubica de manera simétrica con respecto al eje óptico (eje z en la fig. 4.31). En la figura se incluye el perfil de difracción (curva segmentada) de una abertura, y resulta evidente la modulación que esta produce en el patrón de interferencia generado por 8 fuentes puntuales ubicadas en el centro de las aberturas. La unidad de la escala horizontal está dada como 𝜆 d/a, esto es, la separación entre los máximos principales del patrón de interferencia. Por otra parte, a las distancias ±m 0𝜆 d/b (m 0 = 1, 2, 3, ...) con respecto al centro en 0 (eje óptico) se tienen los ceros del patrón de difracción. Ya que · Difracción 311 a = 4b, el máximo principal del patrón de interferencia ubicado en 4(𝜆 d/a) cae justo en el primer cero del patrón de difracción ubicado en 𝜆 d/b, por lo que allí no se observa el máximo de la interferencia. En el lóbulo central, tendremos 2(a/b) − 1 máximos principales, mientras que en los lóbulos laterales tendremos (a/b) − 1 máximos principales. Los máximos principales se ubican en ±m𝜆 d/a (m = 0, 1, 2, 3, ...) y con m se etiquetan los máximos como el orden de difracción. Así, el máximo central será el orden cero de difracción, los dos máximos más próximos al central serán los órdenes +1 y −1 de difracción, y así sucesivamente. 64 ld/b Irradiancia, I (I0) 56 48 40 32 24 16 8 0 -8 -7 -6 -5 -4 -3 -2 -1 0 1 x' (ld/a) 2 3 4 5 6 7 8 Figura 4.32. Patrón de difracción producido por una arreglo de 8 aberturas rectangulares idénticas separadas a = 4b, con b el ancho de cada abertura. La curva segmentada corresponde con el patrón de difracción de una sola abertura. Al aumentar N la energía en los máximos secundarios disminuye (acercándose a cero) y los máximos principales tienen la forma de picos muy agudos. El pico de orden m subtiende el ángulo 𝜃 m con respecto al centro de la rejilla (en el eje óptico) y está dado por tan 𝜃 m = m (𝜆 d/a) . d (4.78) En la aproximación de Fraunhofer, podemos cambiar la función tan( ) por la función sin( ) de modo que la ecuación de la rejilla de difracción que ubica angularmente un orden de difracción es m𝜆 = a sin 𝜃 m . (4.79) Cuando la fuente de iluminación es policromática, en el orden cero tendremos un máximo del mismo color que el de la fuente, pero para m ≠ 0 312 · Difracción tendremos máximos de diferente color separados espacialmente. Por ejemplo, si la fuente es de luz blanca, se verá un espectro continuo para un m dado (≠ 0). Si el espectro de la fuente consiste en dos longitudes de onda, ¿cuál es la mínima diferencia en longitud de onda que se puede resolver en el patrón de difracción? Este problema se puede tratar de manera similar a como se trató la resolución espacial de dos imágenes puntuales en la unidad anterior. La eq. (3.112) permite determinar la separación de los mínimos entre los máximos principales del patrón de interferencia de N fuentes. La separación entre dos mínimos consecutivos estará dada por Δx 0 = 𝜆d , Na (4.80) lo que a su vez es la mitad del ancho de los máximos principales. Si aplicamos el criterio de Rayleigh, entonces Δx 0 será la mínima separación en x 0 entre los máximos de difracción para dos longitudes de onda 𝜆 y 𝜆 + Δ𝜆 para un orden de difracción m. Por otro lado, la separación angular entre los dos máximos se puede calcular de la siguiente manera: sea x 0 la posición del máximo de orden m, entonces x 0/d = tan 𝜃 m ≈ sin 𝜃 m , de donde Δx 0 = Δ𝜃 m cos 𝜃 m . d (4.81) Reemplazando la eq. 4.80 en la eq. 4.81, se tiene que la separación angular es igual a 𝜆 . (4.82) Δ𝜃 m = N a cos 𝜃 m Por otra parte, de la eq. (4.79) también se puede evaluar la separación angular. Diferenciando se tiene que mΔ𝜆 = aΔ𝜃 m cos 𝜃 m , es decir Δ𝜃 m = mΔ𝜆 . a cos 𝜃 m (4.83) (4.84) El poder de resolución de la rejilla de difracción8 se define como <= 8 El 𝜆 , (Δ𝜆 )mı́n (4.85) poder de resolución en una rejilla de difracción es una medida de la capacidad para separar espacialmente dos longitudes de onda. Difracción · 313 donde (Δ𝜆 )mı́n es la diferencia en longitud de onda que se puede resolver alrededor de la longitud de onda 𝜆 . Al igualar las eqs. (4.82) y (4.84,) se tiene que el poder de resolución de la rejilla también se puede escribir como < = N m. (4.86) Entonces, el poder de resolución aumenta con N y el orden de difracción m. En una rejilla de difracción, la densidad de elementos difractantes (aberturas) suele ser de cientos o miles por milímetro. Esta densidad es el parámetro que se suele usar para caracterizar la rejilla y su valor se da en líneas por milímetro. Una línea equivale a un elemento difractante. Por ejemplo, en el catálogo de una tienda de elementos ópticos, una rejilla de difracción, de 12.5 mm de ancho, tiene 500 líneas/mm. A partir de esta información encontramos que N = 6250. Si iluminamos completamente la rejilla con una onda plana, el poder de resolución con el orden m = 1 será < = 6250. Entonces, para una señal luminosa alrededor de 𝜆 = 540 nm, podremos separar dos longitudes de onda cuya diferencia sea (Δ𝜆 )mı́n = 0.086 nm. Si el análisis se hace para el segundo orden de difracción, la diferencia en longitudes de onda será (Δ𝜆 )mı́n = 0.043 nm. En la práctica, las rejillas se diseñan de tal manera que se pueda controlar la cantidad de luz en los órdenes de difracción. En el caso de la rejilla plana iluminada ortogonalmente, la mayor parte de la luz está en el orden cero, donde no se puede resolver el espectro. Entonces, sería conveniente tener la mayor parte de la luz en el orden 1 o 2. Lo anterior se puede hacer, por ejemplo, grabando escalones inclinados en la superficie de un espejo. Si además el espejo es cóncavo, se logra enfocar los diferentes órdenes de difracción, lo que es común en los espectrómetros. Para una ampliación de este tema, se puede consultar los libros Diffraction Gratings and Application [30] y Diffraction Grating Handbook [31]. Apéndice A Trazo de rayos Trazo de rayos · 317 Considerando la aproximación paraxial, se puede establecer un método para propagar un rayo óptico en un sistema de superficies refractoras o reflectoras. Lo anterior permite medir las propiedades paraxiales del sistema óptico, a saber: puntos focales, puntos principales y puntos nodales. En la fig. A.1, se indican los ángulos u y u 0 de inclinación de los rayos incidente y refractado en una superficie esférica de radio R, y la altura y del rayo incidente en la superficie esférica. En la aproximación paraxial, la altura del rayo en la superficie se mide a lo largo de la línea segmentada que pasa por el vértice V de la superficie y las tangentes de los ángulos se toman como los ángulos (en radianes). Por lo tanto, y u=− (A.1) s y y (A.2) u0 = − 0 . s . V - u' s' R -s y . u n n' Figura A.1. Altura y ángulos de inclinación de un rayo en una superficie esférica refractora. Multiplicando por la altura y la ecuación de Gauss para la superficie esférica refractora (eq. 1.21), se tiene que n 0 y ny n0 − n − = y . s0 s R (A.3) Y a partir de las eqs. (A.1) y (A.2), se llega a n 0u 0 = nu − (n 0 − n)cy, (A.4) donde c = 1/R es la curvatura de la superficie. La eq. (A.4) permite propagar el ángulo de inclinación del rayo a lo largo del sistema óptico. Para generalizar la propagación en varias superficies, consideremos dos superficies esféricas de un sistema óptico, como en la fig. A.2. La ecuación para propagar el ángulo desde la izquierda hacia la derecha de la superficie j queda n j u j = n j−1 u j−1 − P j y j , (A.5) 318 · Trazo de rayos donde P j = (n j −n j−1 )c j es la potencia refractora. Aquí se tiene que n 0j−1 = n j , y c j = 1/R j . n j-1 u j-1 uj yj nj n j+1 y j+1 u j+1 tj j j+1 Figura A.2. Propagación de un rayo en dos superficies. Por otro lado, el objeto de la ( j + 1)-ésima superficie será la imagen de la j-ésima superficie, por lo que las distancias se relacionan mediante la separación o espesor t j entre las superficies como s j+1 = s 0j − t j , (A.6) y j+1 yj = − − tj , uj uj (A.7) que es igual a − es decir, y j+1 = y j + 𝜏j (n j u j ), (A.8) donde 𝜏j = t j /n j es el espesor reducido. Entonces, mientras que con la eq. (A.5) propagamos el ángulo, con la eq. (A.8) propagamos la altura. Con estas dos ecuaciones, podemos ver cómo evoluciona un rayo en un sistema óptico con cualquier número de superficies refractoras y/o reflectoras. Las eqs. (A.5) y (A.8) son la base del método y-nu de trazo de rayos paraxial [12]. Distancia focal de un conjunto de lentes A partir de la eq. (A.5), se puede determinar la distancia focal de un conjunto de superficies refractoras (lentes). Supongamos que tenemos M superficies Trazo de rayos · 319 refractoras. Entonces, para las M superficies nM uM = nM−1 uM−1 − PM yM nM−1 uM−1 = nM−2 uM−2 − PM−1 yM−1 . . . n1 u1 = n0 u0 − P1 y1 , (A.9) y sumando se llega a nM uM = n0 u0 − M Õ Pj y j . (A.10) j=1 La distancia focal del sistema se determina cuando s0 = −∞, es decir, u0 = 0 (y y1 = y0 ). Por lo tanto, f =− y1 , uM (A.11) y M 1 Õ yj 1 = Pj . f nM y1 (A.12) j=1 Distancia focal de una lente simple n0= 1 n 1 = nl n 2 =1 u0= 0 y0 u1 y1 y2 t V P 0 u2 P' V' 1 2 F' 3 H H' Figura A.3. Cálculo de la distancia focal de una lente. Como resultado particular de la eq. (A.12), vamos a calcular la distancia focal de una lente de espesor t sumergida en aire. En la fig. A.3, se ilustra 320 · Trazo de rayos la geometría para el cálculo de la distancia focal. En este caso, M = 2 y n0 = n2 = 1. Luego, la eq. (A.12) se reduce a y2 1 = P1 + P2 . f y1 (A.13) Empleando la eq. (A.8) para y2 , se tiene 1 𝜏1 (n1 u1 ) = P1 + P2 + P2 , f y1 (A.14) y, con la eq. (A.5) para n1 u1 , se llega a 1 t = P1 + P2 − P1 P2 , f nl (A.15) donde nl = n1 y t = t1 . Esta última ecuación equivale a 1 (nl − 1) (1 − nl ) (nl − 1) (1 − nl ) t = + − . f R1 R2 R1 R2 nl (A.16) Así, se obtiene el resultado para la distancia focal de una lente de espesor t dada en la eq. (1.50), es decir, 1 1 1 (n − 1) 2 t = (nl − 1) − + l . f R1 R2 R1 R2 nl (A.17) Planos principales Los planos principales se pueden ubicar con respecto a los vértices de la lente. Así, el plano principal secundario estará a la distancia V0P0 del vértice V0 y el plano principal primario estará a la distancia VP del vértice V. La distancia entre V0 y F0 se denomina distancia focal posterior, fp = V0F0 y la distancia entre V y F se denomina distancia focal anterior, fa = VF. Entonces, V0P0 = fp − f (A.18) y como y1 y2 = , f fp de la eq. (A.8), se tiene fp = f y, con la eq. (A.5), y1 + 𝜏1 (n1 u1 ) y1 (A.19) Trazo de rayos fp = f y1 + 𝜏1 (−P1 y1 ) , y1 · 321 (A.20) tP1 . nl (A.21) t(nl − 1) . nl R1 (A.22) fp = f − f Por lo tanto, V0P0 = −f Note que V0P0 depende de la potencia de la primera cara de la lente. Si esta es cero (r1 = ∞), entonces el plano principal secundario se localiza en V0. Para determinar VP, podemos considerar que se gira la lente y se realiza el mismo procedimiento del caso anterior, por lo tanto, se tiene que VP = − f t(nl − 1) . nl R2 (A.23) Distancia focal de un conjunto de lentes delgadas Si aproximamos un conjunto de lentes N por lentes delgadas (sumergidas en aire), la eq. (A.12) se simplifica de la siguiente manera N 1 Õ yk 1 = , f y1 fk k=1 donde yk es la altura del rayo en la k-ésima lente y fk la distancia focal de la késima lente. Por ejemplo, la distancia focal de dos lentes delgadas separadas una distancia d estará dada por 1 1 y2 1 = + . f f1 y1 f2 Empleando la eq. (A.8) para y2 y luego la eq. (A.5) para (n1 u1 ), se llega al resultado conocido 1 1 1 1 1 = + − d. f f1 f2 f1 f2 Apéndice B Índice de refracción Índice de refracción · 325 El índice de refracción en un medio mide el cambio de la velocidad de la luz en el medio con respecto a la velocidad de la luz en el vacío. Ya que la velocidad de la luz en un medio depende de la frecuencia 𝜈, entonces el índice de refracción también depende de la frecuencia. Denotando por n el índice de refracción, 𝜐 la velocidad de la luz en el medio y c la velocidad de la luz en el vacío, el índice de refracción está dado por n(𝜈) = c , 𝜐 (𝜈) (B.1) ecuación conocida también como relación de dispersión. Desde el punto de vista microscópico, en una aproximación clásica, el cambio de la velocidad ocurre por el cambio de fase de la onda electromagnética reemitida por los dipolos eléctricos inducidos que componen el medio con respecto a la onda electromagnética incidente (de velocidad c). El índice de refracción en materiales dieléctricos Para obtener un primer modelo del índice de refracción en un medio dieléctrico, vamos a suponer inicialmente que el medio en presencia de un campo eléctrico externo está compuesto por N dipolos inducidos del tipo p = −er (electrón ligado a un átomo) por unidad de volumen. Ya que el dipolo está rodeado de otros dipolos, en presencia de una onda electromagnética armónica de amplitud E0 y frecuencia 𝜈, el dipolo oscilará de manera similar a como lo hace un oscilador armónico amortiguado - forzado. Entonces, si E = E0 e −i𝜔t (B.2) representa la onda armónica, con 𝜔 = 2𝜋 𝜈, la fuerza eléctrica sobre la carga e será F = −eE. (B.3) El vector de desplazamiento de la carga e estará determinado por la ecuación d2r dr me 2 + me 𝛾 + kr = −eE0 e −i𝜔t , (B.4) dt dt donde me es la masa de la carga e, 𝛾 la constante de amortiguación (debido a la presencia de los otros dipolos) y k la constante que da cuenta de la fuerza que mantiene ligada la carga al átomo. En el estado estacionario, la respuesta del dipolo será r = r0 e −i (𝜔t+𝛿) , (B.5) 326 · Índice de refracción es decir, oscilará con la misma frecuencia de la onda incidente, pero con un desfase 𝛿. Reemplazando la eq. (B.5) en la eq. (B.4), se llega a r0 = (𝜔02 −eE0 /me e i𝛿 . 2 − 𝜔 ) − i𝛾𝜔 (B.6) con 𝜔02 = k/me . Con este resultado, se tiene que r=− (𝜔02 (e/me ) E, − 𝜔 2 ) − i𝛾𝜔 (B.7) y el vector de polarización eléctrico inducido P = −N er será P= N e 2 /me E. (𝜔02 − 𝜔 2 ) − i𝛾𝜔 (B.8) Entonces, el efecto macroscópico de la onda electromagnética incidente en el medio es un vector de polarización, el cual es proporcional a E. En general, lo anterior se escribe como (B.9) P = 𝜖 0 𝜒 E, donde 𝜖 0 es la permitividad del vacío (una constante) y 𝜒 la susceptibilidad eléctrica del medio, la cual mide el grado de proporcionalidad con E y se define como 𝜒 = 𝜖 /𝜖 0 − 1, donde 𝜖 es la permitividad del medio. Por otro lado, en medios dieléctricos (no magnéticos), se tiene que el vector de polarización magnético, M = 0, el vector de densidad de corriente eléctrica, J = 0 y la densidad de carga libre, 𝜌 = 0. Así, las ecuaciones de Maxwell para el medio tienen la forma ∇ × E = − 𝜇0 ∇ × H = 𝜖0 𝜕H , 𝜕t (B.10) 𝜕E 𝜕P + , 𝜕t 𝜕t ∇·E=− (B.11) ∇·P , 𝜖0 (B.12) ∇ · H = 0, (B.13) donde H es el vector magnético y 𝜇 0 la permeabilidad del vacío. La ecuación de onda que resulta de tomar ∇× (∇×E) = − 𝜇 0 𝜕(∇×H)/𝜕t y las eqs. (B.11) y (B.9) es ∇(∇ · E) − ∇2 E = − 𝜇 0 𝜖 0 (1 + 𝜒 ) 𝜕2E . 𝜕t 2 (B.14) Índice de refracción · 327 Medios isotrópicos Un medio se dice isotrópico si sus propiedades físicas no dependen de la dirección. En particular, en óptica, se dice que el medio es isotrópico si el índice de refracción no depende de la dirección. Lo anterior implica que en la eq. (B.9) la susceptibilidad eléctrica se describe mediante un escalar. En caso contrario, en un medio anisotrópico (en el que el índice de refracción sí depende de la dirección), la susceptibilidad eléctrica se describe mediante un tensor (matriz de 3 × 3). Suponiendo que el medio dieléctrico es isotrópico, entonces en la eq. (B.12) se tiene que ∇ · (𝜖 0 E + 𝜒 𝜖 0 E) = (1 + 𝜒 )∇ · E = 0, (B.15) lo cual implica que ∇ · E = 0, ya que 𝜒 > 0. Por lo tanto, la ecuación de onda para el medio dieléctrico isotrópico está dada por ∇2 E = 𝜇 0 𝜖 0 (1 + 𝜒 ) 𝜕2E , 𝜕t 2 (B.16) por lo que la velocidad de la luz en el medio se determina de 1 = 𝜇 0 𝜖 0 (1 + 𝜒 ). 𝜐2 (B.17) Ya que c 2 = 1/ 𝜇 0 𝜖 0 , entonces el índice de refracción resulta ser n2 = 1 + 𝜒 . (B.18) Y con el resultado obtenido para el medio del ejemplo dado por la eq. (B.8), se llega a 1 N e2 2 . n2 = 1 + (B.19) me 𝜖 0 (𝜔0 − 𝜔 2 ) − i𝛾𝜔 Partiendo del resultado anterior, se logra una generalización del medio si suponemos que en lugar de un solo tipo de dipolos eléctricos se tienen M tipos de dipolos. Si N j es la densidad volumétrica del j-ésimo tipo de dipolos, entonces Nj (B.20) N Í es la fracción del j-ésimo tipo de dipolos y se satisface M j=1 g j = 1. Con esto en mente, se puede escribir el índice de refracción de un modo general como M gj N e2 Õ 2 h i, n =1+ (B.21) me 𝜖 0 (𝜔 2 − 𝜔 2 ) − i𝛾 𝜔 gj = j=1 0j j 328 · Índice de refracción donde ahora se tienen varias frecuencias propias 𝜔0 j y constantes de amortiguamiento 𝛾 j correspondientes a cada tipo de dipolos. Según la eq. (B.21), el índice de refracción es una cantidad de variable compleja, es decir, n = nR + inI . Tomando las partes real e imaginaria del cuadrado del índice de refracción se llega a nR2 − nI2 M (𝜔02 j − 𝜔 2 ) N e2 Õ i gj h =1+ me 𝜖 0 2 2 2 2 2 j=1 (𝜔0 j − 𝜔 ) + 𝛾 j 𝜔 (B.22) M 𝛾j𝜔 N e2 Õ h i gj . me 𝜖 0 2 2 2 2 2 j=1 (𝜔0 j − 𝜔 ) + 𝛾 j 𝜔 (B.23) y 2nR nI = Parte real del índice, nR Este modelo, aunque requiere ajustes para ser aplicado en casos reales, permite ver la dependencia del índice de refracción con la frecuencia. Por otro lado, nos muestra que el índice de refracción tiene dos componentes, una real, nR , con la que podemos explicar la refracción, y una imaginaria, nI , que da cuenta de la absorción en el medio. Dispersión normal 1 Parte imaginaria del índice, n I 0 01 02 1 Bandas de absorción 0 01 02 Frecuencia angular, Figura B.1. Comportamiento general de las partes real e imaginaria del índice de refracción de acuerdo con las eqs. (B.22) y (B.23). Índice de refracción · 329 En la fig. B.1 se muestra el comportamiento general de nR y nI a partir de las eqs. (B.22) y (B.23) para dos frecuencias de resonancia 𝜔01 y 𝜔02 . Las constantes de amortiguamiento 𝛾 j suelen ser pequeñas en comparación con las respectivas frecuencias de resonancia 𝜔0 j . Cuando 𝜔 ≈ 𝜔0 j la parte imaginaria del índice de refracción toma valores relevantes lo que da lugar a bandas de absorción. Cuando 𝜔 se aleja de las frecuencias de resonancia la parte imaginaria del índice de refracción es prácticamente cero y la parte real del índice de refracción aumenta con la frecuencia. A este comportamiento se le denomina dispersión normal. Cuando la parte real del índice de refracción disminuye con la frecuencia se denomina dispersión anómala (región donde ocurre la absorción). La velocidad de la luz en el medio también se puede dar en términos de la permitividad 𝜖 y la permeabilidad 𝜇 del medio (que también dependen de la frecuencia de la onda electromagnética que incide en el medio), es decir 1 = 𝜇𝜖 . (B.24) 𝜐2 Por lo tanto, el índice de refracción queda n2 = 𝜇𝜖 . 𝜇0𝜖 0 (B.25) Para materiales no magnéticos, se puede hacer la aproximación 𝜇 ≈ 𝜇 0 , por lo que en este caso el índice de refracción se puede calcular como r 𝜖 . (B.26) n= 𝜖0 n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C Apéndice n -1 V = nd - n F C n -1 V = nd - n F C C n -1 n -1 n -1 n -1 V= n -n V= n -n V= n -n V= n -n Vidrios ópticos d F d C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C F d C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C F d C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C n -1 V = nd - n F C Vidrios ópticos · 333 El índice de refracción varía con la velocidad de la onda electromagnética en el medio, como se muestra en el apéndice B. A su vez, la velocidad depende la frecuencia de la onda (o de la longitud de onda en el vacío, mediante 𝜆 = c/𝜈, donde 𝜈 es la frecuencia de la onda). En función de la longitud de onda, lejos de las frecuencias de resonancia, el índice de refracción disminuye al aumentar la longitud de onda. Cerca de las frecuencias de resonancia, donde ocurre absorción, el índice de refracción aumenta. Lo anterior se puede entender mediante la relación de dispersión obtenida en la Eq, (B.21). En la práctica, para cada medio se obtiene empíricamente la relación de dispersión en función de la longitud de onda. Por ejemplo, el vidrio empleado para las láminas portaobjetos de microscopio, soda lime silica, se puede caracterizar en el rango visible mediante la relación obtenida por Rubin [32] n = 1.5130 − 0.003169𝜆 2 + 0.003962𝜆 −2 (C.1) Otra manera de caracterizar los vidrios ópticos se hace mediante el índice de refracción en tres longitudes de onda correspondientes a dos líneas espectrales del hidrógeno y a una línea espectral del helio, como se muestra en el tabla D.1. Tabla C.1. Líneas espectrales para caracterizar los vidrios ópticos. Línea F d C Longitud de onda 486.13 587.56 656.27 Elemento H He H Color azul amarillo rojo Con estas líneas espectrales, se abarca el rango visible. Estas se usan para el análisis de las aberraciones cromáticas. Los índices para los correspondientes colores se denotan por nF , nd , y nC . Por otro lado, para tener una medida de la dispersión cromática, se define V = nd − 1 , nF − nC (C.2) conocido como el número de Abbe. Usualmente, cuando se dice que el índice de refracción de un medio es n, por defecto (salvo que se mencione lo contrario) este valor corresponde con el índice nd . Los vidrios ópticos se fabrican a partir de SiO2 y una combinación de metales ligeros (vidrio crown) o metales pesados (vidrio flint), con lo que se logra fijar los índices de refracción y el número de Abbe deseado. 334 · Vidrios ópticos Figura C.1. Diagrama de vidrios ópticos de la compañía Schott. En la fig. C.1, se muestra un diagrama de vidrios de la compañía Schoot según el índice de refracción nd y el número de Abbe. Cada vidrio se identifica con un punto etiquetado en la gráfica nd vs V . Así, los vidrios utilizados en la fabricación de elementos ópticos (lentes, prismas, espejos, etc) se identifican con el nombre del vidrio (y no con el índice). Por ejemplo, consideremos un doblete acromático fabricado por una compañía. El catálogo dice que la primera lente está hecha de vidrio BK7 y la segunda está hecha de vidrio SF5. La diferencia de los vidrios tiene por objeto corregir la aberración cromática axial (para los colores azul y rojo). En la fig. C.1, podemos ver que el índice nd para el vidrio BK7 es 1.52 ± 0.05 (1.5168) y su número de Abbe 64.0 ± 0.5 (64.17); y el índice nd para el vidrio SF5 es 1.68 ± 0.05 (1.6727) y su número de Abbe 32.0 ± 0.5 (32.21). d F d C F d F C d C F C d F C d F d C F C d F d C F F C Apéndice d d C F C d F d F C D Aberraciones cromáticas d C F C d F d F C d F C d C F C d F d F C d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F d C F C C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F C d C F C d F C d F d C F C d F d C F d F d C F C C Aberraciones cromáticas · 337 En el capítulo 1 tratamos la formación de imagen para una sola longitud de onda. Cuando la luz que proviene del objeto es policromática, los parámetros que dependen del índice de refracción cambian según el color de la luz. Por ejemplo, la distancia focal de una lente, eq. (1.50), y la posición de los planos principales, eqs. (1.51) y (1.52). En consecuencia, para cada color tendremos una imagen de diferente tamaño y en diferente posición axial. Consideremos las tres longitudes de onda con las que se caracterizan los vidrios ópticos Tabla D.1. Líneas espectrales para caracterizar los vidrios ópticos. Línea F d C Longitud de onda 486.13 587.56 656.27 Elemento H He H Color azul amarillo rojo Denotando las distancias focales para estos colores como fF , fd y fC , las ecuaciones para localizar la imagen en cada caso son 1 1 1 − = , 0 sF sF fF (D.1) 1 1 1 − = , 0 sd sd fd (D.2) 1 1 1 − = . 0 sC sC fC (D.3) En el caso de una lente, la distancia entre el objeto y la primera superficie de la lente es igual en los tres casos, es decir, sF − (VP)F = sd − (VP)d = sC − (VP)C . Lo anterior también implica que, en general, la distancia objeto es diferente según el color. Para la imagen, la situación es un poco más compleja, ya que en general sF0 + (V0P0)F ≠ sd0 + (V0P0)d ≠ sC0 + (V0P0)C . La diferencia axial entre las posiciones de las imágenes correspondientes a las líneas espectrales F y C AchrL = sF0 + (V0P0)F − sC0 + (V0P0)C = sF0 − sC0 + (V0P0)F − (V0P0)C (D.4) se denomina aberración cromátical axial. Por ejemplo, en la fig. D.1 se muestra la posición de las imágenes para las líneas espectrales F, d y C, para una lente de distancia focal fd = 50 mm (R1 = 25.84 mm, R2 = ∞, espesor 338 · Aberraciones cromáticas t = 4.5 mm, vidrio BK7) cuando el objeto se encuentra a sd = −100 mm, lo que da un aumento md = −1. En este ejemplo el plano principal primario se localiza en el vértice de la primera superficie, por lo tanto, sd = sF = sC . -s AchrL F -h d C Figura D.1. Aberración cromática axial en una lente positiva. En la tabla D.2, se resumen los parámetros de este ejemplo. Todas las distancias (salvo la longitud de onda) están dadas en mm. El aumento se denota por m. Tabla D.2. Parámetros de una lente positiva y la imagen según las líneas espectrales para caracterizar los vidrios ópticos cuando el objeto está a -100 mm del plano principal primario. Línea F d C 𝜆 (nm) 486.13 587.56 656.27 f 49.46 50.00 50.24 V0P0 -3.21 -3.23 -3.23 s0 94.67 96.77 97.73 m -0.9788 1 -1.0097 A partir de estos datos, se tiene que la aberración cromática axial es AchrL = −3.05 mm. Supongamos que el objeto es puntual y el sistema está libre de aberraciones primarias monocromáticas (Seidel), entonces tendremos para las líneas espectrales F, d y C tres puntos imagen localizados en sF0 = 94.67 mm, sd0 = 96.77 mm y sC0 = 97.73 mm, respectivamente. ¿Dónde debemos colocar el plano imagen? Si lo colocamos en sF0 , tendremos un punto azul enfocado, pero las imágenes en amarillo y rojo estarán desenfocadas. Situaciones análogas se tienen si ubicamos el plano imagen en sd0 y sC0 . Sin embargo, en medio de las imágenes en azul y rojo se tendrá el círculo de menor confusión y este será el lugar donde veremos la mejor imagen. Al enfocar en sF0 , se tendrá una mancha roja de mayor extensión que la mancha en amarillo. Por otra parte, al enfocar en sC0 se tendrá una mancha azul de mayor extensión que la mancha en amarillo. Esto tiene como consecuencia que al observar un objeto policromático con una lente simple (como la del ejemplo en la fig. D.1) al enfocar en sF0 el borde de la imagen se ve de color Aberraciones cromáticas · 339 rojo, mientras que si enfocamos en sC0 , el borde de la imagen se ve de color azul. Ya que el aumento también depende de la longitud de onda en un plano imagen, tendremos la superposición de imágenes de distinto color y tamaño (una enfocada y las demás desenfocadas). Si hF0 = mF h y hC0 = mC h son las alturas de la imagen, la diferencia AchrT = hF0 − hC0 (D.5) se define como aberración cromática transversal. Con una lente negativa, el orden en el que se ubican las imágenes para cada color es contrario al de la lente positiva. Podemos ver esto con un ejemplo similar al de la lente positiva. Para una lente de distancia focal fd = −50 mm (R1 = −25.84 mm, R2 = ∞, espesor t = 3.5 mm, vidrio BK7) cuando el objeto se encuentra a sd = −100 mm, la imagen virtual para el color azul está más cerca de la lente que la imagen para el color rojo (y la imagen en amarillo en medio), fig. D.2. -s C F -h Figura D.2. Aberración cromática axial en una lente negativa. En la tabla D.3, se muestra los valores de las distancias. La aberración cromática en este caso es AchrL = 0.36 mm. Tabla D.3. Parámetros de una lente negativa y la imagen virtual según las líneas espectrales para caracterizar los vidrios ópticos cuando el objeto está a -100 mm del plano principal primario. Línea F d C 𝜆 (nm) 486.13 587.56 656.27 f -49.46 -50.00 -50.24 V0P0 -2.30 -2.31 -2.31 s0 -35.39 -35.64 -35.75 m 0.3309 0.3333 0.3344 340 · Aberraciones cromáticas Doblete acromático Lo anterior sugiere que combinando una lente positiva con una negativa se puede reducir la aberración cromática axial. En la práctica, las lentes que se combinan se hacen con diferentes tipos de vidrio para compensar el poder de dispersión de cada lente (número de Abbe, eq. (C.2)). Uniendo las dos lentes se obtiene una sola lente denominada doblete acromático. Esto supone que el radio de curvatura de la cara posterior de la primera lente debe ser igual al radio de curvatura de la cara anterior de la segunda lente, es decir R12 = R21 , fig. D.3. t1 R11 t2 R12 R 22 (R21) Figura D.3. Doblete acromático. Supongamos que deseamos obtener un doblete acromático de distancia focal fd . A partir de la aproximación de lentes delgadas, la distancia focal de la combinación de dos lentes delgadas (eq. (1.53)) será 1 1 1 = + , fd f1d f2d ya que la separación entre las lentes es cero. Para cada lente, 1 1 1 = (n1d − 1) 𝜅 1 = P1d = (n1d − 1) − f1d R11 R12 (D.6) (D.7) y 1 1 1 = P2d = (n2d − 1) − = (n2d − 1) 𝜅 2 . f2d R21 R22 (D.8) En las eqs. (D.7) y (D.8), se han introducido los factores 𝜅 1 y 𝜅 2 para la diferencia de las curvaturas. Entonces, la potencia del doblete acromático en la aproximación de lentes delgadas es P = (n1d − 1) 𝜅 1 + (n2d − 1) 𝜅 2 . (D.9) Aberraciones cromáticas · 341 El doblete acromático implica que la potencia sea constante al variar la longitud de onda alrededor de la longitud de onda 𝜆 = 587.56 nm, es decir, 𝜕P = 0. (D.10) 𝜕𝜆 d En otras palabras, 𝜕n1 𝜕n2 + 𝜅2 = 0. (D.11) 𝜕𝜆 𝜕𝜆 Aproximando la variación del índice de refracción con nF − nC y la variación de la longitud de onda con 𝜆 F − 𝜆 C , tenemos 𝜅1 𝜅1 n2F − n2C n1F − n1C − 𝜅2 = 0. 𝜆F − 𝜆C 𝜆F − 𝜆C (D.12) Multiplicando y dividiendo cada sumando por (n1d − 1) y (n2d − 1), respectivamente, para introducir el número de Abbe (n1F − n1C ) (n1d − 1) (n2F − n2C ) (n2d − 1) − 𝜅2 (n1d − 1) (𝜆 F − 𝜆 C ) (n2d − 1) (𝜆 F − 𝜆 C ) (n1d − 1) (n2d − 1) = 𝜅1 − 𝜅2 . (D.13) (𝜆 F − 𝜆 C ) V1 (𝜆 F − 𝜆 C ) V2 0 = 𝜅1 Eliminando el factor común del denominador y empleando la definición de potencia para cada lente, eqs. (D.7) y (D.8), se llega a P2d P = − 1d . V2 V1 (D.14) Esta ecuación, junto con la eq. (D.6) en la forma de potencias Pd = P1d + P2d , permite escribir la potencia de cada lente en términos de la potencia y los números de Abbe de cada vidrio como −V1 V2 − V1 (D.15) V2 . V2 − V1 (D.16) P1d = Pd y P2d = Pd Después de esto, se obtiene los factores de curvatura 𝜅1 = P1d n1d − 1 (D.17) 𝜅2 = P2d . n2d − 1 (D.18) y 342 · Aberraciones cromáticas Para terminar el diseño del doblete, se debe determinar los radios de curvatura de las lentes. Un diseño muy común propone que la primera lente sea equiconvexa de vidrio crown. Así, los radios satisfacen las siguientes relaciones: R12 R11 = −R12 , R12 = R21 y R22 = . (D.19) 1 − 𝜅 2 R12 Ejemplo: doblete acromático Supongamos que queremos un doblete acromático de distancia focal fd = 50 mm. La potencia será P = 20 D. Usando los vidrios LAKN22 para la primera lente y SFL6 para la segunda lente (apéndice C) y las eqs. (D.15) - (D.18) junto con la definición de los factores de curvatura, en la tabla D.4 se muestra los resultados para los radios de curvatura. Tabla D.4. Parámetros de diseño de un doblete acromático en la aproximación de lentes delgadas. P (D) V1 V2 n1d n2d 𝜅 1 (D) 𝜅 2 (D) R11 (mm) R22 (mm) 20 55.89 25.39 1.6511 1.8051 56.29 -20.68 35.52 -133.97 Para tener lentes reales, debemos asignar algún espesor a cada lente, por ejemplo, 8 mm para la primer lente y 4 mm para la segunda. El doblete acromático (real) se resume en la tabla D.5. Tabla D.5. Doblete acromático. Las unidades del radio y el espesor se dan en mm. Superficie Radio 1 2 3 35.52 −35.52 −133.97 Espesor 8 4 Índice LAKN22 SFL6 Con estos parámetros, la distancia focal para la línea espectral d queda fd = 50.85 mm. Aberraciones cromáticas · 343 Para ver la mejora en la formación de imagen, comparemos la formación de imagen con este doblete y la formación de imagen con la lente simple de la fig. D.1 colocando un objeto a sd = −101.7 mm del doblete (para que el aumento sea nuevamente md = −1). En la tabla D.6, se muestra los parámetros para las tres líneas espectrales. La aberración cromática axial resulta AchrL = −0.19 mm, esto es, solo el 6 % de la aberración obtenida con la lente simple. Por otra parte, el aumento para cada color varía muy poco, lo que hace que la aberración cromática transversal sea despreciable. Entonces, con el doblete acromático se logra una imagen de alta calidad. Tabla D.6. Parámetros de un doblete acromático y la imagen según las líneas espectrales para caracterizar los vidrios ópticos cuando el objeto está a -101.7 mm del plano principal primario para la línea espectral d. Línea F d C 𝜆 (nm) 486.13 587.56 656.27 f 50.83 50.85 50.90 VP 1.05 1.10 1.12 V0P0 -6.13 -6.13 -6.14 s0 95.54 95.57 95.73 m -1.0002 1 -1.0014 Aunque el diseño original pide una distancia focal de 50 mm en la línea d, el doblete real propuesto tiene un valor ligeramente mayor. Con un pequeño ajuste en los radios de curvatura de la primera lente, se puede obtener el valor deseado (por ejemplo, con R11 = −R12 = 34.7 mm, se obtiene fd = 50.01 mm). Los dobletes acromáticos son muy comunes en los sistemas formadores de imagen, pues, además de generar imágenes de buena calidad, también disminuyen la aberración esférica. Otra posible solución para disminuir la aberración cromática consiste en diseñar dos lentes del mismo vidrio separadas la distancia (( f1d + f2d )/2). Esto último se puede consultar en [12]. Apéndice E Prismas Prismas · 347 Un prisma es un elemento óptico de caras planas, en el que al menos dos de ellas están pulidas especularmente e inclinadas entre sí, de manera que la luz se puede reflejar o transmitir en estas caras. Los prismas que se usan para reflejar luz lo hacen a partir de la reflexión total interna en una o varias de sus caras y sirven para cambiar la orientación de las imágenes en un sistema óptico o la dirección de propagación de la luz [33]. Por otra parte, los prismas que hacen uso de la refracción son empleados como elementos para dispersar luz, por lo que sirven para medir el cambio del índice de refracción en un medio (prisma) con la longitud de onda o las componentes espectrales de una fuente luminosa. Primas reflectores Figura E.1. Primas reflectores: (a) recto, (b) Porro, (c) pentaprisma y (d) Amici. En la fig. E.1, se muestra una imagen de algunos prismas reflectores denominados: (a) prisma recto, (b) prisma Porro, (c) pentaprisma y (d) prima Amici. En estos prismas, un haz de luz incide en una de las caras y el haz transmitido debe experimentar al menos una reflexión total interna. Los prismas recto y Porro geométricamente son iguales, lo que cambia es la orientación con respecto a la dirección de la luz. Suponiendo que la luz incide de izquierda a derecha, la trayectoria que sigue la luz en estos tipos de prismas se ilustra en la fig. E.2. Para ver cómo cambia la orientación en la imagen se incluye un par de símbolos en el haz incidente: una flecha hacia arriba y un círculo hacia la izquierda (saliendo del plano del papel). También se supone que la luz se propaga hacia el observador. El prisma recto después de la reflexión en la cara diagonal desvía la luz 90◦ , invierte la flecha y mantiene la orientación del círculo, de manera que al observar la flecha nuevamente hacia arriba (con una rotación de 180◦ ) el círculo se ve a la derecha (invierte izquierda-derecha); el prisma Porro refleja la luz 348 · Prismas paralela al haz incidente, invierte la flecha dos veces y mantiene la orientación del círculo, de manera que al observar la flecha nuevamente hacia arriba el círculo se mantiene a la izquierda (no cambia las orientaciones1 ); el pentaprisma desvía la luz 90◦ y no cambia las orientaciones; el prisma Amici desvía la luz 90◦ , invierte la flecha y refleja dos veces el círculo en el techo del prisma cambiando su orientación, de manera que al observar la flecha nuevamente hacia arriba el círculo está a la izquierda (no cambia las orientaciones). (a ) (b) (c) (d) Figura E.2. Dirección que sigue la luz al reflejarse internamente (totalmente) en los prismas: (a) recto, (b) Porro, (c) pentaprisma y (d) Amici. Una configuración que permite mantener la dirección de propagación de la luz con una inversión de la imagen (simetría central) se logra combinando dos prismas Porro como se muestra en la fig. E.3. Este sistema de prismas se suele usar en los binoculares (telescopio terrestre) en los que la imagen se ve derecha. El prisma Amici también se suele usar en oculares para corregir la inversión de la imagen en telescopios terrestres. El pentaprisma se suele usar en telémetros y en instrumentos de alineación en topografía. Una variante en el pentaprisma resulta al cambiar una de las caras planas reflectoras por una cara en forma techo (similar a la del prisma Amici); se suele usar en cámaras fotográficas tipo reflex. Figura E.3. Dos prismas Porro se combinan para invertir la imagen (simetría central con respecto a un punto en el eje óptico) manteniendo la dirección de propagación. 1 Las orientaciones relativas entre la flecha y el círculo. Prismas · 349 Otro prisma de gran utilidad es el prisma Dove, cuya configuración se muestra en la fig. E.4. Un rayo que incide paralelo a la base se refracta en la primera cara, luego se refleja internamente en la base (punto medio) y, finalmente, emerge paralelo al rayo incidente invirtiendo la flecha. El prisma se debe usar con luz colimada y tiene la siguiente propiedad: si el prisma se rota alrededor del eje óptico (haz incidente) cierto ángulo, la imagen rota el doble de ese ángulo. Por ejemplo, en algunas lámparas de hendidura (instrumento oftálmico) el prisma Dove se coloca en medio de las dos lentes de un sistema confocal que proyecta una línea de luz en la superficie de la córnea. Para observar el astigmatismo corneal, es común rotar la línea un ángulo de 90◦ , lo que se hace girando el soporte cilíndrico que contiene al prisma Dove un ángulo de 45◦ . Esto resulta muy cómodo para el especialista cuando debe rotar la línea luminosa. Figura E.4. Prisma Dove. Cubos divisores de haz Otra configuración de prismas muy empleada es el cubo divisor de haz formado por dos prismas rectos unidos por sus caras diagonales para dividir un haz incidente en un haz transmitido y uno reflejado, fig. E.5(a). Una de las caras diagonales se recubre con una película reflectiva (semiespejo) y luego se unen las diagonales mediante un adhesivo óptico. El espesor de la película reflectiva determina los porcentajes de luz reflejada y transmitida en la diagonal. El índice de refracción del adhesivo óptico ha de ser cercano al de los vidrios de los prismas para evitar reflexiones no deseadas. Uno de los cubos más comunes transmite el 50 % y refleja el 50 % de la luz. Ei Ei Et (p) Er (s) ( a) ( b) Figura E.5. Cubos divisores de haz. (a) No-polarizador, (b) polarizador. 350 · Prismas Los cubos también se diseñan para separar un haz no polarizado en un haz transmitido con polarización p y un haz reflejado con polarización s, como se muestra en la fig. E.5(b). La diagonal de uno de los prismas se recubre con una película dieléctrica o una mezcla de metal-dieléctrico. Cuando el haz incidente llega a la película, el haz con polarización paralela al plano de incidencia (p) se transmite, mientras que el haz con polarización ortogonal al plano de incidencia (s) se refleja. Prismas refractores Los prismas también se pueden usar para analizar las componentes espectrales (en longitud de onda o frecuencia) de una fuente luminosa. Ya que el índice de refracción es función de la longitud de onda, un haz de luz policromático se refracta en varios haces según su longitud de onda. Esta separación física de los haces refractados hace posible medir el espectro luminoso. Para determinar la desviación del haz refractado en función del índice de refracción, consideremos la refracción de un haz en dos caras de un prisma que forman un ángulo 𝛼, como se muestra en la fig. E.6. a qi 1 n1 = 1 q t 1 qi 2 n 2= n qt2 d n1 = 1 Figura E.6. Refracción de un haz en dos caras de un prisma. Supongamos que el prisma está sumergido en un medio de índice n1 y que el índice de refracción del prisma para el haz considerado es n2 . La ley de Snell en ambas caras será n1 sin 𝜃 i1 = n2 sin 𝜃 t1 , (E.1) n2 sin 𝜃 i2 = n1 sin 𝜃 t2 . (E.2) y Prismas · 351 De la geometría de la figura, se tiene que 𝛼 = 𝜃 t1 + 𝜃 i2 . Al cambiar 𝜃 i2 por 𝛼 − 𝜃 t1 en la eq. (E.2), se tiene sin 𝜃 t2 = n2 [sin 𝛼 cos 𝜃 t1 − cos 𝛼 sin 𝜃 t1 ] , n1 (E.3) que es igual a s sin 𝜃 t2 = sin 𝛼 n2 n1 2 − sin2 𝜃 i1 − cos 𝛼 sin 𝜃 i1 . (E.4) Si n1 = 1 y n2 = n, el índice de refracción del prisma para un rayo de cierta longitud de onda está dado por n 2 = sin2 𝜃 i1 + (sin 𝜃 t2 + sin 𝜃 i1 cos 𝛼) 2 . sin2 𝛼 (E.5) Empleando un prisma caracterizado en sus índices de refracción según la longitud de onda, podemos medir el espectro luminoso de una fuente observando sobre una escala la posición de los rayos refractados. Una configuración empleada en los espectrómetros de prisma se basa en el mínimo valor del ángulo 𝛿 = 𝜃 i1 + 𝜃 t2 − 𝛼, el cual mide la desviación del rayo refractado al salir del prisma con respecto al rayo incidente en el prisma. El mínimo de 𝛿 ocurre cuando 𝜃 t2 = 𝜃 i1 = 𝜃 mı́n [3]. En este caso, p sin 𝜃 mı́n 2(1 + cos 𝛼) n= , sin 𝛼 (E.6) y como 𝜃 mı́n = (𝛿mı́n + 𝛼)/2, entonces n= sin [(𝛿mı́n + 𝛼)/2] . sin(𝛼/2) (E.7) En particular, si el prisma se construye como un triángulo isósceles, siendo 𝛼 el ángulo entre los dos lados iguales, el rayo refractado dentro del prisma será paralelo al otro lado del prisma (base del prisma), como se muestra en la fig. E.7. Otro prisma usado en espectroscopía es el prisma Pellin-Broca. El principio de funcionamiento de este prisma se puede entender como una variante de un prisma equilátero ( 𝛽 = 𝛼 = 60◦ en la fig. E.7). 352 · Prismas a b b Figura E.7. Prisma Isósceles en el que la mínima desviación del rayo ocurre cuando el rayo refractado dentro del prisma se propaga paralelo a la base del prisma. 60° 30° 30° 30° 45° 60° 60° 60° 60° 60° 30° 60° (a) (b) (c) Figura E.8. Principio del prisma Pellin-Broca. (a) Prisma equilátero y un rayo en condición de mínima desviación. (b) Separación del prisma equilátero en dos prismas de 30◦ − 60◦ − 90◦ manteniendo la condición de mínima desviación. (c) Cambio de la trayectoria del rayo con un espejo a 45◦ manteniendo la condición de mínima desviación en los prismas. El resultado final es que el rayo refractado forma un ángulo de 90◦ con el rayo incidente. Supongamos que en el prisma equilátero de la fig. E.8 (a) se hace incidir un rayo de una longitud de onda dada en la condición de mínima desviación (el rayo refractado dentro del prisma es paralelo a la base). Si el prisma equilátero se separa en dos primas de 30◦ − 60◦ − 90◦ , como en la fig.E.8(b), el rayo refractado sigue cumpliendo la condición de mínima desviación. Si adicionalmente se coloca un espejo a 45◦ y se desplaza el segundo prisma, como se muestra en la fig. E.8(c), se sigue mateniendo la condición de mínima desviación en el segundo prisma. El resultado final es que el haz refractado, independientemente de la longitud de onda, si se mantiene la condición de mínima desviación, será refractado formando un ángulo de 90◦ con respecto al rayo incidente. Si en lugar del espejo se usa un prisma de 45◦ − 45◦ − 90◦ , se puede construir en un solo bloque un prisma como el mostrado en la fig. E.9. Este es el prisma Pellin-Broca [34]. Entonces, para un rayo incidente policromático, el rayo refractado a 90◦ corresponde con una longitud de onda dada. Rayos de otras longitudes de onda no se propagan bajo la condición de mínima desviación y emergen del Prismas · 353 prisma formando un ángulo diferente a 90◦ . Sin embargo, con un pequeño giro alrededor de un eje ortogonal al plano del papel, se puede ajustar la condición de mínima desviación para otra longitud de onda. En particular, si el eje de giro pasa por un punto definido por la intersección de la bisectriz del ángulo ∠BAD y el lado BC, esto es, el punto O en la fig. E.9, el rayo refractado a 90◦ con respecto al rayo incidente mantiene su posición lateral. B 30° 45° A 60° 30° 90° O 45° 90° C 60° D Figura E.9. Prisma Pellin-Broca. O n = 1.5628 n = 1.6361 Figura E.10. Ilustración de la ventaja de girar el prisma en el punto O. Independientemente de la longitud de onda el rayo refractado a 90◦ mantiene su posición lateral. En la fig. E.10, se ilustra esta situación para dos rayos de diferente longitud de onda en un prisma cuyos índices de refracción para las dos longitudes de onda son 1.5628 y 1.6361. En la figura, se superpone el prisma con las dos orientaciones (con eje de giro en O) que satisfacen la condición 354 · Prismas de mínima desviación para cada longitud de onda. En gris, la orientación correspondiente al índice de refracción 1.5628 y, en negro, la orientación correspondiente al índice de refracción 1.6331. El ángulo de giro es 3.5◦ . En efecto se tiene que los dos rayos refractados mantienen su localización espacial gracias a la rotación del prisma en el punto O. Si el giro se hace en otro punto, los dos rayos se refractan con un desplazamiento lateral entre sí. Así que el punto de giro en O ofrece una ventaja a la hora de diseñar un espectrómetro. Apéndice F Elipse de polarización Elipse de polarización · 357 Para determinar el estado de polarización general, consideremos la parte real de las amplitudes del vector eléctrico dado en la eq. (2.31), es decir, Ex = |Eox | cos 𝛿 x , (F.1) Ey = Eoy cos 𝛿 y . (F.2) Multiplicando por sin 𝛿 x y sin 𝛿 y las funciones cos 𝛿 x y cos 𝛿 y de las eqs. (F.1) y (F.2) de la siguiente manera Ex sin 𝛿 y = cos 𝛿 x sin 𝛿 y , |Eox | Ey Eoy sin 𝛿 x = cos 𝛿 y sin 𝛿 x , (F.3) (F.4) y luego restando las eqs. (F.3) y (F.4), se tiene que Ey Ex sin 𝛿 x = sin(𝛿 y − 𝛿 x ). sin 𝛿 y − |Eox | Eoy (F.5) Mediante un procedimiento análogo, multiplicando por cos 𝛿 x y cos 𝛿 y las funciones cos 𝛿 x y cos 𝛿 y de las eqs. (F.1) y (F.2), y luego restando, se llega a Ey Ex cos 𝛿 y − cos 𝛿 x = 0. |Eox | Eoy (F.6) Por último, al elevar al cuadrado las eqs. (F.5) y (F.6), y luego sumarlas, se encuentra la siguiente forma cuadrática Ex2 |Eox | 2 −2 Ey2 E x Ey cos(Δ𝛿) + = sin2 (Δ𝛿), 2 |Eox | Eoy Eoy (F.7) con Δ𝛿 = 𝛿 y − 𝛿 x . Esta ecuación representa una cónica rotada.1 Mediante una rotación de ejes se elimina el término cruzado de Ex Ey . El ángulo de la rotación es 2 cos(Δ𝛿)/ |Eox | Eoy tan 2𝜓 = − . (F.8) 2 1/|Eox | 2 − 1/ Eoy 1 La forma cuadrática Ax 2 + 2Bxy + Cy 2 = D representa una cónica rotada en el sistema cartesiano xy. Si B2 − AC < 0, es una elipse; si B2 − AC = 0, es una parábola; si B2 − AC > 0, es una hipérbola. La versión no rotada de la cónica en un nuevo sistema cartesiano x 0 y 0 se logra mediante una transformación de coordenadas que corresponde con un problema de valores propios de una matriz 2×2 simétrica cuyos elementos son los coeficientes A, B hy C. En el sistema de coordenadas rotado, coeficientes están i h los nuevos i dados por: p p 1 1 0 0 2 2 2 2 A = 2 (A + C) + (A − C) + 4B , C = 2 (A + C) − (A − C) + 4B ; y el ángulo 2B . de rotación se puede determinar a partir de: 𝜓 = 12 arctan A−C 358 · Elipse de polarización Definiendo tan 𝛼 = Eoy , |Eox | (F.9) se llega a tan 2𝜓 = tan 2𝛼 cos Δ𝛿. (F.10) El signo del discriminante de la eq. (F.7), cos2 (Δ𝛿)/ |Eox | Eoy 2 − 1/ |Eox | Eoy 2 =− sin2 (Δ𝛿) |Eox | Eoy 2 < 0, (F.11) determina el tipo de cónica. Ya que el resultado es menor que cero, tenemos que la eq. (F.7) es una elipse rotada el ángulo 𝜓 en el sistema cartesiano xy. Bibliografía [1] S.R. Wilk. Ibn al-haytham: 1,000 Years after the Kitāb al-Manāzir. Optics and Photonics News, 26(10):42–48, 2015. [2] I. Newton. Opticks, or, a Treatise of the Reflections, Refractions, Inflections & Colours of Light. London, 1718. [3] E. Hecht. Óptica. Addison Wesley Longman, 2000. [4] W.E. Humphrey. Method and Apparatus for Analysis of Corneal Shape, December 13 1983. US Patent 4,420,228. [5] H. Von Helmholtz. Helmholtz’s Treatise on Physiological Optics, volume 1. Optical Society of America, 1924. [6] Y. LeGrand and S.G. ElHage. Physiological Optics, volume 13. Springer, 2013. [7] H. Davson. Physiology of the Eye. Macmillan International Higher Education, 1990. [8] G. Smith and D.A. Atchison. The Eye and Visual Optical Instruments. Cambridge University Press, 1997. [9] D.A. Atchison and G. Smith. Optics of the Human Eye, volume 35. Butterworth-Heinemann Oxford, 2000. [10] V.N. Mahajan. Optical Imaging and Aberrations: Ray Geometrical Optics. SPIE press, 1998. [11] S. Dupr. Galileo, the Telescope and the Science of Optics in the Sixteenth Century. PhD thesis, Ghent University, 2002. [12] D. Malacara and Z. Malacara. Handbook of Optical Design. CRC Press, 2016. [13] E.H. Land. Some Aspects of the Development of Sheet Polarizers. JOSA, 41(12):957–963, 1951. 360 · Bibliografía [14] Grant R Fowles. Introduction to Modern Optics. Dover Publications, Inc., 1989. [15] M. Born and E. Wolf. Principles of Optics, Chapter X: Interference and Diffraction with Partially Coherent Light. Pergamon Press, 1993. [16] J.D. Jackson. Classical Electrodynamics, Chapter XVI: Radiation Damping, Classical Models of Charged Particles. American Association of Physics Teachers, 1999. [17] M.H. Shamos. Great Experiments in Physics: Firsthand Accounts from Galileo to Einstein, Chapter VII: The Interference of Light. Dover Publications, Inc., 1987. [18] M. Csele. Fundamentals of Light Sources and Lasers. Wiley Online Library, 2004. [19] M.V. Mantravadi and D. Malacara. Optical Shop Testing, Chapter I: Newton, Fizeau, and Haidinger Interferometers. John Wiley and Sons, Inc, 2007. [20] M.H. Shamos. Great Experiments in Physics: Firsthand Accounts from Galileo to Einstein, Chapter VIII: The Diffraction of Light. Dover Publications, Inc., 1987. [21] J.D. Jackson. Classical Electrodynamics, Chapter X: Scattering and Diffraction. American Association of Physics Teachers, 1999. [22] M. Born and E. Wolf. Principles of Optics, Chapter VIII: Elements of the Theory of Diffraction. Pergamon Press, 1993. [23] A. Sommerfeld. Lectures on Theoretical Physics, Vol 4: Optics, 1964. [24] J.W. Goodman. Introduction to Fourier Optics. Roberts and Company Publishers, 2005. [25] Y. Mejía and A.I. González. Measuring Spatial Coherence by Using a Mask with Multiple Apertures. Optics Communications, 273(2):428– 434, 2007. [26] Y. Mejía. El Frente de Onda y su Representación con Polinomios de Zernike. Ciencia y Tecnología para la Salud Visual y Ocular, 9(2):145– 166, 2011. Bibliografía · 361 [27] H.H. Hopkins. On the Diffraction Theory of Optical Images. Proceedings of the Royal Society of London. Series A. Mathematical and Physical Sciences, 217(1130):408–432, 1953. [28] B.J. Thompson. IV Image Formation with Partially Coherent Light. In Progress in optics, volume 7, pages 169–230. Elsevier, 1969. [29] Y. Mejía and D.E.G. Suárez. Optical Transfer Function with Partially Coherent Monochromatic Illumination. Optik, 193:163021, 2019. [30] E.G. Loewen and E. Popov. Diffraction Gratings and Applications. CRC Press, 2018. [31] C.A. Palmer and E.G. Loewen. Diffraction Grating Handbook. Newport Corporation New York, 2005. [32] M. Rubin. Optical Properties of Soda Lime Silica Glasses. Solar Energy Materials, 12(4):275–288, 1985. [33] NAVEDTRA. Basic Optics and Optical Instruments. Dover Publications, 1997. [34] Ph. Pellin and A. Broca. A Spectroscope of Fixed Deviation. The Astrophysical Journal, 10:337, 1899. Índice Aberración cromática axial, 337 transversal, 339 Aberraciones primarias monocromáticas, 95 astigmatismo, 102 coma, 102 curvatura de campo, 97 distorsión, 100 esférica, 97 patrones de difracción, 304 Petzval, 96 polinomio de aberración, 303 Ángulo crítico, 12, 146 Apertura numérica, 92 Aumento angular, 73 espejos esféricos, 38 lentes, 45, 46 lupa, 83 microscopio, 92 superficie esférica refractora, 33 telescopio, 85 Cámara oscura, 4 Campo de visión y objeto, 70 lupa, 80 Coherencia grado de coherencia, 180, 184 longitud de coherencia, 186, 188 teorema de Van Cittert-Zernike, 299 Convención de signos, 25 Diafragmas apertura, 63 campo, 69 Difracción, 277 abertura circular, 289 abertura rectangular, 291 condición de Sommerfeld, 281 disco de Airy, 291 dos aberturas circulares, 296 factor de inclinación, 268, 282 Fraunhofer, 288 Fresnel, 288 Huygens-Fresnel, 285 integral de Fresnel-Kirchhoff, 282 integral de Kirchhoff, 280 Rayleigh-Sommerfeld, 284 Divisor de haz, 211 Ecuación de onda dieléctrico, 134 material birrefringente, 154 vacío, 117 Ecuaciones de Fresnel, 138 Ecuaciones de Maxwell, 117, 134, 326 Espejo parabólico, 41 Espejo plano, 14 Espejos esféricos, 37 aberración esférica, 39 trazo de rayos, 37 364 · Índice Franjas de interferencia circulares, 201, 205, 217 hiperbólicas, 199 rectas, 191, 208, 216 Fuente extendida, 244, 247 Imagen objeto puntual difractiva, 302 geométrica, 19 Índice de refracción, 155, 325, 327, 329 ordinario, extraordinario, 160 Intensidad, 61 Interferómetros Fabry-Perot, 257 Fizeau, 261 lámina de caras paralelas, 218 Michelson, 182, 201, 207, 210, 248 Newton, 259 Young, 251, 254 Interferencia con luz blanca, 244, 246 con N fuentes puntuales, 238 de dos ondas, 180 de múltiples ondas reflejadas, 221 de múltiples ondas transmitidas, 222 dos ondas esféricas, 196, 225, 229 dos ondas planas, 189, 191, 222 franjas localizadas, 225, 226, 235, 245, 247 franjas no localizadas, 225, 226, 236, 245 igual espesor, 247, 261, 262 igual inclinación, 235, 249 máximos principales, 239, 242 máximos secundarios, 239, 242 visibilidad, contraste, 190, 194 Irradiancia, 65, 120, 121, 179 Láminas birrefringentes, 156 de cuarto de onda, 156 de media onda, 157 ejes lento y rápido, 156 Límite de resolución espacial, 305 criterio de Rayleigh, 306 Lentes colimadora, 211 delgada, 43 distancia focal lente delgada, 43 distancia focal lente gruesa, 53 doblete acromático, 340 ecuación de Gauss, 43 ecuación de Newton, 46 ecuación lente delgada, 43 gruesa, 53 negativa, 48 planos focales, 48 planos principales, 54 positiva, 47 potencia lente delgada, 59 punto focal primario, 44 punto focal secundario, 44 rayos oblicuos, 49 sistema de lentes, 57 trazo de rayos, 45 Ley de la reflexión, 36, 135 Ley de la refracción, 10, 136 Ley de Malus, 132 Ley de Snell, 10, 14 Longitud de camino óptico, 16 Lupa, 80 Materiales birrefringentes, 155 índices ordinario y extraordinario, 160 biaxiales, 160 doble imagen, 163 Índice eje óptico, 160 rayos ordinario y extraordinario, 161 uniaxiales, 160 Matrices de Jones, 171 Microscopio, 91 Número de Abbe, 333 Número f, 63 Oculares, 86 Ojo humano, 23, 74 acomodación, 75 distancia de punto cercano (dpc), 75, 78 Gullstrand-Emsley, 74 hipermetropía, 78 miopía, 78 Purkinje, 74 Ondas esférica, 196 plana armónica, 117, 118, 134, 179 Ovoide cartesiano, 21 Plano de incidencia, 36 Plano meridional, 32, 101 Planos tangencial y sagital, 101 Poder de resolución microscopio, 93 rejilla de difracción, 312 Polarización ángulo de Brewster, 141 circular, 123, 126 elíptica, 123, 126 lineal, 126 luz natural, 122 luz polarizada, 122 por reflexión, 141 reflectancia y transmitancia, 142, 152 · 365 Polarizadores coeficiente de extinción, 130 lineal dicroico, 129 prisma Glan-Thompson, 166 prisma Rochon, 166 prisma Senarmont, 166 prisma Wollaston, 166 rombo de Fresnel, 150 Principio de Fermat, 13, 16 espejismo, 15 frente de onda geométrico, 18 rayo de luz, 17 Principio de Huygens, 8, 267 Principio de Huygens-Fresnel, 267 Prismas, 347 birrefringente, 164 cubos divisores de haz, 349 Dove, 349 Isósceles, mínima desviación, 352 Pellin-Broca, 353 recto, Porro, pentaprisma, Amici, 347 PSF difractiva, 303 geométrica, 106 Pupilas acoplamiento, 86 entrada y salida, 65 función pupila, 303 Rayos marginal, 68, 85 principal, 68, 99, 101 Reflexión total interna, 146 Rejillas de difracción, 309 orden de difracción, 311 Relaciones de Stokes, 219 Superficie esférica refractora aberración esférica, 27 366 · Índice aproximación paraxial, 27 distancia focal primaria, 28 distancia focal secundaria, 28 ecuación de Gauss, 28 potencia refractiva, 34 punto focal primario, 29 punto focal secundario, 28 trazo de rayos, 32 Telescopio, 84 reflector newtoniano, 90 refractor galileano, 88 refractor kepleriano, 85 Trazo de rayos exacto, 107 gráfico, 12 lentes delgadas, 44 paraxial, método y-nu, 318 Vector de onda, 133 Vector de Poynting, 120 Vectores de Jones, 168 Vidrios ópticos, 333 diagrama de vidrios, 334 Zonas de Fresnel, 269 placa zonal, 275 punto de Poisson, 274 Editado por el Centro Editorial de la Facultad de Ciencias, Universidad Nacional de Colombia, sede Bogotá, Fuente principal Baskerllive y Fira Sans. Otros títulos Nanomateriales que revolucionan la tecnología. Perspectivas y aplicaciones en espintrónica Anderson Dussán Cuenca, Heiddy Paola Quiroz Gaitán y Jorge Arturo Calderón Cómbita Notas de clase: Introducción al estado sólido William Javier Herrera Diseño de experimentos. Métodos y aplicaciones. Segunda edición Oscar Melo, Luis Alberto López y Sandra Melo